首页
前端开发
用美丽的汤剥离HTML时保留空间

用美丽的汤剥离HTML时保留空间 [英] Preserve space when stripping HTML with Beautiful Soup

查看：100 发布时间：2018/6/22 19:43:41 python html beautifulsoup

本文介绍了用美丽的汤剥离HTML时保留空间的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

合并。段2< blockquote>引用1< block引用>引用2< / p>< / html>
print html $ b $ soup = BeautifulSoup（html）
print u''join（soup.findAll（text = True））

此代码的输出是Para 1 WordsMerge。Para 2Quote 1Quote 2。

I don不希望第一段的最后一句与第二段的第一句话合并。
例如。 Para 1 Words Merge。Para 2 Quote 1 Quote 2。
这可以使用BeautifulSoup库实现吗？

解决方案

只需使用空格加入件即可：

  print u''.join（soup.findAll（text = True））

from BeautifulSoup import BeautifulSoup

html = "<html><p>Para 1. Words</p><p>Merge. Para 2<blockquote>Quote 1<blockquote>Quote 2</p></html>"
print html
soup = BeautifulSoup(html)
print u''.join(soup.findAll(text=True))

The out put of this code is "Para 1 WordsMerge. Para 2Quote 1Quote 2".

I don't want the last word of paragraph one merging with the first word of paragraph two. eg. "Para 1 Words Merge. Para 2 Quote 1 Quote 2". Can this be achieved using the BeautifulSoup library?
解决方案
Just join the pieces with a space:
print u' '.join(soup.findAll(text=True))

这篇关于用美丽的汤剥离HTML时保留空间的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文

相关文章

滚动条的HTML保留空间;

不能在运行之间保留空间;

sed中的“保留空间"和“模式空间"的概念;

Recyclerview中的view.GONE仍然保留空间;

如何创建可以在xml中保留空间的xsd?;

无法用美丽的汤解析html表;

在笔式驱动器的保留空间中读/写;

美丽的汤-获取所有文本，但保留链接html?;

解析HTML美丽的汤;

PyQt4:如何使带有保留空间的下corcord窗口;

用美丽的汤抓取问题;

用美丽的汤解析 JS;

用美丽的汤解析XML;

是否可以在内存中保留空间以减少加载时间?;

在FAT32引导记录中写入保留空间;

用美丽的汤转换CSS属性个别HTML属性？;

用美丽的汤来获取所有的HTML标签;

安装gem时出错：无法为cygwin的堆保留空间，Win32错误487;

用美丽的汤选择嵌套元素;

在浏览器布局中为响应式图像保留空间(防止回流);

为什么浏览器保留空间用于ACCENTED CHARACTERS，即使没有一个？;

加快美丽汤;

您如何在不初始化每个元素的情况下为数组保留空间?;

美丽的汤没有解析这个HTML;

csv的美丽汤;

前端开发最新文章

为什么Chrome（在Electron内部）突然重定向到chrome-error：// chromewebdata？;

错误102（net :: ERR_CONNECTION_REFUSED）：服务器拒绝连接;

如何解决'重定向已被CORS策略阻止：没有'Access-Control-Allow-Origin'标题'？;

如何处理“Uncaught（in promise）DOMException：play（）失败，因为用户没有首先与文档交互。”在桌面上使用Chrome 66？;

警告：添加非被动事件侦听器到滚动阻塞'touchstart'事件;

如何在浏览器中播放.TS文件（视频/ MP2T媒体类型）？;

此请求已被阻止;内容必须通过HTTPS提供;

资源解释为样式表，但转换为MIME类型text / html（似乎与web服务器无关）;

通过HTTPS加载页面但请求不安全的XMLHttpRequest端点;

拒绝从执行脚本'*'，因为它的MIME类型（“应用/ JSON'）不是可执行文件，并严格MIME类型检查被启用。;

热门教程

Java教程

Apache ANT 教程

Kali Linux教程

JavaScript教程

JavaFx教程

MFC 教程

Apache HTTP客户端教程

Microsoft Visio 教程

热门工具

Java 在线工具

C(GCC) 在线工具

PHP 在线工具

C# 在线工具

Python 在线工具

MySQL 在线工具

VB.NET 在线工具

Lua 在线工具

Oracle 在线工具

C++(GCC) 在线工具

Go 在线工具

Fortran 在线工具

登录关闭

扫码关注1秒登录

发送“验证码”获取 | 15天全站免登陆

友情链接： IT屋 Chrome插件谷歌浏览器插件

IT屋 ©2016-2022 琼ICP备2021000895号-1 站点地图站点标签 SiteMap <免责申明> 本站内容来源互联网,如果侵犯您的权益请联系我们删除.