Beautifulsoup 分解() [英] Beautifulsoup decompose()

查看:23
本文介绍了Beautifulsoup 分解()的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在尝试使用 beatifulsoup 去除 <script> 标签和标签内的内容.我去了文档,似乎是一个非常简单的调用函数.有关该功能的更多信息,请参见此处.这是我目前解析的html页面的内容...

<div class="pub_300x250 pub_300x250m pub_728x90 text-ad textAd text_ad text_ads text-ads text-ad-links" id="wp-adb-c" style="width: 1px !important;高度:1px!重要;位置:绝对!重要;左:-10000px!重要;顶部:-1000 像素!重要;>

<div id="pb-f-a">

<div class="" id="pb-root"><脚本>(功能(一){TWP=window.TWP||{};TWP.Features=TWP.Features||{};TWP.Features.Page=TWP.Features.Page||{};TWP.Features.Page.PostRecommends={};TWP.Features.Page.PostRecommends.url="https://recommendation-hybrid.wpdigital.net/hybrid/hybrid-filter/hybrid.json?callbackx3d?";TWP.Features.Page.PostRecommends.trackUrl="https://recommendation-hybrid.wpdigital.net/hybrid/hybrid-filter/tracker.json?callbackx3d?";TWP.Features.Page.PostRecommends.profileUrl="https://usersegment.wpdigital.net/usersegments";TWP.Features.Page.PostRecommends.canonicalUrl=""})(jQuery);

想象一下,您有一些类似的 Web 内容,并且在名为 soup_html 的 BeautifulSoup 对象中有这些内容.如果我运行 soup_html.script.decompose() 并且他们调用对象 soup_html 脚本标签仍然存在.我如何摆脱

登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆