如何从漂亮的汤对象获取HTML [英] How to get HTML from a beautiful soup object
本文介绍了如何从漂亮的汤对象获取HTML的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有以下bs4对象列表:
I have the following bs4 object listing:
>>> listing
<div class="listingHeader">
<h2>
....
>>> type(listing)
<class 'bs4.element.Tag'>
我想将原始html提取为字符串.我尝试过:
I want to extract the raw html as a string. I've tried:
>>> a = listing.contents
>>> type(a)
<type 'list'>
所以这不起作用.我该怎么办?
So this does not work. How can I do this?
推荐答案
只需获取字符串表示形式:
html_content = str(listing)
这是一个非美化的版本.
This is a non-prettified version.
如果您要美化,请使用 prettify()
方法:
If you want a prettified one, use prettify()
method:
html_content = listing.prettify()
这篇关于如何从漂亮的汤对象获取HTML的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文