Python HTML 删除 [英] Python HTML removal

查看:25
本文介绍了Python HTML 删除的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

如何从 Python 中的字符串中删除所有 HTML?比如我怎么转:

blah blah <a href="blah">link</a>

进入

等等等等链接

谢谢!

解决方案

您可以使用正则表达式删除所有标签:

<预><代码>>>>进口重新>>>s = 'blah blah <a href="blah">link</a>'>>>re.sub('<[^>]*>', '', s)'等等等等链接'

How can I remove all HTML from a string in Python? For example, how can I turn:

blah blah <a href="blah">link</a>

into

blah blah link

Thanks!

解决方案

You can use a regular expression to remove all the tags:

>>> import re
>>> s = 'blah blah <a href="blah">link</a>'
>>> re.sub('<[^>]*>', '', s)
'blah blah link'

这篇关于Python HTML 删除的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆