python - 正则表达式匹配html的问题。

查看：197 发布时间：2017/9/6 2:01:16

本文介绍了python - 正则表达式匹配html的问题。的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

问题

<dd class="gray6">
  <span class="gray6">
    中文
    <span class="padl27"></span>
    中文
  </span>
  中文内容  #需要抓取的内容
</dd>

用BeautifulSoup html.parser解析的网页，现在用re模块想抓取**第7行**的中文内容，放在一个组里面（.*?）。正则老是匹配不上，用换行符也匹配不上，不知道怎么写了。。。

这个问题已被关闭，原因：问题已解决 - 问题已解决，且对他人无借鉴意义

解决方案

既然你都用bs4解析了，为什么不用它提取哪？
bs4内有一个stripped_string的函数正好满足你的需要。

这篇关于python - 正则表达式匹配html的问题。的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文

python - 正则表达式匹配html的问题。

问题描述

相关文章

其他开发最新文章

热门教程

热门工具

登录关闭

python - 正则表达式匹配html的问题。

问题描述

相关文章

其他开发最新文章

热门教程

热门工具

登录 关闭

登录关闭