python - 为什么正则表达式抓取不到数据?

查看:281
本文介绍了python - 为什么正则表达式抓取不到数据?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

问 题

已经把需要抓取的html写入txt,但是无法使用正则表达式抓取数据,抓取结果永远是空的,请问为什么会出现这种问题?

def zhengze():

material=open(r"c:\test.txt","r")
print(material.read())
pattern=re.compile(r"<div>")
joke=re.search(pattern,material.read())
print(joke)

这行代码应该是抓取整个html里所有的"<div>",但返回结果一直是none,为什么?

解决方案

material.read() 你用了两次!!!
你确定第二次能读到数据.
read() 方法是读取整个文件,读完文件指针应该到了文件末尾,再次读取就返回''了,建议这样写:

def zhengze():
    material=open(r"c:\test.txt","r")
    res = material.read()
    print(res)
    pattern=re.compile(r"<div>")
    joke=re.search(pattern,res)
    print(joke)

这篇关于python - 为什么正则表达式抓取不到数据?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆