python 正则表达式提取

查看:93
本文介绍了python 正则表达式提取的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

问 题

41. gnos, gnit, gniz [L, GK]= to know 知

李平武. 英语词根与单词的说文解字(修订版) (Kindle 位置 3397-3398). 外语教学与研究出版社. Kindle 版本.

42. grad, gress [L]= to step 步

李平武. 英语词根与单词的说文解字(修订版) (Kindle 位置 3448-3449). 外语教学与研究出版社. Kindle 版本.

有如上内容,怎么样才可以通过正则表达式仅抓取数字那一行的内容,而忽略掉关于来源的内容呢?

谢谢!

解决方案

import re

regex = r"^\d.*"

test_str = ("41. gnos, gnit, gniz [L, GK]= to know 知\n\n"
    "李平武. 英语词根与单词的说文解字(修订版) (Kindle 位置 3397-3398). 外语教学与研究出版社. Kindle 版本.\n\n"
    "42. grad, gress [L]= to step 步\n\n"
    "李平武. 英语词根与单词的说文解字(修订版) (Kindle 位置 3448-3449). 外语教学与研究出版社. Kindle 版本.")

matches = re.finditer(regex, test_str, re.MULTILINE)

for match in matches:

    
    print (match.group())
    

这篇关于python 正则表达式提取的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆