两个字符串之间的正则表达式文本 [英] Regex text between two strings

查看：55 发布时间：2021/7/6 20:41:05 python regex

本文介绍了两个字符串之间的正则表达式文本的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我正在尝试使用正则表达式从 PDF 文本中提取数据字段.

I am trying to extract data fields from PDF texts using regex.

正文是:

"样本 EXPERIAN 客户\n2288150 - EXPERIAN 样本报告\n数据字典报告\n过滤条件:\n自定义选择\n营销元素:\n第 1 页，共 284 页\n2014-11-11 21:52:01 PM\nExperian以及此处使用的标记是 Experian 的服务标记或注册商标.\n© Experian 2014 保留所有权利.机密和专有.\n**数据字典**\n出生日期是从公共和专有文件中获得的.这些来源提供，至少是出生年份；在可用的情况下提供月份.可以提供各种详细级别的确切出生日期\n\n\n\n\n\n注意:使用 DOB 编码的记录不包括估计的年龄 (101E)\n**元素编号**\n0100\n描述\n出生日期/确切年龄\n**数据字典**\n\n\n\n\n\n\n\n\n\n\n填充，三个字节\n**元素编号**\n0000\n**描述**\n增强强制附加\n**数据字典**\n\n\n当没有足够的数据来匹配客户的记录时给我们的浓缩大师估计年龄，提供了基于同一 ZIP+4 区域内所有其他成年个体年龄的估计年龄中位数.\n\n\n\n\n\n\n00 = 未知\n**元素编号**\n0101E\n**描述**\n估计年龄\n"

字段名称以粗体显示.字段名称之间的文本是字段值.

The field names are in bold. The texts between field names are the field values.

我第一次尝试使用以下正则表达式提取描述"字段:

The first time I tried to extract the 'Description' field using the following regex:

pattern = re.compile('\nDescription\n(.*?)\nData Dictionary\n')
re.findall(pattern,text)

结果正确:

['Date Of Birth / Exact Age', 'Enhancement Mandatory Append']

但是使用相同的想法提取数据字典"字段给出了空结果:

But using the same idea to extract 'Data Dictionary' Field gives the empty result:

pattern = re.compile('\nData Dictionary\n(.*?)\nElement Number\n')
re.findall(pattern,text)

结果:

[]

知道为什么吗?

两个字符串之间的正则表达式文本 [英] Regex text between two strings

问题描述

推荐答案

相关文章

Python最新文章

热门教程

热门工具

登录关闭

两个字符串之间的正则表达式文本 [英] Regex text between two strings

问题描述

推荐答案

相关文章

Python最新文章

热门教程

热门工具

登录 关闭

登录关闭