python-docx相关内容

Python-docx:识别段落中的分页符

我逐段遍历文档,然后将每个段落文本按.(带空格的点)拆分成句子.与在整个段落文本中搜索相比,我将句子中的段落文本分割为n 以便进行更有效的文本搜索. 然后代码在句子的每个单词中搜索错误,错误来自纠错数据库.我在下面展示了一个简化的代码: from docx.enum.text import WD_BREAK对于 document.paragraphs 中的段落:句子 = 段落.text.s ..
发布时间:2021-07-17 20:03:57 Python

在 python-docx 中搜索和替换

我有一个包含以下字符串的文档(模板):“你好,我叫 Bob.Bob 是个好名字."我想使用 python-docx 打开此文档并使用“查找和替换"方法(如果存在)更改每个字符串“Bob"->“Mark".最后,我想生成一个带有字符串“你好,我的名字是马克.马克是个好名字"的新文档.我该怎么做? from docx import *TEMPLATE_FILE = 'test_template.do ..
发布时间:2021-07-07 19:35:36 Python

如何在word文档中创建书签,然后使用python创建指向书签的内部超链接

我已经使用 python-docx 编写了一个脚本来搜索 Word 文档(通过搜索运行)以获取参考号和技术关键词,然后创建一个表格来总结附加到 Word 文档末尾的搜索结果. 有些文档有 100 多页,所以我想通过在搜索结果表中创建内部超链接来让用户更轻松,这样它就会带您到文档中检测到搜索结果的位置. 一旦找到参考运行,我不知道如何将其标记为书签或如何在结果表中创建指向该书签的超链接. ..
发布时间:2021-06-28 19:37:47 Python

python -docx 从word docx中提取表格

我知道这是一个重复的问题,但其他答案对我不起作用.我有一个包含一张表的 word 文件.我想要那个表作为我的 python 程序的输出.我正在使用 python 3.6,我也安装了 python -docx.这是我的数据提取代码 from docx.api 导入文档document = Document('test_word.docx')table = document.tables[0]数据 ..
发布时间:2021-06-28 19:23:36 Python

使用python docx按部分交叉引用的数字编号

我一直在使用 python-docx 来生成包含符合标准模板的表格和图形的大型文档.我发现了如何使用 https://github.com 使它们可交叉引用/python-openxml/python-docx/issues/359 .但是,这会在每个部分中标记我的数字/表格,从 1 开始,直到下一部分从 1 重新开始. 我希望数字取决于部分编号(即第二部分中的第一个数字 = 图 2.1 等 ..
发布时间:2021-06-26 20:29:07 其他开发

如何使用PIP安装python-docx?

我在 Mac 上的终端中输入了以下命令:sudo pip install python-docx --user.事情发生了,终端中的东西像疯了一样突然出现.突然……一个错误!有点让我恼火.出现以下情况: 错误:无法复制“docx/templates/default-docx-template":不存在或不是常规文件---------------------------命令 "/usr/bin/ ..
发布时间:2021-06-26 20:14:40 Python

Python-docx - 如何更改表格字体大小?

table = document.add_table(rows=1, cols=1)hdr_cells = table.rows[0].cellshdr_cells[0].text = '数量' 我必须更改一排一列表格中文本“数量"的字体大小,我该怎么做? 解决方案 您需要获取单元格中的段落.来自 python-docx 的文档: 3.5.2 _Cell 对象: class do ..
发布时间:2021-06-26 19:23:38 其他开发

Python-docx 设置文本方向RTL

我正在尝试使用 RTL(从右到左)文本方向创建文档 def printExam():#获取考试题目行 = db(db.exam_questions.exam == request.vars.exam).select()# 创建文档网络文档 = 文档()document.add_heading(u"أختبار", 0)#for row in row:行 = 行 [0]run = document ..
发布时间:2021-06-26 19:12:21 其他开发

使用python docx组合word文档

我有几个单词文件,每个文件都有特定的内容.我想要一个片段来展示或帮助我弄清楚如何在使用 Python docx 库时将单词文件合并到一个文件中. 例如在 pywin32 库中,我执行了以下操作: rng = self.doc.Range(0, 0)对于数据中的 d:时间.睡眠(0.05)docstart = d.wordDoc.Content.Startself.word.Visible ..
发布时间:2021-06-25 20:45:29 Python

使用 python-docx 在 MSWord 中添加超链接

我正在尝试使用 Python 的 docx 模块在 MS Word 文档中添加超链接. 我到处搜索(官方文档、StackOverflow、Google),但一无所获. 我想做类似的事情: from docx 导入文档文档 = 文档()p = document.add_paragraph('一个简单的段落有一些')p.add_hyperlink('链接到我的网站', target="h ..
发布时间:2021-06-25 20:34:18 Python

Python docx在保持样式的同时替换段落中的字符串

我需要帮助替换 Word 文档中的字符串,同时保持整个文档的格式. 我正在使用 python-docx,在阅读文档后,它适用于整个段落,所以我松散了粗体或斜体字等格式.包括要替换的文本以粗体显示,我想保持这种方式.我正在使用此代码: from docx 导入文档def replace_string2(文件名):doc = 文档(文件名)对于 doc.paragraphs 中的 p:如果 p ..
发布时间:2021-06-25 20:27:35 Python

如何使用 python-docx 从现有的 docx 文件中提取文本

我正在尝试使用 python-docx 模块(pip install python-docx)但这似乎非常令人困惑,因为在他们使用的 github repo 测试示例中opendocx 函数,但在 readthedocs 中,他们使用 Document班级.甚至他们只展示了如何将文本添加到 docx 文件而不阅读现有文件? 第一个 (opendocx) 不起作用,可能已弃用.对于第二种情况, ..
发布时间:2021-06-25 19:46:46 Python

在 Python 中读取 .docx 文件以查找删除线、项目符号和其他格式

谁能帮我在 Python 中使用 python-docx 识别 .docx 文件中的一个段落是否包含带有删除线格式的文本(即它出现但被划掉),或者在开头有一个项目符号?我正在尝试编写一个脚本来识别文档中的结构并解析内容. 到目前为止,我能够读取 .docx 文件并遍历段落,识别粗体段落. from docx 导入文档文档 = 文档(r'C:\stuff\Document.docx')对于 ..
发布时间:2021-06-14 18:39:06 Python

如何在python-docx中获取单元格背景颜色?

我正在尝试使用 python-docx 从 MS Word 表中读取数据.有一种方法可以设置表格单元格的背景颜色: tcPr = cell._tc.get_or_add_tcPr()shd = OxmlElement("w:shd")shd.set(qn("w:fill"), rgb2hex(*color))tcPr.append(shd) 我的任务相反,我需要获取现有的颜色.我不擅长 xml ..
发布时间:2021-06-04 19:25:43 Python

python-docx 在它们应该已满时返回空单元格

我正在尝试遍历文档中的所有表格并从中提取文本.作为中间步骤,我只是想将文本打印到控制台. 我在类似的帖子中查看了 scanny 提供的其他代码,但由于某种原因,它没有从我正在解析的文档中给我预期的输出 该文件可在 https://www.ontario.ca/laws/regulation 找到/140300 from docx 导入文档从 docx.enum.text 导入 WD_ ..
发布时间:2021-06-04 19:19:37 Python

提取 MS Word 文档格式元素以及原始文本信息

在这篇文章中@mikemaccana 描述了如何使用python-docx 从 Python 中的 MS Word 文档中提取原始文本数据.我想更进一步.除了简单地提取原始文本信息之外,我还可以使用此模块来获取有关字体(例如粗体与斜体)或字体大小(例如 12 与 18pt)的信息.我最接近的是这篇文章询问使用此模块提取突出显示的文本条目. 看起来有点抽象,我不完全确定这里发生了什么.有没有更 ..
发布时间:2021-06-04 19:19:27 Python