docx相关内容

docx4j查找并替换

我有一些占位符的docx文档.现在,我应该用其他内容替换它们并保存新的docx文档.我从 docx4j 并找到此方法: 公共静态列表getAllElementFromObject(Object obj,Class toSearch){List结果=新的ArrayList();如果(JAXBElement的obj实例)obj =(((JA ..
发布时间:2021-05-02 20:06:20 Java开发

在Windows中使用反词在Python中读取.doc文件(也是.docx)

我尝试读取 .doc 文件,例如- ,其中open('file.doc',errors ='ignore')为f:文字= f.read() 它确实读取了该文件,但是有很多垃圾,我无法删除该垃圾,因为我不知道它从哪里开始以及在哪里结束. 我还尝试安装 textract 模块,该模块说它可以从任何文件格式读取,但是在Windows中下载时存在很多依赖关系问题. 因此,我还是使用 an ..
发布时间:2021-05-02 20:06:17 Python

DocX克隆表并在索引处插入

我正在使用C#制作一个简单的Windows应用程序,并使用Novacode来操纵Word文档. 我的Word文档中有一个要克隆的源表.我可以使用以下代码找到源表: 表源表= document.Tables [3]; 我可以通过行和列看到实际上这是我要克隆的表. 我的Word文档中有一个字符串,该字符串刚好要插入克隆的源表.实际上,我可能需要插入多次. 我不知道如何找到我的字 ..
发布时间:2021-05-02 20:06:14 C#/.NET

在DOCX输出中更改Pandoc等宽字体的大小或样式

使用降价代码块时,在DOCX文档中产生的等宽字体大小太大. 我可以通过指定自定义的 template.docx 文件来调整段落的字体大小,但是由于某些原因,与大多数其他生成的输出相反,生成的代码块不使用段落样式. 有什么方法可以 使代码块使用特定的样式,以便可以覆盖 template.docx 中的样式 要覆盖代码块的DOCX表示中使用的等宽字体吗? 已更新以澄清: ..
发布时间:2021-05-02 20:06:11 其他开发

在.docx文件中查找和替换文本-Python

我一直在努力寻找一种方法来查找和替换docx文件中的文本,但运气不佳.我尝试了docx模块,但无法正常工作.最终,我使用zipfile模块制定了下面描述的方法,并替换了docx存档中的document.xml文件.为此,您需要一个模板文档(docx),其文本要替换为唯一的字符串,该字符串不能与文档中任何其他现有或将来的文本匹配(例如,“与XXXMEETDATEXXX上的XXXCLIENTNAMEX ..
发布时间:2021-05-02 20:06:08 Python

页码python-docx

我正在尝试用python创建一个程序,该程序可以在.docx文件中找到特定的单词并返回其出现的页码.到目前为止,在浏览python-docx文档时,我无法找到如何访问页码,甚至无法访问该编号所在的页脚.有没有办法使用python-docx甚至只是python来做到这一点?否则,什么是最好的方法? 解决方案 简短答案为否,因为分页符是由呈现引擎插入的,而不是由.docx文件本身确定的. ..
发布时间:2021-05-02 20:06:05 Python

如何使用Django框架创建docx文件?

我想使用Django创建docx文件.我已经在笔记本电脑上安装了python-docx,我使用了pip install python-docx这个命令,甚至在桌面上创建了一个.docx文件,但是我不打算在django项目中使用它.首先,我是否需要从项目中修改settings.py才能将python-docx导入django?顺便说一句,当有人访问我的url应用程序时,我想创建这些文件,我有一个名为 ..
发布时间:2021-05-01 19:24:22 Python

在Windows Form C#上打开Word(.docx)文件

我试图使我的程序能够在窗体上显示Microsoft Word文件,但这样做没有任何运气.我希望能够打开该文件并将其显示为只读形式.所以基本上只显示它的内容.Web上的各种用户都建议在WebBrowser控件中(在工具箱下)显示文件.我已经尝试过了,但是没有成功.我的最终目标是能够在Web浏览器的顶部进行批注(或类似的方式),然后将批注与打开的文件一起保存. 我也不具备C#语言方面的经验,因此 ..
发布时间:2021-04-18 19:00:29 C#/.NET

如何在Java中打开受密码保护的docx文件?

我想使用Apache POI打开一个受密码保护的docx文件.有人可以帮我提供完整的代码吗?此代码无法解决问题 线程“主"中的异常org.apache.poi.poifs.filesystem.OfficeXmlFileException:提供的数据似乎在Office 2007+ XML中.您正在调用与OLE2 Office文档有关的POI部分.您需要调用POI的其他部分来处理此数据(例如X ..
发布时间:2021-04-08 19:21:19 Java开发

Apache POI或docx4j中的SUM(ABOVE)功能

我正在尝试在docx中实现= SUM(ABOVE)函数,该函数用于将以上所有元素加到列中.我能够使用 与apache poi来实现这一点 CTSimpleField sumAbove = sectionInCell.getCTP().addNewFldSimple();sumAbove.setInstr("= SUM(ABOVE)");//将总和字段设置为脏,因此必须在打开文档时对其进行计算 ..
发布时间:2021-04-08 19:20:08 Java开发

使用Apache POI处理docx文件中的复选框

能请你帮我吗?我需要通过Apache POI填写MS Word docx 模板中的复选框.复选框已通过“开发人员"选项卡->“控件"->“复选框"插入,并位于段落->"w:sdt"标记内(不在段落->运行内). 我已经尝试过 paragraph.getCTP().getFldSimpleList(),但它返回0个字段. 那么还有另一种获取复选框访问权限的方法吗? XML部分: ..
发布时间:2021-04-08 19:18:57 Java开发

设置Apache POI XWPFTable表的外边界?

我需要设置Apache POI XWPFTable表的外边界.我知道下面的命令设置insade边框,但是找不到设置外部边框的方法. table.setInsideHBorder(XWPFBorderType.SINGLE,4,0,"FF0000"); 有帮助吗?预先感谢! 解决方案 我找到了: CTTblPr tblpro = table.getCTTbl().getTblPr ..
发布时间:2021-04-08 19:18:07 Java开发

XWPFTableRow用当前样式添加新的Row?

我尝试使用Apache POI将新行添加到现有XWPFTable上,以使添加的行保留最后一行的样式(字体,颜色等).通常,XWPFTable.createRow()返回具有空白样式的行.我尝试使用最后一行的CTRow作为构造参数和XWPFTable.addRow()创建新的XWPFTableRow对象.但是,当我创建对象时,它仅引用最后一行(对对象所做的任何更改都会反映在最后一行上,而不是新添加的 ..
发布时间:2021-04-08 19:17:15 Java开发

如何使用Ajax读取外部docx文件内容

以下是形成的请求: 请求网址: https://remoteserverurl.docx 请求方法:GET状态码:200 OK远程地址:10.232.4.216:7317推荐人政策:降级时不推荐人接受:text/html,application/xhtml + xml,application/xml; q = 0.9,image/webp,image/apng,/; q = 0.8接受编码: ..
发布时间:2021-04-02 19:41:11 前端开发

如何从段落python docx获取图像(inlineshape)

我想逐段阅读docx文档,如果有图片(InlineShape),请使用其周围的文字进行处理.函数Document.inline_shapes将提供文档中所有内联形状的列表.但是我想得到一个,如果存在的话,它恰好出现在当前段落中... 代码示例: from docx import Document doc = Document("test.docx") blip = doc.inlin ..
发布时间:2020-11-26 22:44:55 其他开发

使用openoffice无头方式将docx转换为pdf太慢

我一直在使用PHPWord生成docx文件.它一直都很棒. 但是现在我还需要在pdf版本中提供其中一些文件. 经过一些研究,我发现使用OOo的 PyODConverter .似乎是一个不错的选择,因为我不想依赖第三方Web服务.我在计算机上对其进行了尝试,并且可以正常工作,因此我也将其应用到了服务器上.花了一点时间,但我也设法在那里进行了工作. 但是有一个(不好的)问题.在服务器上,完 ..
发布时间:2020-11-22 20:17:19 PHP

如何在Linux(Mac)中从WORD文档中提取嵌入式PDF

我在Mac中也遇到过此类问题,只想在bash脚本文件中共享我的解决方案,而无需其他应用程序! 解决方案 此脚本将提取word文档中嵌入的所有pdf文件. 只需将脚本文件放在word.docx文件所在的位置,然后运行它(首先赋予它权限),就像这样: ./extract_docx_objects.sh word.docx 提取的文件将位于子文件夹 docx_zip/word/ ..
发布时间:2020-11-02 21:51:22 其他开发

如何从.doc&中仅提取纯文本.docx文件?

任何人都知道他们可以推荐的什么内容,以便从.doc或.docx中仅提取纯文本? 我发现了此-想知道是否还有其他建议吗? 解决方案 如果您要纯文本格式(我的要求),那么您所需要的就是 unzip -p some.docx word/document.xml | sed -e 's/]\{1,\}>//g; s/[^[:print:]]\{1,\}//g' 我在命令行f ..
发布时间:2020-11-02 21:41:49 服务器开发