提取C#.net中ODT文件的内容 [英] extract the contents of ODT files in C#.net
问题描述
朋友们,
我正在尝试提取ODT文件的内容以进行索引.
我来详细说明.
以下是我提取odt文件内容所遵循的步骤:
步骤
1-将odt文件转换为临时zip文件.
2-循环浏览内部文件并检索"content.xml"文件.
3-ODT文件的实际内容位于名为< text:p>
的xml元素中
4-索引从< text:p>
检索到的内容
请给我以上步骤的示例,以便我可以将odt文件转换为文本文件,然后生成pdf
Hi friends,
I am trying to extract the contents of ODT files for indexing.
Let me elaborate.
The following are the steps i follow to extract the contents of the odt file:
Steps
1 - convert the odt file into a temporary zip file.
2 - loop thru the files inside and retrieve the ''content.xml'' file.
3 - the actual content of the ODT file resides in an xml element called <text:p>
4 - index the contents retrieved from <text:p>
Please can you give me example of above steps so that i can convert the odt file to text file and then generate pdf
推荐答案
在此处尝试使用IFilter: http://www.ifiltershop.com/sofilter.html [
Try using the IFilter here : http://www.ifiltershop.com/sofilter.html[^]
这篇关于提取C#.net中ODT文件的内容的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!