提取C#.net中ODT文件的内容 [英] extract the contents of ODT files in C#.net

查看:91
本文介绍了提取C#.net中ODT文件的内容的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

朋友们,
我正在尝试提取ODT文件的内容以进行索引.
我来详细说明.

以下是我提取odt文件内容所遵循的步骤:

步骤
1-将odt文件转换为临时zip文件.
2-循环浏览内部文件并检索"content.xml"文件.
3-ODT文件的实际内容位于名为< text:p>
的xml元素中 4-索引从< text:p>
检索到的内容
请给我以上步骤的示例,以便我可以将odt文件转换为文本文件,然后生成pdf

Hi friends,
I am trying to extract the contents of ODT files for indexing.
Let me elaborate.

The following are the steps i follow to extract the contents of the odt file:

Steps
1 - convert the odt file into a temporary zip file.
2 - loop thru the files inside and retrieve the ''content.xml'' file.
3 - the actual content of the ODT file resides in an xml element called <text:p>
4 - index the contents retrieved from <text:p>

Please can you give me example of above steps so that i can convert the odt file to text file and then generate pdf

推荐答案

在此处尝试使用IFilter: http://www.ifiltershop.com/sofilter.html [
Try using the IFilter here : http://www.ifiltershop.com/sofilter.html[^]


这篇关于提取C#.net中ODT文件的内容的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆