文件内容基于搜索 [英] Files content based Searching

查看:46
本文介绍了文件内容基于搜索的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我想为基于Web的应用程序创建搜索引擎。我希望实现基于内容的搜索。即,如果用户使用某个文件中的某些文本作为关键字进行搜索,则应用程序应该能够找到该文件。 (就像使用该文件中包含的单词或短语搜索文件或文件夹的窗口功能一样)。首先,截至目前,我已将文件放在服务器上的文件夹中。文件是否必须在数据库中才能合并。或者,即使文件在磁盘上,我也可以合并基于内容的搜索功能吗?

有人可以用示例代码帮助我吗?



我正在使用C#和ASP.NET。



谢谢。

I want to create a search engine for a web based application.i want to implement a content based searching. i.e. if the user searches using some text from some file as a keyword, the application should be able to find out that file. (just like the windows capability of "search for a file or folder using a word or a phrase contained in that file"). First thing, As of now I have the files in a folder on the server. Will the files have to be in a database to incorporate this. Or will I be able to incorporate the content based search capability even when the files are on a disk?
Can some one help me with example code??

I am using C# and ASP.NET.

Thanks.

推荐答案

你的答案并非无足轻重。

有很多文章处理使用像SQL Server这样的数据库服务器或使用像Solr这样的搜索引擎的文本搜索。

此外,还存在与从pdf或office文档等格式化文件中提取纯文本相关的问题。

以下文章应该是更深入研究的起点:
Lucene.Net上的
DotLucene:使用37行代码对您的Intranet或网站进行全文搜索 [ ^ ]
SorlNet上的
使用Solr for Search with .NET(C#) [ ^ ]

on SQL Server SQL全文搜索编程 [ ^ ]和 SQL SERVER - 2008 - 创建全文目录和全文搜索 [ ^ ]
Your answer isn''t trivial.
There are a lot of articles that deal with text search using db servers like SQL Server or using search engines like Solr.
Furthermore, there are problems related to the extraction of plain text from formatted files like pdf or office documents.
The following articles should be a starting point for a more in-depth reseach:
on Lucene.Net DotLucene: Full-Text Search for Your Intranet or Website using 37 Lines of Code[^]
on SorlNet Using Solr for Search with .NET(C#)[^]
on SQL Server SQL Full Text Search Programming[^] and SQL SERVER - 2008 - Creating Full Text Catalog and Full Text Search[^]


这篇关于文件内容基于搜索的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆