有哪些工具可用于跨各种工具集的 Intranet 搜索引擎? [英] What tools are out there for an Intranet search engine across a diverse toolset?
问题描述
基本要求:
- 应该能够为 MediaWiki、Confluence、Sharepoint、GitHub:Enterprise、Askbot 等内容编制索引
- 在删除重复结果方面应该相当聪明(Confluence 搜索如此痛苦的原因之一).
- 绝对应该结合启发式方法,例如链接到文档的页数、搜索词是否在文档的标题中等.如果有办法让用户降低特定结果的排名,那可能是一个奖励.
- 应该在某种程度上可以调整(例如,更喜欢 Confluence 而不是 Sharepoint,将某些路径列入黑名单).
是否有可以实现上述功能的现成产品?开源项目?是否有 FOSS 项目可以提供上述基础知识并且易于扩展或构建前端?
Are there off-the-shelf products that can do the above? FOSS projects? Are there FOSS projects that can provide the basics for the above and are easy to extend or build a frontend for?
推荐答案
你可以试试 Apache Solr,这是一个很棒的工具.
You can try Apache Solr, it's a great tool.
根据网站:
Solr 是流行的、极快的开源企业搜索来自 Apache Lucene 项目的平台.其主要特点包括强大的全文搜索、命中突出显示、分面搜索、近实时索引、动态聚类、数据库集成、丰富文档(例如 Word、PDF)处理和地理空间搜索.索尔是高度可靠、可扩展和容错,提供分布式索引、复制和负载平衡查询、自动故障转移和恢复、集中配置等.Solr 为许多世界上最大的互联网的搜索和导航功能网站.
Solr is the popular, blazing fast open source enterprise search platform from the Apache Lucene project. Its major features include powerful full-text search, hit highlighting, faceted search, near real-time indexing, dynamic clustering, database integration, rich document (e.g., Word, PDF) handling, and geospatial search. Solr is highly reliable, scalable and fault tolerant, providing distributed indexing, replication and load-balanced querying, automated failover and recovery, centralized configuration and more. Solr powers the search and navigation features of many of the world's largest internet sites.
这篇关于有哪些工具可用于跨各种工具集的 Intranet 搜索引擎?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!