有哪些工具可用于跨各种工具集的 Intranet 搜索引擎? [英] What tools are out there for an Intranet search engine across a diverse toolset?

查看:50
本文介绍了有哪些工具可用于跨各种工具集的 Intranet 搜索引擎?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

基本要求:

  • 应该能够为 MediaWiki、Confluence、Sharepoint、GitHub:Enterprise、Askbot 等内容编制索引
  • 在删除重复结果方面应该相当聪明(Confluence 搜索如此痛苦的原因之一).
  • 绝对应该结合启发式方法,例如链接到文档的页数、搜索词是否在文档的标题中等.如果有办法让用户降低特定结果​​的排名,那可能是一个奖励.
  • 应该在某种程度上可以调整(例如,更喜欢 Confluence 而不是 Sharepoint,将某些路径列入黑名单).

是否有可以实现上述功能的现成产品?开源项目?是否有 FOSS 项目可以提供上述基础知识并且易于扩展或构建前端?

Are there off-the-shelf products that can do the above? FOSS projects? Are there FOSS projects that can provide the basics for the above and are easy to extend or build a frontend for?

推荐答案

你可以试试 Apache Solr,这是一个很棒的工具.

You can try Apache Solr, it's a great tool.

根据网站:

Solr 是流行的、极快的开源企业搜索来自 Apache Lucene 项目的平台.其主要特点包括强大的全文搜索、命中突出显示、分面搜索、近实时索引、动态聚类、数据库集成、丰富文档(例如 Word、PDF)处理和地理空间搜索.索尔是高度可靠、可扩展和容错,提供分布式索引、复制和负载平衡查询、自动故障转移和恢复、集中配置等.Solr 为许多世界上最大的互联网的搜索和导航功能网站.

Solr is the popular, blazing fast open source enterprise search platform from the Apache Lucene project. Its major features include powerful full-text search, hit highlighting, faceted search, near real-time indexing, dynamic clustering, database integration, rich document (e.g., Word, PDF) handling, and geospatial search. Solr is highly reliable, scalable and fault tolerant, providing distributed indexing, replication and load-balanced querying, automated failover and recovery, centralized configuration and more. Solr powers the search and navigation features of many of the world's largest internet sites.

这篇关于有哪些工具可用于跨各种工具集的 Intranet 搜索引擎?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆