Apache Solr - 搜索引擎基础知识

搜索引擎是指庞大的互联网资源数据库,如网页,新闻组,程序,图像等.它有助于在万维网上查找信息.

用户可以通过以关键字或短语的形式将查询传递到搜索引擎来搜索信息.然后搜索引擎在其数据库中搜索并返回给用户的相关链接.

Google Search

搜索引擎组件

通常,搜索引擎有三个基本组件,如下所示 :

  • 网络抓取工具 : 网络抓取工具也称为蜘蛛机器人.它是一个遍历网络以收集信息的软件组件.

  • 数据库 :  Web上的所有信息都存储在数据库中.它们包含大量的网络资源.

  • 搜索界面 : 该组件是用户和数据库之间的接口.它可以帮助用户搜索数据库.

搜索引擎如何工作?

任何搜索应用程序都需要执行以下部分或全部操作.

StepTitle描述

1

获取原始内容

任何搜索应用程序的第一步是收集要进行搜索的目标内容.

2

构建文档

下一步是从搜索应用程序可以理解的原始内容构建文档,轻松解释.

3

分析文档

在开始编制索引之前,文件将被分析.

4

索引文档

构建和分析文档后,下一步是索引它们,以便可以根据某些键而不是文档的全部内容检索此文档.

索引是类似于我们在一本书末尾的索引,其中常见的单词与其页码一起显示,以便可以快速跟踪这些单词,而不是搜索整本书.

5

搜索用户界面

Onc如果索引数据库已准备就绪,则应用程序可以执行搜索操作.为了帮助用户进行搜索,应用程序必须提供用户界面,用户可以在其中输入文本并启动搜索过程

6

构建查询

一旦用户发出搜索文本的请求,应用程序应该使用该文本准备一个查询对象,然后可以使用该文本来查询索引数据库获取相关细节.

7

搜索查询

使用查询对象,检查索引数据库以获取相关详细信息和内容文档.

8

渲染结果

收到所需结果后,应用程序应决定如何解除使用用户界面向用户播放结果.

请看下图.它显示了搜索引擎如何运作的整体视图.

搜索引擎

除了这些基本操作之外,搜索应用程序还可以提供管理用户界面,以帮助管理员根据用户配置文件控制搜索级别.搜索结果分析是任何搜索应用程序的另一个重要和高级方面.