Solr
Solr是一个可扩展的,可部署,搜索,存储引擎,优化搜索大量以文本为中心的数据库
Solr是开源搜索平台,用于构建搜索应用程序
建立在Lucene(全文搜索引擎)之上
Solr是企业级的,...的所有功能
RESTful API: 要与Solr通信,可以使用RESTful服务与Solr通信,可以使用XML,JSON,CSV等格式的文件作为输入文档,并以相同的文件格式获取结果
全文搜索: Solr...提供了全文搜索所需的所有功能:令牌,短语,拼写检查,通配符,自动完成
企业准备: 根据企业或组织的需要,Solr可以部署在任何类型的系统:独立,分布式,云
灵活可扩展: 通过扩展Java类并进行相关配置...有助于在网上定位信息
用户可以通过以关键字或短语的形式将查询传递到搜索引擎中来搜索信息,然后搜索引擎搜索其数据库并向用户返回相关链接
搜索引擎组件
搜索引擎有三个组件:
Web爬虫: 一个收集网络信息的软件组件...数据库: Web上的所有信息都存储在数据库中,包含大量的Web资源
搜索接口: 这个组件是用户和数据库之间的接口,帮助用户搜索数据库
搜索引擎工作流程
获取原始内容: 任何搜索应用程序的第一步是收集要进行搜索的目标内容