首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

全文检索Solr集成HanLP中文分词

意思是默认文本字段类型启用HanLP分词器,text_general还开启了solr默认的各种filter。...solr允许为不同的字段指定不同的分词器,由于绝大部分字段都是text_general类型的,可以说这种做法比较适合新手。...如果你的业务系统中有其他字段,比如location,summary之类,也需要一一指定其type="text_general"。...切记,否则这些字段仍旧是solr默认分词器,会造成这些字段“搜索不到”。 另外,切记不要在query中开启indexMode,否则会影响PhaseQuery。...索引模式的功能 索引模式可以对长词进行全切分,得到其中蕴含的所有词汇。比如“中医药大学附属医院”在HanLP索引分词模式下的切分结果为: 1.

1.4K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Solr 笔记 2-core 创建后的数据导入

    Solr 笔记 2-core 创建后的数据导入 前言 在笔记 1 中,我们已经介绍了Solr下载及单节点启动和配置,以及如何创建core,但是如何进行数据导入却还没有介绍。...--以下的字段column属性对应数据库中字段名称,name是对应solr这边配置的名称; 注意id,默认名称即为id,表示solr这边一条数据的主键,为需要的字段建立索引关系...-- name属性为引入字段在solr中的名称。...type表示类型,solr中会有很多类型,这个在managed-schema中你会看到很多的fieldType标签,都是solr中的类型 indexed:表示是否建立索引,true为建立,...如果为false,则该字段不能作为条件查询出来; stored:表示是在solr中显示,如果这里设置为false,将会在solr中查询不到。

    83030

    Solr的知识点学习 Solr单机版的安装与使用

    答:创建一个Solr home目录,目录中包括了运行Solr实例所有的配置文件和数据文件,SolrHome是Solr运行的主目录。...答:创建一个Solr home目录,目录中包括了运行Solr实例所有的配置文件和数据文件,SolrHome是Solr运行的主目录,一个SolrHome可以包括多个SolrCore(Solr实例),每个SolrCore...hl"是指某个字段高亮。"df"是指需要指定默认字段。 7、Solr全文检索,如何支持中文分词?如何添加中文分词器?   答:需要使用IK中文分词器。...41 动态字段就是不用指定具体的名称,只要定义字段名称的规则,例如定义一个 dynamicField,name为*_i,定义它的type为text,那么在使用这个字段的时候,任何以_i结尾的字段都被认为是符合这个定义的...1 通过/select搜索索引,Solr制定一些参数完成不同需求的搜索: 2 a、q代表查询字符串,必须的,如果查询所有使用*:*。

    1.2K40

    Solr core创建后的数据导入

    --以下的字段column属性对应数据库中字段名称,name是对应solr这边配置的名称; 注意id,默认名称即为id,表示solr这边一条数据的主键,为需要的字段建立索引关系...webapps/solr/WEB-INF/lib文件夹中; 配置managed-schema文件 即在笔记 1 中创建core后所出现的schema.xml文件,该文件配置内容为solr索引中引入字段的类型设置...-- name属性为引入字段在solr中的名称。...type表示类型,solr中会有很多类型,这个在managed-schema中你会看到很多的fieldType标签,都是solr中的类型 indexed:表示是否建立索引,true为建立,...如果为false,则该字段不能作为条件查询出来; stored:表示是在solr中显示,如果这里设置为false,将会在solr中查询不到。

    88310

    Solr的schema.xml

    schema.xml是Solr一个配置文件,它包含了你的文档所有的字段,以及当文档被加入索引或查询字段时,这些字段是如何被处理的。这个文件被存储在Solr主文件夹下的conf目录下,默认的路径....在配置中,string类型的class是solr.StrField,而这个字段是不会被分析存储的,也就是说不会被分词。...一个标准的分词: text_general" class="solr.TextField" positionIncrementGap="100"> 所有的token转换成小写,也就是在最终的index中保存的都是小写 你也可以定义一个analyzer,例如使用mmseg4j进行中文分词: <fieldType...例如: id defaultSearchField节点 默认搜索的字段,我们已经将需要搜索的字段拷贝至all字段了,在这里设为all即可。

    98030

    solr的基本概念

    在solr集群的情况下,我们称这张表叫collection,在单机的情况下,我们叫它core。     在solr集群的情况下,每一个shard分片下的副本replica也称为core。...在solr中,我们可以将爱好组成一个list放到这一个字段中。           如果在数据库中,我们没有相应的概念,只能新建一张表,做一对多的关系。...root_" type="string" indexed="true" stored="false" docValues="false" /> text_general...,我们注意到最后一行,,含义是将所有的字段都复制到“_text_”字段中去,并进行分词。     ...在solr中,已经默认给我们创建好了一些常用的动态字段,方便了我们的使用。我们在编写java通用类时也正是运用了这一特性。

    73420

    Apache solr(一).

    solr的所有版本下载地址:http://archive.apache.org/dist/lucene/solr/  安装配置以及程序插入与查询 1、启动solr        命令行窗口进入安装目录的...在控制台的左边菜单中,选择Core Admin,进入core新建页面。 ...在点击Add Core 保存之前, 先进入solr的安装目录的 server - solr 下 新建一个和core同名的文件夹,如:  进入E:\DevelopEnvironment\solr\solr...进入该core的Schema 菜单 ,点击Add Field ,在弹出的页面中,录入name和type,name代表字段的名称,type为类型 ,类型选择 text_general。...stored 意思为,将该字段的值进行存储,用来以后索引的时候直接取出。 indexed 表示 将该字段进行索引。  ? 录入完成后,点击Add Field保存即可。

    1.7K80

    【详解】CentOS安装与配置Solr6.5

    可以通过以下命令创建一个新的Core:bin/solr create -c mycore这将在Solr中创建一个名为​​mycore​​​的新Core。...编辑​​/opt/solr-6.5.0/server/solr/mycore/conf/schema.xml​​文件,根据需要添加或修改字段定义。...创建核心创建一个新的Solr核心(例如,名为​​mycore​​):bin/solr create -c mycore6. 配置Solr编辑核心的配置文件。...配置 Solr 核心Solr 核心是 Solr 中的数据存储单元。你可以创建一个新的核心来管理你的数据。# 创建一个新的核心./solr create -c mycore# 列出所有核心....修改 ​​schema.xml​​假设你想要添加一个新的字段 ​​title​​​,可以在 ​​schema.xml​​ 中进行如下修改:text_general

    7100

    Solr

    # 简介 数据库太慢 # 启动 bin目录下 solr start 后台url (opens new window) # 创建core solr create -c name 创建的core文件在...,注意id必须是tring 可以用postman添加字段,post方法 http://localhost:8983/solr/user_core/schema id本身就有,因此id不用再添加 {...root_" type="string" docValues="false" indexed="true" stored="false"/> text_general.../ik-analyzer-solr 将ik-analyzer-8.5.0.jar放置在webapp/WEB-INF/lib/目录下 将resources目录下的5个配置文件放入solr服务的Jetty或...我们的solr目的就是为了能让我们的应用程序更快的查询出用户想要的数据,而数据存储在应用中的各种地方入xml、pdf、关系数据库中,那么solr首先就要能够获取这些数据并在这些数据中建立索引来达成快速搜索的目的

    1.3K20

    solr

    ,且可以针对每个Facet字段设置查询参数.以下介绍的参数既可以应用于所有的Facet字段,也可以应用于每个单独的Facet字段.应用于单独的字段时通过 f.字段名.参数名=参数值...enum或fc,默认为fc.该字段表示了两种Facet的算法,与执行效率相关. enum适用于字段值比较少的情况,比如字段类型为布尔型,或者字段表示中国的所有省份.Solr会遍历该字段的所有取值,并从filterCache...MLT 要求字段被储存或使用检索词向量,检索词向量以一种以文档为中心的方式储存信息。MLT 通过文档的内容来计算文档中关键词语,然后使用原始查询词语和这些新词语创建一个新的查询。...提交新查询就会返回其他查询结果。所有这些都可以用检索词向量来完成:只需将 termVectors=”true” 添加到 schema.xml 中的 声明。...到这里我们的配置还有没完成呢,还要加几个copyFiled,这样就不用单独处理我们新加的拼音字段了。

    11.1K20

    Solr7使用Oracle数据源导入+中文分词

    安装目录假设为#solr_home,本文的#solr_home为apps/svr/solr  一、Oracle数据导入 1....在#solr_home/server/solr下新建文件夹,假设为mjd; 2....在菜Thread Dump下方有一个下拉框,选择刚新建的Core,点击Schema 里的Add field菜单,name输入刚才配置的查询语句中的某个字段(假设该字段为字符串类型),点击field type...服务; 4.在第一部分第8步的时候,Add Field的时候,看是否有text_cn_splitting类型可选,如果有的话,那在add field的时候将需要进行中文分词的字段选择该类型即可;  定时任务...如果需要设置单字段索引,而不每个字段都去检索,比如有数据字段author,title,keywords,body,搜索的时候想搜索这四个字段,可以使用copyField字段,具体方法,在managed-schema

    80720
    领券