首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Solr -将术语添加到方面

Solr -将术语添加到方面
EN

Stack Overflow用户
提问于 2015-10-21 14:47:30
回答 1查看 152关注 0票数 0

如何将术语添加到solr中的一个方面?我想用一个术语和同义词列表索引一些文档。

我有文本文档,其中包含了我想要能够搜索的术语。

例如,本文件包含以下术语:

干扰素、细胞因子、MEC

我希望这些术语(或者如果这个词是术语列表中的同义词,而不是同义词)出现在我正在索引的术语的方面列表中。

  1. J干扰素细胞因子研究,2015年9月25日。印刷前的Epub

高糖通过H3K9甲基转移酶机制增加巨噬细胞炎性细胞因子基因的表达。

李明(1),张R(1),李TT(1),陈米(1),李LX(1),陆JX(1),贾WP(1)。

作者资料:(1)上海交通大学附属第六人民医院内分泌科,上海糖尿病研究所,上海糖尿病临床中心,上海糖尿病重点实验室,上海市代谢病重点临床中心,上海,中国。

近年来的研究表明,组蛋白修饰是高血糖条件下调节炎症细胞因子基因表达的机制之一。然而,在高糖(HG)条件下,组蛋白甲基化是如何启动和参与炎症细胞因子基因表达变化的,目前尚不清楚。我们的目的是研究H3K9甲基化是否参与HG诱导的巨噬细胞炎性细胞因子的表达。用人细胞因子抗体芯片检测高血糖状态下细胞因子基因在THP-1衍生巨噬细胞中的表达谱。根据人细胞因子抗体阵列分析结果,采用H3K9me3法检测HG下白细胞介素-6 (IL-6)、白细胞介素-12p40、巨噬细胞炎症蛋白-1α(MIP-1α)和MIP-1β4种炎症细胞因子基因的α水平。此外,用定量聚合酶链反应分析了HG或SUV39H1甲基转移酶抑制剂chaetocin暴露或过表达SUV39H1 (H3K9me3特异性甲基转移酶)后4种炎性细胞因子基因的表达。与正常葡萄糖(NG)培养的巨噬细胞相比,在HG条件下培养的巨噬细胞表达增加,炎性细胞因子基因H3K9me3水平降低。链霉素抑制SUV39H1对巨噬细胞IL-6、IL-12p40、MIP-1α和MIP-1β的表达也有促进作用。此外,在HG处理的巨噬细胞中,用链霉素抑制SUV39H1进一步增加了这些炎性细胞因子的表达。与之相反,转染SUV39H1质粒的NG处理巨噬细胞表达炎性细胞因子减少.此外,SUV39H1在HG处理的巨噬细胞中的过度表达也减轻了HG条件下炎性细胞因子的表达。最后,HG还能增加小鼠骨髓巨噬细胞炎症细胞因子的表达.我们的数据表明,HG通过降低H3K9me3水平而增加巨噬细胞中炎性细胞因子的表达,这部分是由SUV39H1介导的。表观组蛋白修饰失调可能是HG诱导巨噬细胞炎性细胞因子表达的机制之一。

PMID: 26406561 PubMed -由publisher提供

编辑:

我试过有人建议的:

代码语言:javascript
运行
复制
but only got this:
"id":"9cae6e2f-bd81-4c72-b2a8-fd8184af603d",
        "_version_":1515690847909183488},
      {
        "content":["The CHO airport is at 38.1384683,-78.4527887.\nSee also: http://www.lat-long.com/Latitude-Longitude-1480221-Virginia-Charlottesville_Albemarle_Airport.html"],
        "title":["Test1"],
        "id":"cdf82556-7545-4d81-a7a5-83bb4f14e4b7",
        "_version_":1515776762744668160}]
  },
  "facet_counts":{
    "facet_queries":{},
    "facet_fields":{
      "key_phrases":[]},
    "facet_dates":{},
    "facet_ranges":{},
    "facet_intervals":{},
    "facet_heatmaps":{}}}

这是我的查询

代码语言:javascript
运行
复制
http://localhost:8983/solr/Cytokine/query?q=*:*&facet=on&facet.field=key_phrases

Edit2:当我查看solr中的分析页面时,我可以看到它分解了空白筛选器和带状筛选器中的数据,但是在留言符过滤器中没有任何数据。

编辑3:开始工作了!下面是我的模式:

代码语言:javascript
运行
复制
<field name="key_phrases" type="key_phrases" indexed="true" stored="false" multiValued="true"/>
<fieldType name="key_phrases" class="solr.TextField" >
<analyzer>
<filter class="solr.ShingleFilterFactory"
            minShingleSize="2" maxShingleSize="3"
            outputUnigramsIfNoShingles="true"
    />
  <tokenizer class="solr.WhitespaceTokenizerFactory"/>
      <filter class="solr.LowerCaseFilterFactory"/>
    <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" tokenizerFactory="solr.KeywordTokenizerFactory"/>
    <filter class="solr.KeepWordFilterFactory"
            words="keep_phrases.txt" ignoreCase="true"/>
  </analyzer>
</fieldType>
<copyField source="content" dest="key_phrases"/>

以下是我的同义词:

代码语言:javascript
运行
复制
cytokine, CXCL10, cxcl10, CYTOKINE IP 10 PROTEIN, INTERFERON-INDUCIBLE PROTEIN 10

以下是我要说的话:

代码语言:javascript
运行
复制
endocrinology
cytokine
histone

PS:如果您看到“复制”字段不工作,则需要删除solr/server/solr/[CORE NAME]/data中的“数据”文件夹。然后重新启动,它就会工作。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-10-21 20:30:26

这是自然语言处理领域所关注的问题之一( NLP ),并且有各种各样的库为大多数语言做不同类型的NLP。

然而,有一些小的黑客可以直接在Solr中执行"穷人实体提取“操作。对于您的情况,本文中的第二个示例将是一个可能的解决方案:

代码语言:javascript
运行
复制
<field name="key_phrases" type="key_phrases" indexed="true" stored="false" multiValued="true"/>
<copyField source="content" dest="key_phrases"/>
<fieldType name="key_phrases" class="solr.TextField" sortMissingLast="true" omitNorms="true">
<analyzer>
  <tokenizer class="solr.WhitespaceTokenizerFactory"/>
    <filter class="solr.ShingleFilterFactory"
            minShingleSize="2" maxShingleSize="5"
            outputUnigramsIfNoShingles="true"
    />
    <filter class="solr.KeepWordFilterFactory"
            words="keep_phrases.txt" ignoreCase="true"/>
    <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

。。其中keep_phrases.txt包含如下内容:

代码语言:javascript
运行
复制
airport 
restaurant
toy store

(或干扰素,细胞因子,MEC在你的情况下)。maxShingleSize应该和单个短语中最大的单词数量一样大。

对于处理同义词,使用常规的同义词过滤器应该是可以的。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/33262478

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档