将document进行分析(分词)
域的三个属性,分词,索引,存储
document.add(new TextField(FIELD,"hello world", Field.Store.YES));...document.add(new StoredField(FIELD,"hello china"));
TextField 模型进行分词,Field.Store.YES 表示进行存储(即可以提供返回结果...,lucene使用布尔和VSM两个模型的结合,来进行搜索关键词与文档的打分操作,判断文档与关键词的相似性和相关性。...布尔模型
布尔模型,搜索过程就是判断文档与用户意图是否相关的一个过程,是逻辑运算(也称布尔运算)的过程
对于一个用户输入的关键词,搜索引擎要布尔运算判断每篇文献是否含有这个关键词,如果含有关键词,则给这篇文章一个逻辑值...该模型主要用于解决文本相似度的问题,搜索关键词与对应网页相似度可以视为文本相似度的问题。