本文是爱奇艺人工智能研究组2018年的论文,本文创新之处在于将关键词识别转化序列标注任务,将BiLSTM-CRF运用在识别关键词。BiLSTM-CRF常用于命名实体识别、分词、词性标注等任务。....同时,关键词在信息检索、文本聚类、分类和文档摘要等NLP任务中也发挥着重要作用.例如,在文本聚类时,可以将关键词相似的多篇文档看成一个簇,这样就可以大大地提高KGMeans聚类的收敛速度;从某天所有新闻中提取出这些新闻的关键词...,ME)和条件随机场(ConditionalRandomFields,CRF)等模型.其中CRF是目前解决序列标注问题最主流的做法,性能也最好,目前已被广泛应用于NLP的各种任务中,如分词、词性标注、命名实体识别等...,而模型的好坏与特征工程的构建有很大关系.近些年,随着深度学习的兴起,其已被广泛应用于NLP的各种任务中,如分词、词性标注、命名实体识别、情感分析等,且取得了一定的成果.长短期记忆网络(LongShortGTermMemoryNetworks...对于中文分词,本文使用的是爱奇艺 NLP团队自己开发的中文分词工具.本文使用预训练好的词向量,大小为400维.