机器阅读理解涉及信息检索、文本匹配、语言理解、语义推理等不同层次的技术,对于复杂问题的处理甚至需要结合世界知识与常识知识,极具挑战。为了进一步推动机器阅读理解领域的技术发展,为研究者提供学术交流和模型评测的基准,本次竞赛将重点针对阅读理解中较为复杂的,需要利用整篇文章中多个句子的信息进行综合才能得到正确答案的观点型问题开展评测。本次竞赛将利用准确率进行评分,作为主要评价指标。组委会将通过客观指标,并结合答辩表现,综合评估参赛者的算法模型。
采用bilstm crf attention 和 word2vec 做文本标注。
形成文本分类基础标注模型。(svm分类/k最近邻分类)还没有想好;
采用多层结构进行子父类数据的结构化保存。
Word2vec:
bilstm :
crf :
Rnn attention:
Tfidf: 词频逆向词频,在现在的语料数据看来词频文章同词词频的效果并不会很好,只能作为辅助类的算法。
参赛准备中,加油梦想家。
领取专属 10元无门槛券
私享最新 技术干货