中以key开始且词sentencekey:i+1在我们的前缀词典中的以key开始i结尾的词的末位置i的列表,即list存放的是sentence中以位置key开始的可能的词语的结束位置,这样通过查字典得到词...,下一个字是结尾的概率。...通过提前训练好的HMM转移概率、发射概率,使用基于动态规划的viterbi算法的方法,就可以找到一个使概率最大的BEMS序列。按照B打头,E结尾的方式,对待分词的句子重新组合,就得到了分词结果。...比如,对待分词的句子全世界都在学中国话得到一个BEMS序列 S,B,E,S,S,S,B,E,S这个序列只是举例,不一定正确,通过把连续的BE凑合到一起得到一个词,S为一个单独的词,就得到一个分词结果了:...以下句子为例:
小明硕士毕业于中国科学院计算所
定义变量
二维数组 weight4,4是状态数(0:B,1:E,2:M,3:S),15是输入句子的字数。