SBME标记法: S 表示 表示单个字的词(single word) , B表示词的开始(begin)即首字,M表示词的中间(Middle)即词的中间字,E表示词的结尾(end),即尾字
一般在用数字这样表示:
# -1, unknown
# 0-> 'S'
# 1-> 'B'
# 2-> 'M'
# 3-> 'E'
样例:
我爱使用小米手机玩王者荣耀 -> 我<S>爱<S>使<B>用<E>小<B>米<M>手<M>机<E>玩<S>王<B>者<M>荣<M>耀<E>
CS标记法:C 表示 当前的字char和后面字char是连续的,它们共同表示一个词,S 表示 当前字char和后面字char是两个不同的词 。
一般用数字这样表示:
#-1,unkonwn
# 0 , -> 'C'
# 1 , -> 'S'
样例:
我爱使用小米手机玩王者荣耀 -> 我<S>爱<S>使<C>用<S>小<C>米<C>手<C>机<S>玩<S>王<C>者<C>荣<C>耀<S>