一谈起数据标注,很多人的第一反应都是语音转写、图片拉框这两个最为基础的数据类型,但是作为一个想要长远发展的数据标注公司和个人,一定是要全面发展,全方位的对这个行业有一个了解的,所以今天小编也想来讲讲关于文本标注的那么三两事
之前咱们说过文本标注的流程、分享过文本标注的工具,也聊过情感标注的四大个分类,今天呢,再来学习一下文本标注的4大应用类型
01
语义识别
语义识别是利用平台对文本进行标注,相同的内容,不同的分割,不同的顺序,表达的意思也会完全不同,所以如果想让计算机能清楚地识别,第一步就要告诉计算机,在每句话中,哪几个字是一个词组,这就是分词的过程,而中文有非常强的歧义性,所以准确分词是非常复杂且具有挑战性的
02
情绪识别
情绪识别原本是指AI通过获取个体的生理或非生理信号对个体的情绪状态进行自动辨别,是情感计算的一个重要组成部分。情绪识别研究的内容包括面部表情、语音、行为、心率和文本等方面,通过以上内容来判断用户的情绪状态
03
实体识别
一种信息提取技术。从文本数据中获取人名、地名等实体数据
04
数据清洗
数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等,录入后的数据清理一般是由计算机完成
关于文本的应用类型分享完了,还想知道文本标注的哪些知识技能呢?欢迎留言,我们一起学习吖~
领取专属 10元无门槛券
私享最新 技术干货