首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    人民日报标注语料库(PFR)1.标记说明2.格式说明3.例子4.生语料库和熟语料库5.其他语料库汇总

    PFR语料库是对人民日报1998年上半年的纯文本语料进行了词语切分和词性标注制作而成的,严格按照人民日报的日期、版序、文章顺序编排的。文章中的每个词语都带有词性标记。目前的标记集里有26个基本词类标记(名词n、时间词t、处所词s、方位词f、数词m、量词q、区别词b、代词r、动词v、形容词a、状态词z、副词d、介词p、连词c、助词u、语气词y、叹词e、拟声词o、成语i、习惯用语l、简称j、前接成分h、后接成分k、语素g、非语素字x、标点符号w)外,从语料库应用的角度,增加了专有名词(人名nr、地名ns、机

    08

    情感AI产品Hume.AI CEO Alan Cowen最新访谈视频(42分钟)

    一、Alan Cowen个人背景 1.UC Berkeley的心理学博士,在研究人类情感方面发表了40多篇论文。 2.在Google建立了情感计算团队。 情感计算是应用机器学习来理解情感行为。 由于没有足够大的数据,从上世纪60年代到2017年,心理学界普遍认为只有6种基本情绪。 2017年,Cowen首次将“数据驱动”引入情绪研究,提出“语义空间理论”,将情绪的维度扩展到27个,这是一种对情绪更深刻的认识。 3.情感计算的重点是获得“控制数据”(接受实验控制下产生的数据,比如呈现给被试特定的视频片段。与之相对的是自然数据,如互联网上直接收集到的数据)。 4.互联网上的数据是没有“情感标签”的,如果请专门的人士进行数据标注,会受到评注者种族、民族、性别、背景等影响,使标签失准。 比如,美国的标注者倾向于把大多数话语评价为积极的,哪怕这个话语实际上带有讽刺语气。 5.Google作为大型科技公司想要得到“控制数据”很难,因为公司有处理数据的规范,想要破例要面临法律审查、管理费用等困难。 Cowen为了获得“控制数据”在2016年离开了Google,创立了Hume AI。 有更大的自由,获得了海量的“控制数据”,并在这上面训练模型。 二、Hume的功能与目标

    01
    领券