社会媒体的蓬勃发展给自然语言处理带来了许多挑战与机遇。在“2019世界人工智能大会”上,复旦大学黄萱菁教授出席达观数据主办的“理解语言,拥抱智能”主题论坛,并围绕“基于深度学习的智能社会媒体挖掘”的主题,分享了其实验室的相关研究成果。
随着媒体形式的转变,社交媒体的发展彻底改变了当今自然语言处理研究者信息获取的数量和形式。利用Twitter,Facebook,YouTube,博客以及论坛获取到的信息有助于研究人口信息、语言运用和社会交互三者之间的关系。
黄萱菁教授首先介绍了社会媒体研究具有很大的商业价值和社会价值。她所带领的实验室所做工作主要围绕三方面展开:社会媒体的结构和用户行为、预测整个媒体动力学,以及信息挖掘后和干预的结合。
黄萱菁教授介绍了在社会化推荐方面的诸多研究工作,从用户行为建模和预测,包括微博标签推荐、艾特用户 ( 公司 ) 推荐、 转发行为预测、用户话题参与预测,以及如何在社会媒体挖掘中融入多模态信息等几个方面,分享了她所领导团队的从早期的主题模型和机器学习方法转变为近期深度学习方法所取得的主要研究进展。
采用的方法主要基于话题翻译模型、层次狄利克雷过程和深度学习等。并且在微博和 Twitter 等社会媒体上进行的多项实验,验证了所提出方法的有效性。
在演讲的尾声,黄萱菁教授讲到,对于社交网络挖掘,要利用内容信息,特别是语言文字的内容,还要关注用户之间的结构。对用户和问题进行细致分析,才有可能提出更好的方法。
A
BOUT
关于嘉宾
黄萱菁:复旦大学教授、博士生导师,研究方向为人工智能、自然语言处理、信息检索和社会媒体分析。兼任中国中文信息学会常务理事,社会媒体专委会副主任。她已经在SIGIR,IEEETKDE,ACL,ICML,IJCAI,AAAI,SCIS,CIKM,ISWC,EMNLP,WSDM和
COLING等多个高水平国际学术期刊和会议上发表了近百篇论文,负责的多个科研项目受到国家自然科学基金、科技部、教育部、上海市科委的支持。
领取专属 10元无门槛券
私享最新 技术干货