暂无搜索历史
摘要:本篇从理论到实践介绍了超好用的无监督关键词提取算法Keybert。首先介绍了调研背景;然后重点介绍了什么是Keybert、KeyBERT提取关键词流程和如...
摘要:本篇主要从理论到实践介绍了当前超火的提示学习Prompt Learning。首先介绍了背景,从NLP四大范式引出预训练+微调和当前大火的提示学习Promp...
摘要:本篇主要总结了一下我在实际项目中对于文本分类任务的优化策略,主要包括预训练模型优化、语义embedding优化、分类层优化、使用知识蒸馏优化、使用标签内容...
摘要:本篇从理论到实践介绍了Transformer中的位置编码。首先介绍了位置编码的作用以及主要实现方式;然后重点介绍了主流的位置编码方式,包括训练式位置编码、...
摘要:本篇主要介绍了多模态学习模型VILT几个实用的源码实践,包括使用VILT预训练模型获取pretrain embedding、微调VILT、VILT模型预估...
摘要:本篇主要介绍了百度在多模态学习领域的成果UNIMO模型。首先是背景介绍,针对当前主流多模态学习模型存在训练语料少和模态缺失导致模型效果下降的问题,百度提出...
摘要:本篇从理论到实践介绍了当前超火的多模态学习模型。首先介绍了背景,将文本模态和图像模态在语义空间上对齐进行联合训练可以得到高质量的多模态embedding;...
摘要:上一篇书中自有黄金屋系列6:读《浪潮之巅》-上篇 主要讲苹果、微软和雅虎的兴衰史。本篇主要讲下“不作恶”的谷歌以及IT行业中那些经典的定律,其中包括摩尔定...
摘要:吴军博士的《浪潮之巅》作为记录全球信息科技产业发展最清晰、最完整也是阅读体验最棒的一本书,能拿到豆瓣9.1分可谓实至名归。信息科技浪潮奔涌了三十年,我们每...
摘要:本篇主要是关于持续学习的一些思考。首先明确为什么要持续学习,因为可怕的熵增定律很多人会选择舒适躺平,而想不断进步成为二八定律中的20%头部人群必然需要逆趋...
摘要:这是广告系列的第一篇。广告的核心是服务广告主,为广告主圈定对应的人群从而达到好的广告转化效果。而在其中起到桥梁作用的就是标签。广告主会根据自身的性质选定一...
摘要:这是书中自有黄金屋系列的第一篇:读《腾讯传》。吴晓波写的这本《腾讯传》很好的讲了腾讯从建立到现在成为互联网双雄之一的整个历程。本篇不仅仅是讲腾讯,更多的是...
摘要:本篇分享了多模态学习在CTR预估模型中的应用实践及效果展示。首先是背景介绍,通过多模态学习可以更好的处理多模态信息,从而得到更丰富的特征信息,可以更好的提...
摘要:本篇从理论到实践介绍了华为CTR开源项目FuxiCTR。首先是背景介绍,然后重点详解开源项目FuxiCTR,包括项目架构、支持的主流CTR算法以及在公共数...
摘要:本篇分享了kaggle比赛《Corporación Favorita Grocery Sales Forecasting》冠军方案。因为业务需要所以调研了...
摘要:本篇从理论上到实践介绍了BERT知识蒸馏发展进程。首先介绍了BERT类模型提升线上性能的方法以及知识蒸馏为什么有效;然后重点介绍了BERT蒸馏的主要发展进...
摘要:本篇主要介绍了广告场景中NLP技术的业务应用和线上方案,主要介绍了三大类任务:第一类任务是文本分类任务,业务主要包括自然兴趣建模体系、搜索场景行业词包和在...
摘要:本篇主要介绍我们构建的oCTS分类器优化训练系统,一个标注人员都可以优化分类器的训练系统。首先介绍了项目背景和目标,oCTS主要针对人工可标注的数据场景又...
摘要:本篇主要总结了小X语音助手安全服务模型的优化实践。首先介绍了小X语音助手安全服务模型背景以及任务类型;然后重点介绍了在优化任务中的实践,包括线上算法服务介...
摘要:本篇从理论到实践分享了当前NLP中对比学习SOTA模型ESimCSE。首先回顾了无监督SimCSE以及存在的两个问题;然后重点详解了ESimCSE,包括E...
暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市