腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
润风拂过存甘霖
专栏成员
举报
34
文章
98883
阅读量
13
订阅数
订阅专栏
申请加入专栏
全部文章(34)
python(13)
网络安全(9)
https(9)
编程算法(6)
深度学习(4)
NLP 服务(3)
机器学习(3)
github(3)
知识图谱(3)
tensorflow(2)
html(2)
人工智能(2)
开源(2)
正则表达式(2)
pytorch(2)
pandas(2)
javascript(1)
regex(1)
css(1)
api(1)
apache(1)
神经网络(1)
文字识别(1)
http(1)
机器人(1)
数据分析(1)
腾讯云开发者社区(1)
jupyter notebook(1)
unicode(1)
checksum(1)
components(1)
cut(1)
dataframe(1)
document(1)
driver(1)
email(1)
excel(1)
gpu(1)
jieba(1)
max(1)
min(1)
nlp(1)
nvidia(1)
python3(1)
scipy(1)
sort(1)
split(1)
text(1)
token(1)
uri(1)
url(1)
word2vec(1)
表格(1)
计算机(1)
漏洞(1)
搜索文章
搜索
搜索
关闭
如何搜索同时引用了两篇特定文章的论文?
腾讯云开发者社区
在科研中,有时看到两个研究类似问题的工作,会希望看看是否有后续工作对二者进行了比较和评价。比如,我听说XLNet和RoBERTa是两个很牛的预训练模型,但不知道他们孰强孰弱。那我们就想找找同时引用了它们的论文,看看别人是怎么评价比较他们的?然而,Google Scholar这类的流行的搜索引擎并不直接提供找到同时引用了两篇特定文章A,B的论文,这样的搜索功能,那么我们怎么实现这一点呢?
blmoistawinde
2021-12-06
907
0
使用huggingface全家桶(transformers, datasets)实现一条龙BERT训练(trainer)和预测(pipeline)
css
huggingface的transformers在我写下本文时已有39.5k star,可能是目前最流行的深度学习库了,而这家机构又提供了datasets这个库,帮助快速获取和处理数据。这一套全家桶使得整个使用BERT类模型机器学习流程变得前所未有的简单。
blmoistawinde
2021-01-21
5.3K
0
conceptnet-numberbatch: 结合常识知识的词向量 - 概述及使用
nlp
text
uri
word2vec
在NLP领域,常识知识的使用越发成为热点,因为其有希望帮助克服现有模型的局限:它们仅从训练数据中学到的有偏的、浅薄的知识,而并不擅长像人一样进行真正的推理。
blmoistawinde
2020-12-01
1.3K
0
交大ADAPT实验室 | 常识知识论文列表
编程算法
NLP 服务
apache
近年来,常识知识(commonsense knowledge)越发成为NLP领域,乃至多模态,跨学科的研究热点。尽管以BERT为代表的的预训练语言模型已经在实体识别、机器翻译、情感分析等任务上取得了亮眼的表现,它们在面对一些人类可以使用常识轻易解决的问题时仍然表现不佳,面对对抗样本时也极为脆弱。似乎这些模型知识只是学到了一些浅层线索和语义,而与人类的知识体系并不相同。因此,将常识知识融入机器学习中就成为了一个充满前景的解决方案。不过,如何抽取常识知识,如何利用常识知识,乃至如何定义“常识本身”依然是有待研究的难题。 交大ADAPT实验室近年来正将研究兴趣专注于这一领域。在此过程中,我们也将自己的阅读加以筛选、归类和统计,整合成了一份论文列表,在GitHub上开源。
blmoistawinde
2020-11-24
652
0
tensorflow/pytorch临时指定CUDA版本,解决版本适配问题
tensorflow
pytorch
深度学习
经典的深度学习引擎,如tensorflow和pytorch,其自身版本与CUDA版本有着严格的对应关系,一点点的不符都会使得程序无法运行。
blmoistawinde
2020-06-22
2.5K
0
AI/机器学习常用公式的LaTex代码汇总
python
机器学习
深度学习
人工智能
编程算法
在写AI/机器学习相关的论文或者博客的时候经常需要用到LaTex的公式,然而作为资深“伸手党”的我在网上搜索的时候,居然没有找到相关现成资源@-@
blmoistawinde
2020-05-26
3.2K
0
python文字转图片(二值、RGB)以及numpy数组
机器学习
python
文字识别
unicode
计算机
文字一般使用unicode等编码的形式在计算机中表示,但是其形态本身也很有价值。如果能够把文字转为图片,就可以做一些应用,比如:
blmoistawinde
2020-05-09
5K
0
困惑度(perplexity)的基本概念及比较多种模型下的计算(N-gram, 主题模型/LDA, 神经网络/RNN)
NLP 服务
https
网络安全
机器学习
深度学习
发现网络上流传的关于困惑度(perplexity)大多数都是利用了N-gram或者主题模型的例子来阐述的。但是现在这个年代来学习这个指标的人多半都是想研究神经网络的,而两者的对困惑度的计算方法又很不同,这就不能不让人对“困惑度”感到“困惑”了。本人虽然才疏学浅,还是斗胆在这里尝试写一篇文章,试图用简洁的方式来梳理清楚其中的困惑。
blmoistawinde
2020-03-20
10.6K
0
用HarvestText自动识别实体及人物别名,用于实体链接分析
数据分析
编程算法
html
处理1需要文本清洗,处理2需要挖掘出人物别名,HarvestText提供了能够方便处理这些问题的接口:
blmoistawinde
2020-02-14
1.7K
0
Python正则表达式清洗微博文本特殊符号(网址, @, 表情符等)
html
email
url
在做文本分类的实验时,找到一个微博的情感分析语料,但是其中保留了很多微博中的特殊符号,对于算法的训练来说不太有利。
blmoistawinde
2019-12-24
4.8K
1
infoROM is corrupted at gpu解决方法
checksum
driver
gpu
nvidia
sort
使用nvidia-smi指令查看显卡信息,发现在最后出现了infoROM is corrupted at gpu这样的警告。
blmoistawinde
2019-12-19
4.8K
0
VS Code jupyter报错Error starting original kernel
开源
jupyter notebook
https
网络安全
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
blmoistawinde
2019-11-26
1.4K
0
sklearn: TfidfVectorizer 中文处理及一些使用参数
document
jieba
max
min
token
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
blmoistawinde
2019-10-30
3.3K
0
NeuralCoref: python的共指消解工具,向代词指代的问题进军!
https
网络安全
python
github
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
blmoistawinde
2019-10-30
2.2K
0
NeuralCoref: 用指代消解来做一个“能多轮对话的问答对话机器人”
机器人
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
blmoistawinde
2019-10-30
1.6K
0
更少标注的机器学习方法——主动学习(python示例)
https
网络安全
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
blmoistawinde
2019-10-30
1.2K
0
jupyter notebook黑科技——制作PPT式的演示文稿
https
开源
网络安全
python
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
blmoistawinde
2019-10-30
2.3K
0
深度学习哪家强?用数据来一较高下吧
pytorch
tensorflow
深度学习
神经网络
人工智能
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
blmoistawinde
2019-10-30
563
0
基于知识图谱的文本自动注释(python+html)
api
http
https
知识图谱
网络安全
在探索知识图谱的过程中,发现它可以做一个有趣的应用——文本自动注释。在此整理并分享给大家。为了具体说明它的效果,让我们先来看一个例子:
blmoistawinde
2019-10-30
938
0
pyDatalog: python的逻辑编程引擎【五:与“知识图谱”的交互】
知识图谱
这一回,我们的目标是用pyDatalog与“知识图谱”交互。知识图谱是个很复杂的概念,但一般其中的知识都是以RDF三元组的形式存储的,所以我在这里实际上演示的是pyDatalog与RDF类三元组的交互。官网上没有提供这类问题的“标准解法”,下面的例子是我的一些思考,我也从中发现了用Datalog管理和维护知识图谱的一些特有优势:
blmoistawinde
2019-10-30
1.4K
0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档