腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
fasttext
:
有没有
一种
方法
可以
导出
ngram
?
、
、
、
、
我是DL和NLP的新手,最近开始通过gensim使用预先训练好的
fastText
嵌入模型(cc.en.300.bin)。我找不到
一种
方法
来
导出
作为模型一部分的n-gram向量。我知道它们是散列的,但也许有
一种
方法
(不一定使用gensim)来获取它们? 任何有见地的都将不胜感激!
浏览 16
提问于2019-03-12
得票数 0
3
回答
使用tf-以色列国防军和
FastText
载体
、
、
我对在
FastText
库中使用tf很感兴趣,但是找到了
一种
处理
ngram
的逻辑
方法
。对于一般的word2vec aproach,我将对每个单词有一个向量,我
可以
计数该向量的术语频率,并相应地除以它的值。但是对于
fastText
来说,同一个词会有几个n克,我很高兴.] model['lis']model
浏览 3
提问于2019-09-23
得票数 7
6
回答
如何用Gensim加载
FastText
预培训模型?
、
我试着从这里加载
fastText
预培训模型,快速文本模型。
浏览 0
提问于2017-06-30
得票数 35
回答已采纳
1
回答
将快速文本模型转换为tensorflow集线器时出错
、
def _compute_ngrams(word, min_n=1, max_n=3): for w in word[b]: extended_word = BOW + "".join( chr+ 1):
ngram
.
浏览 0
提问于2019-01-16
得票数 1
回答已采纳
1
回答
设置
fastText
的最大碳数n克长度
、
、
、
、
在此基础上,将
fastText
模型的最大长度n-g设置为零,从而使
fastText
模型的语义精度提高,使得
fastText
的行为几乎与word2vec相似。它忽略了纳克。但是,在加载
fastText
模型时,我无法找到如何设置此参数的任何形式。对怎么做有什么想法吗?
浏览 0
提问于2017-08-08
得票数 0
回答已采纳
1
回答
pip一个接一个地从需求中安装2个包
、
、
我想使用pip安装
fasttext
。但是
fasttext
需要Cython。错误
可以
在这里看到:Traceback (most recent call last): File "/tmp/pip-install-3if14395/
浏览 6
提问于2018-08-17
得票数 1
回答已采纳
1
回答
创世纪most_similar只找到同义词(不是反义词)
、
、
、
、
有没有
一种
方法
让model.wv.most_similar在gensim中只返回正义词(即表示同义词,而不是反义词)?例如,如果我这样做:from gensim.models.
fasttext
import load_facebook_modelimport
fasttext
.util from gensim.m
浏览 1
提问于2021-07-19
得票数 2
回答已采纳
2
回答
在python中根据电子邮件主题和正文进行多分类
、
、
、
请建议我需要遵循的分类
方法
。我需要使用哪些ML模型来训练数据和测试数据。分类更像gmail收件箱分类:主要分类、社交分类和促销分类。
浏览 1
提问于2018-02-22
得票数 0
1
回答
为什么Gensim拒绝加载由
Fasttext
(Facebook)库构建的监督模型dict?
、
Traceback (most recent call last): model=
FastText
.load_
fasttext
_format('model_ups_tickets_rca.bin') File "/usr/local/lib/python3.5/dist-packages/gen
浏览 6
提问于2020-08-24
得票数 1
1
回答
如何将gensim创建的快速文本模型
导出
到二进制文件中?
、
、
、
我试图将gensim创建的快速文本模型
导出
到二进制文件中。但是医生们还不清楚如何做到这一点。之后,当我想使用以下
方法
加载模型时:我进入了一个无限循环。在加载由
fasttext
.model函数创建的model.save('
fasttext
.model)时,将在大约30秒内完成。
浏览 2
提问于2019-11-15
得票数 4
回答已采纳
1
回答
Gensim
Fasttext
预培训模型是如何获得词汇外单词的向量的?
、
、
、
下面是我编写的加载预培训模型的代码:model=ft.load_
fasttext
_format("wiki.en.bin0.23980476,现在我的困惑是,Fastext也为一个单词的字符
ngram
因此,对于一个单词“内部”,它将为它的所有字符符号创建向量,包括完整的单词,然后这个单词的最后一个单词向
浏览 2
提问于2018-06-13
得票数 13
1
回答
在Python中高效地按ID计数
ngram
、
我当前的解决方案包括使用文本遍历数据帧中的列,使用re.findall计算
ngram
在每一行中出现的次数,将findall
方法
的长度放在一个列表中,然后使用该列表在数据帧中创建新列。在一个页面中,最终结果是包含原始列加上10,000列(每个
ngram
一个)的数据帧,大约需要5个小时。因为我有65页要读完,我估计要花325个小时才能读完所有的内容。我遍历了10,000个
ngram<
浏览 0
提问于2020-05-20
得票数 0
1
回答
在存储库中不保留
fastText
矢量文件的情况下创建word嵌入
、
、
我正在尝试在Infersent的帮助下嵌入一个句子,而Infersent使用
fastText
向量来嵌入单词。
fastText
向量文件接近5 GiB。当我们将
fastText
向量文件与代码存储库一起保存时,它会使存储库变得巨大,并使代码难以共享/部署(甚至创建docker容器)。
有没有
什么
方法
可以
避免将向量文件与存储库一起保留,而是重复使用它来嵌入新句子?
浏览 13
提问于2019-03-06
得票数 1
回答已采纳
1
回答
无需下载即可从Google云存储加载模型
、
有没有
一种
方法
可以
在不下载模型副本的情况下从Google云存储中提供模型?比如直接流式传输数据? 我正在尝试加载一个托管在Google云存储上的
fasttext
模型。bucket.blob(language_model_filename)language_model =
FastText
.load_model
浏览 16
提问于2019-03-15
得票数 0
1
回答
Gensim快速文本获取单词或单词索引
、
、
、
、
尝试使用gensim's
fasttext
,测试来自gensim的示例代码,并将论证替换为corpus_iterable https://radimrehurek.com/gensim/models/
fasttext
.html gensim_version == 4.0.1 from gensim.models import
FastText
model.train(corpus_iterable
浏览 44
提问于2021-09-02
得票数 0
回答已采纳
1
回答
对未标记的字段使用同义词标记筛选器
、
、
、
假设我想使用edge-
ngram
技术进行自动补全(补全提示器对我来说不是一个好的选择)。我试着这样做: "analysis": { "
ngram
_prefix": { "min_gram": 1, "m
浏览 0
提问于2014-12-19
得票数 0
1
回答
Gensim
FastText
计算训练损失
、
、
、
、
我正在使用训练一个
fastText
模型。但是,我似乎找不到
一种
方法
来计算迭代的损失以用于日志记录。如果我看一下,它有get_latest_training_loss
方法
,允许您打印训练损失。
有没有
其他选择,或者根本不可能?
浏览 0
提问于2018-06-01
得票数 8
1
回答
用更快的东西替换Python3.x循环
、
、
、
、
python3.x做了一个功能: vector = [] for
ngram
in var: vector.append(docs.count(
ngram
))'name', 'are', 'is'] doc = '
浏览 0
提问于2018-12-05
得票数 0
1
回答
pandas
导出
不带字符串截断的字符串序列
、
、
我有一个简单的代码,
可以
合并两个字符串序列并将结果写入一个文件 return row['labels'] + ' ' + row['text'] with open("
fasttext
_
浏览 3
提问于2017-05-13
得票数 1
2
回答
使用tfidf作为功能
、
、
、
、
一种
方法
是使用tfidf提取每个文档的重要单词,然后生成如下所示的csv文件: document,
ngram
1,
ngram
2,
ngram
3, ..., label 1, 0.0, 0.0, 0.0另
一种
方法
是合并每个组中的所有文档并提取
ngram
。在此之后,我
可以
计算每个
ngram
在每个文档中的出现次数,但我不确定这是最好的
方法
。请提供您建议的解决方案。
浏览 30
提问于2021-02-08
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
pdf合并,有没有可以在线合并pdf的方法
word embedding系列(三)FastText
cad如何导入导出高清的图片格式呢?这个方法可以帮助你
隐形马尔科夫到textcnn的转变
FastText的内部机制
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券