腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
0
回答
自制
的
嵌入
是否
适用于
RNN
,
或者
它们
是否
必须
经过训练
?
、
、
、
假设我正在训练一个
RNN
用于分类,使用100个单词
的
词汇表。我可以跳过
嵌入
,将句子作为one-hot向量传递,但是对于100个特征
的
空间使用one-hot向量似乎非常浪费内存。而且随着词汇
的
增长,情况只会变得更糟。有没有什么原因我不能创建自己
的
嵌入
,其中0-100
的
每个值都被转换为二进制并存储为长度为7
的
数组,即0=[0,0,0,0,0,0,0],1=[1,0,0,0,0,0,0],...,100=[1,1,0,0,1,0,0我意识到
浏览 1
提问于2018-07-17
得票数 1
1
回答
动态
RNN
中初始状态
的
设置
、
根据链接: 我目前正在调试我
的
RNN
模型,因为它似乎将不同
的
问题分类在同一个类别中,这是很奇怪
的
。我怀疑这可能与我没有设置细胞
的
初始状态有关。
浏览 3
提问于2019-05-15
得票数 1
回答已采纳
1
回答
RNN
传感器训练中
的
标签对齐
、
、
我试图了解
RNN
传感器是如何与地面真相标签训练
的
。在反恐委员会
的
情况下,我知道该模型是
经过训练
的
损失函数,它总结了所有可能
的
地面真理标签
的
所有分数。但在
RNN
-T中,预测网络
必须
从最后一步接收输入,以产生类似于“教师强制”方法
的
输出。但我在这里
的
疑问是,地面真实标签
是否
应该被转换成所有可能
的
空标签对齐,并通过教师强制“方法”将每条直线传送到网络上?
浏览 1
提问于2019-07-03
得票数 3
1
回答
一个只有10000个单词
的
字典真正需要什么
嵌入
层output_dim?
、
、
、
我正在训练一个
RNN
,它
的
一组词特征非常小,大约10,000。在添加
RNN
之前,我计划先从
嵌入
层开始,但我不清楚真正需要什么维度。我知道我可以尝试不同
的
值(32,64,等等),但我宁愿先有一些直觉。例如,如果我使用32维
嵌入
向量,那么每个维只需要3个不同
的
值来完全描述空间(32**3>>10000)。
或者
,对于一个有少量单词
的
空间,
是否
真的需要使用
嵌入
层,还是从输入层直接转到
R
浏览 0
提问于2018-07-13
得票数 7
1
回答
<PAD>、<EOS>和<GO>标记
的
不同用法
、
、
我发现<PAD>、<EOS>和<GO>标记有许多不同
的
用法。就我个人而言,我将这三个标记分开,并为
它们
分配不同
的
嵌入
,具体地将全零
嵌入
向量分配给<PAD>标记(使用基于
RNN
的
seq2seq模型)。我想知道
是否
存在这些令牌
的
最佳使用(就基于
RNN
的
模型或基于transformer
的
模型而言)。
浏览 0
提问于2020-06-19
得票数 1
1
回答
RNN
和LSTM在tensorflow中
的
实现
、
我一直在努力学习如何在tensorflow中对
RNN
和LSTM进行编码。我在网上找到了一个例子 X是要输入
的
数据,y是标签
的
集合。以下是我<e
浏览 1
提问于2016-10-25
得票数 2
回答已采纳
1
回答
在训练神经网络
的
过程中应该改变
嵌入
层吗?
、
我是深度学习和Pytorch领域
的
新手。所以我
的
问题是,在训练网络
的
过程中,
嵌入
应该改变吗?如果我想要将预先训练
的
嵌入
(例如,
经过训练
的
word2vec
嵌入
)加载到PyTorch
嵌入
层中,
是否
应该在训练过程中也更改预先训练
的
嵌入
?
浏览 12
提问于2019-08-01
得票数 3
4
回答
文本处理
的
支持向量机还是人工神经网络?
、
、
哪种方法是正确
的
?
或者
有没有这两个
的
替代方案...比范恩和支持向量机更合适
的
方法吗?
浏览 1
提问于2010-03-13
得票数 14
回答已采纳
2
回答
如何在Tensorflow
RNN
中建立
嵌入
层?
、
、
、
我只是根据单词
的
频率对
它们
进行分类,并给出了
它们
的
索引。tf.random_uniform([vocab_size, hidden_size], -1, 1))这
是否
意味着我们正在构建一个学习
嵌入
的
层如果我在代码中使用这两行代码,就会得到一个错误: TypeError:传递给参数‘int64’
的
值在允许
的
值列表中没有Dat
浏览 0
提问于2018-09-04
得票数 8
1
回答
Tensorflow:在输入输入之前拆分占位符?
我
的
模型通过提要接收一个输入序列,然后
必须
在模型中用分隔符将该序列拆分。然而,由于Tensorflow
的
图表要求我们将占位符放在前面,我不知道如何实现这一点。有没有一种方法可以创建一个可以处理模型中不断变化
的
张量数量和形状
的
模型?
浏览 2
提问于2016-03-08
得票数 1
2
回答
理解变压器
的
自重计算
、
utm_source=blog&utm_medium=demystifying-bert-groundbreaking-nlp-framework#comment-160771变压器模型自重计算中
的
键值查询向量是被查询
的
单词
的
嵌入
向量,对吗? 在
RNN
中计算注意力
是否
与变压器中
的
自我注意不同?
浏览 0
提问于2020-11-09
得票数 0
1
回答
基于图像标签生成有意义
的
图像描述
、
、
、
、
目前,我和我
的
三个朋友正在进行一个项目,基于特定图像中
的
对象生成图像描述(当向系统提供图像时,
必须
基于对象和
它们
之间
的
关系生成新颖
的
描述)。因此,简单地说,一个人正在计划识别图像中
的
对象,并使用基于快速区域
的
CNN (FRCNN)对
它们
进行标记。在我
的
部分中,我
必须
根据这些图像标签( FRCNN
的
输出正计划作为我
的
RNN
的
输入)
浏览 11
提问于2017-07-05
得票数 0
1
回答
将脚本列表作为cron作业运行
的
标准解决方案(也许是fluentd?)
、
、
、
、
我需要定期运行几个脚本,并以普罗米修斯指标的格式重新发送
它们
的
输出。目前,我在Flask上使用了
自制
的
解决方案和一个后台cron作业,将输出转储到文件中,解析
它们
并转换为.prom格式,然后通过NodeExporter公开。简明。这似乎是夸大其词,而且是
自制
的
,毫无意义。我想知道
是否
有一个标准
的
解决方案,它可以运行脚本,解析他们
的
输出,并以/metrics或以普罗米修斯或Fluentd格式重发? Fluen
浏览 2
提问于2018-08-08
得票数 0
1
回答
具有不同
嵌入
尺寸
的
经过训练
模型上
的
resize_token_embeddings
、
、
、
、
我想问一下如何改变
经过训练
的
模型
的
嵌入
大小。from transformers import AutoTokenizer
浏览 52
提问于2022-06-27
得票数 2
回答已采纳
1
回答
Tensorflow:我
的
rnn
总是输出相同
的
值,
rnn
的
权重没有
经过训练
。
、
我使用tensorflow实现了一个简单
的
RNN
模型,以了解时间序列数据
的
可能趋势并预测未来值。然而,模型在训练后总是产生相同
的
值。实际上,它得到
的
最好
的
模型是:(也许这些不是很好
的
设置。但无论我如何改变
它们
,结果几乎是一样
的
。因此,我只是设置这些,以帮助显示他们以后。)我发现这是因为BasicRNNCell
的
权
浏览 0
提问于2019-03-15
得票数 3
3
回答
用于Linux兼容性
的
Nvidia视频卡驱动程序
、
、
我想购买一个新
的
显卡,但所有供应商只为Windows提供驱动程序,而Nvidia提供Linux驱动程序,我
的
问题是我
是否
可以使用来自nvidia
的
驱动程序,
或者
它们
是否
必须
来
自制
造商?
浏览 0
提问于2013-07-31
得票数 1
1
回答
用Python脚本预测SSIS包中
的
数据
、
、
、
、
我知道微软在他们
的
SQL服务器机器学习服务中包含了Python,但是这仅
适用于
server 2017及以上版本,这是我
的
服务器目前无法满足
的
要求。在这种情况下,我希望完全在SSIS中部署具有
经过训练
的
生成预测模型管道,即:
是否
有一种方法完全在SSIS中完成,<e
浏览 1
提问于2019-02-18
得票数 3
回答已采纳
1
回答
如何将Windows3.5
的
安装添加到Windows2008Server R2
的
安装程序中
、
、
、
、
我有一个
自制
的
引导程序(称为SetUp.exe),它检查目标计算机上
是否
安装了.NET 3.5,如果没有,则通过运行dotnetfx35.exe来启动安装。很好。这
适用于
我需要
的
所有情况,除了Windows2008Server R2。在此操作系统上,.NET installer不安装/启用.NET 3.5。相反,它会弹出一个对话框,指示用户
必须
手动启用它。我更喜欢从我
的
引导程序exe中
或者
从我
的
基于WiX
的
浏览 0
提问于2010-10-07
得票数 0
1
回答
密集层对不同识别任务
的
一般有用性
、
、
、
、
我想问,在任何形式
的
识别任务中使用
嵌入
和相似性度量实用吗?如果我有一个
经过训练
的
神经网络来查找照片中
的
不同对象,提取完全连接
的
层/密集层并对
它们
进行聚类
是否
有用?我最近发现有一个来自tensorflow
的
嵌入
式投影仪工具,非常酷和有用。我知道在单词
嵌入
以及相似单词如何聚在一起方面已经有了一些工作。对于面孔也是如此。话虽如此,我还是想用同样
的
方法来分析地质遗迹;我可以训练一
浏览 8
提问于2020-03-14
得票数 0
1
回答
我
必须
扩展什么才能让自定义网格具有良好
的
性能?
、
、
我需要一个具有不同高度
的
行
的
GridView。仅
适用于
行,不
适用于
行中
的
项。在一行中,项目具有相同
的
高度。因此,似乎我
必须
创建一个自定义视图。它
必须
具有非常好
的
性能和较低
的
内存使用量。
是
浏览 0
提问于2012-06-29
得票数 0
回答已采纳
点击加载更多
相关
资讯
使用实体嵌入的结构化数据进行深度学习
利用NAS寻找最佳GAN:AutoGAN架构搜索方案专为GAN打造
循环神经网络RNN 怎么用?给初学者的小教程
如何入门PyTorch自然语言处理?
MongoDB数据建模-第二章:使用MongoDB进行数据建模(三):设计文档
热门
标签
更多标签
云服务器
ICP备案
实时音视频
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券