腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
列车
数据
上
运行
模型
后
,
如何
对
测试数据
应用逻辑
回归
、
我一直
在
尝试学习机器学习,但不知道
如何
将算法应用于
测试数据
。在这个例子中,我一直
在
尝试将用于训练
数据
的逻辑
回归
模型
应用于一组新的
测试数据
。这两个
数据
集位于两个不同的csv文件中: titanic_train.csv和titanic_test.csv。我可以将该
模型
应用于训练
数据
,但不能将其应用于
测试数据
。我使用Anaconda的Jupiter笔记本和python 3
运行</
浏览 22
提问于2019-05-07
得票数 1
2
回答
不平衡分类:过采样与缩放特征的顺序?
、
、
当使用不平衡的
数据
集(例如,欺诈检测)执行分类(例如,逻辑
回归
)时,是最好在过度采样少数类之前
对
特征进行缩放/zscore/标准化,还是
在
缩放特征之前平衡类?其次,这些步骤的顺序是否会影响最终
如何
解释特性(当使用所有
数据
scaled+balanced来训练最终
模型
时)?下面是一个例子: 使用所有培训(不平衡)
数据
计算平均值/std
浏览 0
提问于2018-01-21
得票数 7
1
回答
RANSAC
回归
模型
的检验
、
、
、
我将建立一个
模型
(例如多元线性
回归
)来预测我所在城市的公寓成本。首先,我必须在训练
数据
中找出异常值。对于这个任务,RANSAC
回归
算法看起来很有吸引力,因为它不仅允许检测异常值,而且还允许构建
模型
本身。有一件事让我感到困惑,那就是
如何
测试受过训练的
模型
。检验
模型
是否具有良好预测能力的标准方法是
对
列车
数据
和
测试数据
进行分割,并在
测试数据
上
应用经过训
浏览 0
提问于2023-03-11
得票数 0
1
回答
如何
收集
测试数据
?
、
我现在正在学习线性
回归
。我使用R
在
一组火车
模型
上
建立线性
模型
,并尝试根据
测试数据
预测()
数据
。PS:我是用自学的方法学习
数据
科学的,所以我的知识缺乏结构。我可能在一个地方知道一些事情,而在另一个地
浏览 0
提问于2015-06-28
得票数 0
1
回答
如何
评估均方误差(MSE)是否合理?
、
、
、
我正在使用scikit学习创建
回归
模型
。现在我想知道
如何
评估均方误差是合理的还是坏的?这不是编程问题,但我想知道
如何
评估价值。我不确定我的方式是否正确。
浏览 0
提问于2018-05-06
得票数 2
回答已采纳
1
回答
我应该上采样和下采样
数据
,还是只
上
采样不平衡的类
、
、
我有一个高度不平衡的二进制(是/否)分类
数据
集。
数据
集当前有appx 0.008% 'yes‘。我遇到了两种方法来处理这种不平衡。在对变量
运行
MinMaxScaler之后,执行以下步骤oversample = SMOTE(sampling_strategyundersample)]x_scaled_s, y_s = pi
浏览 3
提问于2020-05-14
得票数 0
3
回答
机器学习:基于
测试数据
的训练
模型
我想知道一个
模型
是否也是从
测试数据
中训练自己,同时
对
它进行多次评估,从而导致了一个过度拟合的场景。通常,我们将训练
数据
分成train-test分割,我注意到有些人将它分成3组
数据
-- train、test和eval。eval是
对
模型
的最终评价。我可能错了,但我的观点是,如果上面提到的场景不是真的,那么就不需要eval
数据
集。 需要澄清一下。
浏览 5
提问于2018-01-03
得票数 1
回答已采纳
2
回答
在
Keras中,x_train和x_test有什么区别?
、
、
在
本教程(以及Keras的官方文档中)中,MNIST
数据
集的加载方式如下:然而,没有解释为什么我们有两个元组的
数据
。
浏览 0
提问于2017-09-29
得票数 13
回答已采纳
2
回答
测试数据
中没有目标响应变量
、
我有两个
数据
集,它们是训练和测试集。训练
数据
有一个目标变量,但是测试集没有。我应该做些什么来解决测试集的问题?
浏览 0
提问于2021-08-10
得票数 0
3
回答
测试数据
的MAE是否总是高于训练
数据
的MAE?
、
、
在
卡格尔课程页
上
,下面的图表显示
测试数据
的MAE总是高于训练
数据
的MAE。为什么是这种情况?它是否仅限于DecisionTreeRegressor
模型
?或者图是错的,
在
实际测试中,MAE可以低于训练的MAE吗? 📷
浏览 0
提问于2019-12-26
得票数 1
回答已采纳
1
回答
当测试和训练
数据
集来自不同的来源时,为什么测试精度保持不变,并且
在
二进制分类中没有增加?
、
、
、
、
我有两个不同来源的训练
数据
集和
测试数据
集。我的意思是,它们来自两个不同的实验,但它们的结果是相同的生物图像。我想做二进制分类使用深CNN和我有以下的测试精度和训练精度的结果。蓝线显示
列车
精度,红线
在
近250个历次
后
显示测试精度。为什么测试的准确性几乎是恒定的,而不是提高?这是因为、Test、和
列车
数据
集来自不同的发行版吗? 编辑:
在
我添加了辍学层,
回归
项和平均减法之后,我仍然得到了一些奇怪的结果,从一开始就说
模型
浏览 0
提问于2017-01-29
得票数 3
2
回答
在
预测时间序列时,
如何
将
测试数据
纳入训练
后
的
模型
中?
、
、
在
构建分类或
回归
模型
时,通常将
数据
拆分为火车
数据
集和
测试数据
集。
测试数据
是整个
数据
的随机选择子集。 一旦完成了培训,就会丢弃
测试数据
,并将构建的
模型
应用于新的未知
数据
。但是
在
时间序列的情况下,这是行不通的:您不能只是随机地为
测试数据
集选择
数据
的任何子集,因为
数据
是有序的。
测试数据
集必须由
数据
的
浏览 0
提问于2017-12-12
得票数 4
1
回答
规范培训和
测试数据
分离前后的时间序列
数据
?
我
在
时间序列
数据
上
使用了一个分类
模型
,
在
将
数据
分解为训练和测试之前,我对
数据
进行规范化。现在,我知道训练
数据
和
测试数据
应该分开处理,以防止
数据
泄漏。在这里,规范化步骤的正确顺序是什么?我是否应该分别应用步骤1、2、3来训练和测试使用滑动窗口分割
数据
后
的
数据
?我在这里使用一个滑动窗口来比较每一个小时(测试)和它之前的24小时
数据
(火车)。这是我目前
浏览 0
提问于2020-07-04
得票数 1
回答已采纳
1
回答
模型
:
在
培训和部署期间
、
众所周知,
在
模型
训练期间,我们坚持测试集。然而,我实际
上
在
部署过程中发现,如果在整个
数据
集(train+test)
上
使用新的
模型
序列,实际
上
在
预测真正的“未见”
数据
方面也会产生相当好的结果。我正在寻找
对
这种方法的评论。有什么问题吗? 特别是,在这种方法中,我将对整个
数据
集应用任何类型的转换,例如标准化/规范化/分类编码。
对
部署来说不是更好吗?(
浏览 0
提问于2022-04-06
得票数 0
回答已采纳
1
回答
多项式
回归
图不正确显示
、
我使用sklearn
运行
了这段多项式
回归
代码,但我的图解与我所期望的不一样。正如你所看到的,,我没有得到一条平滑的线,但是它是从一个点跳到另一个点。
浏览 1
提问于2020-04-14
得票数 1
回答已采纳
1
回答
如何
才能使岭
回归
包含整个
数据
集?
、
、
我正在尝试
对
一组
数据
进行岭
回归
。我的完整
数据
集voters有49978个观察值,我的训练
数据
有39983个观察值。我使用训练
数据
构建了岭
回归
模型
,并在
测试数据
上
对
其进行了测试,现在正在尝试将该
模型
应用于整个选民
数据
集。问题是,当我
对
整个
数据
集
运行
预测时,它只返回39983个元素(即,仅与
测试数据</em
浏览 0
提问于2020-12-11
得票数 0
1
回答
显示
测试数据
的
模型
摘要(R闪亮应用程序)
、
我
对
R是个新手。我创建了一个简单的线性
回归
模型
,并使用现在,我已经创建了一个闪亮的R应用程序,用户可以上传一个文件(
测试数据
),我希望我保存的
模型
加载并
运行
测试数据
。然后,我想展示
模型
的总结。$modelSummary <- renderPrint({ model <- load(file = "Sim
浏览 1
提问于2018-10-13
得票数 0
回答已采纳
2
回答
通过预测()或通过fit()验证?
、
、
、
、
有几种可能性可以用来评估一个
模型
: (...)
浏览 0
提问于2019-10-17
得票数 0
2
回答
Python中的一种热编码
、
、
我
对
一个热门编码有疑问:导入
测试数据
集
后
,如果我
对
其进行热编码,编码将与训练
数据
集的编码相同还是不同。如果是这样,我
如何
解决这个问题?
浏览 3
提问于2018-07-10
得票数 1
2
回答
机器学习中的预测函数是否理解分类
数据
?
、
、
、
、
据我所知,
在
进行特征工程之前,必须将
数据
集分成训练
数据
和
测试数据
,以避免分析中的偏差。我还了解到,机器学习
模型
除了数字
数据
之外不理解
数据
,因此需要编码,这是特征工程的一部分。我的问题是,我是单独编码
测试数据
,还是预测函数理解分类
数据
。
浏览 0
提问于2019-11-06
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
R语言如何和何时使用glmnet岭回归
KNN算法原理及代码实现
TensorFlow 2keras开发深度学习模型实例:多层感知器(MLP),卷积神经网络(CNN)和递归神经网络(RNN)
教你在Python中用Scikit生成测试数据集
九道门丨如何使用随机森林进行时间序列预测?
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券