腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
击打与
标准
化
、
、
、
我把它分为数据和标签,然后
标准
化数据。然后使用train_test_split对训练数据和
测试数据
进行分割,并输出结果。为了做到这一点,我保留了和以前一样的
测试数据
,并且我只将新的合成样本添加到训练数据中。我该如何处理
标准
化工作?简单地假设,既然我使用了已经
标准
化的数据中的点,那么新的合成样本也会
标准
化吗?(不接触
测试数据
) 从预先
标准
化的数据中创建合成样本,
标准
化合成样本并将它们添加到列车数据中?(不接触
测试数据
浏览 0
提问于2016-07-22
得票数 1
回答已采纳
1
回答
StandardScaler变换后ML模型在
测试数据
上的性能
、
、
、
我认为,当我们对
测试数据
进行sklearn预处理转换时,均值不会是0,std也不会是1(原因是我们使用训练数据平均值/std来
标准
化
测试数据
)。我的问题是:如果
测试数据
是这样
标准
化的(不正确地
标准
化为高斯正态分布,平均为0和std 1),那么这会对ML算法的预测产生影响吗?我的理解是,ML预测的准确性很低,因为我们给ML模型提供了一个不正确的
标准
化数据。
浏览 3
提问于2020-02-20
得票数 1
回答已采纳
1
回答
在训练数据上使用MinMaxScaler生成用于
测试数据
的std、min和max
、
、
我将如何使用scikit学习MinMaxScaler来
标准
化熊猫数据框架训练数据集中的每一列,但在我的
测试数据
集上使用完全相同的
标准
差,最小/最大公式?由于我的
测试数据
是未知的模型,我不想
标准
化整个数据集,它将不会是一个准确的模型,对未来的未知数据。相反,我希望使用训练集将0&1之间的数据
标准
化,并对
测试数据
的公式使用相同的std、min和max数字。
浏览 2
提问于2018-01-29
得票数 1
回答已采纳
3
回答
如何评估数据挖掘模型?
、
、
我用什么
标准
来比较? 假设模型选择的
标准
是ASE。训练数据ASE高,
测试数据
ASE低,训练数据ASE低,
测试数据
ASE高。如果您选择一个模型,您会选择哪些模型?
浏览 0
提问于2018-06-02
得票数 1
回答已采纳
1
回答
如何在数据集上使用
标准
的标度模型,其特征比最初训练的原始数据集要少
、
、
、
我使用的是sklearn.preprocessing的
标准
标量模型。我在包含27个特征的数据集上拟合了
标准
标度模型。是否可以在
测试数据
集上使用相同的
标准
标量模型,其中代码片段中的特性少于27个sc=StandardScaler()到目前为止,当我试图转换我的
测试数据
集时,这是起作用的fine.Problem。
测试数据
集中有24个特性
浏览 4
提问于2020-10-07
得票数 2
回答已采纳
2
回答
特性缩放(
标准
化)、LabelEncode和OneHotEncode数据的最佳实践是什么?
、
、
、
、
这里有训练数据(x_train)、
测试数据
(x_test)和all_data,它们结合了培训和
测试数据
。from sklearn.preprocessing import StandardScaler 对列车数据进行
标准
化,然后应用于
测试数据
scaler.fit(x_train) x_train=scaler.transform(x_train) x_test=sc
浏览 5
提问于2017-01-06
得票数 3
1
回答
如何在sklearn model.predict中用单样本进行预测?
、
我应用
标准
标量来训练和
测试数据
,训练模型。但是,如果我想用训练和
测试数据
之外的数据对模型进行预测,我必须对新数据应用
标准
标量,但如果我有单个数据,那么我不能对我想要作为输入的新的单个样本应用
标准
标量。
浏览 17
提问于2019-06-23
得票数 2
1
回答
当列车/测试是真正的i.i.d.时,信息泄漏。
、
、
、
、
我非常清楚,为了避免信息泄漏,建议对训练数据集上的任何转换(例如
标准
化或基于中值的估算)进行拟合,并将其应用于
测试数据
集。然而。例如,如果原始数据集具有一定的统计特性(例如,均值、中值和std),那么我将期望随机数据溢出,生成具有相同统计特性的训练和
测试数据
集。因此,对整个数据集进行
标准
化,然后再进行分割,可以产生与分割数据集、基于列车数据库的
标准
化和转换
测试数据
集相同的结果。对于基于中值的估算,也可以使用相同的参数。 我是不是遗漏了什么?
浏览 0
提问于2021-02-04
得票数 2
回答已采纳
2
回答
用于单元测试的
测试数据
文件路径
、
、
我目前正在使用VS 2008中的
标准
Microsoft单元测试套件。还安装了ReSharper 4.5。我的单元测试依赖于一个预加载数据文件的TestInitialize方法。根据使用
标准
Ctrl+Ctrl命令和Resharper单元测试执行命令在VS 2008中运行单元测试,该
测试数据
文件的路径将有所不同。我的TestInitialize方法如何知道单元
测试数据
文件的正确路径?
测试数据
是足够大的,所以我不想将它推入字符串中,所以更愿意将它作为外部文件保存。我的测试项目的文件结构是用MVC应用程
浏览 1
提问于2009-11-21
得票数 63
1
回答
使用插入符号对训练和
测试数据
进行预处理
、
我还有一个
测试数据
集,我想用训练集中相同的均值和
标准
差进行缩放。通过这种方式,我将
测试数据
视为全新的/看不见的数据,这些数据是根据我基于训练数据观察到的数据进行缩放的。predict(preprocess_values_train, train) test.st = predict(preprocess_values_train, test) 我认为这会将训练均值和
标准
差应用于
测试数据
集如何编辑此代码以基于训练数据细节缩放
测试数据
?train.st正是我需要的,但test.s
浏览 40
提问于2020-06-24
得票数 1
回答已采纳
1
回答
将Sci-Kit学习分类器的预测结果与原始测试集数据相结合
、
我的问题是,现在我有了"Predict_Probas“结果,我已经将其转换为Pandas数据框架,我想将它与我最初的
测试数据
结合起来,稍后我将在CSV中导出
测试数据
。问题是我采取了以下方法- 现在,如果没有
标准
化和一次热编码,那么我如何才能获得原始的
测试数据
(没有完整的列名)?
浏览 0
提问于2018-03-24
得票数 1
回答已采纳
2
回答
应用Sci-kit学习的kNN算法处理新数据
、
、
当我研究Scikit-learn的kNN算法时,我意识到如果我使用sklearn.model_selection.train_test_split,所提供的数据就会根据作为参数提供的比例自动分成火车数据和
测试数据
集然后,基于列车数据,该算法从最接近
测试数据
点的k近邻点出发,确定
测试数据
点是否属于某一准则。我想知道是否有一种方法可以预测
标准
,而不是
测试数据
集,因为
测试数据
集已经是提供数据集的一部分,而是在整个过程中没有提供的全新数据。 有办法用sci学习吗?
浏览 0
提问于2021-05-01
得票数 1
回答已采纳
1
回答
转换是如何工作的?
、
我看了一下MinMaxScaler的源代码。我知道,当您将预处理类安装到dataset时,它会接收数据并为转换做准备。 比方说,我把MinMaxScaler装到了X_train上,并把它改造了。但是,当我使用另一个数据集(比如X_test )时,转换是如何工作的呢?当您调用transform()时,它是否替换了使用中的数据集?
浏览 0
提问于2021-05-04
得票数 1
1
回答
R中的
标准
化/
标准
化试验数据
、
我理解,人们应该
标准
化和规范化
测试数据
(或任何“未标记的”数据)与培训手段和sd。我如何用R语言实现这一点?是否有一种对训练集的“拟合”和一种对
测试数据
的应用?
浏览 0
提问于2016-09-13
得票数 1
回答已采纳
1
回答
空间列车开发和
测试数据
、
、
、
或者开发数据完全不在训练过程中,所以等同于
测试数据
?按照
标准
对进行了很大的解释,验证数据和
测试数据
是不同的。请有人澄清spaCy在下的情况是什么。非常感谢。
浏览 6
提问于2022-09-21
得票数 1
回答已采纳
2
回答
我可以让CNTK检测过拟合吗?
CNTK只有在达到maxEpochs后才会停止,然后运行测试。有没有办法让它在每个时期之后运行测试,以检查它是否严重过度拟合?
浏览 6
提问于2016-09-20
得票数 0
2
回答
用于单元测试的Spring/Hibernate非JPA存储库
、
、
、
我知道我可以在扩展JpaRepository的
标准
存储库中自动更新,但是使用@Repository注释的
标准
类如何使用@PersistentContext与执行em.createNativeQuery(query, Class).getResultList的EntityManager 例如,我正在运行内存数据库,我可以自动生成一个
标准
的JpaRepository,比如getOne或getAll,它将对我的内存
测试数据
库执行并返回一个结果但是有什么方法可以对我的SQL存储库进行同样的处理,让EntityManger对
浏览 5
提问于2017-11-22
得票数 0
回答已采纳
1
回答
异常检测模型的特征归一化
、
、
、
、
对于使用自动编码器进行异常检测/新颖性检测,我有一个关于特征规范化/
标准
化(Standardisation)的问题。通常,在ML问题中,我们分割火车/测试集。在列车上安装普通/
标准
定标器,并使用它来转换(而不是fit_transform )
测试数据
。但是,在异常检测/新颖性检测中,我们如何使用“正常”数据(而不是“异常”)来训练异常检测器?这里的训练数据不代表
测试数据
,因为它只学习“正常”数据,以便在给定“异常”数据时产生重建误差。在这里,我们是否应该对列车数据进行规范化处
浏览 3
提问于2022-10-31
得票数 -1
1
回答
使用fit_transform()和transform()
、
、
、
、
StandardScaler()X_test = sc.transform(X_test)这是否意味着我们正在使用训练数据的均值和
标准
差来转换
测试数据
?
浏览 11
提问于2022-06-16
得票数 2
回答已采纳
1
回答
标准
化模型的培训数据是否真的是现实的?
、
、
、
、
与不
标准
化或规范化培训和
测试数据
相比,
标准
化或规范化培训和
测试数据
可以显著提高网络的预测性能。到现在为止还好。我不太确定我是不是漏掉了什么东西。但是,对于流
浏览 6
提问于2022-07-01
得票数 -1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何准备软件测试数据
Python Web 测试数据
这是一条测试数据
LeetCode测试数据的爬虫
在线测试数据生成器
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券