腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(7592)
视频
沙龙
1
回答
使用
fit_transform
()
和
transform
()
、
、
、
、
from sklearn.preprocessing import StandardScaler
X_train
= sc.fit_
transform
(
X_train
)我所知道
的
是
fit()方法计算
特征
的
均值
和
标准差,
然后
transform
()方法
使用
浏览 11
提问于2022-06-16
得票数 2
回答已采纳
2
回答
使用
分类
特征
缩放
数据
帧
,
然后
是
X_train
/
X_test
的
fit_transform
()
和
transform
()
、
我有一个
数据
帧
df: cat1 | cat2 | cat3 | year | quartal | month | y
X_test
= scale
浏览 26
提问于2020-12-02
得票数 0
回答已采纳
3
回答
如何用scikit学习评估基于文本
的
模型?
、
、
我有以下带有
数据
的
数据
:1079 COMPUTER long text.... 3from sklearn.model_selection import train_tes
浏览 0
提问于2018-11-25
得票数 1
回答已采纳
1
回答
Sklearn.pipeline产生不正确
的
结果
、
、
、
、
我正在尝试构建一个带有StandardScaler()
和
LogisticRegression()
的
管道。当我
使用
和
不
使用
管道进行编码时,我得到了不同
的
结果。下面
是
我不
使用
管道
的
代码: clf_LR = linear_model.LogisticRegression()X_train_std = scalar.fit_
transform
(
X_train</e
浏览 30
提问于2020-08-26
得票数 1
2
回答
ValueError:查询
数据
维度必须匹配训练
数据
维度-KNN
、
、
、
、
最近邻居和我收到此错误: ValueError:查询
数据
维度必须与训练
数据
维度匹配。# Part 1 - Data Preprocessing import numpy as np dataset = pd.read_csv('Google
浏览 0
提问于2020-05-14
得票数 1
1
回答
在流水线中学习多类支持向量机
的
预处理
、
、
机器学习方面的文献强烈支持支持向量机()
的
数据
归一化。作为,同样
的
应该应用于训练
和
测试
数据
。
使用
比手工减去平均值
和
除以标准差(除了在管道中
使用
它
的
能力)有什么好处?那么,如果我有多个类,
使用
以归一化为第一个估计量
的
管道来训练,会发生什么呢?它还会计算每个类别的平均
和
标准变化,并在
分类
时
使用
吗?更具体地说,下面的
分类
器是否在
浏览 1
提问于2013-04-22
得票数 6
回答已采纳
1
回答
使用
Scikit
的
Keras回归学习管道
和
无管道
的
StandardScaler
、
、
、
我正在比较
使用
Scikit
的
两个KerasRegressor程序
的
性能-学习StandardScaler:一个程序与Scikit学习Pipeline
和
一个没有Pipeline
的
程序。, Y_train)方案2:
X_train
= scale.fit_
transform
(
X_train
)
X_test</em
浏览 2
提问于2017-05-06
得票数 3
回答已采纳
1
回答
在Lasso
和
RobustScalar之后,如何逆变换回归预测?
、
、
、
在
使用
RobustScalar
和
Lasso之后,我正在尝试找出如何对我
的
数据
进行
缩放
(可能
使用
inverse_
transform
)来进行预测。下面的
数据
只是一个例子。我
的
实际
数据
更大更复杂,但我希望
使用
RobustScaler (因为我
的
数据
有异常值)
和
Lasso (因为我
的
数据
有几十个无用
的
浏览 23
提问于2019-05-16
得票数 2
回答已采纳
1
回答
使用
scikit学习流水线与手动学习时
的
分数不同
、
、
下面
是
使用
minmaxscaler、polyl
特征
和
线性回归
分类
器
的
简单示例。,Y_train)print(pipeLine.steps[2][1].intercept_)手动执行: X_trainScaled = MinMaxScaler().
fit_transform
(
X_t
浏览 13
提问于2019-07-27
得票数 1
回答已采纳
1
回答
交叉验证
和
测试集
的
缩放
和
数据
泄漏
、
、
、
、
我有更多
的
最佳实践问题。from sklearn.model_selection import train_test_split from sklearn.preprocessing import(
浏览 4
提问于2022-06-29
得票数 1
1
回答
“inverse_
transform
”函数在sklearn.preprocessing.MinMaxScalar中
的
奇怪行为
、
我
使用
MinMaxScalar函数在sklearn.preprocessing中规范化了我
的
一些变量(数组)
的
属性,使之在模型(线性回归)中
使用
,在模型创建和训练之后,我用
x_test
(splited为了评估目的,我想用原始
数据
集评估我
的
预测值,因为我
使用
了"MinMaxScalar.inverse_
transform
“函数,当我
的
代码按下面的顺序运行时,这个函数工作得很好,
x_train</em
浏览 0
提问于2021-04-13
得票数 0
3
回答
功能计数不匹配
、
、
我正在
使用
scikit做一个简单
的
分类
任务。我有一个测试
和
训练
数据
集,它们
的
形状如下: train = (1000,69917)
和
test = (1073,49429)。当我这样做
的
时候:predicted = clf.predict(
X_test
)ValueError: X has 49429
浏览 0
提问于2014-08-19
得票数 3
1
回答
在学习过程中,fit
和
fit_transform
在
使用
特征
缩放
时有什么区别?
、
、
我很少看到与这个问题有关
的
帖子,但我不太清楚我
的
困惑,如下面提到
的
。 我对fit
和
fit_transform
有一些困惑。假设我有
X_train
和
X_test
数据
,让我
的
缩放
函数
是
标准标量。我
使用
以下代码进行
缩放
,sc_X =StandardScaler()
X_train
= sc_X.fit_
transform</em
浏览 0
提问于2020-06-22
得票数 1
1
回答
fit()、
fit_transform
()
和
transform
()在scikit_learn中
的
区别是什么?
、
、
、
这是我正在
使用
fit_transform
()
和
transform
()
的
特性
缩放
代码。##Feature scalingsc_x=StandardScaler()
X_test
=sc_x.
transform
(
X_test</
浏览 0
提问于2018-03-16
得票数 3
回答已采纳
1
回答
使用
带有CountVectorizer
和
TfidfTransform
的
管道是否可以将输入
数据
转换为文档术语矩阵?
、
、
下面的代码是否真的将输入转换为dtm,因为它没有
使用
fit_transform
方法,而只是为了学习词汇表?这个模型是否足以进行学习?
X_train
,
X_test
, y_train, y_test = train_test_split(df.data, df.target, test_size = 0.2, random_state('tfidf', TfidfTransformer()),
浏览 15
提问于2020-06-17
得票数 0
2
回答
使用
CountVectorizer
和
其他预测器
的
sklearn DecisionTreeClassifier
、
、
、
我已经
使用
sklearn
的
DecisionTreeClassifier构建了一个文本
分类
模型,并希望添加另一个预测器。我
的
数据
在一个pandas
数据
框中,其中
的
列被标记为'Impression' (文本)、'Volume' (浮动)
和
'Cancer' (标签)。我一直只
使用
印象来预测癌症,但我想用印象
和
体积来预测癌症。(以粗体显示
的
更改):
浏览 15
提问于2020-05-22
得票数 1
回答已采纳
3
回答
为什么对测试
数据
调用
transform
()返回
数据
尚未安装
的
错误?
、
、
在执行特性
缩放
时,不要将变量赋值给StandardScaler(),而是按如下方式编码:它给出了以下错误: NotFittedError在
使用
此方法之前,
使
浏览 0
提问于2019-09-03
得票数 4
回答已采纳
1
回答
PCA
特征
选择
和
随机森林
分类
的
正确步骤
、
、
在MFCC
特征
提取之后,我尝试
使用
PCA
特征
选择,
然后
用随机森林进行
分类
。在对
数据
进行standardscale()之前,我已经将
X_train
、y_train、
X_test
和
y_test
数据
分开。第一步:我首先将
数据
缩放
如下:X_train_scaled = scaler.fit_
transform
(X_tr
浏览 7
提问于2022-06-25
得票数 0
回答已采纳
1
回答
我应该如何在Scikit学习中
使用
RandomizedLogisticRegression呢?
、
我只是没有理解这个类
的
。我可以用它来拟合
数据
,并得到特性
的
分数,但是这是这门课应该做
的
吗? 我看不出如何
使用
它来
使用
合适
的
模型实际执行回归。那么,是否有可能
使用
这个类来获得对新测试
数据
的
实际预测,以及是否有可能在交叉折叠验证中
使用
它来比较我正在
使用
的
其他方法
的
性能?我在其他
分类
器中
使用
了排名最高
的</e
浏览 1
提问于2013-11-27
得票数 5
回答已采纳
2
回答
使用
训练
数据
进行
fit_transform
,并通过测试进行转换
、
正如标题所说,我在训练
数据
上
使用
带有CountVectorizer
的
fit_transform
。
然后
我只对测试
数据
使用
tranform ...这是否与仅在训练上
使用
fit
和
仅在测试
数据
上
使用
tranform相同?
浏览 3
提问于2016-10-12
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习整体流程总结
数据预处理代码分享——机器学习与数据挖掘
机器学习100天-Day1
机器学习100天:第1天
常见的降维技术比较:能否在不丢失信息的情况下降低数据维度
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券