首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >用StandartScaler处理的数据可以包含值>1或<-1吗?

用StandartScaler处理的数据可以包含值>1或<-1吗?
EN

Stack Overflow用户
提问于 2017-10-07 12:45:44
回答 1查看 53关注 0票数 0

我将我的功能数据放大如下:

代码语言:javascript
运行
AI代码解释
复制
flattened_num_f.head()
num_features_test  = flattened_num_f.fillna(flattened_num_f.mean())

from sklearn.preprocessing import StandardScaler
std_scaler = StandardScaler()

num_train_std = pd.DataFrame(std_scaler.fit_transform(num_features_test.loc[y_train_IDs]), \
                         columns=num_features_test.loc[y_train_IDs].columns, \
                        index=num_features_test.loc[y_train_IDs].index)
test_for_stdness(num_train_std)

最后一个函数将超出-1,1约束的值添加到列表中,它会找到~100个元素,max : 78.86000099160675,min :-2.785050711746339。

这是正常的,还是我犯了一个错误?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-10-07 12:59:51

StandardScaler根据标准正态分布(均值为零,标准差为1)进行转换。在这个分布中,随机变量可以在-infinity和无穷远之间取任意值。更大的价值不太可能出现,但它们可能会出现。事实上,你能看到一个小于-1或大于1的值的概率大约是32%。

有关图像的来源和一些示例计算,请参见这个可汗学院的页面

在标准的min-max归一化中,减去最小值并除以范围,得到0到1之间的值,但这可以用一个线性函数来修改,这样就可以得到-1和1之间的值。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/46624947

复制
相关文章
SQL---NULL值处理(1)
如果表中的某个列是可选的,那么我们可以在不向该列添加值的情况下插入新记录或更新已有的记录。这意味着该字段将以 NULL 值保存。
IT云清
2019/01/16
7670
前端进阶之 a 可以同时 == 1 && == 2 && == 3吗?
当然,我们可以通过重写 Symbol.toPrimitive来制定转换规则,此方法在转原始类型时调用优先级最高。
用户1462769
2019/08/09
7110
null或空值的判断处理
1,错误用法一: if (name == "") {      //do something } 2,错误用法二: if (name.equals("")) {      //do something } 3,错误用法三: if (!name.equals("")) {      //do something } 我们来解说一下: 上述错误用法1是初学者最容易犯,也最不容易被发现的错误,因为它们的语法本身没问题,Java编译器编译时不报错。但这种条件可能在运行时导致程
似水的流年
2018/01/18
3.8K0
null或空值的判断处理
1,错误用法一: if (name == "") {      //do something } 2,错误用法二: if (name.equals("")) {      //do something } 3,错误用法三: if (!name.equals("")) {      //do something } 我们来解说一下: 上述错误用法1是初学者最容易犯,也最不容易被发现的错误,因为它们的语法本身没问题,Java编译器编译时不报错。但这种条件可能在运行时导致程序出现bug,永远也不会为true,也就是时说,if块里的语句永远也不会被执行。 上述用法二,用法三 的写法,是包括很多Java熟手也很容易犯的错误,为什么是错误的呢?也许你会感到纳闷。 对,它们的写法本身没错,但是,少了一个null判断的条件,试想,如果name=null的情况下,会发生什么后果呢?后果是,你的程序将抛出NullPointerException异常,系统将被挂起,不再提供正常服务。 当然,如果之前已经对name作了null判断的情况例外。 正确的写法应该先加上name != null的条件,如例: if (name != null && !name.equals("")) {      //do something } 或者 if (!"".equals(name)) {//将""写在前头,这样,不管name是否为null,都不会出错。      //do something } 下面,我们举一个简单的例子: TestNullOrEmpty.java
似水的流年
2018/01/14
3.3K0
null或空值的判断处理
1,错误用法一: if (name == "") {      //do something } 2,错误用法二: if (name.equals("")) {      //do something } 3,错误用法三: if (!name.equals("")) {      //do something } 我们来解说一下: 上述错误用法1是初学者最容易犯,也最不容易被发现的错误,因为它们的语法本身没问题,Java编译器编译时不报错。但这种条件可能在运行时导致程序出现bug,永远也不会为true,也就是时说,if块里的语句永远也不会被执行。 上述用法二,用法三 的写法,是包括很多Java熟手也很容易犯的错误,为什么是错误的呢?也许你会感到纳闷。 对,它们的写法本身没错,但是,少了一个null判断的条件,试想,如果name=null的情况下,会发生什么后果呢?后果是,你的程序将抛出NullPointerException异常,系统将被挂起,不再提供正常服务。 当然,如果之前已经对name作了null判断的情况例外。 正确的写法应该先加上name != null的条件,如例: if (name != null && !name.equals("")) {      //do something } 或者 if (!"".equals(name)) {//将""写在前头,这样,不管name是否为null,都不会出错。      //do something } 下面,我们举一个简单的例子: TestNullOrEmpty.java
似水的流年
2019/12/08
3.6K0
异或满足结合律吗_异或1⊕0的结果是
A x:添加操作,表示在序列末尾添加一个数 x,序列的长度 N 增大 1。 Q l r x:询问操作,你需要找到一个位置 p,满足 l≤p≤r,使得:a[p] xor a[p+1] xor … xor a[N] xor x 最大,输出这个最大值。 输入格式 第一行包含两个整数 N,M,含义如问题描述所示。
全栈程序员站长
2022/09/22
2530
excel判断单元格包含指定内容的函数用=IF(COUNTIF(A1,"*内容*"),"0","1")
  前面我们聊过怎样将Excel包含某字符的单元格填充颜色,这边我们用另外一种方法来实现:excel判断单元格包含指定内容的函数   选中需要显示结果的单元格,假设我们要判断第一行第一列的单元格A1是
ytkah
2018/03/05
93K0
excel判断单元格包含指定内容的函数用=IF(COUNTIF(A1,"*内容*"),"0","1")
Pandas数据处理1、DataFrame删除NaN空值(dropna各种属性值控制超全)
        这个女娃娃是否有一种初恋的感觉呢,但是她很明显不是一个真正意义存在的图片,我们需要很复杂的推算以及各种炼丹模型生成的AI图片,我自己认为难度系数很高,我仅仅用了64个文字形容词就生成了她,很有初恋的感觉,符合审美观,对于计算机来说她是一组数字,可是这个数字是怎么推断出来的就是很复杂了,我们在模型训练中可以看到基本上到处都存在着Pandas处理,在最基础的OpenCV中也会有很多的Pandas处理,所以我OpenCV写到一般就开始写这个专栏了,因为我发现没有Pandas处理基本上想好好的操作图片数组真的是相当的麻烦,可以在很多AI大佬的文章中发现都有这个Pandas文章,每个人的写法都不同,但是都是适合自己理解的方案,我是用于教学的,故而我相信我的文章更适合新晋的程序员们学习,期望能节约大家的事件从而更好的将精力放到真正去实现某种功能上去。本专栏会更很多,只要我测试出新的用法就会添加,持续更新迭代,可以当做【Pandas字典】来使用,期待您的三连支持与帮助。
红目香薰
2023/02/17
4.3K0
Pandas数据处理1、DataFrame删除NaN空值(dropna各种属性值控制超全)
任意文件包含漏洞(1)
文件包含漏洞:即file inclusion 指当服务器开启allow_url_include选项时,就可以通过PHP的某些特性函数(include(),require()和include_once(),requir_once()),去包含任意文件。此时如果对文件来源不严格过滤审查,就容易包含恶意文件。而攻击者可以通过构造这个恶意文件来达到目的。
宸寰客
2020/08/25
1.3K0
任意文件包含漏洞(1)
学会这个,1秒就可以批量处理文件
拿到老板给到的这个任务后,没关系我很有耐心,不就是右击新建文件夹重命名保存吗,然后加班点鼠标到天荒地老,终于完成了。
猴子数据分析
2022/12/12
6890
学会这个,1秒就可以批量处理文件
实验七 香农编码_香农编码效率可以大于1吗
编程,对某一离散无记忆信源实现香农编码,输出消息符号及其对应的码字。 设离散无记忆信源,
全栈程序员站长
2022/09/30
4330
实验七 香农编码_香农编码效率可以大于1吗
用R处理NASA数据(.hdf 或.nc文件)
这里不在赘述,参考如何获取NASA数据,下面的例子根据下载的LandCover与Rainfall数据进行展示,如何利用R语音进行读取,然后绘图。先加载所需R包及地图文件
Jamesjin63
2022/10/25
1.4K0
用R处理NASA数据(.hdf 或.nc文件)
1秒时间用Excel可以做些什么
不多说开始工作 首先伪造一份数据,孩子哭了.没数据啊 这个选定,就是鼠标箭头放好以后(大白加号)按住左键拉取数据 Alt+=即可求和.看最后的数据 选中以后,Ctrl+T 隔行填充颜色 不想要筛选 选
云深无际
2020/09/03
4780
1秒时间用Excel可以做些什么
R语言数据分析与挖掘(第一章):数据预处理(1)——缺失值处理
今天开始新的R教程:R语言数据分析与挖掘,本教程是在掌握R基础语法和基本绘图的情况下学习,没有R基础的可先在网上找相关教程进行学习。当然,本公众号(bioinfo_cloud)也有基础的语法教程,也可参考学习!后台回复:R语言基础教程,即可获取,或者通过本公众号的菜单栏自己寻找!
DoubleHelix
2019/09/25
4.5K0
R语言数据分析与挖掘(第一章):数据预处理(1)——缺失值处理
返回指针值的函数(1)
/**有a个学生,每个学生有b门课程的成绩。要求在用户输入学生序号以后, **/ #include <stdio.h> #include <stdlib.h> int main() { float *aa(int (*p)[4],int n); float a[3][4]={{50,99,80,50},{55,60,85,90},{10,54,74,26}}; float *pt; int k; scanf("%d",&k); pt=aa(a,k);
谙忆
2021/01/19
2.6K0
数据处理 | xarray的NC数据基础计算(1)
首先我们先导入所需的数据,本次使用的是经扩展重构的海表面温度 v5 数据集(Extended Reconstructed Sea Surface Temperature, abbr. ERSST)。这个数据集可追溯到 1854 年的海表面温度,并被广泛使用。
郭好奇同学
2021/04/22
7.4K0
数据处理 | xarray的NC数据基础计算(1)
用Pandas处理缺失值
在数据表或 DataFrame 中有很多识别缺失值的方法。一般情况下可以分为两种:一种方法是通过一个覆盖全局的掩码表示缺失值, 另一种方法是用一个标签值(sentinel value) 表示缺失值。在掩码方法中, 掩码可能是一个与原数组维度相同的完整布尔类型数组, 也可能是用一个比特(0 或 1) 表示有缺失值的局部状态。在标签方法中, 标签值可能是具体的数据(例如用 -9999 表示缺失的整数) , 也可能是些极少出现的形式。另外, 标签值还可能是更全局的值, 比如用 NaN(不是一个数) 表示缺失的浮点数。
用户3577892
2020/06/10
3K0
50. Python 数据处理(1)
逗号分隔符(csv),有时也称为字符分隔值,因为分隔字符也可以不是逗号,其文件以纯文本的形式存储表格数据(数字和文本)。
py3study
2020/01/07
1.1K0
50. Python 数据处理(1)
点击加载更多

相似问题

可以用[:1]代替[0]吗?

435

深度值可以大于1吗?

13

我可以用Perl或PHP生成SHA1吗?

50

如果其他行中包含有1的in,那么可以搜索in列1吗?

23

主键列的1行可以包含空值?

30
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档