腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
生成
要素
和
类
仅为
0
和
1
且为
线性
的
100K
数据
集
、
有没有办法
生成
一个只包含
0
和
1
的
数据
集
?我想创建一个
数据
集
,它有4个
0
和
1
的
特征,还有这个
数据
集
被标记为
0
和
1
。
数据
应该是50%标记为
0
,50%标记为
1
,并且是
线性
的
。
数据</e
浏览 11
提问于2019-02-25
得票数 2
1
回答
Pytorch Dataloader -如何训练不同大小
的
训练
和
val
数据
集
(10k样本,20k…
100k
样本)来比较
数据
集
大小
的
影响?
、
、
、
我想根据训练
和
验证
数据
集
的
不同大小来比较模型
的
性能。我希望能够构建一个循环,使用10k训练
和
1
k val
数据
训练我
的
pytorch模型,并
线性
增加
数据
集
大小,直到
100k
训练
和
10k val
数据
集
大小。 我还需要考虑目标
类
,因此以某种方式实现分层拆分。有谁知道如何轻松地将其嵌入到我
的<
浏览 1
提问于2021-01-07
得票数 0
2
回答
转换
仅为
0
和
1
值
的
数据
集
、
我不知道该怎么称呼这件事,所以我试着用普通
的
术语来描述这个问题是什么。我有一个只包含
0
和
1
的
数据
,所以对于每一个人来说,而不是有一个具有因子值(ex )
的
列。
0
如何转换R中
的
数据
集
,从而创建新
的
列(房间数目),并为
1
(在第4列)
的
位置提供一个vhigh值?我有很多种不同
的
费用,我需要这样做。这21列表示1000+观测
的
浏览 1
提问于2018-04-02
得票数 0
1
回答
生成
线性
回归
和
k-NN
的
二元
数据
、
我正在阅读“统计学习
的
要素
”一书中
线性
回归
和
k近邻
的
生成
数据
。以下是文本中提到
的
两个场景**情景
1
:每个类别中
的
训练
数据
是由二元高斯分布产生
的
,它们具有不相关
的</e
浏览 4
提问于2020-09-15
得票数 0
1
回答
sklearn.LogisticRegression ValueError:未知
的
标签类型:'continuous‘
、
我得到了这个错误: ValueError: Unknown label type: 'continuous' 下面是我
的
代码: data=data.dropna()y = array[:,-
1
]model
浏览 122
提问于2021-04-23
得票数 0
1
回答
在python中以两个半圆弧
的
形式创建
数据
集
、
、
内半径rad有两个半圆,由red( -
1
)
和
blue ( +
1
)分隔。上半圆
的
中心与底部半圆边缘
的
中间对齐。这个任务在sep >=
0
时是
线性
可分离
的
,而对于sep <
0
则不是这样。设置rad = 10,thk = 5
和
sep = 5。然后,均匀地
生成
2000个示例,这意味着每个
类
大约有1000个示例。 有人能帮我
浏览 0
提问于2018-08-13
得票数 0
回答已采纳
1
回答
循环遍历目录名list.remove()不起作用
、
、
我正在尝试遍历多个目录
和
多个GDB,以创建一个
要素
类
列表。我遇到
的
问题是,当我试图从列表中删除某些
要素
类
时,脚本只是被忽略了,或者我得到了一个错误,说明列表中不存在x。(X)。
要素
类
名称
的
问题是,它有3个字母,对于每个GDB是唯一
的
,同时仍然有2个其他标准组件。如下所示: directory
1
> directory
1
.gdb > shapes > fc_dir<
浏览 0
提问于2013-05-23
得票数 0
2
回答
为Pandas Dataframe中
的
两列创建稀疏矩阵
、
、
、
、
我正在尝试从Pandas
数据
集
(>10 to )创建一个稀疏矩阵表:
类
---------------------现在,每个教师
和
学生都有一个与之相关联
的
数字。,(r,c)),shape=(len(students),len
浏览 0
提问于2016-10-09
得票数 4
4
回答
测试非
线性
支持向量机
的
数据
集
、
、
、
我正在实现一个非
线性
支持向量机,我想在一个简单
的
不可
线性
分离
的
数据
上测试我
的
实现。谷歌并没有帮我找到我想要
的
东西。你能告诉我在哪里可以找到这样
的
数据
吗?或者至少,我如何手动
生成
这样
的
数据
? 谢谢,
浏览 1
提问于2011-05-07
得票数 8
回答已采纳
2
回答
使用sklearn
和
Python进行大型应用程序分类/抓取练习
、
、
、
我正在研究一个相对较大
的
基于文本
的
web分类问题,我计划在python中
的
sklearn中使用多项式朴素贝叶斯分类器,并使用scrapy框架进行爬行。然而,我有点担心sklearn/python对于一个可能涉及数百万网站分类
的
问题来说可能太慢了。我已经在DMOZ
的
数千个网站上训练了分类器。研究框架如下:
1
)爬虫登陆一个域名,抓取网站上20个链接
的
文本(深度不超过
1
个)。(对于爬虫
的
示例运行,这里
的
标记化单
浏览 0
提问于2013-04-13
得票数 5
1
回答
pyspark SVD特征向量与PCA特征向量之间
的
区别是什么?
、
、
我正在使用(pyspark) mllib (Spark 2.2.0)中
的
奇异值分解
和
主成分分析函数,如以下链接所述:[(2, 2), (3,
1
), (2, 2), (
1
DenseVector([-0.5883, -0.0])][[-0.70710678 -0.70710678]这里有一个问题: spark中
的
特征向量到底是什么现在与应用computePrincipalComp
浏览 1
提问于2019-05-07
得票数 2
1
回答
用sklearn.datasets.make_classification创建质量
数据
我在做一些关于svm内核方法
的
实验。我比较这些问题
的
方法是存在一些多
类
和
二进制分类问题,并且在每组中都有一些p > n、n > p
和
p == n
的
例子。但是,要找到一些示例(每个子组大约有5个)真的很难,所以我想用sklearn
生成
它们。这么说,我不知道如何以一贯
和
现实
的
方式去做这件事。我可以
生成
数据
集
,但是我不知道为我
的
目的设置了哪些参数。因此,基本
浏览 0
提问于2021-09-08
得票数 0
1
回答
如果目标被标记为
0
和
1
,在支持向量机中如何在数学上进行分类?
、
、
、
、
我
的
数据
集
具有
要素
列
和
目标标签
0
和
1
。但我
的
问题是,它是如何在数学上预测
的
。边际超平面H
1
和
H2
的
方程为: W^T X +b >=
1
这意味着如果大于+
1
,它属于一个
类
。如果小于-
1
,则它属于另一个
类<
浏览 5
提问于2021-02-04
得票数 1
1
回答
Keras,如何在删除最后一层
的
情况下使用模型进行预测
、
、
、
、
假设我有
100k
x 400
的
数据
集
。init_weights))model.add(SReLU())model.add(Dense(
1
,activation = 'linear', init = init_weights))model.compile(loss = ..
和
model.fit(input_matrix
浏览 11
提问于2017-03-17
得票数 4
3
回答
在R中这两种情况下如何
生成
高斯分布
的
数据
?
、
在Tibshirani
的
“统计学习
要素
”中,在比较最小二乘/
线性
模型
和
knn时,说明了以下两种情况: 场景
1
:每个
类
中
的
训练
数据
是由二元高斯分布产生
的
,它们具有不相关
的
分量
和
不同
的
均值。场景2:每个
类
中
的
训练
数据
来自10个低方差高斯分布
的
混合
数据
,单个均值本身分布为高斯。其思想是,
浏览 1
提问于2015-09-04
得票数 5
回答已采纳
2
回答
对倾斜
的
验证
数据
的
限制
、
、
、
我有一个严重倾斜
的
数据
集
,由20个
类
组成,其中最小
的
类
包含1000个样本,最大
的
几百万个。因为我
的
数据
集
有如此大
的
偏差,对我<
浏览 0
提问于2017-11-03
得票数 3
4
回答
识别栅格地图上
的
线性
要素
并使用R返回
线性
形状对象
、
、
我想识别栅格地图上
的
线性
要素
,例如道路
和
河流,并使用R将它们转换为
线性
空间对象(SpatialLines
类
)。raster
和
sp软件包可用于将
要素
从光栅转换为多边形矢量对象(SpatialPolygons
类
)。rasterToPolygons()将从栅格中提取特定值
的
单元格,并返回多边形对象。sinuous linear feature on a raster as an example library(raster
浏览 2
提问于2012-03-07
得票数 15
回答已采纳
2
回答
从过度抽样技术
的
预期性能提升
的
粗略想法?
、
、
我试着训练一个分类器来完成多
类
分类任务。但是,
数据
集
非常不平衡。在大约160个独特
的
标签中,大约有一半是这样
的
,只有10个或更少
的
样本对应于每一个稀有标签。大约有20个标签恰好出现一次。因此,
数据
集
包含了几个
类
,这些
类
很好地表示,并且有非常长
的
和
瘦削
的
稀有标签尾。
数据
集中大约有50个特征(包括数字特征
和
分类特征)
和</
浏览 0
提问于2022-01-16
得票数 0
回答已采纳
1
回答
我们从训练一个逻辑回归
数据
集中学到了什么?
、
、
、
在Logistic回归中,我们从
数据
集
的
培训中学到了什么?与
线性
回归一样,在训练
集
的
帮助下,我们能够
生成
一条最佳拟合线(y= mx+c),其中m
和
c来自于训练我们
的
数据
集
。同样地,一旦我们训练了我们
的
logistic回归模型,模型会学到什么,然后用来预测特定输入
的
类
呢?
浏览 0
提问于2019-08-31
得票数 0
回答已采纳
2
回答
如何定义
线性
可分问题?
、
、
当我们谈论感知器时,我们说它们对于
线性
可分函数
的
逼近是有限
的
,而使用非
线性
变换
的
神经网络则不是。 我很难理解
线性
可分性
的
概念。具体来说,它是只适用于二进制分类,还是推广到N
类
?如果是这样,那么4个
类
的
线性
决策边界看起来是什么样
的
呢?
浏览 0
提问于2020-01-23
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
一文揭开机器学习算法的神秘面纱
如何在Python中用scikit-learn生成测试数据集
教你在Python中用Scikit生成测试数据集
3,sklearn的一般流程
来看看如何生成测试数据集吧!
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券