腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Python
-
从
现有
数据
集
生成
新
的
更大
的
数据
集
,循
环行
、
,所以我阅读了大量
的
循环答案,但这并不能让我完全理解。我有传统
的
成人
数据
集
。在清理它并保存一些用于验证之后,它看起来如下所示: Adult dataset - 43958 rows and 12 colums 我想运行一个循环,它接受每一行,并添加一个
新
行,其中age增加1,但保持所有其他
数据
与该行
的
数据
相等我尝试了两种不同
的
方法。To
的
目标是使
数据
集
更大
,但保持
浏览 29
提问于2021-03-30
得票数 1
回答已采纳
1
回答
Python
Glueviz -有没有办法替代ie更新导入
的
数据
?
我在OSX上使用Glueviz 0.7.2作为Anaconda包
的
一部分。Glueviz是一个
数据
可视化和探索工具。 我定期
从
外部模型重新
生成
相同
数据
集
的
更新版本,然后将该
数据
集
导入Glueviz。目前,我无法找到让Glueviz刷新或更新
现有
导入
数据
集
的
方法。我可以添加一个
新
的
数据
集
,即来自
浏览 1
提问于2016-07-19
得票数 1
1
回答
如何将
数据
集
从命令行(如Google )上传到Kaggle?
、
、
我已经阅读了一些命令来将文件或
数据
集
从
Google或Linux终端上传到GitHub (见我之前
的
问题)。 但是,我不知道如何通过命令将来自Google或Linux
的
数据
直接上传到Kaggle。
浏览 0
提问于2018-11-06
得票数 0
回答已采纳
1
回答
刷新Azure机器学习中
的
数据
集
、
、
在蔚蓝机器学习演播室中,本实验所用
的
数据
由R使用AzureML软件包推送。,) 上面的方法起作用了,但是让我说我想更新
数据
集
(相同
的
模式只是增加了更多
的
行)delete.datasets(ws, "data_for_azure") refresh(w
浏览 3
提问于2016-03-21
得票数 1
回答已采纳
2
回答
如何基于多个
数据
集
创建BIRT报表
、
、
、
、
我试图使操作符分离
数据
集
,并将其放在第一列中,并在所有quires中添加一个参数,例如( column..But =?),使操作符
从
当前
的
运算符行中获取--我无法将每个
数据
集中
的
参数值附加到操作符
数据
集中。这个策略正确吗?如果是.我如何做到这一点。如果没有,正确
的
策略是什么?
浏览 2
提问于2010-09-04
得票数 4
回答已采纳
1
回答
如何使用
Python
使用一个
数据
集
来模拟另一个
数据
集
?
、
、
、
= pd.DataFrame(cars, columns = ['Brand','Price'], index=['Car_1','Car_2','Car_3','Car_4']) 有没有办法用第一个
数据
集
的
参数
生成
一个
新
的
数据
集
我希望'Brand‘值是相同
的
,但'Price’值是通过使用
浏览 22
提问于2020-07-12
得票数 0
2
回答
Python
如何根据条件
从
现有
数据
集
创建
新
数据
集
、
例如:我有这样
的
代码: import pandas df = pandas.read_csv('covid_19_data.csv') 此
数据
集
有一个名为countryterritoryCode
的
列,它是国家/地区
的
代码。sample data from the dataset 此
数据
集
包含世界上所有国家/地区
的
covid19病例信息。如何创建只显示美国信息
的
新
数据</
浏览 47
提问于2020-07-13
得票数 0
2
回答
通过引导选择两个随机数
、
、
、
我有1020个尺寸
的
数据
集
。我需要在这1020个数字
的
基础上创建一个
新
的
数据
集
,方法是随机抽取替换
的
数字。但是,我需要以以下方式进行随机抽样: 将这个
更大
的
数字输入
新
的
数据
集
。重复步骤1-3,多次说明我有
浏览 1
提问于2013-06-19
得票数 2
回答已采纳
1
回答
如何有效地乘PySpark
数据
中
的
行?
、
、
、
、
我试图通过使用
现有
的小
数据
集
并使其
更大
来
生成
合成
数据
集
。我要目标尺寸是2000万行。我现在
的
方法是: table_copy = table_copy.unionAll(table_copy) 但是,在第是否有更快
的
方法将150行
数据
转换成20米?
浏览 5
提问于2021-08-05
得票数 0
回答已采纳
1
回答
流动停止和恢复训练
、
我在用Tensorflow训练我
的
模型。我每隔10个时代就会定期保存我
的
模型。我要训练
的
样本数量有限,所以我正在增强我
的
数据
集
,以
生成
一个
更大
的
训练
数据
集
。如果我需要使用我保存
的
模型来恢复停电后
的
训练,那么使用相同
的
数据
集
还是创建一个
新
的
数据
集</e
浏览 4
提问于2021-02-05
得票数 0
回答已采纳
2
回答
根据我
现有
的
数据
集
生成
额外
的
随机
数据
样本
、
、
我正在尝试
从
我
现有
的样本
数据
中
生成
一个
更大
的
数据
样本。例如,iris是N = 150,我想将其降到4500 (每种1500种)。在这里
的
文章中描述了一个例子。我不想resample或bootstrap,我对
生成
新
值感兴趣,例如,使用rnorm,这是我迄今为止尝试过
的
。Sepal.Length = rnorm(N, muSepal.Length,sdSepal.Length),Sepal.Width
浏览 2
提问于2020-06-24
得票数 1
回答已采纳
1
回答
如何在
Python
中基于
现有
的平衡
数据
集
生成
用于二进制分类
的
数据
?
我有一个100K行和100列
的
数据
集
,我想基于这个
现有
的
数据
集
生成
样本,以便使
数据
集
的
输出形状为10M行和100列?你知道如何在
Python
中做到这一点吗?我不想要过采样方法,因为我
的
数据
集
已经平衡了。
浏览 1
提问于2019-06-16
得票数 0
2
回答
从
概率分布
生成
随机变量
、
、
、
、
我已经
从
我
的
python
数据
集中提取了一些变量,并且我想从我拥有的发行版中
生成
一个
更大
的
数据
集
。问题是,我试图在保持相似行为
的
同时,为
新
数据
集
引入一些可变性。2000个观测值
的
类似
数据
集
。我知道numpy.random.choice和random.choice函数,但我不想使用完全相同
的
发行版
浏览 18
提问于2020-03-22
得票数 1
回答已采纳
5
回答
如何使用MapReduce/Hadoop?
、
我正在寻找一些关于其他人如何使用或其他类似MapReduce
的
技术
的
一般信息。一般来说,我很好奇您是在编写MR应用程序来处理
现有
的
数据
集
(比如web服务器日志文件),还是正在编写
生成
和处理
新
数据
集
的
应用程序?编辑:后续问题(2)您是否需要使用MR修改
现有
的
数据
集<
浏览 11
提问于2008-12-01
得票数 13
1
回答
我需要在AWS个性化中更新项目csv吗?
、
我试图使用AWS个性化,并跟踪他们
的
文档。因此,我将
数据
集
文件(交互、用户、项)上传到S3,然后创建了一个解决方案和一个活动。我使用java实现了PutEvents API。现在我很好奇,我需要更新
数据
集
文件,特别是条目csv。
浏览 1
提问于2020-09-08
得票数 4
回答已采纳
1
回答
在
Python
中
生成
Tableau中网络图
的
X,Y坐标
、
、
、
我希望
生成
一组X,Y坐标,以
从
现有
的
数据
集
创建。此结果
集
应该能够在Tableau中读取,因此应该以这种方式格式化(例如):其中LineX、LineY和CircleY是要求。例如,我想根据算法(Fruchterman-Reingold)
生成
X,Y坐标。在
Python
中有什么方法可以做到这一点吗?如果需要,我可以展示一个示例输入
集
(来自真实
集
),但我可以以任何方式格式化该集,这是我需要帮助
的
浏览 0
提问于2017-01-25
得票数 0
回答已采纳
1
回答
如何在azure
数据
工厂中将datalake gen1
数据
集
迁移到datalake gen2?
、
、
、
、
最近,对于我们
的
解决方案,我们被要求
从
第一代升级到第二代,但是我可以使用azure
数据
工厂将文件夹和文件
从
第一代加载到gen2,但在
现有
的
数据
工厂中,我们有多个与gen1相关
的
数据
集
。有人能建议我如何在azure
数据
工厂中将
数据
集
从
gen 1更改为gen 2吗?
浏览 32
提问于2020-01-31
得票数 0
1
回答
如何将
现有
多维
数据
集
添加到SSAS项目中
、
、
我需要在
现有
的SSAS
数据
库中添加多维
数据
集
的
新版本。我已经创建了
新
的
多维
数据
集
,方法是使用Management Studio将旧
的
多维
数据
集
编写到屏幕上,将ID更改为
新
的
ID,然后执行脚本。因此,现在
新
的
多维
数据
集
存在于
数据
库中。 我想将
新</em
浏览 0
提问于2014-06-06
得票数 0
1
回答
如何更改
数据
集
名称
我在BigQuery中创建了一个
数据
集
。不幸
的
是,还不清楚如何重命名它?我单击了dataset名称右侧
的
箭头,但看不到任何将其重命名
的
选项。
浏览 0
提问于2018-10-10
得票数 0
回答已采纳
1
回答
机器学习中
的
堆叠建模建议
、
、
、
我已经在训练
数据
集
上建立了几个模型,我对结果不满意,我希望把它们结合在一起,
生成
一个
新
的
模型,所以我
的
想法是,因为我已经有了
现有
模型
的
结果,我想在原始特征
数据
集
之上创建一个
新
的
数据
集
,将
现有
模型结果作为单独
的
特性,应用聚类来过滤原始
数据
集中
的
一些
数据
,并希望
浏览 0
提问于2019-10-18
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
第33集 python机器学习:K均值对多维数据集的处理
如何用python制作自己的训练数据集
【五号雷达-数据快讯】DiFF - 扩散模型生成的面部伪造数据集
如何由 Power BI 直接查询数据集捕获生成的 SQL 查询
Python学习笔记3:数据集操作-列的统一操作
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券