腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
有没有
办法
对
大型
数据
集
进行
循环
子集
?
、
、
、
我正在尝试使用'R‘将一个相当大的
数据
集
(530行,211列)分成两个
子集
,每个
子集
46行,20行中的21行,16行中的1行和2行中的1行。我不想多次复制代码,而是想为此创建一个
循环
。另外,当
子集
设置时,我想删除
子集
的前3列。,所以我想使用
循环
,但我不知道如何编码。我想每年以块为单位设置整个
数据
集
的
子集
,并为此使用一个
循环
。 下面我发布了
数据
集<
浏览 23
提问于2019-02-19
得票数 0
回答已采纳
1
回答
R使用for
循环
从一个
大型
csv文件设置
子集
并创建较小的csv文件
、
我有一个温度的
大型
数据
集
(Csv),我必须按日期(年)
进行
子集
,以按十年创建5个较小的
数据
集
。因此1960-1969年的
数据
将是一个较小的csv文件,1970-1979年的
数据
将是另一个csv文件,等等。我一直在尝试使用for
循环
来实现这一点IDs<-unique(df$ID) temp <- df[df$ID==IDs[i],f
浏览 4
提问于2015-11-22
得票数 0
1
回答
Neo4j:按总关系
对
大型
结果
集
进行
排序?
、
、
有没有
可能获取一个大的节点
子集
,并按总的关系
对
它们
进行
排序?或者换一种说法,
有没有
可能从neo4j返回连接最多的节点在顶部的
大型
结果
集
?
浏览 0
提问于2013-02-06
得票数 0
回答已采纳
1
回答
执行管道时的“步骤”太多
我们有一个
大型
数据
集
,需要将其划分为1,000个单独的文件,我们想要使用的最简单的实现是应用PartitionFn,它在给定
数据
集
的一个元素的情况下,返回1到1,000之间的随机整数。这种方法的问题是,它最终会创建1,000个PCollections,并且管道不会启动,因为似乎
对
“步骤”的数量有硬限制(与执行图中作业监视UI上显示的框相对应)。
有没有
办法
提高这个限制(限制是多少)?我们用来解决这个问题的解决方案是首先将
数据
划分为较小的
浏览 0
提问于2016-12-03
得票数 0
3
回答
在
大型
数据
集
上
进行
聚类
、
、
我正在尝试
对
一个
大型
(‘m)
数据
集
进行
集群。为了聚类,你需要每个点到其他点的距离,所以你最终得到了一个N^2大小的距离矩阵,在我的
数据
集
的情况下,它将是艾字节的数量级。当然,Matlab中的Pdist会立即崩溃;)
有没有
一种方法可以先
对
大
数据
的
子集
进行
聚类,然后再
进行
一些相似聚类的合并?我不知道这是否有帮助,但
数据
是固定长度的二进制字符串,所以
浏览 0
提问于2011-03-29
得票数 5
3
回答
设置嵌套列表,选择多个条目
、
、
、
我经常使用
大型
数据
集
,因此有时会创建嵌套列表来减少环境中的对象。当删除这样的列表并希望沿着所有步骤进入第一个条目时,如下所示:在我当前的一些脚本中,这些脚本中的
数据
是对齐的,因为下一步列表中的每个条目都是可比较的。如果我想比较这些或做一个计算,它会是这样的:
有没有
办法
对
它们
进行</em
浏览 3
提问于2021-12-15
得票数 0
回答已采纳
6
回答
实时内插
大型
数据
集
、
、
对
大
数据
集
进行
插值我有一个应用程序,它希望能够将这些
数据
或
子集
绘制成图形。我需要的是一个更小的
数据
集
(100个点左右),它(尽可能)准确地表示给定的
数据
。
有没有
人知道有什么有趣的和有效的方法来获得这些
数据
? 干杯,卡尔
浏览 0
提问于2010-03-25
得票数 9
回答已采纳
2
回答
关于迭代
数据
集
的Tensorflow速成课程问题
我
对
中的my_input_fn()感到非常困惑 如果shuffle = False,estimator.train()不会在
循环
中使用相同的
数据
子集
吗?即
循环
迭代#1和#0使用相同的
数据
子集
。这里的目标是:*在
循环
中调用estimator.train() *评估
循环
内的验证错误*训练()和评估应该在不同
循环
iteration#的不同
数据
子集
上
进行
。由于input_
浏览 1
提问于2019-01-02
得票数 0
2
回答
dplyr
循环
滤波re *
、
、
、
我使用dplyr和for
循环
的组合来对
数据
库
进行
子集
。我想
对
整个
数据
集
执行第一个操作。我的正则表达式
循环
失败。什么是解决
办法
?
浏览 1
提问于2019-09-21
得票数 2
回答已采纳
5
回答
在MySQL中建立
大型
数据
库以便在R中
进行
分析
、
、
在R中分析
大型
数据
集
时,我已经达到了内存的极限。我认为我的下一步是将这些
数据
导入到MySQL
数据
库中并使用RMySQL包。很大程度上是因为我不懂
数据
库的行话,所以我不知道如何通过几个小时的Googling和RSeeking来安装MySQL (我在MacOSX10.6上运行MySQL和MySQL Workbench,但也可以运行关于如何开始使用这个用法,
有没有
好的参考资料?在这一点上,我不想做任何类型的关系
数据
库。我只想将.csv文件导入到本地MySQL
浏览 1
提问于2010-07-27
得票数 10
回答已采纳
1
回答
Stata -从
大型
数据
集中读取有限数量的变量
我正在使用Stata IC 13,需要对
大型
dataset.The问题的不同变量
进行
不同类型的分析,因为我的
数据
集
非常大,所以我得到了以下错误 我需要一种灵活的方式,通过变量名导入变量,而不是将原始
数据
集
拆分到许多小
子集
中。我听说过,但是我
对
Stata还比较陌生,所以如果有人能向我展示他们
浏览 3
提问于2013-11-04
得票数 3
回答已采纳
1
回答
Firebase模拟器(Firestore)在
大型
数据
集
上超时
、
、
我已经从Firestore导出了大约2 2GB的生产
数据
,我正在尝试将其导入到Firebase模拟器中。
有没有
办法
增加这个超时时间? 我相当确定问题的原因是
数据
库的大小,因为它适用于较小的
数据
集
。 此外,当我导出集合的
子集
时,
大型
集合的文档不会显示在仿真器UI中。显示了集合名称,但没有文档。是否有任何在线资源可以帮助您了解如何处理
大型
数据
集
或有关Emulator限制的任何文档?谢谢
浏览 20
提问于2021-04-07
得票数 0
1
回答
如何在Pyspark中创建按列拆分的RDD
子集
?
、
我有一个
大型
数据
集
作为一个RDD。我想创建这个RDD的大约100个按列排列的
子集
,这样我就能够在
循环
中单独
对
每个
子集
运行映射转换。.,1000)(1,2,3,...,100)(1,2,3,...,100) 我如何在Pyspark中做到这一点呢
浏览 1
提问于2017-01-21
得票数 0
回答已采纳
1
回答
通过多种因素的组合从
数据
帧创建
子集
、
、
、
、
我需要在一个
大型
数据
集
上按列
进行
成对迭代分析。第一列包含分类变量,其余列包含数值变量。(x) {data.x <- df %>% filter(T %in% x)} df_sets <- apply(ls1, MARGIN = 2, pair) 然后,我可以使用每个子
数据
集
对
每一列
进行
t但是,在实际情况中,我有一个比a/b/c长得多的
数据
集
,这使得手动重复此过程非常费力。如何从d
浏览 11
提问于2020-10-12
得票数 1
回答已采纳
1
回答
如何获得
大型
数据
库的(描述性)概述?
、
、
、
、
我面临着一个
数据
框架151个变量首先,我主要感兴趣的是
数据
与单个参数的关系。但我不能在x轴上绘制2078个主题,然后用它绘制一个条形图。
浏览 0
提问于2020-12-09
得票数 1
2
回答
如何决定使用TFIDF的方法,还是鞠躬?
、
、
、
在NLP的
大型
数据
集中,需要很长时间才能对
数据
集
进行
分类。
有没有
一种方法可以告诉我哪种方法更有可能给出最高的F1分数。我试过在较小的
子集
(1000条记录)上测试它们,这是快速的,但在较小的
子集
中最好的方法并不意味着它在完整的
数据
集中是最好的。 还有其他方法来决定使用哪种方法吗?
浏览 0
提问于2021-03-03
得票数 0
1
回答
如何使用逻辑索引和min函数查找具有min值的行?
所以,我知道如何使用
子集
函数找到它。
有没有
办法
不使用
子集
函数?示例
数据
集
:J 67 89 M 78 89 M 54 75我的问题:如何
对
这个
数据
集
使用逻辑索引和最小函数?我不想用
子集
。
浏览 2
提问于2021-09-13
得票数 1
1
回答
在python中将大
数据
集
划分为较小的
子集
、
、
我有一个
大型
的基于时间的
数据
集
。它有120,496个
数据
点。我想要有更小的
子集
,每个
子集
有600个
数据
点(问题是最后一个系列,因为长度不是600的倍数),我可以用一个冗长而肮脏的for
循环
来做到这一点,但我想问一下,
有没有
什么简单的函数可以执行这个任务?
浏览 30
提问于2020-08-23
得票数 0
回答已采纳
1
回答
如何从绘制的
数据
中获取平均值?从缩小的曲线图到
数据
、
、
我通过缩小ggplot2中菱形
数据
集
的范围得到了这个图。我是通过
对
x限制、截取等
进行
排序来实现的。qplot(price,carat,data=diamonds,cut="Ideal",color=clarity) + xlim(2500,3000) + ylim(1,1.6)如何提取这些
数据
这是否代表它自己的
大型
数据
集
的
子集
?这样我就可以做一些事情,如获取平均价格,最大克拉价值等。
浏览 0
提问于2013-01-22
得票数 0
回答已采纳
1
回答
从
大型
数据
集
生成
循环
数据
子集
、
我试着用R从一个大
数据
集中提取某些
数据
。
数据
来自一个经过几个阶段的过程,比如说阶段0到5。我有一个包含进程多次运行的
数据
集
。 我试图提取每一次运行的
数据
。我想要创建第一次出现阶段0到5的
子集
,然后是第二次运行阶段0到5的另一个
子集
。
数据
集
只包含进程
数据
和按时间顺序排列的位相数,它不知道它在哪个运行中。我已经尝试过使用一些while和for
循环
来组织
数据
,但是在这么
浏览 0
提问于2019-04-15
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测
超越ImageNet预训练,Meta AI提SplitMask,小数据集自监督预训练
Multicolumn RBF Network
处理数据,大数据甚至更大数据的 17 种策略
从用户交易数据集中寻找商品之间的关联规则
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券