腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
在
R
中
编排
数
据以
按
组
添加
变量
(
列
)
和
观测
值
(
行
、
我正在尝试重新排列一个包含几千个
观测
值
的数据集(为了最终使用DRC包
中
的drm功能),我厌倦了
在
excel
中
这样做。在数据帧
中
,我希望根据
在
df
中
的向量中找到的间隔来
添加
“开始”
和
“结束”时间(直到inf)。这意味着我必须在最后一个“结束”时间是inf的地方
添加
一个观察
值
(
行
)。对于最后一
行
(带有inf的那行),我还需要从一个任意数字
中<
浏览 9
提问于2019-03-14
得票数 0
回答已采纳
1
回答
步进左连接/合并
、
我有一个250k
观测
值
的主df,我想向其中
添加
一
组
变量
,由于left_join/merge-function的
行
大小( 2^31-1个
观测
值
)的限制,我必须在较小的dfs (5个不同的dfs,每个50k
观测
值
)中计算这些
变量
。我现在尝试
在
主df
和
5个较小的df上使用left_join或merge函数,以便在每个步骤
中
为50k的观察<em
浏览 26
提问于2019-02-04
得票数 0
1
回答
如何基于2
列
合并
R
上的2个数据帧?
、
、
、
、
我希望基于
R
中
的2
列
合并2个数据帧,这两个数据帧称为popr
和
data
列
,它们共享相同的2个
变量
: USUBJID
和
TRTAG2N,这两个
变量
是我想要组合这两个数据帧的
变量
。没有
值
,只有
列
标题。它说“表
中
没有可用的数据”。我的任务是
在
R
中
复制SAS代码: set pop combined1 ;
浏览 1
提问于2019-07-09
得票数 2
回答已采纳
1
回答
距离匹配循环
1
值
用于治疗观察,0
值
用于非治疗观察。然而,这些290,724
观测
值
在
1
和
933之间存在差异,这是很奇怪的。
变量
neighbor
浏览 6
提问于2020-08-21
得票数 0
回答已采纳
1
回答
如果SAS为first.variable,则进行赋值
我有一个
按
6个
变量
排序的数据集。 我想使用first.variable (
在
我的例子
中
是第六个
变量
)为数据集的一个新
变量
(第七个、第八个
变量
)设置初始
值
。
组
中
的第一
列
具有硬编码的日期
值
'3-20-2017‘。因此,只有一个
组
,第一
列
由所有200K观察
值
组成。问题是,当我执行上面的代码时,我希望得到分配给
观测</
浏览 0
提问于2017-03-28
得票数 1
3
回答
R
和
Python之间cov
和
cor的差异
、
、
我经常使用
R
,我是Python的新手。
在
R
中
,给出了给定矩阵的计算平均值、cov
和
cor的演示如下:X1.0000000 0.7857143我想在Python
中
复制上面的内容,并尝试:
R
# a
浏览 1
提问于2018-11-02
得票数 1
回答已采纳
1
回答
查找
值
的前X百分位
数
,并将该百分位数以下的所有
值
组合到
R
中
的每个
组
中
的其他
行
中
、
、
、
我刚开始使用
R
语言进行编码,我遇到了一些麻烦。我试图
在
每个
组
的某个百分位
数
(X%ile)之上的
列
中找到
值
,然后将该百分位
数
下面的所有
行
合并为每个
组
的
行
--其他
行
。我的情况非常类似于这里的问题: 其中,我将
按
两
列
分组,并试图
在
第二
列
和
第三
列
中
添加
行,这将在第二
浏览 3
提问于2022-06-15
得票数 1
回答已采纳
3
回答
返回只
在
一
组
中发生一次的观察
、
、
我试图通过一个因子
变量
对一个data.frame进行分组,然后返回data.frame的
行
,这些
行
对应于
在
每个
组
中发生一次的
观测
结果。= 2, byrow = F)x # 1 1 3# 3 2 4# 5 2 4 我想
按
第1
列
中
的
值
对数据进行分组,然后返回第2
列
中值
在
<
浏览 3
提问于2016-03-22
得票数 3
2
回答
计算
R
中
若干独立情况下单个情况下两个
观测
值
的差值
、
2, 2, 2, 3, 3, 3)我试图创建一个新的数据框架,其中一
列
是情况(A、B或C),第二
列
是
观测
值
从第一次
观测
到第三次
观测
的变化。行数将是不同的情况
数
(在上面的示例
中
为3
行
,而在实际的数据集中为数百
行
)。 有一些解决办法可以适用于示例数据,但我的实际数据是几百个案例,每一个都
浏览 3
提问于2017-09-16
得票数 2
回答已采纳
1
回答
(从Stata到
R
)数据挖掘
和
变量
创建:计数、列表、排序、egen
、
、
、
、
从Stata到
R
的过渡一直是令人兴奋
和
具有挑战性的,但我
在
R
中
仍在努力的一个领域是数据探索,然后是随后的
变量
创建。具体来说,如何 如果var 2==3 /*计数var2 */上的
值
为3的
观测
数
如果var7 <8 /*lists列出id,/*lists *&
浏览 4
提问于2014-12-18
得票数 0
回答已采纳
3
回答
每组变异,然后取消分组
、
编辑4 20 200 x y z n3 10 101 2 4 20 2
浏览 3
提问于2020-12-11
得票数 0
1
回答
R
中
的ordinalNet包
、
我使用
R
中
的ordinalNet包进行预测。
在
ordinalNet()函数
中
,x必须是一个协
变量
矩阵,y必须是一个因子。如果我把X交换成一个协
变量
矩阵,它将有51
行
和
51
列
。响应
变量
有160 k的
观测
值
,因此它显示了因尺寸不匹配而产生的误差。我对
R</em
浏览 0
提问于2018-03-26
得票数 0
回答已采纳
2
回答
DataFrame
列
中
的随机
值
、
、
、
、
我有一个dataframe (df)
和
一个包含
组
号的
变量
。每个观察都有一个从1到80的
组
数
。我想要创建一个名为new_group的新
变量
,它包含每个观察
值
从1到80之间的新随机
数
。然而,这些新的群
数
必须与原来的群
数
一致,即如果2次
观测
在
第1
组
中
,则两个
观测
都应具有相同的新随机群
数
。I创建了一个包含2
列<
浏览 0
提问于2019-11-04
得票数 1
回答已采纳
2
回答
如何在
R
中
按
区域绘制前5位最频繁
变量
本质上,我想要创建一个图解,它将显示每个区中最常见的5种呼叫类型,并计算每个区
中
每一种呼叫类型的数量。下面的简要介绍了我的数据是如何使用调用类型
和
Borough的 FINAL_CALL_TYPE BOROUGH1974030 INJURY MANHATTAN--这显示了有多少唯一的
值
是FINAL_CALL_TYPE)) + +
浏览 5
提问于2019-11-20
得票数 0
回答已采纳
1
回答
R
矩阵结构-操作问题
、
、
、
、
我正试图解决和在
R
程序上的两个主要问题。主要的问题是,
在
每一对行列
中
,我需要一个时间序列形式的
观测
向量。因为每个不同
变量
中
的时间序列不是
按
顺序采样的,所以不同的时间序列是不规则的。不知道这是不是我需要的最好的结构。正在使
浏览 4
提问于2014-04-29
得票数 1
回答已采纳
1
回答
探索
变量
以指导xgboost调优
、
、
简而言之:在为xgboost选择参数值时,如何考虑
变量
的类型
和
分布?示例:具有二进制结果
变量
和
二进制/连续预测器混合的数据集。结果
变量
(每次观察一个
值
):一
组
名为味道(~150个
变量
)
和
浏览 0
提问于2020-10-09
得票数 4
回答已采纳
1
回答
利用Matlab
中
的概率密度计算相关系数
、
、
mu = [1 2]; X = mvnrnd(mu,SIGMA);
变量
p存储遵循二维法律的向量X的概率密度我必须用概率函数p来计算相关系数,而函数
R
= corrcoef(X)不这样做。
浏览 2
提问于2014-01-02
得票数 1
3
回答
基于目标分布的分类
变量
之间的相关性
、
、
、
我想找到一种方法来组合它们(假设X_1
和
X_3在那里Y分布的频率上非常相似),其中X in (x_1,...,x_n)
和
y in (y_1,...,y_n)找到所有具有类似X分布的D11子
组
的最佳方法是什么?我之所以这么做,是因为我知道我的很多Xs都是一样的,但是有人给他们贴上了不同的标签。
浏览 0
提问于2019-11-27
得票数 1
4
回答
使用字符串选择dplyr (或基
R
)
中
的每行列
、
我有一个
列
充满了其他的列名。我要得到每个列名
中
的
值
。
浏览 0
提问于2016-01-28
得票数 5
回答已采纳
1
回答
未四舍五入的大数据帧
列
[
R
]
、
、
我有一个很大的坐标数据框(phi,
r
,z)。我希望每个phi
值
都四舍五入为最接近的整数。mat.cyl <- as.matrix(df.cyl) round(mat.cyl[,'
浏览 0
提问于2018-10-02
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
R语言笔记10:循环函数apply、tapply、mapply
在Python中进行探索式数据分析
数据清洗——是时候把自己从繁重的体力劳动中解救出来了
如何用R语言进行缺失值填充?
卡方检验—初步了解
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券