腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3513)
视频
沙龙
2
回答
在
Python
Pandas
数据
集中
保留
每行
的
随机
最低值
、
、
我有一个
数据
框架,其中每一行都在几个属性上进行排序,而不是所有其他行。单行可以
在
两个属性中具有相同
的
排名(这意味着一行可以是几个属性中最好
的
),如下面的第2行和第3行所示: att_1 att_2 att_3 att_4984 53 1 466471 20 2 3 2 每一行,我希望
保留
索引(ID)和具有
最低值
的
单元格-如果有超过
浏览 14
提问于2019-03-20
得票数 1
回答已采纳
4
回答
在
Python
数据
集中
只
保留
每行
的
最低值
、
在
Pandas
数据
集中
,我只想保持
每行
的
最低值
。所有其他值都应删除。我需要完整
的
原始
数据
集。只需删除不是最小值
的
所有值(用NaN替换)即可。谢谢罗伯特
浏览 2
提问于2014-11-11
得票数 1
回答已采纳
2
回答
pandas
rank函数2列表示高值和低值
、
下面是组成一个包含两列
的
pandas
数据
帧
的
代码,一列名为data,另一列名为hours。data列是从-150到250
的
随机
整数。hours列是从.5到15.5.
的
随机
浮点数。import randomimport
pandas
as pd dfData']) #generate rando
浏览 3
提问于2021-01-08
得票数 0
2
回答
Python
:如何将
数据
采样到测试和培训
数据
集中
?
、
、
我一直
在
使用CSV
数据
来实现我
的
脚本,并希望将
数据
采样到两个
数据
集中
: 我希望
在
85%和15%
的
分区中对
数据
集进行采样,并希望输出两个CSV文件Test.csv和Train.csv我希望
在
基本
Python
中这样做,并且不想使用任何其他外部模块,如Numpy、SciPy、
Pandas
或Scikitlearn。有人
浏览 5
提问于2016-03-15
得票数 3
回答已采纳
1
回答
随机
选择
Python
中不同百分比
的
数据
、
、
、
这里是
Python
初学者。我有一个有101行
的
数据
集,我使用
Pandas
将其导入
Python
(作为csv文件)。实际上,我想要在0到1之间
随机
生成一个数字,并根据结果从
数据
集中
随机
选择等效百分比。因此,例如,
随机
生成
的
0.89个数字将需要选择89%
的
数据
。 我还想说明不同
的
百分比,例如,我有89%、8%和3%
的
随机</
浏览 1
提问于2018-09-18
得票数 1
回答已采纳
1
回答
在
scikit-learn中平均多个
随机
森林模型
、
、
、
我有一个非常大
的
数据
集,我想在
数据
集
的
分区上训练几个
随机
的
森林模型,然后对这些模型进行平均,以得出我
的
最终分类器。由于
随机
森林是一种集成方法,这是一种直观上合理
的
方法,但我不确定是否可以使用scikit-learn
的
随机
森林分类器。有什么想法吗? 我也会开放使用来自另一个包
的
随机
森林分类器,只是不确定去哪里找。
浏览 0
提问于2017-12-23
得票数 1
1
回答
python
:从
数据
集中
删除比较两个直方图
的
记录
、
、
、
我有两个具有不同长度(
每行
都是记录)
的
多列(order 10)
数据
集,它们必须成为相同
的
行数:条件是对多个列(从2到4 )进行绑定,然后删除其中一个
数据
集中
的
超出记录(
在
该垃圾箱中
的
所有记录之间
随机
选择既然我事先知道一个
数据
集比另一个
数据
集小--我(天真地说)--我
的
想法是先计算两个直方图(先小一点),从另一个中减去另一个
在
每个垃圾箱中有差异,遍
浏览 0
提问于2017-02-04
得票数 0
回答已采纳
1
回答
如何准备熊猫
的
纵向
数据
,然后从学习算法中使用?
、
、
我正在使用
Pandas
清理和准备我
的
数据
集,以供学习算法使用,例如用于分类
的
随机
森林或用于聚类
的
K-means。我曾经有过这样
的
数据
集(举例说明):然而,
在
我
的
数据
集中
,我面对
的
是一种不同
的
类型:纵向
数据
,如下图所示:正如您所看到
的
,对于每个单独
的
实例(人员或汽车),同
浏览 3
提问于2015-03-29
得票数 1
1
回答
如何使用
Python
查找基于
数据
集
的
列
的
动态函数
的
根
、
、
、
、
我是
Python
的
初学者,我需要把R中
的
一些代码翻译成
python
。我需要在基于动态函数
的
数据
集中
找到
每行
一个根,R中
的
代码是:library(dplyr) dataset = data.frame(parse(text=as.character(FX),dataset))),lower = -10000, upper = 10000, tol = 0.00001)
浏览 7
提问于2019-11-12
得票数 3
回答已采纳
1
回答
如何在原始索引
的
同时从
数据
帧中采样?
、
、
我有一个
pandas
数据
框架,我想使用.sample(frac=0.1)并创建
数据
集
的
子集。但是,我希望
在
子
集中
保留
原始索引。这个是可能
的
吗?
浏览 13
提问于2021-01-18
得票数 0
1
回答
Pandas
dataframe -将N行从一个
数据
帧移动到另一个
数据
帧
、
、
我有一个用于机器学习
的
训练集和测试集,但是训练集包含
的
数据
行太多,而测试集包含
的
数据
太少。我计算出我需要将245行从训练
集中
移动到测试
集中
,以产生更好
的
拆分。我该怎么做呢?我
在
训练
集中
总共有5116行。首先,我使用下面的代码
随机
化训练集
的
行 train_df = train_df.sample(n = len(train_df)).reset_index(drop=True) 然后
浏览 13
提问于2020-12-24
得票数 0
回答已采纳
2
回答
熊猫
数据
中
的
“
随机
行”
、
、
在
熊猫
数据
中,我如何丢弃
随机
子
集中
的
服从条件
的
行Label A0 31 11 1 121 13 我很想知道一种最简单,也是最像熊猫
的
方法我仍然
浏览 2
提问于2018-06-19
得票数 4
回答已采纳
2
回答
1000个整数GroupBy -出现
、
、
、
我
在
1到100之间创建了100万个
随机
整数&将结果写入一个文本文件。但我希望
在
整个
数据
集中
找到每个整数
的
出现情况。 df = pd.read_csv('RandomN
浏览 1
提问于2018-10-09
得票数 1
回答已采纳
1
回答
使用apply()加速
数据
帧上
的
嵌套循环
、
、
、
我有一个
在
Python
中使用
Pandas
的
dataframe,它包含
每行
上
的
纬度和经度坐标。我
的
目标是添加另一个名为"close_by“
的
列,其中包含使用半正弦计算
数据
集中
1英里以内
的
其他条目的数量。我见过类似问题
的
其他指南,比如:https://engineering.upside.com/a-beginners-guide-to-opti
浏览 23
提问于2019-04-16
得票数 0
1
回答
读取包含单词“.dat”
的
上层文件会导致问题
、
、
这是我用来读入.dat文件
的
代码:import matplotlib.pyplot as plt plt.xlabel('yh_center')plt.savefig('name.pdf')当dat中没有单独
的
单词center upper 0.0000
浏览 1
提问于2018-03-06
得票数 0
1
回答
不正确排序
的
SQLite
随机
()
、
、
、
、
我
的
SQLite查询似乎是从指定
的
"ORDER“子句返回结果。当我运行以下内容时,第三列给出了我想要
的
随机
值,但是它
的
顺序看起来被忽略了。结果集似乎是
随机
排序
的
。-- 4 Jack 023 Bob 3 4 Jack "A9" 2
浏览 0
提问于2014-02-23
得票数 6
回答已采纳
1
回答
使用min()获取最小值或排序数组,然后
在
实现A* (A星)算法中
的
打开集时,
在
Python
中弹出第一个值?
、
、
我正在用
Python
实现A* (星型)算法。
在
该算法中,我们从开放
集中
得到F(n)值最小
的
节点(估计总成本)。我们经常使用PriorityQueue,但出于某些原因,我不明白为什么PriorityQueue没有得到值最低
的
节点。因此,我创建了一个名为"frontier“
的
数组列表(
Python
中
的
常规列表),并将”打开集“
保留
在那里。 有两
浏览 3
提问于2020-11-14
得票数 3
回答已采纳
1
回答
pandas
.errors.ParserError:应为第3行中
的
5个字段,实际为6
、
、
我正在尝试使用
pandas
读取
数据
文件, import
pandas
as pddf = pd.read_csvcall last): File "/usr/local/lib/
python
3.
浏览 34
提问于2021-10-11
得票数 0
2
回答
随机
丢弃重复
、
在
Pandas
中,我们可以使用dataframe.drop_duplicates()删除重复
数据
,默认情况下
保留
重复
数据
的
第一行。如果是keep_last = True,则
保留
最后一行。我们如何保持
随机
行,并使用熊猫drop_duplicate删除重复行?
浏览 3
提问于2014-04-04
得票数 5
回答已采纳
1
回答
基于重复值
的
列值替换
、
、
在
我
的
数据
集中
,我有OrderID列和OrderTotal列。我有重复
的
OrderIDs,我不想删除重复项,相反,我希望用OrderID
的
第一个实例
保留
order总计
的
值,并在有其他重复
的
OrderID时将OrderTotal
的
值替换为0。以下是我所做
的
:df['OrderTo
浏览 0
提问于2020-06-27
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python爬虫在大规模数据收集中的重要作用
数据分享|Python在Scikit-Learn可视化随机森林中的决策树分析房价数据
这样做能让你的 pandas 循环加快 71803 倍
python一两行代码完成的骚操作
用python读取Excel并保存字典?一两行代码完成骚操作
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券