首页
学习
活动
专区
圈层
工具
发布

从DataFrame中删除列

在操作数据的时候,DataFrame对象中删除一个或多个列是常见的操作,并且实现方法较多,然而这中间有很多细节值得关注。...如果这些对你来说都不是很清楚,建议参阅《跟老齐学Python:数据分析》中对此的详细说明。 另外的方法 除了上面演示的方法之外,还有别的方法可以删除列。...我们知道,如果用类似df.b这样访问属性的形式,也能得到DataFrame对象的列,虽然这种方法我不是很提倡使用,但很多数据科学的民工都这么干。...为此,可以定义一个简单的类,这里暂用dict作为保存数据的容器,当然,这个类不是真正的DataFrame。...当然,并不是说DataFrame对象的类就是上面那样的,而是用上面的方式简要说明了一下原因。 所以,在Pandas中要删除DataFrame的列,最好是用对象的drop方法。

13K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    python DataFrame数据生成

    index也有列索引columns,创建DataFrame的基本方法为df = pd.DataFrame(data, index=index,columns=columns),其中data参数的数据类型可以支持由列表...、结束时间end、时期数量periods、日期间隔频率freq='M’月、'D’天、‘W’、周、'Y’年等等,此处生成从2010-01-01开始的1000个日期的时间序列,如下所示: import pandas...’numpy.ndarray’,属于data参数支持的数据类型,于是我们将data、 index和columns三个参数传入创建DataFrame的方法中,就可以生成DataFrame格式的股票交易数据...({'close': stock_data, 'price range': pct_change}, index=dd) print(f'股价交易数据:\n {df_stock.head()}')#打印前...以上就是Pandas的核心—DataFrame数据结构的生成讲解。

    2.4K20

    Pandas DataFrame 数据合并、连接

    merge 通过键拼接列 pandas提供了一个类似于关系数据库的连接(join)操作的方法merage,可以根据一个或多个键将不同DataFrame中的行连接起来 语法如下: merge(left...在此典型情况下,结果集的行数并没有增加,列数则为两个元数据的列数和减去连接键的数量。...必须存在右右两个DataFrame对象中,如果没有指定且其他参数也未指定则以两个DataFrame的列名交集做为连接键 left_on:左则DataFrame中用作连接键的列名;这个参数中左右列名不相同...sort:默认为True,将合并的数据进行排序。...True,总是将数据复制到数据结构中;大多数情况下设置为False可以提高性能 indicator:在 0.17.0中还增加了一个显示合并数据中来源情况;如只来自己于左边(left_only)、两者(

    4.5K50

    量化分析入门——从聚宽获取财务数据Pandas Dataframe

    两大数据结构 DataFrame——带标签的,大小可变的,二维异构表格 Series——带标签的一维同构数组 重点说下DataFrame,它是Pandas中的一个表格型的数据结构,包含有一组有序的列...获取财务数据Dataframe 聚宽是国内不错的量化交易云平台,目前可以通过申请获得本地数据的使用权。授权之后,就可以通过其提供的SDK获取到你想要的数据。...在这里,将通过一个获取上市公司财务数据的例子来展示DataFrame的使用。...NaN 0.0 describe查看简单统计 DataFrame还提供一个叫做describe()的方法可以快速查看数据的统计摘要,比如这里查看这几家公司的统计摘要。...stock_dataframe.High.rolling(window=30).max() Series 前面也说到了Series是同构的一维数据,其实在这里也就是DataFrame中的某一列,比如ci_parent_company_owners

    2.6K40

    Pandas数据结构之DataFrame

    DataFrame 用 Series 创建 DataFrame 备选构建器 DataFrame 是由多种类型的列构成的二维标签数据结构,类似于 Excel 、SQL 表,或 Series 对象构成的字典...传递了索引或列,就可以确保生成的 DataFrame 里包含索引或列。Series 字典加上指定索引时,会丢弃与传递的索引不匹配的所有数据。 没有传递轴标签时,按常规依据输入数据进行构建。...缺失数据 更多内容,详见缺失数据 。DataFrame 里的缺失值用 np.nan 表示。DataFrame 构建器以 numpy.MaskedArray 为参数时 ,被屏蔽的条目为缺失数据。...DataFrame.from_records 构建器支持元组列表或结构数据类型(dtype)的多维数组。...本构建器与 DataFrame 构建器类似,只不过生成的 DataFrame 索引是结构数据类型指定的字段。

    2K10

    Pandas DataFrame 数据存储格式比较

    Pandas 支持多种存储格式,在本文中将对不同类型存储格式下的Pandas Dataframe的读取速度、写入速度和大小的进行测试对比。...推荐阅读:详解 16 个 Pandas 读与写函数 创建测试Dataframe 首先创建一个包含不同类型数据的测试Pandas Dataframe。...总结 从结果来看,我们应该使用ORC或Feather,而不再使用CSV ?是吗? “这取决于你的系统。” 如果你正在做一些单独的项目,那么使用最快或最小的格式肯定是有意义的。...未压缩的CSV可能很慢,而且最大,但是当需要将数据发送到另一个系统时,它非常容易。...ORC作为传统的大数据处理格式(来自Hive)对于速度的和大小的优化是做的最好的,Parquet比ORC更大、更慢,但是它却是在速度和大小中取得了最佳的平衡,并且支持他的生态也多,所以在需要处理大文件的时候可以优先选择

    84730

    Pandas DataFrame 数据存储格式比较

    Pandas 支持多种存储格式,在本文中将对不同类型存储格式下的Pandas Dataframe的读取速度、写入速度和大小的进行测试对比。...创建测试Dataframe 首先创建一个包含不同类型数据的测试Pandas Dataframe。...但压缩写入速度是最慢的 Feather 最快的读写速度,文件的大小也是中等,非常的平均 ORC 所有格式中最小的 读写速度非常快,几乎是最快的 Parquet 总的来说,快速并且非常小,但是并不是最快也不是最小的 总结 从结果来看...未压缩的CSV可能很慢,而且最大,但是当需要将数据发送到另一个系统时,它非常容易。...ORC作为传统的大数据处理格式(来自Hive)对于速度的和大小的优化是做的最好的,Parquet比ORC更大、更慢,但是它却是在速度和大小中取得了最佳的平衡,并且支持他的生态也多,所以在需要处理大文件的时候可以优先选择

    1.2K20
    领券