在Pandas中对以数字开头的列运行查询(Python 3)

在Pandas中，对以数字开头的列运行查询可以使用filter()函数。该函数允许使用正则表达式来匹配列名，以选择需要的列。

首先，我们需要导入pandas库并创建一个DataFrame对象：

import pandas as pd

data = {'1st Column': [1, 2, 3],
        '2nd Column': [4, 5, 6],
        '3rd Column': [7, 8, 9]}

df = pd.DataFrame(data)

接下来，我们可以使用filter()函数来选择以数字开头的列。以下是一个示例：

filtered_df = df.filter(regex='^\d')

print(filtered_df)

输出结果将只包含以数字开头的列：

   1st Column  2nd Column
0           1           4
1           2           5
2           3           6

在这个例子中，filter()函数的regex参数使用了正则表达式'^\d'来匹配以数字开头的列名。^表示匹配字符串的开头，\d表示匹配任意一个数字。

Pandas中的filter()函数非常灵活，可以使用不同的正则表达式模式来选择不同类型的列。这使得我们可以根据需要对列进行高级查询和筛选。

推荐的腾讯云产品：腾讯云云服务器（https://cloud.tencent.com/product/cvm）

相关·内容

Python 3深度置信网络(DBN)在Tensorflow中的实现MNIST手写数字识别

深度置信网络深度置信网络可以通过额外的预训练规程解决局部最小值的问题。预训练在反向传播之前做完，这样可以使错误率离最优的解不是那么远，也就是我们在最优解的附近。再通过反向传播慢慢地降低错误率。...构建RBM层 RBM的细节参考【https://blog.csdn.net/sinat_28371057/article/details/115795086】为了在Tensorflow中应用DBN...在这个例子中，我们使用了3个RBM，一个的隐藏层单元个数为500，第二个RBM的隐藏层个数为200，最后一个为50. 我们想要生成训练数据的深层次表示形式。...5.训练RBM 我们将使用***rbm.train()***开始预训练步骤, 单独训练堆中的每一个RBM，并将当前RBM的输出作为下一个RBM的输入。...特别地，我们使用这个浅层神经网络的最后一层的输出对数字分类。 6. 神经网络下面的类使用了上面预训练好的RBMs实现神经网络。

2.1K0 0

如何用 Python 执行常见的 Excel 和 SQL 任务

有关数据结构，如列表和词典，如何在 Python 中的运行的更多信息，本教程将有所帮助。...这不是很好，由于实际的数字顺序被破坏，这使得 Rank 列无用，特别是使用 Pandas 默认提供的编号索引。幸运的是，使用内置的 Python 方法：del，删除列变得很容易。 ?...在 SQL 中，这是通过混合使用 SELECT 和不同的其他函数实现的，而在 Excel 中，可以通过拖放数据和执行过滤器来实现。你可以使用 Pandas 库不同的方法或查询快速过滤。...有12个国家的 GDP 超过 50000！选择属于以 s 开头的国家的行。现在可以显示一个新 dataframe，其中只包含以 s 开头的国家。...现在过滤以「S」开头或人均 GDP 超过 50000 的国家。 ? ? 我们正在努力处理 Pandas 中的过滤视图。

10.8K6 0

用Python执行SQL、Excel常见任务？10个方法全搞定！

有关数据结构，如列表和词典，如何在 Python 中的运行的更多信息，本篇将有所帮助。...这不是很好，由于实际的数字顺序被破坏，这使得 Rank 列无用，特别是使用 Pandas 默认提供的编号索引。幸运的是，使用内置的 Python 方法：del，删除列变得很容易。 ?...在 SQL 中，这是通过混合使用 SELECT 和不同的其他函数实现的，而在 Excel 中，可以通过拖放数据和执行过滤器来实现。你可以使用 Pandas 库不同的方法或查询快速过滤。...有12个国家的 GDP 超过 50000！选择属于以 s 开头的国家的行。现在可以显示一个新 dataframe，其中只包含以 s 开头的国家。...现在过滤以「S」开头或人均 GDP 超过 50000 的国家。 ? ? 我们正在努力处理 Pandas 中的过滤视图。

8.3K2 0

统计师的Python日记【第九天：正则表达式】

第2天：再接着介绍一下Python呗【第3天：Numpy你好】【第4天：欢迎光临Pandas】【第四天的补充】【第5天：Pandas，露两手】【第6天：数据合并】【第七天：数据清洗（1）】...用正则表达式处理Pandas数据（1）匹配行（2）提取匹配文字（3）提取匹配文字的一部分 ---- 统计师的Python日记【第9天：正则表达式】前言根据我的Python学习计划： Numpy...在之前的【SAS正则表达式】系列中（在后台回复【sasre】查看），我用正则表达式做文本处理做的非常之爽，比如下面这列数据： (01)1872-8756 Body shop P1 Book B13 (...（2）函数在SAS中，PRXPARSE()是获取一个正则表达式的pattern，在Python中对应的就是 compile() 。...正则表达式是文本分析的利器，在爬虫中用处也非常大。但本文中，我要挑战的是对DataFrame结构数据进行正则表达式的处理。

1.8K4 0

利用query()与eval()优化pandas代码

简介利用pandas进行数据分析的过程，不仅仅是计算出结果那么简单，很多初学者喜欢在计算过程中创建一堆命名「随心所欲」的中间变量，一方面使得代码读起来费劲，另一方面越多的不必要的中间变量意味着越高的内存占用...本文就将带大家学习如何在pandas中化繁为简，利用query()和eval()来实现高效简洁的数据查询与运算。...图1 2 基于query()的高效查询 query()顾名思义，是pandas中专门执行数据查询的API，其实早在2014年，pandas0.13版本中这个特性就已经出现了，随着后续众多版本的迭代更新，...，其中对字段名的命名规范有一定要求：当字段名符合Python中对变量命名规范的要求时，即变量名完全由「字母」、「数字」、「下划线」构成且不以「数字」开头，这样的字段是可以直接写入query()表达式的。...，我可以在很多数据分析场景中实现0中间变量，一直链式下去，延续上面的例子，当我们新增了这两列数据之后，接下来我们按顺序进行按月统计影片数量、字段重命名、新增当月数量在全部记录排名字段、排序，其中关键的是

1.5K3 0

（数据科学学习手札92）利用query()与eval()优化pandas代码

本文就将带大家学习如何在pandas中化繁为简，利用query()和eval()来实现高效简洁的数据查询与运算。 ?...图1 2 基于query()的高效查询 query()顾名思义，是pandas中专门执行数据查询的API，其实早在2014年，pandas0.13版本中这个特性就已经出现了，随着后续众多版本的迭代更新...，其中对字段名的命名规范有一定要求：当字段名符合Python中对变量命名规范的要求时，即变量名完全由字母、数字、下划线构成且不以数字开头，这样的字段是可以直接写入query()表达式的。　　...图12 3 基于eval()的高效运算　　而eval()类似Python的eval()函数，可以将字符串形式的命令直接解析并执行。　　...，我可以在很多数据分析场景中实现0中间变量，一直链式下去，延续上面的例子，当我们新增了这两列数据之后，接下来我们按顺序进行按月统计影片数量、字段重命名、新增当月数量在全部记录排名字段、排序，其中关键的是新增当月数量在全部记录排名字段

1.7K2 0

14个pandas神操作，手把手教你写代码

在Python语言应用生态中，数据科学领域近年来十分热门。作为数据科学中一个非常基础的库，Pandas受到了广泛关注。Pandas可以将现实中来源多样的数据进行灵活处理和分析。...01 Pandas是什么很多初学者可能有这样一个疑问：“我想学的是Python数据分析，为什么经常会被引导到Pandas上去？”虽然这两个东西都是以P开头的，但它们并不是同一个层面的东西。...Python是一门解释型语言，语法优雅贴近人类自然语言，符合人类的认知习惯。 Python支持跨平台，能够运行在所有的常见操作系统上。...Pandas简介 Pandas是使用Python语言开发的用于数据处理和数据分析的第三方库。它擅长处理数字型数据和时间序列数据，当然文本型的数据也能轻松处理。...Python中的库、框架、包意义基本相同，都是别人造好的轮子，我们可以直接使用，以减少重复的逻辑代码。正是由于有众多覆盖各个领域的框架，我们使用起Python来才能简单高效，而不用关注技术实现细节。

3.4K2 0

数据可视化：认识Pandas

Pandas数据结构 Series 在Pandas中，最常用的就是数据结构就是Series和DataFrame。Series是带标签的一维数组，可以储存的数字、字符串等常见对象。...[3, '电影名称']) # 获取index是2 ,第2列的内容 print(df.iat[2, 1]) #代码运行结果：无间道無間道 2009 在选择或者查询数据的时候，肯定会带又一些条件，这时候我们可以直接选择某一个列...内连接得到两个对象中都有的数据，对象A中a列和对象B中的a列都有1。左连接以对象A的a列为准，对象B中a列中没有的值，则取空。右连接则以对象B的a列为准。外连接则查询出全部的数据。...同样除了连接操作还有聚合操作，与SQL中的使用groupby对列进行聚合操作一样。...可以直观的看出，count()按照a列的值计数，值为1的有2个，值为2，3的有1个。Sum()操作在实际应用场景中通过会用于按照月份或者年度统计销售额等等。

2811 0

盘一盘 Python 系列特别篇 - Jupyter Notebook

第 6-12 行用 - 符号来创建非数字型要点。第 16-19 行用 1,2,3 来创建数字型要点。最终效果 ? 1.2 公式标记语言 ?...2 Code 类操作 2.1 Python 代码以检查系统和 Python 常用包的版本为例。...如果记得前两个字母，L.co + ，这时可看到所有以 c 开头的方法，有 copy 和 count。...ValueError WindowsError ZeroDivisionError 再比如你想查询 str 中以 r 开头的所有方法，用 r*。 str.r*?...在 Code Cell 中可用 Python 编程，还可以执行 Shell 命令和 Magic 命令，还可以玩一下用下划线 _ 和 In/Out 的骚操作。

9381 0

pandas每天一题-题目13：文本筛选

6642 0

统计师的Python日记【第十天：数据聚合】

第2天：再接着介绍一下Python呗【第3天：Numpy你好】【第4天：欢迎光临Pandas】【第四天的补充】【第5天：Pandas，露两手】【第6天：数据合并】【第七天：数据清洗（1）】...学过SQL的人知道，典型的SQL查询语句应该是： select mean(salary) from family group by fam 从数据family这份数据中，找出每个fam group下的mean...这里的列名还可以改，比如不想用max2这个列名，想用2*max，在自定义函数的时候因为不能以数字开头所以只能写成max2，那么这里可以用(‘2*max’, max2)来改名字： family.groupby...数据透视表在第5天的日记中，提到过“数据透视表”（第5天：Pandas，露两手）： ?...（1）pivot_table()方法比如，以fam这个列变量维度进行透视： family.pivot_table(columns='fam') ? 以fam、gender这两个维度进行透视： ?

2.8K8 0

干货 | 利用Python操作mysql数据库

作者 | Tao 来源 | 知乎 ---- 本文主要讲解如何利用python中的pymysql库来对mysql数据库进行操作。...中用来在数据库中执行指定的SQL语句查询或对指定的整张表进行查询,以DataFrame 的类型返回查询结果....coerce_float:将数字形字符串转为float parse_dates:将某列日期型字符串转换为datetime型数据 columns:选择想要保留的列 chunksize：每次输出多少行数据...至此一次简单地利用pandas中read_sql方法从数据库获取数据就完成了 2 PyMySQL PyMySQL 是在 Python3.x 版本中用于连接 MySQL 服务器的一个库，可以方便的连接数据库并操作数据库...可以把游标当作一个指针，它可以指定结果中的任何位置，然后允许用户对指定位置的数据进行处理，通俗来说就是，操作数据和获取数据库结果都要通过游标来操作。如果不获取游标，我们就没法获得查询出来的数据。

2.9K2 0

整理了25个Pandas实用技巧（上）

本文一共为大家分享25个pandas技巧，分为两篇分享给大家。显示已安装的版本输入下面的命令查询pandas版本： In [7]:pd....更改列名让我们来看一下刚才我们创建的示例DataFrame: ? 我更喜欢在选取pandas列的时候使用点（.），但是这对那么列名中含有空格的列不会生效。让我们来修复这个问题。...这些数字实际上储存为字符型，导致其数据类型为object: ? 为了对这些列进行数学运算，我们需要将数据类型转换成数值型。你可以对前两列使用astype()函数： ?...你可以给glob()函数传递某种模式，包括未知字符，这样它会返回符合该某事的文件列表。在这种方式下，glob会查找所有以stocks开头的CSV文件： ?...glob会返回任意排序的文件名，这就是我们为什么要用Python内置的sorted()函数来对列表进行排序。

2.2K2 0

快速提升效率的6个pandas使用小技巧

Python大数据分析记录分享成长文章来源：towardsdatascience 作者：B.Chen 翻译\编辑：Python大数据分析 pandas是python中常用的数据分析库...() 这功能对经常在excel和python中切换的分析师来说简直是福音，excel中的数据能一键转化为pandas可读格式。...值得注意的是，price列都是数字，sales列有数字，但空值用-代替了。...这里使用内置的glob模块，来获取文件路径，简洁且更有效率。在上图中，glob()在指定目录中查找所有以“ data_row_”开头的CSV文件。...glob()以任意顺序返回文件名，这就是为什么使用sort()函数对列表进行排序的原因。

3.3K1 0

【强强联合】在Power BI 中使用Python（2）

脚本编辑器中自带一句话： # 'dataset' 保留此脚本的输入数据一行以“#”开头的语句，在Python的规范中表示注释，所以这句话并不会运行，它的意思是将你要进行修改的表用dataset来表示，...理论上我们需要在这个地方键入： import pandas as pd 以表示我们要使用pandas库，但是Power BI在调用Python时，自动导入了pandas和matplotlib库，所以这一行写不写都一样...再比如，我们想提取数据的某列，比如上面这张表的“key2”列，我们可以点击运行Python脚本，并写入如下的代码： ?...在IDE中运行无误后复制到powerquery的Python脚本编辑器中： ? 点击确定，返回结果： ? 后面两列就是我们想要的手机号和邮箱了。...感谢您对【学谦数据运营】公众号的关注，支持与厚爱，如果您觉得本文对您有用，请不要吝惜您的点赞、转发、点亮在看，有任何问题欢迎大家在留言区留言，谢谢。

3.3K3 1

6个提升效率的pandas小技巧

文章来源：towardsdatascience 作者：B.Chen 翻译\编辑：Python大数据分析 pandas是python中常用的数据分析库，出现频率非常高，而且pandas功能之多让人咋舌...然后在python中执行pd.read_clipboard()，就能得到一模一样的dataframe数据表： pd.read_clipboard() ?...这功能对经常在excel和python中切换的分析师来说简直是福音，excel中的数据能一键转化为pandas可读格式。 2....这里使用内置的glob模块，来获取文件路径，简洁且更有效率。 ? 在上图中，glob()在指定目录中查找所有以“ data_row_”开头的CSV文件。...glob()以任意顺序返回文件名，这就是为什么使用sort()函数对列表进行排序的原因。

2.9K2 0

python数据科学系列：pandas入门详细教程

切片形式访问时按行进行查询，又区分数字切片和标签切片两种情况：当输入数字索引切片时，类似于普通列表切片；当输入标签切片时，执行范围查询（即无需切片首末值存在于标签列中），包含两端标签结果，无匹配行时返回为空...query，按列对dataframe执行条件查询，一般可用常规的条件查询替代 ?...是在numpy的基础上实现的，所以numpy的常用数值计算操作在pandas中也适用：通函数ufunc，即可以像操作标量一样对series或dataframe中的所有元素执行同一操作，这与numpy...3 数据转换前文提到，在处理特定值时可用replace对每个元素执行相同的操作，然而replace一般仅能用于简单的替换操作，所以pandas还提供了更为强大的数据转换方法 map，适用于series...例如，以某列取值为重整后行标签，以另一列取值作为重整后的列标签，以其他列取值作为填充value，即实现了数据表的行列重整。

15K2 0

玩转数据处理120题｜Pandas版本

Python解法 df.columns = ['col1','col2','col3'] 89 数据提取题目：提取第一列中不在第二列出现的数字难度：⭐⭐⭐ Python解法 df['col1'][~...(df['col2']) temp.value_counts()[:3] 91 数据提取题目：提取第一列中可以整除5的数字位置难度：⭐⭐⭐ Python解法 np.argwhere(df['col1...,clo3三列顺序颠倒难度：⭐⭐ Python解法 df.iloc[:, ::-1] 94 数据提取题目：提取第一列位置在1,10,15的数字难度：⭐⭐ Python解法 df['col1'].take...题目：提取industryField列以'数据'开头的行难度：⭐⭐ Python解法 df[df['industryField'].str.startswith('数据')] 117 数据计算题目...，并且在之后的数据分析中碰到相关问题，希望武装了Pandas的你能够从容的解决！

7.6K4 1

Pandas 秘籍：1~5

37.6K1 0

Python数据科学（七）- 资料清理(Ⅱ)1.资料转换2.处理时间格式资料3.重塑资料4.学习正则表达式5.实例处理

# 以列进行计算 df.apply(lambda e: e.max() - e.min()) ?...：表示前面匹配的字符出现了0次或者1次 r =”\d+”：表示前面匹配的字符出现了1次或者多次 #范围匹配分组匹配方式：将多个匹配字符当成一个完整的匹配公式 (abc)：用于在目标字符串中查询abc...同时出现的地方选择匹配方式：将指定的多个字符，选择其中一个进行匹配 [abc]：用于在目标字符串中，查询a或者b或者c出现的地方 [0-9]：用于匹配一个0~9之间的数字->等价于\d [a-z]：...#正则表达式在python中的使用正则表达式，在python中，主要用到了一个re模块 compile()：编译正则表达式 pattern = re.compile(“^\d{2,}$”) pattern...从指定的字符串中直接进行查询，查询到的第一个结果作为匹配结果 pattern.findall(str)：从指定的字符串中，查询符合匹配规则的字符，将所有符合的字符存放在一个列表中 pattern.finditer

1.1K3 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云