DataFrame是一种二维数据结构,类似于表格,由行和列组成。在数据分析和处理中,DataFrame是一种常用的数据结构,可以方便地进行数据的筛选、转换和分析。
从str.contain创建列和分组是指在DataFrame中使用str.contain方法来创建新的列或进行分组操作。str.contain方法用于判断字符串是否包含指定的子字符串,并返回一个布尔值。
创建列: 可以使用str.contain方法在DataFrame中创建新的列,该列的值为原始列中的字符串是否包含指定的子字符串。具体步骤如下:
import pandas as pd
df = pd.DataFrame({'column_name': ['string1', 'string2', 'string3']})
df['new_column'] = df['column_name'].str.contains('substring')
其中,'column_name'为原始列的名称,'substring'为要判断的子字符串,'new_column'为新创建的列的名称。print(df)
分组: 可以使用str.contain方法对DataFrame进行分组操作,将包含指定子字符串的行分为一组。具体步骤如下:
import pandas as pd
df = pd.DataFrame({'column_name': ['string1', 'string2', 'string3']})
grouped = df.groupby(df['column_name'].str.contains('substring'))
其中,'column_name'为要进行分组的列的名称,'substring'为要判断的子字符串。for key, group in grouped: print(key) print(group)
分组结果将按照包含或不包含指定子字符串的结果进行输出。DataFrame从str.contain创建列和分组的应用场景包括但不限于:
腾讯云相关产品和产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云