首先,我们先导包并设置Pandas显示参数:
import pandas as pd
pd.set_option("display.max_colwidth", 100)
正则提取并分列
需求:
?...+表示连续的数字或.用于匹配时间字符串,两个时间之间的连接字符可能是到或至。...droplevel(0, axis=1)用于删除多级索引指定的级别,axis=0可以删除行索引,axis=1则可以删除列索引,第一参数表示删除级别0。...当然如果列索引存在名称时还可以传入名称字符串,可参考官网文档:
df = pd.DataFrame([
... [1, 2, 3, 4],
... [5, 6, 7, 8],
......而result["counts"] = df.counts则将原始数据的counts列添加到结果列中。