重复值的处理
利用drop_duplicates()函数删除数据表中重复多余的记录, 比如删除重复多余的ID.
1 import pandas as pd
2 df = pd.DataFrame({"ID...查看数据类型
查看所有列的数据类型使用dtypes, 查看单列使用dtype, 具体用法如下:
1 import pandas as pd
2 df = pd.DataFrame({"ID": [100000,100101,100201...修改数据类型
使用astype()函数对数据类型进行修改, 用法如下
1 import pandas as pd
2 df = pd.DataFrame({"ID": [100000,100101,100201...字段的拆分
使用split()函数进行字段的拆分, split(pat=None, n = -1, expand=True)函数包含三个参数:
第一个参数则是分隔的字符串, 默认是以空格分隔
第二个参数则是分隔符使用的次数...12.记录的合并
使用concat()函数可以将两个或者多个数据表的记录合并一起, 用法: pandas.concat([df1, df2, df3.....])
1 import pandas as