这个项目从基础到进阶,可以检验你有多么了解 pandas。
我会挑选一些题目,并且提供比原题库更多的解决方法以及更详尽的解析。
计划每天更新一期,希望各位小伙伴先自行思考,再查看答案。...一个订单会包含很多明细项,表中每个样本(每一行)表示一个明细项
order_id 列存在重复
item_name 是明细项物品名
前面章节讲解过的知识点,本文不再讲解!...reindex 可以重复多行数据:
df.reindex([0,0,1,1,2,2,3,3])
reindex 中指定的是行索引列表
怎么知道每个订单需要拆分的行数:
dfx = df.assign...)
输出:
Int64Index([0, 0, 0, 0, 1, 1, 2, 3, 3, 3], dtype='int64')
行2:此时 item_name 列不是文本类型,但是因为 列表对象 也可以使用...(idx)
dfx['item_name'] = names
dfx
这就能得到与直接使用 explode 一样的结果
总结:
itertools.chain 展开 list 中 list
numpy.repeat