九層之台,起於累土。---《老子》
下面是开发过程中杂七杂八的笔记,就像零零散散的小螺丝,暂时丢在工具箱的小角落,备用。
对pandas层级的粗劣理解:
pandas—(主要对象)→DataFrame—(某列)→Series—(元素)→numpy中的各数据类型
把某列转为date
read_csv时用 parse_dates=True, or parse_dates=[‘column name’]自动把列转为日期,
自定义datetime格式。
定义多个列合并成一个datetime列
read_csv读取数据 默认类型为数值,修改为对象后就可以读取000001
resample时间序列,index要是datetime-like,比如(DatetimeIndex, PeriodIndex, or TimedeltaIndex)
第一个参数表示resample的规则,有如下规则可选:
获取dataFrame奇偶列
jupyter notebook 的magic command ,在cell开头加%%time,最后output整个cell执行时长。
timeit 模块会运行语句100,000 times (by default),然后取运行最快的前三次的平均值。
beautifulSoup 获取多个tags
领取专属 10元无门槛券
私享最新 技术干货