今
日
鸡
汤
早岁那知世事艰,中原北望气如山。
大家好,我是Python进阶者。
一、前言
前几天在Python最强王者交流群【金光灿灿】问了一个Pandas处理字符串数据的问题。问题如下:亲们问个问题:现在有1列数据,约42w行,字段名为PatientID,字段内长度不一,经统计共有下列5种,示例如下,问,我该如何精确的提取到其中的年度信息。
二、实现过程
方法一
这里【吴超建】给了一个思路:086028000A 替换成'',截取前 4 位即是年份。代码如下所示:
方法二
后来【FiNε_】也给了一个思路:不用定义 一行代码能否搞定。答案是肯定的,代码如下所示:
方法三
【猫药师Kelly】看完数据之后,也给了一个思路:按照字母split一下,取前4位就是年份了。代码如下所示:
方法四
【瑜亮老师】这里还提出了正则表达式的解决办法,如下所示:
代码写完后如下所示:
思路一下子就打开了,4种方法,任君挑选!
领取专属 10元无门槛券
私享最新 技术干货