我正在做一些网络抓取和使用内置的熊猫read_html功能。我的一个专栏有一串字符串,格式为" 0E10“、"0E25”、"0E8“等等。熊猫太聪明了,并且认识到0e10是0.0的科学符号。
有方法禁用此功能吗?
如果可能的话,我仍然希望它能够智能地将其他列转换为类型(我有另外两个列是浮动的,并且应该在输出df中浮动)。
发布于 2019-09-19 19:37:23
回答我自己的问题。如果有人有一个更漂亮的解决方案(一条线?),请分享。
read_html
有一个转换器参数!
df = pd.read_html(url, converters = {'ColName': str})
效果很好。
希望这对那些花了好几个小时试图弄明白为什么熊猫把字符串转换成0.0的人有用!
https://stackoverflow.com/questions/58017677
复制相似问题