首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >使用pandas加载过滤后的.tda文件最简单的方法是什么?

使用pandas加载过滤后的.tda文件最简单的方法是什么?
EN

Stack Overflow用户
提问于 2013-02-26 19:39:20
回答 1查看 216关注 0票数 2

Pandas有很好的.read_table()功能,但是文件太大会导致MemoryError。

因为我只需要加载满足特定条件的行,所以我正在寻找一种只加载这些行的方法。

这可以使用临时文件来完成:

代码语言:javascript
运行
复制
with open(hugeTdaFile) as huge:
    with open(hugeTdaFile + ".partial.tmp", "w") as tmp:
        tmp.write(huge.readline())  # the header line
        for line in huge:
            if SomeCondition(line):
                tmp.write(line)

t = pandas.read_table(tmp.name)

有没有办法避免这种使用临时文件的情况?

EN

回答 1

Stack Overflow用户

发布于 2013-02-27 00:18:51

可以使用chunksize参数返回迭代器

看看这个:http://pandas.pydata.org/pandas-docs/stable/io.html#iterating-through-files-chunk-by-chunk

  • 过滤区块帧所需的方式将过滤后的帧追加到列表中,并在末尾连接

(或者,您可以将它们写到新的csvs或HDFStores或其他任何位置)

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15088190

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档