文章/答案/技术大牛

发布

社区首页 >问答首页 >使用pandas加载过滤后的.tda文件最简单的方法是什么？

问使用pandas加载过滤后的.tda文件最简单的方法是什么？
EN

Stack Overflow用户

提问于 2013-02-26 19:39:20

回答 1查看 216关注 0票数 2

Pandas有很好的.read_table()功能，但是文件太大会导致MemoryError。

因为我只需要加载满足特定条件的行，所以我正在寻找一种只加载这些行的方法。

这可以使用临时文件来完成：

with open(hugeTdaFile) as huge:
    with open(hugeTdaFile + ".partial.tmp", "w") as tmp:
        tmp.write(huge.readline())  # the header line
        for line in huge:
            if SomeCondition(line):
                tmp.write(line)

t = pandas.read_table(tmp.name)

有没有办法避免这种使用临时文件的情况？

large-files

python

pandas

回答 1

Stack Overflow用户

发布于 2013-02-27 00:18:51

可以使用chunksize参数返回迭代器

看看这个：http://pandas.pydata.org/pandas-docs/stable/io.html#iterating-through-files-chunk-by-chunk

过滤区块帧所需的方式将过滤后的帧追加到列表中，并在末尾连接

(或者，您可以将它们写到新的csvs或HDFStores或其他任何位置)

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/15088190

复制

相似问题

问使用pandas加载过滤后的.tda文件最简单的方法是什么？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用pandas加载过滤后的.tda文件最简单的方法是什么？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用pandas加载过滤后的.tda文件最简单的方法是什么？
EN