我想从队列(如redis)中将数据追加到published dask dataset
上。然后,其他python程序将能够获取最新的数据(例如每秒一次)并执行一些进一步的操作。
pd.DataFrame
中,还是最好使用某些文本导入程序?谢谢你的建议和建议。
发布于 2020-08-08 01:04:09
你有几个选择。
假设附加的速度是多少?是否可以在一秒钟内追加1k/10k行?
达斯克只是在跟踪远程数据。应用程序的速度更多地取决于您选择如何表示数据(比如python列表和熊猫数据),而不是Dask。达斯克一秒钟就能处理数千项任务。这些任务中的每一个都可以有一行或数以百万计的行。这取决于你如何建造它。
https://stackoverflow.com/questions/63156650
复制相似问题