腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
3
回答
使用
C#
读取
数百万
个
小文件
、
、
、
、
我有
数百万
个
日志文件,每天都会生成,我需要
读取
所有这些文件,并将它们放在一起作为单个文件,以便在其他应用程序中对其进行一些处理。 我正在寻找最快的方法来做这件事。目前我正在
使用
线程、任务和并行,如下所示: Parallel.For(0, files.Length, new ParallelOptions { MaxDegreeOfParallelism = 100ReadFiles(file)).Start(); // Task.Run(()
浏览 60
提问于2019-09-29
得票数 2
回答已采纳
1
回答
读取
数百万
个
小文件
并
使用
Nodejs插入mysql
、
、
、
我尝试过许多方法,但是找不到一种高效的、高效的方法来打开文件夹中的
数百万
个
文件,并将其内容插入到带有nodejs的数据库中。有洞察力吗?
浏览 4
提问于2019-11-20
得票数 0
回答已采纳
3
回答
Python:只保留最后n
个
插入键的字典
、
、
我计划从磁盘上
读取
数百万
个
小文件
。为了最小化i/o,我计划
使用
一
个
字典将文件路径映射到其内容。不过,我只希望字典保留插入其中的最后n
个
键(因此字典将充当缓存)。
浏览 1
提问于2018-06-30
得票数 5
回答已采纳
1
回答
访问多个小.npy文件的python与一
个
大型.npy文件之间的性能差别是什么?
、
、
、
我目前正在开发一
个
存储库,其中包含
数百万
个
小型.npy、numpy或.png图像文件。代码
读取
和写入这些多个
小文件
。它看起来非常慢,我想知道如果我将所有较小的.npy文件合并成一
个
更大的文件,代码会运行得更快吗?如果是的话,原因是什么?它与磁盘I/O有关吗?
浏览 1
提问于2022-07-15
得票数 0
回答已采纳
2
回答
从S3桶中用PySpark
读取
数百万
个
小JSON文件非常慢
、
、
、
、
我在s3中有一
个
文件夹(path = mnt/data/*. json ),其中包含
数百万
个
json文件(每个文件小于10 KB)。星星之火通过一
个
任务为此创建一
个
作业。任务似乎没有运行它的执行程序,这通常意味着作业的完成(对吗?),但是由于某种原因,DataBricks中的命令单元仍在运行。像这样卡住已经10分钟了。json文件,我不能自信地说它们将具有相同的确切结构(可能有一些discrepancies)The json文件是从我读到的= False可以帮助减少运行时的REST 中
浏览 2
提问于2020-12-04
得票数 2
回答已采纳
7
回答
如何备份
数百万
个
小文件
?
、
在很短的时间内备份
数百万
个
小文件
的最佳方法是什么?我们有不到5
个
小时来备份一
个
文件系统,其中包含大约6000万
个
文件,其中大部分是
小文件
。我们可以先将文件放入存档文件,或者通过网络或硬盘传输将文件传送到另一
个
位置。 谢谢
浏览 0
提问于2011-02-02
得票数 9
1
回答
在我的主目录中出现了一
个
名字随机的不可访问的目录。
、
权限似乎是正常的:我在堆栈溢出上只遇到过一
个
这种情况,但是没有答案。
浏览 0
提问于2015-06-10
得票数 5
回答已采纳
1
回答
列出20
个
子目录需要很长时间
、
、
、
、
我有一
个
目录(my_dir),它有20
个
子目录。每次我运行'ls‘或试图在这个目录中自动完成一
个
文件名时,我的IO
使用
量就会达到100%,列出20
个
子目录需要很长时间(10分钟)。我怎么才能修好它?
浏览 0
提问于2012-02-23
得票数 2
1
回答
使用
Span<T>解析文本文件的性能
我试图利用Span<T>,
使用
.NETCore 2.2来提高从文本文件解析文本的性能。文本文件包含多个连续的数据行,每个行将被分割为字段,然后每个字段被映射到一
个
数据类。最初,解析例程
使用
传统方法
使用
StreamReader
读取
每一行,然后
使用
Substring从该行复制各个字段。根据我所读到的(),除其他外,
使用
Span<T>和Slice应该更有效地执行,因为所做的数据分配较少,相反,指向byte[]数组的指针被传递并执行。经过一些实验,我比较
浏览 1
提问于2019-07-12
得票数 13
1
回答
为
数百万
个
小文件
设置块大小
、
、
、
、
我在Debian上的硬件RAID1中有2x4TB磁盘(可能是一
个
LSI MegaRaid)。物理块大小为4kB。我要存储1.5亿到2亿的
小文件
(3到10‘m之间)。我将一
个
8200字节的文件复制到一
个
块大小为4kB的ext4上。这需要32 of的磁盘!?写日记是原因吗?那么,有哪些选项可以为这样的
小文件
保存大部分存储空间呢?
浏览 0
提问于2014-01-08
得票数 10
1
回答
截断和优化后的MySQL写性能
、
、
、
我们每年一次截断一
个
由几个GBs和
数百万
行组成的表,然后运行优化以缩
小文件
系统上相应的ibd文件的大小。我们
使用
InnoDB作为存储引擎,MySQL 5.7作为数据库管理系统。
浏览 0
提问于2020-08-09
得票数 0
4
回答
如何在
C#
中
使用
线程
读取
和解析非常大的平面文件?
我必须
读取
一
个
大的文本文件,并
使用
C#
逐行解析它。对于
小文件
,这可以用StreamReader轻松完成,但在处理大文件时,它捕获了内存不足的异常。如何适配大文件?
浏览 2
提问于2013-01-08
得票数 3
2
回答
多流SCP从EC2传输大量
小文件
、
、
我正在
使用
scp从我的EC2实例中下载
数百万
个
小文件
(100到1000 kb)。scp似乎一次传输一
个
文件,并且没有充分利用我的1 gbps连接。 有没有更有效的方式下载这些文件?
浏览 3
提问于2013-11-04
得票数 0
回答已采纳
2
回答
在不提取
C#
的情况下
读取
ZIP
、
、
、
我有一
个
很大的ZIP文件,其中包含许多目录,每个目录都有数万
个
需要
读取
的
小文件
。这样做可以吗?与简单的
浏览 6
提问于2013-08-28
得票数 2
1
回答
在03或更多way服务器上同步文件夹的最佳方法是什么?
、
、
、
、
我用了一年左右的时间
使用
DRBD + OCFS2,但它现在不支持超过02台服务器。我读过关于GlusterFS和CEPH的文章,但是有很多关于它们的坏评论都与文件丢失有关。我需要所有的服务器实时同步,
使用
主动-主动-主动布局.有人知道怎么做吗?我的场景包括
数百万
个
小文件
(10 in或更少),所以在这种情况下,我需要一些具有良好性能的东西。当
使用
大型文件时,GlusterFS具有良好的性能,但在处理
小文件
时却受到了影响。
浏览 0
提问于2014-06-29
得票数 -2
1
回答
用于创建Hadoop归档的Java代码
、
、
我正在开发一
个
从
数百万
个
小文件
创建1 Hadoop归档文件的应用程序。你知道如何
使用
客户端应用程序创建Hadoop归档吗?
浏览 0
提问于2017-07-29
得票数 1
1
回答
/tmp/在某种程度上超出了空间,包含一
个
不可移动的文件
、
/tmp只包含一
个
东西:一
个
名为/tmp/.mount_VCeNjK/的文件夹。我找不到关于它的任何东西,因为即使是sudo和su也不能chmod、阅读、umount、rm或stat。
浏览 0
提问于2019-01-19
得票数 0
回答已采纳
2
回答
Windows Server备份与Acronis备份和恢复?
、
、
我需要备份一
个
服务器(Windows2008R2)到外部驱动器。因为服务器有
数百万
个
小文件
,所以需要块级备份,而不是文件系统。 我可以
使用
Acronis备份和恢复,也可以
使用
Windows备份。有什么令人信服的理由来选择一
个
而另一
个
呢?(我已经拥有Acronis软件,所以价格不是问题。)
浏览 0
提问于2011-05-19
得票数 3
回答已采纳
1
回答
HDFS Balancer -适用于包含1KB文件的群集
我有一
个
包含3
个
节点的HDFS集群。该集群包含大量
小文件
(KB),我已经达到了每个节点
数百万
个数据块。 我又向集群中添加了4台新服务器,并启动了均衡器进程,但看起来效果不是很好。-目标是减少每台服务器的数据块数量 为了平衡
小文件
,我应该更改以下参数的值以支持从1KB大小的文件移动吗?
浏览 25
提问于2021-10-16
得票数 0
回答已采纳
1
回答
从15.04升级到15.10之后,登录需要很长时间
、
、
从Ubuntu 15.04升级到15.10后,我注意到当我打开笔记本电脑时,启动和显示登录屏幕只需几秒钟,但当我输入密码登录字段并按下“enter”时会出现问题:屏幕显示我的桌面图像,左下角写着"Ubuntu 15.10“(我也可以看到我的鼠标),大约需要3-4分钟才能显示菜单栏。我知道我立即登录到会话,因为我可以听到skype登录声音,它也加载所有的启动程序,但我不明白为什么要花这么长时间来显示菜单栏。P.S.我的笔记本电脑是惠普展馆dv6b04st。
浏览 0
提问于2015-11-13
得票数 0
回答已采纳
点击加载更多
相关
资讯
barcodelib:一个功能强大且易于使用的 C# 条形码生成库
如何从根源上解决 HDFS 小文件问题
使用S7.Net与S7-1200进行数据读写-布尔量
11-Halcon实战宝典之C#与Halcon混合开发
盘点3个.Net解压缩开源库
热门
标签
更多标签
云服务器
ICP备案
云直播
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券