所以我在玩维基百科的转储文件。这是一个经过bzipped压缩的XML文件。我可以将所有文件写入目录,但是当我想要进行分析时,我必须重新读取磁盘上的所有文件。这给了我随机访问,但它很慢。从表面上看,bz2库必须读取并捕获偏移量,然后才能将我带到那里(并解压缩所有偏移量,因为偏移量是以解压缩的字节为单位)。无论如何,我正在尝试mmap转储文件(~9.5 it )并将其加载到bzip中。显然,我想在此之前在一个bzip文件上进行测试。我希望将mmap文件映射到一个BZ2Fil
在mmap()手册页中:void *mmap(void *start, size_t length, int prot, int flags, int fd, off_t offset);The mmap() function asks to map 'length' bytes starting at offset 'offset'
from the file (or根据我的实践,offset必须是页面大小的倍数,例如在我的Linux上,4096,否则