我们知道程序中,所有的数据结构、变量都是运行时暂存在内存中的、但是实际中常常有需要将这些数据永久保存的需求。把程序运行时的内存保存到文件实现数据永久保存的过程,我们称之为数据序列化或者编组。
数据持久化目标是将临时的内存数据或者运行时中间过程数据转换为适合存储或传输的格式。数据持久化到文件后,在后续需要时候可以直接通过文件信息生成内存数据数据,这在一定程度上可以程序初始化或者处理过程,可以极大的节约时间和计算提高软件的效率或者方便实现短时间内程序运行时的横向扩展,这在虚拟化云收缩大量使用的今天用的尤为有用。
今天虫虫就以Python脚本为例,和大家一起来说说Python中list列表持久化的各种方法。
普通写入
在Pyton的句柄写入模式下,可以对打开句柄(文件)任意写入内容,我们通过打开需要保存到的文件句柄,然后通过循环遍历列表,以次写入文件就可以完成列表的保存。实际上这个过程是所有语言中保存内容到文件的内容,也不能算是实际上的数据持久化。
对文件写入时,要注意数据的类型和编码。 wrie方法接受字符串,因此列表中的数字首先应转换为字符串。
cat CC.txt查看内容
字符串写入文件
上面我们通过write写入了打个字符,实际中用的更多的是将list转化为字符串,然后一次性将其写入文件。 我们可以使用join方法将字符拼接为连字符串。同样的例子,字符串方法的代码如下:
结果:
writelines函数
Python的writelines()可用于将一系列字符串写入文件。序列化的可以是一个字符串列表,甚至是一个列表解析,它产生一个字符串列表,代码如下:
在Python 3.x中,print函数也可用于将列表写入文件。也非常简单:
Pickle对象序列化
Pickle一个序列化模块,常用于Python数据的序列化和反序列化操作,Pickle的序列化和反序列化过程分别叫做pickling和unpickling,实现把python对象的保存为字节流和对其可逆操作。其基本操作如下:
pickling支持以序列化python的任何数据结构,包括类,对象,甚至是可执行代码。对接本文主题,序列化一个list的pickling实例代码为:
注意字节流不宜于阅读(见下图),上述代码中我们使用load方法读出来内容并打印。
注:Pickle序列化和反序列化存在很多漏洞,有安全隐患,慎用!
通过json写入文件
JSON是表示数据结构和对象目前最流行的文本格式之一。由于JSON是Python内置的数据结构,我们可以很方便的使用Json操作实现列表的序列化:
领取专属 10元无门槛券
私享最新 技术干货