这篇笔记主要介绍Python中文本相关的操作。
先做下名词解释,所谓文本文件,就是指以特定的编码方式构成的数据序列。我们日常办公处理的.txt文件,.csv文件等都是文本文件。在进行网络爬虫、数据分析时,数据通常是文本文件格式,而不是像之前笔记里中的手动输入数据。Python中有一系列专门针对文本文件的操作。
对于文本文件的处理,简言之,分为三步:
打开文件 --> 文件操作 --> 关闭文件
有点像打开冰箱,把大象放进去,再关上冰箱这三个步骤。
1. 文件的打开
文本文件的打开主要由open()函数完成,具体格式如下,
文件句柄=open(文件名, 打开模式)
其中文件句柄用于后续对该文件的操作,文件名可以包括文件的具体路径,例如 “D: //Python//data.txt”。打开模式是指该文件被打开的方式,分为很多类,
举个栗子,f=open("a.txt", r)表示以只读模式打开文件a.txt。
2. 文件的操作
文件的操作主要包括读取与写入两种操作。读取操作,主要有read(),readline(),readlines()三个函数,对应的格式(文件句柄为fh)分别为
fh.read()一定性读取文件的全部内容
fh.readline()读取文件的某一行
fh.readlines()一定性读取文件的全部内容,并以行为单位返回列表
后面两种方式常用于for循环中,例如
read函数还可以指定读取字节的大小,格式为f.read(size)。
类似的,写入操作也分为write()与writelines()两种操作。write()写入的是单个字符串,而writelines则可以写入由字符串构成的列表。
另外一个重要的文本操作函数是seek函数,用于改变文件操作的指针位置,其格式为
文件句柄. seek(offset)
offset=0表示文件开头,offset=1表示当前位置,offset=2表示文件末尾。
3. 文件的关闭
文件的关闭与打开是成对出现的,文件的关闭语句比较简单,主要就是close函数,其格式为
文件句柄. close()
以上是对Python文件操作的简单介绍,比较简单,就是三步走。文件的读写是后续数据分析中必不可少的操作,需熟练掌握。
领取专属 10元无门槛券
私享最新 技术干货