上级目录~ 家目录:每个用户的家目录都不同/ 当“/”在最前面时才代表根目录,其他位置均为目录层级分隔符命令格式命令+参数+文件command -options [parameter]command:命令名...##>:重定向,创建新的文件file并写入内容,Ctrl+C终止,会覆盖原有同名文件cat >> file ##>>:追加,在文件file后追加写入内容,Ctrl+C终止其它:zcat:可以查看压缩的文本文件...:查看压缩文件G/g:快速到文本结尾/开头文本统计wc:统计文本常见参数:-l ##统计行数-w ##统计字符串数-c ##统计字节数##不加参数时三者都会出现制表符等不可见字符依然计算字节数cut:文本切割常见参数...按数值升序排序-r:逆向排序-k:按指定的某列排序-t:指定分隔符uniq:去除重复行##只能去除相邻的重复行,记得和sort联用常见参数:-c:统计每个字符串连续出现的次数paste:文本合并 ##只能做简单合并...,默认按列合并常见参数:-d:指定分隔符-s:按行合并 ##先转置后上下连接常见用法:paste file1 file2 ##cat file1 file2只能上下连接,paste则能左右合并,字符串中间以
上面是一行HTML代码,文本的前面、里面和后面各有两个空格。为了便于识别,这里使用半圆形符号来表示空间。 浏览器的输出如下。 你好世界 如您所见,文本前后的空格将被忽略,内部连续的空格将只被算作一个。...这个属性有六个值,除了一个universal inherit(继承父元素),其余五个值在下面依次介绍。 空白属性的默认值是正常的,这意味着浏览器以正常方式处理空格。...在上面的代码中,文本前面有两个空格,里面有一个长单词和一个新的行字符。 然后,容器p指定一个相对较小的宽度。为了便于识别,背景颜色设置为红色。...唯一不同的是,当超过容器宽度时,会出现一条新的线。 p { white-space:预包装;} 显示效果如下。 文本开头的空格,里面的空格,换行符都保留,容器外换行。...当空白属性为行前时,表示保留换行符。除了换行符将按原样输出之外,其他都符合空白:正常规则。 显示效果如下。 除了文本内部的换行符没有转换成空格,其他都符合正常的处理规则。这对诗化文本很有用。
每个页面的文本都被提取出来page.extractText()并写入output_file....连接和合并 PDF 处理 PDF 文件时的两个常见任务是将多个 PDF 连接并合并为一个文件。 当您连接两个或多个 PDF 时,您将文件一个接一个地合并为一个文档。...Peter Python 注意到了这个错误,并迅速创建了一个缺少目录的 PDF。现在他需要将该 PDF 合并到原始报告中。...现在您已经旋转了 PDF 中的所有页面,您可以将内容写入pdf_writer新文件并检查一切是否正常: >>> >>> with Path("ugly_rotated.pdf").open(mode="...当您使用密码加密 PDF 文件并尝试打开它时,您必须提供密码才能查看其内容。这种保护扩展到在 Python 程序中读取 PDF。
以 # 开头的行将被忽略。以双引号开头的模式以 C 风格引用。当模式匹配相关路径时,该行上列出的属性将被赋予路径。...仅当您无法以 UTF-8 编码存储文件并且希望 Git 能够将内容作为文本处理时,才使用working-tree-encoding属性。...union 对文本文件运行 3 向文件级别合并,但从两个版本中获取行,而不是留下冲突标记。这往往会以随机顺序在结果文件中保留添加的行,用户应验证结果。如果您不理解其含义,请不要使用此功能。...当历史中的发展线分散并然后合并在一起时, git log 呈现这些提交的顺序是没有意义的。...任何形式的行: 三个破折号和行尾,或 以“diff - ”开头的行,或 一行以“索引:”开头 被视为补丁的开头,并且在第一次出现这样的行之前终止提交日志消息。
文件指针将会放在文件的开头。 rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。 w 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。...readlines() 自动将文件内容分析成一个行的列表,该列表可以由 Python 的 for ... in ... 结构进行处理。...readline() 每次只读取一行,通常比readlines() 慢得多。仅当没有足够内存可以一次读取整个文件时,才应该使用 readline()。...只有调用close()方法时,操作系统才保证把没有写入的数据全部写入磁盘。忘记调用close()的后果是数据可能只写了一部分到磁盘,剩下的丢失了。...python文件对象提供了两个“写”方法: write() 和 writelines()。 write()方法和read()、readline()方法对应,是将字符串写入到文件中。
readlines() 自动将文件内容分析成一个行的列表,该列表可以由 Python 的 for ... in ... 结构进行处理。...readline() 每次只读取一行,通常比readlines() 慢得多。仅当没有足够内存可以一次读取整个文件时,才应该使用 readline()。...我们可以反复调用write()来写入文件,但是务必要调用f.close()来关闭文件。当我们写文件时,操作系统往往不会立刻把数据写入磁盘,而是放到内存缓存起来,空闲的时候再慢慢写入。...只有调用close()方法时,操作系统才保证把没有写入的数据全部写入磁盘。忘记调用close()的后果是数据可能只写了一部分到磁盘,剩下的丢失了。...python文件对象提供了两个“写”方法: write() 和 writelines()。 write()方法和read()、readline()方法对应,是将字符串写入到文件中。
1 2 3 ^C #[结束写入] 这样就可以写入到file zcat [压缩文件的路径] tac [文件路径] #逆向查看 逆向是行的逆向 从最后一行到第一行,而左右不会变 head...-n 1 [路径] #打开某个文件的第一行 cat [路径] | head -n 1 #以管道符的方式链接两个命令 more [路径] #逐页查看文件 按空格翻页,按回车换行 less [文件路径...显示得更全 wc [路径1] [路径2] #分别输出多个文件得行数、字符串数、以及字符数 并显示总和 图片 切割文本: cat [路径] | cut -f 1,3-5,7 # 切割文件并显示文件的第一列...> [新的文件] 左右合并: paste [路径1] [路径2] paste -d "分隔符" [路径1] [路径2] #用分隔符合并两个文件 paste -s [路径1] [路径2] #合并后转置...d "删除的字符" #删除某个字符 tr -s #缩减重复的字符串 tr -s '缩减的字符' ‘字符2’ #将缩减成一个的字符替换成另一个字符’ eg:当某些文件以多个空格开头,想要取里面某列的字符串
打开并读取文件实例: tf = open("test1.txt","rt") #以文本文件打开一个test1.txt文件并读取,当rt换成用rb时则是以二进制文件形式打开 print(tf.readline...()) tf.close() 二.文件的打开和关闭 当Python执行文件相关操作时,也和其它编程语言类似,都遵循一定的步骤:打开——操作——关闭。...当然,有强迫症的同学可以使用两个\\,以达到一个\ 的效果。...txt","b") #二进制形式,只读模式 是一种只读的二进制方式打开的模式 f=open("test1.txt","wb") #二进制形式,覆盖写模式,可以对文件进行覆盖写 文件关闭(如果文件未被关闭,当程序如果是正常退出时...",""] fo.writelines(ls) #写入一个字符串列表 fo.seek(0)#回到开头(当写入数据时,指针是指向数据末尾的,需要将指针重新指向开头) for line in fo: print
正常使用文本的时候,不需要使用二进制方式,在需要特殊用途的时候是需要以二进制方式来存储、读取的。 操作模式: r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。...文件指针将会放在文件的开头。 w 打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。 wb 以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。...当相应的文件存在时,会清空原先的文件然后写入,当相应的文件不存在时会创建新的文件。...seek可以有两个传递变量,只有一个变量时,就是更改当前的指针,或者第一个变量为0,第二个变量为1的时候,会返回当前指针位置,这个与tell方法同样。...4、在最后写入 之前看到的w模式,当文件是已有文件,就会删除里面的所有内容后再写入的。当我们需要在最后添加,而不是删除原有内容时,可以使用a模式。
当有人扫描文档为PDF或电子邮件时,很可能会发生这种情况。我们可以打印出文档并阅读纸质版本,也可以使用Python的强大功能来旋转有问题的页面。...最后,使用.write()把所有新页写入新的PDF。 如何合并PDF? 在许多情况下,我们希望将两个或多个PDF合并到一个PDF中。例如,现在可能有一个标准的封面,需要转到许多类型的报告中。...然后遍历PDF文件中的所有页面,并使用.addpage()将这些页面写入writer对象。当完成对列表中所有PDF的所有页面的写入后,将在末尾写入新的结果中。...我们可以使用Python和PyPDF2为文档添加水印,而且是拥有仅包含水印图像或文本的PDF。...遍历完成后,最后将新加水印的PDF写入磁盘。 如何加密PDF? PyPDF2目前仅支持将用户密码和所有者密码添加到预先存在的PDF。
Python 文件处理Python 支持文件处理,并允许用户处理文件,即读取和写入文件,以及许多其他文件处理选项,以对文件进行操作。...每行代码都包含一个字符序列,它们形成一个文本文件。文件的每一行都以一个特殊字符结尾,称为 EOL 或行尾字符,如逗号{,} 或换行符。它结束当前行,并告诉解释器新行已经开始。...灵活性:Python 中的文件处理非常灵活,因为它允许您处理不同的文件类型(例如文本文件、二进制文件、CSV 文件等),并对文件执行不同的操作(例如读取、写入、追加等)。...复杂性:Python 中的文件处理可能很复杂,尤其是在使用更高级的文件格式或操作时。必须仔细注意代码,以确保正确且安全地处理文件。...# 打开一个文件进行读取file = open('test.txt', 'r')# 读取文件的第一行line = file.readline()# 循环遍历文件的其余部分并打印每一行while line
一共包含三个步骤: 打开文件; 读,写文件;读:将文本内容读入内存;写:将内存内容写入文本; 关闭文件; 操作文件的方法/函数 在python中操作文件需要记住一个函数和两个方法 序号 函数/方法 说明...文件的指针将会放在文件的开头,这是默认模式。如果文件不存在,抛出异常 w 以只写方式打开文件。如果文件存在会被覆盖。如果文件不存在,创建新文件 a 以追加方式打开文件。...如果文件不存在,创建新文件进行写入。 r+ 以读写方式打开文件。文件的指针将会放在文件的开头。如果文件不存在,抛出异常。 w+ 以读写方式打开文件。如果文件村子会被覆盖。如果文件不存在,创建新文件。...python2.x中使用中文 在python2.x文件的第一行增加以下代码,解释器会以utf-8编码来处理python文件; # *-* coding:utf8 *-* 上面这种是官方推荐使用的,也可以使用下面这种方式...: # coding=utf8 unicode字符串前加u 在python2.x中,即使指定了文件使用utf-8的编码格式,但是在遍历字符串时,仍然会以字节为单位遍历字符串; 要能够正确的遍历字符串,在定义字符串时
U 通用换行模式(Python 3 不支持)。 r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。...一般用于非文本文件如图片等。 r+ 打开一个文件用于读写。文件指针将会放在文件的开头。 rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。...w 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 wb 以二进制格式打开一个文件只用于写入。...5 file.next()Python 3 中的 File 对象不支持 next() 方法。返回文件下一行。...8 file.readlines([sizeint])读取所有行并返回列表,若给定sizeint>0,返回总和大约为sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区
在调用这个函数之前,你需要导入 Python 的traceback模块。 例如,您可以将回溯信息写入一个文本文件并保持程序运行,而不是在发生异常时立即使程序崩溃。...这样,您可以很容易地找到它来注释掉或取消注释调用,以根据需要启用或禁用日志消息。 记录到一个文件 您可以将日志消息写入文本文件,而不是显示在屏幕上。...例如,如果下一行代码调用了一个spam()函数,但您并不真正关心这个函数内部的代码,您可以单击“跳过”以正常速度执行函数中的代码,然后在函数返回时暂停。...当执行最后一行时,Python 将这些字符串连接起来,而不是将数字加在一起,从而导致了 bug。 用调试器单步调试程序是有帮助的,但也可能很慢。通常,您会希望程序正常运行,直到运行到某一行代码。...当您在调试器下运行程序时,它将像往常一样在第一行以暂停状态启动。但是如果单击“”,程序将全速运行,直到到达设置了断点的那一行。然后,您可以单击“继续”、“跳过”、“进入”或“退出”继续正常操作。
txt结尾的文件;find /data/ -name “[A-Z]*” #查找/data/目录以大写字母开头的文件;find /data/ -name “test*” #查找/data/目录以test开头的文件...在处理文本时把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),紧接着用SED命令处理缓冲区中的内容,处理完成后把缓冲区的内容输出至屏幕或者写入文件。...D;$d’ jfedu.txt 合并上下两行,也即两行合并: sed ‘$!...;-n 顺便输出行号; 学习Grep时,需要了解通配符、正则表达式两个概念,很多读者容易把彼此搞混淆,通配符主要用在Linux的Shell命令中,常用于文件或者文件名称的操作,而正则表达式用于文本内容中的字符串搜索和替换....* 代表任意字符;^ 匹配行首,即以某个字符开头;$ 匹配行尾,即以某个字符结尾;\(..\) 标记匹配字符;[] 匹配中括号里的任意指定字符,但只匹配一个字符;[^] 匹配除中括号以外的任意一个字符
-e, --quit-at-eof 当 less 第二次到达文件末尾时,自动退出。...这允许在选项字符串中包含美元符号 -- 该选项标识命令行选项的结束,之后的参数被解释为文件名,当在文件名的首字符是 - 或这 + 时需要使用该选项 + 如果命令行选项以 + 开头,则将该选项的其余部分视为初始命令...比如 +G 表示跳转至文件末尾,+/XYZ 表示跳转至匹配 XYZ 的第一行,+NUM 表示从文件第 NUM 行开始显示;如果选项以 ++ 开头,则初始命令将应用于所查看的每个文件,而不仅仅是第一个文件...当文件不断增长时该命令可以查看新增的内容,类似于 tail -f 命令 ESC-F 与 F 类似,但是一旦找到与最后一个搜索模式匹配的行,就会按下终端铃并停止向前滚动 g, <, ESC-< 跳转到第...g : 跳转到首行 / : 使用模式进行搜索,并跳转到下一个匹配文本行 n : 向前跳转到下一个匹配文本行 N : 向后跳转到下一个匹配文本行 # 或者。
领取专属 10元无门槛券
手把手带您无忧上云