文件可以将数据进行持久化的保存。
根据功能来分,文件可以分为程序文件和数据文件
程序文件:包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows 环境后缀为.exe)
数据文件:文件内容不一定都是程序,而是程序运行读写的数据
文件名:⼀个文件要有⼀个唯的一文件标识,以便用户识别和引用。
文件名包含3部分:文件路径+文件名主干+文件后缀, 例如: c:\code\test.txt
文件标识常被称为文件名
文件路径:
相对路径:从当前目录开始,描述到达文件或目录所需的路径。它不需要从根目录开始,而是基于当前位置。
..表示当前目录的上一级目录,.表示同一级
绝对路径:从根目录开始,完整地描述到达文件或目录所需的路径,例如: c:\code\test.txt
数据文件分类:
可分为文本文件和二进制文件。
数据在内存中以二进制的形式存储,如果不加转换的输出到外存的文件中,就是二进制文件。
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。
在文件中,字符用ASCII码值存储,数字可以用ASCII码值也可以用二进制来存储。
举例:
可以将流想成是流淌着字符的河,C程序针对文件、画面、键盘等的数据输入输出操作都是通过流操作的。
⼀般情况下,我们要想向流里写数据,或者从流中读取数据,都是要打开流,然后操作。
为C语言程序在启动的时候,默认打开了3个流,3个标准流。
• stdin - 标准输入流,在大多数的环境中从键盘输入,scanf函数就是从标准输入流中读取数据。 • stdout - 标准输出流,大多数的环境中输出到显示器界面,printf函数就是将信息输出到标准输出流中。 • stderr - 标准错误流,大多数的环境中输出到显示器界面。
默认打开了这三个流,我们使用scanf、printf等函数就可以直接进行输入输出操作的。
stdin、stdout、stderr 三个流的类型是: FILE * ,通常称为文件指针。
C语言中,就是通过 FILE* 的文件指针来维护流的各种操作的。
“文件类型指针”,简称“文件指针”。 每个被使用的文件都在内存中开辟了⼀个相应的文件信息区,用来存放文件的相关信息。
这些信息是保存在⼀个结构体变量中的。该结构体类型是由系统声明的,取名 FILE.
不同的C编译器的FILE类型包含的内容不完全相同,但是大同小异。⼀般都是通过⼀个FILE的指针来维护这个FILE结构的变量,这样使用起来更加方便。
下面创建⼀个FILE*的指针变量:
FILE* pf; //文件指针变量
通过文件指针变量能够间接找到与它关联的文件 。
读写文件之前要先打开文件,读写完之后要关闭文件。
fopen()用来打开文件,fclose()用来关闭文件。
//打开文件 FILE * fopen ( const char * filename, const char * mode );//mode为文件打开模式 //关闭文件 int fclose ( FILE * stream );
一些文件打开方式:
以读的方式打开就只能读,以写的方式打开就只能写。
示例:
#include <stdio.h>
int main ()
{
FILE * pFile;
//打开⽂件
pFile = fopen ("myfile.txt","w");
//⽂件操作
if (pFile!=NULL)
{
fputs ("fopen example",pFile);
//关闭⽂件
fclose (pFile);
}
return 0;
}
如果文件关闭,可以将文件指针pFile置为NULL来规避野指针。
适用于所有 输入/出 流的函数既能用于标准输入/出 流,也能用于文件输入/出 流。
fgetc int fgetc ( FILE * stream ); 读取当前字符正常,返回读到指针的ASCII码值,并且文件的光标(也称为文件位置指示器或文件指针)指向下一个位置;读取失败或遇到文件结束,则返回EOF(文件读取结束标志,值为-1)
fputc int fputc ( int char, FILE * stream ); char 要写入的字符的 int 提升。写入时,该值在内部转换为无符号字符 将字符写入流,文件光标指向下一个位置
fgets char * fgets ( char * str, int num, FILE * stream ); str 指向复制读取的字符串的 char数组的指针。 num数字 要复制到 str 中的最大字符数(包括终止 null 字符)。 stream流 指向标识输入流的 FILE 对象的指针。 stdin 可以用作从标准输入读取的参数。 从流中读取字符,并将它们作为字符串存储到 str 中,直到读取 (num-1) 个字符或到达换行符\n或文件末尾 '\0'会被自动加入到字符串最后,文件读取时遇到'\n'也会结束,其后也会添加'\0' 读取成功返回目标空间地址str,失败返回NULL
fputs int fputs ( const char * str, FILE * stream ); 将 str 指向的 C 字符串写入流。 该函数从指定的地址 (str) 开始复制,直到到达终止 null 字符 ('\0')。此终止 null 字符不会复制到流中。 成功后,将返回一个非负值。 出错时,该函数返回 EOF 并设置错误指示器(ferror)
int fscanf ( FILE * stream, const char * format, ... );
从流中读取数据,并根据参数格式将它们存储到其他参数所指向的位置。
例:
float f;
FILE * pFile;
pFile = fopen ("myfile.txt","w");
fscanf (pFile, "%f", &f);
int fprintf ( FILE * stream, const char * format, ... );
format 包含要写入流的文本的 C 字符串
将按格式指向的字符串写入流
成功后,将返回写入的字符总数。 如果发生写入错误,则设置错误指示符 (ferror) 并返回负数。
例:
FILE * pFile;
int n;
char name [100];
pFile = fopen ("myfile.txt","w");
for (n=0 ; n<3 ; n++)
{
puts ("please, enter a name: ");
gets (name);
fprintf (pFile, "Name %d %s\n",n+1,name);
}
fclose (pFile);
fread size_t fread ( void * ptr, size_t size, size_t count, FILE * stream ); 从文件中读取count个大小为size个字节的数据,存放在ptr指向的空间中 返回值为成功读取的元素个数
fwrite size_t fwrite ( const void * ptr, size_t size, size_t count, FILE * stream ); 将ptr中count个大小为size的字节的数据写到文件中 返回成功写入的元素总数。
scanf/fscanf/sscanf
sscanf 从字符串中提取格式化的数据,可以理解为将字符串转成格式化的数据
int sscanf(const char *str, const char *format, ...);
sscanf 会按照format指定的格式从str中读取数据,并将这些数据存储在提供的变量中
例如:
char input[] = "John 30 90.5";
char name[50];
int age;
float score;
if (sscanf(input, "%49s %d %f", name, &age, &score) == 3) {
printf("Name: %s, Age: %d, Score: %.1f\n", name, age, score);
} else {
printf("Failed to parse the input.\n");
}
fscanf从一个文件流中读取格式化的输入。它的原型类似于scanf,但它是从文件(由文件指针指定)中读取数据,而是scanf从标准输入(通常是键盘)读取
printf/fprintf/sprintf
sprintf 将格式化的数据写到字符串中,可以理解为将格式化的数据转换成字符串
int sprintf(char *str, const char *format, ...);
sprintf会按照format指定的格式将提供的数据写入到str指向的缓冲区中。注意,你需要确保str指向的缓冲区有足够的空间来存储结果字符串,否则可能会导致缓冲区溢出。
例如:
char buffer[100];
int age = 30;
float score = 90.5;
sprintf(buffer, "Name: John, Age: %d, Score: %.1f", age, score);
printf("%s\n", buffer);
fprintf 将格式化的数据写入一个文件流。它的原型类似于printf,但它是将数据写入一个文件(由文件指针指定),而不是写入标准输出(通常是屏幕)
sscanf、sprintf是从字符串中读取、写入,fscanf、fprintf从文件中读取、写入
根据文件指针的位置和偏移量来定位文件指针(文件内容的光标)
int fseek ( FILE * stream, long int offset, int origin ); 允许改变这个位置指针(光标),从而可以在文件的任何位置开始读取或写入
stream
:一个指向 FILE
的指针,该 FILE
对象标识了要移动位置指针的文件。
offset
:一个长整型值,表示相对于 origin
参数的偏移量。
origin
:这是一个用于指定如何解释 offset
参数的宏,可能的值有:
SEEK_SET
:文件的开头。偏移量 offset
是从文件的开头算起的。SEEK_CUR
:文件的当前位置。偏移量 offset
是从当前位置算起的。SEEK_END
:文件的末尾。偏移量 offset
是从文件的末尾算起的(通常用于从文件末尾向前移动位置指针)。返回值:
fseek
函数返回零。fseek
返回非零值。可以使用 perror
或 strerror
函数来获取更具体的错误信息。 举例:
#include<stdio.h>
int main ()
{
FILE * pFile;
pFile = fopen ( "example.txt" , "wb" );
fputs ( "This is an apple." , pFile );
fseek ( pFile , 9 , SEEK_SET );
fputs ( " sam" , pFile );
fclose ( pFile );
return 0;
}
输出文件指针相较于文件初始位置的偏移量
long int ftell ( FILE * stream ); 如果成功, 函数返回从文件开头到当前位置的偏移量(以字节为单位)
例子:
#include <stdio.h>
int main ()
{
FILE * pFile;
long size;
pFile = fopen ("myfile.txt","rb");
if (pFile==NULL)
perror ("Error opening file");
else
{
fseek (pFile, 0, SEEK_END);
size=ftell (pFile);
fclose (pFile);
printf ("Size of myfile.txt: %ld bytes.\n",size);
}
return 0;
}
fseek (pFile, 0, SEEK_END);这行代码将文件的位置指针移动到文件的末尾。`0` 表示偏移量为 0,`SEEK_END` 表示从文件的末尾开始计算偏移量。 size=ftell (pFile);这行代码调用 `ftell` 函数来获取当前位置(即文件末尾)的偏移量,并将其存储在 `size` 变量中。这个偏移量实际上就是文件的大小(以字节为单位)。
将文件指针调回到文件初始位置
void rewind ( FILE * stream );
例子:
#include <stdio.h>
int main ()
{
int n;
FILE * pFile;
char buffer [27];
pFile = fopen ("myfile.txt","w+");
for ( n='A' ; n<='Z' ; n++)
fputc ( n, pFile);
rewind (pFile);
fread (buffer,1,26,pFile);
fclose (pFile);
buffer[26]='\0';
printf(buffer);
return 0;
}
feof()不是用来判断文件是否结束,
而是当文件读取结束时,判断结束原因是否是 遇到文件尾结束
feof()函数用于检测指定的文件流stream是否已经到达了文件末尾(EOF)。
如果是,则返回一个非零值;否则返回零。
函数原型:int feof(FILE *stream);
ferror()函数用于检测指定的文件流stream是否发生了错误。
如果在之前的I/O操作中有错误发生(如磁盘错误、读取不存在的文件等),ferror()将返回一个非零值(通常是EOF,但这不是必须的,只是通常约定)。
如果没有错误,则返回零。
1. 文本文件读取是否结束,判断返回值是否为 EOF ( fgetc ),或者 NULL ( fgets )
例如: • fgetc 判断是否为 EOF . • fgets 判断返回值是否为 NULL
2. ⼆进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
例如: • fread判断返回值是否小于实际要读的个数。
文本文件例子:
#include <stdio.h>
#include <stdlib.h>
int main(void)
{
int c; // 注意:int,⾮char,要求处理EOF
FILE* fp = fopen("test.txt", "r");
if(!fp) {
perror("File opening failed");
return EXIT_FAILURE;
}
//fgetc 当读取失败的时候或者遇到⽂件结束的时候,都会返回EOF
while ((c = fgetc(fp)) != EOF) // 标准C I/O读取⽂件循环
{
putchar(c);
}
//判断是什么原因结束的
if (ferror(fp))
puts("I/O error when reading");
else if (feof(fp))
puts("End of file reached successfully");
fclose(fp);
}
二进制文件例子:
#include <stdio.h>
enum { SIZE = 5 };
int main(void)
{
double a[SIZE] = {1.,2.,3.,4.,5.};
FILE *fp = fopen("test.bin", "wb"); // 必须⽤⼆进制模式
fwrite(a, sizeof *a, SIZE, fp); // 写 double 的数组
fclose(fp);
double b[SIZE];
fp = fopen("test.bin","rb");
size_t ret_code = fread(b, sizeof *b, SIZE, fp); // 读 double 的数组
if(ret_code == SIZE) {
puts("Array read successfully, contents: ");
for(int n = 0; n < SIZE; ++n)
printf("%f ", b[n]);
putchar('\n');
}
else
{ // error handling
if (feof(fp))
printf("Error reading test.bin: unexpected end of file\n");
else if (ferror(fp))
{
perror("Error reading test.bin");
}
}
fclose(fp);
}
缓冲文件系统是指系统自动地在内存中为程序中每⼀个正在使用的文件开辟⼀块“文件缓冲区”。
从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才⼀起送到磁盘上。
如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。
缓冲区的大小根据C编译系统决定的。
因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。 如果不做,可能导致读写文件的问题。
#include <stdio.h>
#include <windows.h>
int main()
{
FILE*pf = fopen("test.txt", "w");
fputs("abcdef", pf);//先将代码放在输出缓冲区
printf("睡眠10秒-已经写数据了,打开test.txt⽂件,发现⽂件没有内容\n");
Sleep(10000);
printf("刷新缓冲区\n");
fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到⽂件(磁盘)
//注:fflush 在⾼版本的VS上不能使⽤了
printf("再睡眠10秒-此时,再次打开test.txt⽂件,⽂件有内容了\n");
Sleep(10000);
fclose(pf);
//注:fclose在关闭⽂件的时候,也会刷新缓冲区
pf = NULL;
return 0;
}
打开文件:
FILE* pf = fopen("test.txt", "w");
这里使用函数fopen()以写入模式("w")打开一个名为"test.txt"的文件。如果文件不存在,它将被创建;如果文件已存在,其内容将被清空。
写入数据到缓冲区:
fputs("abcdef", pf);
使用函数fputs()将数据"abcdef"写入文件。但实际上,数据并没有直接写入到磁盘上的文件,而是首先被写入到一个与FILE*指针pf关联的输出缓冲区中。这种缓冲机制是为了提高I/O效率,因为将数据写入磁盘通常比将数据写入内存要慢得多。
输出提示信息并等待:
printf("睡眠10秒-已经写数据了,打开test.txt文件,发现文件没有内容\n");
Sleep(10000); // 等待10秒
这里输出一个提示信息,告诉用户已经写入了数据,但此时如果打开"test.txt"文件,会发现文件是空的。这是因为数据还在输出缓冲区中,没有被刷新到磁盘上。Sleep(10000)函数使程序暂停10秒,以便用户有时间去查看文件内容(尽管此时文件内容仍然是空的)。
刷新缓冲区:
printf("刷新缓冲区\n");
fflush(pf);
使用fflush()函数刷新与pf关联的输出缓冲区。这将导致缓冲区中的数据被写入到磁盘上的"test.txt"文件中。此时,如果用户再次打开"test.txt"文件,就会看到"abcdef"这个字符串。
再次等待并输出信息:
printf("再睡眠10秒-此时,再次打开test.txt文件,文件有内容了\n");
Sleep(10000);
再次输出一个提示信息,并等待10秒,以便用户有时间去查看文件内容(此时文件内容应该是"abcdef")。
关闭文件并置空指针:
fclose(pf);
pf = NULL;
使用函数fclose关闭文件。在关闭文件时,通常会自动刷新输出缓冲区(如果存在),因此即使没有显式调用fflush(),文件也会包含之前写入的数据。将pf置空是一个好习惯,可以防止在后续代码中误用已经关闭的文件指针。