所谓的文件就是存储在计算机磁盘上的文件,在程序设计中,谈到文件一般可以分为两种文件。
程序文件
比如后缀为.c的C语言的源程序文件,还有.exe的可执行文件(在windows中)。不过在Linux系统中文件后缀名只是起到一个标识作用,后缀和文件类型无关。
数据文件
数据文件的内容不一定是程序,而是程序运行是读写的数据。比如程序运行时需要从中读取数据的文件,或者是程序输出内容的文件,比如.txt的文本文件。
而C语言文件操作一般围绕的就是数据文件,有的时候我们希望把一些数据保存到磁盘中永久存储,而不是在内存中,停止程序数据就丢失了。
缓冲文件系统中,关键的概念就是”文件类型指针“,简称文件指针
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(比如文件的标识符,文件名,文件的当前位置等)。
比如下面就是devcpp中在stdio.h头文件中有以下声明:
struct _iobuf {char *_ptr;//文件输入的下一个位置int _cnt;//当前缓冲区的相对位置char *_base;//文件的起始位置int _flag;//文件标标志int _file;//文件描述符idint _charbuf;//检查缓冲区状况,如果无缓存区则不读取int _bufsiz;//缓冲区大小char *_tmpfname;//临时文件名};typedef struct _iobuf FILE;
不同的编译器FILE类型可以会略有差异的,但是都差不太多。
每当C程序打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,调用者不用关注其实现,只需要使用就好了。
使用FILE一般是通过指针来维护这个变量,使用起来更加方便。
FILE* pf;//文件指针变量
pf是一个指向FILE类型数据的指针变量,可以让pf指向某个文件的文件信息区域(一个结构体变量),通过该文件信息区中的信息就能狗访问该文件,也就是说通过文件指针变量能够找到与它关联的文件

文件在读写之前应该先打开文件,在使用结束之后应该关闭文件 。因为一个程序打开的文件数量是有限的。
C语言在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。
C语言标准规定使用fopen函数来打开文件,fclose来关闭文件
FILE *fopen( const char *filename, const char *mode );
int fclose ( FILE * stream );
| 文件使用方式 | 含义 | 如果指定文件不存在 |
|---|---|---|
| “r”(只读) | 为了输入数据,打开一个已经存在的文本文件 | 出错 |
| “w”(只写) | 为了输出数据,打开一个文本文件 | 自动建立一个新的文件 |
| “a”(追加) | 向文本文件尾添加数据 | 自动建立一个新的文件 |
| “rb”(只读) | 为了输入数据,打开一个二进制文件 | 出错 |
| “wb”(只写) | 为了输出数据,打开一个二进制文件 | 自动建立一个新的文件 |
| “ab”(追加) | 向一个二进制文件尾添加数据 | 自动建立一个新的文件 |
| “r+”(读写) | 为了读和写,打开一个文本文件 | 出错 |
| “w+”(读写) | 为了读和写,建议一个新的文件 | 自动建立一个新的文件 |
| “a+”(读写) | 打开一个文件,在文件尾进行读写 | 自动建立一个新的文件 |
| “rb+”(读写) | 为了读和写打开一个二进制文件 | 出错 |
| “wb+”(读写) | 为了读和写,新建一个新的二进制文件 | 自动建立一个新的文件 |
| “ab+”(读写) | 打开一个二进制文件,在文件尾进行读和写 | 自动建立一个新的文件 |
文件打开关闭实例
#include
#include
#include
int main()
{FILE* pf = fopen("test.txt","w");if (pf == NULL){printf("打开文件失败!\n%s", strerror(errno));}//关闭文件fclose(pf);pf = NULL;return 0;
}
| 功能 | 函数名 | 适用于 |
|---|---|---|
| 字符输入函数 | fgetc | 所有输入流 |
| 字符输出函数 | fputc | 所有输出流 |
| 文本行输入函数 | fpusc | 所有输入流 |
| 文本行输出函数 | fgets | 所有输出流 |
| 格式化输入函数 | fscanf | 所有输入流 |
| 格式化输出函数 | fprintf | 所有输出流 |
| 二进制输入 | fread | 文件 |
| 二进制输出 | fwrite | 文件 |
C语言程序在运行起来的时候
会默认打开3个流
流是一个高度抽象的概念。举个例子::
我们写代码可能要操作硬盘或者U盘又或者是屏幕或者网卡,当我们要操作这么多外部设备的时候,需要要知道怎么用代码去操作它们,但每一种设备的操作方式就是不一样的,这样也是非常麻烦的,学习成本也比较高。于是流这个概念就诞生了,我们可以把这些外部设备当作成流,我们写代码只需要关心怎怎么把数据写到流里面去,和怎么从流里面读取数据就够了,具体的流和操作系统的交互C语言已经帮我们封装好了,不需要我们去关心。
fgetc:从文件中读取一个字符,读取错误或者读取到文件末尾返回EOF
gputc:写入一个字符到文件中,写入失败返回EOF
int fgetc( FILE *stream );
int fputc( int c, FILE *stream );
写入字符到文件中
#include
#include
#include
int main()
{FILE* pf = fopen("test.txt", "w");//以写入的方式打开test.txt文件if (pf == NULL){printf("打开文件失败!\n%s", strerror(errno));}else{int i = 0;for (i = 'a'; i <= 'z'; i++){fputc(i, pf);//向文件里写入字符}}if (pf != NULL){//关闭文件fclose(pf);pf = NULL;}return 0;
}
从文件中读取字符
#include
#include
#include
int main()
{FILE* pf = fopen("test.txt", "r");//以只读的方式打开test.txt文件if (pf == NULL){printf("打开文件失败!\n%s", strerror(errno));}else{int ch = 0;while ((ch = fgetc(pf)) != EOF){printf("%c ", ch);}}if (pf != NULL){//关闭文件fclose(pf);pf = NULL;}return 0;
}
fputc也可以从标准输出流中打印
#include int main()
{char ch = 'a';fputc(ch, stdout);//从标准输出流中打印return 0;
}
char *fgets( char *string, int n, FILE *stream );
int fputs( const char *string, FILE *stream );
写入数据到文件中
#include
#include
#include
int main()
{FILE* pf = fopen("test.txt", "w");//以写入的方式打开文件if (pf == NULL){printf("文件打开失败!%s", strerror(errno));}else{fputs("第一行\n", pf);fputs("第二行\n", pf);fputs("第三行\n", pf);}//关闭文件if (pf != NULL){fclose(pf);pf = NULL;}return 0;
}
从文件中读取一行
#include
#include
#include
int main()
{FILE* pf = fopen("test.txt", "r");//以只读的方式打开文件if (pf == NULL){printf("文件打开失败!%s", strerror(errno));}else{char ch[10] = { 0 };fgets(ch, 11, pf);//读取第一行10个字节的数据到ch中printf("%s", ch);}//关闭文件if (pf != NULL){fclose(pf);pf = NULL;}return 0;
}
也可以用while循环读取多行
char ch[10] = { 0 };
while (fgets(ch, 10, pf) != NULL)//一次读取9个字节
{printf("%s", ch);
}
也可以从标准输入中读取
#include int main()
{char ch[10] = { 0 };fgets(ch, 10, stdin);//从键盘中读取字符串到ch中printf("%s", ch);return 0;
}
通过标准输出打印到屏幕上
#include int main()
{char ch[10] = "hello";fputs(ch,stdout);return 0;
}
size_t fwrite( const void *buffer, size_t size, size_t count, FILE *stream );size_t fread( void *buffer, size_t size, size_t count, FILE *stream );
写入代码实例
#include
struct Stu
{char name[20];int age;
};
int main()
{FILE* pf = fopen("test.txt", "wb");//以二进制写文件方式打开if (pf == NULL){printf("文件打开失败!\n");}else{//写入文件struct Stu s = { "张三",17 };fwrite(&s, sizeof(s), 1, pf);}//关闭文件if (pf != NULL){fclose(pf);pf = NULL;}return 0;
}
读取代码实例
#include
struct Stu
{char name[20];int age;
};
int main()
{FILE* pf = fopen("test.txt", "rb");//以二进制读文件方式打开if (pf == NULL){printf("文件打开失败!\n");}else{//读文件struct Stu s = { 0 };fread(&s, sizeof(s), 1, pf);printf("%s %d", s.name, s.age);}//关闭文件if (pf != NULL){fclose(pf);pf = NULL;}return 0;
}
fscanf和fprintf函数是用来格式化写入和格式化读取文件的函数
int fscanf( FILE *stream, const char *format [, argument ]... );
int fprintf( FILE *stream, const char *format [, argument ]...);
格式化写入数据到文件
#include
struct Stu
{char name[20];int age;
};
int main()
{FILE* pf = fopen("test.txt", "w");//以写文件方式打开if (pf == NULL){printf("文件打开失败!\n");}else{//格式化写入文件struct Stu s = { "张三",20};fprintf(pf, "%s %d", s.name, s.age);}//关闭文件if (pf != NULL){fclose(pf);pf = NULL;}return 0;
}
格式化从文件中读取
#include
struct Stu
{char name[20];int age;
};
int main()
{FILE* pf = fopen("test.txt", "r");//以读文件方式打开if (pf == NULL){printf("文件打开失败!\n");}else{//格式化读取文件struct Stu s = { 0 };fscanf(pf, "%s %d", s.name, &(s.age));fprintf("%s %d\n",s.name,s.age);}//关闭文件if (pf != NULL){fclose(pf);pf = NULL;}return 0;
}
他们俩也可以实现和printf和scanf的效果
//格式化读取文件struct Stu s = { 0 };fscanf(stdin, "%s %d", s.name, &(s.age));fprintf(stdout,"%s %d\n", s.name, s.age);
前面两个一个介绍了,而sscanf和sprintf是将格式化的数据和字符串互相转换
int sscanf( const char *buffer, const char *format [, argument ] ... );
int sprintf( char *buffer, const char *format [, argument] ... );
#include
struct Stu
{char name[20];int age;
};
int main()
{struct Stu s1 = { "张三",20 };char ch[20] = { 0 };//sprintf可以把结构化的数据转换为一个字符串sprintf(ch, "%s %d", s1.name, s1.age);struct Stu s2 = { 0 };//sscanf可以把一个字符串转换为一个结构化的数据sscanf(ch, "%s %d", s2.name, &(s2.age));printf("%s %d\n", s2.name, s2.age);return 0;
}
它们几个又什么区别呢?
int fseek( FILE *stream, long offset, int origin );
#include int main()
{FILE* pf = fopen("test.txt", "r");if (pf == NULL){return 1;}printf("%c\n",fgetc(pf));printf("%c\n",fgetc(pf));//人文件指针回到偏移量为0的位置fseek(pf, 0 SEEK_SET);//让文件指针指向起始位置偏移量为0的位置printf("%c\n", fgetc(pf));fseek(pf, 2, SEEK_CUR);//让文件指针指向起始位置偏移量往后+2的位置printf("%c\n", fgetc(pf));fseek(pf, -2, SEEK_END);//让文件指针指向末尾前2两个位置printf("%c\n", fgetc(pf));fclose(pf);return 0;
}

ftell函数
返回文件指针相对于起始位置的偏移量
long ftell( FILE *stream );
#include int main()
{FILE* pf = fopen("test.txt", "r");if (pf == NULL){return 1;}fgetc(pf);fgetc(pf);printf("%d\n", ftell(pf));//人文件指针回到偏移量为0的位置fseek(pf, 0, SEEK_SET);printf("%d\n", ftell(pf));fclose(pf);return 0;
}
rewind 函数
让文件指针的位置回到文件的起始位置
void rewind ( FILE * stream );
#include int main()
{FILE* pf = fopen("test.txt", "r");if (pf == NULL){return 1;}fgetc(pf);fgetc(pf);printf("%d\n", ftell(pf));//人文件指针回到偏移量为0的位置rewind(pf);printf("%d\n", ftell(pf));fclose(pf);return 0;
}
feof是用来判断文件是否结束的,但容易被人错误使用。
int feof( FILE *stream );
注意:在文件读取过程中,不能使用feof函数的返回值直接用来判断文件的是否结束,而是将该函数用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件末尾结束
函数使用示例
判断文本文件结束
#include
#include
#include int main()
{FILE* pf = fopen("test.txt", "r");//读取的方式if (pf == NULL){return 1;}char* c = 0;char buffer[20] = { 0 };while ((c = fgets(buffer, 20, pf)) != NULL){printf("%s", buffer);}if (feof(pf)){printf("读取到文件末尾正常结束");}else{printf("错误退出 %s", strerror(errno));}fclose(pf);return 0;
}
判断二进制文件结束
#include
#include
#include typedef struct Stu
{char name[20];char sex[10];int age;
}Stu;
int main()
{FILE* pf = fopen("test.txt", "rb");//二进制读取的方式if (pf == NULL){return 1;}int count = 0;Stu s = { 0 };while ((count = fread(&s, sizeof(Stu), 1, pf)) != 0){printf("%s %s %d\n", s.name, s.sex, s.age);}if (feof(pf)){printf("文件正常读取完毕结束\n");}else{printf("文件读取错误异常结束 %s\n", strerror(errno));}fclose(pf);return 0;
}
通过上述了解,C语言的文件操作基本就是围绕着文本文件和二进制文件进行操作.
他们都是数据文件,而数据在内存中是以二进制存储的,如果不进行转换直接输出到磁盘,就是二进制文件
如果要在磁盘中以ASII码的形式存储,则需要在存储前转换,以ASCII字符的形式存储就是文本文件
一个数据在内存中是怎么存储的呢?
字符一律是以ASCII形式存储,数值类型既可以用ASCII形式存储,也可以使用二进制形式存储。
假设又一个整数1000,如果要以ASCII码的形式输出到磁盘,则磁盘中占用4个字节(一个字符占一个字节),而以二进制的形式输出,则在磁盘上只占4个字节(VS2019平台上)
由下图VS2019监视是以十六进制显示的,e8 03 00 00转换为二进制就是11101000 00000011 00000000 00000000,应为我们这里是小端存储所以二进制因该是00000000 00000000 00000011 11101000


测试代码
#include int main()
{int a = 1000;FILE* pf = fopen("test.txt", "wb");fwrite(&a, 4, 1, pf);fclose(pf);pf = NULL;return 0;
}
C语言标准采用缓冲文件系统处理数据文件,缓冲文件系统指的是系统自动的在内存中为程序中为程序中每一个正在使用的文件开辟一块文件缓冲区。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上,如果从磁盘向计算机读入数据吗,则从磁盘文件中读取数据输入到内存缓冲区(填满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区,缓冲区的大小由编译器决定的。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-t0Gh1wZg-1670326098573)(assets/1670126909085.png)]
为什么要有文件缓冲区?
假设没有缓冲区,我们每写入或者读取一个字符,都要打断操作系统进行磁盘的写入和读取,就会频繁的进行写入和读取。而读取写入磁盘速度是较慢的,
文件缓冲区是在内存中的,而内存的读写速度比磁盘快好几个数量级,只需要把数据写入到文件缓冲区中,等缓冲区满了再写入到磁盘中,这样可以减少磁盘的IO次数,提高的运行速度。
文件缓冲区目的是缓和CPU 与 I/O 设备间速度不匹配的矛盾。减少对 CPU 的中断频率,放宽对 CPU 中断响应时间的限制。提高 CPU和 I/O 设备之间的并行性,这有点类似于生产者消费者模型。
验证文件缓冲区
#include
#include int main()
{FILE*pf = fopen("test.txt", "w");fputs("abcdef", pf);//先将代码放在输出缓冲区printf("睡眠10秒-已经写数据了,打开test.txt文件,发现文件没有内容\n");Sleep(10000);printf("刷新缓冲区\n");fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到文件(磁盘)printf("再睡眠10秒-此时,再次打开test.txt文件,文件有内容了\n");Sleep(10000);fclose(pf);//注:fclose在关闭文件的时候,也会刷新缓冲区pf = NULL;return 0;
}
存中的缓冲区,装满缓冲区后才一起送到磁盘上,如果从磁盘向计算机读入数据吗,则从磁盘文件中读取数据输入到内存缓冲区(填满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区,缓冲区的大小由编译器决定的。

为什么要有文件缓冲区?
假设没有缓冲区,我们每写入或者读取一个字符,都要打断操作系统进行磁盘的写入和读取,就会频繁的进行写入和读取。而读取写入磁盘速度是较慢的,
文件缓冲区是在内存中的,而内存的读写速度比磁盘快好几个数量级,只需要把数据写入到文件缓冲区中,等缓冲区满了再写入到磁盘中,这样可以减少磁盘的IO次数,提高的运行速度。
文件缓冲区目的是缓和CPU 与 I/O 设备间速度不匹配的矛盾。减少对 CPU 的中断频率,放宽对 CPU 中断响应时间的限制。提高 CPU和 I/O 设备之间的并行性,这有点类似于生产者消费者模型。
验证文件缓冲区
#include
#include int main()
{FILE*pf = fopen("test.txt", "w");fputs("abcdef", pf);//先将代码放在输出缓冲区printf("睡眠10秒-已经写数据了,打开test.txt文件,发现文件没有内容\n");Sleep(10000);printf("刷新缓冲区\n");fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到文件(磁盘)printf("再睡眠10秒-此时,再次打开test.txt文件,文件有内容了\n");Sleep(10000);fclose(pf);//注:fclose在关闭文件的时候,也会刷新缓冲区pf = NULL;return 0;
}