【云原生】Linux模拟实现简易版bash
创始人
2025-06-01 14:56:44
0

✨个人主页: Yohifo
🎉所属专栏: Linux学习之旅
🎊每篇一句: 图片来源
🎃操作环境: CentOS 7.6 阿里云远程服务器

  • Good judgment comes from experience, and a lot of that comes from bad judgment.
    • 好的判断力来自经验,其中很多来自糟糕的判断力。

上帝的指纹


文章目录

  • 🌇前言
  • 🏙️正文
    • 1、bash本质
    • 2、需求分析
    • 3、基本框架
    • 4、核心内容
      • 4.1、指令读取
      • 4.2、指令分割
      • 4.3、程序替换
      • 4.4、实机演示
    • 5、特殊情况处理
      • 5.1、ls 显示高亮
      • 5.2、内建命令
      • 5.3、cd
      • 5.4、export
      • 5.5、echo
    • 6、源码
  • 🌆总结


🌇前言

Linux 系统主要分为 内核(kernel)外壳(shell),普通用户是无法接触到内核的,因此实际在进行操作时是在和外壳程序打交道,在 shell 外壳之上存在 命令行解释器(bash),负责接收并执行用户输入的指令,本文模拟实现的就是一个 简易版命令行解释器

结构


🏙️正文

1、bash本质

在模拟实现前,先得了解 bash 的本质

bash 也是一个进程,并且是不断运行中的进程
证明:常显示的命令输入提示符就是 bash 不断打印输出的结果

提示信息

输入指令后,bash 会创建子进程,并进行程序替换
证明:运行自己写的程序后,可以看到当前进程的 父进程bash

父进程
此时可以断定神秘的 bash 就是一个运行中的进程,因为进程间具有独立性,因此可以同时存在多个 bash,这也是多用户登录 Linux 可以同时使用 bash 的重要原因

系统自带的 bash 是一个庞然大物,我们只需根据其本质,实现一个简易版 bash 就行了

大小
图片源自知乎《Linux内核有多少行源代码?》


2、需求分析

bash 需要帮我们完成命令解释+程序替换的任务,因此它至少要具备以下功能:

  • 接收指令(字符串)
  • 对指令进行分割,构成有效信息
  • 创建子进程,执行进程替换
  • 子进程运行结束后,父进程回收僵尸进程
  • 输入特殊指令时的处理

进程相关知识都已经在前面介绍过了,本文着重介绍的是其他步骤及细节


3、基本框架

抛开指令接收、切割、替换时的细节,简易版 bash 代码基本框架如下:

#include 
#include 
#include 
#include 
#include 
#include 
#include //指令分割函数
void split(char* argv[ARGV_SIZE], char* ps)
{}int main()
{//这是一个始终运行的程序:bashwhile(1){//打印提示符printf("[User@myBash default]$ ");	//可以自定义,跟着标准走fflush(stdout);	//手动清空缓冲区//读取指令//指令分割//子进程进行程序替换pid_t id = fork();if(id == 0){//直接执行程序替换,这里使用 execvpexecvp();	//具体细节先忽略exit(168); //替换失败后返回,这个值可以自定义 [0, 255]}//父进程等待子进程终止,回收僵尸进程int status = 0;waitpid(id, &status, 0);  //在等待队列中阻塞if(WIFEXITED(status)){//假如程序替换失败//关于打印的错误信息:也可以自定义,格式跟着标准走if(WEXITSTATUS(status) == 168)printf("%s: Error - %s\n", argv[0], "The directive is not yet defined");}else	//如果子进程被异常终止,打印相关信息printf("process run fail! [code_dump]:%d [exit_signal]:%d\n", (status >> 7) & 1, status & 0x7F);  //子进程异常终止的情况}return 0;
}

这只是简易版 bash 的基本框架,其他细节将会在后续补充完整


4、核心内容

核心内容主要为 读取切割替换 这三部分,逐一实现,首先从指令读取开始
大纲

4.1、指令读取

读取指令前,首先要清楚待读取命令可能有多长

  • 常见命令如 ls -a -l 长度不超过 10
  • 为了避免极端情况,这里预设命令最大长度为 1024
  • 使用数组进行指令存储(缓冲区)
#define COM_SIZE 1024char command[COM_SIZE];	//缓冲区

得到缓冲区后,就得考虑什么是指令?如何读取指令?

  • Linux 中的大部分指令由 指令 [选项] 构成,在 指令[选择] 间有空格
  • 常规的 scanf 无法正常读取指令,因为空格会触发输入缓冲区刷新
  • 这里主要使用 fgets 逐行读取,可以读取到空格
//读取指令
//因为有空格,所以需要逐行读取
fgets(command, COM_SIZE, stdin);
assert(command);  //不能输入空指令
(void)command; //防止在 Release 版本中出错command[strlen(command) - 1] = '\0';  //将最后一个字符 \n 变成 \0

注意: 可能存在读取失败的情况,assert 断言解决;因为 fgets 也会把最后的 '\n' 读进去,为了避免出错,手动置为 '\0'

4.2、指令分割

获得指令后,就需要将指令进行分割

就像伐木后需要再次分割利用一样,指令也需要经过分割才能利用~
伐木分割

为何要分割指令?

  • 程序替换时,需要使用 argv 表,这张表由 指令选项NULL 构成
  • 利用指令间的空格进行分割

如何分割指令?

  • C语言 提供了字符串分割函数 strtok,可以直接使用
  • 当然也可以手动实现分割

指令分割后呢?

  • 将分割好的指令段,依次存入 argv 表中,供后续程序替换使用
  • argv 表实际为一个指针数组,可以存储字符串

command 一样,表 argv 也需要考虑大小,这里设置为 64实际使用时也就分割为四五个指令段

#define ARGV_SIZE 64//指令分割//将连续的指令分割为 argv 表char* argv[ARGV_SIZE];	//指针数组split(argv, command);

利用 strtok 实现指令分割函数 split()

#define DEF_CHAR " "	//预设分割项,需为字符串void split(char* argv[ARGV_SIZE], char* ps)
{assert(argv && ps);//调用 C语言 中的 strtok 函数分割字符串int pos = 0;argv[pos++] = strtok(ps, DEF_CHAR);  //有空格就分割while(argv[pos++] = strtok(NULL, DEF_CHAR));  //不断分割argv[pos] = NULL; //确保安全
}

注意: 指令分割结束后,需要在添加 argv 表结尾 NULL

4.3、程序替换

获得实际可用的 argv 表后,就可以开始子进程程序替换操作了

这里使用的是函数 execvp,理由:

  • v 表示 vector,正好和我们的 argv 表对应
  • ppath,可以根据 argv[0](指令),在 PATH 中寻找该程序并替换

当然也可以使用 execve 系统级替换函数

//子进程进行程序替换
pid_t id = fork();
if(id == 0)
{//直接执行程序替换,这里使用 execvpexecvp(argv[0], argv);exit(168); //替换失败后返回
}

注意: 程序替换成功后,exit(168) 语句不会执行

4.4、实机演示

基本框架 + 核心内容 合并编译后,得到了这样一个程序:

动图Gif

动图展示
可以看到,bash 的基本雏形已经形成,不过还存在一些不足,比如 ls 命令显示文件无高亮、cd命令无法切换、环境变量无法添加至子进程等,这些问题都可以通过特殊处理避免


5、特殊情况处理

对特殊情况进行处理,使 myBash 更加完善

5.1、ls 显示高亮

系统中的 bash 在面对 ls 等文件显示指令时,不仅会显示内容,还会将特殊文件做颜色高亮处理,比如在我的环境下,可执行文件显示为绿色

实现原理

  • 在指令结尾加上 --color=auto 语句,即可实现高亮

实现原理
处理这个问题很简单,在指令分割结束后,判断是否为 ls,如果是,就在 argv 表后尾插入语句 --color=auto 即可

//特殊处理
//颜色高亮处理,识别是否为 ls 指令
if(strcmp(argv[0], "ls") == 0)
{int pos = 0;while(argv[pos++]); //找到尾argv[pos - 1] = (char*)"--color=auto"; //添加此字段argv[pos] = NULL; //结新尾
}

结果
注意:

  • 因为 argv 表中的元素类型为 char*,所以在尾插语句时,需要进行类型转换
  • 尾插语句后,需要再次添加结尾,确保安全

5.2、内建命令

内建命令是比较特殊的命令,不同于普通命令直接进行程序替换,内建命令需要进行特殊处理,比如 cd 命令调用系统级接口 chdir父进程(myBash) 进行目录间的移动

内建命令
资料来源:互联网

5.3、cd

首先实现不同目录间的切换

切换的本质:令当前 bash 移动至另一个目录下,不能直接使用 子进程 ,因为需要移动的是 父进程(bash)

对于当前的 myBash 来说,cd 没有丝毫效果,因为此时 指令会被拆分后交给子进程处理,这个方向本身就是错误的

错误结果
特殊情况特殊处理,同 ls 高亮一样,对指令进行识别,如果识别到 cd 命令,就直接调用 chdir 函数令当前进程 myBash 移动至指定目录即可(不必再创建子进程进行替换)

//目录间移动处理
if(strcmp(argv[0], "cd") == 0)
{//直接调用接口,然后 continue 不再执行后续代码if(strcmp(argv[1], "~") == 0)chdir("/home");  //回到家目录else if(strcmp(argv[1], "-") == 0)chdir(getenv("OLDPWD"));else if(argv[1])chdir(argv[1]);  //argv[1] 中就是路径continue;  //终止此次循环
}

正确结果

注意: 如果路径为空,不进行操作;如果路径为 ~,回到家目录;cd - 指令依赖于 OLDPWD 这个环境变量,直接拿来用即可

5.4、export

export 添加环境变量,添加的是父进程 myBash 的环境变量,而非子进程,需要特殊处理

解决方法:

  • 先将待添加的环境变量拷贝至缓冲区
  • 再从缓冲区中读取,并调用 putenv 函数添加至环境变量表

为何不能直接通过 putenv 添加至环境变量表中?

  • argv[1] 中的内容是不断变化的,不能直接使用
  • 一般用户自定义的环境变量,在 bash 中需要用户自己维护
  • 最好的方案就是使用缓冲区进行环境变量的拷贝放置,因为缓冲区中的内容不易变

错误体现:直接使用 putenv(argv[1]),导致第一次添加可能成功,但第二次添加后,第一次的环境变量会被覆盖

正确解法是借助缓冲区 myEnv

#define COM_SIZE 1024
#define ARGV_SIZE 64char myEnv[ARGV_SIZE][COM_SIZE];	//二维数组
int env_pos = 0;	//专门维护此缓冲区

注意: 此缓冲区定义在循环之外

char myEnv[COM_SIZE][ARGV_SIZE];  //大小与前面有关
int env_pos = 0;  //专门维护缓冲区
//这是一个始终运行的程序:bash
while(1)
{//…… 省略部分代码//环境变量相关if(strcmp(argv[0], "export") == 0){if(argv[1]){strcpy(myEnv[env_pos], argv[1]);putenv(myEnv[env_pos++]);}continue; //一样需要提前结束循环}
}

环境变量
除了 export 需要特殊处理外,env 查看环境变量表也需要特殊处理,因为此时的 env 查看的是 父进程(myBash) 的环境变量表,因此不需要将指令交给 子进程 处理

//注意:此函数实现于主函数外
void showEnv()
{extern char** environ;  //使用当前进行的环境变量表int pos = 0;for(; environ[pos]; printf("%s\n", environ[pos++]));
}//环境变量表
if(strcmp(argv[0], "env") == 0)
{showEnv();  //调用函数,打印父进程的环境变量表continue; //提前结束本次循环
}

完善后,env 指令显示的才是正确进程的环境变量表

5.5、echo

echo 命令也属于内建命令,其能实现很多功能,比如:查看环境变量查看最近一个进程的退出码输出重定向等,其中前两个实现比较简单,最后一个需要 基础IO 相关知识,后续更新补上

查看环境变量

echo 指令查看环境变量时,指令长这样 echo $环境变量,可以先判断 argv[1][0] 是否为 $,如果是,就直接根据 argv[1][1] 获取环境变量信息并打印即可

代码实现如下

//echo 相关
if(strcmp(argv[0], "echo") == 0)
{if(argv[1] && argv[1][0] == '$'){printf("%s\n", getenv(argv[1] + 1));}continue;
}

结果

echo 还能查看退出码:echo $?,对上述程序进行改造即可实现

退出码从何而来?

  • 很简单,父进程在等待子进程结束后,可以轻而易举的获取其退出码
  • 将退出码保存在一个全局变量中,供 echo $? 指令使用即可
int exit_code = 0;  //保存退出码的全局变量

代码实现:

//echo 相关
if(strcmp(argv[0], "echo") == 0)
{if(argv[1] && argv[1][0] == '$'){if(argv[1][1] == '?')printf("%d\n", exit_code);elseprintf("%s\n", getenv(argv[1] + 1));}continue;
}

结果
关于 echo 重定向的内容,后面有空再更新


6、源码

本次实现的 myBash 如下所示,拷贝编译运行后,即可使用

#include 
#include 
#include 
#include 
#include 
#include 
#include #define COM_SIZE 1024
#define ARGV_SIZE 64
#define DEF_CHAR " "void split(char* argv[ARGV_SIZE], char* ps)
{assert(argv && ps);//调用 C语言 中的 strtok 函数分割字符串int pos = 0;argv[pos++] = strtok(ps, DEF_CHAR);  //有空格就分割while(argv[pos++] = strtok(NULL, DEF_CHAR));  //不断分割argv[pos] = NULL; //确保安全
}void showEnv()
{extern char** environ;  //使用当前进行的环境变量表int pos = 0;for(; environ[pos]; printf("%s\n", environ[pos++]));
}int main()
{char myEnv[COM_SIZE][ARGV_SIZE];  //大小与前面有关int env_pos = 0;  //专门维护缓冲区int exit_code = 0;  //保存退出码的全局变量//这是一个始终运行的程序:bashwhile(1){char command[COM_SIZE]; //存放指令的数组(缓冲区)//打印提示符printf("[User@myBash default]$ ");fflush(stdout);//读取指令//因为有空格,所以需要逐行读取fgets(command, COM_SIZE, stdin);assert(command);  //不能输入空指令(void)command; //防止在 Release 版本中出错command[strlen(command) - 1] = '\0';  //将最后一个字符 \n 变成 \0//指令分割//将连续的指令分割为 argv 表char* argv[ARGV_SIZE];split(argv, command);//特殊处理//颜色高亮处理,识别是否为 ls 指令if(strcmp(argv[0], "ls") == 0){int pos = 0;while(argv[pos++]); //找到尾argv[pos - 1] = (char*)"--color=auto"; //添加此字段argv[pos] = NULL; //结尾}//目录间移动处理if(strcmp(argv[0], "cd") == 0){//直接调用接口,然后 continue 不再执行后续代码if(strcmp(argv[1], "~") == 0)chdir("/home");  //回到家目录else if(strcmp(argv[1], "-") == 0)chdir(getenv("OLDPWD"));else if(argv[1])chdir(argv[1]);  //argv[1] 中就是路径continue;  //终止此次循环}//环境变量相关if(strcmp(argv[0], "export") == 0){if(argv[1]){strcpy(myEnv[env_pos], argv[1]);putenv(myEnv[env_pos++]);}continue; //一样需要提前结束循环}//环境变量表if(strcmp(argv[0], "env") == 0){showEnv();  //调用函数,打印父进程的环境变量表continue; //提前结束本次循环}//echo 相关if(strcmp(argv[0], "echo") == 0){if(argv[1] && argv[1][0] == '$'){if(argv[1][1] == '?')printf("%d\n", exit_code);elseprintf("%s\n", getenv(argv[1] + 1));}continue;}//子进程进行程序替换pid_t id = fork();if(id == 0){//直接执行程序替换,这里使用 execvpexecvp(argv[0], argv);exit(168); //替换失败后返回}//父进程等待子进程终止int status = 0;waitpid(id, &status, 0);  //在等待队列中阻塞exit_code = WEXITSTATUS(status);if(WIFEXITED(status)){//假如程序替换失败if(exit_code == 168)printf("%s: Error - %s\n", argv[0], "The directive is not yet defined");}elseprintf("process run fail! [code_dump]:%d [exit_signal]:%d\n", (status >> 7) & 1, status & 0x7F);  //子进程异常终止的情况}return 0;
}

🌆总结

以上就是本次关于 简易版 bash 模拟实现 的全部内容了,相信你在看完本文后,也能手搓出一个简易版 bash

如果你觉得本文写的还不错的话,期待留下一个小小的赞👍,你的支持是我分享的最大动力!

如果本文有不足或错误的地方,随时欢迎指出,我会在第一时间改正


星辰大海

相关文章推荐

Linux进程控制【进程程序替换】

Linux进程控制【创建、终止、等待】

===============

Linux进程学习【进程地址】

Linux进程学习【环境变量】

Linux进程学习【进程状态】

Linux进程学习【基本认知】

感谢支持

相关内容

热门资讯

关于最新或2023(历届)青年...  进步自己艺术修养,全部构建和谐社会,正值青年节到来,以下是芒果教育网小编网罗的青年节放假告诉,欢迎...
17年国庆放假安排通知公告 国... 国庆节放假告诉是每一个放假的当地都要发布的,下面是小编为咱们带来的国庆节放假告诉范文,期待咱们参阅!...
最新或2023(历届)5月4日... 许多人在5月4日会疑问青年节是不是会放假?而上班是不是归于加班?以下是芒果教育网小编搜罗的最新或20...
今年最新页面紧急升级通知 今年...  电脑页面总是会呈现页面紧迫晋级告诉,那他要怎样写?下面小编整理了页面紧迫晋级告诉范文,期待阅览参阅...
最新或2023(历届)村底层... 村底层党安排换届推举作业计划最新或2023(历届)最新或2023(历届),全街10个村、社区党安排任...
最新或2023(历届)开展勇... 展开勇士留念日活动计划201X年8月31日,第十二届全国人民代表大会常务委员会第十次会议作出对于建立...
最新或2023(历届)展开婚... 市级展开全民终身学习周活动计划为“推进全民持续教学,建造学习型社会”,深化展开社区教学,推进学习型城...
最新或2023(历届)大学秋... 最新或2023(历届)大学秋季运动会计划一、 活动布景xx师范大学第四十八届田径运动会将于10月27...
最新或2023(历届)五查五... 五查五看施行计划为进一步展开好“机关风格整治年”活动,深化机关风格建造,实在加强机关效能建造,不断进...
最新或2023(历届)党员三... 最新或2023(历届)党员三比三争活动计划为遵循镇润发〔最新或2023(历届)〕36号文件,对于展开...
最新或2023(历届)农委三... 农委三比三争活动计划全省农经农业系统展开春季农业出产效劳 深化推动“三解三促”活动施行计划 为悉数贯...
最新或2023(历届)孩童万圣... 最新或2023(历届)孩童万圣节活动策划计划一、规划目的:每年的10月31日是外国的万圣节,这是他们...
最新或2023(历届)公司万圣... 最新或2023(历届)公司万圣节活动策划计划(1)万圣节相关内容的场内宣扬(2)喷绘3副(门口、活动...
最新或2023(历届)中学秋季... 最新或2023(历届)中学秋季运动会活动计划一、 运动会前期预备作业首先在学生会首次整体例会上对整体...
最新或2023(历届)中秋节... 一、目的:我们都知道中秋节是中国传统的节日,我们想知道更多的关于中国的中秋节的传统节日之一,努力去体...
最新或2023(历届)妇联三比... 环绕筠连县委、县政府展开的“三办理三激起三添加”主题实习活动,筠连县妇联活跃展开“三亮三比三争”活动...
最新或2023(历届)南京三... 近来,南京分公司党委联络公司实习,在“两学一做”学习教育中安排展开党员“三亮三比三争”主题实习活动,...
最新或2023(历届)三比三... 广大党员要紧扣“五查摆五处理五强化”,农村党员重点在带领大众致富、保护调和安稳、宏扬文明新风等方面作...
最新或2023(历届)社区三比... 社区三比三争活动计划为深化执行区委八届九次整体(扩大)会议精力,深化展开抢先创优活动,进一步进步政协...
银行干部入党申请书范文 入党转... 敬爱的党组织:我怀着十分激动的心情向党组织提出申请我志愿加人中国共产党,愿意为共产主义而奋斗终身。中...