PCB概念
每个进程在内核中都有一个进程控制块(PCB)来维护进程相关的信息,Linux内核的进程控制块是task_struct结构体, 其中包含以下信息。
- 进程id。系统中每个进程有唯一的id,在C语言中用pid_t类型表示,其实就是一个非 负整数。
- 进程的状态,有运行、挂起、停止、僵尸等状态。
- 进程切换时需要保存和恢复的一些CPU寄存器。
- 描述虚拟地址空间的信息。
- 描述控制终端的信息。
- 当前工作目录(Current Working Directory)。
- umask掩码。
- 文件描述符表,包含很多指向file结构体的指针。
- 和信号相关的信息。
- 用户id和组id。
- 控制终端、Session和进程组。
- 进程可以使用的资源上限(Resource Limit)。
fork和exec是本章要介绍的两个重要的系统调用。fork的作用是根据一个现有的进程复
制出一个新进程,原来的进程称为父进程(Parent Process),新进程称为子进程(Child Process)。进程原语: fork
#includepid_t fork(void);
子进程复制父进程的0到3g空间和父进程内核中的PCB,但id号不同。
fork调用一次返回两次.#include#include #include #include int main(){ pid_t pid; char *message; int n; pid = fork(); if(pid < 0){ perror("fork error!"); exit(1); }else if(pid == 0){ message = "This is the child\n"; n = 6; }else{ message = "This is the parent\n"; n = 3; } for(; n > 0; n--){ printf(message); sleep(1); } return 0;}
进程相关函数
#include#include pid_t getpid(void); //返回调用进程的PID号pid_t getppid(void); //返回调用进程父进程的PID号uid_t getuid(void); //返回实际用户IDuid_t geteuid(void); //返回有效用户IDgid_t getgid(void); //返回实际用户组IDgid_t getegid(void); //返回有效用户组ID
进程原语: exec族
用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),
子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的 用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建 新进程,所以调用exec前后该进程的id并未改变。 其实有六种以exec开头的函数,统称exec函数:#includeint execl(const char *path, const char *arg, ...);int execlp(const char *file, const char *arg, ...);int execle(const char *path, const char *arg, ..., char *const envp[]);int execv(const char *path, char *const argv[]);int execvp(const char *file, char *const argv[]);int execve(const char *path, char *const argv[], char *const envp[]);
这些函数如果调用成功则加载新的程序从启动代码开始执行,不再返回,如果调用出错
则返回-1,所以exec函数只有出错的返回值而没有成功的返回值。// 子进程创建成功后调用exex函数执行firefox程序#include#include #include int main(void){ pid_t pid; pid = fork(); if(pid == 0){ execl("/usr/bin/firefox", "firefox", "www.baidu.com", NULL); } else if(pid > 0){ while(1){ printf("parent\n"); sleep(1); } } else{ perror("fork"); exit(1); } return 0;}
进程原语: wait/waitpid
僵尸进程: 子进程退出,父进程没有回收子进程资源(PCB),则子进程变成僵尸进程
孤儿进程: 父进程先于子进程结束,则子进程成为孤儿进程,子进程的父进程变成1号 进程init进程,称为init进程领养孤儿进程#include#include pid_t wait(int *status);pid_t waitpid(pid_t pid, int *status, int options);
返回值:
< -1 回收指定进程组内的任意子进程 -1 回收任意子进程 0 回收和当前调用waitpid一个组的所有子进程 > 0 回收指定ID的子进程一个进程在终止时会关闭所有文件描述符,释放在用户空间分配的内存,但它的PCB还
保留着,内核在其中保存了一些信息:如果是正常终止则保存着退出状态,如果是异常终止 则保存着导致该进程终止的信号是哪个。这个进程的父进程可以调用wait或waitpid获取这 些信息,然后彻底清除掉这个进程。如果一个进程已经终止,但是它的父进程尚未调用wait或waitpid对它进行清理,这时 的进程状态称为僵尸(Zombie)进程。任何进程在刚终止时都是僵尸进程,正常情况下,僵
尸进程都立刻被父进程清理了,为了观察到僵尸进程,我们自己写一个不正常的程序,父进 程fork出子进程,子进程终止,而父进程既不终止也不调用wait清理子进程, 程序运行时在另一个终端输入ps aux
可以看到处于僵尸状态的子进程. #include#include int main(void){ pid_t pid = fork(); if(pid < 0) { perror("fork"); exit(1); } if(pid > 0) {/* parent */ while(1); } /* child */ return 0;}
若调用成功则返回清理掉的子进程id,若调用出错则返回-1。父进程调用wait或waitpid时可能会:
- 阻塞(如果它的所有子进程都还在运行)。
- 带子进程的终止信息立即返回(如果一个子进程已终止,正等待父进程读取其终止信 息)。
- 出错立即返回(如果它没有任何子进程)。
这两个函数的区别是:
- 如果父进程的所有子进程都还在运行,调用wait将使父进程阻塞,而调用waitpid时如 果在options参数中指定WNOHANG可以使父进程不阻塞而立即返回0。
- wait等待第一个终止的子进程,而waitpid可以通过pid参数指定等待哪一个子进程。
可见,调用wait和waitpid不仅可以获得子进程的终止信息,还可以使父进程阻塞等待子进
程终止,起到进程间同步的作用。如果参数status不是空指针,则子进程的终止信息通过 这个参数传出,如果只是为了同步而不关心子进程的终止信息,可以将status参数指定为 NULL。#include#include #include #include #include int main(){ pid_t pid; pid = fork(); if(pid > 0){ // 当前处于父进程 while(1){ printf("I'm parent, parent id = %d\n", getpid()); // 通过父进程回收子进程的PCB, wait返回值是子进程的ID号 // 直到回收完子进程才会继续执行父进程, wait是一个阻塞函数 printf("wait for child pid = %d\n", wait(NULL)); sleep(1); } }else if(pid == 0){ // 子进程结束后变成僵尸进程 printf("I'm child, child id = %d\n", getpid()); sleep(3); // 用户空间已经释放掉了, 但是PCB没有释放, PCB要等待父进程回收 }else{ perror("fock"); exit(1); } return 0;}/* 运行结果$ ./a.out I'm parent, parent id = 13351I'm child, child id = 13352[由于父进程的wait阻塞机制, 中间会等待3秒, 直到回收完子进程才会继续执行父进程]wait for child pid = 13352I'm parent, parent id = 13351wait for child pid = -1 [已经回收完子进程了, 返回-1]I'm parent, parent id = 13351wait for child pid = -1*/
#include#include #include #include #include int main(void){ pid_t pid; pid = fork(); if (pid < 0) { perror("fork failed"); exit(1); } if (pid == 0) { int i; for (i = 3; i > 0; i--) { printf("This is the child\n"); sleep(1); } exit(3); } else { int stat_val; waitpid(pid, &stat_val, 0); if (WIFEXITED(stat_val)) printf("Child exited with code %d\n", WEXITSTATUS(stat_val)); else if (WIFSIGNALED(stat_val)) printf("Child terminated abnormally, signal %d\n", WTERMSIG(stat_val)); } return 0;}/*This is the childThis is the childThis is the childChild exited with code 3*/