程序是包含一系列信息的文件,这些信息描述了如何在运行时创建一个进程。
进程是正在运行的程序的实例。是一个具有一定独立功能的程序关于某个数据集合的一次运行活动。它是操作系统动态执行的基本单元,在传统的操作系统中,进程既是基本的分配单元,也是基本的执行单元。实际上,进程是操作系统为正在运行的程序所分配的计算机资源的抽象。
进程和程序的区别:程序是存储在计算机磁盘中的可执行程序,不占用计算机的其他资源;而进程是正在运行的程序的实例,会占用计算机的内存和CPU资源。
从内核的角度看,进程由用户内存空间和一系列内核数据结构组成,其中用户内存空间包含了程序代码及代码所使用的变量,而内核数据结构则用于维护进程状态信息。
- 单道程序VS多道程序
单道程序: 在计算机内存中只允许一个的程序运行;
多道程序: 多道程序设计技术是在计算机内存中同时存放几道相互独立的程序,使它们在管理程序控制下,相互穿插运行,两个或两个以上程序在计算机系统中同处于开始到结束之间的状态, 这些程序共享计算机系统资源。引入多道程序设计技术的根本目的是为了提高 CPU 的利用率。微观上,同一时刻还是正在运行的程序还是只有一个。
时间片:操作系统分配给每个正在运行的进程微观上的一段 CPU 时间(在Linux上为 5ms-800ms)。时间片由操作系统内核的调度程序分配给每个进程。时间片不能过于小,因为在切换时操作系统需要通过进程调度程序来保存当前的程序的执行状态,然后加载其他程序的执行状态,这个过程需要一定的时间。
时间片由操作系统内核的调度程序分配给每个进程。首先,内核会给每个进程分配相等的初始时间片,然后每个进程轮番地执行相应的时间,当所有进程都处于时间片耗尽的状态时,内核会重新为每个进程计算并分配时间片,如此往复。自行了解进程调度算法、策略。
并行VS并发
- 并行(parallel):指在同一时刻,有多条指令在多个处理器上同时执行。
- 并发(concurrency):指在同一时刻只能有一条指令执行,但多个进程指令被快速的轮换执行,使得在宏观上具有多个进程同时执行的效果,但在微观上并不是同时执行的,只是把时间分成若干段,使多个进程快速交替的执行(微观上快速切换)。
- 进程控制块
为了管理进程,内核必须对每个进程所做的事情进行清楚的描述。内核为每个进程分配一个 PCB(Processing Control Block)进程控制块,维护进程相关的信息,Linux 内核的进程控制块是 task_struct
结构体(位于/usr/src/linux-headers-xxx/include/linux/sched.h
中)。
- 进程id:系统中每个进程有唯一的 id,用 pid_t 类型表示,其实就是一个非负整数
- 进程的状态:有就绪、运行、挂起、停止等状态
- 进程切换时需要保存和恢复的一些CPU寄存器
- 描述虚拟地址空间的信息
- 描述控制终端的信息
- 当前工作目录(Current Working Directory)
- umask 掩码
- 文件描述符表,包含很多指向 file 结构体的指针
- 和信号相关的信息
- 用户 id 和组 id
- 会话(Session)和进程组
- 进程可以使用的资源上限(Resource Limit)
通过
ulimit -a
可以查询计算机系统的资源上限。
- 进程状态反映进程执行过程的变化。这些状态随着进程的执行和外界条件的变化而转换。在三态模型中,进程状态分为三个基本状态,即就绪态,运行态,阻塞态。在五态模型中,进程分为新建态、就绪态,运行态,阻塞态,终止态。
- 运行态:进程占有处理器正在运行.
- 就绪态:进程具备运行条件,等待系统分配处理器以便运行。当进程已分配到除CPU以外的所有必要资源后,只要再获得CPU,便可立即执行。在一个系统中处于就绪状态的进程可能有多个,通常将它们排成一个队列,称为就绪队列.
- 阻塞态:又称为等待(wait)态或睡眠(sleep)态,指进程不具备运行条件,正在等待某个事件的完成.
阻塞态无法直接转换为运行态,而是需要转换为就绪态。
- 新建态:进程刚被创建时的状态,尚未进入就绪队列.
- 终止态:进程完成任务到达正常结束点,或出现无法克服的错误而异常终止,或被操作系统及有终止权的进程所终止时所处的状态。进入终止态的进程以后不再执行,但依然保留在操作系统中等待善后。一旦其他进程完成了对终止态进程的信息抽取之后,操作系统将删除该进程.
终止后的进程无法继续运行,因为其虚拟地址空间中用户区已经被释放,而内核区等待被善后。
- 相关shell指令
- 查看进程(静态,快照)
ps aux/ajx
- a:显示终端上的所有进程
- u: 显示进程详细信息
- x:显示没有控制终端的进程
- j: 列出与作业控制相关的信息
- 状态:
- D:不可中断
- R: 正在运行
- S: 处于睡眠状态
- T: 停止或被跟踪
- Z:僵尸进程
- W:进入内存交换
- X:死掉的进程
- <:高优先级
- N:低优先级
- s:包含子进程
- +:位于前台的进程组
- 查看进程(动态显示)
top
,可在其后加-d
用于指定更新的时间间隔。显示时可以通过按键对显示结果进行排序(M为按内存使用量排序、P按CPU占有率、T按进程运行时间长短、U按用户名筛选进程、K接PID为杀死对应的进程)。
- 杀死进程
kill [-signal] pid
: 杀死对应的进程kill -l
:列出所有的信号kill -SIGKILL pid/kill -9 pid
: 强制杀死对应进程killall name
: 根据进程名杀死进程
- 进程号:每个进程都由进程号来标识,其类型为 pid_t(整型),进程号的范围: 0~ 32767。进程号总是唯一的,但可以重用。当一个进程终止后,其进程号就可以再次使用。任何进程(除init进程)都是由另一个进程创建,该进程称为被创建进程的父进程,对应的进程号称为父进程号(PPID)。
- 相关函数
pid_t getpid(void);
pid_t getppid(void);
pis_t getpgid(void);