文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

Linux系统调用之fork,getpid,getppid函数(进程相关函数,与G老师的对话,必看!)

2023-10-25 19:29

关注

前言

如果,想要深入的学习Linux系统调用中的fork,getpid,getppid函数,还是需要去自己阅读Linux系统中的帮助文档。
具体输入命令:

man 2 fork/getpid/getppid

即可查阅到完整的资料信息。

fork函数

fork() 函数是 UNIX/Linux 系统中的一个系统调用 (system call),它会创建一个新的进程,称为子进程,该子进程是原始进程的副本。

调用 fork() 后,两个进程都将从当前指令序列的下一条指令开始运行,但子进程完全复制了父进程的内存空间、打开文件等状态信息(子进程获得了对共享内存区域的独立控制权,即父进程和子进程之间不会相互干扰)。

我们可以通过返回值来区分是在哪个进程中。具体地讲,在父进程中,它返回子进程的 Process ID (PID) ,而在子进程中,它返回0.

fork()的函数原型是长这样的:

pid_t fork(void);

在使用这个函数之前,我们需要往C/C++文件中导入这些头文件:

#include
#include

下面用一个代码例子来演示一下fork函数的作用:

#include #include #include int main() {    int num = 10;    // 创建子进程    pid_t pid = fork();    // 判断是父进程还是子进程    if(pid > 0) {        // printf("pid : %d\n", pid);        // 如果大于0,返回的是创建的子进程的进程号,当前是父进程        printf("i am parent process, pid : %d, ppid : %d\n", getpid(), getppid());        printf("parent num : %d\n", num);        num += 10;        printf("parent num += 10 : %d\n", num);    } else if(pid == 0) {        // 当前是子进程        printf("i am child process, pid : %d, ppid : %d\n", getpid(),getppid());               printf("child num : %d\n", num);        num += 100;        printf("child num += 100 : %d\n", num);    }    // for循环    for(int i = 0; i < 3; i++) {        printf("i : %d , pid : %d\n", i , getpid());        sleep(1);    }    return 0;}

输出内容:

nowcoder@nowcoder:~/Linux/lession18$ cd "/home/nowcoder/Linux/lession18/" && gcc fork.c -o fork && "/home/nowcoder/Linux/lession18/"forki am parent process, pid : 29230, ppid : 28564parent num : 10parent num += 10 : 20i : 0 , pid : 29230i am child process, pid : 29231, ppid : 29230child num : 10child num += 100 : 110i : 0 , pid : 29231i : 1 , pid : 29230i : 1 , pid : 29231i : 2 , pid : 29230i : 2 , pid : 29231

在这个例子中,代表父进程的 if (pid > 0) 分支和代表子进程的 if (pid == 0) 分支会同时执行。

简单来说,fork() 的作用就是在程序中生成一个新的进程,这个新的进程和原有进程基本一致,除了 fork() 的返回值。这两个进程几乎是同时运行的。一般情况下,父进程将 fork() 的返回值保存,并通过这个唯一的返回值标识子进程。子进程也可以通过 getppid 获得其父进程的 PID.

实际上,更准确来说,Linux 的 fork() 使用是通过写时拷贝 (copy- on-write) 实现。写时拷贝是一种可以推迟甚至避免拷贝数据的技术。内核此时并不复制整个进程的地址空间,而是让父子进程共享同一个地址空间。只用在需要写入的时候才会复制地址空间,从而使各个进行拥有各自的地址空间。也就是说,资源的复制是在需要写入的时候才会进行,在此之前,只有以只读方式共享。

大概就向图中一样:
在这里插入图片描述

注意:fork之后父子进程共享文件,
fork产生的子进程与父进程相同的文件文件描述符指向相同的文件表,引用计数增加,共享文件偏移指针。

getpid函数

获取当前进程的pid。这个pid与ps命令里显示的进程id一致。

getppid函数

获取当前进程的父进程的id。这个ppid与ps命令里显示的进程id一致。

忽如其来的问答 (以下部分对理解内存方面的一些东西非常重要)

问:

父进程fork以后,子进程共享父进程的文件描述符表,这句话怎么理解。
Linux系统是不是有一个机制叫做”读时共享,写时拷贝“的机制。那我是不是理解为,父进程fork以后,在没有写入之前,父子进程共享一个文件描述符表。但是,一旦父进程或者子进程任意一方只要开始执行写入操作以后,子进程就会复制父进程写入之前的文件描述符表,自己单独一份呢?你看我理解的对不对

答:

您对子进程共享父进程的文件描述符表的理解部分正确,但与“读时共享,写时拷贝”(Copy-on-Write)机制有一些混淆。让我分别解释这两个概念。

继续追问

问:

把这两点合在一起理解就是,当父进程fork了一个子进程后,子进程与父进程共享相同的内存页(也就是此时它们是真的在同一张共享文件描述符表)。只有当父进程或子进程试图修改某个内存页时,系统才会复制该内存页,为执行写入操作的进程创建一个新的物理内存页。(这个新的内存页也就是父进程内存页的一个副本,子进程拥有着这个新的内存页,这个内存页上面也有父进程文件描述符表的信息)我理解的对吗?

答:

您将两个概念联系在一起的理解有些混淆。实际上,文件描述符表与“读时共享,写时拷贝”机制是两个不同层面的概念。让我们再次澄清一下:

再再次追问

问:

那我重新理解一下,父进程fork以后,父子进程各自拥有着各自的文件描述符的副本,但他们此时共享着同一块内存的资源。
但当发生了写入操作了以后,系统会复制一份内存的资源,然后让父子进程各自拥有着各自的内存的资源。
你看我理解的对吗?

答:

您的理解基本正确,但需要注意的是,这里的内存资源指的是物理内存页。让我们再次总结一下:

最后总结

我的总结

父进程fork之后,创建出了一个子进程。此时子进程与父进程共享相同的物理内存页。子进程拥有父进程文件描述符表的一个副本。(子进程与父进程不共享文件描述符表)
如果父进程执行写入操作,系统就会创建一个新的物理内存页给父进程,然后将原来的物理内存页上的内容拷贝到这个新的物理内存页上,然后再执行写入操作。
如果子进程执行写入操作,系统就会创建一个新的物理内存页给子进程,然后将原来的物理内存页上的内容拷贝到这个新的物理内存页上,然后再执行写入操作。
你看我理解的对吗?

老师的总结

是的,您的理解是正确的。在父进程 fork 之后:

子进程和父进程共享相同的物理内存页。
子进程拥有父进程文件描述符表的一个副本,它们各自有自己独立的文件描述符表。
当父进程或子进程执行写入操作时:

系统会为执行写入操作的进程(无论是父进程还是子进程)创建一个新的物理内存页。
将原来共享的物理内存页上的内容拷贝到新的物理内存页上。
在新的物理内存页上执行写入操作。
这种优化策略被称为“读时共享,写时拷贝”(Copy-on-Write),它可以在进程间共享资源的同时,有效地节省内存和提高性能。

最最最后一个问题

问:

最后问一下,这个物理内存页都记录了哪些信息呢?

答:

物理内存页(Physical Memory Page)是计算机内存管理的基本单位。在操作系统中,物理内存被划分为固定大小的页,通常为 4KB、2MB 或更大。物理内存页用于存储各种类型的数据和信息,包括:

程序代码:程序的可执行代码通常被加载到内存中,以便 CPU 能够直接访问和执行这些指令。

数据:程序运行时所需的各种数据,包括全局变量、静态变量等,都存储在内存中。这些数据可能在程序执行过程中被读取或修改。

堆内存:堆是一个动态内存分配区域,用于存储程序运行时动态分配的内存。堆内存的大小在程序运行过程中可能会发生变化,可以通过 malloc、calloc 等函数分配内存,通过 free 函数释放内存。

栈内存:栈是程序运行时的临时存储区,用于存储函数调用过程中的局部变量、函数参数以及返回地址等信息。栈内存由编译器自动分配和回收,具有后进先出(LIFO)的特点。

其他内核数据结构:操作系统会在内存中维护一些内核相关的数据结构,如进程控制块(PCB)、文件描述符表等,这些数据结构在操作系统中起着关键作用。

总之,物理内存页存储了程序执行所需的各种信息,如代码、数据、堆内存、栈内存等。这些信息在程序运行过程中可能被多个进程共享或独占。

来源地址:https://blog.csdn.net/weixin_49503250/article/details/129500813

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-人工智能
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯