TLPI-Chapter 6 进程

每个进程都有一个唯一进程标识号（process ID),并保存有对其父进程号的记录。
进程的虚拟内存逻辑上被划分为许多段：文本段、数据段、栈和堆。
栈由一系列帧组成，随函数调用而增长，随函数返回而减，每个帧都包含有函数局部变量、函数实参以及单个函数调用的调用链接信息。
程序调用时命令行参数通过argc argv参数提供给main()函数。通常argv[0]包含调用程序的名称。
每个进程都会获得其父进程环境列表的一个副本，即一组”名称-值“的键值对。全局变量environ和各种库函数允许进程访问和修改其环境列表中的变量。
setjmp()函数和longjmp()函数提供了从函数甲执行非局部跳转到函数乙的方法。在调用这些函数时，为避免编译器优化所引发的问题，应使用volatile修饰符声明变量。非局部跳转会使程序难以阅读和维护，应尽量避免使用。
进程是一个可执行程序的实例。一个程序可以创建很多进程。
进程是由内核定义的抽象实体，内核为此实体分配执行程序所需的系统资源。
从内核的角度来看，进程是由用户内存空间和内核数据结构组成的。程序的代码和代码中的变量存放在用户内存空间，内核数据结构用于维护进程状态信息。
对于每个进程都有一个唯一的进程号（进程ID）（正数），用来标识系统中的某个程序。
系统调用getpid()返回调用进程的进程号。
系统调用getppid()可以检索到父进程的进程号。
使用命令pstree可以查看进程树。
如果子进程的父进程终止，则子进程就会变成孤儿，Init进程随即收养该进程，子进程后续对getppid()调用将返回进程号1.
在Linux系统中可以查看/proc/进程PID/status中PPid字段获知该进程的父进程。
本章中介绍的进程内存布局可以参考文章C内存布局,本书48.5节会更详细介绍进程内存布局。

#define _BSD_SOURCE
#include <stdio.h>
#include <stdlib.h>

char globBuf[65536];            /* Uninitialized data segment */
int primes[] = { 2, 3, 5, 7 };  /* Initialized data segment */

static int
square(int x)                   /* Allocated in frame for square() */
{
    int result;                 /* Allocated in frame for square() */

    result = x * x;
    return result;              /* Return value passed via register */
}

static void
doCalc(int val)                 /* Allocated in frame for doCalc() */
{
    printf("The square of %d is %d\n", val, square(val));

    if (val < 1000) {
        int t;                  /* Allocated in frame for doCalc() */

        t = val * val * val;
        printf("The cube of %d is %d\n", val, t);
    }
}

int
main(int argc, char *argv[])    /* Allocated in frame for main() */
{
    static int key = 9973;      /* Initialized data segment */
    static char mbuf[10240000]; /* Uninitialized data segment */
    char *p;                    /* Allocated in frame for main() */

    p = malloc(1024);           /* Points to memory in heap segment */

    doCalc(key);

    exit(EXIT_SUCCESS);
}

可以通过将上述代码中的内容只保留main函数其余注释掉之后编译，size 查看结构，然后在取消注释之后，逐步查看size的不同，进而确定该类型变量在内存中的布局.

环境列表

每个进程都有与自己相关的环境列表。
每条记录的形式为name=value；
新进程创建时会继承父进程的环境副本（原始的进程间通信方式。
可以通过printenv输出当前的环境列表：
在linux系统中通过查看/proc/进程PID/environ文件可以查看相应的环境列表。

char *getenv(const char *name);

对于存在name的环境变量就返回对应的value的指针，如果不存在就返回NULL

int putenv(char *string);

将name=value形式的字符串添加到当前的环境列表。成功返回0,失败返回非0值。
putenv是将environ变量的某个元素指向string指向的位置，并不是指向string指向字符串的副本。所以如果修改string指向的内容，环境变量也会改变，因此string指向后来不能是自动变量。
当string里不包含等号的时候，将会在环境列表移除string命名的环境变量。

int setenv(const char *name, const char *value, int overwrite);

name，value与name=value对应，overwrite决定时候改变环境。如果以name标识的变量存在环境里而且overwrite为0,就不改变环境；否则如果overwrite不为0就总是改变环境。
成功返回0, 失败返回-1
不同与putenv，setenv是分配一块内存缓冲区，将name和value指向的字符串复制到缓冲区里。

int unsetenv(const char *name);

移除name标识的变量
成功调用返回0,失败返回-1。

int clearenv(void);

成功调用返回0,失败返回非0值。
setenv和clearenv会导致内存泄露：setenv分配了一块内存缓冲区，但是clearenv没有释放这个缓冲区。
例子：

#define _GNU_SOURCE     /* Get various declarations from <stdlib.h> */
#include <stdlib.h>
#include "tlpi_hdr.h"

extern char **environ;

int
main(int argc, char *argv[])
{
    int j;
    char **ep;

    clearenv();         /* Erase entire environment */

    /* Add any definitions specified on command line to environment */

    for (j = 1; j < argc; j++)
        if (putenv(argv[j]) != 0)
            errExit("putenv: %s", argv[j]);

    /* Add a definition for GREET if one does not already exist */

    if (setenv("GREET", "Hello world", 0) == -1)
        errExit("setenv");

    /* Remove any existing definition of BYE */

    unsetenv("BYE");

    /* Display current environment */

    for (ep = environ; *ep != NULL; ep++)
        puts(*ep);

    exit(EXIT_SUCCESS);
}

命令行参数相关讲解参考文章C语言命令行参数

执行非局部跳转setjmp()和longjmp()

setjmp()函数和longjmp()函数提供了从函数甲执行非局部跳转到函数乙的方式。
示例代码：

#include <setjmp.h>
#include "tlpi_hdr.h"

static jmp_buf env;

static void
f2(void)
{
    longjmp(env, 2);
}

static void
f1(int argc)
{
    if (argc == 1)
        longjmp(env, 1);
    f2();
}

int
main(int argc, char *argv[])
{
    switch (setjmp(env)) {
    case 0:     /* This is the return after the initial setjmp() */
        printf("Calling f1() after initial setjmp()\n");
        f1(argc);               /* Never returns... */
        break;                  /* ... but this is good form */

    case 1:
        printf("We jumped back from f1()\n");
        break;

    case 2:
        printf("We jumped back from f2()\n");
        break;
    }

    exit(EXIT_SUCCESS);
}

代码解析：
上面代码保存为longjmp.c，运行./longjmp此时argc为1，如果我输入./longjmp x argc不为1，上述代码setjmp只有在第一次执行时返回0，然后下次执行时通过longjmp跳转过来，通过longjmp设置的值就是setjmp返回的值，本例中f1中返回1，f2中返回2.

#include <stdio.h>
#include <stdlib.h>
#include <setjmp.h>

static jmp_buf env;

static void
doJump(int nvar, int rvar, int vvar)
{
    printf("Inside doJump(): nvar=%d rvar=%d vvar=%d\n", nvar, rvar, vvar);
    longjmp(env, 1);
}

int
main(int argc, char *argv[])
{
     int nvar;
     register int rvar;          /* Allocated in register if possible */
    volatile int vvar;          /* See text */

    nvar = 111;
    rvar = 222;
    vvar = 333;

    if (setjmp(env) == 0) {     /* Code executed after setjmp() */
        nvar = 777;
        rvar = 888;
        vvar = 999;
        doJump(nvar, rvar, vvar);

    } else {                    /* Code executed after longjmp() */

        printf("After longjmp(): nvar=%d rvar=%d vvar=%d\n", nvar, rvar, vvar);
    }

    exit(EXIT_SUCCESS);
}

代码讲解：
gcc -o setjmp_vars setjmp_vars.c
gcc -O -o setjmp_vars setjmp_vars.c
-O选项是开启编译器优化，上述例子中如果不将局部变量定义为volatile的话在调用setjmp()的函数中会存在问题。所以为避免编译器优化所引发的问题，应使用volatile修饰符声明变量。

52coder

TLPI-Chapter 6 进程

环境列表

执行非局部跳转setjmp()和longjmp()