[ PHP 内核与扩展开发系列] PHP 生命周期 —— 启动、终止与模式


启动与终止

PHP程序的启动可以看作有两个概念上的启动,终止也有两个概念上的终止。 其中一个是 PHP 作为Apache(拿它举例,板砖勿扔)的一个模块的启动与终止, 这次启动 PHP 会初始化一些必要数据,比如与宿主 Apache 有关的,并且这些数据是常驻内存的,终止与之相对。还有一个概念上的启动就是当 Apache 分配一个页面请求过来的时候,PHP会有一次启动与终止,这也是我们最常讨论的一种。

现在我们主要来看一个 PHP 扩展的生命旅程是怎样走完这四个过程的。

在最初初始化的时候,就是 PHP 随着 Apache 的启动而诞生在内存里的时候,它会把自己所有已加载扩展的 MINIT 方法(全称 Module Initialization,是由每个模块自己定义的函数)都执行一遍。在这个时间里,扩展可以定义一些自己的常量、类、资源等所有会被用户端的 PHP 脚本用到的东西。但你要记住,这里定义的东西都会随着 Apache 常驻内存,可以被所有请求使用,直到 Apache 卸载掉 PHP 模块。

内核中预置了 PHP_MINIT_FUNCTION 宏函数,来帮助我们实现这个功能:

//抛弃作者那个例子,书才看两页整那样的例子太复杂了!
//walu是我扩展的名称
int time_of_minit; // 在MINIT()中初始化,在每次页面请求中输出,看看是否变化
PHP_MINIT_FUNCTION(walu)
{
    time_of_minit=time(NULL); //我们在MINIT启动中对它初始化
    return SUCCESS; //返回SUCCESS代表正常,返回FALIURE就不会加载这个扩展了。
}

当一个页面请求到来时候,PHP 会迅速开辟一个新的环境,并重新扫描自己的各个扩展,遍历执行它们各自的RINIT 方法(俗称 Request Initialization),这时候一个扩展可能会初始化在本次请求中会使用到的变量等, 还会初始化用户端(即 PHP 脚本)中的变量之类的,内核预置了 PHP_RINIT_FUNCTION() 这个宏函数来帮我们实现这个功能:

int time_of_rinit; //在RINIT里初始化,看看每次页面请求的时候是否变化。
PHP_RINIT_FUNCTION(walu)
{
    time_of_rinit=time(NULL);
    return SUCCESS;
}

好了,现在这个页面请求执行的差不多了,可能是顺利的走到了自己文件的最后,也可能是出师未捷,半道被用户给 die 或者 exit 了, 这时候 PHP 便会启动回收程序,收拾这个请求留下的烂摊子。它这次会执行所有已加载扩展的 RSHUTDOWN(俗称 Request Shutdown)方法, 这时候扩展可以抓紧利用内核中的变量表之类的做一些事情, 因为一旦 PHP 把所有扩展的 RSHUTDOWN 方法执行完, 便会释放掉这次请求使用过的所有东西, 包括变量表的所有变量、所有在这次请求中申请的内存等等。

内核预置了 PHP_RSHUTDOWN_FUNCTION 宏函数来帮助我们实现这个功能

PHP_RSHUTDOWN_FUNCTION(walu)
{
    FILE *fp=fopen("time_rshutdown.txt","a+");
    fprintf(fp,"%ld\n",time(NULL)); //让我们看看是不是每次请求结束都会在这个文件里追加数据
    fclose(fp);
    return SUCCESS;
}

前面该启动的也启动了,该结束的也结束了,现在该 Apache 老人家歇歇的时候,当 Apache 通知 PHP 自己要 Stop 的时候,PHP 便进入 MSHUTDOWN(俗称Module Shutdown)阶段。这时候 PHP 便会给所有扩展下最后通牒,如果哪个扩展还有未了的心愿,就放在自己 MSHUTDOWN 方法里,这可是最后的机会了,一旦 PHP 把扩展的 MSHUTDOWN 执行完,便会进入自毁程序,这里一定要把自己擅自申请的内存给释放掉,否则就杯具了。

内核中预置了 PHP_MSHUTDOWN_FUNCTION 宏函数来帮助我们实现这个功能:

PHP_MSHUTDOWN_FUNCTION(walu)
{
    FILE *fp=fopen("time_mshutdown.txt","a+");
    fprintf(fp,"%ld\n",time(NULL));
    return SUCCESS;
}

这四个宏都是在 walu.c 里完成最终实现的,而他们的则是在 /main/php.h 里被定义的(其实也是调用的别的宏,本节最后我把这几个宏给展开了,供有需要的人查看)。

好了,现在我们本节内容说完了,下面我们把所有的代码合在一起,并预测一下应该出现的结果:

//这些代码都在walu.c里面,不在.h里

int time_of_minit; //在MINIT中初始化,在每次页面请求中输出,看看是否变化
PHP_MINIT_FUNCTION(walu)
{
    time_of_minit=time(NULL); //我们在MINIT启动中对他初始化
    return SUCCESS;
}

int time_of_rinit;//在RINIT里初始化,看看每次页面请求的时候是否变化。
PHP_RINIT_FUNCTION(walu)
{
    time_of_rinit=time(NULL);
    return SUCCESS;
}

PHP_RSHUTDOWN_FUNCTION(walu)
{
    FILE *fp=fopen("/cnan/www/erzha/time_rshutdown.txt","a+"); //请确保文件可写,否则apache会莫名崩溃
    fprintf(fp,"%d\n",time(NULL)); //让我们看看是不是每次请求结束都会在这个文件里追加数据
    fclose(fp);
    return SUCCESS;
}

PHP_MSHUTDOWN_FUNCTION(walu)
{
    FILE *fp=fopen("/cnan/www/erzha/time_mshutdown.txt","a+"); //请确保文件可写,否则apache会莫名崩溃
    fprintf(fp,"%d\n",time(NULL));
    return SUCCESS;
}

//我们在页面里输出time_of_minit和time_of_rinit的值
PHP_FUNCTION(walu_test)
{
    php_printf("%d<br />",time_of_minit);
    php_printf("%d<br />",time_of_rinit);
    return;
}
  • time_of_minit 的值每次请求都不变。
  • time_of_rinit 的值每次请求都改变。
  • 每次页面请求结束都会往 time_rshutdown.txt 中写入数据。
  • 只有在 Apache 结束后 time_mshutdown.txt 才写入有数据。

启动模式

一个 PHP 实例,无论通过 HTTP 请求调用的,还是从命令行启动的,都会依次进行 Module init、Request init、Request Shutdown、Module shutdown 四个过程, 当然之间还会执行脚本自己的逻辑。 那么两种 init 和两种 shutdown 各会执行多少次、各自的执行频率有多少呢?这取决于 PHP 是用什么 SAPI 与宿主通信的。最常见的四种方式如下所列:

  • 直接以 CLI/CGI 模式调用
  • 多进程模式
  • 多线程模式
  • Embedded(嵌入式,在自己的 C 程序中调用 Zend Engine)

CLI/CGI

CLI 和 CGI 的 SAPI 是相当特殊的,因为这时 PHP 的生命周期完全在一个单独的请求中完成。虽然简单,不过我们以前提过的两种 init 和两种 shutdown 仍然都会被执行。下图展示了PHP在这种模式下是怎么工作的:

cli:cgi

多进程模式

ps:书是2006年出版的,所以你应该理解作者说多进程是主流
PHP 最常见的工作方式便是编译成为 Apache2 的 Pre-fork MPM 或者 Apache1 的 APXS 模式,其它 Web 服务器也大多用相同的方式工作,在本书后面,把这种方式统一叫做多进程方式。给它起这个名字是有原因的,不是随便拍拍屁股拍拍脑袋定下来的。当 Apache 启动的时候,会立即把自己 fork 出好几个子进程,每一个进程都有自己独立的内存空间, 也就代表了有自己独立的变量、函数等。在每个进程里的PHP的工作方式如下图所示:

multiprocess

因为是 fork 出来的,所以各个进程间的数据是彼此独立,不会受到外界的干扰(ps:fork 后可以用管道等方式实现进程间通信)。这是一片独立天地,它允许每个子进程做任何事情,玩七十码、躲猫猫都没人管,办公室拿砍刀玩自杀也没事,下图展示了从 Apache 的视角来看多进程工作模式下的 PHP:

multiprocess2

多线程模式

随着时代的进步,PHP 越来越多地在多线程模式下工作,就像 IIS 的 isapi 和 Apache MPM worker(支持混合的多线程多进程的多路处理模块)。在这种模式下,只有一个服务器进程在运行着,但会同时运行很多线程,这样可以减少一些资源开销,像 Module init 和 Module shutdown 就只需要运行一次就行了,一些全局变量也只需要初始化一次,因为线程独具的特质,使得各个请求之间方便的共享一些数据成为可能。

其实多线程与 MINIT、MSHUTDOWN 只执行一次并没有什么联系,多进程模式下一样可以实现。
下图展示了在这种模式下 PHP 的工作流程:

multiprocess2

Embed

Embed SAPI 是一种比较特殊的 SAPI,容许你在 C/C++ 语言中调用 PHP/ZE 提供的函数。并且这种 SAPI 和上面的三种一样,按 Module Init、Request Init、Rshutdown、mshutdown 的流程执行着。 当然,这只是其中一种情况。因为特定的应用有自己特殊的需求,只是在处理 PHP 脚本这个环节基本一致。

真正令 Emebed 模式独特的是因为它可能随时嵌入到某个程序里面去(比如你的 test.exe 里), 然后被当作脚本的一部分在一个请求的时候执行。控制权在 PHP 和原程序间来回传递。关于嵌入式的 PHP 在第20章会有应用,到时我们再用实例介绍这个不经常使用的 SAPI。


点赞 取消点赞 收藏 取消收藏

<< 上一篇: [ PHP 内核与扩展开发系列] PHP 生命周期 —— 从 SAPI 开始

>> 下一篇: [ PHP 内核与扩展开发系列] 变量在内核中的实现 —— 变量类型