以前对se特别感兴趣,但是自己又不会java,lucene等搜索引擎开发工具,于是不断挖掘php的功效。

最后发现php也可以做抓取,并且原理很易:直接获取页面源文件,然后通过正则或字符串的参照截取来获取需要的信息。但是性能上不能和搜索引擎的多线程抓取相比。

实现了上一步之后,又思考着,如果抓取可以自动定时获取,那么人工运行可执行页面也就省下来了。

后来也在一些php开源程序中了解到关于"计划任务"的效果:可以定时运行某程序,比如数据库备份,更新缓存,生成静态页面,生成网站地图等。

最近由于项目需要定时更新远程数据库到本地,网上搜了搜,还真找到了。

ignore_user_abort();函数搭配set_time_limit(0);和sleep($interval);即可实现以上自动更新。

先给出一个基本的范式,其中有个人的测试程序:

<?php
ignore_user_abort(); // run script. in background
set_time_limit(0); // run script. forever
$interval=30; // do every 15 minutes...
do{
$fp = fopen('text3.txt','a');
fwrite($fp,'test');
fclose($fp);
sleep($interval); // wait 15 minutes
}while(true);
?>

首先运行该程序,然后关闭该页面,程序仍然运行中,test会每隔30秒的填补到text3.txt文件。

实现效果如图:(略)

最后根据php手册简单介绍一些相关的知识:

1.连接处理:

在 PHP 内部,系统维护着连接状态,其状态有三种可能的情况:

0 - NORMAL(正常)
1 - ABORTED(异常退出)
2 - TIMEOUT(超时)

当 PHP 脚本正常地运行 NORMAL 状态时,连接为有效。当远程客户端中断连接时,ABORTED 状态的标记将会被打开。远程客户端连接的中断通常是由用户点击 STOP 按钮导致的。当连接时间超过 PHP 的时限时,TIMEOUT 状态的标记将被打开。

可以决定脚本是否需要在客户端中断连接时退出。有时候让脚本完整地运行会带来很多方便,即使没有远程浏览器接受脚本的输出。默认的情况是当远程客户端连接中断时脚本将会退出。该处理过程可由 php.ini 的 ignore_user_abort 或由 Apache .conf 设置中对应的"php_value ignore_user_abort"以及 ignore_user_abort() 函数来控制。如果没有告诉 PHP 忽略用户的中断,脚本将会被中断,除非通过 register_shutdown_function() 设置了关闭触发函数。通过该关闭触发函数,当远程用户点击 STOP 按钮后,脚本再次尝试输出数据时,PHP 将会检测到连接已被中断,并调用关闭触发函数。

脚本也有可能被内置的脚本计时器中断。默认的超时限制为 30 秒。这个值可以通过设置 php.ini 的 max_execution_time 或 Apache .conf 设置中对应的"php_value max_execution_time"参数或者 set_time_limit() 函数来更改。当计数器超时的时候,脚本将会类似于以上连接中断的情况退出,先前被注册过的关闭触发函数也将在这时被执行。在该关闭触发函数中,可以通过调用 connection_status() 函数来检查超时是否导致关闭触发函数被调用。如果超时导致了关闭触发函数的调用,该函数将返回 2。

需要注意的一点是 ABORTED 和 TIMEOUT 状态可以同时有效。这在告诉 PHP 忽略用户的退出操作时是可能的。PHP 将仍然注意用户已经中断了连接但脚本仍然在运行的情况。如果到了运行的时间限制,脚本将被退出,设置过的关闭触发函数也将被执行。在这时会发现函数 connection_status() 返回 3。

2.相关函数:

int ignore_user_abort ( [bool setting] )
This function sets whether a client disconnect should cause a script. to be aborted. It will return the previous setting and can be called without an argument to not change the current setting and only return the current setting.

int connection_aborted ( void )
Returns TRUE if client disconnected.

int connection_status ( void )
Returns the connection status bitfield.

最新文章

  1. Leetcode 121 Best Time to Buy and Sell Stock 动态规划
  2. 我在用的mac软件(2)-终端环境之zsh和z(*nix都适用)
  3. Eclipse快捷键 10个最有用的快捷键【转】
  4. 【转】visual studio 2012进行C语言开发[图文]
  5. ashx-auth-黑色简洁验证码
  6. Android开源项目发现--- 工具类数据库ORM篇(持续更新)
  7. PowerDesigner 对 Oracle 作 逆向工程
  8. Redis MSET的极限在哪里
  9. jquery中ajax跨域提交的时候会有2次请求
  10. 【Zabbix】zabbix设置邮件报警
  11. swift 学习- 11 -- 属性
  12. Hibernate 查询技术
  13. FreeRTOS
  14. Oracle数据库 插入数据格式,简单查询
  15. windows中连接hive-客户端
  16. BZOJ.4695.最假女选手(线段树 Segment tree Beats!)
  17. rviz学习笔记(二)——Markers: Points and Lines (C++) 点和线
  18. Android Studio入门指南 (历上最全,全球首发)
  19. llg的农场(farm)
  20. Matlab一个错误引发的血案:??? Error using ==&gt; str2num Requires string or character array input.

热门文章

  1. Dubbo入门实例--转载
  2. C++11笔记
  3. HDU 2222 (AC自动机模板题)
  4. 基本输入输出系统BIOS---显示输出
  5. QT多线程笔记
  6. 【转】Phonegap离线调用SQLite数据库文件
  7. 《Genesis-3D开源游戏引擎完整实例教程-2D射击游戏篇04:碰撞检测》
  8. windows下安装和配置Weka
  9. 现代程序设计homework——04
  10. JavaIO(01)File类详解