我们知道,从父进程到子经常的数据传递相对比较容易一些,但是从子进程传递到父进程就比较的困难。

有很多办法实现进程交互,在php中比较方便的是 管道通信。当然,还可以通过 socket_pair 进行通信。

首先是服务器为了应对每一个请求要做的事情(发送一个url 序列,url序列用t 分割。而结束标记是 n)

function clientHandle($msgsock, $obj)
{
$nbuf = '';
socket_set_block($msgsock);
do {
if (false === ($buf = @socket_read($msgsock, , PHP_NORMAL_READ))) {
$obj->error("socket_read() failed: reason: " . socket_strerror(socket_last_error($msgsock)));
break;
}
$nbuf .= $buf; if (substr($nbuf, -) != "\n") {
continue;
}
$nbuf = trim($nbuf);
if ($nbuf == 'quit') {
break;
}
if ($nbuf == 'shutdown') {
break;
}
$url = explode("\t", $nbuf);
$nbuf = ''; $talkback = serialize(read_ntitle($url));
socket_write($msgsock, $talkback, strlen($talkback));
debug("write to the client\n");
break;
} while (true);
}
 
上面代码比较关键的一个部分是 read_ntitle,这个函数实现多线程的读取标题。

代码如下:(为每一个url fork 一个线程,然后打开管道 ,读取到的标题写入到管道里面去,主线程一直的在读取管道数据,直到所有的数据读取完毕,最后删除管道)

function read_ntitle($arr)
{
$pipe = new Pipe("multi-read");
foreach ($arr as $k => $item)
{
$pids[$k] = pcntl_fork();
if(!$pids[$k])
{
$pipe->open_write();
$pid = posix_getpid();
$content = base64_encode(read_title($item));
$pipe->write("$k,$content\n");
$pipe->close_write();
debug("$k: write success!\n");
exit;
}
}
debug("read begin!\n");
$data = $pipe->read_all();
debug("read end!\n");
$pipe->rm_pipe();
return parse_data($data);
}
parse_data 代码如下,非常的简单,就不说了。
parse_data 代码如下,非常的简单,就不说了。
function parse_data($data)
{
$data = explode("\n", $data);
$new = array();
foreach ($data as $value)
{
$value = explode(",", $value);
if (count($value) == ) {
$value[] = base64_decode($value[]);
$new[intval($value[])] = $value[];
}
}
ksort($new, SORT_NUMERIC);
return $new;
}
 
上面代码中,还有一个函数read_title 比较有技巧。为了兼容性,我没有采用curl,而是直接采用socket 通信。

在下载到 title 标签后,就停止读取内容,以节省时间。代码如下:

function read_title($url)
{
$url_info = parse_url($url);
if (!isset($url_info['host']) || !isset($url_info['scheme'])) {
return false;
}
$host = $url_info['host']; $port = isset($url_info['port']) ? $url_info['port'] : null;
$path = isset($url_info['path']) ? $url_info['path'] : "/";
if(isset($url_info['query'])) $path .= "?".$url_info['query'];
if(empty($port)){
$port = ;
}
if ($url_info['scheme'] == 'https'){
$port = ;
}
if ($url_info['scheme'] == 'http') {
$port = ;
}
$out = "GET $path HTTP/1.1\r\n";
$out .= "Host: $host\r\n";
$out .= "User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.1.7)\r\n";
$out .= "Connection: Close\r\n\r\n";
$fp = fsockopen($host, $port, $errno, $errstr, );
if ($fp == NULL) {
error("get title from $url, error. $errno: $errstr \n");
return false;
}
fwrite($fp, $out);
$content = '';
while (!feof($fp)) {
$content .= fgets($fp, );
if (preg_match("/<title>(.*?)<\/title>/is", $content, $matches)) {
fclose($fp);
return encode_to_utf8($matches[]);
}
}
fclose($fp);
return false;
} function encode_to_utf8($string)
{
return mb_convert_encoding($string, "UTF-8", mb_detect_encoding($string, "UTF-8, GB2312, ISO-8859-1", true));
}

这里,我只是检测了 三种最常见的编码。其他的代码都很简单,这些代码都是测试用的,如果你要做这样一个服务器,一定要进行优化处理。特别是,要防止一次打开太多的进程,你要做更多的处理。

很多时候,我们抱怨php 不支持多进程,实际上,php是支持多进程的。当然,没有那么多的进程通信的选项,而多进程的核心就在于进程的通信与同步。在web开发中,这样的多线程基本上是不会使用的,因为有很严重的性能问题。要实现比较简单的多进程,高负载,必须借助其扩展。

最新文章

  1. python学习6
  2. ThinkPHP3.1快速入门(1)基础
  3. 爬虫爬数据时,post数据乱码解决办法
  4. django_restframework_angularjs
  5. CreateJSのTweenJS、SoundJS、PreloadJS
  6. jQuery Validate 表单验证插件----自定义一个验证方法
  7. SDRAM总结
  8. 学习练习 java面向对象梯形面积
  9. SQL Delta实用案例介绍 (对应软件)
  10. BlockingQueue汇总
  11. php中利用HttpClient判断页面状态
  12. python保留指定文件、删除目录其他文件的功能(1)
  13. 使用WSL吧
  14. Vultr新用户充值优惠 – 最多充值100美元送100美元
  15. [福大软工] Z班 第7次成绩排行榜
  16. Mysql的唯一性索引unique
  17. Velocity学习4
  18. PU-bound(计算密集型) 和I/O bound(I/O密集型)
  19. 很不错标签云js插件
  20. Myeclipse2013下载,安装,破解,介绍(CSDN首发)

热门文章

  1. Windows、mac字体安装教程
  2. sql删除数据库所有表
  3. ie6/7 bug大全
  4. Quartz 2D中CGContextSaveGState与UIGraphicsPushContext
  5. C#串口通信程序实现无感知签到与答题
  6. python --标准库 路径与文件 (os.path包, glob包)
  7. 修改host简化远程访问
  8. 权限管理系统(四):RBAC权限模型分类介绍
  9. AngularJS 路由:ng-route 与 ui-router
  10. Atitit.各种 数据类型 ( 树形结构,表形数据 ) 的结构与存储数据库 attilax 总结