PHP中通过preg_match_all函数获取页面信息并过滤变更为数组存储模式
2024-09-24 14:58:53
// 1. 初始化
$ch = curl_init(); // 2. 设置选项
curl_setopt($ch, CURLOPT_URL, "http://test.com/index.jsp"); // 设置要抓取的页面地址
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); // 抓取结果直接返回(如果为0,则直接输出内容到页面)
curl_setopt($ch, CURLOPT_HEADER, 0); // 不需要页面的HTTP头
// 3. 执行并获取HTML文档内容,可用echo输出内容
$output = curl_exec($ch);
//dump($output);
$arr= array();
if(preg_match_all('/<tr>(.*?)<\/tr>/s', $output,$reg)){
foreach ($reg[1] as $t)
if(preg_match_all('/<div[^>]*>(.*?)<\/div>/',$t,$r))
$arr[]=$r[1];
}
foreach ($arr as $k => $v){
echo $v['3'].$v['4'].$v['18']."<br/>";
}
// print_r($arr);
// 4. 释放curl句柄
curl_close($ch);
最新文章
- 【读书笔记】Asp.Net MVC 上传图片到数据库(会的绕行)
- C#开发Windows服务 入门
- CAS单点登录和spring securtiy集成
- cannot find module &#39;xml2js&#39;
- cocos2d-x 3.10 屏幕适配问题
- c# 函数及out传值
- Python操作MySQL之SQLAlchemy
- document.getElementsByClassName方法的重写(OVERRIDE)
- DWR应用—快速入门篇
- Android 面试精华题目总结
- MVC Razor视图引擎控件
- HashMap实现原理
- 基础--Redis在Linux环境下的安装
- date函数的属性
- Java中的定时任务
- C语言数据结构_严蔚敏+吴伟民 课本源码
- JavaScript 概述
- Spring Boot:如何配置静态资源的地址与访问路径
- sqlserver中的数据转换与子查询
- day18 类与类之间的关系
热门文章
- php函数strtotime结合date时间修饰语的使用
- PHP使用阿里大鱼发送短信验证
- Delphi并行库System.Threading 之ITask 1
- MapReduce输入输出的处理流程及combiner
- 嵌入式框架Zorb Framework搭建一:嵌入式环境搭建、调试输出和建立时间系统
- Hihocoder #1515 : 分数调查
- 9、Java ConcurrentModificationException异常原因和解决方法
- libevent学习六(Connect listeners )
- PLSQL集合类型
- 「题目代码」P1044~P1048(Java)