用工具metaseeker写简单爬虫(1)
2024-08-23 01:50:49
1、下载metaseeker(一款比较实用的网站数据采集程序)
2、将所要爬取的网页复制到网址里,按回车。我选择的是当当网新书排行榜页面,标2的地方表示已经导入到软件里了。
3、命名主题,查重,查看是否名称冲突。Dangdangnewbooks是我命名的,没有冲突。
4、创建规则,单击新建,名为“当当图书商品价格抓取”
5、右键该规则名,点击包容,输入名称,勾选“关键内容”(创建两个包容,一个商品价格,一个商品名称。)如图
6、随后在该软件的左下角浏览器中点击商品名称:如曼食慢语,左上角空白处会显示网页标签对应的DIV/#text,点击text右键“内容映射”-“商品名称”
7、与上面相同方法点击浏览器价格位置会有对应网页标签,出现I/#text,点击text右键“内容映射”-“商品价格”
8、工作台中点击测试,左下浏览器页面会跳到输出信息。至此就完成了简单的工具爬虫。
学习笔记,喜欢的话可以关注公众号大王有药,不定时发送爬虫小练习,与你一同学习。
最新文章
- javascript 函数初探 (二)--- 那些年的预定义函数
- oracle 数据库的学习1
- Vue.js – 基于 MVVM 实现交互式的 Web 界面
- JQuery操作Ajax
- csu 10月 月赛 B 题 Scoop water
- (转载)Flash Loader加载完成不发送COMPLETE和ERROR事件的问题分析
- java源码解析——Stack类
- Android---控制设备照相机
- struts2 里escape=";false";的问题?
- 蓝色巨人IBM
- Python(一)字符串用法
- poj1011 && uva307 DFS + 剪枝
- html与ios交互方法 WebViewJavascriptBridge
- 爬虫框架Scrapy 之(二) --- scrapy文件
- Hibernate各种基本注解及一对一(多)关系映射采坑笔记
- 缓存系列之四:redis持久化与redis主从复制
- 【BZOJ2229】[ZJOI2011]最小割(网络流,最小割树)
- sonar扫描java、js、jsp技术
- Cracking The Coding Interview4.8
- Linux:进程