1、下载metaseeker(一款比较实用的网站数据采集程序)

2、将所要爬取的网页复制到网址里,按回车。我选择的是当当网新书排行榜页面,标2的地方表示已经导入到软件里了。

3、命名主题,查重,查看是否名称冲突。Dangdangnewbooks是我命名的,没有冲突。

4、创建规则,单击新建,名为“当当图书商品价格抓取”

5、右键该规则名,点击包容,输入名称,勾选“关键内容”(创建两个包容,一个商品价格,一个商品名称。)如图

6、随后在该软件的左下角浏览器中点击商品名称:如曼食慢语,左上角空白处会显示网页标签对应的DIV/#text,点击text右键“内容映射”-“商品名称”

7、与上面相同方法点击浏览器价格位置会有对应网页标签,出现I/#text,点击text右键“内容映射”-“商品价格”

8、工作台中点击测试,左下浏览器页面会跳到输出信息。至此就完成了简单的工具爬虫。

学习笔记,喜欢的话可以关注公众号大王有药,不定时发送爬虫小练习,与你一同学习。

最新文章

  1. javascript 函数初探 (二)--- 那些年的预定义函数
  2. oracle 数据库的学习1
  3. Vue.js – 基于 MVVM 实现交互式的 Web 界面
  4. JQuery操作Ajax
  5. csu 10月 月赛 B 题 Scoop water
  6. (转载)Flash Loader加载完成不发送COMPLETE和ERROR事件的问题分析
  7. java源码解析——Stack类
  8. Android---控制设备照相机
  9. struts2 里escape="false"的问题?
  10. 蓝色巨人IBM
  11. Python(一)字符串用法
  12. poj1011 && uva307 DFS + 剪枝
  13. html与ios交互方法 WebViewJavascriptBridge
  14. 爬虫框架Scrapy 之(二) --- scrapy文件
  15. Hibernate各种基本注解及一对一(多)关系映射采坑笔记
  16. 缓存系列之四:redis持久化与redis主从复制
  17. 【BZOJ2229】[ZJOI2011]最小割(网络流,最小割树)
  18. sonar扫描java、js、jsp技术
  19. Cracking The Coding Interview4.8
  20. Linux:进程

热门文章

  1. jmeter的新增函数说明
  2. raphael参数说明
  3. 纸小墨ink简洁主题story爱上你的故事
  4. Nodejs运行错误小结
  5. 殊途同归 - Church-Rosser and Consistency of Evaluation
  6. nodejs的jekins部署
  7. 删除链表的倒数第N个节点(java实现)
  8. 雷林鹏分享:jQuery EasyUI 数据网格 - 设置冻结列
  9. expect简单自动交互-用于密码、命令输入
  10. 记一次oracle数据库复制过程