第一步:访问分类页面

https://www.amazon.in//gp/site-directory?ref=nav_em_ajax_fail  #抓包获得

第二步:获取分类页面下各个分类的url

如 :https://www.amazon.in/gp/browse.html?node=1389401031&ref_=nav_em_T1_0_4_NaN_1_sbc_mobcomp_all_mobiles

 由于对方网站也是迭代的出来的这里有很多信息需要自己过滤排查

第三步:翻页的处理

import time

https://www.amazon.in/gp/browse.html?node=1389401031&ref_=nav_em_T1_0_4_NaN_1_sbc_mobcomp_all_mobiles&page=1&qid={int(time.time())}&ref=sr_pg_1

翻页主要2个参数控制
#page=页码
#qid=十位的当前时间戳
#如果页码超过最大页码不会报错就是现实最后一页内容

第四步:详情页内容获取

#内容都在
#正则匹配格式
jQuery.parseJSON\('(.*?)'\);

最新文章

  1. Lucene4.4.0 开发之排序
  2. 开始学nodejs —— 调试篇
  3. Web API 之CRUD
  4. 【转】ELK(ElasticSearch, Logstash, Kibana)搭建实时日志分析平台
  5. Android最大可运行内存
  6. ACM/ICPC 之 优先级队列+设置IO缓存区(TSH OJ-Schedule(任务调度))
  7. 常用的I/O流类型
  8. 更改printk打印级别
  9. IOS上传图片
  10. 定位position详解:relative与absolute
  11. Java应用开发的一条经验
  12. ssdt_hook NtOpenProcess
  13. HTML 颜色名
  14. canvas API总结
  15. 【django小练习之主机管理界面】
  16. Percona-Toolkit 之 pt-online-schema-change 总结
  17. 企业邮箱绑定微信后,如何设置通过本地验证。(Foxmail)
  18. Auto.js 初试-Android开发JS利器
  19. 不同数据源之间的数据同步jdbc解决方案
  20. 关于java中指针的概念

热门文章

  1. html汇总
  2. [动图演示]Redis 持久化 RDB/AOF 详解与实践
  3. 基于jquery的弹幕实现
  4. 最新28道java基础面试题-上
  5. python优势之通过一段代码来了解python的强大之处
  6. spring security 权限安全认证框架-入门(一)
  7. 如何成为一名成功的iOS程序员,挑战年薪50万?
  8. Python3 常用模块2
  9. 【React】383- React Fiber:深入理解 React reconciliation 算法
  10. CSS-sprite(雪碧图、精灵图)