第一步:爬取分类url

from requests_html import  HTMLSession
session =HTMLSession()
#https://www.flipkart.com/lc/getData?dataSourceId=websiteNavigationMenuDS_1.0
#还有个t参数,目前可以不加
res =session.get('https://www.flipkart.com/lc/getData?dataSourceId=websiteNavigationMenuDS_1.0', verify=False) appliances_columns_list=res.json().get('navData').get('appliances').get('tabs')[0].get('columns')
men_columns_list=res.json().get('navData').get('men').get('tabs')[0].get('columns')
women_columns_list=res.json().get('navData').get('women').get('tabs')[0].get('columns')
baby_kids_columns_list=res.json().get('navData').get('baby-kids').get('tabs')[0].get('columns')
home_kitchen_columns_list=res.json().get('navData').get('home-kitchen').get('tabs')[0].get('columns')
nav_columns_lists =appliances_columns_list+men_columns_list+women_columns_list+baby_kids_columns_list+home_kitchen_columns_list for nav_columns_list in nav_columns_lists:
for title_url_type_dict in nav_columns_list:
print(title_url_type_dict.get('url'))

第二步:获取翻页

#page参数控制
如:https://www.flipkart.com/womens-footwear/pr?sid=osp,iko&page=3

第三步:获取详情页url

from requests_html import  HTMLSession
session =HTMLSession() res =session.get('https://www.flipkart.com/womens-footwear/pr?sid=osp,iko&page=3', verify=False) print(res.html.xpath('//*[@id="container"]/div/div[3]/div[2]/div[1]/div[2]/div/div/div/div/div/a[1]/@href')[4:])

第四步:详情页访问

最新文章

  1. Javascript权威指南
  2. strust.xml
  3. centos 7 搭建本地yum仓库
  4. DP+单调队列 codevs 1748 瑰丽华尔兹(还不是很懂具体的代码实现)
  5. php自定义函数call_user_func和call_user_func_array详解
  6. dshow,Sample Grabber 从摄像头采集
  7. VIM 技巧 (一)全文统一添加
  8. Android TabHost中Activity之间传递数据
  9. HDU-2500 做一个正气的杭电人
  10. 对于ios7扫描二维码功能的实现
  11. cocos2d-x中的init,onEnter,onExit......
  12. JMeter基础
  13. python实现断点续传下载文件
  14. HYML / CSS和Javascript 部分
  15. Java反射机制剖析(一)-定义和API
  16. hdu1789 Doing Homework again---(经典贪心)
  17. DP求树的重心
  18. Nginx 常用配置
  19. IdentityServer4-主题
  20. 系统windows版本修改

热门文章

  1. Calling the Web Service dynamically (.NET 动态访问Web Service)
  2. 第七章终结篇——8251A的总结
  3. 洛谷 P2342 叠积木 题解
  4. HDU1224-Free DIY Tour(SPFA+路径还原)
  5. cmake 简介
  6. USB3.0 图像视频传输 开发 CYUSB3014开发基础(导入官方例程) 转
  7. 使用java语言实现八皇后问题
  8. IP地址的配置
  9. 【hibernate】应用程序级别的视图
  10. html5 websocket 示例,websocket在线聊天,php websocket实例