前言

嗨喽!大家好呀,这里是小熊猫

知识点:

  • 基本流程
  • fiddler抓包

开发环境:

  • python 3.8 运行代码
  • pycharm 2021.2 辅助敲代码
  • requests 第三方模块

如果安装python第三方模块:

  • win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车
  • 在pycharm中点击Terminal(终端) 输入安装命令

如何配置pycharm里面的python解释器?

  1. 选择file(文件) >>> setting(设置) >>> Project(项目) >>> python interpreter(python解释器)
  2. 点击齿轮, 选择add
  3. 添加python安装路径

pycharm如何安装插件?

  1. 选择file(文件) >>> setting(设置) >>> Plugins(插件)
  2. 点击 Marketplace 输入想要安装的插件名字 比如:翻译插件 输入 translation / 汉化插件 输入 Chinese
  3. 选择相应的插件点击 install(安装) 即可
  4. 安装成功之后 是会弹出 重启pycharm的选项 点击确定, 重启即可生效

代码

欢迎加入白嫖Q群:660193417###
import requests
import re
import json
import os headers = {
'Host': 'mp.weixin.qq.com',
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36 NetType/WIFI MicroMessenger/7.0.20.1781(0x6700143B) WindowsWechat(0x63060012)',
'Cookie': 'wxuin=2408215323; lang=zh_CN; pass_ticket=TsrY5cXMvTN01ghVFxFxT9k4jdPONJBt8mdl0ta20qxjUHNsnkkWLjib4gXCXSQM; devicetype=android-29; version=2800153f; wap_sid2=CJvmqfwIEooBeV9IQVVCUVAzdVBlWEo5NTlySFpON1Ffek5zTE9qRi1jdWZjVFMyOFYyM0FyVE9RSTRNZ3VuUXFTcU94Q3lKY1VyQlJ2RkEtTWFyRWFLeHhJUTRrWmp0N0VDZ05zOFV4d0kzZ1p5cXBIbTVBbEZGRWJteEt4Q0oxSjY4ZHFhODlaZnMyY1NBQUF+MOXS6ZIGOA1AlU4=',
}
for page in range(0, 3):
url = f'https://mp.weixin.qq.com/mp/profile_ext?action=getmsg&__biz=MzU0MzU4OTY2NQ==&f=json&offset={page * 10}&count=10&is_ok=1&scene=&uin=777&key=777&pass_ticket=&wxtoken=&appmsg_token=1161_7%252BO7mVaQbImKSRrYWqKBnNggweX4WNZaqjadeg~~&x5=0&f=json'
json_data = requests.get(url=url, headers=headers).json()
general_msg_list = json_data['general_msg_list']
general_msg_list = json.loads(general_msg_list)['list']
# print(general_msg_list)
title_list = []
content_url_list = []
for general_msg in general_msg_list:
title = general_msg['app_msg_ext_info']['title']
content_url = general_msg['app_msg_ext_info']['content_url']
multi_app_msg_item_list = general_msg['app_msg_ext_info']['multi_app_msg_item_list']
title_list.append(title)
content_url_list.append(content_url)
for multi_app_msg_item in multi_app_msg_item_list:
title_list.append(multi_app_msg_item['title'])
content_url_list.append(multi_app_msg_item['content_url'])
# print(title_list)
# print(content_url_list)
zip_data = zip(title_list, content_url_list)
for detail_title, detail_url in zip_data:
if not os.path.exists('img/' + detail_title):
os.mkdir('img/' + detail_title)

1. 发送请求

        欢迎加入白嫖Q群:660193417###
response = requests.get(url=detail_url, headers=headers)

2. 获取数据

        html_data = response.text

3. 解析数据

欢迎加入白嫖Q群:660193417###
# 正则匹配数据 第一个参数 需要匹配的规则
# 第一个参数 在哪个字符串里面匹配
img_list = re.findall('data-src="(https://mmbiz\.qpic\.cn/.*?)"', html_data)
print(detail_title)
# print(img_list)
for img in img_list:
if not 'gif' in img:
img_data = requests.get(img).content
img_name = img.split('/')[-2]
print(img_name)
with open(f'img/{detail_title}/{img_name}.jpeg', mode='wb') as f:
f.write(img_data)

我是小熊猫,咱们下篇文章见啦(✿◡‿◡)

最新文章

  1. ORACLE中常见SET指令
  2. jquery 设置页面元素不可点击、不可编辑、只读(备忘)
  3. String根据、拆分
  4. MyEclipse JAX-WS Web Service
  5. OC-id、构造方法
  6. Java开发中经典的小实例-( 鸡蛋0.1元一个,鸭蛋3元一个,鹅蛋6元一个。求一百元买一百个蛋。)
  7. visual studio 中快捷键的使用
  8. ceph-deploy 在下面ceph-nodes执行的命令
  9. 导出项目为jar包
  10. 编译android的linux kernel goldfish
  11. 幻世(OurDream)2D图形引擎使用教程9——处理操作输入(3)
  12. leetcode第35题--Valid Sudoku
  13. 支持异步同步的分布式CommandBus MSMQ实现
  14. [python]小练习__创建你自己的命令行 地址簿 程序
  15. 关于inet_addr() 函数
  16. python模块:logging
  17. mysql表空间加密 keyring encryption
  18. Ubuntu 14.04 下安装 OpenCV
  19. IP路由实验之---Telnet远程登陆
  20. EMIF接口与FPGA的互联(转)

热门文章

  1. C. Sum of Cubes
  2. 你能知道的或者不知道的shell变量都在这里
  3. python基础练习题(一个整数,它加上100后是一个完全平方数,再加上168又是一个完全平方数,请问该数是多少?)
  4. MeteoInfo-Java解析与绘图教程(八)_java解析卫星FY-4A一级产品文件(HDF举例)
  5. LVM 逻辑卷学习
  6. 详解:什么是VXLAN?
  7. BootstrapBlazor实战 Markdown 编辑器使用
  8. 前端HTML-01
  9. mySql in 语句查询优化
  10. 斯坦福NLP课程 | 第18讲 - 句法分析与树形递归神经网络