Python 爬歌曲

小练习

import re
import time
import requests
# http://www.htqyy,com/top/hot
# http://f2.htqyy.com/play7/33/mp3/4
page=int(input("请输入要爬取的页数:"))
songID=[]
songName=[]
for i in range(0,page):
url="http://www.htqyy.com/top/musicList/hot?pageIndex= "+str(i)+"&pageSize=20"
html=requests.get(url)
strr=html.text
pat1=r'title="(.*?)" sid'
pat2=r'sid="(.*?)"'
idlist=re.findall(pat2,strr)
title=re.findall(pat1,strr)
print(title)
songID.extend(idlist)
songName.extend(title)
for i in range(0,len(songID)):
songurl="http://f2.htqyy.com/play7/"+str(songID[i])+"/mp3/4"
songname=songName[i]
data=requests.get(songurl).content
with open("D:\\music\\{}.mp3".format(songname),"wb") as f:
f.write(data)
print("正在下载第:",i+1,"首","歌曲名为:",songname)
time.sleep(0.5)
print(len(songID))
print(len(songName))

最新文章

  1. K-V-O 键值观察机制
  2. VB.NET读取Excel工作表信息
  3. JAVA中获取工程路径的方法
  4. Unity3D 之防止刚体碰撞导致旋转
  5. 配置主机路由表(route)(两)
  6. angular-ui-bootstrap插件API - Pagination
  7. PHPCMS笔记第二弹
  8. Java IO学习笔记(一)
  9. 40个比较重要的Android面试题
  10. js分析 邮箱地址加密 [email protected]
  11. selenium中遇到div弹框,一起引申到其他弹框
  12. IT资产管理—采购与合同管理功能
  13. nginx 全局配置
  14. HTTP协议(web开发)
  15. FPGA基础知识1
  16. VBA编程中的 sheet1 与 sheets(1)的区别
  17. VirtualBox安装Mac OS 10.11——虚拟机安装黑苹果
  18. 内存问题排查工具 --- valgrind
  19. python rabittmq 使用
  20. spark 调优——基础篇

热门文章

  1. Python笔记17---------魔法方法
  2. 【BZOJ1125】【POI2008】poc - splay+哈希
  3. Bash 如何取得当前正在执行的脚本的绝对路径?
  4. zabbix监控websphere的几个监控项
  5. Elasticsearch 入门 - Modifying Your Data
  6. Redis-Cluster集群原理
  7. [Node.js] Manage Configuration Values with Environment Variables
  8. Solr 搜索的过程和所须要的參数
  9. mysql基础综述(四)
  10. 使用Android Studo开发NDK之Gradle的配置(能debug C代码)