源码:

 import requests
import re
from my_mysql import MysqlConnect # 获取详情页链接和电影名称
def get_urls(page):
url = 'http://www.dytt8.net/html/gndy/dyzz/list_23_{}.html'.format(page)
response = requests.get(url)
response.encoding = 'gbk'
# print(res)
pat = r'<a href="(.*?)" class="ulink">(.*?)</a>'
res = re.findall(pat, response.text)
# print(res)
return res # 获取磁力链接
def get_links(url):
response = requests.get(url)
response.encoding = 'gbk'
html = response.text
# print(res)
pat = r'href="(magnet.*?)"'
res = re.search(pat, html)
magnet = res.group(1)
pat = r'href="(ftp.*?)"'
res = re.search(pat, html)
ftp = res.group(1)
return magnet,ftp if __name__ == '__main__':
mc = MysqlConnect('127.0.0.1', 'root', '', 'homework')
for page in range(1,4):
res = get_urls(page)
for url, name in res:
url = 'http://www.dytt8.net/' + url
movie_tuple = get_links(url)
sql = 'insert into dytt(id,name,magnet,ftp) values(null,{},{},{})'.format(repr(name),repr(movie_tuple[0]),repr(movie_tuple[1]))
print(sql)
mc.exec(sql)

最新文章

  1. asp.net 有关时间各种(输出)处理
  2. Ubuntu1404: 将VIM打造为一个实用的PythonIDE
  3. 网页自适应@media
  4. C++ 什么是句柄?为什么会有句柄?HANDLE
  5. Silverlight 读取配置文件
  6. Educational Codeforces Round 7 B. The Time 水题
  7. HDU 4793 Collision (2013长沙现场赛,简单计算几何)
  8. (DT系列一)DTS结构及其编译方法
  9. DPC定时器
  10. zookeeper集群配置
  11. Java程序猿从笨鸟到菜鸟之(九十二)深入java虚拟机(一)——java虚拟机底层结构具体解释
  12. Java Web Services (0) - Overview
  13. DCDC电源 TPS54525
  14. Python的循环导入问题
  15. PythonStudy——数字类型 Number type
  16. keepalived自动安装脚本
  17. 文件描述符fd、文件指针fp和vfork()
  18. day 50 Java Script 学习
  19. DevExpress v17.2新版亮点——Data Access
  20. 【BZOJ】【2946】【POI2000】公共串

热门文章

  1. 33、深入理解Java的接口和抽象类
  2. 首次使用JBoss流程(windows下)
  3. 点滴的积累---初学Javascript
  4. Android 四大组件(Activity、Service、BroadCastReceiver、ContentProvider)
  5. Linux命令-帮助命令:man
  6. 将textarea滚动至底部:
  7. spawn-fcgi原理及源代码分析
  8. CentOS开机的时候卡在进度条一直进不去 F5(是关键)
  9. iOS图片上传1
  10. 【C语言】21-结构体