不同磁力链网站网页内容都不同,需要定制 1,并发爬取 并发爬取后,好像一会就被封了 import requests from lxml import etree import re from concurrent.futures import ThreadPoolExecutor def get_mlink(url, headers): """输入某影片磁力链所在的网页,返回该网页中的磁力链""" r = requests.get(url, he
抓取豆瓣电影(http://movie.douban.com/nowplaying/chengdu/)中的正在热映前12部电影,并按照评分排序,保存至txt文件 #coding=utf-8 from selenium import webdriver import unittest from time import sleep class DoubanMovie(unittest.TestCase): def setUp(self): self.dr = webdriver.Chrome() s