Python3.x:代理ip刷评分

声明:仅供为学习材料,不允许用作商业用途;

一,功能:

 针对某网站对企业自动刷评分;

 网站:https://best.zhaopin.com/

二,步骤:

1,获取代理ip(代理ip地址:http://www.xicidaili.com/nn);

2,模拟浏览器打开评分页面;

3,模拟评分事件,并传递参数;

 参数获取:根据浏览器的开发者工具,跟踪评分事件;对应的“Network”可以看到相关的表头信息,其中的From Data就是参数信息;

 表头信息:POST方式

 参数信息:

三、代码:

# python3
# 功能:对https://best.zhaopin.com/中的某企业刷评分
import re
import random
import sys
import time
import datetime
import threading
from random import choice
import requests
import bs4 # 设置user-agent列表,每次请求时,可在此列表中随机挑选一个user-agnet
user_agent = [
"Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:17.0; Baiduspider-ads) Gecko/17.0 Firefox/17.0",
"Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9b4) Gecko/2008030317 Firefox/3.0b4",
"Mozilla/5.0 (Windows; U; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; BIDUBrowser 7.6)",
"Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; rv:11.0) like Gecko",
"Mozilla/5.0 (Windows NT 6.3; WOW64; rv:46.0) Gecko/20100101 Firefox/46.0",
"Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.99 Safari/537.36",
"Mozilla/5.0 (Windows NT 6.3; Win64; x64; Trident/7.0; Touch; LCJB; rv:11.0) like Gecko",
] # 国内高匿代理IP,返回某页面的所有ip
def get_ip_list(page=1):
#获取代理IP(取当前页的ip列表,每页100条ip)
url = "http://www.xicidaili.com/nn/"+page
headers = { "Accept":"text/html,application/xhtml+xml,application/xml;",
"Accept-Encoding":"gzip, deflate, sdch",
"Accept-Language":"zh-CN,zh;q=0.8,en;q=0.6",
"Referer":"http://www.xicidaili.com",
"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36"
}
r = requests.get(url,headers=headers)
soup = bs4.BeautifulSoup(r.text, 'html.parser')
data = soup.table.find_all("td")
# 匹配规则需要用浏览器的开发者工具进行查看
# 匹配IP:<td>61.135.217.7</td>
ip_compile= re.compile(r'<td>(\d+\.\d+\.\d+\.\d+)</td>')
# 匹配端口:<td>80</td>
port_compile = re.compile(r'<td>(\d+)</td>')
# 获取所有IP,返回的是数组[]
ip = re.findall(ip_compile,str(data))
# 获取所有端口:返回的是数组[]
port = re.findall(port_compile,str(data))
# 组合IP+端口,如:61.135.217.7:80
return [":".join(i) for i in zip(ip,port)] # 打开页面,执行评分行为
def do_dz(code=0,ips=[]):
#点赞,如果代理IP不可用造成刷评分失败,则会自动换一个代理IP后继续刷评分
try:
# 随机选取一个ip
ip = choice(ips)
except:
return False
else:
proxies = {
"http":ip,
}
headers_ = {
"Accept":"*/*",
"Accept-Encoding":"gzip, deflate, sdch",
"Accept-Language":"zh-CN,zh;q=0.8,en;q=0.6",
"Referer":"https://best.zhaopin.com/",
"User-Agent":choice(user_agent),
}
# 用浏览器的开发者工具跟踪评分事件传输的参数值
datas = {'bestid': 6030, 'score': '5,5,5,5,5,5','source': 'best'}
try:
# 评分请求url
url_dz = "https://best.zhaopin.com/API/ScoreCompany.ashx"
# 执行评分行为(发送请求)
r_dz = requests.post(url_dz,headers=headers_,data=datas,proxies=proxies)
except requests.exceptions.ConnectionError:
print("Connection Error")
if not ips:
print("not ip")
sys.exit()
# 删除不可用的代理IP
if ip in ips:
ips.remove(ip)
# 重新请求URL
get_url(code,ips)
else:
# 获取当前时间
date = datetime.datetime.now().strftime('%H:%M:%S')
print(u"第%s次 [%s] [%s]:评分%s (剩余可用代理IP数:%s)" % (code,date,ip,r_dz.text,len(ips))) if __name__ == '__main__':
ips = []
# python3把xrange()与rang()e整合为一个range()
for i in range(5000):
# 每隔1000次重新获取一次最新的代理IP
if i % 1000 == 0:
ips.extend(get_ip_list(""))
# 启用线程,隔2秒产生一个线程
t1 = threading.Thread(target=do_dz,args=(i,ips))
t1.start()
# time.sleep的最小单位是毫秒
time.sleep(2)

四、效果:

 执行前:

 执行后:

作者:整合侠
链接:http://www.cnblogs.com/lizm166/p/8242249.html
来源:博客园
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

最新文章

  1. 程序设计模式浅析(plain framework商业版设计模式)
  2. SSH整合,必出精品
  3. [poj2337]求字典序最小欧拉回路
  4. [Asp.net]Uploadify上传大文件,Http error 500 解决方案
  5. Spring集成jedis支持Redis3.0集群
  6. IOS开发UI基础学习-------总结
  7. HDU5863 cjj&#39;s string game(DP + 矩阵快速幂)
  8. 解决linux中Kipmi0进程对CPU使用率很高问题
  9. C#判断一个类中有无&quot;指定名称&quot;的方法
  10. [JavaScript] js验证身份证
  11. Niagara AX之在Station下显示Home节点
  12. cmd命令添加一个应用程序到防火墙例外项中
  13. [kuangbin带你飞]专题六 最小生成树 POJ 1287 Networking
  14. java字符串比较及小数浮点型的使用
  15. Vivado完成综合_实现_生成比特流后发出提醒声音-原创☺
  16. 【ASP.NET MVC】View与Controller之间传递数据
  17. day06深浅拷贝,元组,字典,集合
  18. 【项目经验】Mockito教程
  19. Generate google sitemap xml
  20. List接口和Set接口和Map接口的of方法

热门文章

  1. python基础之2
  2. iOS json解析中包含“\n”等解析出错
  3. Hadoop单点伪分布模式安装
  4. jsp+servlet+mvc模式图
  5. Linux 常用资源
  6. css calc()
  7. packages managers
  8. [已解决]ubuntu下chrome和firefox输入框内无法快捷键全选
  9. mysql导出成execl
  10. Python的subprocess模块(二)