import urllib2

 class SimpleCookieHandler(urllib2.BaseHandler):
def http_request(self, req):
simple_cookie = 'PHPSESSID=fcf3c469c3c80f3e8480aca76c87faa;ocKey=c9821225458886fa8329cccc283e60e;wy_uid=b52fOIbsG%2BB6kyNmyU9esuL%2FRb8GTatlM4n5ghw7dP4;wy_pwd=f770PcQrsQ2YyEUO07ouNVJxMxXvONgOQHcoXQ%2Bm4xJC22oosvWGDL6RJU09fIwTNkO9JTZ9yQMWXiszw'
if not req.has_header('Cookie'):
req.add_unredirected_header('Cookie', simple_cookie)
else:
cookie = req.get_header('Cookie')
req.add_unredirected_header('Cookie', simple_cookie + '; ' + cookie)
return req opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(), SimpleCookieHandler());
urllib2.install_opener(opener); while 1:
for n in range(4,10):
resp = urllib2.urlopen('http://zone.wooyun.org/content/'+repr(n));
file = open('c:\\'+repr(n)+'.html', 'w')
for line in resp.read():
file.write(line)
file.close()
break;

首先定义个cookie类参考http://blog.csdn.net/uestcyao/article/details/7896184,把收集到的cookie放到simple_cookie内。使用urllib2模块完成整个功能。

说明:刚开始打算使用登录功能,自动提交cookie,要用到cookielib模块。后来发现需要验证码,折腾半天觉得验证码还是比较难缠的问题。暂时改变思路使用自己登录时采集的cookie进行提交。就可以模拟登录者的身份进行采集了。以后会研究验证码方面的功能。解决验证码方面的困扰。

最新文章

  1. SQL Server表分区
  2. 实现滑动可固定header以及页面刷新
  3. JAVA中的正则表达式
  4. mongo创建用户
  5. ssh 公钥
  6. 为Android Studio 项目手动下载gradle
  7. Python2.7.3移除字符串中重复字符(一)
  8. [转载] Zookeeper中的 ACL(Access Control List)访问控制列表
  9. Android打包失败Proguard returned with error code 1. See console
  10. [CODEVS3299]有序数组合并求第K大问题
  11. mysql服务启动
  12. Spring再学习
  13. 一张图看懂JVM之垃圾回收算法详解
  14. 使用layer 弹出对话框 子父页面相互参数传递 父页面获取子页面参数实例
  15. nginx中的break与last指令区别
  16. 关于SX1278、SX1276、SX1262的简单详解资料
  17. Spring Cloud限流思路及解决方案
  18. 怎样将Android SDK源码 导入到Eclipse中?
  19. python风味之大杂烩
  20. 《Vim实用技巧》阅读笔记 --- 移动及跳转

热门文章

  1. ORBslam总结
  2. TP5实现签到功能
  3. POJ3696【欧拉函数+欧拉定理】
  4. HDU2844【背包问题(二进制优化)】
  5. 进击python第4篇:初探模块
  6. js框架:jQuery
  7. python之文件路径截取 & endswith()
  8. SpringBoot | idea新建项目
  9. 转 错误:ORA-28002/ORA-65162 : the password will expire within 7 days 解决方法
  10. 用ssh-key-gen 在本地主机上创建公钥和密钥