2017-03-29

Scrapy爬图片到本地应该会给图片自动生成sha1摘要算法文件名,我第一次用scrapy也不清楚太多,就在程序里自己写了一段实现这一功能的代码。需import hashlib

# 存储所有图片链接image_urls
item["image_urls"] = ['http://www.nosta.gov.cn/upload/2017slgb'+i.replace('..', '') for i in response.xpath('//img[@width="840px"]/@src').extract()]
# 存储所有图片本地地址和图片名(列表中存存字典)images
s = hashlib.sha1()
item["images"] = []
for i in item["image_urls"]:
dict1 = {}
dict1["url"] = i
s.update(i)
dict1["path"] = s.hexdigest() + ".jpg"
item["images"].append(dict2)

其实主要核心是下面这段

import hashlib

sha1 = hashlib.sha1()
sha1.update('自定义内容')print sha1.hexdigest()

最新文章

  1. android json解析详细介绍之gson
  2. Ajax、Comet与Websocket
  3. 如何在eclipse中配置Selenium
  4. CentOS下yum安装wine
  5. 归并排序,递归法,C语言实现。
  6. PreferenceActivity 自动保存属性
  7. 随机数、continue、break
  8. 转载Worktile 技术架构概要
  9. 模拟Struts2框架Action的实现
  10. Golang学习---test写法和benchmark写法
  11. Go语言如何判断一个chan被关闭
  12. 前段基础之CSS
  13. Mac安装crfpp
  14. Android打印当前所有线程及对应栈信息
  15. Zabbix3.0版报警设置
  16. 【Linux技术】BusyBox详解
  17. R因子
  18. Python学习(004)-字典{}
  19. Java性能优化之JVM GC(垃圾回收机制)
  20. django 实用工具dj-database-url 快速配置数据库

热门文章

  1. 2017 多校4 Wavel Sequence
  2. Batting Practice LightOJ - 1408
  3. 如何得到一个接口所有的实现类(及子接口)?例如:Eclipse IDE
  4. bzoj 3160 万径人踪灭 FFT
  5. 什么是SetUID
  6. [ CodeVS冲杯之路 ] P1014
  7. C# WeakReference(弱引用)
  8. matlab 命令行快捷键
  9. redis加入到Windows系统服务
  10. python 错误 error: invalid command 'egg_info'