今天在使用python的urllib对网页进行爬取的时候,中文一直出现错误

UnicodeEncodeError: 'ascii' codec can't encode character '\u6211' in position 26: ordinal not in range(128)

我一直以为是我的编辑器编码问题,因为显示是ascii编码问题,结果转换了很多次后还是没用,终于查资料发现,urllib本身就是使用ascii进行编码的,如果是中文的话,需要对中文进行单独编码,也就是使用,对中文进行编码,再拼接到url中,然后就可以正常访问了

urllib.parse.quote(“中文”)

最新文章

  1. ASM磁盘组扩容流程
  2. 【9-2】mysql数据库学习01
  3. java 反取字符串
  4. Spring框架学习之第3节
  5. kernel网址
  6. UVA 11995 I Can Guess the Data Structure!(ADT)
  7. 2-16 HDO1106
  8. Unix/Linux环境C编程入门教程(3) Oracle Linux 环境搭建
  9. 【日报C在23】堆和栈的深入了解
  10. Java-List泛型的用处(能够使用传入泛型对象的方法)
  11. LVM基本应用,扩展及缩减实现!
  12. 移动端web自适应适配布局解决方案
  13. python 通过元类控制类的创建
  14. C#设计模式(6)——原型模式(Prototype Pattern)(转)
  15. 一些jquery特效收集
  16. [ovs][dpdk] ovs-dpdk, dpdk port 大量丢包
  17. CSS层叠样式表--找到标签
  18. Keepalived 进程无法关闭
  19. idea 安装mybatis plugin (mybatis插件)
  20. centos7 部署LNMP

热门文章

  1. Typescript 回调函数、事件侦听的类型定义与注释--拾人牙慧
  2. JZOJ 排列统计
  3. JZOJ 5372. 【NOIP2017提高A组模拟9.17】猫
  4. go并发实战(读书笔记1)
  5. js手动触发页面元素点击事件,自定义点击事件模拟点击
  6. rn用Modal实现Drawer
  7. vitis笔记1
  8. NSIS 制作漂亮的安装界面(仿QQ音乐,网易云音乐)
  9. HttpClient Post 提交表单数据
  10. ABAP 写入批次特征值以及更新批次特征值