python 爬糗事百科
2024-08-30 11:09:02
糗事百科网站段子爬取,糗事百科是我见过的最简单的网站了!!!
#-*-coding:utf8-*- import requests
import re
import sys
reload(sys)
sys.setdefaultencoding("utf-8") url = 'http://www.qiushibaike.com/hot/page/' page = urls = [] f = open("happy.txt",'w') for i in range(,):
u = url+str(i) +'/'
urls.append(u)
# print urls[i-]
html = requests.get(urls[i-]) content = re.findall('<span>(.*?)</span>',html.text,re.S) for item in content :
if item[]!='<':
print item
f.writelines(str(item)+'\n\n') f.close()
最新文章
- FIR on Hadoop using hadoop-streaming
- [分享] 很多人手机掉了,却不知道怎么找回来。LZ亲身经历讲述手机找回过程,申请加精!
- Linux 进程间通讯详解五
- listener监听器
- Hibernate 查询MatchMode的四种模式
- 使用Webpack和Babel来搭建React应用程序
- struts2:struts.xml配置文件详解
- hdu 1757 矩阵快速幂 **
- HDU 4920 Matrix multiplication 矩阵相乘。稀疏矩阵
- jquery click &; get value of attributes of a href
- Drupal安装及使用问题解决列表
- IAP内购 返回的产品数量为0
- python运维开发之第六天
- C++小知识之wsprintf使用
- pig中使用的一些实例语法
- 用Py2exe打包Python脚本简单介绍
- Flask Ansible自动化平台搭建(持续更新)
- Java并发编程实战(chapter_1)(原子性、可见性)
- 5.list集合添加姓名{张三,李四,王五,二丫,钱六,孙七},将二丫替换为王小丫, 写入到";D:\\stuinfo.txt";
- Codeforces 1045C Hyperspace Highways (看题解) 圆方树