【Python】爬虫
2024-09-24 18:26:02
参考:http://www.cnblogs.com/fnng/p/3576154.html
import urllib,re
page = urllib.urlopen('http://trend.baidu.lecai.com/ssq/')
html = page.read()
reg = r"<td class='chart_table_td omission_entry omission_hit .+_ball background_color_.+'>\d{2}</td>"
htmlre = re.compile(reg)
balllist = re.findall(htmlre,html)
len(balllist)
# 30天,6红1蓝,210个结果 last30=[]
redlist=[]
for item in imglist:
if 'red_ball' in item:
redlist.append(item[-7:-5])
elif 'blue_ball' in item:
last30.append({'blue':item[-7:-5],'red':redlist})
redlist=[] print last30
最新文章
- java获取注册ip
- 学习Coding-iOS开源项目日志(二)
- table.appand(行数据) datagrid分页
- Spring控制Hibernate的缓存机制ehcache
- ThinkPHP3.2.3自带的分页用法--很简单实用
- HDU 1003 基础dp 最大连续序列和
- win7桌面便签。自带的
- 虚拟主机、VPS、云主机以及独立服务器的关系
- MySql中查询表中的列名
- nginx随着passenger构造ruby on rails页
- Tomcat剖析(一):一个简单的Web服务器
- 搭建自己的BT下载平台服务器
- WPF:动态显示或隐藏Listview的某一列
- Python学习——列表
- [android]常见的adb指令
- jackson 流式API
- slurm作业提交系统常用命令
- 产品经理说| AIOps 让告警变得更智能 (下)
- 基于bootstrap的jQuery多级列表树插件 treeview
- gcc优化引起get_free_page比__get_free_page返回值多4096