crawler碎碎念6 豆瓣爬取操作之获取数据
2024-09-06 17:59:38
import requests
from lxml import etree
s = requests.Session()
for id in range(0,251,25):
url ='https://movie.douban.com/top250/?start-'+str(id)
r = s.get(url)
r.encoding = 'utf-8'
root = etree.HTML(r.content)
items = root.xpath(' ')
#print(len(items))
for item in items:
title = item.xpath(' ') #/text加在最后就是找它的文本内容
print(title)
最新文章
- SharePoint Server2016的User Profile Services服务
- Java实现时间动态显示方法汇总
- HttpClient通过Post上传多个文件
- 用Latex写学术论文:作者(Author)&;摘要(Abstract)
- JavaScript: Advanced
- 扩展Oracle表空间
- debian 颜色设置
- [codevs1073]家族
- Servlet单实例多线程模式
- http://fonts.googleapis.com/css?打开很慢解决方案
- CentOS安装并设置MariaDB
- mysql表与表之间数据的转移
- 解决Unity中模型部件的MeshCollider不随动画一起运动的问题
- ZOJ 4062 - Plants vs. Zombies - [二分+贪心][2018 ACM-ICPC Asia Qingdao Regional Problem E]
- CentOS 7 源码编译vim8+vimplus
- 深入理解Tomcat
- 和我一起打造个简单搜索之SpringDataElasticSearch入门
- linux:ubuntu安装mysql(一)
- js中函数的参数传递
- Linux下搜索文件