The fourth day of Crawler learning
2024-10-08 04:20:00
爬取58同城
from bs4 import BeautifulSoup
import requests
url = "https://qd.58.com/diannao/35200617992782x.shtml"
web_data = requests.get(url)
soup = BeautifulSoup(web_data.text, 'lxml')
title = soup.title.text
cost = soup.select("div#basicinfo span.infocard__container__item__main__text--price")
time = soup.select(".detail-title__info__text:nth-child(1)")
visitor = soup.select("span#totalcount")
area = soup.select("div.infocard__container__item:nth-child(3)>div.infocard__container__item__main")
who = soup.select("div.infocard__container__item:nth-child(4)>div.infocard__container__item__main")
data = {
"title": title,
"cost": cost[0].get_text().strip(),
"time": time[0].get_text().strip(),
"area": list(area[0].stripped_strings),
"who": who[0].get_text().strip(),
"visitor": visitor[0].get_text().strip()
}
print(data)
{'title': '现货400多台液晶电脑,低价出售,保修一年,可送货,李村附近,需要请联系! - 青岛58同城', 'cost': '350 元', 'time': '2018-08-23 发布', 'area': ['李沧', '-', '李村'], 'who': '李先生', 'visitor': '0'}
最新文章
- 扩展Bootstrap Tooltip插件使其可交互
- TCP滑动窗口机制
- CYQ.Data 数据层框架 CYQ.Data 数据框架 使用篇四 MAction 增删改
- Mvc中域的添加和不同域之间的跳转
- IIS 平台NET无后缀名伪静态实现办法
- 第一个PHP程序-HelloWorld
- Java中测试异常的多种方式
- 初识socket
- bootstrapt model 的多罩层,禁用罩层
- Android ListView 自定义 Adapter
- HDU 4267-A Simple Problem with Integers(多个BIT)
- IO定时器
- 201521123035《Java程序设计》第十周实验总结
- k短路模板 POJ2449
- 遍历JSON
- 从零开始学习PYTHON3讲义(八)列表类型跟冒泡排序
- Javascript 综合示例 网页扫雷游戏
- lua中table的遍历,以及删除
- 温故而知新:柯里化 与 bind() 的认知
- Linux下wget下载整个FTP目录(含子目录)--转载