爬取58同城

from bs4 import BeautifulSoup
import requests
url = "https://qd.58.com/diannao/35200617992782x.shtml"
web_data = requests.get(url)
soup = BeautifulSoup(web_data.text, 'lxml')

title = soup.title.text
cost = soup.select("div#basicinfo span.infocard__container__item__main__text--price")
time = soup.select(".detail-title__info__text:nth-child(1)")
visitor = soup.select("span#totalcount")
area = soup.select("div.infocard__container__item:nth-child(3)>div.infocard__container__item__main")
who = soup.select("div.infocard__container__item:nth-child(4)>div.infocard__container__item__main")
data = {
   "title": title,
   "cost": cost[0].get_text().strip(),
   "time": time[0].get_text().strip(),
   "area": list(area[0].stripped_strings),
   "who": who[0].get_text().strip(),
   "visitor": visitor[0].get_text().strip()
}
print(data)
{'title': '现货400多台液晶电脑,低价出售,保修一年,可送货,李村附近,需要请联系! - 青岛58同城', 'cost': '350 元', 'time': '2018-08-23 发布', 'area': ['李沧', '-', '李村'], 'who': '李先生', 'visitor': '0'}

最新文章

  1. 扩展Bootstrap Tooltip插件使其可交互
  2. TCP滑动窗口机制
  3. CYQ.Data 数据层框架 CYQ.Data 数据框架 使用篇四 MAction 增删改
  4. Mvc中域的添加和不同域之间的跳转
  5. IIS 平台NET无后缀名伪静态实现办法
  6. 第一个PHP程序-HelloWorld
  7. Java中测试异常的多种方式
  8. 初识socket
  9. bootstrapt model 的多罩层,禁用罩层
  10. Android ListView 自定义 Adapter
  11. HDU 4267-A Simple Problem with Integers(多个BIT)
  12. IO定时器
  13. 201521123035《Java程序设计》第十周实验总结
  14. k短路模板 POJ2449
  15. 遍历JSON
  16. 从零开始学习PYTHON3讲义(八)列表类型跟冒泡排序
  17. Javascript 综合示例 网页扫雷游戏
  18. lua中table的遍历,以及删除
  19. 温故而知新:柯里化 与 bind() 的认知
  20. Linux下wget下载整个FTP目录(含子目录)--转载

热门文章

  1. MyBatis动态批量插入、更新Mysql数据库的通用实现方案
  2. PHP判断图片格式的七种方法小结
  3. keep-alive vue组件缓存避免多次加载相应的组件
  4. python 清空文件夹
  5. ocilib linux编译安装
  6. FastReport模板设计和调用
  7. Streamy障碍二:超大排序合并
  8. Redis源码解析:01简单动态字符串SDS
  9. laravel 授权使用gate门类
  10. 微信公众号无法使用css3的多行省略