python3爬虫爬取金庸小说所有角色
2024-09-06 12:33:20
# -*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
url = 'http://www.jinyongwang.com/data/renwu/';
def getHTML(url):
r = requests.get(url)
return r.content
def parseHTML(html):
soup = BeautifulSoup(html,'html.parser')
body = soup.body
main = body.find('div',attrs={'class':'main'})
booklist = main.find('div',attrs={'class':'booklist'})
for datapice in booklist.find_all('div',attrs={'class':'datapice'}):
for a in datapice.find_all('a'):
print(a.get_text().replace(' ',''))
html = getHTML(url);
print(parseHTML(html))
最新文章
- java中Class对象详解和类名.class, class.forName(), getClass()区别
- 创建一个点状注记(MarkerElement)
- split(),preg_split()与explode()函数分析与介
- 西南科技大学第十一届ACM程序设计大赛发言稿
- 后缀自动机(SAM)模板
- H5 progress标记
- w3school之HTML学习笔记
- Bootstrap框架的要点--栅格系统
- IT之光
- ubuntu下搭建gtk+编程环境
- laravel5集成支付宝alipay扫码支付流程(Laravel 支付解决方案)
- OpenCV Mat格式存储YUV图像
- MySQL5.5安装教程
- [PHP] 算法-两个n位的二进制整数相加问题PHP实现
- c# Parallel.For 并行编程 执行顺序测试
- malloc,calloc,realloc函数用法,原理及不同解析
- 配置MySQL 5.6的主从复制
- 功率谱密度(PDS)的MATLAB分析
- 利用c#+jquery+echarts生成统计报表(附源代码)
- php文件上传——php经典实例