selenium爬取驾考宝典题目
2024-09-02 09:56:28
要求
[x] Python3+
[x] Chrome驱动并已配置环境变量
[x] Selenium
## 研究页面
发现驾考宝典的科目四页面URL都是以 https://www.jiakaobaodian.com/mnks/exercise/0-car-kemu4-huaibei.html?id=916800,每翻一页最后的id值更新一次
所以,主函数可以写为
python # 1到15题 if __name__ == '__main__': for i in range(0, 15): getJkbd((i * 100 + 909800))
getJkbd()
是我自己定义的函数,对页面进行具体的操作
## 编写getJkbd函数
动态拼接url
python url = 'https://www.jiakaobaodian.com/mnks/exercise/0-car-kemu4-huaibei.html?id=' + str(num)
打开浏览器发出请求
browser = webdriver.Chrome()
browser.get(url)
添加等待函数,直至题目被加载出来,这是动态页面
wait = WebDriverWait(browser, 10)
wait.until(EC.presence_of_element_located((By.ID, 'ComQuestionDetail_qundefined')))
提取解析页面并打印到控制台
timu = browser.find_element_by_class_name('timu-text')
xpath = '/html/body/div[@class=\'container mnks-exercise\']/div[@class=\'layout-article\']/div[@class=\'container news-page\']/div[@class=\'frame-l-r\']/div[@class=\'left\']/div[@class=\'com-mnks-question-detail\']/div[@id=\'ComQuestionDetail_qundefined\']/div[@class=\'answer-w clearfix\']/div[@class=\'options-w left\']'
daan = browser.find_element_by_xpath(xpath)
print(timu.text)
print(daan.text)
browser.delete_all_cookies()
browser.close()
最新文章
- 关于C# Winform DataGridView 设置DefaultCellStyle无效的原因与解决方案
- 【JavaEE企业应用实战学习记录】servlet3.0上传文件
- Ubuntu 12.10
- 20145305 《Java程序设计》第9周学习总结
- PHP开发入行真功夫 三扬科技
- 使用ActivityGroup来切换Activity和Layout
- 虚拟机Linux下找不到/dev/cdrom
- C语言的强制类型转换
- IOS之【属性列表】
- Javascript数据类型共有六种
- 淘宝镜像 cnpm 不是内部命令
- js 加减乘除以及四舍五入 新写法
- MySQL--线程池(Thread Pool)
- App测试基本流程详解(汇总整理)
- SQL技巧两则:选择一个表的字段插入另一个表,根据其它表的字段更新本表内容
- .Net Core下使用Ajax,并传送参数到controllers
- 冒泡排序--注意flag变量的设置
- z-index随笔
- python习题-用交集方式产生随机密码
- [第一波模拟\day3\T2]{独立集}(bubble.cpp)