Python 爬取网页中JavaScript动态添加的内容(二)
2024-10-15 07:44:09
使用 selenium + phantomjs 实现
1、准备环境
selenium(一个用于web应用程测试的工具)安装:pip install selenium
phantomjs(是一种无界面的浏览器,用于完成网页的渲染)下载:http://phantomjs.org/download.html
2、使用
from selenium import webdriver url = 'http://jandan.net/ooxx'
driver = webdriver.PhantomJS(
executable_path='D:/Software/phantomjs-2.1.1-windows/bin/phantomjs.exe') # 如果没有配置phantomjs的环境变量,需要手动指定路径
driver.get(url)
print(driver.page_source)
最新文章
- git查看本地和创建分支、上传分支、提交代码到分支、删除分支等,git分支、git查看本地和创建分支以及上传分支到服务器
- 共享onload事件
- Lua 栈的理解
- [JS3] 立即执行JS
- 【Android测试】【第四节】LogCat——认识和使用
- LinkedHashSet与TreeSet
- iOS应用日志:开始编写日志组件与异常日志
- 闲谈Future模式-订蛋糕
- MongoDB的主从复制和副本集
- Java设计模式之装饰模式趣谈
- [Usaco2008 Dec]Patting Heads 轻拍牛头[筛法]
- 通过ionice和nice降低shell脚本运行的优先级
- .net 利用Emit将object转为DbParameter,DataTable转为List<;>;
- Docker 集群环境实现的新方式
- CCF-201312-2-ISBN号码
- CF_229E_Gift_概率DP+组合数学
- Ocelot简易教程(一)之Ocelot是什么
- 20175126《Java程序设计》第二周学习总结
- 判断终端类型、微信的文章防盗链、h5页面跳转打开新的app、跳转到app市场
- QQ项目(续)
热门文章
- VUE的组件DEMO
- next_permutation暴力搜索,POJ(3187)
- 【转】android四大组件--ContentProvider详解
- 怎样在 Ubuntu Linux 上安装 MySQL
- Responsive设计 (响应式设计)
- 如何在spring中运行多个schedulers quartz 实例
- Cannot resolve reference to bean &#39;sessionFactory&#39; while setting bean property &#39;sessionFactory&#39;; 没有sessionFactory
- spring-AspectJ
- 《Linux就该这么学》,刘小伙实在人,给打个广告
- Java源码解析——Java IO包