import time
from selenium import webdriver browser = webdriver.Chrome()
wait_time = 1
USER = 'xl.feng'
PWD = 'fengxiaole'
seed_url = 'http://xx.com/login.jhtml'
browser.get(seed_url)
# time.sleep(wait_time) search_input_user = browser.find_element_by_id('username')
search_input_pwd = browser.find_element_by_id('password')
search_submit = browser.find_element_by_xpath('//div[@class="x-y"]/input[@type="submit"]') search_input_user.send_keys(USER)
search_input_pwd.send_keys(PWD) search_submit.click()
time.sleep(wait_time) new_url = 'http://xx.com/index.jhtml'
browser.get(new_url)
target = browser.find_element_by_xpath('//ul[@class="x-list y-sidebar-list"]/li[3]')
target.click()
target = browser.find_element_by_id('clickHome')
target.click() new_url = 'http://xx.com/ask/list.jhtml?nxType=nx'
browser.get(new_url) counter_ = 1 def fun():
global counter_
if counter_ == 170000:
return
wait_time = 2
time.sleep(wait_time) target = browser.find_element_by_id('dg_next')
target.click()
current_url = browser.current_url
page_source = browser.page_source localtime_ = time.strftime("%y%m%d", time.localtime())
dir_ = 'ml_task_html/'
filename_ = '%s%s_%s%s' % (dir_, counter_, localtime_, '.html')
fo = open(filename_, 'w', encoding='utf-8')
fo.write(page_source)
fo.closed
print(counter_)
counter_ += 1 fun() fun() dd = 0

  

最新文章

  1. ExecuteReader在执行有输出参数的存储过程时拿不到输出参数
  2. java之多线程 一
  3. Linus爱GPL 但不喜欢GPL诉讼
  4. linux下搭建属于自己的博客(WordPress安装)
  5. Eclipse在线安装ADT插件
  6. aix下oracle数据库创建表空间和用户
  7. Java使用poi对Execl简单操作_总结
  8. sql生成20位数随机数
  9. 利用KVC实现无需协议的委托模式
  10. 为什么switch...case语句比if...else执行效率高
  11. FZU 1397 保送
  12. 2019春下载的sublime text都无法自动安装package control:解决办法
  13. 利用SMB jcifs实现对windows中的共享文件夹的操作
  14. es6(10)--Set,Map(2)
  15. Sql递归关联情况,With作为开头条件。
  16. 服务端模版注入漏洞检测payload整理
  17. Wannafly挑战赛22游记
  18. MVC批量更新,使用jQuery Template
  19. ubuntu 下安装 VIM 依赖vim-common错误
  20. iOS- iPad里有趣的UIPopoverController

热门文章

  1. 【Hadoop】HIVE 数据表 使用
  2. 点击Div,显示其innerHTML
  3. 倍福TwinCAT(贝福Beckhoff)基础教程 松下绝对值驱动器如何做初始化设置
  4. pip 安装自己开发模块 边调试边修改
  5. Android学习(十二) ContentProvider
  6. C#IAsyncResult异步回调函数的解释
  7. zabbix监控xenserver
  8. GetTickCount()函数的陷阱!
  9. Android linux kernel privilege escalation vulnerability and exploit (CVE-2014-4322)
  10. u-boot README--linux support