Java Executor框架是Jdk1.5之后推出的,是为了更加方便的开发多线程应用而封装的框架;

  相比传统的Thread类,Java Executor使用方便,性能更好,更易于管理,而且支持线程池,所以我们在开发爬虫的时候,为了提高爬虫的爬取效率,我们要使用多线程,推荐使用Java的Executor框架来实现,因为Executor框架 既简单又高效;

Java Executor框架在爬虫应用中的使用

  常用接口:

  创建固定数目线程的线程池。

  public static ExecutorService newFixedThreadPool(int nThreads)

  

  执行一个线程

  void java.util.concurrent.Executor.execute(Runnable command)

  查看活动线程个数

  int java.util.concurrent.ThreadPoolExecutor.getActiveCount()

  结束所有线程

  void java.util.concurrent.ExecutorService.shutdown()

  说明:Executor在管理多个线程的时候,会进行有效的安排处理,比如创建的时候,线程池是10个,假如实际线程超过10个,Executor会进行有效的队列阻塞和调度。对我们开发者这是透明的,完全不用关心它内部的具体执行;

  测试用例

  

 import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.ThreadPoolExecutor;
import java.util.concurrent.atomic.AtomicInteger; /**
* @author zsh
* @site www.qqzsh.top
* @company wlgzs
* @create 2019-06-02 10:57
* @description
*/
public class ExecutorTest { // 执行标识
private static boolean exeFlag=true; public static void main(String[] args) throws InterruptedException {
// 创建ExecutorService 连接池创建固定的10个初始线程
ExecutorService executorService = Executors.newFixedThreadPool(2);
AtomicInteger atomicInteger = new AtomicInteger(); while (exeFlag){
if (atomicInteger.get() <= 100){
executorService.execute(new Runnable() {
@Override
public void run() {
System.out.println("爬取了第"+atomicInteger.get()+"网页...");
atomicInteger.getAndIncrement();
}
});
}else {
if (((ThreadPoolExecutor)executorService).getActiveCount() == 0){
executorService.shutdown();
exeFlag=false;
System.out.println("爬虫任务已经完成");
}
} Thread.sleep((long) 0.1);
}
}
}

最新文章

  1. javaScript之BOM操作1
  2. 深入探索c++对象模型
  3. 推送 iOS 10
  4. PagerTabStrip在ViewPager的页面中添加标题显示
  5. 【转】Java魔法堂:String.format详解
  6. 跨域iframe高度自适应(兼容IE/FF/OP/Chrome)
  7. 关于线程池ThreadPoolExecutor使用总结
  8. CentOS下利用sshpass不用手动输入密码远程执行命令
  9. Web API-路由(二)
  10. html学习笔记 - sublime text 插件安装
  11. Lua 设置table为只读属性
  12. 【翻译】旧技术成就新勒索软件,Petya添加蠕虫特性
  13. 【zabbix系列】安装与加入host
  14. Mac命令行
  15. 【STM32H7教程】第6章 STM32H7工程模板建立(IAR8)
  16. centos没有可用软件包 libgtk2
  17. python操作mysql数据-执行语句返回值直接返回字典类型
  18. vuejs2.0实现分页组件,使用$emit进行事件监听数据传递
  19. 『TensorFlow』梯度优化相关
  20. rsync简介与rsync+inotify配置实时同步数据

热门文章

  1. js多种去重的方法总结
  2. [转帖]重估BAT与华为的云上野心
  3. java当中JDBC当中Scrollable和Updatable ResultSet的用法和Helloworld例子
  4. CH08 QSPI启动并从EMMC运行APP
  5. Scratch编程:快乐的小马(三)
  6. luogu P4887 莫队二次离线
  7. python之(urllib、urllib2、lxml、Selenium+PhantomJS)爬虫
  8. 记https在Android浏览器无法访问
  9. linux配置sftp简单过程
  10. 易优cms后台RCE以及任意文件上传漏洞