java语言编写一个简单爬取网站图片工具,实现简单:

  • 通过 java.net.HttpURLConnection 获取一个URL连接
  • HttpURLConnection 连接成功返回一个java.io.InputStream,通过InputStream读取图片放入到字节数组buff
  • 通过BufferedOutputStream(new FileOutputStream(new File("TEST.jpg"))) 形式 将内存buff里的图片数据写入到test.jpg文件中

给出工具类的CatchIMG.java代码如下:

/**
* @Title: CatchIMG.java
* @Package web1203.tools
* @Description: TODO(用一句话描述该文件做什么)
* @author penny
* @date 2017年12月3日 下午9:00:05
* @version V1.0
*/
package web1203.tools; import java.io.BufferedInputStream;
import java.io.BufferedOutputStream;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.net.HttpURLConnection;
import java.net.MalformedURLException;
import java.net.URL; /**
* @ClassName: CatchIMG
* @Description: 爬取一个指定地址的网络图片
* @author penny
* @date 2017年12月3日 下午9:00:05
*
*/
public class CatchIMG { /**
*
* @Title: getImg
* @Description: 通过一个url 去获取图片
* @param @param url 图片的连接地址
* @param @throws IOException
* @throws
*/
public static void getImg(String url) throws IOException{
long startTime = System.currentTimeMillis();
URL imgURL = new URL(url.trim());//转换URL
HttpURLConnection urlConn = (HttpURLConnection) imgURL.openConnection();//构造连接
urlConn.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.79 Safari/537.36");
urlConn.connect();
System.out.println(CatchIMG.class.toString()+":获取连接="+urlConn.getResponseMessage());
if(urlConn.getResponseCode()==200){//返回的状态码是200 表示成功
InputStream ins = urlConn.getInputStream(); //获取输入流,从网站读取数据到 内存中
OutputStream out = new BufferedOutputStream(new FileOutputStream(new File("TEST.jpg")));
int len=0;
byte[] buff = new byte[1024*10];//10k缓冲流 视你内存大小而定咯 while(-1!=(len=(new BufferedInputStream(ins)).read(buff))){//长度保存到len,内容放入到 buff
out.write(buff, 0, len);//将图片数组内容写入到图片文件
// System.out.println(CatchIMG.class.toString()+":"+len+"byte已经写入到文件中,内容: "+new String(buff));
}
urlConn.disconnect();
ins.close();
out.close();
System.out.println(CatchIMG.class.toString()+":获取图片完成,耗时="+((System.currentTimeMillis()-startTime)/1000)+"s");
}
}
/**
* @throws IOException
* @Title: main
* @Description: 测试方法
* @throws
*/
public static void main(String[] args) throws IOException {
CatchIMG.getImg("https://files.cnblogs.com/files/humi/wc.bmp");//
} }

测试中要获取的图片是这个https://files.cnblogs.com/files/humi/wc.bmp

最终效果

imgraber

*** 一个自己写的java 爬虫基于jsoup和swing技术

最新文章

  1. 那些年一起用过的iOS开发利器[4月2号更新]
  2. Greedy:Fence Repair(POJ 3252)
  3. 如何在Quagga BGP路由器中设置IPv6的BGP对等体和过滤
  4. Android 中如何获取 H5 保存在 LocalStorage 的数据
  5. SQLBulkCopy使用
  6. java service
  7. setTimeout 和 setInterval区别
  8. SmartQQ二维码登陆接口分析
  9. PASCAL的优越性:官方的说法(不需要Makefile,节约大量的时间)
  10. js如何控制css伪元素内容(before,after)
  11. poll机制分析[转]
  12. C#全局鼠标键盘Hook
  13. Python常用数据结构之collections模块
  14. 201421123042 《Java程序设计》第13周学习总结
  15. Petrozavodsk Summer-2016. Ural FU Dandelion Contest
  16. python随机数random模块
  17. 2154 杭电 数学规律 ACM
  18. Spark搭建HA具体解释
  19. ql常见面试题 受用了
  20. byte[]->new String(byte[]) -> getByte()引发的不一致问题

热门文章

  1. 组合数学---P1358 扑克牌
  2. C++在线编程网站
  3. Python使用设计模式中的责任链模式与迭代器模式的示例
  4. 【ARTS】01_30_左耳听风-201900603~201900609
  5. iOS-NSdata 与 NSString,Byte数组,UIImage 的相互转换
  6. iOS算法题
  7. Spring 分布式事务详解
  8. 关于async await的测试
  9. laravel进程管理supervisor的简单说明
  10. TF-IDF算法与余弦相似性