paip.抓取网页内容--java php python.txt



作者Attilax  艾龙, EMAIL:1466519819@qq.com

来源:attilax的专栏

地址:http://blog.csdn.net/attilax



//////////java

String urlContent = WebpageContent("http://www.123cha.com/ip/?q="+ip,"utf-8");







///////////php

file_get_contents($url);

 curl_init()>>>curl_exec

 fopen->fread->fclose

 

 

 /////python

 urllib.urlopen(url).read()

 response = urllib2.urlopen('http://www.baidu.com/')  

html = response.read()  

 

 ///ahk

 UrlDownloadToFile, URL, Filename



 

 

 public String downloadPage(String Url, String encode) {

        try {

            URL pageUrl = new URL(Url);

            // Open connection to URL for reading.

            BufferedReader reader = new BufferedReader(new InputStreamReader(

                    pageUrl.openStream(), encode));

            // BufferedReader br = new BufferedReader(new InputStreamReader(in,

            // "gbk"));

            // Read page into buffer.

            String line;

            StringBuffer pageBuffer = new StringBuffer();

            while ((line = reader.readLine()) != null) {

                pageBuffer.append(line);

            }

            String s = pageBuffer.toString();

            return s;

            // System.out.println(s);

            // return pageBuffer.toString();

        } catch (Exception e) {

            // return null;

            throw new RuntimeException(e);

        }



    }



 

 

 参考:

 php获取网页内容方法总结_php技巧_脚本之家.htm

 Python 3 抓取网页资源的 N 种方法.htm

最新文章

  1. [译]:Orchard入门——给网站添加新博客
  2. ASP.NET权限管理
  3. Oracle 存储过程异常处理
  4. C# 在Visual Studio中一个项目有两个Main函数, 怎么设置哪个是入口?取代csc /main选项。
  5. Andorid 编程 系统环境安装
  6. SD卡驱动分析(二)
  7. 增加duilib edit控件的提示功能和多种文字颜色
  8. java设计模式(装饰模式)
  9. js split str.split(" "); split使用方法 在某处截字符串
  10. [UWP]浅谈按钮设计
  11. HNOI2002 营业额统计(Splay Tree)
  12. springcloud禁用动注册正在运行的服务
  13. iOS 开发 nonatomic 和 atomic
  14. 不装插件,查看.rp文件
  15. git操作大全
  16. [Converge] Feature Selection in training of Deep Learning
  17. Win10系列:VC++ XML文件解析
  18. jdk1.8.0_45源码解读——HashSet的实现
  19. (C++)i++和++i,哪个效率高一些
  20. Solr学习之三 solr配置说明之一

热门文章

  1. openssl API网络通信
  2. linux ddos防御攻击
  3. Servlet调用过程整理
  4. 解决 webx.ml 中The superclass "javax.servlet.http.HttpServlet" was not found on the Java Build Path 问题
  5. 搭建DHCP服务器以及DHCP中继服务器
  6. select与poll函数介绍
  7. SQL保留关键字不能用作表名
  8. MySQL数据库指定字符集
  9. ubuntu14安装java8
  10. 关于MATHAPP的测试