在解析网页信息的时候,需要登录后才能访问,所以使用httpclient模拟登录,然后把cookie保存下来,以供下一次访问使用,这时就需要持久化cookie中的内容。

在之前先科普一下基础知识:

什么是Cookies?

Cookies 是一些小文件,它们被创建在客户端的系统里,或者被创建在客户端浏览器的内存中(如果是临时性的话)。用它可以实现状态管理的功能。我们可以存储一些少量 信息到可以短的系统上,以便在需要的时候使用。最有趣的事情是,它是对用户透明的。在你的web应用程序中,你可以到处使用它,它极其得简单。 Cookies是以文本形式存储的。如果一个web应用程序使用cookies,那么服务器负责发送cookies,客户端浏览器将存储它。浏览器在下次 请求页面的时候,会返回cookies给服务器。最常用的例子是,使用一个cookie来存储用户信息,用户的喜好,“记住密码”操作等。Cookies 有许多优点,当然也有许多缺点。我将在接下来讲述。

Cookies是如何创建的?

当 一个客户端向服务器发出请求,服务器发送cookies给客户端。而相同的cookies可以被后续的请求使用。例如,如果 codeproject.com将Session ID作为cookies存储。当一个客户端首次向web服务器请求页面,服务器生成Session ID,并将其作为cookies发送往客户端。

现在,所有来自相同客户端的后续请求,它将使用来自cookies的Session ID,就像下面这幅图片展示的那样。

浏览器和web服务器以交换cookies信息来作为响应。对不同的站点,浏览器会维护不同的cookies。如果一个页面需要cookies中的信息,当某个URL被“点击”,首先浏览器将搜索本地系统的cookies的信息,然后才转向服务器来获得信息。

Cookies的优势

下面是使用cookies的主要优势:

(1)    实现和使用都是非常简单的

(2)    由浏览器来负责维护发送过来的数据(cookies内容)

(3)    对来自多个站点的cookies来讲,浏览器自动管理它们

Cookies的劣势

下面是cookies的主要劣势:

(1)    它以简单的文本格式来存储数据,所以它一点也不安全

(2)    对于cookies数据,有大小限制(4kB)

(3)    Cookies最大数目也有限制。主流浏览器提供将cookies的个数限制在20条。如果新cookies到来,那么老的将被删除。有些浏览器能支持到300条的cookies数。

(4)    我们需要配置浏览器,cookies将不能工作在浏览器配置的高安全级别环境下。

什么是持久化的和非持久化的Cookies

我们可以将cookies分成两类:

(1)    持久化的cookies

(2)    非持久化的cookies

持久化的cookies:这可以被称为永久性的cookies,它被存储在客户端的硬盘内,直到它们失效。持久化的cookies应该被设置一个失效时间。有时,它们会一直存在直到用户删除它们。持久化的cookies通常被用来为某个系统收集一个用户的标识信息。

非持久化cookies:也可以被称之为临时性的cookies。如果没有定义失效时间,那么cookie将会被存储在浏览器的内存中。我上面展示的例子就是一个非持久的cookies。

修改一个持久化的cookies与一个非持久化的cookies并没有什么不同。它们唯一的区别是——持久化的cookies有一个失效时间的设置。

Cookie持久化

HttpClient
可以和任意物理表示的实现了CookieStore接口的持久化cookie存储一起使用。默认的CookieStore实现称为
BasicClientCookie,这是凭借java.util.ArrayList的一个简单实现。在BasicClientCookie对象中存储
的cookie当容器对象被垃圾回收机制回收时会丢失。如果需要,用户可以提供更复杂的实现。

下载着重介绍在安卓中如何利用httpclient来实现对cookie的持久化操作:

一、请求网络获取cookie

先看一下下面的代码:

  1. DefaultHttpClient httpclient = new DefaultHttpClient();
  2. HttpGet httpget = new HttpGet("http://www.hlovey.com");
  3. HttpResponse response = httpclient.execute(httpget);
  4. HttpEntity entity = response.getEntity();
  5. List<Cookie> cookies = httpclient.getCookieStore().getCookies();  //执行了请求后才会有cookie

Post模拟登录

    1. HttpPost httpPost = new HttpPost(url);
    2. List<NameValuePair> formparams = new ArrayList<NameValuePair>();
    3. formparams.add(new BasicNameValuePair("id", userid));
    4. formparams.add(new BasicNameValuePair("passwd", passwd));
    5. UrlEncodedFormEntity entity;
    6. try {
    7. entity = new UrlEncodedFormEntity(formparams, mobileSMTHEncoding);
    8. } catch (UnsupportedEncodingException e1) {
    9. return 3;
    10. }
    11. httpPost.setEntity(entity);
    12. httpPost.setHeader("User-Agent", userAgent);
    13. HttpResponse response = httpClient.execute(httpPost);

最新文章

  1. 手把手教从零开始在GitHub上使用Hexo搭建博客教程(二)-Hexo参数设置
  2. 结合WebSocket编写WebGL综合场景示例
  3. Oracle介绍(初学者必须知道的)
  4. SQL语句技巧:查询时巧用OR实现逻辑判断
  5. IOS开发UI基础UIControl事件
  6. P1351 联合权值
  7. 如何在Eclipse中添加Tomcat的jar包
  8. cocos2d-x lua 使用http(下载图片, POST JSON)
  9. HDU4614【线段树。】
  10. hdu 4267
  11. 在cnblog中使用syntax方法
  12. Oracle 常见函数使用汇总
  13. 说说如何用js实现一个模板引擎
  14. (转ORCLE导入导出命令)
  15. hibernate和mybatis区别
  16. jenkins-参数化构建(二)插件:Extended Choice Parameter
  17. MySQL监控全部执行过的sql语句
  18. css布局------上下高度固定,中间高度自适应容器
  19. js for in 获得遍历数组索引和对象属性
  20. win10 cmake编译 opencv4.0 + pyhton3.7x64

热门文章

  1. shp系列(四)——利用C++进行Shx文件的读(打开)
  2. Codeforces 680D Bear and Tower of Cubes 贪心 DFS
  3. c++ stl swap
  4. 访问修饰符相关注意点(protected子类友好)
  5. DropDownListFor
  6. 谷歌vimium配置
  7. IE浏览器 ajax传参数值为中文时出现乱码的解决方案
  8. 更换WordPress编辑器为TinyMCE Advanced
  9. 关于安卓调用wcf的一些问题
  10. ObjectT5:在线随机森林-Multi-Forest-A chameleon in track in