由于前几天看电脑时间过长,在昨天的时候,两个眼睛就有点疼痛感觉,所以昨天晚上就没有学习,博客也没有跟着写,今早去校医院买了点药,上午把老师要求的电路板画完了,已经发出去做了,现在闲来无事,看了一会关于爬虫的书,现在做一下总结,可能比较枯燥。

1、会话

我们平时打电话的时候,从拨号到挂断电话,就可以称之为一个会话。

在web中,会话的作用就是用来存储用户会话所需要的属性以及一系列配置信息,这样的话,我们在网页之间跳转的时候,那么关于会话的一些信息就不会丢失了。

2、Cookies

在一些网页,我们需要登录之后才可以进行一些后续的操作,很多时候,我们在后来再次打开该网页时,会自动登录,而且在一定时间内都是有效的。这就涉及到Cookies了。

书上的定义为:Cookies是指某些网站为了辨别用户身份、进行会话跟踪而存储在用户本地终端上的数据。

3、会话维持

当我们使用我们的客户端进行请求服务器的操作的时候,服务器会返回一个带有Set-Cookies字段的响应,主要的目的就是标记用户,这时,客户端会将响应信息保存下来。这样的话,在下一次,我们再次请求服务器的时候,我们的客户端就会将之前保存到关键信息发送给服务器,这些信息中带有关于用户的ID信息,这样服务器在浏览收到的信息时,就会找到对应的会话,然后再判断会话进而识别用户状态。上边所谈到的信息,都是Cookies。

4、会话Cookies和持久Cookies

会话Cookies:就是把Cookies放置在浏览器内存里边,这些Cookies会随着浏览器的关闭而失效。

持久Cookies:就是把Cookies放置在客户端硬盘里边,这些Cookies会长久保存,当然这个保存时间也是可以设置的。

5、代理

代理指的是代理服务器,主要是做爬虫的时候,我们常常需要频繁的访问网站,如果这个网站有反爬虫机制,那我们的ip很有可能会被封锁,代理的作用就是他可以隐藏我们的真实ip,让服务器以为是代理服务器在访问自己,这样就可以通过不断的更换代理来迷惑对方,从而是自己的ip不会被封锁。

代理的基本原理:我们在访问一个网站的时候,是先向网站发送一个请求,紧接着服务器会返回一个响应。如果我们使用代理的话,代理的角色就跟一个中介一样,位于客户端与服务器中间,此时我们访问网站的流程就变成了,客户端先向代理服务器发送一个请求,再由代理服务器将此请求发送给服务器,服务器紧接着会发回一个响应信息给代理服务器,由代理服务器再返回给客户端。第一,通过这种方法,我们可以正常的访问网页;第二,访问过程中,服务器识别出来的ip不是我们本机的ip,这样就实现了ip伪装。

6、代理的作用

(1)突破自身ip访问限制,访问平时不能访问的网站。

(2)访问一些单位或团体内部资源

(3)提高访问速度,代理服务器都设有一个比较大的硬盘缓冲区,当有外界信息通过的时候,会将其保存到缓冲区中,当其他用户再次访问相同的信息时,则直接将信息从缓冲区的提取出来传给用户,这样就提高了访问的速度。

(4)隐藏真实ip

今天就先写到这吧,等眼睛好了之后,在好好写,可能有写的不当的地方,还请大家多多指正,大家一起学习,共同进步。谢谢。

最新文章

  1. 作品-网站 - [二次开发] 广联达BIM
  2. 使用MDK3探测隐藏SSID名称
  3. 梳理源码中 View 的工作原理
  4. SPRING + THYMELEAF 配置
  5. C++编程新思维中的技巧
  6. yii2源码学习笔记(六)
  7. 一些Android框架
  8. MAC平台下mysql7.5的安装
  9. Oracle-SQL-按月统计自助终端交易量
  10. SQL Server循环——游标、表变量、临时表
  11. MySQL基础--字符函数
  12. json_encode让URL内容斜杠/不转义
  13. Unity3D NGUI 二 NGUI Button怎样接受用户点击并调用函数,具体方法名称是什么
  14. python网络编程-Select\Poll\Epoll异步IO
  15. FZUOJ 2205 据说题目很水 (无三元环图最大边数)
  16. 从数组去重这个函数来体验es6的高效率
  17. 页面报错Uncaught SyntaxError: Unexpected identifier
  18. 【区间更新区间求和】HDU 1698 Just a Hook
  19. [POI2001]Goldmine
  20. Python 之 基础知识(五)

热门文章

  1. rsync错误
  2. Python 简单统记Log 日记 下次用:python的内置logging模块 easy
  3. 【剑指Offer】面试题13. 机器人的运动范围
  4. 解决Tomcat在idea控制台乱码问题
  5. Ubuntu18安装LAMP环境详细步骤
  6. UVA - 11093 Just Finish it up(环形跑道)(模拟)
  7. windows driver 定时器的使用
  8. PHP的操作符与控制结构
  9. jquery获取高度
  10. 全局唯一性ID生成方法小结