发现现在几乎所有的网站都对url中的汉字和特殊的字符,进行了urlencode操作,也就是:

http://hi.baidu.com/%BE%B2%D0%C4%C0%CF%C8%CB/creat/blog/

这个样子,中间%形式的,肯定就是我的登录用户名称了吧。

为什么对这些字符进行了u的编码形式,是为了字符编码(gbk、utf8)还是为了不出现特殊的字符在url中?都知道要转,但是转了的真正好处呢。查看了网上的很多资料,也没有找到更加准确的说法。

url转义其实也只是为了符合url的规范而已。因为在标准的url规范中中文和很多的字符是不允许出现在url中的。

看一下php的urlencode的说明了。

urlencode — 编码 URL 字符串

string urlencode ( string $str )

返回字符串,此字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数,空格则编码为加号(+)。此编码与 WWW 表单 POST 数据的编码方式是一样的,同时与 application/x-www-form-urlencoded 的媒体类型编码方式一样。由于历史原因,此编码在将空格编码为加号(+)方面与 RFC1738 编码(参见 rawurlencode())不同。此函数便于将字符串编码并将其用于 URL 的请求部分,同时它还便于将变量传递给下一页。

标准的英文说明是:

"...Only alphanumerics [0-9a-zA-Z], the special characters "$-_.+!*'()," [not including the quotes - ed], and reserved characters used for their reserved purposes may be used unencoded within a URL."

那哪些字符是需要转化的呢?

1. ASCII 的控制字符

这些字符都是不可打印的,自然需要进行转化。

2. 一些非ASCII字符

这些字符自然是非法的字符范围。转化也是理所当然的了。

3. 一些保留字符

很明显最常见的就是“&”了,这个如果出现在url中了,那你认为是url中的一个字符呢,还是特殊的参数分割用的呢?

4. 就是一些不安全的字符了。

例如:空格。为了防止引起歧义,需要被转化为“+”。

明白了这些,也就知道了为什么需要转化了,而转化的规则也是很简单的。

按照每个字符对应的字符编码,不是符合我们范围的,统统的转化为%的形式也就是了。自然也是16进制的形式。

和字符编码无关

通过urlencode的转化规则和目的,我们也很容易的看出,urleocode是基于字符编码的。同样的一个汉字,不同的编码类型,肯定对应不同的urleocode的串。gbk编码的有gbk的encode结果。

apache等服务器,接受到字符串后,可以进行decode,但是还是无法解决编码的问题。编码问题,还是需要靠约定或者字符编码的判断解决。

因此,urleocode只是为了url中一些非ascii字符,可以正确无误的被传输,至于使用哪种编码,就不是eocode所关心和解决的问题了。

编码问题,不是urlencode所要解决的。
转自:http://apps.hi.baidu.com/share/detail/32230450

参考资料:

http://www.blooberry.com/indexdot/html/topics/urlencoding.htm

http://cn.php.net/manual/zh/function.urlencode.php

最新文章

  1. 【javascript 技巧】Array.prototype.slice的妙用
  2. ALV Tree demo(WBS元素分层显示)[引用别人的]
  3. 安装CocoaPods碰到的问题
  4. 扩展 easyui-tabs 插件 关闭标签页方法
  5. JS match() 方法 使用
  6. Excel应该这么玩——1、命名单元格:干掉常数
  7. POJ1811 Prime Test(miller素数判断&&pollar_rho大数分解)
  8. 杭电 3177 Crixalis's Equipment
  9. 李洪强漫谈iOS开发[C语言-034]-程序的结构
  10. Android之读取 AndroidManifest.xml 中的数据
  11. 对数据预处理的一点理解[ZZ]
  12. sublime搜索和替换--正则
  13. 适用于kali linux的远程桌面开启方法(从windows xp 远程登录到kali linux )
  14. oracle中可能使用到的命令
  15. 《CLR Via C#》读书笔记:27.计算限制的异步操作
  16. LeetCode(283. 移动零)
  17. ABP框架系列之三十五:(MVC-Controllers-MVC控制器)
  18. synchronized(六)
  19. java-Arrays类
  20. 插件开发-滑条(slide)开发

热门文章

  1. MVC流程图
  2. [Create_Cdi]
  3. linux生成指定大小的文件(转)
  4. 懒人学习automake, Makefile.am,configure.ac(转)
  5. Chrome 完整版官方下载
  6. 51单片机 | A/D转换器实现数字电压表实例
  7. 键盘上所有键位的ascii值
  8. ajax个人学习笔记
  9. stage3D基础四----Stage3D和透视投影的使用(转)
  10. 《Python基础教程》第20章学习笔记