在做网页抓取的时候经常会遇到一个问题就是页面中的链接是相对链接,这个时候就需要对链接进行url拼接,才能得到绝对链接. url严格按照一定的格式构成,一般为如下5个字段: 详细可参考RFC:http://tools.ietf.org/html/rfc3986 url拼接一般包含如下几种情况: 1.相对链接不包含路径,则直接在父链接所在的路径级别后面加上该相对链接即可得到拼接的url: 例如:http://www.baidu.com, 相对链接:index.html,得到:http://www.b