1)在编写MR程序的时候经常会有如下代码:

String uri=“。。。。”;

Configuration conf=new Configuration();

FileSystem fs=FileSystem.get(URI.create(uri),conf);

URI究竟是什么东西?有什么用?
2)URI称为统一资源标示符,在Hadoop中使用URI路径作为参数,其格式是:scheme://authority/path。对于HDFS文件系统,scheme(对应协议名)就是hdfs(对于本地文件系统就是file),authority就是namenode主机名,path就是文件(目录)的路径构成的字符串。一个HDFS目录或者文件,比如/parent/child,可以表示为hdfs://namenode:namenodeport/parent/child,一直namenode名称为Master,对应HDFS的端口号是9000的话,实际上就是hdfs://Master:9000/parent/child。当然,scheme和authority参数是可选的,也就是可以省略,如果未加指定就会使用配置中指定的默认值(也就是core-site.xml中配置项fs.default.name的值),如果fs.default.name=hdfs://Master:9000,那么仅仅使用/parent/child就可以表示hdfs://Master:9000/parent/child。这样可以解释conf和URI一起使用,conf是配置文件(conf目录下的配置文件们)相关的对象,uri省略了scheme和authority的部分,虽然不完整,但是与conf配置使用,读取了core-site.xml中的默认scheme值,组成了完整的URI对象,然后创建FileSystem对象。

参考:

https://hadoop.apache.org/docs/r1.0.4/cn/hdfs_shell.html

http://www.cnblogs.com/linjiqin/p/3147837.html

最新文章

  1. BZOJ2933:POI1999地图
  2. c# XML序列化与反序列化 属性字段标识
  3. Sqlserver创建连接MySql的链接服务器
  4. JavaScript脚本语言基础(一)
  5. Junit4入门
  6. activity的android:name 设置问题
  7. iOS开发系列--让你的应用“动”起来
  8. 2016/7/7 自定义函数copy
  9. 自定义复选框 checkbox 样式
  10. WWDC心愿单:新版OS X或将有这些变化
  11. javascript 变量 命名规范 变量的作用域
  12. larbin是一种开源的网络爬虫/网络蜘
  13. WisDom .net开发框架设计 2
  14. LeetCode 题目总结/分类
  15. 搭建CAS服务器,并实现一个简单的单点登录的demo
  16. JQuery的deferred对象学习总结
  17. [django]用fastcgi部署
  18. scrapy分布式爬虫scrapy_redis一篇
  19. 使用phpAnalysis打造PHP应用非侵入式性能分析器
  20. Fiddler 使用fiddler发送捕获的请求及模拟服务器返回

热门文章

  1. wget下载HTTPS链接
  2. Google MapReduce中文版
  3. ShareSDK入门指南:Android 10分钟快速集成
  4. Dom4j解析语音数据XML文档(注意ArrayList多次添加对象,会导致覆盖之前的对象)
  5. Javadoc注释的用法
  6. django原生sql
  7. PL/SQL 04 游标 cursor
  8. 操作MySQL数据库相关代码
  9. 《Java编程思想》笔记 第一章 对象导论
  10. linux awk学习笔记