下面运行步骤除了配置文件有部分改动,其他都是参照hadoop下载解压的share/doc/index.html。

hadoop下载:http://apache.opencas.org/hadoop/common/

解压至无空格目录下即可,下面是目录结构:

下面配置windows环境:

JavaJDK

我采用的是1.8的,配置JAVA_HOME,如果默认安装,会安装在C:\Program Files\Java\jdk1.8.0_51。此目录存在空格,启动hadoop时将报错,JAVA_HOME
is incorrect ...此时需要将环境变量JAVA_HOME值修改为:C:\Progra~1\Java\jdk1.8.0_51,Program Files可以有Progra~代替。

Hadoop 环境变量:

新建HADOOP_HOME,指向hadoop解压目录,如:D:/hadoop。path环境变量中增加:%HADOOP_HOME%\bin;。

Hadoop 依赖库:

winutils相关,hadoop在windows上运行需要winutils支持和hadoop.dll等文件,下载地址:http://download.csdn.net/detail/fly_leopard/9503059

注意hadoop.dll等文件不要与hadoop冲突。为了不出现依赖性错误可以将hadoop.dll放到c:/windows/System32下一份。

hadoop环境测试

起一个cmd窗口,起到hadoop/bin下,hadoop version,显示如下:

hadoop基本文件配置:hadoop配置文件位于:hadoop/etc/hadoop下

core-site.xml / hdfs-site.xml / mapred-site.xml / yarn-site.xml

core-site.xml:

[html] view
plain
 copy

 

print?

  1. <configuration>

    <property>

    <name></name>

    <value></value>

    </property>

    </configuration>

hdfs-site.xml:

  1. <configuration>

    <property>

    <name></name>

    <value></value>

    </property>

    <property>

    <name></name>

    <value></value>

    </property>

    <property>

    <name></name>

    <value></value>

    </property>

    </configuration>

mapred-site.xml:

  1. <configuration>

    <property>

    <name></name>

    <value></value>

    </property>

    </configuration>

    <configuration>

    <property>

    <name></name>

    <value></value>

    </property>

    <property>

    <name></name>

    <value></value>

    </property>

    </configuration>

格式化系统文件:

hadoop/bin下执行 hdfs namenode -format

待执行完毕即可,不要重复format。

格式化完成后到hadoop/sbin下执行 start-dfs启动hadoop

访问:http://localhost:50070

(不是必须的 ) 创建目录:用于输入和输出,Linux上是/user/用户名/xx
windows上可能没具体要求,我创建也是按照liunx目录方式的。参照的api doc上面

创建完成可以通过hdfs dfs-ls 目录名称查看,也可以在浏览器中查看创建的目录或文件

input输入文件到目录:login_weibo2是我自己创建的文本文件,位于hadoop一个盘的。此处是D:/hadoop/login_weibo2

如果了解命令参数输入hdfs dfs回车查看dfs命令参数 。hdfs dfs -put回车查看put相关参数。其他命令也是这样。

查看input输入的文件内容:

运行hadoop给的examples,做个参考,运行下面命令等待执行完成。hadoop jar jar文件位置 grep 输入目录(包含被处理文件的目录)  输出目录(运行结果输出目录)

然后查看文件夹下多了些东西,就是运行结果输出目录,结果般存在part-r-xxxx里面。

在hadoop/sbin下启动start-yarn,访问http://localhost:8088可查看 资源、节点管理

Tip:
(1)自己按照这个帖子配置好了,也启动成功了,因此放到第一个,我用的版本的2.8.1,执行启动的时候不要先入为主的认为切换到bin目录,实际是切换到sbin目录!
(2)至于“winutils”和“hadoop.dll”的文件下载,文中地址失效了!可以去这个地址https://github.com/steveloughran/winutils下载,而且下载的时候不要用右键-->另存为,而是要点击“winutils.exe”后到页面中找到Download按钮下载!

最新文章

  1. java学习:ArrayList的实现及原理
  2. VIRTUALBOX 虚拟机安装 OS X 10.9 MAVERICKS
  3. js库开发--参数传递及方法修改
  4. SilkTest高级进阶系列9 – 异步执行命令
  5. Insert Select
  6. CentOS7防火墙管理firewalld
  7. Cent os6.5 安装python3.2
  8. MySQL - GROUP BY和HAVING的用法
  9. ffmpeg+libmp3lame库源码安装教程(CentOS)
  10. 2018.12.30 洛谷P4238 【模板】多项式求逆
  11. [转帖]技术盛宴 | 关于PoE以太网供电技术详解
  12. RxJava 操作符 on和doOn 线程切换 调度 Schedulers 线程池 MD
  13. ringojs 的包管理
  14. NuGet 2.0 (.NET软件包管理器) 发布了-现在升级吧
  15. SPI最大传输速率【转】
  16. [Groovy]获取当前活动的Environment,获取response中节点的name和节点的value
  17. Idea工具使用
  18. python3 基于tcp 简单client和server
  19. C++ 类模板二(类模版与友元函数)
  20. DSP/BIOS使用之初窥门径——滴答时钟及烧写Flash

热门文章

  1. Java trycatch使用重试Retryer
  2. arduino入门笔记
  3. BZOJ 4903: [Ctsc2017]吉夫特 数论+dp
  4. Reactive Extensions (Rx) 入门(3) —— Rx的事件编程
  5. Git常用命令与入门
  6. javascript冒泡排序 至少比较N(N-1)/2次;
  7. 高考数学答卷策略[K12论坛转载]
  8. mac下 Eclipse代码自动补齐 设置
  9. 【Beta】Scrum meeting 6
  10. 分析 Kaggle TOP0.1% 如何处理文本数据