概述

本文记录windows下hadoop本地开发环境的搭建:

OS:windows
hadoop执行模式:独立模式

安装包结构:

Hadoop-2.6.0-Windows.zip
- cygwinInstall // cygwin离线安装包
- hadoop-2.6.0-windows.tar.gz // hadoop-2.6.0 windows安装包

PS:

hadoop-2.6.0-windows.tar.gz是基于官方发行包hadoop-2.6.0.tar.gz,并为windows单机測试而自己定义的包,修改例如以下:
1. 在bin文件夹下,加入了hadoop.dll和winutils.exe
2. 修改了org\apache\hadoop\io\nativeio\NativeIO.java源代码第558行 *因为源代码有修改,此包不能用于生产环境,仅仅限于windows环境下的开发測试

1. 安装cygwin

  1. 双击cygwinInstall下的setup-x86_64.exe
  2. 选择从本地安装

  3. 选择安装位置

  4. 选择本地安装文件位置

  5. 点击All旁边的default,使其变为Install,再点击下一步就可以開始安装

2. 安装hadoop

  1. 在cygwin的根文件夹下。建立opt文件夹,并把安装包复制到opt文件夹下

    cd /; mkdir opt

  2. 解压

    cd /opt; tar xzf hadoop-2.6.0-windows.tar.gz

  3. 环境变量设置

    设置windows环境变量HADOOP_PREFIX指向hadoop安装文件夹

    设置windows环境变量HADOOP_HOME指向hadoop安装文件夹

    设置windows环境变量JAVA_HOME指向java安装文件夹

    Path环境变量后追加:;%HADOOP_HOME%\bin

  4. ~/.bashrc中设置下面环境变量:

    export HADOOP_CLASSPATH=$(cygpath -pw $(hadoop classpath)):$HADOOP_CLASSPATH

  5. 使~/.bashrc生效,并验证hadoop是否工作

    source ~/.bashrc

    验证hadoop:

    hadoop version

    若正常显示版本号信息则成功安装

  6. 执行演示样例代码。验证hadoop是否可以执行mapreduce

    cd /opt/hadoop-2.6.0; mkdir input; cd input; echo "Hello World" > test

    hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar wordcount input output

    若正常执行则显示:

    在/opt/hadoop-2.6.0/output下会生成part-r-00000文件,包括下面内容:

    Hello   1
    world 1

3. idea开发环境配置

  1. 创建一个mapreduce项目

  2. 选择项目。按下F12。加入外部依赖

  3. 加入HADOOP_HOME下必要的jar包

  4. 进入执行配置

  5. 配置执行參数

    Working directory设置为hadoop安装文件夹

    并设置输入參数

  6. 调试

    和普通java程序一样打断点进行调试

最新文章

  1. 用DllImport引用的外部DLL文件如何通过clickonce发布
  2. 「JavaScript」四种跨域方式详解
  3. Google中rel="canonical"的相关解释和用法
  4. HDU(搜索专题) 1000 N皇后问题(深度优先搜索DFS)解题报告
  5. centos7 搭建elk
  6. MySQL密码破解。
  7. C# 得到EXCEL表格中的有效行数和列数 中 CurrentRegion 的有效范围
  8. 练习题:试使用C#编程实现银行、ATM等功能
  9. python bif
  10. 爬虫时http错误提示
  11. solus 系统 - 更新软件源
  12. DataGridView控件用法一:数据绑定
  13. maven-assembly-plugin
  14. 高可用Kubernetes集群-14. 部署Kubernetes集群性能监控平台
  15. 移动端上下滑动事件之--坑爹的touch.js
  16. google Chrome打开多个网站时等待可用的套接字,怎么加大连接数量提升速度
  17. symbol lookup error
  18. Hive的JDBC访问
  19. 反向代理总结-reverse-proxy-with-url-rewrite
  20. Modeling of Indoor Positioning Systems Based on Location Fingerprinting

热门文章

  1. hdu_5154 拓扑
  2. python判断一个单词是否为有效的英文单词?——三种方法
  3. [NOI2013模拟] BZOJ4705 棋盘游戏 解题报告(组合计数)
  4. 1570. [POJ3461]乌力波
  5. Android 自定义viewpager 三张图片在同一屏幕轮播的效果
  6. 机器学习(七) PCA与梯度上升法 (上)
  7. UVa 202 Repeating Decimals【模拟】
  8. js字符串排序方法
  9. 由防止表单重复提交引发的一系列问题--servletRequest的复制、body值的获取
  10. 【Educational Codeforces Round 37 C】 Swap Adjacent Elements