hadoop 是实现了 mapreduce 的思想,将数据切片计算来处理大量的离线数据。

hadoop处理的数据必须是已经存放在 hdfs 上或者类似 hbase 的数据库中。所以
hadoop 实现的时候是通过移动计算到这些存放数据的机器上来提高效率而 storm
不同,storm 是一个流计算框架。处理的数据是实时消息队列中的,所以须要我们
写好一个 topology 逻辑放在那,接收进来的数据来处理,所以是通过移动数据平均
分配到机器资源来获得高效率。
   
      hadoop 的长处是处理数据量大(瓶颈是硬盘和 namenode,网络等),分析
灵活,可以通过实现 dsl,mdx 等拼接 hadoop 命令或者直接使用 hive。pig 等来
灵活分析数据。适应对大量维度进行组合分析缺点就是慢:每次运行前要分发 jar 
包,hadoop 每次 map 数据超出阙值后会将数据写入本地文件系统,然后在 reduce 
的时候再读进来。
   
   storm 的长处是全内存计算,由于内存寻址速度是硬盘的百万倍以上,所以 storm 
的速度相比較 hadoop 很快(瓶颈是内存。cpu)缺点就是不够灵活:必需要先写
好 topology结构来等数据进来分析。

最新文章

  1. js apply 和 call
  2. PHP 字符检测自定义函数
  3. [芯片] 4、接口技术·实验四·串行接口8251A
  4. valueForKeyPath的妙用(转)
  5. java_stack
  6. 使用UI Automation实现自动化测试 --工具使用
  7. 关于BitmapFactory解析流的问题a
  8. Java ClassLoader 原理详细分析
  9. hive 传递变量的两种方式
  10. mac下烦人的eclipse安装svn插件
  11. PHP-Wamp集成包安装教程
  12. 【Android】Activity的菜单机制和方法解析
  13. 命令提示符CMD远程连接Mysql学习笔记
  14. linux下安装python3.3.4
  15. Linux文件查看与查找命令
  16. 《精通c#(第6版)》【PDF】下载
  17. 启动MySql提示:The server quit without updating PID file(…)失败
  18. 20162311 实验三 敏捷开发与XP实践 实验报告
  19. jvisualvm 连接 jstatd 远程监控 jvm 或 Visual GC提示"不受此JVM支持“
  20. CRMEB提示:系统错误 lnterface SessionUpdateTimestampHandlerlnterface not found

热门文章

  1. vue工程化与路由router
  2. thinkphp5生成二维码
  3. 浏览器通知js授权
  4. 中南大学2019年ACM寒假集训前期训练题集(入门题)
  5. 22Spring基于配置文件的方式配置AOP
  6. LINUX:Contos7.0 / 7.2 LAMP+R 下载安装Mysql篇
  7. POJ 1995 (快速幂) 求(A1B1+A2B2+ ... +AHBH)mod M
  8. UVaLive 4868 Palindrometer (暴力 / 构造)
  9. 100ns周期200ns的正脉冲波形形状描述
  10. JavaScript编程那些事(牛客网 LeetCode)