MapReduce与Hadoop之比较
Hadoop是Apache软件基金会发起的一个项目,在大数据分析以及非结构化数据蔓延的背景下,Hadoop受到了前所未有的关注。
Hadoop是一种分布式数据和计算的框架。它很擅长存储大量的半结构化的数据集。数据可以随机存放,所以一个磁盘的失败并不会带来数据丢失。Hadoop也非常擅长分布式计算——快速地跨多台机器处理大型数据集合。
MapReduce是处理大量半结构化数据集合的编程模型。编程模型是一种处理并结构化特定问题的方式。例如,在一个关系数据库中,使用一种集合语言执行查询,如SQL。告诉语言想要的结果,并将它提交给系统来计算出如何产生计算。还可以用更传统的语言(C++,Java),一步步地来解决问题。这是两种不同的编程模型,MapReduce就是另外一种。
MapReduce和Hadoop是相互独立的,实际上又能相互配合工作得很好。

最新文章

  1. VS 团队资源管理 强制解锁锁定文件
  2. SLP测试记录
  3. java贪吃蛇
  4. jq获取屏幕高度和宽度(盒子模型)
  5. Android JIT实时编译器的设置
  6. Linux/CentOS 同步网络时间
  7. thinkphp验证码使用
  8. 那些年我们没能bypass的xss filter
  9. struts 2.0部署
  10. App Naver Line 5.3 add new features - "True Delete"
  11. blocked because of many connection errors; unblock with 'mysqladmin flush-hosts;MySQL在远程访问时非常慢的解决方法;MySql链接慢的解决方法
  12. linux du 与 df 命令
  13. java递归删除指定目录下的文件和文件夹
  14. 【剑指offer】面试题24:二叉搜索树的兴许前序遍历序列
  15. Spring中对资源的读取支持
  16. netty详解之io模型
  17. Ubuntu 搭建 GlusterFS 过程笔记
  18. android api 镜像站
  19. 将GitLab数据库从阿里云PostgreSQL RDS迁移至自建的PostgreSQL服务器
  20. (转贴)fusionCharts属性参考API

热门文章

  1. vue - 子路由-路由嵌套
  2. Eclipse自动编译NDK/JNI的三种方法
  3. NGUI Tutorial 4 ScrollView
  4. ibatis 调用存储过程
  5. 【CentOS6.5】安装之DNS配置错误,yum install 软件报错:ERROR 6或者56错误提示”could not retrieve mirrorlist http://mirrorlist.centos.org ***”
  6. SDL视频显示进阶
  7. Redis全方位讲解--哨兵模式(Sentinel模式)(转载)
  8. Content Editor Webpart(一)引用JQuery
  9. 百度MIP(百度版的google AMP)了解一下?
  10. PHP is_callable 方法