Spark简介:

    Spark是一个快速且通用的集群计算平台,可以处理大数据量时候,比如几T到几P量级时候只需要几秒钟到几分钟,相对于hadoop几分钟到几小时速度是很快的,通用是指Spark的使用场景非常多。

官网地址:http://spark.apache.org/

Spark特点:

  1.Spark是快速的:

    1).Spark扩充了MapReduce计算模型

    2).  Spark是基于内存的计算,

  2.Spark是通用的:

    Spark的设计容纳了其他分布式系统拥有的功能,包括批处理(hadoop),迭代式计算(机器学习),交互查询(hive)和流处理(storm)等。

    优点:

      降低了维护成本。

  3.Spark是高度开放的

    Spark提供了Python,java,Scala,sql的API和丰富的内置库。

  相比与MapReduce编程模型,Spark提供了更加灵活的DAG(Directed Acyclic Graph) 编程模型, 不仅包含传统的map、reduce接口, 还增加了filter、flatMap、union等操作接口,使得编写Spark程序更加灵活方便。

最新文章

  1. 使用Expression实现数据的任意字段过滤(2)
  2. PyVISA介绍
  3. 【原创】JEECMS v6~v7任意文件上传漏洞(2)
  4. EF中的实体类型【Types of Entity in Entity】(EF基础系列篇8)
  5. css实现并列效果
  6. JavaScript基础插曲---apply,call和URL编码等方法
  7. chrome shortcutkey
  8. Linux命令-tr
  9. 021QTP之焦点(多思考)
  10. Linux下对字符串进行MD5加密
  11. Linux下查看CPU、内存和硬盘信息命令
  12. Java四种引用类型
  13. 验证demo
  14. LoadRunner之IP欺骗
  15. 数组式访问-ArrayAccess
  16. 代理ARP--善意的欺骗
  17. 通过mysql写入php一句话木马
  18. 响应式布局与bootstrap框架
  19. Python Django 之 静态文件存放设置
  20. Speeding Up The Traveling Salesman Using Dynamic Programming

热门文章

  1. threading 多线程
  2. Day3-H-Alice and Bob HDU4268
  3. python类的对象使用
  4. HTML设置表格
  5. redis的基本操作
  6. 吴裕雄 Bootstrap 前端框架开发——Bootstrap 辅助类:"text-primary" 类的文本样式
  7. Ternsorflow 学习:006-MNIST进阶 深入MNIST
  8. 关于netty配置的理解serverBootstrap.option和serverBootstrap.childOption
  9. 安装mysql server5.5 到start service未响应解决方法
  10. DataFoundation比赛总结