共性:

    1、都是spark平台下的分布式弹性数据集

    2、都有惰性机制,创建、转换如map操作时不会立即执行,遇到foreach等Action算子时才开始运算。

    3、都会自动缓存计算

    4、都有partition概念

  区别:

    1、RDD不支持sparkSQL操作

    2、DF每一行类型固定为Row,只有通过解析才能获取值。如 line.getAs[String]("col1")

    3、DF和DS支持sparkSQL

    4、DF和DS支持方便地保存文件格式,可以直接指定。

    5、DF每一行类型不固定,所以在Scala中用case class作模式匹配来校正

    6、DS效率最高

最新文章

  1. Python2.7如何安装numhttp://www.cnblogs.com/yuanzm/p/4089856.htmlpy
  2. HTML适应手机浏览器宽度
  3. 分布式架构高可用架构篇_07_MySQL主从复制的配置(CentOS-6.7+MySQL-5.6)
  4. ThinkPHP 模型(Model)命名规范
  5. 如何在linux系统下面编译C++(写给小白)(-1)
  6. [流媒体]live555简介(转)
  7. hdu 1885 Key Task (三维bfs)
  8. poj 2079 Triangle(旋转卡壳)
  9. jupyter巨好玩-常用设置
  10. poj1077 Eight【爆搜+Hash(脸题-_-b)】
  11. 如何在在网页上显示pdf文档
  12. HTML+CSS+JS简介
  13. java连接sqlserver2008
  14. LeetCode 929.Unique Email Addresses
  15. ABAP开发规范
  16. [Android 泥水匠] Android基础 之一:浅谈Android架构到HelloWorld案例的剖析
  17. 一些公司的面试题目 U3D
  18. 安装MySQL start Service(无法启动服务)
  19. [Windows] 解决 COM Surrogate 错误提示
  20. 树莓3B+_teamviewer_install

热门文章

  1. 【java从入门到精通】day-06-基本运算符-自增自减运算符
  2. python之《set》
  3. python之路《模块》
  4. 阿里巴巴已offer:Java实习五面详细面经(附解答)
  5. 动态导航栏和JavaScript箭头函数
  6. Elasticsearch 国内镜像下载站
  7. php7的Opcache getshell
  8. 面试阿里,字节跳动,华为必须知道的Java创建对象的5种方式
  9. DNS系列—DNS简介
  10. P2943 [USACO09MAR]Cleaning Up G