一、键值对RDD的创建

1、从文件中加载

/opt目录下创建wordky.txt文件。

wordky.txt文件中输入以下三行字符:

Hadoop is good

Spark is fast

Spark is better

使用map()函数转换得到相应的键值对RDD并输出:

2、从列表中创建键值对RDD

二、常用的键值对转换操作

1、使用reduceByKey(func)统计每个单词的出现次数

2、使用groupByKey()对具有相同键的值进行分组

3、使用keys返回所有的key

4、使用values返回所有的value值

5、使用sortByKey()返回一个根据key排序的RDD

6、使用mapValues(func)

7、综合

8、数据读写

最新文章

  1. python基础——单元测试
  2. iOS 设置button文字过长而显示省略号的解决办法
  3. 【Leetcode】【Medium】Pow(x, n)
  4. 【Ext.Net学习笔记】04:Ext.Net中使用数据、Ext.Net Store的用法、Ext.Net ComboBox用法
  5. hdu 1023 卡特兰数+高精度
  6. php大力力 [007节]php静态表量
  7. iOS9.3 Could not find Developer Disk Image 真机调试错误解决办法
  8. MySQL Full Join的实现
  9. Web Builder
  10. GIT-windows系统下Gitblit的使用方式
  11. HDU 3567 Eight II(八数码 II)
  12. Python笔记 【无序】 【二】
  13. boost.lexical_cast 学习
  14. istream不是std的成员
  15. sql server 2016 附加 其它目录的数据库
  16. JSPatch解析
  17. JS-事件心得
  18. 机器学习----人脸对齐的算法-ASM.AAM..CLM.SDM
  19. 修改shell命令的history记录个数
  20. 使用Yii2中dropdownlist实现地区三级联动的例子

热门文章

  1. 需要分析竞争对手的网站哪些SEO数据
  2. CobaltStrike与Metasploit联动配合
  3. Google Kick Start 2020 Round B T1-3
  4. php中的加密解密模块-mcrypt
  5. SpringBoot简单(登录/显示/登出)工程下载 使用Thymeleaf输出页面文字
  6. console.info(sum(1, 2, 3, 4)(5)(6));
  7. Ubuntu下开启/关闭防火墙及端口
  8. 容器服务 TKE 上服务暴露的几种方式
  9. 使用wireshark分析MQTT协议
  10. HTML -- 表单元素1