8. SparkSQL综合作业
综合练习:学生课程分数
网盘下载sc.txt文件,分别创建RDD、DataFrame和临时表/视图;
分别用RDD操作、DataFrame操作和spark.sql执行SQL语句实现以下数据分析:
总共有多少学生?
总共开设了多少门课程?
每个学生选修了多少门课?
每门课程有多少个学生选?
- 每门课程>95分的学生人数
课程'Python'有多少个100分?
Tom选修了几门课?每门课多少分?
Tom的成绩按分数大小排序。
Tom选修了哪几门课?
Tom的平均分。
'OperatingSystem'不及格人数
'OperatingSystem'平均分
'OperatingSystem'90分以上人数
'OperatingSystem'前3名
每个分数按比例+20平时分。
求每门课的平均分
选修了7门课的有多少个学生?
每门课大于95分的学生数
- 每门课的选修人数、平均分、不及格人数、通过率
- 优秀、良好、通过和不合格各有多少人?
- 同时选修了DataStructure和 DataBase 的学生
- 选修了DataStructure 但没有选修 DataBase 的学生
- 选修课程数少于3门的同学
- 选修6门及以上课程数的同学
- 查询平均成绩大于等于60分的姓名和平均成绩
- 找出平均分最高的10位同学
RDD操作
1、总共有多少学生?
2、总共开设了多少门课程?
3、每个学生选修了多少门课?
4、每门课程有多少个学生选?
5、每门课程>95分的学生人数
6、课程'Python'有多少个100分?
7、Tom选修了几门课?每门课多少分?
8、Tom的成绩按分数大小排序。
9、Tom选修了哪几门课?
10、Tom的平均分。
11、'OperatingSystem'不及格人数
12、'OperatingSystem'平均分
13、'OperatingSystem'90分以上人数
14、'OperatingSystem'前3名
15、每个分数按比例+20平时分。
16、求每门课的平均分
17、选修了7门课的有多少个学生?
18、每门课大于95分的学生数
19、每门课的选修人数、平均分、不及格人数、通过率
20、优秀、良好、通过和不合格各有多少人?
21、同时选修了DataStructure和 DataBase 的学生
22、选修了DataStructure 但没有选修 DataBase 的学生
23、选修课程数少于3门的同学
24、选修6门及以上课程数的同学
25、查询平均成绩大于等于60分的姓名和平均成绩
26、找出平均分最高的10位同学
DataFrame操作
1、总共有多少学生?
2、总共开设了多少门课程?
3、每个学生选修了多少门课?
4、每门课程有多少个学生选?
5、每门课程>95分的学生人数
6、课程'Python'有多少个100分?
7、Tom选修了几门课?每门课多少分?
8、Tom的成绩按分数大小排序。
9、Tom选修了哪几门课?
10、Tom的平均分。
11、'OperatingSystem'不及格人数
12、'OperatingSystem'平均分
13、'OperatingSystem'90分以上人数
14、'OperatingSystem'前3名
15、每个分数按比例+20平时分。
16、求每门课的平均分
17、选修了7门课的有多少个学生?
18、每门课大于95分的学生数
19、每门课的选修人数、平均分、不及格人数、通过率
20、优秀、良好、通过和不合格各有多少人?
21、同时选修了DataStructure和 DataBase 的学生
22、选修了DataStructure 但没有选修 DataBase 的学生
23、选修课程数少于3门的同学
24、选修6门及以上课程数的同学
25、查询平均成绩大于等于60分的姓名和平均成绩
26、找出平均分最高的10位同学
spark.sql执行SQL语句操作
创造临时表
1、总共有多少学生?
2、总共开设了多少门课程?
3、每个学生选修了多少门课?
4、每门课程有多少个学生选?
5、每门课程>95分的学生人数
6、课程'Python'有多少个100分?
7、Tom选修了几门课?每门课多少分?
8、Tom的成绩按分数大小排序。
9、Tom选修了哪几门课?
10、Tom的平均分。
11、'OperatingSystem'不及格人数
12、'OperatingSystem'平均分
13、'OperatingSystem'90分以上人数
14、'OperatingSystem'前3名
15、每个分数按比例+20平时分。
16、求每门课的平均分
17、选修了7门课的有多少个学生?
18、每门课大于95分的学生数
19、每门课的选修人数、平均分、不及格人数、通过率
20、优秀、良好、通过和不合格各有多少人?
21、同时选修了DataStructure和 DataBase 的学生
22、选修了DataStructure 但没有选修 DataBase 的学生
23、选修课程数少于3门的同学
24、选修6门及以上课程数的同学
25、查询平均成绩大于等于60分的姓名和平均成绩
26、找出平均分最高的10位同学
最新文章
- 把strassen乘法调出来了...
- eclipse 合并分支
- 最小化安装centos7下配置网络
- codeforces 719B:Anatoly and Cockroaches
- UIScrollView,UIView转换UIImage代码(整个view截图, 不只是可视区域)
- [React Testing] Conditional className with Shallow Rendering
- Buffer深入分析
- mongodb菜鸟整理
- qt捕获全局windows消息
- Servlet和Filter的区别
- springmvc复习笔记----springmvc最简单的第一个例子:RequestMapping试水
- 一脸懵逼学习Struts数据校验以及数据回显,模型驱动,防止表单重复提交的应用。
- 2019.02.21 bzoj2739: 最远点(决策单调性+分治)
- Leaflet_扩展Leaflet:类(2017-10-26)
- ?js调用PHP里的变量,怎么弄?
- vim 如何与外界粘贴复制
- BZOJ1296: [SCOI2009]粉刷匠 DP
- Effective STL 学习笔记 Item 34: 了解哪些算法希望输入有序数据
- Python endswith() 方法
- java资料——线程(转)
热门文章
- android软件简约记账app开发day07-备注界面完善
- Java语言学习day26--7月01日
- 2021.11.09 P4824 [USACO15FEB]Censoring S与P3121 [USACO15FEB]Censoring G(KMP&;&;AC自动机)
- C#语法糖系列 —— 第二篇:聊聊 ref,in 修饰符底层玩法
- 携程开源分布式配置系统Apollo服务端是如何实时更新配置的?
- tensorflwo-gpu win10_64bit 的安装版本问题
- CVE-2021-35042
- hooks 与 animejs
- 用 Go 快速开发一个 RESTful API 服务
- 『忘了再学』Shell基础 — 14、环境变量(二)