160624、Spark读取数据库(Mysql)的四种方式讲解
2024-09-27 06:39:42
目前Spark支持四种方式从数据库中读取数据,这里以Mysql为例进行介绍。
一、不指定查询条件
这个方式链接MySql的函数原型是:
1 |
def jdbc(url : String, table : String, properties : Properties) : DataFrame |
我们只需要提供Driver的url,需要查询的表名,以及连接表相关属性properties。下面是具体例子:
1 |
|
2 |
3 |
val prop = new Properties() |
4 |
|
5 |
6 |
println(df.count()) |
7 |
|
我们运行上面的程序,可以看到df.rdd.partitions.size
输出结果是1,这个结果的含义是iteblog表的所有数据都是由RDD的一个分区处理的,所以说,如果你这个表很大,很可能会出现OOM
最新文章
- BZOJ 3489: A simple rmq problem
- JVM:查看java内存情况命令
- ETL利器Kettle
- MD5加密操作
- 包含文件函数include与require的区别
- 在64位windows下使用instsrv.exe和srvany.exe创建windows服务
- Windows下Nginx的启动、停止等命令(转)
- ASP.NET网络编程之-HTTP协议
- System.Web.HttpException: 无法向会话状态服务器发出会话状态请求
- Java Base64、AES、SHA1、MD5加密算法(转载)
- Nodejs的运行原理-架构篇
- 痞子衡嵌入式:常用的数据差错控制技术(1)- 重复校验(Repetition Code)
- Docker:镜像构建与进入容器总结
- 【python】并查集
- c扩展开发
- killl prefix out macro mis mal micro -m
- 【BZOJ 2986】 莫比乌斯函数+容斥原理
- JNDI数据源(在Tomcat下配置JNDI多数据源实例)
- Java 7 新增功能
- ghostscript 远程命令执行漏洞复现
热门文章
- macbook使用“终端”远程登录linux主机
- spring和hibernate整合,事务管理
- 深入Activity
- 环境搭建基础知识2(sublime text3中配置verilog语法高亮)
- UVA812-Trade on Verweggistan(暴力)
- CCNA2.0笔记_OSI模型
- Python操作Word批量生成文章
- c# 中的UserControl是什么 用户控件和自定义控件有什么区别
- javascript存储器属性与数据属性
- 通过某个进程号显示该进行打开的文件 lsof -p 1 11. 列出多个进程号对应的文件信息 lsof -p 123,456,789 5. 列出某个用户打开的文件信息 lsof -u username