使用grabit分析mysql数据库中的数据血缘关系

Grabit 是一个辅助工具,用于从数据库、GitHub 等修订系统、bitbucket 和文件系统等各种来源收集 SQL 脚本和存储过程,然后将其推送到 SQLFlow 服务器进行分析并生成元数据和数据沿袭。

Grabit 官方获取地址:https://www.gudusoft.com/grabit/

1、Grabit 的主要用途

连接到数据库

从Oracle、SQL Server等数据库中提取创建表、创建视图和存储过程等SQL查询,并发送到SQLFlow进行分析。

连接到SQLFlow系统

从 Github、Bitbucket 等修订系统中获取 SQL 文件并发送到 SQLFlow 以获取数据沿袭。

搜索文件系统

在本地文件系统中找到 SQL 文件并推送它 SQLFlow 以可视化数据沿袭。

本文介绍如何使用grabit分析mysql数据库中的数据血缘关系。

2、如何配置grabit环境

运行grabit的环境需要配置Java 8及以上版本,并需要在系统变量中配置如下信息,部署时请主要java的更换安装路径:

export JAVA_HOME=/usr/lib/jvm/default-java

export PATH=$JAVA_HOME/bin:$PATH

运行grabit

以windows环境下为例,需要执行grbit安装目录下执行start.bat

3、如何连接到数据库

在grabit启动页面有Database、Github、Bitbucket、Single File等多种数据源提供方式,本文重点介绍使用database方式进行获取数据源,想了解其他方式,请参考https://github.com/sqlparser/sqlflow_public/tree/master/grabit

选择mysql数据库类型,然后点击next

点击next后来到数据库配置信息页面,其中前四项为必填项,后面的为选填项。关于选填项中各项具体信息请参阅https://github.com/sqlparser/sqlflow_public/tree/master/grabit获取更详细的介绍。

配置完上述信息后,点击【upload】即可上传至sqlflow服务器并生成相应的job,如下图

如您使用的是sqlflow的云版本,需要注册一个高级会员。

可以点击【save config】保存当前的配置文件,随后点击close关闭grabit。

4、使用sqlflow获取数据血缘关系分析结果

到sqlflow服务器上查看,您可以看到相应的job已经建立并能轻松获取自动分析的数据血缘关系,如下图:

至此,使用grabit分析mysql数据库中的血缘关系介绍完毕。

参考

马哈鱼数据血缘分析器: https://sqlflow.gudusoft.com

马哈鱼数据血缘分析器中文网站: https://www.sqlflow.cn

最新文章

  1. mysqli扩展库的预处理技术 mysqli stmt
  2. HTTP下载文件名称编码说明
  3. 将InfoObject作为信息提供者Characteristic is InfoProvider
  4. 爬虫技术 -- 基础学习(五)解决页面编码识别(附c#代码)
  5. 转:OK6410内存及启动流程
  6. 图书简介:Spring Batch批处理框架
  7. Table of Contents - ActiveMQ
  8. 何使用CSS写出一个下拉菜单。
  9. linux arp攻击解决方法 测试很有效
  10. JSP error: Only a type can be imported
  11. Keepalived+Nginx提供前端负载均衡+主从双机热备+自动切换
  12. TCP 建立连接:三次握手
  13. springMvc项目的搭建,暂时没有整合持久层框架(java Config配置对比xml配置)
  14. Android简易实战教程--第八话《短信备份~一》
  15. Mysql 时间差(年、月、天、时、分、秒)
  16. for 循环 和 Array 数组对象
  17. Spring Boot入门(2)使用MySQL数据库
  18. [python][spark]wholeTextFiles 读入多个文件的例子
  19. 关于SS的一点笔记
  20. java public,default,protected,private区别

热门文章

  1. springboot使用策略模式实现一个基本的促销
  2. 攻防世界php_rce
  3. 前端性能优化(Application Cache篇)
  4. 使用css完成引导用户按照流程完成任务的进度导航条
  5. Linux 0.11源码阅读笔记-内存管理
  6. idea 启动微服务 设置 run dashboard
  7. nginx负载均衡的五种方式
  8. 01 | 堆、栈、RAII:C++里该如何管理资源?(极客时间笔记)
  9. java数组算法——数组元素的赋值2
  10. springboot项目找不到符号问题以及模块聚合项目maven插件使用的相关问题