最近接到个任务是抽取mysql和Oracle的元数据,大致就是在库里把库、schema、表、字段、分区、索引、主键等信息抽取出来,然后导成excel。

因为刚开始接触元数据,对这个并不了解,就想借助一下万能的百度,结果百度了一圈全是告诉我sql,直接cv就行了。虽然得到了部分数据,但是查的哪个库,哪个表我是完全不清楚的,得到的数据也不是我想要的,只有自己去官网看文档来完成自己的任务。

授人以鱼不如授人以渔,把经验写出来,给跟我一样疑惑的小伙伴一个参考。

什么是元数据

百度百科:元数据Metadata),又称中介数据中继数据,为描述数据的数据(data about data),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。元数据算是一种电子式目录,为了达到编制目录的目的,必须在描述并收藏数据的内容或特色,进而达成协助数据检索的目的。都柏林核心集(Dublin Core Metadata Initiative,DCMI)是元数据的一种应用,是1995年2月由国际图书馆电脑中心(OCLC)和美国国家超级计算应用中心(National Center for Supercomputing Applications,NCSA)所联合赞助的研讨会,在邀请52位来自图书馆员、电脑专家,共同制定规格,创建一套描述网络上电子文件之特征。

元数据是关于数据的组织、数据域及其关系的信息,简言之,元数据就是关于数据的数据。

参考文档地址

mysql:https://docs.oracle.com/cd/E17952_01/index.html

Oracle:https://docs.oracle.com/en/database/oracle/oracle-database/index.html

先说MySQL

mysql的元数据都在information_schema库中以视图的形式存在,只能看,不能修改。

进入文档后直接看information_schema的介绍,里面详细介绍了每一个表和字段。

常用的查询mysql元数据sql

-- 数据库
SELECT `schema_name` 库名,`DEFAULT_CHARACTER_SET_NAME` 默认字符集 FROM `SCHEMATA` -- 表
SELECT `TABLE_NAME` 表名,`TABLE_COMMENT` 描述,`TABLE_TYPE` 表类型 FROM`TABLES` -- 字段
SELECT `TABLE_SCHEMA` 库名,`TABLE_NAME` 表名,`COLUMN_NAME` 字段名,`COLUMN_COMMENT` 字段描述,`DATA_TYPE` 字段类型,`CHARACTER_MAXIMUM_LENGTH` 长度,`IS_NULLABLE` 是否为空
FROM `COLUMNS` -- 分区
SELECT `TABLE_SCHEMA` 库名,`TABLE_NAME` 表名,`PARTITION_NAME` 分区名,`PARTITION_ORDINAL_POSITION` 分区编号,`PARTITION_EXPRESSION` 分区函数表达式
FROM `PARTITIONS` WHERE partition_name IS NOT NULL -- 视图
SELECT * FROM `VIEWS` -- 索引
SELECT * FROM STATISTICS -- 主键
SELECT * FROM `COLUMNS` WHERE COLUMN_KEY = 'PRI'

再说Oracle

Oracle里的元数据在静态数据字典视图。

我们是不能直接访问数据字典表的,但可以通过数据字典视图访问其中的信息。要列出可用的数据字典视图,查询视图DICTIONARY就可以。

在静态数据字典视图里有三大类开头的视图:ALL_DBA_USER_

  • ALL_视图显示所有的信息,当前用户,包括从其他架构中对象的当前用户的模式以及信息访问,如果当前用户拥有的权限或角色授权的方式访问这些对象。
  • DBA_视图显示整个数据库中的所有相关信息。DBA_视图仅供管理员使用。只有拥有SELECT ANY DICTIONARY权限的用户才能访问它们。此权限DBA在系统最初安装时分配给角色。
  • USER_视图显示从当前用户的模式中的所有的信息。查询这些视图不需要特殊权限。

ALL_DBA_以及USER_对应于单个数据字典表视图通常是几乎相同的。

官网:

然后就可以通过文档说明找到对应的视图。

常用的sql:

-- 模式
SELECT * FROM DBA_TABLESPACES; -- 表
select *
from user_tables ut LEFT JOIN user_tab_comments utc ON ut.TABLE_NAME = utc.TABLE_NAME; -- 字段
select t.TABLE_NAME 表名,t.COLUMN_NAME 描述,t.DATA_TYPE 类型,t.DATA_LENGTH 长度,t.NULLABLE 是否为空,t.DATA_DEFAULT 默认值,s.comments 描述
from user_tab_columns t LEFT JOIN user_col_comments s ON t.COLUMN_NAME = s.COLUMN_NAME WHERE t.TABLE_NAME ='ASSET_BASE_TABLE'; -- 分区
SELECT * FROM USER_PART_KEY_COLUMNS; -- 索引
SELECT * FROM USER_INDEXES; -- 视图
SELECT * FROM USER_VIEWS; -- 主键
select cu.* from USER_CONS_COLUMNS cu, USER_CONSTRAINTS au
where cu.constraint_name = au.constraint_name and au.constraint_type = 'P';

以上就是我个人查找元数据的流程,如有不对的地方,欢迎在评论区指正。


最新文章

  1. spring缓存Ehcache(入门2)源码解读
  2. centos6.5 mysql开机启动
  3. WCF架构日记-1
  4. DTD Tutorial
  5. Android Activity横竖屏转换的生命周期
  6. JDK小技巧
  7. PHP里关于时间日期大小写(Y,y,M,m...)
  8. USB Mass Storage协议分析
  9. Deep Learning(深度学习)学习笔记整理系列之(四)
  10. 怎么样MyEclipse配置Tomcat?
  11. Angular2 关于*ngFor 嵌套循环
  12. 11. IDS (Intrusion detection systems 入侵检测系统 6个)
  13. swap扩展
  14. P4715 「英语」Z 语言
  15. HTML页面本地正常,部署到服务器稍微异常解决方案
  16. 《Spring_Four》第一次作业:团队亮相
  17. 完整的Django入门指南学习笔记2
  18. codevs 1131 统计单词数
  19. 大型运输行业实战_day04_3_高级查询+分页
  20. Java中的I/O 线程 网络

热门文章

  1. 力扣 - 剑指 Offer 42. 连续子数组的最大和
  2. Codeforces 1361C - Johnny and Megan's Necklace(欧拉回路)
  3. 洛谷 P7718 -「EZEC-10」Equalization(差分转化+状压 dp)
  4. 一类利用队列优化的DP
  5. Linux中shell去除空行的几种方法
  6. Excel-统一小括号格式(中文小括号,英文小括号)
  7. 一个好用的快速安装lnmp环境包lnmp1-6
  8. Ubuntu 和 windows1下文件夹共享的指令
  9. 关于蓝牙Mesh您必须知道的七件事
  10. acknowledge