[论文笔记] Methodologies for Data Quality Assessment and Improvement (ACM Comput.Surv, 2009) (2)
本篇博文主要对DMQ(S3.7)的分类进行了研读。
1. 这个章节提出了一种DQM的分类法(如下图)
由上图可见,该分类法的分类标准是对assessment & improvement阶段的支持,以及是否解决technique(quality dimensions) & economic方面的问题。
2. 从历史发展的角度来看,数据质量维度的关注点与ICT(Information & Communication Technology)的发展是相关的。
(1) 五六十年代时,monolithic系统(通常只包含单个数据库和单个主机),DQ主要关注accuracy, consistency, completeness, time-related dimensions. 数据质量管理面临的最主要问题是:error localization, correction in data sources, record linkage between new data sources and pre-existing data bases.
(2) network-based阶段. DMQ开始关注新的质量维度:compeleteness of the data source, currency of data, consistency of new data sources compared to the enterprise database.
(3) 随着Web的出现,DMQ需要解决新的质量维度:accessibility, reputation
3. audit methodologies比complete、operational methodologies在assessmetn阶段都要更准确。
4. 四种分类的简介
- audit methodologies: 主要是关于assessment阶段
- operational methodologeis: 关注点在于评估阶段识别issues以便在改进阶段取得好的效果。主要贡献:(1) 一组相关维度的识别,以便改进; (2) 描述了一些改进这些维度的易懂的方法
- completeness methodologies: 适用于大型DQ项目
- economic methodologies: 作为其他DQM的补充
最新文章
- JavaScript权威设计--JavaScript函数(简要学习笔记十)
- css3元素简单的闪烁效果(html5 jquery)
- Java 获取当前系统时间方法比较
- ios之无限图片轮播器的实现
- RHEL7.2下netcat工具安装教程
- text-decoration属性
- 使用sqlplus批量执行脚本的总结
- ASPxGridView后台获取edit、delete、选择框等按钮。
- 对于用div+css随心所欲布局的思考
- Nuget常用命令操作
- light oj 1152 Hiding Gold
- [Swift]LeetCode529. 扫雷游戏 | Minesweeper
- mysql下载源码方法
- MyBatis 源码分析 - 映射文件解析过程
- Ubuntu 16 桌面版使用笔记
- 上海第八中学 shader
- java代码中存在的Big Endian 和 Little Endian
- Ubuntu系统无法识别Logitech M590蓝牙鼠标的问题
- Error while uploading slice_4.apk : WARNING: linker: libhoudini.so has text relocations. This is wasting memory and prevents security hardening. Please fix.
- 设计模式之适配器模式(Adapter Pattern)C++实现
热门文章
- 【Leetcode】【Medium】Pow(x, n)
- VR介绍
- libevent (三) 事件注册与循环监听
- 一句话在网页右上角加一个精致下拉框:forkme on github
- thrift之TTransport层的缓存传输类TBufferedTransport和缓冲基类TBufferBase
- 由于外键的存在引发的一个mysql问题 Cannot change column 'id': used in a foreign key constraint
- Java程序员的日常——经验贴(纯干货)二
- docker学习笔记一:基本安装和设置容器静态ip
- atitit.提升稳定性---hibernate 增加重试retry 机制解决数据库连接关闭
- javascript设计模式与开发实践阅读笔记(7)——迭代器模式