生成TPC-H数据集
2024-08-27 16:03:33
下载tpc-h tool 版本有点老,2.14.3,够用了。
在解压的文件夹下面cd到dbgen下,找到makefile.suite。
~/tpch_2_14_3$ cd dbgen
~/tpch_2_14_3/dbgen$ vim makefile.suite -----------------------------
CC = gcc
# Current values for DATABASE are: INFORMIX, DB2, TDAT (Teradata)
# SQLSERVER, SYBASE, ORACLE, VECTORWISE
# Current values for MACHINE are: ATT, DOS, HP, IBM, ICL, MVS,
# SGI, SUN, U2200, VMS, LINUX, WIN32
# Current values for WORKLOAD are: TPCH
DATABASE = MYSQL
MACHINE = LINUX
WORKLOAD = TPCH
---------------------------------
- 设定C语言编译器为gcc(如果你用的是其他的编译器就改成其他对应名字)
- DATABASE设为MYSQL(注意注释里写的提供的数据库格式没有mysql,所以等一下要自己写一个格式,见步骤3)
- MACHINE = LINUX 和 WORKLOAD = TPCH 就不用说啥意思了……
改好之后保存为makefile,这样才好用make命令。
修改tpcd.h
#ifdef MYSQL
#define GEN_QUERY_PLAN ""
#define START_TRAN "START TRANSACTION"
#define END_TRAN "COMMIT"
#define SET_OUTPUT ""
#define SET_ROWCOUNT "limit %d;\n"
#define SET_DBASE "use %s;\n"
#endif 开始构建
~/tpch_2_14_3/dbgen$ make
生成tbl数据文件
接下来要用dbgen生成数据,一共会生成8个表(.tbl)。
查看README里面有命令行参数解说,这里我们在dbgen目录下用
./dbgen -s 1
-s 1 表示生成1G的数据 (如果你之前曾经尝试过生成数据,最好先make clean,再重新make,接着到这步加上-f覆盖掉)
生成之后可以用head命令检查一下tbl们,会看到每一行都有一些用“|”隔开的字段。
压缩包里自带两个脚本:
- dss.ddl:用来建表
- dss.ri:关联表中primary key和foreign key。
最新文章
- Java Generics and Collections-2.4-2.5
- Python为什么要self
- [WP8] 使用ApplicationMenu与使用者互动
- Oracle 修改一行数据内存主要变化
- eclipse安装CDT插件遇到的问题
- setImageResource与setImageBitmap的区别
- Active MQ C#实现
- Delphi的VMT的结构图,很清楚
- C# Expression表达式笔记
- ubuntu12.04下编译chrome
- Rookey.Frame v1.0极速开发平台稳定版发布
- JavaWeb系列:Servlet
- linux新手入门前知道的一些概念
- .7-Vue源码之AST(3)
- myBatis数据库常用标签
- stringify 字符串转化成json方法
- 这么用Mac才叫爽!
- ionic获取表单input的值的两种方法
- <;pre>;标签的基本样式设置
- mycat配置文件备份
热门文章
- VS2015编译CURL7.54.0源码
- mac 获取idea&;&;datagrip激活码
- MyEclipse 2016 CI修改web项目context-root
- HTTP/2笔记之消息交换
- MyBatis官方文档——入门
- replace方法的深入理解
- 【BZOJ4922】[Lydsy六月月赛]Karp-de-Chant Number 贪心+动态规划
- App Transport Security has blocked a cleartext HTTP (http://) resource load since it is insecure.
- 微信小程序 --- 动画
- onethink重新安装后,还原数据库后,登陆不了解决办法!