使用singer 转换gitbase 数据到postgresql
2024-10-21 05:55:43
gitbase 是mysql server 的一个实现(主要是用来分析git仓库代码),但是里面好多功能可能并不是很强大(sql 的限制)
我们可以通过singer 的tap-mysql
将数据抽取到标准的pg 数据库,可以方便的使用pg 的好多函数
参考使用
mysql-postgresql 的可以参考 https://www.cnblogs.com/rongfengliang/p/10239118.html
具体的转换很简单,主要是说明几个gitbase 上的缺陷以及怎么解决
实际的代码可以参考https://github.com/rongfengliang/gitbase2postgresql
同步问题
- string length
默认singer 是通过获取数据库表的schema 进行类型长度确定的,但是singer对于gtibase string 显示的是是0.所以进行处理会有问题 - 解决方法
属于临时解决了,修改singer 关于string 类型处理
elif data_type in STRING_TYPES:
result.type = ['null', 'string']
# result.maxLength = c.character_maximum_length
- 安装新的tap-mysql
因为不是使用的官方pip 仓库安装,我们可以通过本地方法安装,可以通过clone 我的代码解决https://github.com/rongfengliang/tap-mysql
git clone https://github.com/rongfengliang/tap-mysql.git
pip install -e tap-mysql
说明
因为singer 推荐的方式是venv 安装,所以tap 以及target 最好是使用venv 解决,不然会有各种问题(singer 是基于pipe 的处理模型)
参考资料
https://github.com/rongfengliang/tap-mysql
https://github.com/rongfengliang/tap-mysql
https://github.com/rongfengliang/gitbase2postgresql
最新文章
- 4.Struts2转向类型详解
- Robotium ant 报错Unable to find instrumentation info for: ComponentInfo{project/android.test.InstrumentationTestRunner}
- python 代码片段25
- jQuery中append()与appendTo()方法区别
- Android 获取网络状态
- 转载------------------关于android的一些技巧
- Java -- Thread中start和run方法的区别
- Angularjs2——TypeScript学习网站
- vue echarts 遇到的bug之一 无法渲染的问题
- JVM菜鸟进阶高手之路七(tomcat调优以及tomcat7、8性能对比)
- on duplicate key update简单使用
- HBase RegionServer Splitting 流程
- mysql 压缩版配置
- 数据库的OLE字段写入长二进制文件
- KD-树(上)
- 深入flask中的request
- python自动化运维之路~DAY7
- js变量按照存储方式区分,有哪些类型,并表述其特点
- C# web服务器被webbench攻击及目现采用的防御措施
- Angular 4 路由介绍