一、 安装环境

Vertica官方提供了消费kafka的方法,需要注意版本对应



消费kafka原理,是Vertica提供的Udx

首先需要安装相应的环境

/${vertica}/packages/kafka/ddl/install.sql

判断是否安装成功

/${vertica}/packages/kafka/ddl/isinstalled.sql

二、 单次消费kafka

参考官方文档 Using COPY with Kafka

COPY schema.target_table SOURCE KafkaSource (stream='topic1|1|1,topic2|2|2', brokers='host1:9092,
host2:9092',duration= INTERVAL'timeslice',stop_on_eof=TRUE,
eof_timeout= INTERVAL'timeslice')
PARSER KafkaJSONParser(flatten_arrays=False, flatten_maps=False)
REJECTED DATA AS TABLE schema.rejection_table TRICKLE;

三、 实时消费kafka

参考官方文档Using Kafka with Vertica

  1. 首先创建一个Scheduler
/opt/vertica/packages/kafka/bin/vkconfig scheduler --add --config-schema myScheduler --operator user1

使用conf封装Vertica数据库登录信息

kafka_config=”—cinfig-schema kafka01 –dbhoust 172.17.12.1 –username dbadmin –password pass1”
  1. 创建Scheduler脚本
/opt/vertica/packages/kafka/bin/vkconfig scheduler –add ${ kafka_config } –config-schema kafka_config  --operator dbadmin
  1. 创建kafka集群信息
BROKERS=”172.17.12.2:9099, 172.17.12.3:9099, 172.17.12.4:9099”
/opt/vertica/packages/kafka/bin/vkconfig kafka-cluster –add ${ kafka_config } --onfig-schema kafka_config --cluster KafkaCluster –brokers $ BROKERS
  1. 读取topic
/opt/vertica/packages/kafka/bin/vkconfig topic –add ${ kafka_config } –target public.kafka_tgt –rejection-table public.kafka_rej –cluster KafkaCluster –topic web_pagelogs –number-partitions 1
  1. 发布Scheduler
/opt/vertica/packages/kafka/bin/vkconfig launch ${ kafka_config } -- onfig-schema kafka_config –instance-name webpagelogs
  1. 删除scheduler
/opt/vertica/packages/kafka/bin/vkconfig scheduler ${kafka_config} –remove –config-schema kafka_config
  1. 删除topic接收
/opt/vertica/packages/kafka/bin/vkconfig topic ${kafka_config} –remove –target public.kafka_tgt

PS:

通过最新对Vertica消费kafka的使用,发现这个功能比较鸡肋。多个topic也只能放到一个scheduler里面执行消费,而且每次修改增加都需要停下所有topic的消费进程。另外在使用过程中也发现了丢失数据的现象。

最新文章

  1. JSP实现在项目在网页上查询
  2. FFT
  3. Django提交POST表单“CSRF verification failed. Request aborted”问题的解决
  4. MVC中使用Ajax提交数据 Jquery Ajax方法传值到action
  5. /var文件系统
  6. Jetty与Tomcat的区别 转
  7. Group Shifted Strings
  8. C#中DataTable使用技巧
  9. ASP.NET一些常用的东西
  10. (原)java中opencv的width的问题
  11. Oracle存储过程的一点使用总结
  12. (7)STM32使用HAL库实现RS485通讯(全双工串口)
  13. SAP HUM 事务代码HUMO为整托做Scrap
  14. Java虚拟机监控命令
  15. STM32学习笔记:【002】BIN文件通过ST-LINK烧录STM32芯片
  16. vim 配置一:
  17. new 几种用法
  18. python中的数字取整(ceil,floor,round)概念和用法
  19. 转:C#线程系列讲座(1) BeginInvoke和EndInvoke方法
  20. Hadoop学习之路(十五)MapReduce的多Job串联和全局计数器

热门文章

  1. a++与++a的陷阱与盲区
  2. 【Python challenge】通关代码及攻略(0-11)
  3. opt目录
  4. 5W随想
  5. 在Java中使用Collections.sort 依据多个字段排序
  6. XiaoQi.Study项目(一)
  7. Lambda表达式学习笔记
  8. JS排序算法--冒泡排序和选择排序
  9. GO语言web框架Gin之完全指南(二)
  10. Spring Boot入门系列(八)整合定时任务Task,一秒搞定定时任务