一、技术架构

1、整体介绍及架构

(1)概述

Odeon大数据平台以全图形化Web操作的形式为用户提供一站式的大数据能力:包括数据采集、任务编排、调度及处理、数据展现(BI)等;同时提供完善的权限管理、日志追踪、集群监控等能力

自己描述:一个PAAS平台即服务,全图形web操作构建数据闭环,实现多源数据导入、导出及分析、多源SQL数据查询、元数据和日志管理、工作流调度、快速部署

简述:数据采集(结构数据和日志数据sqoop)、数据开发(oozie工作流调度&仪表盘监控、HBASE使用Phoenix查询)、数据分析(OLAP基于kylin查询,支持kafka、hdfs等多数据源,可以整合BI工具)、数据编程(HUE使用统一的8888端口管理)

(2)组成

Odeon大数据平台主要由以下几部分组成:

多源头数据通道:SQL、NoSql数据库及日志多源数据接入与导出

元数据和日志数据管理:元数据管理、数据质量标准管理体系,以及完整的数据隔离及授权机制

多源头数据分析:支持离线批处理、流式计算、OLAP、AdHoc等多种计算方式

SQL数据查询服务:基于Greenplum和Kylin的数据服务架构,提供DaaS服务

工作流调度管理与状态监控:可视化工作流构建,基于Time、Event等触发机制,全程状态监控

可视化运维:物理集群、分析作业、工作流、资源使用情况等全方位可视化监控及告警

快速部署:DevOps模式,全组件镜像化,实现快速部署运维

(3)架构图

2、使用技术

(1)大数据:Hadoop、Spark、HBASE、Hive

(2)中间件:Kylin、k8s、Druid、Oozie、Impala

二、实现功能

1、功能分类

(1)数据查询:可以对Hive、Spark、Impala进行数据查询,实现编写SQL实现,并打印执行日志

(2)数据开发/仪表盘:可以查看各任务的执行状态

(3)日志数据通道:通过web实现增删改查topic等信息

(4)资源集市:配置业务表,实现资源集市,为用户分配项目、资源

(5)业务运维与告警:查看集群状况、任务数量,并能够添加告警

2、具体细节

0987

三、实际使用

1、kafka的QPS、TPS吞吐量及并发量

(1)吞吐量(Throughput)

系统在单位时间内处理请求的数量、上传下载流量

(2)QPS每秒查询率(Query Per Second)

对应fetches/sec,即每秒的响应请求数,也即是最大吞吐能力。

一天有10万pv(访问量),
公式 (100000 * 80%) / (86400*20%) = 4.62 QPS(峰值时间的每秒请求)

(3)并发量

并发用户数是指系统可以同时承载的正常使用系统功能的用户的数量。

(4)指标值

吞吐量:60-70M/s

qps查询率:10以内/s

并发量:峰值1-2w条数据/s

2、占用多大空间

每日新增数据100TB,共有400多台机器

四、完成工作

234

五、项目资料和截图

567

最新文章

  1. Linux下查看操作系统信息、内存情况及cpu信息:cpu个数、核心数、线程数
  2. UIImagePickerControllerDelegate---ActionSheet---获得设备型号
  3. windows 8.1 下蓝屏报错:SYSTEM_SERVICE_EXCEPTION(NETIO.SYS)的解决办法
  4. Drawing Arc Using ArcSegment in XAML
  5. c++嵌套类-内存分配
  6. C# 集合与泛型
  7. POJ 1273 Drainage Ditches -dinic
  8. C#中反射的使用(How to use reflect in CSharp)(1)
  9. Android 实现ListView的A-Z字母排序和过滤搜索功能,实现汉字转成拼音
  10. S3C6410嵌入式应用平台构建(六)——linux-3.14.4移植到OK6410-(Yaffs2文件制作)
  11. WinSock 异步I/O模型-3
  12. XML之DOM解析模型
  13. MTK刷机快捷键
  14. 群晖搭建webssh
  15. latex学习(三)
  16. Android入门学习总结
  17. Python中的高级turtle(海龟)作图
  18. Table of Contents - Python 2.x
  19. 20165320 实验一 java环境的熟悉
  20. Codeforces Round #293 (Div. 2) C. Anya and Smartphone 数学题

热门文章

  1. ImGUI 1.87 绘制D3D外部菜单
  2. sql中更换函数REPLACE
  3. 深入理解AQS--jdk层面管程实现【管程详解的补充】
  4. Ubuntu转到root用户后用户名路径没有颜色
  5. Spring使用注解开发及使用java类进行配置bean
  6. JavaScript基本语法(函数与对象)
  7. 3.RabbitMQ系列之消费者
  8. doecker---制作DockerFile并上传Hub
  9. 频道插件如何对接圈子 齐博x1齐博x2齐博x3齐博x4齐博x5齐博x6齐博x7齐博x8齐博x9齐博x10
  10. 上传数据、下载模板文件解决方案(前端:antd;后端:.Net Core WebAPI)