Apache Duid学习笔记2

1.历史节点的查询效率与内存数据比成正比,内存越大则读取磁盘的次数越少,

历史节点内存越大总数据量越小则查询速度越快。

2.缓存机制可以选择外部和内部缓存,外部缓存如:memcached,内部缓存可以选择查询节点(broker)或历史节点(historical),

如果选择查询节点作为缓存则查询时首先访问查询节点的cache,只有当不命中时才会访问历史节点与实时节点

3.一般druid集群只需要一个查询节点即可,如果需要高可用可以多加一个查询节点。

4.副本解决当某个历史节点故障时其上的数据短暂不可用的问题。

协调节点会将故障节点上的数据重新分配给其他节点,但是存在延时。多个协调节点做负载均衡可以保证协调节点的高可用。

5.indexing-service使用主从架构,其中统治节点(overload)为主节点,中间管理者(Middle-manager)为从节点。

6.关于自动删除数据: If you just want to retain recent data, you can use this rule to drop the old data

that before a specified period and add a loadForever rule to follow it. Notes, dropBeforeByPeriod + loadForever

is equivalent to loadByPeriod(includeFuture = true) + dropForever.

7.druid支持http请求压缩和响应压缩 Content-Encoding:gzip and Accept-Encoding:gzip,对于结果集返回较大的情况可以使用

http响应压缩,从而节省带宽提升查询速度。

8.关于段大小: it's generally recommended for each segment to have around 5 million rows。

Segment byte size: it's recommended to set 300 ~ 700MB,如果行数和大小这两个值不匹配则修改行数。

查看段行数和大小的语句:

SELECT
"start",
"end",
version,
COUNT(*) AS num_segments,
AVG("num_rows") AS avg_num_rows,
SUM("num_rows") AS total_num_rows,
AVG("size") AS avg_size,
SUM("size") AS total_size
FROM
sys.segments A
WHERE
datasource = 'your_dataSource' AND
is_published = 1
GROUP BY 1, 2, 3
ORDER BY 1, 2, 3 DESC;

9.关于Null:配置druid.generic.useDefaultValueForNull When set to true, null values will be stored as ''
for string columns and 0 for numeric columns. Set to false to store and query data in SQL compatible mode
配置默认值为true,使用中需要将此值设置为false。
10.druid内部组件使用http互相通信,其中配置druid.global.http.numMaxThreads为Maximum number of I/O worker threads,
默认值为max(10, ((number of cores * 17) / 16 + 2) + 30),如果k8s指定分配资源则需要手动计算此值并设置。

最新文章

  1. 浅谈Hybrid技术的设计与实现第三弹——落地篇
  2. ACM:SCU 4437 Carries - 水题
  3. 【BZOJ】1002: [FJOI2007]轮状病毒(DP+规律+高精度)
  4. Python中的抽象超类
  5. [转]VPN服务器配置详解
  6. .net framework 注册到IIS上
  7. H2最完整的资料下载地址:
  8. DataTimePicker
  9. mysql新建数据库,并设置charset为utf8,使用utf8_general_ci字符集校验结果
  10. ansible工具
  11. ES6你不知道的let关键字及变量的提升
  12. CP-ABE ToolKit 安装笔记(转载)
  13. poj 2449 k短路+A*算法
  14. Computer - 在VM7虚拟机中使用主机打印机
  15. 网摘Android调用WebService
  16. ResNets和Inception的理解
  17. Spring MVC3.2 通过Servlet3.0实现文件上传
  18. bootstrap table demo
  19. leetcode Ch1-Search
  20. gdb -Mysql源代码级调试方法

热门文章

  1. python基础23 之初识面向对象
  2. [C++]全面理解C++中的引用
  3. 读Java8函数式编程笔记06_Lambda表达式编写并发程序
  4. Java微服务随机掉线排查思路
  5. Java CompletableFuture 异步超时实现探索
  6. springboot自定义验证-传值范围
  7. Nginx实现跨域
  8. GitLab CI-CD 学习笔记
  9. Spring 01 统一资源加载策略 Resource和ResourceLoader
  10. spring cloud alibaba - Nacos 作为注册中心基础使用-服务提供者和消费者