使用中发现,vm-storage节点仅仅过了6天,就占用了800GB的硬盘空间。很不正常。下面是排查过程:

1.查看磁盘占用情况:

先登录容器,执行:

df -h

/dev/vdb               1012.8G    870.2G    142.7G  86% /var/victoria-metrics/data

2.查看节点上的time series总数:

  • 为了方便使用,我在vm-storage节点上部署了vm-select:

    curl -G "http://127.0.0.1:8481/select/0/prometheus/api/v1/series/count"
{"status":"success","isPartial":false,"data":[71273032]}

才7000万,并不算多。

2.研究究竟是哪些文件夹占用空间多

du /var/victoria-metrics/data/ -h -d 4

3.3G    /var/victoria-metrics/data/data/small/2022_01
285.5G /var/victoria-metrics/data/data/small/snapshots #太多的快照了
288.8G /var/victoria-metrics/data/data/small
110.9G /var/victoria-metrics/data/data/big/2022_01
323.9G /var/victoria-metrics/data/data/big/snapshots #太多的快照了
434.8G /var/victoria-metrics/data/data/big
723.6G /var/victoria-metrics/data/data

很奇怪,我备份的时候,是指定了deleteURL的。备份脚本如下:

./vmbackup-prod \
-configFilePath="/etc/cos/config.ini" \
-credsFilePath="/etc/cos/creds.ini" \
-customS3Endpoint="https://cos.ap-guangzhou.myqcloud.com" \
-dst="s3://bucket-125800000/tenant/Production/formal/vm-storage/0/2022-01-06" \
-origin="s3://bucket-125800000/tenant/Production/formal/vm-storage/0/2022-01-06" \
-storageDataPath="/data" \
-httpListenAddr="0.0.0.0:8420" \
-memory.allowedBytes=2GB \
-concurrency=5 \
-maxBytesPerSecond=20MB \
-snapshot.createURL="http://127.0.0.1:8482/snapshot/create" \
-snapshot.deleteURL="http://127.0.0.1:8482/snapshot/delete" &

那么有可能备份完成后,vmbackup并没有去删除快照。

3.手动删除所有快照

curl -G "http://127.0.0.1:8482/snapshot/delete_all"

再看磁盘空间:

/dev/vdb               1012.8G    148.3G    864.6G  15% /var/victoria-metrics/data

这下正常了。

于是提了一个issue给VictoriaMetrics.

目前看来,备份完成后立即执行delete_all才行。

最新文章

  1. hdu 3398
  2. mysql--乱码
  3. JMeter 学习笔记从不懂慢慢提升(01)
  4. iOS开发之UITextField
  5. openStack ceilometer API
  6. Oracle数据 行转列
  7. hdu 5584 LCM Walk(数学推导公式,规律)
  8. Cocos2d-X 动作展示《一》
  9. 信息设计工具IDT创建从SAP Business Object到SAP HANA的连接
  10. ASP.Net数据库如何存取图片
  11. javaWeb学习总结(1)- Tomcat服务器学习和使用(2)
  12. Linux SSH下安装Java并设置环境
  13. 剖析Prometheus的内部存储机制
  14. Vue深度学习(1)
  15. 浮点数乘积的取整intval,以及高精度函数bcmath的使用
  16. scrapy 爬虫返回json格式内容unicode编码转换为中文的问题解决
  17. freemarker导出word档
  18. JHipster技术简介
  19. WIN8系统中 任务管理器 性能栏 显示CPU利用率(已暂停)怎么回事?
  20. 【Redis使用系列】使用Redis做防止重复提交

热门文章

  1. Nacos——注册中心
  2. Oracle使用数据泵导入/导出数据(expdp/impdp)
  3. JAVA获取html中的所有img链接
  4. Simple16 字符压缩
  5. libevent之学习文档
  6. 【LeetCode】658. Find K Closest Elements 解题报告(Python)
  7. 【LeetCode】486. Predict the Winner 解题报告(Python)
  8. 1080 - Binary Simulation
  9. 如何把 MySQL 备份验证性能提升 10 倍
  10. Proximal Algorithms 1 介绍