前言

    zabbix-server昨天出了个问题,不停的重启。昨天摆弄到晚上也不搞清楚原因,按照网上说的各种操作,各种CacheSize、TimeOut、StartPollers都改了,还有什么Include的日志也不贴说个丢,,,想着今天一早来处理下,结果出了生产事故。

    刚好最近超融合不稳定,凌晨的时候,生产环境有台服务器(注册中心和配置中心)无故重启,然后导致一系列的问题,这个不在这里赘述,来讲一下zabbix这个事吧。

环境

CentOS Linux release 7.6.1810 (Core)
mysql 5.7 # docker启动,数据落盘

zabbix参照官方文档 安装的5.0TLS+CentOS7+Mysql+Nginx版。

zabbix_server (Zabbix) 5.0.5
Revision eaa427cf19 26 October 2020, compilation time: Oct 26 2020 12:20:11 Copyright (C) 2020 Zabbix SIA
License GPLv2+: GNU GPL version 2 or later <http://gnu.org/licenses/gpl.html>.
This is free software: you are free to change and redistribute it according to
the license. There is NO WARRANTY, to the extent permitted by law. This product includes software developed by the OpenSSL Project
for use in the OpenSSL Toolkit (http://www.openssl.org/). Compiled with OpenSSL 1.0.2k-fips 26 Jan 2017
Running with OpenSSL 1.0.2k-fips 26 Jan 2017

PS:本人对zabbix了解不多,只是会安照官方和网上的文档安装配置,自己会做一些自定义的监控配置。

问题

zabbix-server不停重启,登录页面也打不开,zabbix-server.log报错如下:

  2148:20210603:143421.801 Starting Zabbix Server. Zabbix 5.0.5 (revision eaa427cf19).
2148:20210603:143421.801 ****** Enabled features ******
2148:20210603:143421.801 SNMP monitoring: YES
2148:20210603:143421.801 IPMI monitoring: YES
2148:20210603:143421.801 Web monitoring: YES
2148:20210603:143421.801 VMware monitoring: YES
2148:20210603:143421.801 SMTP authentication: YES
2148:20210603:143421.801 ODBC: YES
2148:20210603:143421.801 SSH support: YES
2148:20210603:143421.801 IPv6 support: YES
2148:20210603:143421.801 TLS support: YES
2148:20210603:143421.801 ******************************
2148:20210603:143421.801 using configuration file: /etc/zabbix/zabbix_server.conf
...
...
2179:20210603:143423.081 ================================
2179:20210603:143423.081 Please consider attaching a disassembly listing to your bug report.
2179:20210603:143423.081 This listing can be produced with, e.g., objdump -DSswx zabbix_server.
2179:20210603:143423.081 ================================
2148:20210603:143423.082 One child process died (PID:2179,exitcode/signal:1). Exiting ...
zabbix_server [2148]: Error waiting for process with PID 2179: [10] No child processes
2148:20210603:143423.088 syncing history data...
2148:20210603:143423.097 syncing history data... 100.000000%
2148:20210603:143423.097 syncing history data done
2148:20210603:143423.097 syncing trend data...
2148:20210603:143423.102 syncing trend data done
2148:20210603:143423.102 Zabbix Server stopped. Zabbix 5.0.5 (revision eaa427cf19).

处理过程

  日志里是没有体现出内存、缓存、MySQL等问题,于是网上各种检索。做了各种操作,全套重启、修改CacheSize、查看子进程锁死情况、清数据库。

  后面把MySQL直接初始化,发现zabbix-server启动了几分钟,然后又开始无间断重启。登录页也报错 Database error Connection timed out,查看zabbix-server.conf没有问题。然后找官方的安装文档,发现zabbix是front、server分离的。。。emmm这个时候好像找到问题了。

  检查前端的配置发现/etc/zabbix/web/zabbix.conf.php下的mysql信息竟然不对???WTF!!!赶紧修改。然后重启

systemctl stop zabbix-server zabbix-agent rh-nginx116-nginx rh-php72-php-fpm
过了几分钟,zabbix-server又开始重启,然后想到网上的一篇文档,修改报警媒介类型里mail的配置-安全链接:改成STARTTLS(纯文本通信协议扩展)。终于恢复了。。。

PS:

使用一些开源软件的时候,还是要多了解一下软件本身的架构,维护起来也会更加得心应手。

特别感谢:

https://blog.csdn.net/liuxiangyang_/article/details/100024641

https://yunwei365.blog.csdn.net/article/details/103677447

https://blog.csdn.net/h106140873/article/details/104311586

最新文章

  1. web前端开发和后端开发有什么区别?
  2. Android与Swift iOS开发:语言与框架对比
  3. iosTest
  4. JAVA多线程实现的四种方式
  5. 分分钟知道tiles框架是干嘛的
  6. php heredoc 与 nowdoc
  7. node-webkit学习之【无边框窗口用JS实现拖动改变大小等】
  8. python学习之总结
  9. MySQL之表的数据类型
  10. WPF实战之一 桌面消息框(右下角消息弹出框)
  11. Kubernetes — 控制器
  12. 初识Attention机制(NLP领域)
  13. GAN_李弘毅讲解
  14. JavaScript中的 this全面解析
  15. 【读书笔记】iOS-对iOS应用进行模糊测试
  16. web安全之攻击
  17. arm学习——有关位操作的总结
  18. jquery中对 iframe的操作
  19. U盘安装Centos7.1操作系统的问题记录
  20. Genymotion——VirtualBox cannot start virtual device

热门文章

  1. 概A第一章测试
  2. 基于MATLAB的手写公式识别(3)
  3. 08- Tomcat入门与环境搭建部署
  4. hdu4535
  5. CVE-2012-0774:Adobe Reader TrueType 字体整数溢出漏洞调试分析
  6. Windows核心编程 第五章 作业(下)
  7. wordpress如何隐藏后台位置?
  8. 浅谈Java中的公平锁和非公平锁,可重入锁,自旋锁
  9. CCNA 第三章 TCP/IP简介
  10. SQL必知必会 —— 性能优化篇