出差刚到家,公司最近接了一个矿场转建公有云平台的项目。

前期200台服务器作为公有云基础。

我主要负责总体网络规划、计费数据库集群设计、ceph集群自动部署、容器化设计、硬件及系统调试优化等等!

由于机房刚刚建设并且矿机都是被超过频的,直接做GPU是不行的,需要对显卡bios进行降频。

还有N多硬核问题如:硬盘坏道故障、网络拥堵,docker网桥冲突,并且在实施过程中发现有20台服务器被挖矿病毒污染了。。你敢信嘛?以及各种问题。

后续会陆陆续续更新这些问题的排查及处理方法。

老衲会开源废了九牛二虎之力设计的mysql容器集群方案以及一键部署脚本。

由于近期各种旁系项目太多,devops3.0开发进度又被耽误了。不过现在已经完成了ansible2.4+的接口集成、cmdb功能实现、接下来就是各种批量任务了。

因为有不少纯开发的同学,可能都没见过IDC机房长啥样,今天就带大家进IDC机房看看吧!

设备都是国产的1U服务器。

冷风通道,门口一个推拉门,进去后照明自动亮起。还是有点科技感觉的

当时三个服务器有问题,我就在这里调试了一下午。。相关案例细节我会在后续讲。

机柜门配有橘色氛围灯,极其暧昧:

机架式国产1U服务器

存储及其他设备

机房都是上走线了。8年前还都是下走线,下面搭个铁架龙骨,要是线有问题就得把地板块拆了,再下去顺着标签找线。唉想想都是眼泪!

当年做实施的时候拼的就是绑线的手艺。经常以为漏了几根线,全拆了重新绑。现在已经不行啦。但是看这帮小伙帮的还是不错的。

机房着火咋办?看到了,专业的灭火设备

 
 
核心机房的电源一般都是双路电,然后接UPS,并且还配备有备用发电机。
 

空调是两台互备,当年出现过空调室外机过滤网被柳絮堵了导致空调宕机,机房温度半小时内升至50多度,门把手都烫手无法进入抢修的情况。

唉!~想当年。。算了不说了。

上面只是机房一个小角落!大概就是这个样子的。

这些天熬得太厉害了,确实累了,明天整理资料和案例再给大家分享哦!

感谢各位的关注,我会持续给各位带来各个维度的技术干货。IT不易,各位互勉吧!
欢迎关注我的个人公众号,有更多的学习资料等您来拿。

最新文章

  1. 实现断点续传的FTP下载类(支持多线程多任务下载)
  2. 配置eclipse使能打开当前文件所在目录
  3. python学习笔记三 函数(基础篇)
  4. 04day2
  5. Jquery中使用setInterval和setTimeout
  6. SPRING IN ACTION 第4版笔记-第四章ASPECT-ORIENTED SPRING-006-定义切面使用xml
  7. VC中获取窗体句柄的各种方法
  8. adb logcat 命令行用法
  9. C# var 隐式类型 var 用法 特点
  10. CodeChef Cards, bags and coins [DP 泛型背包]
  11. 51nod1556 计算(默慈金数)
  12. Ansible------常用功能
  13. SQL Sever 2012版本数据库的完全安装流程
  14. LeetCode算法题-Power Of Two(Java实现)
  15. TensorFlow从入门到理解(一):搭建开发环境【基于Ubuntu18.04】
  16. 【PMP】易混淆知识点
  17. git与github区别与简介
  18. [Project] SpellCorrect源码详解
  19. freemark简单事例
  20. Petr and Permutations CodeForces - 987E(逆序对)

热门文章

  1. YTU 1068: 复制字符串
  2. 皮尔逊相关系数的java实现
  3. POJ - 2417 Discrete Logging(Baby-Step Giant-Step)
  4. 牛人的ACM经验 (转)
  5. hdu 4398 Template Library Management(贪心+stl)
  6. BZOJ_3295_[Cqoi2011]动态逆序对_CDQ分治+树状数组
  7. 微信小程序-B站:wxml和wxss文件
  8. return break contiune
  9. Vue Router的配置
  10. hibernate的基础学习