基本的概述

在一个服务器的集群上面,服务器的CPU长时间居高不下,响应的时间也一直很慢,即使扩容了服务器CPU的下降效果也不是很明显。

对于CPU过高的原因,可以总结到以下原因:

  • 太多的循环或者死循环

  • 加载了过多的数据,导致产生了很多的大对象

  • 产生了过多的对象,GC回收过于频繁(如:字符串拼接)

对于上面的情况,难点不是优化代码,难点在于定位到问题的所在,下面我们就用Dump抓包的方式来定位到问题的所在。介绍这个内容之前,我们要先回顾下.Net中垃圾回收的基础知识和一个工具的准备。


基础知识


垃圾回收触发条件

  • 代码显示调用System.GC的静态方法

  • windows报告低内存情况

  • CLR正在卸载AppDoamin

  • CLR正在关闭

大对象垃圾回收

CLR将对象分为大对象和小对象,认为大于85000字节或者更大的字节是大对象,CLR用不同的方式来对待大对象和小对象:

  • 大对象不是在小对象的地址空间分配,而是在进程地址空间和其他地方分配

  • GC不会压缩大对象,在内存中移动他们的代价过高,但这样会造成地址空间的碎片化,以至于会抛出OutOfMemeryException 异常。

  • 大对象总是在第二代回收。

工具准备

  1. 下载windbg文件

  2. 相关DLL准备clr.dll和sos.dll,(都在对应.Net版本安装目录下面,我的安装目录在C:\Windows\Microsoft.NET\Framework64\v4.0.30319)

  3. 一个cpu运行的较高的时期的DUMP文件(下面会说如何获取)

  4. 准备测试代码,此处为了演示方便,简单了写了一个有潜在问题的代码:

public  class Common
{
public static List<string> GetList()
{
var list=new List<string>();
for (int i = 0; i < 10000; i++)
{
list.Add(i.ToString());
}
return list;
} public static string GetString(List<string> list)
{
var str = "";
foreach (var l in list)
{
str += string.Format("'{0}',", l);
}
if (str.Length > 0)
{
str.Remove(str.Length - 1);
}
return str;
}
}

我们知道在字符串的拼接的时候,每一个字符串都是一个对象,拼接后又产生了一个新对象,所以在GetString这个方法中会有大量的GC操作,下面我们就调用下这个代码,看下CPU的情况,为了模拟并发情况,我们开多个标签,每个标签每1s秒中刷新一次。

抓取Dump

在任务管理器中选择应用程序池对应的w3wp.exe,右击–>创建转储文件。创建完成后,会提示出指定的路径

根据上面的步骤,我们准备我们分析的文件如下:

分析Dump

  • 打开windbg,加载对应的dump文件

  • 配置Sysmbol,添加”cachec:\mysymbol;srvhttp://msdl.microsoft.com/download/symbols” 

  • load sos.dll和clr.dll,命令如下:
      .load D:\windbg\sos.dll
    .load D:\windbg\clr.dll
  • 运行命令!threadpool 显示有关托管线程池的信息,其它一些SOS 调试扩展命令.

  • 运行!runaway 查询cpu占用时长比较长的几个线程Id

  • 运行~22s (进入线程查看),kb(查看对应的调用)

  • 运行~* kb 查看所有线程的堆栈调用

  • 在上面搜索GC和大对象出现的线程 (ctrl+f搜索:GarbageCollectGeneration和allocate_large_object )

  • 可以看到定位触发GC的线程是31号线程

  • 运行命令~31s 进入31线程,再运行!clrstack查看堆栈调用,最终可以定位到出问题的代码,是由于字符串的拼接导致大量的对象产生,从而触发了GC。

最新文章

  1. iOS -- 轮播图
  2. IEnumerable,IQueryable之前世今生
  3. mysql下将分隔字符串转换为数组
  4. DNS主从TSIG加密传输
  5. loadrunner---&lt;三&gt;---菜鸟对Browser Emulation的思考
  6. Solr笔记--转载
  7. select组件2
  8. Linux学习之crontab定时任务
  9. OGG中断后,重新同步操作
  10. 【原创】EntityFramework Core 中使用 CodeFirst 模式时 PowerShell 版本问题及解决
  11. ubuntu 新手入门第一天
  12. Android绘制文字时垂直居中
  13. AMD,CMD,UMD,CommonJS
  14. 命令行程序增加 GUI 外壳
  15. 信号基础知识--FFT DFT
  16. RHEL6安装Oracle 11g R2
  17. Android签名打包详解
  18. Linux 文件夹含义(转)
  19. SqlServer——系统函数
  20. 我的java问题排查工具单

热门文章

  1. QT中报错collect2:ld returned 1 exit status的可能原因。
  2. python运算符优先级
  3. spass按位置编码,进行排序题处理与分析
  4. 网络编程—端口分类调研和netstat命令
  5. 9.2 翻译系列:数据注解特性之---Column【EF 6 Code First系列】
  6. 迁移桌面程序到MS Store(1)——通过Visual Studio创建Packaging工程
  7. springboot之定时任务
  8. jQuery判断复选框checkbox的选中状态
  9. ElasticSearch权威指南学习(分布式集群)
  10. 从github clone文件: Failed to receive SOCKS4 connect request ack.