线上问题复盘,JVM Fast Throw 的故事

线上问题复盘,JVM Fast Throw 的故事

作者:龙台 2021-04-21 07:37:19

云计算

虚拟化 首先,这是一个 悲伤的故事,涉及到JVM 底层优化的知识点。想到第一次碰到这种问题时的懵逼,应了句老话:书到用时方恨少!

[[394549]]

首先,这是一个 悲伤的故事,涉及到JVM 底层优化的知识点。想到第一次碰到这种问题时的懵逼,应了句老话:书到用时方恨少!

负责的消息中台在 晚上八点左右,运维群里反馈大量用户接收不到短信消息。登陆 Kibana 查找对应的 Error 日志,发现出现了 大量的下标越界异常

当时更…,线上问题得到了修复。但是,出现问题可不得找到问题的产出原因,不然下次有可能还会出现

因为在 ELK 上进行 日志分析不太方便,难以根据对应异常进行不同纬度上的统计分析,所以联系运维同学将故障产生当天的 Info、Error 日志 拉下来进行线下分析

经过日志分析得知,异常的产出有两种,一种是有堆栈信息,比如:

  1. java.lang.ArrayIndexOutOfBoundsException: -1 
  2. ... 省略堆栈信息 

另外一种,就比较诡异,只有异常,没有对应的堆栈信息

  1. java.lang.ArrayIndexOutOfBoundsException: null 

第一种问题比较好定位,根据 异常堆栈信息,定位到了具体代码,直接进行了修复,难就难在第二种

其实这两个是一个异常,往后看小伙伴就明白了。后面做的所有事情,都是为了搞清楚两件事情

  • 为什么异常 message 会输出 null
  • 为什么堆栈信息没有输出打印

JVM Fast Throw

什么是 Fast Throw?

大白话一点来说,就是:当一些异常类型(空指针、下标越界、算术运算等…)在代码里的固定位置被抛出多次,虚拟机(HotSpot VM)会直接 抛出一个事先分配好、类型匹配的异常对象。此异常对象的 message 和 stack trace 都为空

看到这里相信读者朋友已经明白了为什么同一种异常,打印出来的日志却是不一样内容 了吧。就是因为某一个异常在同一个地方多次被抛出,JVM 抛出一个预分配异常,那么 message、stack trace 相当于被吞掉了

The compiler in the server VM now provides correct stack backtraces for all “cold” built-in exceptions. For performance purposes, when such an exception is thrown a few times, the method may be recompiled. After recompilation, the compiler may choose a faster tactic using preallocated exceptions that do not provide a stack trace. To disable completely the use of preallocated exceptions, use this new flag: -XX:-OmitStackTraceInFastThrow.

JDK 1.5 的发布文档介绍中描述了此情况,出现这种优化方案的原因是 为了提高性能。当同一种异常在相同的位置被抛出多次,编译器就会重新编译此方法。重编译后,编译器可能会 使用不提供堆栈跟踪的预分配异常 来选择更快的策略

如果想要关闭这种预分配异常的机制,可以使用 -XX:-OmitStackTraceInFastThrow。感兴趣的读者朋友可以看一下发布说明:https://sourl.cn/PMzVkC

另外通过 JVM 的源码得知,Fast Throw 机制目前支持五种异常情况,截图如下

模拟 Fast Throw

上面说的都是理论部分,这个章节使用代码来实战下

  1. List<String> list = new ArrayList(); 
  2. for (int j = 0; j < 10000; j++) { 
  3.     try { 
  4.         list.get(-1); 
  5.     } catch (Exception ex) { 
  6.         int length = ex.getStackTrace().length; 
  7.         System.out.println(String.format("报错异常 :: %s, 堆栈长度 :: %s", ex, length)); 
  8.     } 

上面程序跑在了 Java8 的环境中,通过运行程序结果可以看出来,Fast Throw 在 Java 8 中依然生效

如果没有特别情况,最好不要关闭此特性。因为如果并发量大的接口,因为程序的 BUG 导致大量的请求在同一代码处抛出异常,Fast Throw 机制可以节省很多性能损耗。通过单线程跑测试 Demo 得知,异常调用情况越多,性能差别越大

 开启  Fast Throw关闭 Fast Throw
10w1004ms3547ms
100 w6193ms30928ms
500w37492ms

如果线上环境触发了 Fast Throw 机制,可以通过 向前追溯相同位置、相同异常的日志 来定位问题的产出原因

结言

千言万语汇成一句话就是,重构有风险,上线需谨慎

针对公共功能的重构,需要包含全量的测试用例,要将问题的产出背景考虑到 极致,亦或者和身边同事说明需求背景,大家一起想下,可以极大程度避免极端问题的产出

必要的压力测试 是很重要的,这一点可以很好的将 流量大才能显现的问题 提前暴露出来

 

故障的产生带来的意义,有好有坏,坏的点大家都懂得;好的点自然是 积累了线上问题故障排查的经验,这样的话,后面公司妹子再遇到相同的问题,大喊一声:妹子,放开那 BUG,让我来!

 

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/231867.html<

(0)
运维的头像运维
上一篇2025-04-19 21:53
下一篇 2025-04-19 21:54

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注