
链接/Resource
https://github.com/alibaba/arthas
背景/Background
通常,本地开发环境无法访问生产环境。如果在生产环境中遇到问题,则无法使用 IDE 远程调试。更糟糕的是,在生产环境中调试是不可接受的,因为它会暂停所有线程,导致服务暂停。开发人员可以尝试在测试环境或者预发环境中复现生产环境中的问题。但是,某些问题无法在不同的环境中轻松复现,甚至在重新启动后就消失了。如果您正在考虑在代码中添加一些日志以帮助解决问题,您将必须经历以下阶段:测试、预发,然后生产。这种方法效率低下,更糟糕的是,该问题可能无法解决,因为一旦 JVM 重新启动,它可能无法复现,如上文所述。Arthas 旨在解决这些问题。开发人员可以在线解决生产问题。无需 JVM 重启,无需代码更改。 Arthas 作为观察者永远不会暂停正在运行的线程。
为什么选择Arths ? 在Arthas出现之前,JAVA线上平台问题排查主要依赖于以下几种处理方式:
1.日志分析:需要预先埋点,考虑步骤的情况下,问题出现时可能没有相关日志;
2.JVM参数调优:需要重启应用,影响业务的连续性;
3.第三方监控工具:如APM, Prometheus等,这类工具配置较为复杂,学习曲线陡峭;
Arthas 是Alibaba开源的Java线上诊断工具, Arthas的出现可以帮助我们解决以下场景问题:
- 这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?
- 我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?
- 遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?
- 线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!
- 是否有一个全局视角来查看系统的运行状况?
- 有什么办法可以监控到JVM的实时运行状态?
- 怎么快速定位应用的热点,生成火焰图?
- 怎样直接从JVM内查找某个类的实例?
Arthas支持JDK 6+(4.x 版本不再支持 JDK 6 和 JDK 7),支持Linux/Mac/Windows,采用命令行交互模式,同时提供丰富的 Tab 自动补全功能,进一步方便进行问题的定位和诊断。
快速安装/Install
curl -O https://arthas.aliyun.com/arthas-boot.jar
java -jar arthas-boot.jar
打印帮助信息:
java -jar arthas-boot.jar -h
* 如果下载较慢,可使用阿里云镜像:
java -jar arthas-boot.jar --repo-mirror aliyun --use-http
更多安装方式:
https://arthas.aliyun.com/doc/install-detail.html
用户案例/Use Case
https://github.com/alibaba/arthas/issues?q=label%3Auser-case