Jaeger是受到 Dapper 和 OpenZipkin 启发的由 Uber Technologies 作为开源发布的分布式跟踪系统,截止2023年8月3日最新稳定版本是1.47。其前端采用React语言实现,后端采用GO语言实现,适用于进行链路追踪,分布式跟踪消息传递,分布式事务监控、问题分析、服务依赖性分析、性能优化等场景。
(资料图)
随着微服务架构的流行,一次请求往往需要涉及到多个服务,因此服务性能监控和排查就变得更复杂:
不同的服务可能由不同的团队开发、甚至可能使用不同的编程语言来实现;服务有可能布在了几千台服务器,横跨多个不同的数据中心。因此,就需要一些可以帮助理解系统行为、用于分析性能问题的工具,以便发生故障的时候,能够快速定位和解决问题,这就是APM系统,全称是(ApplicationPerformanceMonitor,当然也有叫ApplicationPerformanceManagement tools)
AMP最早是谷歌公开的论文提到的Google Dapper。Dapper是Google生产环境下的分布式跟踪系统,自从Dapper发展成为一流的监控系统之后,给google的开发者和运维团队帮了大忙,所以谷歌公开论文分享了Dapper。
(2)链路追踪在传统的单体程序中,遇到问题时,我们可以通过函数间的调用栈来查看函数间的调用关系。但是在分布式的架构中,一个请求可能会导致多个不同网络的服务调用,这给我们调试问题带来了困难。Jaeger可以简单理解为微服务的函数调用栈,其记录了一个请求的各种调用关系,以便于我们分析问题。tracer:在广义上,一个trace代表了一个事务或者流程在(分布式)系统中的执行过程。trace 是多个 span组成的一个有向无环图(DAG),每一个span代表trace中被命名并计时的连续性的执行片段。每一个 Trace 会有一个独有的 Trace ID,假设服务调用关系为 a->b->c->d,请求从 a 开始发起。 那么 a 负责生成 traceId,并在调用 b 的时候把 traceId 传递给 b,以此类推,traceId 会从 a 层层传递到 d。span:是链路追踪工具的逻辑工作单元,可以是一个微服务中的 service,也可以是一次方法调用,甚至一个简单的代码块调用。具有请求名称、请求开始时间、请求持续时间。每一个 Span 会有一个独有的 Span ID。Span 会被嵌套并排序以展示服务间的关系。Span Context:含额外 Trace 信息的数据结构,span context 可以包含 Trace ID、Span ID,以及其他任何需要向下游服务传递的 Trace 信息。总而言之,Trace表示对一次请求完整调用链的跟踪,而将两个服务例如上面的服务A和服务B的请求/响应过程叫做一次Span,trace是通过span来体现的, 通过一句话总结,我们可以将一次trace,看成是span的有向图,而这个有向图的边即为span。而分布式跟踪系统要做的,就是记录每次发送和接受动作的标识符和时间戳,将一次请求涉及到的所有服务串联起来,只有这样才能搞清楚一次请求的完整调用链。
(3)OpenTracing为了解决不同的分布式追踪系统 API 不兼容的问题,诞生了 OpenTracing 规范。OpenTracing 是一个轻量级的标准化层,它位于应用程序/类库和追踪或日志分析程序之间。
一句话总结,OpenTracing是一套标准,它通过提供平台无关、厂商无关的API,使得开发人员能够方便的添加(或更换)追踪系统的实现。OpenTracing提供了用于运营支撑系统的和针对特定平台的辅助程序库。程序库的具体信息请参考详细的规范。OpenTracing 已进入 CNCF,正在为全球的分布式追踪,提供统一的概念和数据标准。
1.3 Jaeger和其他常用分布式链路追踪工具对比注意 1:OpenTracing现在已经成为过去式了,现在的APM(全称:Application Performance Management tools,应用程序性能管理工具)世界,由一种叫做OpenTelemetry的规范所统治,具体详情参见《OpenTelemetry概述》。
市面上关于分布式链路追踪工具的产品很多,除了 Uber 的 Jaeger 和 Twitter 的 Zipkin,目前 SkyWalking 使用者也比较多,下面从多个维度对比下常用分布式链路追踪工具的能力。
2、Jaeger架构设计2.1 Jaeger架构Tracing SDK:用于实现分布式链路追踪的软件开发工具包。这些 SDK 通常是针对特定编程语言或框架的,旨在帮助开发人员在应用程序中集成分布式追踪功能。这些 SDK 提供了一组 API 和工具,使开发人员能够在应用程序代码中插入相关的追踪代码,从而捕获应用程序的请求路径、性能指标和其他有关信息。通过在代码中插入追踪代码,应用程序的不同组件和服务之间的交互将被追踪,从而形成完整的请求链路。JaegerCollector:接收traces,通过处理管道运行它们进行validation和清理/丰富,并将其存储在存储后端。Jaeger内置了对多个存储后端的支持,以及用于实现自定义存储插件的可扩展插件框架。DB:后端存储组件,支持内存、Cassandra、Elasticsearch、Kafka 的存储方式。Jaeger Query:用于接收查询请求,从数据库检索数据并通过 UI 展示。Jaeger UI:使用 React 编写,用于 UI 界面展示。在Jaeger架构设计中,Jaeger Collector组件从被跟踪的应用程序接收数据,并将其直接写入存储。 存储必须能够同时处理平均流量和峰值流量。Jaeger Collector使用内存队列来平滑短期流量峰值,但如果存储无法跟上,持续的流量峰值可能会导致数据丢失。
注意 1:这是Jaeger最新稳定版本1.47的架构图,我们在比较老的jaeger版本的架构图中经常会看到jaeger-agent组件,其在应用程序和后端收集器之间起到中间代理的作用,但是由于Jaeger 客户端库已被弃用,并且 OpenTelemetry SDK 正在逐步取消对 Jaeger Thrift 格式的支持,因此现在版本不再需要或推荐使用jaeger-agent 。2.2 Jaeger采样率
分布式追踪系统本身也会造成一定的性能低损耗,如果完整记录每次请求,对于生产环境可能会有极大的性能损耗,一般需要进行采样设置。
当前支持四种采样率设置:
固定采样(sampler.type=const)sampler.param=1 全采样, sampler.param=0 不采样;
按百分比采样(sampler.type=probabilistic)sampler.param=0.1 则随机采十分之一的样本;
采样速度限制(sampler.type=ratelimiting)sampler.param=2.0 每秒采样两个traces;
动态获取采样率 (sampler.type=remote) ,允许根据特定条件动态地决定是否采集某个请求的追踪数据,以减少性能开销并确保系统的稳定性。
参考:APM 原理与框架选型
参考:Jaeger分布式跟踪工具初探
1、简介1 1Jaeger是什么Jaeger是受到& 160;Dapper和& 160;
双方就金融支持高水平科技自立自强、金融业数字化转型、金融业信息技术
航天科技公告,控股子公司航天科工惯性技术有限公司位于河北省涿州市的
重庆农商行:金融+文化打造“兴农家园”特色网点,金融,兴农家园,银...
央广网上海8月3日消息(记者唐奇云)根据上海市交通委指挥中心发布的《
央视网消息:8月3日,外交部发言人就环保组织表示中国代表团阻止有关暂
1、不是~这是指今年遭受的第8次台风了!。本文到此讲解完毕了,希望对
联创光电(600363)8月3日晚间公告,公司董事会秘书邓惠霞8月3日以集中竞
中新网北京8月3日电 (唐茜茜 王蕙萱)“大伙都听清楚了吗?以后出
直击河北水灾:洪水迫近“中国箱包之都”,白沟居民的去与留,洪水,...
本文来源:时代周报作者:李馨婷小众的野奢酒店生意再度进入公众视野。
天眼查App显示,近日,广东大族半导体科技有限公司成立,注册资本1 2亿
在“产品+渠道”双轮驱动增长模式指引下,盐津铺子业绩延续高增长态...
近日,有网友发布视频称,黑龙江省佳木斯市一小区疑似将要建设方舱医院
中新网8月3日电中国气象局3日召开新闻发布会,发布“七下八上”全国...
本报太原8月2日电(记者付明丽)近日,山西省自然资源厅印发《山西省自
当地时间8月2日,哥伦比亚国家参与委员会在哥首都波哥大成立,负责推进
08月02日,中国太保被沪股通减持81 64万股,最新持股量为2 92亿股,占
7月29日以来,受台风“杜苏芮”影响,京津冀地区普降大到暴雨,K117...
令人震撼的大陆板块如何演变,鲜明的地形地貌怎样形成,多样的季风洋流有
在这个充满浪漫的月份里,有三大星座被誉为桃花运最强,他们在爱情中拥
1、一磅合0 45359237公斤。2、磅(英语:pound)是英国与美国所使用的
布偶猫是一种大型宠物猫品种,它的体重通常在10到15磅之间。布偶猫是一
人民网北京8月2日电(欧阳易佳)今日,习酒集团召开科技创新研讨会。会
2018年,由苏州90后小伙陈柯宇作词作曲的歌曲《生僻字》在网络走红。《
新品不断入场,竞争加剧,买量打法也在继续进化。CJ期间,中国音数协游
近日,陕西榆林警方经过持续攻坚,成功破获了一起涉案600余万元的特大
公职人员判刑能不能办退休
(视频截图)将一块钕铁硼磁体放到材料的下面能够发现,当磁体缓慢地靠
基础层企业ST蓝奥(873501)发布公告,公司本次股票解除限售数量总额为