Kubernetes 中的调用链跟踪和分析实践

在 Kubernetes 运行环境中,一次 HTTP 请求可能需要经过多个不同的 Pod,并且可能需要涉及多个服务之间的协作来完成。对于开发者来说,这样的请求链路复杂度增加会使得问题排查困难、性能优化变得复杂,因此需要引入调用链跟踪技术来帮助开发者更好地解决这些困难。

本文将介绍在 Kubernetes 中如何使用调用链跟踪技术,包括如何实现和使用 OpenTracing 和 Jaeger,并且展示如何在 Kubernetes 集群中进行链路跟踪和分析。在本文中,我们将会实现一个示例应用来演示如何使用这些技术。

什么是调用链跟踪技术?

调用链跟踪(Distributed Tracing)技术是一种可以追踪分布式系统中请求的传递路径和处理过程的技术。在微服务系统中,不同的服务、模块之间需要进行协作,而一个请求通常需要访问多个服务,请求的处理任务会在不同的服务上被执行。调用链跟踪技术可以在每一个服务中插入一个追踪点,用来记录请求的传递信息,并将这些信息重新组合成一条完整请求链路。

在调用链跟踪技术中,主要由两个角色组成:提供追踪信息的客户端和处理追踪信息的服务端。客户端通常会在发送请求时,在请求 Header 中添加一些标记,此标记会被路由器、负载均衡器、服务网格等网络中间件带上,并在整个请求链路中传递下去。服务端可以通过解析请求 Header 中的标记信息,来组织出一个完整的请求链路,并将这些信息可视化展示出来。

为什么需要调用链跟踪技术?

在线上环境中,发现问题的环节是非常复杂的。如果只是单单从上层应用的表象出发去分析一个故障,那么花费的时间和付出的代价必定是巨大的。通常我们需要结合其他的几个环节,以此来排查问题、调优表现和优化性能。其中,调用链技术可以非常完美地解决当前遇到的问题。

  • 莫衷一是的故障信息:一些故障现象很难直接识别哪些服务受到了影响,调用链技术可以提供可视化界面来看到服务间的依赖关系。

  • 难以排查过程:在分布式系统中,单个服务可能是多个微服务系统的组成部分,故障可能不是由单个系统引起的。调用链技术可以轻松地找到引起故障的一个或多个微服务系统或者其它问题。

  • 对性能问题缺少足够的数据支持:在微服务架构中,经常会出现因某个微服务系统的性能问题而引起整个应用性能问题的情况。使用调用链技术,可以方便地找到出现性能问题的微服务系统,并对这个系统进行优化。

OpenTracing 和 Jaeger

基于调用链的技术方案有很多,目前主要有三种实现:Zipkin、OpenTracing 和 Jaeger。在本次实践中我们将会使用 OpenTracing 和 Jaeger。

OpenTracing

OpenTracing 是一个针对跨进程追踪协议的规范,它提供了一种简单、标准化的方式来在分布式系统中收集追踪数据。OpenTracing 规范可用于任意编程语言和相互通信的系统。通过 OpenTracing 可以收集分布式系统的完整调用链路信息。OpenTracing 可以让开发者在客户端和服务端之间很容易地传递上下文信息。OpenTracing 提供了大量的语言库支持,如 Python、Java、.NET、PHP、C++ 等等。

Jaeger

Jaeger 是一个分布式系统中调用链跟踪的系统,它与 OpenTracing 协议兼容,而且内置支持的 OpenTracing API。同时,它还提供了一个 UI 来展示分布式系统中各个服务之间的关系,以及请求调用的情况。

在 Kubernetes 中实现调用链跟踪

以下是一个基于 Kubernetes 的微服务应用的架构示意图。本应用共有四个微服务,Gateway 接收所有 Http 请求并将请求转发到相应的微服务。微服务 A、B、C 为应用程序的后台服务,其中 A 调用服务 B 和 C,B 和 C 会向外部发起远程调用(例如访问数据库或其他微服务)。最后,服务 D 用于接收微服务 A 的消息通知。

以下是如何在 Kubernetes 中使用 OpenTracing 和 Jaeger 实现调用链跟踪:

安装 Jaeger

在 Kubernetes 中安装 Jaeger 可以使用 Helm 部署,我们将在本文中使用 Jaeger 的官方 Helm Chart。在部署之前,确保您已经安装了 Helm 客户端,并且连接到 Kubernetes 集群。

---- ---- --- ------------- -------------------------------------------
---- ---- ------
---- ------- ------ --------------------

当 Helm 和 Tiller 安装好之后,应该可以看到 Jaeger is 等待部署。使用 kubectl 命令检查 pods 是否处于正常状态:

- ------- --- ---- -- ----------------------------- -------

一旦所有的 jaeger-all-in-onejaeger-agent pod 处于「Running」状态,就说明 Jaeger 已经部署成功了。

实现调用链跟踪

将 Jaeger 部署到 Kubernetes 之后,我们需要在微服务中添加 OpenTracing 的客户端库,以便在服务运行期间生成和发送调用链信息。以下是使用 Python 的 Jaeger 客户端库在微服务 A 中实现调用链跟踪的示例。

---- ------------- ------ ------
------ -----------

------ - -------
    --------
        ---------- -------- -------- -------- ---
        -------------- -
            ----------------- ---------
            ----------------- ----
        --
        ---------- -----
    --
    -----------------------------
-
------ - --------------------------

---- ------------------------------------------------ -- -----
    --------------------------- ---------------
    ------------------------ ------------
    - -- ---- ---- -- --- ---------- --- ------- --- -------- ------- -- ---- ----
    ---
    
--------------

在这个示例中,我们使用 Python 版本的 Jaeger 客户端库进行初始化,并使用服务名称 microservice_a 进行注册。接下来我们使用 opentracing.tracer.start_span() 方法:创建一个 span(描述请求链路中的一段处理)。

您需要确定一个逻辑父级 Span,然后在执行它的任何子任务时对其进行包装。在本示例中,逻辑上的父级 Span 是 process_request。在 process_request 任务内部,我们可以使用 span 对象来记录发生的任何事件。一般情况下,可以使用 set_tag() 方法为 Span 添加内容。对于耗时操作,可以使用start_time()finish_time() 方法测量。

最后,我们需要调用 tracer.close() 方法来结束 Span 的跟踪。将它们的数据发送给后端服务器。

当然,各个语言的 OpenTracing 客户端库支持的 API 不尽相同,但是这种实现方式大体相同。在这里推荐阅读 OpenTracing 官方文档 了解更多信息。

查看调用链跟踪信息

通过部署 Jaeger 并在 Python 代码中添加 Jaeger 客户端库之后,您就可以通过 Jaeger UI 来查看应用的调用链路了。

在完成 Jaeger 安装的网络之前,我们无法访问 Jaeger UI,因此使用以下 kubectl 命令将 Jaeger UI 暴露为 NodePort 服务:

------- ------ ------- ------------ --------------- -
  ----------------------------

在浏览器中访问:http://<node_ip>:<node_port> 来打开 Jaeger UI。在 Jaeger UI 上,您可以轻松地看到您的应用程序的调用链路。

请注意,在本示例中,每个服务都向 Jaeger 报告,而 Jaeger 是一个独立的服务本身。这种架构确保了系统拓扑关系的集中管理。此外,Jaeger 提供了非常有用的可视化工具,可以轻松地查看不同进程之间的依赖关系和调用时间。

总结

在本文中,我们介绍了在 Kubernetes 中使用调用链跟踪技术的必要性,通过使用 OpenTracing 和 Jaeger 实现分布式系统的调用链跟踪,包括如何在 Kubernetes 上安装 Jaeger,如何在 Python 应用程序的微服务中添加 Jaeger 客户端库,并查看调用链跟踪在 Jaeger UI 中的输出。调用链跟踪技术可以帮助开发者在分布式服务中更好地查找和解决问题,最终优化系统性能。

来源:JavaScript中文网 ,转载请联系管理员! 本文地址:https://www.javascriptcn.com/post/6543881d7d4982a6ebd5451e


猜你喜欢

  • GraphQL:用 Connection 优化节点查询

    前言 GraphQL 是一种由 Facebook 开发的数据查询和操作语言,它提供了一种更高效、更灵活的方式来获取和操作数据。GraphQL 的一个重要特性就是可以精确地指定需要查询的数据,避免了传统...

    2 个月前
  • Server-sent Events 的浏览器支持情况及解决方法

    什么是 Server-sent Events? Server-sent Events(简称 SSE)是一种基于 HTTP 的服务器推送技术,它可以让服务器向客户端发送事件流,客户端通过监听这个事件流来...

    2 个月前
  • ECMAScript 2020(ES11)中的新特性:BigInt 转换

    在 ECMAScript 2020(ES11)中,新增了一种数据类型:BigInt。它是一种可以表示任意大整数的数据类型,可以用来解决 JavaScript 中整数运算的精度问题。

    2 个月前
  • CSS Reset 在 IE6、IE7 等老浏览器中的应用

    什么是 CSS Reset CSS Reset 是一种通过重置浏览器默认样式的方式,消除不同浏览器之间的差异,从而实现更加一致的样式效果的技术手段。在前端开发中,使用 CSS Reset 可以让我们更...

    2 个月前
  • ES6 中的类继承和原型链之间的关系解析

    在 ES6 中,引入了 class 关键字,使得 JavaScript 也具备了面向对象编程的能力。在类继承和原型链之间,有着密切的关系。本文将详细解析 ES6 中的类继承和原型链之间的关系,并提供一...

    2 个月前
  • 如何使用 Redux 处理 React 应用中的表单数据

    前言 在开发 React 应用时,表单数据的处理是非常常见的需求。然而,由于 React 的单向数据流和组件化特性,传统的表单处理方式可能会变得非常繁琐。而 Redux 作为一种状态管理工具,可以帮助...

    2 个月前
  • Redis 处理高并发的策略

    前言 随着互联网的发展,高并发已经成为了一个不可避免的问题。而 Redis 作为一款高性能的 NoSQL 数据库,也成为了处理高并发的重要工具之一。本文将会介绍 Redis 处理高并发的策略,并且会提...

    2 个月前
  • 响应式设计中的图片适配问题解决方案

    在响应式设计中,图片适配是一个比较棘手的问题。如果不加以处理,可能会导致图片在不同设备上显示不佳,影响用户体验。本文将介绍响应式设计中的图片适配问题,并提供解决方案。

    2 个月前
  • 解析 TypeScript 中 encapsulation(封装)的实现方式

    解析 TypeScript 中 encapsulation(封装)的实现方式 在 TypeScript 中,封装(encapsulation)是一种重要的面向对象编程的特性。

    2 个月前
  • PM2 崩溃处理:如何避免由于 PM2 进程奔溃导致应用崩溃?

    在前端开发中,我们经常使用 PM2 进行进程管理和部署。但是,当 PM2 进程崩溃时,应用也会跟着崩溃。如何避免这种情况的发生?本文将介绍 PM2 崩溃处理的方法和技巧,帮助您更好地管理和部署应用。

    2 个月前
  • 在 Node.js 中运行 HTTPS 服务器的方法

    Node.js 是一个非常流行的 JavaScript 运行时环境,它可以让我们通过 JavaScript 编写服务器端应用程序。在开发 Web 应用程序时,安全性是非常重要的。

    2 个月前
  • 详解 ECMAScript 2018 中的三个新操作符及其用法

    ECMAScript 2018 (简称 ES2018) 是 JavaScript 语言的最新标准,其中包含了许多新特性和语法糖。本文将详细介绍其中的三个新操作符及其用法,分别是:扩展运算符、剩余运算符...

    2 个月前
  • 解决 Enzyme 测试 React Native 组件时动画无法渲染的问题

    在开发 React Native 应用时,我们经常需要使用 Enzyme 来测试组件。然而,当我们测试涉及到动画的组件时,我们可能会遇到一些问题:动画无法渲染,导致测试失败。

    2 个月前
  • 使用 React Router 打造复杂而强大的 SPA 应用

    随着 Web 技术的不断发展,单页应用(Single Page Application,SPA)已经成为了现代 Web 应用的主流。SPA 通过异步加载数据和动态更新页面,提供了更快速、更流畅的用户体...

    2 个月前
  • AngularJS 中如何使用 ng-repeat 中的 filter 来过滤数据

    在 AngularJS 中,ng-repeat 指令是用于循环遍历数组或对象并生成 HTML 元素的常用指令。而 ng-repeat 指令中的 filter 属性则是用于过滤数据的功能。

    2 个月前
  • 如何在 Chai 中验证 Promise.all

    如何在 Chai 中验证 Promise.all 在前端开发中,Promise.all 是一个非常常用的功能,它可以让我们在多个异步操作完成后再执行一些操作,这个功能在实际开发中非常实用。

    2 个月前
  • Mongoose 实现数据批量更新的方式详解

    前言 在前端开发中,经常会涉及到对数据库中的数据进行批量更新的操作。而 Mongoose 是一款 Node.js 平台下的 MongoDB 对象模型工具,它提供了一种方便的方式来操作 MongoDB ...

    2 个月前
  • 在使用 lit-element 的时候,如何解决麻烦的 Shadow DOM 的变量传递问题

    前言 在使用 Web Components 的时候,我们通常会使用 Shadow DOM 来实现封装和样式隔离。然而,Shadow DOM 的封闭性也带来了一些挑战,其中之一就是变量传递问题。

    2 个月前
  • Tailwind CSS 如何实现动态换肤?

    随着互联网的发展,越来越多的网站和应用开始支持动态换肤功能。动态换肤不仅可以提升用户体验,还可以让用户在不同的环境下选择适合自己的主题,增加用户黏性和满意度。本文将介绍如何使用 Tailwind CS...

    2 个月前
  • 如何在 Less 中使用字符串操作函数?

    在前端开发中,样式表是不可或缺的一部分。而 Less 是一种动态样式语言,它是 CSS 的一种扩展。在 Less 中,我们可以使用字符串操作函数来处理字符串,这些函数可以帮助我们更加方便地操作字符串,...

    2 个月前