Kubernetes 中调度器的工作流程分析

阅读时长 7 min read

Kubernetes 是目前最流行的容器编排系统之一,它提供了许多优秀的特性,其中之一就是调度器。调度器是 Kubernetes 集群中负责管理容器调度的组件,它的主要作用是将容器部署到合适的节点上以尽可能地利用资源。

本文将会对 Kubernetes 中调度器的工作流程进行分析,并且分享一些最佳实践以及示例代码。

调度器的概念及作用

调度器是 Kubernetes 中的一个核心组件,主要负责对集群中的容器进行调度,并将其分配到适当的节点上进行部署。

调度器在 Kubernetes 中的核心作用如下:

  • 监听 API server 中 SchedulerConfigMap 和 SchedulerPolicyConfigMap 中的配置变更,从而调整调度策略;
  • 监听 Pod 资源的创建和删除操作,调度尚未绑定到节点的 Pod 到合适的节点上;
  • 监听节点的变化,例如节点宕机或新增节点,然后对相关 Pod 进行重新调度或或将其直接绑定到这些新节点上。

一个调度器通常由两部分组成:调度器本身和调度器算法(也称为 Predicates 和 Priorities)。

  • 调度器本身:负责监听和响应 API server 的操作,并采用调度器算法确定要绑定到哪个节点上。
  • 调度算法:是一些规则和策略,用于判断哪些节点可以绑定 Pod,并根据 Pod 的需求和节点的资源特性来确定最终的节点。调度算法中的两个重要部分是 Predicates 和 Priorities。

Predicates 和 Priorities

Predicates 和 Priorities 是 Kubernetes 调度算法中的两个重要组件,它们都是用于确定哪些节点可以绑定 Pod,并根据其特性和资源需求将 Pod 分派到合适的节点上。下面分别介绍。

Predicates

Predicates 是调度器算法的第一步,它用于从候选节点列表中过滤掉不符合条件的节点。通常情况下,Predicates 会根据诸如资源限制、亲和性、互斥等因素来确定哪些节点适合绑定 Pod。

Predicates 应该是轻量级和快速的,它们可能会在调度器算法的后续步骤中被多次调用。常见的 Predicates 如下:

  • PodFitsResources:调度器会过滤掉资源不足的节点,例如内存或 CPU 小于需求量的节点;
  • PodFitsHostPorts:调度器会过滤掉与 Pod 端口冲突的节点;
  • PodMatchNodeSelector:调度器会过滤掉无法满足 Pod 标签选择器的节点;
  • PodFitsHost:调度器会过滤掉不能满足 Pod 亲和性或互斥约束的节点。

Priorities

Priorities 是调度器算法的第二步,它用于从 Predicates 过滤后的候选节点列表中选择最优节点。根据优先级策略,调度器将从候选节点列表中选择某个节点将绑定 Pod。

Priorities 应该是相对较重的,因为它们通常仅在候选节点列表中选择前几个节点。常见的 Priorities 如下:

  • SelectorSpreadPriority:调度器会尽可能将 Pod 分散到不同的节点上,以降低节点出现故障的概率;
  • LeastRequestedPriority:调度器会选择可用资源最大的节点(也称为 best-fit);
  • SelectorPreferencePriority:调度器将依据先前指定的标签选择器来选择节点。

调度器的工作流程

根据上述分析,我们可以开始分析调度器的工作流程了。一个简单的调度器工作流程如下:

图中省略的部分是:k8s_scheduler_config,其实是 kube-system namespace 内的 kube-scheduler ConfigMap。ConfigMap 的内容主要包含调度器的工作配置和算法。

从上图可以看出,调度器的工作流程包含以下几个步骤:

  1. Pod 创建:一个 Pod 对象被创建,并被提交到 Kubernetes 集群中的 API server 中。
  2. 调度器监听:调度器会监听到 Pod 创建事件,并检查 Pod 是否具有可以马上绑定到节点上的节点。
  3. Predicates 运行:调度器启动 Predicates (多个)POS(Parallel Optimal Scheduling)算法,以过滤掉无法满足 Pod 要求的节点。
  4. Priorities 运行:从 Predicates 过滤后的候选节点列表中选择最优节点,通过 Priorities 策略将 Pod 绑定到选定的节点上。
  5. 节点绑定:调度器将调度决策写入 API server 中的 PodBindings 对象,以便 Kubernetes 后续将 Pod 绑定到节点上。
  6. Pod 启动:Pod 会被 Kubernetes API server 内部的控制器管理器分配到节点上,并启动相应的容器。

示例代码

下面是一些使用 Kubernetes Python 客户端库的示例代码,该库提供了从 Python 访问 Kubernetes API server 的功能。

-- -------------------- ---- -------
---- ---------- ------ ------- ------
------ ----

-------------------------

- ------------- --- ---
---- --------------- -- --
    ---- - ------------

- -- --- --
-- - ------------------
---- - ----------------------------------- --------------------
---------- -------- ------------ - -------------------

上述代码使用 YAML 文件定义 Pod,并将其提交到 Kubernetes API server。使用 Kubernetes Python 客户端库可以轻松地编写自定义调度器,并为 Kubernetes 添加一些自定义功能。

一些最佳实践

最后,我们还想分享一些最佳实践和设计约定,有助于将 Kubernetes 中的调度器优化到最佳状态。

资源请求和限制

当我们创建 Pod 时,我们应该明确地指定 Pod 的资源需求和限制。这将帮助调度器更好地使用可用资源,并将 Pod 分配到与其需求最匹配的节点上。

为了完成这项工作,我们可以使用 PodSpec 中的 resources 字段,例如:

-- -------------------- ---- -------
----------- --
----- ---
---------
  ----- -----
-----
  -----------
  - ----- -----
    ------ -----
    ----------
      -------
        ---- ---
        ------- -------
      ---------
        ---- ------
        ------- -------

上述 YAML 文件定义了一个名为 "nginx" 的 Pod,它要求 500m CPU 和 256Mi 内存,同时最多限制 1 CPU 和 512Mi 内存。

亲和性和互斥

Pod 在进行调度时,可以指定与某个或某个节点关联性(亲和性)或互斥性。这可以帮助我们使 Pod 与特定集群节点共生或排斥它们,并可以使用 Label 来指定关联规则。

例如:

-- -------------------- ---- -------
----------- --
----- ---
---------
  -------
    ---- -----
  ----- -----
-----
  ---------
    -------------
      -----------------------------------------------
        ------------------
        - -----------------
          - ---- ----------------------
            --------- --
            -------
            - -------
  -----------
    ------ -----
    ----- -----
    ------
    - -------------- --

示例文件指定在计划 Pod 时,调度器只会寻找具有标签 kubernetes.io/hostname=my-node 的节点。这通常是将特定类型的工作负载绑定到特定节点的一种方法,以使集群更轻松地管理和平衡。

总结

Kubernetes 调度器是 Kubernetes 集群中一个重要的组成部分。它可以帮助我们将容器部署到合适的节点上,以便在集群中最大化利用资源。本文对 Kubernetes 中调度器的工作流程进行了详细的介绍,并且分享了一些最佳实践和设计约定。同时,我们还提供了一些使用 Kubernetes Python 客户端库的示例代码。

Source: FunTeaLearn,Please indicate the source for reprints https://funteas.com/post/645d497c968c7c53b0fccb2c

Feed
back