文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

深入理解kubernetes监控原理

2024-12-01 16:05

关注

前言

承接上文,我们在基于Ubuntu 2204使用kubeadm部署了k8s集群,且基于helm部署了metrics-server.

然后我们可以很欢快的使用kubectl top命令查看node、pod的实时资源使用情况:如CPU、内存。

本文将介绍其数据链路和实现原理,同时会阐述k8s中的监控体系。

kubectl top

kubectl top是我们经常使用的基础命令,但是必须需要部署metrics-server组件,才能获取到监控值。

我们所使用的版本是1.24.3的最新版本,所以一定要部署metrics-server。

查看node的资源使用情况。

$ kubectl top node
NAME CPU(cores) CPU% MEMORY(bytes) MEMORY%
k8s-unode1 158m 7% 1814Mi 47%
k8s-unode2 50m 2% 874Mi 23%
k8s-unode3 51m 2% 943Mi 24%
k8s-unode4 45m 2% 905Mi 23%
$ kubectl top node k8s-unode1
NAME CPU(cores) CPU% MEMORY(bytes) MEMORY%
k8s-unode1 160m 8% 1811Mi 47%

查看pod的资源使用情况,--containers可以显示pod内所有的container。

$ kubectl top pod -n metrics-server
NAME CPU(cores) MEMORY(bytes)
metrics-server-56c6866684-w6n9b 5m 17Mi
$ kubectl top pod --containers -n metrics-server
POD NAME CPU(cores) MEMORY(bytes)
metrics-server-56c6866684-w6n9b metrics-server 5m 17Mi

指标的具体含义:

kubectl top pod 内存计算

每次启动 pod,都会有一个 pause 容器,既然是容器就一定有资源消耗(一般在 2-3M 的内存),cgroup 文件中,业务容器和 pause 容器都在同一个 pod的文件夹下。

但 cadvisor 在查询 pod 的内存使用量时,是先获取了 pod 下的container列表,再逐个获取container的内存占用,不过这里的 container 列表并没有包含 pause,因此最终 top pod 的结果也不包含 pause 容器。

pod 的内存使用量计算

kubectl top pod 得到的内存使用量,并不是cadvisor 中的container_memory_usage_bytes,而是container_memory_working_set_bytes,计算方式为:

container_memory_working_set_bytes是容器真实使用的内存量,也是limit限制时的 oom 判断依据。

kubectl top命令和 top 的差异和上边 一致,无法直接对比,同时,就算你对 pod 做了limit 限制,pod 内的 top 看到的内存和 cpu总量仍然是机器总量,并不是pod 可分配量。

实现原理

数据链路

k8s dashboard、kubectl top等都是通过apiserver获取监控数据,数据链路如下:

监控体系

在提出 metric api 的概念时,官方页提出了新的监控体系,监控资源被分为了2种:

kubelet

无论是废弃的heapster还是metric-server,都只是数据的中转和聚合;两者都是调用的kubelet的api接口获取的数据。kubelet代码中实际集成了采集指标的cAdvisor模块,可以通过kubelet暴露的10250端口获取监控数据。

kubelet虽然提供了 metric 接口,但实际监控逻辑由内置的cAdvisor模块负责。

cAdvisor

cAdvisor由谷歌开源,使用go语言开发。项目地址:https://github.com/google/cadvisor。

cadvisor不仅可以搜集一台机器上所有运行的容器信息,包括CPU使用情况、内存使用情况、网络吞吐量及文件系统使用情况,还提供基础查询界面和http接口,方便其他组件进行数据抓取。在K8S中集成在Kubelet里作为默认启动项,k8s官方标配。

cadvisor获取指标时实际调用的是 runc/libcontainer库,而libcontainer是对 cgroup文件 的封装,即 cadvsior也只是个转发者,它的数据来自于cgroup文件。

cgroup

cgroup文件中的值是监控数据的最终来源,如:

一般情况下,cgroup文件夹下的内容包括CPU、内存、磁盘、网络等信息。

device:设备控制权限
cpuset:分配指定的CPU和内存节点
cpu:控制CPU占用率
cpuacct:统计CPU使用情况
memory:限制内存的使用上限
freezer:冻结Cgroup中的进程
net_cls:配合(traffic controller)限制网络带宽
net_prio:设置进程的网络流量优先级
huge_tlb:限制HugeTLB的使用
pref_event:允许perf工具基于cgrgoup分组做性能监测

memory下的几个常用的指标含义:

memory.usage_in_bytes: 已使用的内存量(包含cache和buffer)字节,相当于linux的userd_mem
memory.limit_in_bytes: 限制的内存总量(字节),相当于linux的total_mem
memory.failcnt: 申请内存失败次数计数
memory.stat: 内存相关状态
memory.memsw.usage_in_bytes: 已使用内存和swap
memory.memsw.limit_in_bytes: 限制的内存和swap
memory.memsw.failcnt: 申请内存和swap失败次数计数
来源:今日头条内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯