文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

linux中perf有什么用

2023-06-25 13:51

关注

这篇文章主要为大家展示了“linux中perf有什么用”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“linux中perf有什么用”这篇文章吧。

perf是linux系统中提供的性能分析工具,它基于一个叫“Performance counters”的内核子系统实现,同时支持硬件(CPU、PMU(Performance Monitoring Unit))和软件(软件计数器、tracepoint)层面的性能分析。

perf中的事件

perf与其他性能调优工具一样,都是通过对监测对象进行采样,根据采样点的分布来推断整个程序的行为。通过perf list命令我们可以看到perf支持很多的采样事件,比如branch-misses、cpu-clock等等。perf中预定义的事件属于不同的类型,比如硬件产生的事件(cache 命中/分支miss)和软件产生的事件(context switch/page fault)等等。

tracepoint

tracepoint是linux内核中定义的一些hook,如果被开启,它们就会在执行到特定逻辑时被触发,方便其他工具获取系统内部的运行状态等信息,perf就是利用了tracepoint,它会记录和统计tracepoint的各个事件,生成分析报告。

使用方式

perf 工具的具体使用方式如下:

perf [--version] [--help] COMMAND [ARGS]

其中的COMMAND列表可以通过执行perf --help查看,下面列举几个常用的command。

perf stat

perf stat的作用是执行一个命令并收集其运行过程中的各个数据,它可以提供一个程序运行情况的总体概览。比如:

user@localhost:~$ perf stat hostnamelocalhost Performance counter stats for 'hostname':          0.313464      task-clock (msec)         #    0.481 CPUs utilized                           2      context-switches          #    0.006 M/sec                                   0      cpu-migrations            #    0.000 K/sec                                 153      page-faults               #    0.488 M/sec                             896,723      cycles                    #    2.861 GHz                               620,709      instructions              #    0.69  insn per cycle                    121,143      branches                  #  386.465 M/sec                               6,247      branch-misses             #    5.16% of all branches               0.000651441 seconds time elapsed

上面这个例子,通过perf stat运行了hostname命令,并将其运行过程中的一些指标汇总显示了出来,比如task-clock、context-switches等待。默认情况下,perf stat 会输出几个常用的事件的统计,比如:

task-clock-msecs:cpu 使用率context-switches:进程切换次数page-faults:发生缺页的次数cpu-migrations:表示进程运行过程中发生了多少次CPU迁移,即被调度器从一个CPU转移到另外一个CPU上运行cycles:处理器时钟,一条机器指令可能需要多个cyclesinstructions: 机器指令数目branches:遇到的分支指令数branch-misses是预测错误的分支指令数

除此之外,我们可以使用-e参数来指定我们感兴趣的事件,比如:

user@localhost:~$ perf stat -e cache-misses hostnamelocalhost Performance counter stats for 'hostname':          682      cache-misses                                                       0.000646676 seconds time elapsed

perf top

perf top的作用是实时地显示系统当前的性能统计信息。前面的perf stat用于对一个特定的程序进行分析,而某些时候我们可能并不知道是哪个程序影响了系统性能,这时候就可以用perf top来查找可疑的程序。比如:

Samples: 775  of event 'cpu-clock', Event count (approx.): 92931021Overhead  Shared Object       Symbol   8.93%  [kernel]            [k] vsnprintf   7.73%  perf                [.] rb_next   5.92%  [kernel]            [k] kallsyms_expand_symbol.clone.0   5.07%  [kernel]            [k] format_decode   4.59%  [kernel]            [k] number   3.40%  perf                [.] symbols__insert   3.03%  libslang.so.2.2.1   [.] SLtt_smart_puts

上面的例子显示perf统计了cpu-clock事件的数据,根据比例进行了排序。和perf stat一样,我们可以通过-e参数指定统计其他的事件,比如perf top -e context-switches可以查看进程切换最多的top N个进程。

perf record & perf report

perf record的作用和perf stat类似,它可以运行一个命令并生成统计信息,不过perf record不会将结果显示出来,而是将结果输出到文件中。perf record生成的文件可以用perf report来进行解析。

perf record还可以通过-g参数,在分析时生成calling graph,帮助定位更上层的逻辑分布。

其他

通过例子我们可以发现,perf的分析结果中的Symbol一列显示的都是c语言函数的名字。对于java来说,jit编译产生的函数就会直接显示在symbol里,而不是java的函数名,这时要定位问题就不是那么容易了,我们需要通过额外的手段将symbol和java程序的符号表对应起来,具体后续再讨论了。

以上是“linux中perf有什么用”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注编程网行业资讯频道!

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-人工智能
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯