关于UNIX：”real”、”user”和”sys”在时间输出(1)中是什么意思？

What do 'real', 'user' and 'sys' mean in the output of time(1)?

1
2
3
4
5

$ time foo
real 0m0.003s
user 0m0.000s
sys 0m0.004s
$

"real"、"user"和"sys"在时间输出中是什么意思？

当基准测试我的应用程序时，哪一个是有意义的？

相关讨论

实时、用户和系统进程时间统计好的。

其中一件事与另一件事不同。real是指实际运行的时间；user和sys是指仅由进程使用的CPU时间。好的。

真正的是挂钟时间-从开始到结束的通话时间。这是所有经过的时间，包括其他进程使用的时间片和进程阻塞的时间(例如，如果它正在等待I/O完成)。好的。
用户是进程内用户模式代码(内核外)所花费的CPU时间量。这只是在执行进程时使用的实际CPU时间。其他进程和阻塞的进程花费的时间不计入此数字。好的。
sys是进程中在内核中花费的CPU时间量。这意味着在内核内执行系统调用所花费的CPU时间，而不是在用户空间中运行的库代码。与"用户"类似，这只是进程使用的CPU时间。有关内核模式(也称为"监督"模式)和系统调用机制的简要说明，请参阅下面的内容。好的。

User+Sys将告诉您进程实际使用的CPU时间。请注意，这是跨所有CPU的，因此，如果进程有多个线程(并且此进程在一台具有多个处理器的计算机上运行)，它可能会超过Real报告的壁时钟时间(通常会发生)。注意，在输出中，这些数字包括所有子进程(及其后代)的User和Sys时间，以及可以收集它们的时间，例如wait(2)或waitpid(2)，尽管底层系统调用分别返回进程及其子进程的统计信息。好的。

time (1)报告的统计数据来源好的。

time报告的统计数据是从各种系统调用中收集的。"用户"和"系统"来自wait (2)(posix)或times (2)(posix)，具体取决于特定的系统。"real'是从从gettimeofday (2)调用收集的开始和结束时间计算的。根据系统的版本，time还可以收集各种其他统计数据，例如上下文切换的数量。好的。

在多处理器机器上，多线程进程或进程分叉子进程的运行时间可能小于总CPU时间，因为不同的线程或进程可能并行运行。此外，报告的时间统计数据来自不同的来源，因此，对于非常短的运行任务记录的时间可能会受到舍入误差的影响，如原始海报给出的示例所示。好的。

关于内核与用户模式的简要介绍好的。

在Unix或任何受保护的内存操作系统上，"内核"或"管理器"模式指的是CPU可以操作的特权模式。某些可能影响安全性或稳定性的特权操作只能在CPU在此模式下运行时执行；这些操作对应用程序代码不可用。这种操作的一个例子可能是操纵MMU以访问另一个进程的地址空间。通常，用户模式代码不能这样做(有充分的理由)，尽管它可以从内核请求共享内存，这可以由多个进程读取或写入。在这种情况下，共享内存是通过安全机制从内核显式地请求的，并且两个进程都必须显式地附加到它才能使用它。好的。

特权模式通常被称为"内核"模式，因为内核由在此模式下运行的CPU执行。为了切换到内核模式，您必须发出一个特定的指令(通常称为陷阱)，该指令将CPU切换到内核模式下运行，并从跳转表中保存的特定位置运行代码。出于安全原因，您不能切换到内核模式并执行任意代码-陷阱是通过地址表管理的，除非CPU在管理模式下运行，否则无法写入地址表。您使用一个显式的陷阱编号进行陷阱，地址在跳转表中查找；内核具有有限数量的受控入口点。好的。

C库中的"系统"调用(特别是手册第2节中描述的那些)有一个用户模式组件，这是您从C程序实际调用的。在后台，它们可能会向内核发出一个或多个系统调用，以执行特定的服务(如I/O)，但它们仍然有代码以用户模式运行。如果需要，也可以直接从任何用户空间代码向内核模式发出陷阱，尽管您可能需要编写一段汇编语言来正确设置调用的寄存器。在这里可以找到描述Linux内核提供的系统调用和设置寄存器的约定的页面。好的。

有关"sys"的详细信息好的。

您的代码在用户模式下不能做一些事情，比如分配内存或访问硬件(HDD、网络等)。这些都是在内核的监督下进行的，只有它才能做到。您执行的一些操作(如malloc或ocx1〔1〕或fwrite将调用这些内核函数，然后这些操作将计为'sys'时间。不幸的是，这并不像"每一个对malloc的呼叫都会被计入‘sys’时间"那么简单。对malloc的调用将对它自己进行一些处理(仍然计算在"用户"时间内)，然后在调用内核中的函数的过程中的某个地方(计算在"系统"时间内)。从内核调用返回后，"用户"中会有更多的时间，然后malloc将返回到您的代码。至于什么时候发生了切换，以及在内核模式下花了多少钱…你不能说。这取决于库的实现。另外，其他看似无辜的函数也可能在后台使用malloc等类似函数，这在"sys"中会有一些时间。好的。好啊。

相关讨论

子进程所花费的时间是否计入real/sys？
@Ron——根据Linux手册页，它将"c"时间和处理时间聚合在一起，所以我认为是这样的。但是，父时间和子时间可与Times(2)调用分开使用。我猜Solaris/Sysv版本的时间(1)也有类似的功能。
@Ron我刚刚编辑了答案：子进程及其子进程所花费的时间只有在wait(2)或waitpid(2)可以收集到时间，并递归地收集到子进程时才算。这意味着子进程必须已终止。例如，比较time sh -c 'foo & sleep 1'和time sh -c 'foo & sleep 2'，其中foo是一个CPU时间介于1到2秒之间的命令。前者输出大约0。
用户+系统允许您测量进程的CPU使用率。您可以使用它来测试性能。这对于多线程代码尤其有用，因为多个CPU核心可能正在处理一个计算。
不过，主题上并不完全正确：running" ime"很有趣-它提供了更多详细信息：(请原谅注释中格式错误)：$time ps pid tty time cmd 9437 pts/19 00:00:00 bash 11459 pts/19 00:00:00:00 ps real 0m0.025s user 0m0.004s sys 0m0.018s$ ime ps pid tty time cmd 9437 pts/19 00:00:00 bash 11461 pts/19 00:00:00:00时间11462 pts/19 00:00:00:00 ps 0.00用户0.01系统0:00.02已用95%CPU(0AVGText+0AVGData 2160MaxResident)k 0输入+0输出(0Major+103minor)页面故障0交换$
(上一条评论中的字符用完了，所以)：更详细吗？使用性能[1]、[2]。[1]perf.wiki.kernel.org/index.php/main_page[2]brendangregg.com/perf.html
有没有一个简单的方法来找出"实时"时间是如何花费的？比如，在网络I/O上的时间比在磁盘I/O上的时间多吗？
@Gunnar的"实时"时间可以用在其他进程上，因此无法使用这些调用来确定计算机在做什么。您可以在大多数UNIX系统上使用进程记帐系统获取统计信息，这可能会告诉您有用的信息。top(1)通过/dev/kmem通过内核数据结构获取数据。
我发现有时候用户+系统不等于实时的。什么会导致这种情况？还有，这对GPU计算有何概括？
@文章详细讨论了用户、系统和现实的关系。据我所知，进程统计中不计算GPU时间，因为对GPU的调用将阻塞进程(强制上下文切换)或不阻塞进程，在这种情况下，进程将继续，系统将测量进程使用的CPU时间。您将需要特定于GPU的基准测试工具来衡量流程使用了多少GPU时间。
很好。你从哪里得到这些细节的？
其中大部分都在时间手册(1)中。其余的我从大学的操作系统课程中学到的。有些书(如巴赫或史蒂文斯)涵盖了这一材料。

为了进一步讨论这个公认的答案，我只想提供另一个原因，为什么real≠user＋sys。

请记住，real表示实际运行时间，而user和sys值表示CPU执行时间。因此，在多核系统中，user和/或sys时间(及其总和)实际上可以超过实时。例如，在运行Java类应用程序时，我得到了一组值：

1
2
3

real 1m47.363s
user 2m41.318s
sys 0m4.013s

相关讨论

我一直在想这件事。因为我知道我的程序是单线程的，所以用户和实时之间的区别必须是虚拟机开销，对吗？
不一定；Solaris机器上的Sun JVM以及Mac OS X上的Apple JVM甚至在单线程应用程序中也使用多个内核。如果你做了一个Java进程的示例，你会发现垃圾收集之类的东西在单独的线程上运行(还有一些其他的东西，我记不起来了)。不过，我不知道您是否真的想称之为"虚拟机开销"。
@Quantum7-不，不一定。看上面我的帖子。real是经过的时间，user和sys是从进程实际使用的CPU时间中累积的时间片统计信息。
我想现在投票的数量已经给了你足够的声望：D.那么你认为real超过user和sys的总数怎么样？线程上下文切换等操作系统开销可能是多少？
只有当您有一个实际连续运行的多线程应用程序(即，由于锁)时，上下文切换才会增加更多的运行时。一个单线程应用程序(真正的单线程应用程序，JVM并不像我们上面看到的那样)也会给出类似的结果。
另一个潜在的问题可能是I/O：如果您的应用程序在等待接收文件或流时花费了大量时间，那么显然，实时时间将大大超过用户/sys时间，因为在等待访问文件或类似文件时不使用CPU时间。
我很想知道为什么人们有时会对这个答案投反对票。有什么问题吗？
@Muhammadgelbana-如果应用程序因任何原因被阻止执行，就会发生这种情况。例如，如果它正在等待I/O、IPC或套接字连接，它将处于空闲状态，不会累积任何CPU时间，直到阻塞调用返回。
我看到了这个GC输出。直观地说real=usr+sys，但情况并非总是如此。这里还回答了以下问题：unix.stackexchange.com/questions/40694/&hellip；
哇，这个应用程序看起来真的很bug，看看执行时间，你一定有扫描仪在那里呢？
@穆罕默德格尔巴纳，这不一定是开销。当计算机被计时器中断击中时，它将决定切换到一些守护进程以使其保持运行，x11使窗口保持平滑，然后在不到一秒钟的时间内返回到进程。大部分时间将不会是开销，但仍然是花时间。appx<1%的损失时间将是来自其他进程的"sys"时间，因此这将是操作系统开销，比如上下文切换，它计算的是正在运行的进程的实际值，而不是用户/sys。然而，大多数(real-(user+sys))将是其他程序的"用户"时间。

？实数：从开始到结束运行过程所花费的实际时间，好像是由一个带秒表的人来测量的。

？用户：计算期间所有CPU花费的累计时间

？sys：所有CPU在与系统相关的任务(如内存分配)期间所花费的累计时间。

Notice that sometimes user + sys might be greater than real, as
multiple processors may work in parallel.

相关讨论

real显示流程的总周转时间；当用户显示用户定义指令的执行时间时而sys是执行系统调用的时间！

实时还包括等待时间(I/O等的等待时间)

最小可运行POSIX C示例

为了使事情更具体，我想用一些最小的C测试程序来举例说明time的一些极端情况。

所有程序都可以编译和运行：

1 2	gcc -ggdb3 -o main.out -pthread -std=c99 -pedantic-errors -Wall -Wextra main.c time ./main.out

并在Ubuntu 18.10、GCC 8.2.0、Glibc 2.28、Linux内核4.18、ThinkPad P51笔记本电脑、Intel Core i7-7820HQ CPU(4核/8线程)、2x Samsung M471A2K43BB1-CRC RAM(2x 16GiB)中进行了测试。

睡觉

非忙碌睡眠在user或sys中都不起作用，只有real起作用。

例如，一个睡眠一秒钟的程序：

1
2
3
4
5
6
7
8

#define _XOPEN_SOURCE 700
#include <stdlib.h>
#include <unistd.h>

int main(void) {
sleep(1);
return EXIT_SUCCESS;
}

Github上游。

输出如下：

1
2
3

real 0m1.003s
user 0m0.001s
sys 0m0.003s

同样适用于在IO可用时被阻止的程序。

例如，以下程序等待用户输入字符并按Enter键：

1
2
3
4
5
6
7
8

#include <stdio.h>
#include <stdlib.h>

int main(void) {
printf("%c
", getchar());
return EXIT_SUCCESS;
}

Github上游。

如果你想要一秒钟的时间，就像睡眠的例子一样输出如下：

1
2
3

real 0m1.003s
user 0m0.001s
sys 0m0.003s

多线程

下面的示例对nthreads线程执行无用CPU繁重工作的niters迭代：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65

#define _XOPEN_SOURCE 700
#include
#include <inttypes.h>
#include <pthread.h>
#include <stdint.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>

uint64_t niters;

void* my_thread(void *arg) {
uint64_t *argument, i, result;
argument = (uint64_t *)arg;
result = *argument;
for (i = 0; i < niters; ++i) {
result = (result * result) - (3 * result) + 1;
}
*argument = result;
return NULL;
}

int main(int argc, char **argv) {
size_t nthreads;
pthread_t *threads;
uint64_t rc, i, *thread_args;

/* CLI args. */
if (argc > 1) {
niters = strtoll(argv[1], NULL, 0);
} else {
niters = 1000000000;
}
if (argc > 2) {
nthreads = strtoll(argv[2], NULL, 0);
} else {
nthreads = 1;
}
threads = malloc(nthreads * sizeof(*threads));
thread_args = malloc(nthreads * sizeof(*thread_args));

/* Create all threads */
for (i = 0; i < nthreads; ++i) {
thread_args[i] = i;
rc = pthread_create(
&threads[i],
NULL,
my_thread,
(void*)&thread_args[i]
);
assert(rc == 0);
}

/* Wait for all threads to complete */
for (i = 0; i < nthreads; ++i) {
rc = pthread_join(threads[i], NULL);
assert(rc == 0);
printf("%" PRIu64" %" PRIu64"
", i, thread_args[i]);
}

free(threads);
free(thread_args);
return EXIT_SUCCESS;
}

Github上游+绘图代码。

然后，我们将wall、user和sys绘制为我的8个超线程CPU上固定10^10次迭代的线程数的函数：

enter image description here

从图中我们可以看到：

对于CPU密集型单核应用程序，wall和user大致相同
对于2个内核，用户大约有2倍的墙，这意味着用户时间在所有线程中都计算在内。
用户基本上增加了一倍，而墙保持不变。
这将继续多达8个线程，这与我计算机中的多个超线程匹配。
8点之后，Wall也开始增加，因为我们没有额外的CPU来在给定的时间内完成更多的工作！
在这一点上，这一比率达到了顶峰。

系统与sendfile的繁重工作

我能想到的最重的系统工作负载是使用sendfile，它在内核空间上执行文件复制操作：以一种健全、安全和高效的方式复制文件。

所以我认为在内核memcpy中，这将是一个CPU密集型操作。

首先，我用以下方法初始化一个10gib的大型随机文件：

1	dd if=/dev/urandom of=sendfile.in.tmp bs=1K count=10M

然后运行代码：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33

#define _GNU_SOURCE
#include
#include <fcntl.h>
#include <stdlib.h>
#include <sys/sendfile.h>
#include <sys/stat.h>
#include <sys/types.h>
#include <unistd.h>

int main(int argc, char **argv) {
char *source_path, *dest_path;
int source, dest;
struct stat stat_source;
if (argc > 1) {
source_path = argv[1];
} else {
source_path ="sendfile.in.tmp";
}
if (argc > 2) {
dest_path = argv[2];
} else {
dest_path ="sendfile.out.tmp";
}
source = open(source_path, O_RDONLY);
assert(source != -1);
dest = open(dest_path, O_WRONLY | O_CREAT | O_TRUNC, S_IRUSR | S_IWUSR);
assert(dest != -1);
assert(fstat(source, &stat_source) != -1);
assert(sendfile(dest, source, 0, stat_source.st_size) != -1);
assert(close(source) != -1);
assert(close(dest) != -1);
return EXIT_SUCCESS;
}

Github上游。

它基本上提供了预期的系统时间：

1
2
3

real 0m2.175s
user 0m0.001s
sys 0m1.476s

我还想知道time是否能区分不同进程的系统调用，因此我尝试：

1 2	time ./sendfile.out sendfile.in1.tmp sendfile.out1.tmp & time ./sendfile.out sendfile.in2.tmp sendfile.out2.tmp &

结果是：

1
2
3
4
5
6
7

real 0m3.651s
user 0m0.000s
sys 0m1.516s

real 0m4.948s
user 0m0.000s
sys 0m1.562s

两个进程的sys时间与单个进程的大致相同，但wall时间更大，因为进程很可能在竞争磁盘读取访问。

因此，它似乎确实解释了哪个进程启动了一个给定的内核工作。

bash源代码

当你只在Ubuntu上执行time 操作时，它使用bash关键字，如下所示：

type time

输出：

1	time is a shell keyword

因此，我们在bash 4.19源代码中为输出字符串添加grep源代码：

1	git grep '"user\b'

这导致我们执行"命令c"函数time_command，它使用：

gettimeofday()和getrusage()，如果两者都可用
times()否则

所有这些都是Linux系统调用和POSIX函数。

GNU coreutils源代码

如果我们称之为：

1	/usr/bin/time

然后使用gnu coreutils实现。

这一个有点复杂，但相关的来源似乎在resuse.c，它做到了：

非posix bsd wait3呼叫(如果可用)
times和gettimeofday否则