计算linux的性能数据

CPU利用率

/proc/stat文件里包含系统cpu使用情况,2-8列对应的CPU消耗含义是用户态消耗(user)、用户态nice消耗(nice)、内核态消耗(sys)、空闲时间(idle)、等待IO消耗(iowait)、硬件中断消耗(hardirq)、软中断消耗(softirq)。(man proc)

1
2
3
4
5
$ cat /proc/stat
cpu 2339504870 2641995 716723851 70316975284 7219566 328971 304057999 0 0
cpu0 211214357 275710 57674236 2778331292 3688175 10421 12279511 0 0
cpu1 140100049 278788 47142039 2857686940 180452 32028 14960093 0 0
...

要计算t1~t2时间内系统的cpu利用率,需要在t1、t2时刻分别采集cpu使用信息

1
2
3
4
t1_all = t1(user + nice + sys + idle + iowait + hardirq + sortirq)
t1_used = t1(user + nice + sys + iowait + hardirq + sortirq)
t2_all = t2(user + nice + sys + idle + iowait + hardirq + sortirq
t2_used = t2(user + nice + sys + iowait + hardirq + sortirq)
1
cpu_usage = (t2_used - t1_used) / (t2_all - t1_all)

进程CPU利用率

/proc/$pid/stat文件里包含某个进程的cpu使用信息,14、15、16、17列对应进程用户态消耗(user)、内核态消耗(sys)、用户态等待子进程的消耗(user_child)、内核态等待子进程的消耗(sys_child)。

1
2
3
4
5
6
7
$cat /proc/24076/stat
24076 (redis-server) S 1 24076 24076 0 -1 4202560 5755 147 0 0 1864 3298 0 0 20 0 3 0 70238536 159555584 5145 18446744073709551615 1 1 0 0 0 0 0 4097 17610 18446744073709551615 0 0 17 4 0 0 0 0 0
t1、t2时刻分别采集/proc/stat、/proc/$pid/stat,获取总的cpu消耗,以及进程的cpu消耗
t1_all = t1(user + nice + sys + idle + iowait + hardirq + sortirq)
t1_pid = t1(user + sys + user_child + sys_child)
t2_all = t2(user + nice + sys + idle + iowait + hardirq + sortirq)
t2_pid = t2(user + sys + user_child + sys_child)
1
pid_cpu_usage = (t2_pid - t1_pid) / (t2_all - t1_all)

内存利用率

/proc/meminfo文件里包含系统内存使用信息

1
2
3
$ cat /proc/meminfo
MemTotal: 198450624 kB
MemFree: 184950332 kB

1
mem_usage = 1 - MemFree / MemTotal

系统load

/proc/uptime的前3列包含了最近1min、5min、15min系统的平均load(正在运行或等待IO的进程数,进程state为R或D)

1
2
$cat /proc/loadavg
0.02 0.09 0.08 1/2362 855

网卡流量信息

/proc/net/dev包含所有网卡的流量信息,第1、2、10、11列分别代表网卡当前接受字节数(recv_bytes)、接受包个数(recv_packets)、发送字节数(send_bytes)、发送个数(send_packets)。

1
2
3
4
5
6
$cat /proc/net/dev
Inter-| Receive | Transmit
face |bytes packets errs drop fifo frame compressed multicast|bytes packets errs drop fifo colls carrier compressed
lo:25047448261 37947893 0 0 0 0 0 0 25047448261 37947893 0 0 0 0 0 0
eth0:2566932970457 7620547348 0 0 2 0 0 62732 728662220296 6145797287 0 0 0 0 0 0
eth1:2023304550582 7268848253 0 0 0 0 0 77924 742443231982 6129090809 0 0 0 0 0 0

t1~t2时间内的平均流量为

1
2
avg_recv_bytes = (t2_recv_bytes - t1_recv_bytes) / (t2 - t1)
avg_send_bytes = (t2_send_bytes - t1_send_bytes) / (t2 - t1)

磁盘(文件系统)空间信息

通过statfs系统调用可获取当前文件系统的空间占用情况

1
2
3
4
5
6
7
8
struct statfs {
long f_type; /* type of file system (see below) */
long f_bsize; /* optimal transfer block size */
long f_blocks; /* total data blocks in file system */
long f_bfree; /* free blocks in fs */
long f_bavail; /* free blocks avail to non-superuser */
...
};
1
disk_usage = 1 - f_bfree / f_blocks

磁盘读写信息

/proc/diskstats包含磁盘的IO信息,第4-9列分别为当前磁盘读次数(read),磁盘读扇区数(read_sec)、磁盘读毫秒数(read_ms)、磁盘写次数(write)、磁盘写扇区数(write_sec)、磁盘写毫秒数(write_ms)。

1
2
3
4
5
$cat /proc/diskstats
8 4 sda4 3 0 12 8 0 0 0 0 0 8 8
8 5 sda5 87928 55284 2842138 17349 1230958 7932106 73380432 4931382 0 503343 4947504
8 16 sdb 393 35 3418 37 17 2 152 0 0 37 37
8 32 sdc 788 114 10690 10132 14550036 226568635 1929026928 623148463 0 4917530 623154797

t1~t2时间内磁盘平均读写次数、扇区数、IO利用率计算如下

1
2
3
4
5
avg_read = (t2_read - t1_read) / (t2 - t1)
avg_read_sec = (t2_read_sec - t1_read_sec) / (t2 - t1)
avg_write = (t2_write - t1_write) / (t2 - t1)
avg_write_sec = (t2_write_sec - t1_write_sec) / (t2 - t1)
io_util = (t2_read_ms + t2_write_ms - t1_read_ms - t1_write_ms) / (t2 - t1) (t1~t2时间段内IO的时间百分比)