CPU利用率
/proc/stat文件里包含系统cpu使用情况,2-8列对应的CPU消耗含义是用户态消耗(user)、用户态nice消耗(nice)、内核态消耗(sys)、空闲时间(idle)、等待IO消耗(iowait)、硬件中断消耗(hardirq)、软中断消耗(softirq)。(man proc)
1 2 3 4 5 $ cat /proc/stat cpu 2339504870 2641995 716723851 70316975284 7219566 328971 304057999 0 0 cpu0 211214357 275710 57674236 2778331292 3688175 10421 12279511 0 0 cpu1 140100049 278788 47142039 2857686940 180452 32028 14960093 0 0 ...
要计算t1~t2时间内系统的cpu利用率,需要在t1、t2时刻分别采集cpu使用信息
1 2 3 4 t1_all = t1(user + nice + sys + idle + iowait + hardirq + sortirq) t1_used = t1(user + nice + sys + iowait + hardirq + sortirq) t2_all = t2(user + nice + sys + idle + iowait + hardirq + sortirq t2_used = t2(user + nice + sys + iowait + hardirq + sortirq)
1 cpu_usage = (t2_used - t1_used) / (t2_all - t1_all)
进程CPU利用率
/proc/$pid/stat文件里包含某个进程的cpu使用信息,14、15、16、17列对应进程用户态消耗(user)、内核态消耗(sys)、用户态等待子进程的消耗(user_child)、内核态等待子进程的消耗(sys_child)。
1 2 3 4 5 6 7 $cat /proc/24076/stat 24076 (redis-server) S 1 24076 24076 0 -1 4202560 5755 147 0 0 1864 3298 0 0 20 0 3 0 70238536 159555584 5145 18446744073709551615 1 1 0 0 0 0 0 4097 17610 18446744073709551615 0 0 17 4 0 0 0 0 0 t1、t2时刻分别采集/proc/stat、/proc/$pid/stat,获取总的cpu消耗,以及进程的cpu消耗 t1_all = t1(user + nice + sys + idle + iowait + hardirq + sortirq) t1_pid = t1(user + sys + user_child + sys_child) t2_all = t2(user + nice + sys + idle + iowait + hardirq + sortirq) t2_pid = t2(user + sys + user_child + sys_child)
1 pid_cpu_usage = (t2_pid - t1_pid) / (t2_all - t1_all)
内存利用率
/proc/meminfo文件里包含系统内存使用信息 1 2 3 $ cat /proc/meminfo MemTotal: 198450624 kB MemFree: 184950332 kB
1 mem_usage = 1 - MemFree / MemTotal
系统load
/proc/uptime的前3列包含了最近1min、5min、15min系统的平均load(正在运行或等待IO的进程数,进程state为R或D)
1 2 $cat /proc/loadavg 0.02 0.09 0.08 1/2362 855
网卡流量信息
/proc/net/dev包含所有网卡的流量信息,第1、2、10、11列分别代表网卡当前接受字节数(recv_bytes)、接受包个数(recv_packets)、发送字节数(send_bytes)、发送个数(send_packets)。
1 2 3 4 5 6 $cat /proc/net/dev Inter-| Receive | Transmit face |bytes packets errs drop fifo frame compressed multicast|bytes packets errs drop fifo colls carrier compressed lo:25047448261 37947893 0 0 0 0 0 0 25047448261 37947893 0 0 0 0 0 0 eth0:2566932970457 7620547348 0 0 2 0 0 62732 728662220296 6145797287 0 0 0 0 0 0 eth1:2023304550582 7268848253 0 0 0 0 0 77924 742443231982 6129090809 0 0 0 0 0 0
t1~t2时间内的平均流量为
1 2 avg_recv_bytes = (t2_recv_bytes - t1_recv_bytes) / (t2 - t1) avg_send_bytes = (t2_send_bytes - t1_send_bytes) / (t2 - t1)
磁盘(文件系统)空间信息
通过statfs系统调用可获取当前文件系统的空间占用情况
1 2 3 4 5 6 7 8 struct statfs { long f_type; long f_bsize; long f_blocks; long f_bfree; long f_bavail; ... };
1 disk_usage = 1 - f_bfree / f_blocks
磁盘读写信息
/proc/diskstats包含磁盘的IO信息,第4-9列分别为当前磁盘读次数(read),磁盘读扇区数(read_sec)、磁盘读毫秒数(read_ms)、磁盘写次数(write)、磁盘写扇区数(write_sec)、磁盘写毫秒数(write_ms)。
1 2 3 4 5 $cat /proc/diskstats 8 4 sda4 3 0 12 8 0 0 0 0 0 8 8 8 5 sda5 87928 55284 2842138 17349 1230958 7932106 73380432 4931382 0 503343 4947504 8 16 sdb 393 35 3418 37 17 2 152 0 0 37 37 8 32 sdc 788 114 10690 10132 14550036 226568635 1929026928 623148463 0 4917530 623154797
t1~t2时间内磁盘平均读写次数、扇区数、IO利用率计算如下
1 2 3 4 5 avg_read = (t2_read - t1_read) / (t2 - t1) avg_read_sec = (t2_read_sec - t1_read_sec) / (t2 - t1) avg_write = (t2_write - t1_write) / (t2 - t1) avg_write_sec = (t2_write_sec - t1_write_sec) / (t2 - t1) io_util = (t2_read_ms + t2_write_ms - t1_read_ms - t1_write_ms) / (t2 - t1) (t1~t2时间段内IO的时间百分比)