前言
上次发了一篇文章,我使用脚本自动根据GPU温度调整服务器风扇转速
但是我实测之后,发现这个方法还是压不住我GPU的温度,暂时不清楚什么原因
所以我准备把GPU功耗压低
先看看gpu的功耗限制
nvidia-smi -q -d POWER
 
使用上面的命令会输出gpu的功耗的信息,如果出现找不到命令的情况先安装gpu驱动
chen@chen:~$ nvidia-smi -q -d POWER
==============NVSMI LOG==============
Timestamp                                 : Tue Jun 11 10:20:46 2024
Driver Version                            : 470.42.01
CUDA Version                              : 11.4
Attached GPUs                             : 2
GPU 00000000:01:00.0
    Power Readings
        Power Management                  : Supported
        Power Draw                        : 28.20 W
        Power Limit                       : 100.00 W
        Default Power Limit               : 149.00 W
        Enforced Power Limit              : 100.00 W
        Min Power Limit                   : 100.00 W
        Max Power Limit                   : 175.00 W
    Power Samples
        Duration                          : 119.17 sec
        Number of Samples                 : 119
        Max                               : 28.20 W
        Min                               : 27.97 W
        Avg                               : 28.16 W
GPU 00000000:02:00.0
    Power Readings
        Power Management                  : Supported
        Power Draw                        : 30.32 W
        Power Limit                       : 100.00 W
        Default Power Limit               : 149.00 W
        Enforced Power Limit              : 100.00 W
        Min Power Limit                   : 100.00 W
        Max Power Limit                   : 175.00 W
    Power Samples
        Duration                          : 119.16 sec
        Number of Samples                 : 119
        Max                               : 30.32 W
        Min                               : 30.08 W
        Avg                               : 30.23 W
 
来看看这张显卡的最低和最高功率限制多少
        Min Power Limit                   : 100.00 W
        Max Power Limit                   : 175.00 W 
我这张卡是两个核心的,所以会显示 GPU 00000000:01:00.0 和GPU 00000000:02:00.0
可以看到单个核心最低功率是100W,最高功率的175W
调整功率
sudo nvidia-smi -pl 100 
给两个核心都限制100W
chen@chen:~$ sudo nvidia-smi -pl 100
Power limit for GPU 00000000:01:00.0 was set to 100.00 W from 100.00 W.
Power limit for GPU 00000000:02:00.0 was set to 100.00 W from 100.00 W.
All done.
 
从输出来看,两个核心都已经调整为了100W功率