--- hide: - toc --- # 运维管理 运维管理是 IT 运维人员日常管理 IT 资源,处理工作的空间。 ![运维管理概览](../images/oam-overview.png) 在这里可以直观地了解当前集群、节点、CPU、GPU、vGPU 等资源的使用状况。 ## 常见术语 - GPU 分配率:统计当前集群内所有未完成的任务的 GPU 分配情况,统计请求的 GPU(Request)与总资源量(Total)之间的比例。 - GPU 利用率:统计当前集群中所有运行中的任务的实际资源利用情况,统计实际使用的 GPU(Usage)与总资源量(Total)之间的比例。