本帖最后由 999的demo 于 2024-3-25 22:49 编辑
3D虚拟机部署场景,需要提前准备好3D授权服务器镜像、HCI主机显卡驱动、3D虚拟机显卡驱动 授权服务器版本 目前授权服务器分为旧授权服务器和DLS授权服务器(旧授权服务器将在2023年7月EOL,届时NVIDIA将不提供任何技术支持,也不支持在此服务器增加或缩减授权) 因此目前在部署时授权服务器都采用新的DLS服务器来进行部署 注意事项: 11.1的显卡驱动不支持DLS部署,使用Grid11.1驱动时只能使用旧授权服务器授权 从Grid13.2之后,不再支持Wind7;若必须使用Win7 3D桌面,则只能使用Grid11.1驱动 不同VDI版本虚拟机/HCI安装的显卡驱动 从VDI5.5.2版本开始,对于3D交付项目优先使用Grid 13.2驱动,NVIDIA授权服务器优先采用新的DLS服务器
GPU HCI需要开通的授权 如果只是显卡直通给虚拟机,则只需要开通HCI的aGPU授权就可以
如果使用vGPU的切分场景,则需要同事开通aGPU的授权和英伟达vGPU授权(包括vCS、vDWS、EDU) 即需要给3D授权服务器授权(下载3D授权服务器的token,然后去英伟达申请授权) vCS: 面向AI和科学计算场景(vCS不支持Windows虚拟机,最小切割粒度为4G,最大为32G) vDWS: 面向工作站的用户,用于专业图形和计算场景,会发挥出GPU的全部实力 EDU: 面向教育场景销售的VDWS授权,实际功能与vDWS一致,只是价格低一点 VPC: 面向普通办公场景,可配置的单桌面显存上限为2GB vApp: 虚拟应用/共享桌面场景 注意事项 l 超融合平台上已经分配显卡的虚拟机不再支持热迁移 l 单台服务器禁止使用两个不同型号的显卡,同集群的不同主机可以支持使用不同型号的GPU l 当A、B两张显卡插在紧邻着的两个PCIE插槽时,如果B显卡存在核心损坏时,显卡B的核心会被识别为显卡A的,因此需要及时更换显卡 l 并不是所有的显卡都支持vGPU,对于不支持vGPU的显卡可以使用直通模式 l 不论是直通场景还是vGPU场景,虚拟机必须安装和HCI平台对应版本的英伟达显卡驱动(不过对于直通场景的显卡驱动需要从英伟达官网下载 官方驱动 | NVIDIA)
vGPU切分相关知识 在vGPU场景下,显卡的显存资源师分配且独占的,显卡的计算资源会依据调度器进行调度,该版本支持三种调度器:抢占、等分、固定配比 抢占(Best Eddort):当多虚拟机运行在该显卡时,会根据工作负载情况抢占算力资源; 等分(Equal Share):当多虚拟机运行在该显卡时,会均分算力资源 固定配比(FixedShare):当多虚拟机运行在该显卡时,会依据虚拟机所配置的显存比例来分配算力资源 显卡分配的两种模式 密度模式——适用于存在多种虚拟显卡类型虚拟机经常开关机的场景 配置了相同型号虚拟显卡的虚拟机会优先在同一GPU核心上运行 以空闲出更多核心供其他虚拟显卡类型虚拟机运行 性能模式——适用于大部分虚拟机为相同虚拟显卡类型的场景 3D虚拟机优先选择显存空闲最大的GPU核心运行,确保已开机的虚拟机都能得到最大的GPU核心算力 显卡切分 T4指的是虚拟显卡对应的物理显卡型号 2指的是该虚拟显卡可以使用显存的上限为2GB B/Q/C指的是该虚拟显卡的显卡类型 B(Basic)基本级别显卡,代表性能为基础或入门级别的显卡;适用于一般办公、网页浏览等简单应用,能够满足一般的图形处理要求 Q(Quality)品质级别显卡,代表性能为均衡和优质的显卡;适用于一般的游戏、轻度视频编辑等需求 C(Customized)定制级别显卡,代表着性能较高或者专业级别的显卡;适用于高端游戏、专业设计软件等对图形性能要求高的应用 |