虚拟化

S7150x2 实测失败

liaoya · 10月15日 · 2020年 · · · · · ·

测试环境

服务器:DELL R720
CPU:E5-2670 V2
GPU:AMD S7150x2
OS:ESXI 6.0、ESXI 6.5、ESXI 6.7
Driver:amdgpuv-1.05-1OEM.650.0.0.4598673.x86_64-CL1424097
technology:共享GPU模式
主板BIOS已经开启VT-D和SR-IOV

问题

按照https://drivers.amd.com/relnotes/amd_mxgpu_deploymentguide_vmware.pdf中的,《ESXi MxGPU Setup》的方式进行设置,尝试了ESXI 6.0和6.5,按照方法设置后,使用 sh mxgpuinstall.sh -c 脚本查看,均提示重启系统(设置或变更配置后已重启过系统)。 在ESXI中,也无法看见VGPU被划分。使用ESXI6.5进行sr-iov设置,重启后,也无法成功。

原因分析

1:R720服务器不兼容,需要使用R730服务器,配合V4 CPU测试(未验证:V3不支持AMD)。
S7150x2搭配服务器为:DELL R730或HP DL380 G9 。搜索未找到搭配R720使用案例。
R720支持的GPU是Nvidia(M2090 / M2075 / M2070Q / K20 / K2000)以及AMD Fire V7800P。
R730支持的GPU是Quadro P5000,Tesla M4,FirePro S7150X2,Tesla K20,Pascal GP100,FIrePro S7000,FirePro S7150,FirePro S9050,Grid K2A,Intel 5110P,FirePro S9100,Tesla K20X,Tesla M10,Tesla K80M Duo,Tesla P4,GeForce Titan X, Tesla P40,Grid K2,Intel Phi 7120P,Nvidia M60,Tesla K20C,Quadro K1200和QUadro M5000。
https://downloads.dell.com/manuals/all-products/esuprt_ser_stor_net/esuprt_poweredge/poweredge-r720_reference-guide_en-us.pdf
https://i.dell.com/sites/doccontent/shared-content/data-sheets/en/Documents/Dell-PowerEdge-R730-and-R730xd-Technical-Guide-v1-7.pdf?dgc=SM&cid=376139&lid=spr3645932729&linkId=98627304
https://www.vmware.com/resources/compatibility/search.php?deviceCategory=vdga&details=1&partner=23&keyword=730&page=1&display_interval=10&sortColumn=Partner&sortOrder=Asc
https://www.vmware.com/resources/compatibility/detail.php?deviceCategory=vdga&productid=33815&deviceCategory=vdga&details=1&keyword=33815&page=1&display_interval=10&sortColumn=Partner&sortOrder=Asc

2:S7150x2 firmware 固件版本有问题。
参考:https://communities.vmware.com/message/2719066
https://support.hpe.com/hpsc/swd/public/detail?swItemId=MTX-7b68dbf88aac4b0d91bf52e49d

未尝试方法

1:换用ovirt或PVE平台测试,他们都是基于KVM虚拟化方案。
参考:https://blog.csdn.net/qq_18204953/article/details/100156361
https://pve.proxmox.com/wiki/MxGPU_with_AMD_S7150_under_Proxmox_VE_5.x
https://forum.proxmox.com/threads/amd-s7150-mxgpu-with-proxmox-ve-5-x.50464/
https://github.com/GPUOpen-LibrariesAndSDKs/RapidFire_SDK
2:使用XenServer或其他平台测试。
未找到相关案例

本次测试参考

https://www.amd.com/zh-hans/support/professional-graphics/firepro/firepro-s-series/firepro-s7150-x2
https://drivers.amd.com/relnotes/amd_mxgpu_deploymentguide_vmware.pdf
https://docs.vmware.com/cn/VMware-Horizon/2006/virtual-desktops/GUID-98149DA9-4B05-4DEB-863B-E722A6535B55.html
https://www.vmware.com/resources/compatibility/detail.php?deviceCategory=sptg&productid=40749
https://www.vmware.com/resources/compatibility/detail.php?deviceCategory=sptg&productid=40750


2 条回应
  1. 60682020-10-20 · 23:49

    随便买的垃圾双路C612 主板都可使用S7150X2 我买了一个淘宝所谓的富士康C612 还有个超微X10dai 双路 CPU:双路2680v3 都可以完美划分切片,就是第一块主板经常重启掉配置第二台没问题 。不知道你的怎么回事

    • liaoya2020-11-18 · 18:24

      可能因为CPU是V2系列,不是V3。