如何部署GPU满足服务器工作负载需求

 我来答
上海罗望
2020-07-13
知道答主
回答量:65
采纳率:0%
帮助的人:4.4万
展开全部

选择GPU服务器时首先要考虑业务需求来选择适合的GPU型号。在HPC高性能计算中还需要根据精度来选择,比如有的高性能计算需要双精度,这时如果使用P40或者P4就不合适,只能使用V100或者P100;同时也会对显存容量有要求,比如石油或石化勘探类的计算应用对显存要求比较高;还有些对总线标准有要求,因此选择GPU型号要先看业务需求。

GPU服务器人工智能领域的应用也比较多。在教学场景中,对GPU虚拟化的要求比较高。根据课堂人数,一个老师可能需要将GPU服务器虚拟出30甚至60个虚拟GPU,因此批量Training对GPU要求比较高,通常用V100做GPU的训练。模型训练完之后需要进行推理,因此推理一般会使用P4或者T4,少部分情况也会用V100。

综上所述,选择服务器时不仅需要考虑业务需求,还要考虑性能指标,比如精度、显存类型、显存容量以及功耗等,同时也会有一些服务器是需要水冷、降噪或者对温度、移动性等等方面有特殊的要求,就需要特殊定制的服务器。

欢迎了解更多:网页链接

已赞过 已踩过<
你对这个回答的评价是?
评论 收起

2024-11-14 广告
深圳市响河测控技术有限公司,坐落于电力电子产业密集的珠三角地区--广东深圳,是国内外前列的电力电子测试设备研发制造商,致力于为电力电子、科研提供高可靠性、高精度的电子测试设备。响河测控技术起源于航天航空产业,具备雄厚的技术研发力量及对高精度... 点击进入详情页
本回答由提供
俊下雕5121
推荐于2016-07-21 · 超过73用户采纳过TA的回答
知道答主
回答量:125
采纳率:0%
帮助的人:160万
展开全部
服务器负载,如大数据分析,对数据的可视化和演示功能需求更高,以展示更复杂数据。服务器也需要更多图形处理能力来满足现在虚拟化后的终端任务需求。 目前为止,多数服务器厂商忽视了图形需求,因为传统的数据库或文件及AD服务器等工作负载并不需要这样的演绎和可视功能。系统设计师选择放弃GPU以满足降低服务器成本和最小化系统能耗需求。 但是随着虚拟化时代到来,以及对多媒体和可视化工具需求的提升,促使业务部门重新考虑服务器的图形显示硬件。随着服务器技术的发展,厂商开始考虑提供硬件直接集成GPU的服务器。 在部署高性能GPU之前,一定要先规划和测试,因为服务器和PC、工作站不同,没有提供插槽空间和电源线。 高性能GPU扮演的角色 服务器中的GPU扮演的角色和客户端计算机中一样:GPU把应用的图形处理指令从主处理器中解放出来。该过程释放了主处理器资源用于其它任务并在硬件上执行应用的图形处理指令,满足我们现在对更高级别精致的、栩栩如生的渲染、视频加工和可视化的需求。没有GPU,图形指令需要软件仿真然后占用主处理器资源,导致无法承受的低性能表现。 例如,应用虚拟化,可以允许服务器支撑多个用户共享的应用。如果该共享应用需要图形功能,例如视频渲染工具,那么服务器必须提供该功能。另外,虚拟桌面(VDI)也可以支持终端集中到服务器上。本例中,3D建模软件和其它图形工具通常会运行在桌面PC的环境中,现在已经在基于服务器的虚机上,同样需求额外的图形处理功能。 在虚拟服务器上安装GPU 高性能GPU通常以高度专业化的图形适配卡方式安装到传统服务器中,如NVIDIA的Tesla,安装在服务器的可用PCIe插槽中。这是最简易也是最常见的对现有无板载GPU的服务器进行改进的方式,但是仍有些需要考虑的挑战。 这些GPU卡通常是很大、电力需求很高的设备,而服务器通常提供只有1或2个PCIe插槽,其中之一可能已经被其它的PCIe扩展设备占用,如多端口网卡或IO加速器等。即使有合适的空闲插槽,一块GPU卡加上完整的大型散热片和风扇,通常超出可用空间的大小。 您需要记住一点,GPU卡需要数百瓦特的系统电力供应。这个需求可能对配置较小的电源供应模块,以实现高效率和最低能耗的服务器平台带来问题。一些系统可能需要升级电源以及提供额外的电源线来适应GPU卡。PCIe总线也无法提供这么多的电量给支撑的设备。 最后,增加GPU卡总是一个需要经过验证可行性的项目。IT专家将需要对GPU卡的部署进行非常仔细的评估和验证服务器的能力,确认其能否在各种操作条件下支撑GPU负载。 无论如何,新的服务器已经直接把GPU的问题考虑在服务器的主板设计上。超微公司的SuperServer 1027GR-TRFT,结合了板载Matrox的G200eW GPU,使得您的集成更为简单。该GPU不需要PCIe插槽,而且电源供应已经考虑了运行额外GPU芯片的需求。 服务器GPU的软件需求 对于任何计算机而言,图形显示平台都是必须的子系统,但是除了物理空间和电源供应问题外,GPU还需要跟服务器的操作系统相兼容。 NVIDIA现在用于服务器的Tesla仅支持32位和64位的Linux。为扩展其应用范围,该GPU需要支持Windows Server2012的驱动,包括对hypervisor的支持,如vSphere或Hyper-V。简言之,需要有一些机制保证CPU核心可以共享GPU。这对于很多桌面都需要图形功能的VDI部署而言尤其重要。 数十年来,服务器供应商避免使用图形功能,更愿意把高性能图形渲染和可视化工作放到带有独立显卡子系统的终端设备上。随着虚拟化使得应用和终端整合到数据中心,图形功能也需要迁移到服务器硬件上。责编:王珂玥
本回答被提问者采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式