新零售网 > 商业 >

京东云推出vGPU池化方案,可令“大模型推理大幅降本”

来源:IT之家 发布时间:2023-08-16 12:01   阅读量:14113   

,据京东云官方公众号报道,京东云日前推出 vGPU 池化方案,官方表示,“该方案可提供一站式 GPU 算力池化能力,令 GPU 利用率最高提升 70%,大幅降低大模型推理成本”。

图源 京东云 官方公众号

京东云表示,凭借其“自主研发的混合多云操作系统云舰”,京东云在原有支持混合多云 CPU 算力池化能力基础上,针对大模型训练所需的泛算力池化能力,进一步增加了针对 AI 应用所需的调度管理能力,包括卡管理、节点管理、异构资源调度管理等,为包括大模型训练在内的多种 AI 应用,提供一站式算力池化解决方案,从而全面提升资源利用率。

京东云同时称,自家池化方案具有四大优势,IT之家转录相关内容如下:

  • 算力切分灵活:支持任意比例切分和动态调整机制,可实现按显卡算力、显存做细粒度切分,一张物理卡可供多个容器使用,与整卡算力相比,性能衰减在 2% 以内。

  • 精细化配额管理:支持灵活的配额管理,按显卡型号 / label 配额,有效保障资源按需分配,提升推理稳定性和训练性能。

  • 多场景适配:适配主流 CUDA 版本和不同 GPU 芯片适配,支持 TensorFlows、Pytorch 等行业主流的 AI 训练框架。

  • 多节点管理:支持节点虚拟分组和节点组指定应用使用,全面提升大模型训练效率。

京东云表示,在使用场景中,开发者可以根据卡型号申请资源,按算力和显存切分,统一由控制器根据用户指定的调度策略调整。仅在训练、微调和推理任务启动时进行动态分配,在任务结束即可以释放,支持多任务算力隔离和任务冷启动。

从实践效果看,通过 GPU 异构资源池化,AI 运行效率显著提高,整体 GPU 利用率提升 70%。结合任意切分和按需分配,在同等 GPU 数量的前提下,实现了数倍业务量扩展和资源共享,降低了硬件采购成本,使用更少的 AI 芯片支撑了更多的训练和推理任务。

广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

青云科技2023上半年净亏损8210万元同比收窄 2023-08-16 11:56

溢价成交!越秀地产68亿广州拿地,楼面价超5万!曾是广州“初代” 2023-08-16 11:37

钉钉个人版开放内测:没有已读、没有打卡,AI服务限时免费 2023-08-16 11:27

创建集团控股01609已委聘另一保荐人,将展开对新目标的尽职调查 2023-08-16 11:16

华为MateBook14S/16S2023笔记本32GB大内存版 2023-08-16 10:36

疯狂体育获得FIFPro全球IP正版授权将开启体育游戏全球发行战 2023-08-16 10:10

AdobePremierePro2024Beta已支持英特尔独显 2023-08-16 10:00

百亿基金经理再出手,固收产品添新作! 2023-08-16 09:53

SunSpider性能跑分:火狐浏览器Firefox已连续2个月 2023-08-16 08:45

货币政策逆周期调节再发力7天期逆回购和中期借贷便利MLF利率双双 2023-08-16 08:13

投融资两端助力市场人士认为证券业大有可为 2023-08-15 15:30

陕西:400万元以下工程采购项目适宜的应专门向民营等中小建筑业企 2023-08-15 15:21

TrendForce集邦咨询:预估今年服务器主板及整机出货量均同 2023-08-15 15:19

消息称特斯拉部署全自动驾驶方案FSD入华,招募本地运营团队 2023-08-15 14:59

远洋集团已获足够赞同票,8月17日将达成违约豁免 2023-08-15 13:50

前300名付尾款免100元定金:小米全能扫拖机器人2八点开售 2023-08-15 13:04

华为智选奇瑞,智界S7通过工信部申报:首搭鸿蒙4.0车机系统 2023-08-15 12:59

2599元起,小米RedmiK60至尊版手机发布:天玑9200+ 2023-08-15 12:25

云从科技推出“众寻V1PRO”鼠标:内置“从容AI大模型”,售价 2023-08-15 12:12

从基础设施到实体产业:汕头加速推进数实融合实践 2023-08-15 11:45