精细化的资源调度

>50% 的资源利用率提升

精细

Task级别的资源调度,支持抢占式调度和动态迁移,最大化资源利用率

解耦

开发和计算(训练与推理)所需资源进行解耦,降低资源的闲置

断点续跑

支持进程级别断点续跑和自动休眠(Hibernate),减少资源和训练时间的浪费
高吞吐量,提升分布式计算性能
大规模深度学习框架-IDP Wind,可自动选择高效的并行策略,用户只需增加少量代码即可完成大规模深度学习模型的高效分布式训练。

高性能分布式计算

8-10 倍的计算性能提升

开启AI创新之旅

体验易用和性能的融合