All Reduce算法汇总-白红宇

All Reduce算法汇总

阅读量：5170 次

发布时间：2019-06-13

本文共 325 字，大约阅读时间需要 1 分钟。

1、朴素All Reduce

假设GPU节点数为N，两两GPU间的网络上下行带宽均为B，weight数据量S，那么broadcast（下图中的Receive）的通信时间：T = (N-1)S/B，可以看出T随N线性增长，当N很大时，这会成为严重的瓶颈。

当然，这是基于同步SGD。如果用异步SGD，通信时间会变短，但是异步SGD可能会不收敛。

2、Baidu All Reduce（Ring All Reduce）

参见：

3、Double binary trees

参考链接

1）Baidu All Reduce：

2）Horovod：

转载于:https://www.cnblogs.com/yangwenhuan/p/11390823.html

你可能感兴趣的文章

input中的name，value以及label中的for

Confluence 6 系统运行信息中的 JVM 内存使用情况

《avascript 高级程序设计（第三版）》 ---第二章在HTML中使用Javascript

查看>>

JS一些概念知识及参考链接

查看>>

TCP/IP协议原理与应用笔记24：网际协议（IP）之 IP协议的简介

查看>>

SAP HANA开发中常见问题- 基于SAP HANA平台的多团队产品研发

查看>>

游戏中的心理学（一）：认知失调有前提条件

查看>>

WHAT I READ FOR DEEP-LEARNING

查看>>