博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
All Reduce算法汇总
阅读量:5170 次
发布时间:2019-06-13

本文共 325 字,大约阅读时间需要 1 分钟。

1、朴素All Reduce

假设GPU节点数为N,两两GPU间的网络上下行带宽均为B,weight数据量S,那么broadcast(下图中的Receive)的通信时间:T = (N-1)S/B,可以看出T随N线性增长,当N很大时,这会成为严重的瓶颈。

当然,这是基于同步SGD。如果用异步SGD,通信时间会变短,但是异步SGD可能会不收敛。

2、Baidu All Reduce(Ring All Reduce)

参见:

3、Double binary trees 

 

 

参考链接

1)Baidu All Reduce:

2)Horovod:

 

转载于:https://www.cnblogs.com/yangwenhuan/p/11390823.html

你可能感兴趣的文章
jquery的ajax用法
查看>>
设计模式-策略模式(Strategy)
查看>>
django orm 数据查询详解
查看>>
JarvisOJ Basic 熟悉的声音
查看>>
C# list导出Excel(二)
查看>>
CAS 单点登录模块学习
查看>>
Android应用开发-网络编程①
查看>>
input中的name,value以及label中的for
查看>>
静态库制作-混编(工程是oc为基础)
查看>>
jQuery 显示加载更多
查看>>
Confluence 6 系统运行信息中的 JVM 内存使用情况
查看>>
Confluence 6 升级以后
查看>>
用JS实现版面拖拽效果
查看>>
二丶CSS
查看>>
《avascript 高级程序设计(第三版)》 ---第二章 在HTML中使用Javascript
查看>>
JS一些概念知识及参考链接
查看>>
TCP/IP协议原理与应用笔记24:网际协议(IP)之 IP协议的简介
查看>>
SAP HANA开发中常见问题- 基于SAP HANA平台的多团队产品研发
查看>>
游戏中的心理学(一):认知失调有前提条件
查看>>
WHAT I READ FOR DEEP-LEARNING
查看>>