ISBN/价格: | 978-7-121-45814-9:CNY139.00 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | 分布式机器学习/.柳浩著 |
出版发行项: | 北京:,电子工业出版社:,2023 |
载体形态项: | xiv, 575页, [16] 页图版:;+图 (部分彩图):;+26cm |
相关题名附注: | 英文并列题名取自封面 |
提要文摘: | 本书共分为5篇, 第1篇是分布式基础, 首先介绍了分布式机器学习的概念、基础设施, 以及机器学习并行化技术、框架和软件系统, 然后对集合通信和参数服务器PS-Lite进行了介绍。第2篇是数据并行, 以PyTorch和Horovod为主对数据并行进行分析, 读者可以了解在具体工程领域内实现数据并行有哪些挑战和解决方案。第3篇是流水线并行, 讲解了除模型划分之外, 还通过引入额外的流水线来提高效率,以GPipe/PyTorch/PipeDream为例进行分析。第4篇是模型并行, 首先对NVIDIA Megatron进行分析, 讲解如何进行层内模型并行, 然后讲解PyTorch如何支持模型并行, 最后介绍分布式优化器。第5篇是TensorFlow分布式, 前面几篇以PyTorch为纲, 结合其他框架/库来穿插完成, 本篇带领大家进入TensorFlow分布式领域。 |
并列题名: | Distributed machine learning eng |
题名主题: | 分布式算法 机器学习 |
中图分类: | TP181 |
个人名称等同: | 柳浩 著 |
记录来源: | CN SCYK 20240716 |