超越多顯卡多機器:分散式機器學習超速實戰

超越多顯卡多機器:分散式機器學習超速實戰

作者 陳敬雷(著)
DOI / ISBN-A:10.978.9860776/546
ISBN 9789860776546
出版機構 深智數位股份有限公司
出版年 2021
電子書
紙本書
在Hadoo/Spark/Mahout/Tensorflow上跑多機器多片GPU的機器學習

  機器學習在神經網路和GPU流行起來之後大放異彩,連販夫走足都CNN/RNN朗朗上口,然而許多企業/研究機關/學校在花了大筆預算購買昂貴的硬體時,卻不知如何採購,更不用說如何應用這些硬體來進行研發或產品開發了。本書作者是知名電商的創辦人,其不止在機器學習上有十足的實務經驗,在面對大量資料的場景下,更能利用前人的智慧,用上了Big Data最流行的Hadoop/Spark平台。尤有甚者,在新一代的AI函數庫面世時,也能充分利用這些函數庫的GPU加速,將多機器,多GPU的資源應用在大型專案上。

  ▌業界獨有
  全書以Hadoop/Spark為基礎,加上使用了最流行的TensorFlow on Hadoop,更使用了分散式系統最老牌的Mahout,有別於一般只介紹Python/TensorFlow的坊間書籍,是市場上唯一僅有完整從Hadoop一直延伸到神經網路。

  ▌內容完整豐富
  本書以分散式機器學習為主線,以實戰為主要目的。共分為8章,分別介紹網際網路公司巨量資料和人工智慧、巨量資料演算法系統架構、巨量資料基礎、Docker容器、Mahout分散式機器學習平台、Spark分散式機器學習平台、分散式深度學習實戰、完整工業級系統實戰(推薦演算法系統實戰、人臉辨識實戰、對話機器人實戰)等內容。

  適合讀者
  適合分散式機器學習的初學者閱讀,對於有一定經驗的分散式巨量資料方向的從業人員及演算法工程師,也可以從書中獲取很多有價值的知識,並透過實戰專案更佳地理解分散式機器學習的核心內容。