數字教材介紹
本書通俗地講解數據科學與并行計算的基本概念、方法和原理,系統地介紹基于典型大數據場景的并行計算解決思路,同時涵蓋常用的數據并行計算工具的操作實踐,使讀者知其然更知其所以然。
本書的特色在于:注重對大數據科學方法核心應用的講解,突出以并行計算思維解決大數據場景問題的案例教學。基于典型大數據場景案例數據集,循序漸進地引導讀者利用Parallel、Sparklyr、Dask和PySpark等主流并行計算工具實現數據的清洗、轉換、描述和建模分析。幫助讀者系統全面地構建數據科學的基本知識體系,領會數據并行計算方法的精髓,掌握不同編程語言和并行計算工具針對不同規模數據集的優缺點,能夠利用并行計算工具解決實際的數據分析問題。
數字教材資源
資源制作中。。