本书结合案例研究讲解Spark 在机器学习中的应用,并介绍如何从各种公开渠道获取用于机器学**统的数据。内容涵盖推荐系统、回归、聚类、降维等经典机器学习算法及其实际应用。第2版新增了有关机器学习数学基础以及Spark ML Pipeline API 的章节,内容更加系统、全面、与时俱进。拉结帝普·杜瓦(Rajdeep Dua)
Salesforce公司工程主管,致力于打造云计算和人工智能团队。曾参与Google的大数据分析工具BigQuery的宣传团队。在云计算、大数据分析和机器学习领域有近20年的经验。
曼普利特·辛格·古特拉(Manpreet Singh Ghotra)
Salesforce公司软件工程主管,拥有十余年软件开发经验,目前致力于开发基于Apache Spark的机器学**台。
尼克·彭特里思(Nick Pentreath)
IBM开源数据及人工智能技术中心首席工程师,大数据及机器学习公司Graphflow联合创始人,Spark项目管理委员会成员。
【译者简介】
蔡立宇
曾从事自然语言处理和图数据分析相关工作,现提供数据分析相关的独立咨询和开发服务。坐标深圳。
书籍下载&在线阅读
保护知识产权,暂不提供下载微信关注“码中人”公众号,获取免费赠书。
本站的大部分电子书均为开源电子书。
本站不制作 、不存储该资源,所有资源来自于其它网站。
如本电子书非开源图书,请尊重版权,购买正版书籍
本电子版仅供预览,下载后24小时内务必删除。
PS:如果链接失效,请留言告知我们,将尽快修复链接。