Spark基础：使用维基百科数据集来用Spark进行原型实验-白红宇的个人博客

发布日期：2021-11-09 06:56:01 浏览次数：12 分类：技术文章

本文共 302 字，大约阅读时间需要 1 分钟。

Apache Spark的真正价值和强大能力在于用它可以构建一个统一一致的分析场景，囊括了从ETL（数据抽取、转换和载入）、批处理分析、实时流分析、机器学习、图类型数据分析，到可视化的多种功能。在这个历时2天的课程里，布莱恩·克莱坡通过对多种维基百科数据集的动手操作来展示了理想中Spark可以完成的多样化的编程模式。在培训结束时，参加者将具备运用Spark来进行概念验证和原型搭建的能力。

本课程包括50%的讲座和50%的动手编程实践。所有的参与者在课程结束后还可以获得Databricks内容一个月的接入，方便参与者继续进行课堂实践和完成作业。

阅读原文 ( read more ) 浏览更多培训信息

转载地址：https://blog.csdn.net/zkh880loLh3h21AJTH/article/details/78100530 如侵犯您的版权，请留言回复原文章的地址，我们会给您删除此文章，给您带来不便请您谅解！

上一篇：Strata + Hadoop World 北京大会早期门票价格将在7月8日周五截止

下一篇：在Spark和Hadoop上做大规模数据科学

发表评论

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！

发表评论

最新留言

关于作者

推荐文章