Quantcast
Channel: 英特尔开发人员专区文章
Viewing all articles
Browse latest Browse all 583

AMPCamp@China 2015_DEMO

$
0
0
课程讲师
AMPLab and BDAS OverviewMichael Franklin
SparkJason Dai
SparkSQL程浩
Spark StreamingSaisai Shao
MLib+GraphxYuhao Yang
SparkRRui Sun
TachyonMingfei Shi
A Sneak Peek at Recent Updates from AMPLabZongheng Yang

Michael Franklin

课程:AMPLab and BDAS Overview

人物介绍:Michael Franklin 是一名计算机科学家,他同时是美国伯克利大学计算机系的系主任兼 AMPLab 的主管。

视频介绍:在开幕辞中,Michael Franklin 首先向来宾介绍了 AMPLab 实验室的研究方向、成员和与包括英特尔在内的业界公司之间的技术合作。随后他介绍了大数据生态系统从 Hadoop 向 Spark 的演化,Spark 基于内存计算带来的性能和运行速度的提升(MapReduce的10-100倍),以及 AMPLab 实验室推出的以 Spark 为核心框架的伯克利数据分析栈(BDAS):一个涵盖了整个大数据生态系统、包含众多子项目的大数据平台。Michael Franklin 详细介绍了 BDAS,包括 BDAS 由哪些模块组成,核心模块 Spark,Apache Spark 社区的活跃度(其他大数据开源项目的 2-3 倍),Spark的最新版本 Spark 1.3,以及 BDAS 在现实世界中的用户案例等。

下载视频AMPCamp@China-introduction to amplab and BDAS.mp4

下载PDFUCB_AMPCamp_China.pdf


Michael 通过在线视频从 UC Berkeley 远程向 AMPCamp China 的学员致开幕词。

top ↑

Jason Dai

课程:Spark

人物介绍:Jason Dai,英特尔大数据中心首席架构师。

视频介绍:介绍了基于内存的分布式并行计算框架 Spark 的优势,系统全面地介绍了整个 Spark 软件栈,包括 Spark Core、SparkSQL、SparkR、SparkStreaming、MLlib 和 GraphX 等。接下来,Jason更详细地介绍了 Spark 所提供的 API,并结合日志挖掘和字数统计的实例,讲解了在 Spark 平台上基于弹性分布式数据集(RDD)的编程,包括分布式任务执行和错误恢复等内容。

下载视频AMPCamp@China-Spark.mp4

下载PDFSpark_AMPCamp_China.pdf


Jason 的 Keynote 主题是 “Introduction to Apache Spark”。

top ↑

程浩

课程:SparkSQL

人物介绍:程浩,来自英特尔大数据技术团队,之前一直从事 Spark SQL 相关开发

视频介绍:讲授与 SparkSQL 相关的一些知识和实践。

下载视频AMPCamp@China-SparkSQL.mp4

下载PDFSparkSQL_AMPCamp_China.pdf


程浩分享的主题是 “Spark SQL Introduction”。

top ↑

Saisai Shao

课程:Spark Streaming

人物介绍:Saisai Shao,来自英特尔大数据技术团队,主要从事 Spark Core 和 SparkStreaming 相关的开发。活跃的 SparkStreaming 代码贡献者。

视频介绍:介绍了如何利用 SparkStreaming,一个建立在 Spark Core 基础上的流式处理框架,来实现大规模近实时的流式数据处理。

下载视频AMPCamp@ChinaStreaming.mp4

下载PDFSpark-Streaming_AMPCamp_China.pdf


Saisai Shao 分享的主题是 “Spark Stream – Large-scale near-real-time stream processing”。

top ↑

Yuhao Yang

课程:MLib+Graphx

人物介绍:Yuhao Yang,来自英特尔大数据技术团队,之前一直从事机器学习和图像算法相关的开发。

视频介绍:讲授了 Spark MLib 和 Graphx 的一些相关知识。

下载PDFMLlib and GraphX_AMPCamp_China.pdf


Yuhao Yang 分享的主题是 ”Introduction to Spark MLlib & GraphX”。

top ↑

Rui Sun

课程:SparkR

人物介绍:Rui Su,来自英特尔大数据技术团队,从去年 9 月份开始从事 SparkR 的相关开发。

视频介绍:讲授了 SparkR 的一些相关知识。开发 SparkR 的动机:在数据科学领域,R 是非常流行的一门编程语言和环境,但传统的R语言是单线程的,只能在单机上运行,因此受限于单机容量。SparkR 的项目针对R语言的扩展局限性,把 R 语言与通用的大数据引擎结合起来(本项目是与 Spark 结合),提供让 R 语言在集群上运行的最佳解决方案。

下载视频AMPCamp@China-SparkR.mp4

下载PDFSparkR_AMPCamp_China.pdf


Rui Sun 分享的主题是 “SparkR- Scale R with Spark”。

top ↑

Mingfei Shi

课程:Tachyon

人物介绍:Mingfei Shi 来自英特尔大数据技术团队,之前从事过 Spark 方面的工作,近一年以来一直从事 Tachyon 相关开发。

视频介绍:介绍了与基于内存的分布式存储系统-Tachyon;并对比了早期主流分布式存储如 HFDS 和 S3,介绍了 Tachyon 的优势。内存相比硬盘有着绝对的速度优势,近年来内存容量的快速增长和价格降低使得把大量数据存储在内存中具有了可行性。在这样的趋势下,例如 Spark 的基于内存的计算模型不断涌现,它们要求充分发挥内存性能,而 Tachyon 正是顺应这种要求产生。

下载视频AMPCamp@China-Tachyon.mp4

下载PDFTachyon_Ampcamp_China.pdf


Mingfei Shi 分享的主题是 “Tachyon – A Reliable Memory-centric Distributed Storage System”。

top ↑

Zongheng Yang

课程:A Sneak Peek at Recent Updates from AMPLab

人物介绍:Zongheng Yang 加州大学伯克利分校的数学系学生,2013 年成为 AMPLab 的研究学者,从事过 SparkR 第一个版本的开发,曾在 Databricks 工作。

视频介绍:整体介绍 BDAS 之前的情况和最新的研究成果,包括一些首次公布的新进展。接着他着重介绍了两个系统:一个是机器学习框架 KeystoneML,一个是更偏向于开放性研究的项目 EP^2。

下载视频AMPCamp@China-RecentResearch@AMPLab.mp4

下载PDFRecentResearchinAMPLab_AMPCamp_China.pdf


杨宗衡的 Keynote 主题是 “A Sneak Peek at Recent Updates from AMPLab”。

top ↑


Viewing all articles
Browse latest Browse all 583

Trending Articles