沙龙概述

Hadoop是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统。EasyHadoop组织第三次聚会活动,本次活动邀请到阿里巴巴 、暴风、趣游、亿赞普等公司的Hadoop专家对Hadoop实际应用进行讲解。watchstor全程进行视频拍摄,欢迎广大网友观看视频,下载PPT。

  视频点播
  沙龙PPT下载
向磊—Scribe日志收集系统简介
Scribe是Facebook开源的日志收集系统,在Facebook内部已经得到大量的应用。它能够从各种日志源上收集日志,存储到一个中央存储系统(可以是NFS,分布式文件系统等)上,以便于进行集中统计分析处理。它为日志的"分布式收集,统一处理"提供了一个可扩展的,高容错的方案 ... 下载>>
 
史东杰—Hive与HBase整合经验谈
Hive与HBase的整合功能的实现是利用两者本身对外的API接口互相进行通信,相互通信主要是依靠hive-hbase-handler.jar工具类 (Hive Storage Handlers) 在使用Hive 进行多个列进行group by 的查询分享Hive中的字段为id,,name,time,num time格式为yyMMddHHmmss格式... 下载>>
 
肖燕京—Hadoop在亿赞普的应用
曾担任信息安全技术支持工程师、服务器存储大客户经理、云计算/云存储平台销售经理现任北京北龙超级云计算有限责任公司市场总监。关注领域包括HPC关键技术、信息安全、存储、虚拟化、新媒体、物联网等技术和应用的价值... 下载>>
 
荣英杰—Mahout机器学习与推荐系统简介
Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。机器学习是人工智能的一个分支,它涉及通过一些技术来允许计算机... 下载>>
 
王乐珩—阿里云ODPS:云端数据仓库服务
阿里云开放数据处理服务(Open Data Processing Service,简称ODPS) 是构建在飞天系统上的大规模分布式数据处理服务。ODPS以REST API的形式,支持用户提交类SQL的查询语言,对海量数据进行处理。在API之上... 下载>>