English

2014年12月12-14日 北京 · 新云南皇冠假日酒店

2014中国大数据技术大会

暨第二届CCF大数据学术会议

首页 > 演讲嘉宾 > 演讲嘉宾详情> 田毅
田毅

田毅

大数据平台研发部经理

北京Spark Meetup创始人,从2010年起,尝试独立编写分布式的业务处理平台。2011年开始全面使用hadoop平台,早期设计开发利用MapReduce构建可视化数据处理平台,后逐步转向研究使用Hive分担电信行业传统数据仓库的复杂计算。从2013年开始关注Spark,目前致力于利用Spark技术的特性拓展电信行业的业务模式。从2011年到2014年,鉴证了Hadoop技术在电信行业中从小范围探索,到大规模推广使用,从6-7台机器组成的小集群,到现在数百台的大数据处理平台。先后使用HBase实现了电信业务场景中的单据类数据即时查询业务,使用Shark实现了准实时用户标签统计分析平台。2014年7月创建北京Spark Meetup小组,目前已经成功举办3次,参与人数在全世界的Spark Meetup排名第7,历次活动中邀请了来自Databricks,亚信,京东,Intel等多个知名企业的员工分享了Spark实践中的经验与教训。

 

演讲主题:Spark介绍与应用案例分析

Apache Spark作为新一代大数据分析平台,以全能分析闻名,可以在单个软件栈内混合批处理、流式计算、以机器学习为代表的迭代型计算、关系查询、交互式查询、 图计算等多种分析范式,是搭建一体化大数据流水线的极佳选择。在部署Spark集群、设计Spark应用时有哪些方面的问题需要考量?目前Spark适合 应用在哪些场景? 哪些场景不适合Spark使用? 本演讲试图通过亚信科技在Spark平台上的应用案例与经验教训为上述问题提供参考。 

联系我们

服务热线:010-64351456

媒体咨询:010-51661202-246

商务合作:010-51661202-834

大会邮箱:bdtc2014@163.com

申请演讲 志愿者报名

申请演讲时间截止到11月15日

扫一扫

微信号:CSDNcloud

时时关注

云计算官方频道官微

 


扫一扫

微信号:CSDNbigdata

时时关注

大数据官方频道官微

 

主办单位

中国计算机学会

承办单位

CCF大数据专家委员会

南京大学、复旦大学(学术会议)

协办单位

中国科学院计算技术研究所
CSDN

大会官方媒体(排名不分先后)

CSDN 程序员

大会特邀合作伙伴

小象科技

大会合作伙伴(排名不分先后)

百度 星环信息科技(上海)有限公司 浪潮集团有限公司 华为技术有限公司 国际商业机器(中国)有限公司 亚马逊AWS中国

专题论坛合作伙伴(排名不分先后)

英特尔在中国 北京亚信数据有限公司 中移(苏州)软件技术有限公司 威睿信息技术(中国)有限公司 戴尔(中国)有限公司

展览展示(排名不分先后)

巨杉数据库 中金数据系统有限公司 北京华章图文信息有限公司 北京博文视点资讯有限公司 北京数字冰雹信息技术有限公司 Parasoft 杭州又拍云科技有限公司 腾讯广点通 肯睿(上海)软件有限公司 曙光信息产业股份有限公司 上海云人信息科技有限公司 人民邮电出版社 万迪思科软件(成都)有限公司 Facebook

合作门户(排名不分先后)

中华网科技 腾讯科技 搜狐科技 网易科技 新浪科技

特别支持媒体(排名不分先后)

中国信息化 商业价值 创业邦 IT经理世界 计算机世界报 中国计算机报 电脑商情在线 环球网科技 中新网

支持媒体(排名不分先后)

中关村在线 3sNews 会点网 FT中文网 pchome phpchina techweb 畅享网 豆丁网 机房360 计世网 计世资讯 美通社 赛迪网 数字e族 太平洋电脑网 天极网 通信世界网 投资界 网界网 网易新闻客户端 支点网 中国idc圈 中国IT实验室 中国软件网 中国商业电讯 中国网科技 中国信息主管网 中云网 大数据文摘 懒汉互联 it商业新闻网 硅谷动力 易会 DoNews DOIT 至顶网 CIO时代网 比特网 C114