English

2014年12月12-14日 北京 · 新云南皇冠假日酒店

2014中国大数据技术大会

暨第二届CCF大数据学术会议

首页 > 日程安排 > 大会日程

Session A1:大数据存储管理与处理

地 点:昆明多功能A厅   时 间:8:30-10:00,每个报告15分钟

主持人:肖利民         

序号
论文标题
作者
基于数据通道的非结构化数据多存储系统 
蒋静远,鲁伟明,王耀光,楼仁杰 
大数据集成中确定数据准确属性值的WR方法 
周宁南,张    孝,王    珊 
面向大数据的分布式流处理技术综述  张    鹏,李鹏霄,任    彦,杨    嵘,林海伦,刘庆云 
一种大规模时空数据处理与可视化平台
杜    一,郭旦怀,周园春,黎建辉
Hadoop环境下三维模型的存储及形状分布特征提取
李海生,赖    龙,蔡    强,毛典辉,陈    谊
基于数据位图的滑动分块算法
邓雪峰,孙瑞志,张永瀚,聂    娟 

 

Session B1:数据质量

地 点:昆明多功能A厅   时 间:10:15-12:00,每个报告15分钟

主持人:曹建军         

序号
论文标题
作者
基于任务合并的并行大数据清洗过程优化 
杨东华,李宁宁,王宏志,李建中,高    宏 
大数据上基于Hadoop的不一致数据检测与修复算法 
张安珍,门雪莹,王宏志,李建中,高    宏 
面向隐马尔可夫特征的数据质量控制模型  周金陵,刁兴春,周    星,曹建军 
对非随机缺失中的缺失依赖关系研究
郑奇斌,刁兴春,曹建军
一种含缺失数据的记录逻辑检测方法
高    科,刁兴春,曹建军
基于Hadoop的电网数据质量校验方法与验证系统
张志亮,孙煜华,陈承志,龙庆麟,梁国辉,顾    荣,杨滨诚,黄宜华 
利用AQL的逐批海洋大数据质量检验模型
黄冬梅,周雪楠,王振华

 

Session A2:数据分析与挖掘

地 点:昆明多功能B厅   时 间:8:30-10:00,每个报告15分钟

主持人:王    莉         

序号
论文标题
作者
利用社交关系的实值条件受限玻尔兹曼机协同过滤推荐
算法 
何洁月,马    贝 
基于移动网络流量日志的城市空间行为分析 
强思维,陈夏明,姜开达,金耀辉 
一种对数据集稀疏度不敏感的协同推荐新方法  蔡国永,吕    瑞 
基于Hadoop的领域术语抽取研究
杜丽萍,李晓戈,周元哲,邵春昌
一种融合异构信息网络和评分矩阵的推荐新算法
张邦佐,桂    欣,何    涛,孙焕垚,杨晟雨,韩宇茹
基于广域分布时空轨迹大数据的群体行为模式挖掘方法
杨    杰,李小平,陈    湉 

 

Session B2:社会网络分析与知识图谱

地 点:昆明多功能B厅   时 间:10:15-12:00,每个报告15分钟

主持人:何洁月         

序号
论文标题
作者
一种面向大规模社会信息网络的多层社区发现算法 
康    颖,于    博,林    政,周    江,王伟平,孟    丹 
一种大规模图数据处理关键技术的评估模型 
高    赟,周    薇,韩冀中,孟    丹 
大规模演化知识网络中的关系推断  赵泽亚,贾岩涛,王元卓,靳小龙,程学旗 
社会网络中面向不确定性影响源的影响力传播抑制方法
李    劲,柳    青,岳    昆,蔡    莉
基于低秩结构和局部约束矩阵估计的链接预测方法
刘    冶,印    鉴,邓泽亚,王智圣,潘    炎
SFEN-Inf:一种微博信息传播网络推理算法
郑众杰,林学练 
大数据环境下的动态知识网络模型及构建方法
刘    剑,许洪波,唐慧丰,程学旗

 

Session A3:大数据机器学习算法

地 点:昆明多功能C厅   时 间:8:30-10:00,每个报告15分钟

主持人:禹晓辉         

序号
论文标题
作者
面向大数据流的多任务加速在线学习算法 
李志杰,李元香,王    峰,匡    立 
基于非负矩阵分解的大规模异构数据联合聚类 
申国伟,杨    武,王    巍,于    淼,董国忠 
基于Spark的大规模文本k-means并行聚类算法  刘    鹏,滕家雨,张国鹏,胡延军,黄宜华 
基于受限玻尔兹曼机的链接分类算法
史喜斌,吴世伟,熊    赟
基于滑窗不等长时间序列STS 距离的聚类算法
刘    琴,王恺乐,饶卫雄
一种基于高斯混合模型的不确定数据流聚类方法
曹振丽,孙瑞志,李    勐 

 

Session B3:大数据并行化算法

地 点:昆明多功能C厅   时 间:10:15-12:00,每个报告15分钟

主持人:于俊清         

序号
论文标题
作者
基于BSP并行计算模型的K-shell算法 
王    阳,吴    斌 
基于MapReduce的多元连接优化方法 
李甜甜,于    戈,郭朝鹏,宋    杰 
基于SparkR的分类算法并行化研究  刘志强,顾    荣,袁春风,黄宜华 
基于MapReduce的并行化最小最大模块化支持向量机
研究
赵    研,李    云
基于Spark的并行图数据分析系统
王虹旭,吴    斌,刘    旸
大数据下利用块依赖的并行实体解析算法
王    宁,黄    敏 
基于Hadoop的局部支持向量机
崔文斌,温孚江,牟少敏,浩庆波

 

Session A4:查询检索

地 点:西双版纳厅   时 间:8:30-10:00,每个报告15分钟

主持人:陈    耿          

序号
论文标题
作者
HiBase:一种基于分层式索引的高效HBase 查询技术与系统 
葛    微,罗圣美,周文辉,赵    頔,唐    云,周    娟,
曲文武,袁春风,黄宜华 
异构信息网上的可达性查询 
尹    丹,高    宏,邹兆年,李建中 
基于LDA主题模型的分布式信息检索集合选择方法  何旭峰,陈    岭,陈根才,钱    坤,吴    勇,王敬昌 
基于浓密树和改进McCHyp算法的Impala查询优化
马骄阳,陈    岭,赵宇亮,杨    谊,吴    勇,王敬昌
基于内存的分布式隐私流查询系统
张    鹏,刘庆云,熊翠文,李保珲,郑    超,易    立
基于信息熵加权的三维模型特征融合算法
李海生,张朝立,蔡    强,毛典辉,杜军平 

 

Session B4:大数据应用

地 点:西双版纳厅   时 间:10:15-12:00,每个报告15分钟

主持人:罗圣美         

序号
论文标题
作者
海量车牌识别数据集上基于时空划分的旅行时间计算
方法 
赵卓峰,张    帅,丁维龙 
基于海量医疗数据的症状自查服务的云框架设计 
周作建,林文敏,王斌斌,潘金贵 
基于TCBF_LRU的高速网络大流检测算法  白    磊,田立勤,陈    超 
大数据下纺织制造执行系统关键问题研究
邵景峰,贺兴时,王进富,白晓波,刘    晟,马创涛,
刘聪颖
一种支持音乐情感检索的索引结构
王    伟,徐立臻,董逸生
电力数据语义冲突检测及消减技术研究
张德刚,吴    毅,张德海,张少泉 
大数据背景下山东省二代玉米螟发生程度预测模型的构建
杨    波,刘    勇,牟少敏,温孚江

 

Session A5:数据安全与大数据系统

地 点:会议室7+8   时 间:8:30-10:00,每个报告15分钟

主持人:何利文         

序号
论文标题
作者
增强云存储中数据机密性的属性基加密方案 
张    星,文子龙,沈晴霓,吴中海 
可信固态硬盘:大数据安全的新基础 
田洪亮,张    勇,许信辉,李    超,邢春晓 
面向大数据的软件定义安全服务  何利文,李    杰,陈向东,鲁蔚锋,孔令军,王少辉,黄    俊 
基于属性的广义签密方案
韩益亮,白寅城,房鼎益,杨晓元
接收与处理分离的实时大数据处理模型
彭建华,李臣明,邱军林,李晓芳,徐立中
观澜交通数据处理平台
董    振,禹晓辉,崔星灿,宋仁勇,林立伟 

 

Session B5:大数据系统与体系结构

地 点:会议室7+8   时 间:10:15-12:00,每个报告15分钟

主持人:张   东         

序号
论文标题
作者
BDSim:面向大数据应用的组件化高可配并行模拟框架 
李文明,叶笑春,张    洋,宋风龙,王    达,唐士斌,
范东睿 
云海大数据一体机体系结构和关键技术 
张    东,亓开元,吴    楠,辛国茂,刘正伟,颜秉珩,郭    锋 
一种面向图数据的预装载缓存策略  黄    硕,左    遥,梁    英,许洪波,熊锦华,王千博,
程学旗 
GRC:一种适用于多节点失效的高容错低修复成本纠删码
林    轩,王意洁,裴晓强,许方亮,符永铨
一种基于历史信息的一致性哈希集群重复数据删除路由
策略
邢玉轩,肖    侬,刘    芳,付印金,李    芳,巫小泉
一种提高虚拟化Hadoop系统数据本地性的资源调度方法
孙瑞琦,杨    杰,高    瞻,贺志强 
云计算环境下基于改进粒子群优化算法的多目标资源调度策略研究
赵宏伟 

 

基于大数据的个性化系统构建及其核心技术(二层会议室1+2+3)

主题/时间
内容
讲师
如何用开源工具构建个性化系统
09:00-12:00

一、个性化系统

  • 什么是个性化系统
  • 大数据与个性化系统的关系
  • 个性化系统典型案例
  • 推荐系统、计算广告系统
  • 个性化系统一般框架

二、在线投放引擎

  • 个性化系统在线服务的特点
  • 高并发个性化服务引擎 - Nginx
  • 分布式服务管理 - Zookeeper
  • 跨语言服务间通信 - Thrift
  • 海量候选的快速筛选 - Lucene

三、离线大数据平台

  • 个性化系统中的主要大数据问题
  • 日志收集与转运工具 - Flume
  • 分布式存储与计算平台 – Hadoop
  • 数据结果与线上决策的交互 – Redis

四、在线流计算平台

  • 个性化系统中的主要流计算问题
  • 高吞吐量分布式消息系统 - Kafka
  • 流计算基础平台 – Storm VS Spark Streaming

刘鹏

现任奇虎360商业产品首席架构师,负责360的变现产品及工程,包括搜索广告、展示广告、站外数据变现体系等
基于Spark的推荐系统设计与实现 13:30-17:00
  • Spark核心技术详解
  • 深入解析流式计算框架Spark Streaming
  • MLlib常用算法详解
  • Kafka+Spark Streaming的架构解析
  • 基于Spark和Spark Streaming的推荐系统架构与实现

陈超

Apache顶级项目Spark的Contributor ,屡次受邀作为演讲嘉宾出席国内著名大数据技术峰会

 

联系我们

服务热线:010-64351456

媒体咨询:010-51661202-246

商务合作:010-51661202-834

大会邮箱:bdtc2014@163.com

申请演讲 志愿者报名

申请演讲时间截止到11月15日

扫一扫

微信号:CSDNcloud

时时关注

云计算官方频道官微

 


扫一扫

微信号:CSDNbigdata

时时关注

大数据官方频道官微

 

主办单位

中国计算机学会

承办单位

CCF大数据专家委员会

南京大学、复旦大学(学术会议)

协办单位

中国科学院计算技术研究所
CSDN

大会官方媒体(排名不分先后)

CSDN 程序员

大会特邀合作伙伴

小象科技

大会合作伙伴(排名不分先后)

百度 星环信息科技(上海)有限公司 浪潮集团有限公司 华为技术有限公司 国际商业机器(中国)有限公司 亚马逊AWS中国

专题论坛合作伙伴(排名不分先后)

英特尔在中国 北京亚信数据有限公司 中移(苏州)软件技术有限公司 威睿信息技术(中国)有限公司 戴尔(中国)有限公司

展览展示(排名不分先后)

巨杉数据库 中金数据系统有限公司 北京华章图文信息有限公司 北京博文视点资讯有限公司 北京数字冰雹信息技术有限公司 Parasoft 杭州又拍云科技有限公司 腾讯广点通 肯睿(上海)软件有限公司 曙光信息产业股份有限公司 上海云人信息科技有限公司 人民邮电出版社 万迪思科软件(成都)有限公司 Facebook

合作门户(排名不分先后)

中华网科技 腾讯科技 搜狐科技 网易科技 新浪科技

特别支持媒体(排名不分先后)

中国信息化 商业价值 创业邦 IT经理世界 计算机世界报 中国计算机报 电脑商情在线 环球网科技 中新网

支持媒体(排名不分先后)

中关村在线 3sNews 会点网 FT中文网 pchome phpchina techweb 畅享网 豆丁网 机房360 计世网 计世资讯 美通社 赛迪网 数字e族 太平洋电脑网 天极网 通信世界网 投资界 网界网 网易新闻客户端 支点网 中国idc圈 中国IT实验室 中国软件网 中国商业电讯 中国网科技 中国信息主管网 中云网 大数据文摘 懒汉互联 it商业新闻网 硅谷动力 易会 DoNews DOIT 至顶网 CIO时代网 比特网 C114