CCF 大数据与计算智能大赛(CCF Big Data&Computational Intelligence Contest简称“CCF BDCI”)

由中国计算机学会2013年创办,是大数据及人工智能领域的算法、应用和系统大型挑战赛事。大赛面向大数据与人工智能领域的重点应用行业征集实际需求问题,以前沿技 术创新和行业应用问题突破为导向,通过“众包、众筹、众创”的方式汇聚产学研用多方资源,旨在促进产业技术升级和行业应用创新,为社会发现和培养大量高质量人才。大赛迄今已成功举办五届,累计吸引到了国内外1000余所高校、1200余家企事业单位及80余所科研机构的30000余人参与,已经成为中国大数据与人工智能领域最具影响 力的活动之一,是国内外大数据综合赛事第一品牌。

当前,中国正迎来数字经济快速发展的历史性机遇,我国信息化正进入由大数据驱动的智能化新阶段,大数据及人工智能新技术、新业态、新模式不断涌现,人才和高新技术 成果成为推动产业升级及发展的关键因素。2018年第六届 CCF BDCI由中国计算机学会主办,沈阳市人民政府和教育部计算机教指委参与指导,CCF大数据专家委员会联合 沈阳市浑南区人民政府、信息技术新工科产学研联盟以及CCF数据库、高性能、中文信息技术等专委共同承办,200余位顶级学术专家及行业大咖、70余家企事业单位、300 余家媒体共同组织。大赛将立足国际化、规模化、普及化,拟发布“算法能力赛”和“创新方案赛”10道热门方向赛题,在全球范围内的30余所城市开展走进高校、技术沙龙 数据科学家论坛等活动,面向全球范围内优秀大数据及人工智能技术团队开放报名,征集方案、众智创新,冲击百万奖金。

大赛优势

大赛赛程

大赛启幕仪式及签约仪式

2018年6月21日
大赛规划发布,正式启幕;

大赛启动仪式

2018年8月11日
大赛赛题发布,专家受聘,全球开赛启动;

大赛初赛;

【第一赛道】2018年9月 - 2018年10月
【第二赛道】2018年9月 - 2018年11月
参赛者报名提交,开展走进高校、全球宣传活动,推动参与

大赛复赛

2018年10月 -2018年11月
优秀团队及作品选拔,扩展大赛影响力;

大赛决赛嘉年华

2018年11月24日-2018年11月25日
开展数据科学家论坛、答辩评审、浑南夜话、颁奖典礼活动。

2018 CCF BDCI大赛专家智囊团

大赛指导委员会主席

梅 宏 中国科学院院士 北京理工大学副校长
李国杰 中国工程院院士 中科院计算所研究员
徐宗本 中国科学院院士 西安交通大学教授
倪光南 中国工程院院士 中科院计算所研究员
陈国良 中国科学院院士 深圳大学教授
管晓宏 中国科学院院士 西安交通大学教授

大赛工作委员会主席

程学旗 中科院计算所研究员 CCF大数据专家委员会秘书长
陈宝权 北京大学教授 CCF常务理事
陈恩红 大数据学院常务副院长 CCF大数据专家委员会副主任
陈 钟 北京大学教授 教育部计算机教指委副主任
崔 斌 北京大学教授 CCF数据库专业委员会秘书长
赵东岩 北京大学教授 CCF中文信息技术专业委员会秘书长
张云泉 中科院计算所研究员 CCF高性能计算专业委员会秘书长
点击查看更多专家信息

数据驱动 智见未来 全球启动 慧聚智谷

“沈阳•中国智谷”位于沈阳市东南部,地处沈阳经济区地理几何中心,是沈阳新的行政中心、科技中心、文化中心、商贸中心。域内交通便捷畅达,生态环境优美,综合配套完善,是东北地区的交通枢纽、国家级生态区和生态文明试点区、全国首批智慧城市建设试点地区。

“沈阳•中国智谷”产业基础雄厚,科技创新体系完善,政策环境优越。沈阳市超过三分之一的高新技术企业在此落户,拥有70个省级以上工程技术研究中心,6个国家级孵化器和32个科技创新平台,形成了以信息技术、智能制造、生物医药、健康医疗、汽车零部件、民用航空、现代建筑、新材料、电子商务等9大产业为主导的现代产业体系,是东北地区唯一集国家级高新技术产业开发区、中国辽宁自由贸易区沈阳片区、沈大自主创新示范区、全国综合配套改革试验区、国家级双创示范基地等多种政策区于一体的地区,享有部分市级管理权限,以及产业扶持、科技创新、行政审批、外贸通关等方面系列优惠政策,是东北地区投资条件最好、发展环境最优的地区之一。

今后5至10年,“沈阳•中国智谷”将着力打造智能制造和新一代信息技术、健康医疗和生物医药、电子商务、民用航空等四个千亿产业集群,加快建设成为国际化营商环境先导区、全国高新技术产业集聚区、国家创新创业示范区、沈阳现代化新城区、缔造幸福沈阳样板区。

2018 CCF BDCI赛题详情

  • 自动驾驶三维点云分割

    查看赛题
    赛题描述:面向自动驾驶的三维点云标注数据非常稀有,严重阻碍相关科研的发展。赛题要求参赛者给出测试数据中每个点的类别预测。要求参赛者的方案在i7 CPU+GTX 1080 GPU显卡的硬件上达到至少10帧每秒的处理速度。阿里巴巴希望借助本次比赛开放一批面向自动驾驶的三维点云数据,和学术界共同探索针对自动驾驶的高效三维点云分割方案。相比于基于现有的方案进行简单的调参,我们更鼓励参赛者提出创新的解决方案。
    • 出题单位:阿里巴巴集团
    • 技术方向:目标提取, 无人驾驶
  • 基于视频的可移动物体实例分割

    查看赛题
    赛题描述:自动驾驶是当前科研和产业界非常重要的项目。环境感知是自动驾驶众多关键技术之一。百度这个赛题的目的是推动在环境感知问题中计算机视觉和机器学习算法的科研水平。为此我们开放了一个具备精细标注的大规模数据集。基于这个数据集,我们也定义了一系列实际的问题,并希望参赛者为自动驾驶开发新颖独特的算法和框架。在这个比赛中,我们选取了基于视频的可移动物体分割的任务,参赛者也可以在百度Apollo官网上找到更多的相关任务。在这个任务中,我们提供给参赛者一系列像素级别标注的视频图像,其中可移动物体例如车辆和行人为实例标注。任务的目的是评估当前先进的基于视频的物体分割算法。
    • 出题单位:百度
    • 技术方向:图像处理、无人驾驶
  • 互联网金融平台用户评价观点提取

    查看赛题
    赛题描述:举办方提供互联网金融平台用户评论数据及相关新闻数据,参赛者也可自行爬取更多的数据进行辅助分析。参赛者根据用户评论数据进行分析,提取用户对于平台的评价或印象(如:利率高、提现速度慢、客服态度好、活动多、安全有保证、不讲信用等),要求相同或相似评价进行聚合处理(如:利率高、收益率高等认为属于相同或相似评价)。同时,分析新闻事件对用户评论观点随时间变化的影响。
    • 出题单位:中科天玑
    • 技术方向:信息抽取,自然语言处理
  • 供应链需求预测

    查看赛题
    赛题描述:为提升用户物流服务体验,供应链协同将货品提前准备在全球各个市场的本地仓,降低物流时效提升用户物流服务体验。不同于国内电商物流情况,出海电商的产品生产和销售地区是全球化的,商品的采购,运输,海关质检等,整个商品准备链路需要较长的时间。在大数据和人工智能技术快速发展的新时代背景下,运用大数据分析和算法技术,精准预测远期的商品销售,为供应链提供数据基础,建立出海企业全球化供应链方案提供技术支持。
    • 出题单位:执御
    • 技术方向:数据挖掘、定论预测
  • 基金间的相关性预测

    查看赛题
    赛题描述:基金间的相关性是基金的重要特征。根据金融学原理,一个基金组合的整体风险,不仅和其中各只基金的风险水平有关,还和这些基金之间的相关性有关。构造一个基金之间相关性小、或者说分散程度高的基金组合,能在保持一定收益水平的基础上,降低整体风险。因此,参赛者需要根据给出的基金净值、基金业绩比较基准、对应指数行情、基金间相关性等数据,构建模型、算法进行训练。然后针对提供的测试样本,通过算法或模型预测出之后一段时间内基金间的相关性情况。
    • 出题单位:宜信大数据
    • 技术方向:相关性预测,机器学习
  • 汽车行业用户观点主题及情感识别

    查看赛题
    赛题描述:随着政府对新能源汽车的大力扶植以及智能联网汽车兴起都预示着未来几年汽车行业的多元化发展及转变。汽车厂商需要了解自身产品是否能够满足消费者的需求,但传统的调研手段因为样本量小、效率低等缺陷已经无法满足当前快速发展的市场环境。因此,汽车厂商需要一种快速、准确的方式来了解消费者需求。本赛题提供一部分网络中公开的用户对汽车的相关内容文本数据作为训练集,训练集数据已由人工进行分类并进行标记,参赛队伍需要对文本内容中的讨论主题和情感信息来分析评论用户对所讨论主题的偏好。
    • 出题单位:艾普深瞳
    • 技术方向:情感识别、自然语言处理
  • 面向电信行业存量用户的智能套餐个性化匹配模型

    查看赛题
    赛题描述:电信产业作为国家基础产业之一,覆盖广、用户多,在支撑国家建设和发展方面尤为重要。随着互联网技术的快速发展和普及,用户消耗的流量也成井喷态势,面对种类繁多的套餐,如何选择最合适的一款对于运营商和用户来说都至关重要。针对电信套餐的个性化推荐问题,通过数据挖掘技术构建了基于用户消费行为的电信套餐个性化推荐模型,根据用户业务行为画像结果,分析出用户消费习惯及偏好,匹配用户最合适的套餐,提升用户感知,带动用户需求,从而达到用户价值提升的目标。
    • 出题单位:中国联通研究院
    • 技术方向: 数据挖掘、分类预测
  • 视频中人体姿态识别

    查看赛题
    赛题描述:姿态识别又称姿态估计旨在 RGB 图片和 Video 中的人体像素映射到肢体的三维曲面(3D surface),其涉及了很多计算机视觉任务,如目标检测,姿态估计,分割,等等。姿态估计的应用场景不仅包括关键点定位,如图形(Graphics),增强显示(Augmented Reality, AR),人机交互(Human-Computer Interaction,HCI),还包括 3D 目标识别的很多方面.本赛题提供6段不同场景的下的视频,(视频源来自于互联网某视频类网站)要求参赛者针对提供的视频进行姿态识别。
    面临的挑战和难点:背景复杂多变、人体的肢体运动比较灵活、视角的变化、衣着的变化
    • 出题单位:零点有数
    • 技术方向:图像识别、姿态识别
  • 基于GPU服务器的图数据三角形计数算法设计与性能优化

    查看赛题
    赛题描述:大数据时代,对关联(图)数据的处理被广泛应用于社交网络、智能交通、移动网络等领域。对图数据的三角形计数被广泛应用于图数据的特征描绘(如聚集系数、联通度等)、社区结构检索、子图匹配、生物网络等应用。在给定服务器平台,以及数据集上实现三角形计数(Triangle Counting,TC)算法,调试并获得最高的性能。三角形的定义是一个包含三个顶点的子图,其中顶点两两相连。
    • 出题单位:费马科技
    • 技术方向:查询优化、系统工程
  • 大规模分布式多路Join查询优化

    查看赛题
    赛题描述:在大数据查询分析技术中,多路Join查询在许多大数据分析场景中扮演着重要的角色。除了传统的多表关联查询分析应用之外,多路Join查询还可以被用于检测复杂网络中的模式结构、挖掘语义网中的知识等场景。然而,在大数据分布式存储模式下,已有的单机多路Join查询算法并不适用,因此,需要研究高效的分布式多路Join查询算法。与单机多路Join查询相比,大规模分布式多路Join查询与优化具有更高的技术挑战性,不仅需要考虑Join过程中的计算开销,还需要考虑计算节点间的数据传输与通信开销。本赛题旨在基于大数据分布式计算引擎Apache Spark,对分布式多路Join算法进行优化,进而提升分布式多路Join查询的性能。
    • 出题单位:深鉴科技
    • 技术方向:查询优化、系统工程

往届大赛盛况

数据驱动,智见未来。全球启动,慧聚智谷。