

Arithmetic Big data
全国大数据与计算智能挑战赛是由大数据与决策(国家级)实验室组织的年度赛事活动,旨在深入挖掘大数据应用实践中亟需破解的能力生成难题,选拔汇聚数据领域优势团队,促进大数据领域的技术创新和面向需求的成果生成,推动形成“集智众筹、联合攻关、共享共用”的研建用一体迭代演进创新模式。
本届大赛以“发榜挑战、集智攻关”为主题,面向全国大数据与计算智能领域的相关单位,将围绕自然语言处理、目标识别、图像检测、隐私计算等前沿技术难点开设赛道,以“揭榜打擂”的形式组织创研竞赛,通过线上打榜与现场评审相结合的方式决出优势团队,进一步创新大数据管理与应用模式,推动大数据与计算智能领域技术发展与生态构建。
本届大赛还与粤港澳大湾区(黄埔)国际算法算例大赛、第三届“金海豚”杯电子水声对抗算法挑战赛等顶级赛事联动,给参赛团队提供了更多的发展机会与资源支持,为大数据与计算智能相关技术的创新发展注入更加强劲的动力。
热烈欢迎全国各工业部门、科研院所、各高校及民营企业的业内优势团队踊跃参赛揭榜!
了解更多赛事信息 2024全国大数据与计算智能挑战赛
• 赛题名称
领域事件多因果关联挖掘
• 赛题背景
事件之间的因果性分析是一项关键的认知任务,它涉及从复杂文本中识别和分析事件及其相互关系,具有严密的逻辑性。这一过程有助于揭示事件背后的深层逻辑,进而支撑各种决策。
领域事件多因果关联挖掘是从给定文本中识别并抽取出所有具有因果关系的事件以及鉴别其因果影响关系的任务,其中构成事件对的两个事件包含若干事件要素。传统的事件关系识别方法通常只涉及事件的关联性分析,而不深入至因果影响分析,导致得到的事件关联结果往往只是停留在表面层面。此外,不同领域文本中存在事件关系错综复杂,事件粒度参差不齐,专业术语难以理解等诸多特性,进一步限制了现有技术在事件提取和因果关系识别方面的效果。
本次赛题基于军事新闻、外交事件、冲突事件、全球经济等多个领域的新闻文本及标注,构建新闻多因果关联事件挖掘数据集(DSN-DEMAMD)。基于该数据集,发布领域事件多因果关联挖掘(DEMAMD)挑战,旨在通过竞赛促进领域事件多因果关联挖掘模型方法的研究,通过改进的自然语言处理等技术手段,提高事件因果关系识别的准确性和效率,支撑事件因果关联挖掘相关技术的落地,并推动相关领域人工智能应用的发展。
• 赛题任务
本赛题的任务为基于给定的涵盖军事新闻、外交事件、冲突事件、全球经济等多领域的DSN-DEMAMD新闻文本数据集,实现领域事件多因果关联挖掘。给定一个测试文档样本,要求从该样本中需找出所有具有因果关系的事件对,并识别不同事件之间的因果影响性(直接因果,间接因果)。要求给出原因事件和结果事件的事件类型、事件包含的主体、事件包含的主要行为(动作)、事件包含的客体(对象/次要动作)、事件时间、事件地点等6项事件要素。通过机器学习、深度学习等模型方法开发对应算法,使得模型在领域的事件多因果关联挖掘的场景下仍具有良好的性能。
输入: 一个具有事件因果关联信息的文本段落。
输出: 结构化的事件因果对,包含原因和结果事件的事件类型、事件主体、事件动作、事件客体、事件时间、事件地点等6项事件要素,以及因果影响性强度(仅复赛)。
示例:
输入:
据印度媒体19日报道,印度北部锡金邦18日18时10分发生里氏6.8级地震,震源深度约20公里。据印度媒体报道,锡金邦首府甘托克地区电路,交通等设施遭到严重破坏。由于断电和设施等问题,甘托克陷入一片黑暗,手机信号和网络中断。地震发生后,又接连发生两次强烈余震。
输出:
"causality_list": [
{"causality_type": "直接", //初赛阶段无需此字段
"cause": {
"class": "自然灾害", // 原因事件类型
"actor": "印度北部锡金邦", // 原因事件主体
"action": "发生", // 原因事件动作
"object": "里氏6.8级地震", // 原因事件客体
"time": "18日18时10分, // 原因事件时间
"location": "印度北部锡金邦" // 原因事件地点
},
"effect": {
"class": "社会事件", // 结果事件类型
"actor": "电路,交通等设施", // 结果事件主体
"action": "遭到", // 结果事件动作
"object": "严重破坏", // 结果事件客体
"time": "", // 结果事件时间
"location": "甘托克" // 结果事件地点
}
},
{"causality_type": "间接", //初赛阶段无需此字段
"cause": {
"class": "自然灾害", // 原因事件类型
"actor": "印度北部锡金邦", // 原因事件主体
"action": "发生", // 原因事件动作
"object": "里氏6.8级地震", // 原因事件客体
"time": "18日18时10分, // 原因事件时间
"location": "印度北部锡金邦" // 原因事件地点
},
"effect": {
"class": "社会事件", // 结果事件类型
"actor": "甘托克", // 结果事件主体
"action": "陷入", // 结果事件动作
"object": "一片黑暗,手机信号和网络中断", // 结果事件客体
"time": "", // 结果事件时间
"location": "甘托克" // 结果事件地点
}
}
…… // 该文档下的其他事件因果对
]
在示例文本中,可以得到若干因果关系。其中,文本中包含的事件有“印度北部锡金邦发生地震”、“电路,交通等设施遭到严重破坏”、“甘托克陷入一片黑暗,手机信号和网络中断”等,“印度北部锡金邦发生地震”直接导致了“电路,交通等设施遭到严重破坏”,而“印度北部锡金邦发生地震”间接导致了“甘托克陷入一片黑暗,手机信号和网络中断”,因此,输出结果中包含了这两组事件因果对。输出中的事件因果对包含了该因果关系类型,以及原因事件和结果事件的流向事件要素。文本中可能包含更多组因果事件对。
该赛题采用初赛、复赛、决赛的“三级赛制”,具体赛程安排如下:
2024/10/10-10/30,初赛阶段
2024/10/10,发布大赛赛题,选手可登录大赛官网报名;
2024/10/14,发布初赛赛题数据,选手可登录PC端大赛官网赛题详情页下载数据集,同步开启初赛线上评测。选手可在线提交结果文件至竞赛平台,每日每队最多可提交3次,测评系统将自动评测得分并同步更新至排行榜。排行榜上将记录选手的最高成绩,相关团队必须自行保存最高成绩作品的源代码以备审核;
2024/10/28(12:00),截止报名组队及团队信息修改;
2024/10/30(24:00),截止初赛作品提交,遴选决出前30支团队入围复赛。
2024/11/01-11/07,复赛阶段
2024/11/01-11/07,入围复赛的团队登录PC端大赛官网赛题详情页下载复赛数据集,选手可在线提交结果文件至竞赛平台,每日每队最多可提交3次,测评系统将自动评测得分并同步更新至排行榜。排行榜上将记录选手的最高成绩,相关团队必须自行保存最高成绩作品的源代码以备审核。
2024/11/09-11/19,复现阶段
2024/11/09-11/19,反作弊审核,作品成绩复现,每道赛题遴选决出5支团队入围决赛。
2024/11/28-11/29,决赛阶段(长沙)
2024/11/28-11/29,组织线下专家评审,入围决赛团队现场答辩,公布优胜队伍,并组织颁奖典礼。
备注:
组队及作品提交请在PC端进行操作;
以上赛程安排均为北京时间计算,赛程时间将根据实际情况调整,请及时关注通知。
奖项 | 数量 | 奖项激励 |
---|---|---|
一等奖 | 1支获奖队伍/赛题 | 获奖证书 & 获奖团队所属单位将获得大赛主办单位给予的赛题成果转化研究经费支持 |
二等奖 | 2支获奖队伍/赛题 | 获奖证书 & 获奖团队所属单位将获得大赛主办单位给予的赛题成果转化研究经费支持 |
三等奖 | 2支获奖队伍/赛题 | 获奖证书 & 获奖团队所属单位将获得大赛主办单位给予的赛题成果转化研究经费支持 |
优胜奖 | 若干/赛题 | 各赛题入围复赛(未入围决赛)且在复赛中提交复赛作品并取得有效成绩的团队 |
1.根据线上评测和线下专家评审结果,每道赛题分别设置一等奖1组、二等奖2组、三等奖2组、优胜奖若干;
2.获奖参赛队将获得由大赛主办单位颁发的获奖证书;
3.获得第一、二、三等奖的参赛队所属单位将获得大赛主办单位给予的赛题成果转化研究经费支持,用以支撑参赛队成员进一步深化和完善参赛成果,攻克相关技术难题。
报名组队规则
参赛对象:面向全国各工业部门、科研院所、高校、民营企业。
报名要求:参赛队须以单位名义报名,同一单位可有多支不同的参赛队。参赛选手可报名参加多个赛题,但在同一赛题中仅能报名参加一支团队。报名时所有参赛队成员需提供所在单位信息、个人基本信息,并进行实名认证;参赛选手应当保证各项信息的真实性。学生参赛者报名须指定至少一名所在单位任职的具有中级职称以上相关领域科研工作者作为团队指导教师。大赛组委会承诺其中涉及个人隐私的内容予以保密。
组队要求:所有报名参加同一赛题的参赛者,可在PC端进行组队操作。所有参赛选手应在截止日期前自行完成组队,每队1-5人(含指导教师),不可重复组队。并以团队身份提交各阶段的作品材料,一旦进入团队,不可退出队伍。多个单位的参赛者联合组队时,队长所在单位为该参赛队的第一单位。为保证每支参赛团队享有相对平等的提交机会,各赛题组队需满足组队成员在赛题中的提交总次数≤开赛天数*3次。
队长责任制:各团队队长作为团队的负责人,需自行进行团队内部分工和协调,并承担与大赛组委会对接沟通(包括但不限于晋级入围、团队信息收集、作品审核、线下活动等)的责任。
回避原则:参与大赛出题的人员禁止参与所出具的赛题(可参与其他赛题),禁止委托他人参赛或违规指导参赛团队。
作品要求
作品原创:参赛作品必须保证原创性,不违反任何中华人民共和国有关法律法规,不侵犯任何第三方知识产权或其他权利,一经发现或经权利人提出并查证,大赛组委会将取消其比赛资格和成绩并进行严肃处理。
作品知识产权:未获奖参赛作品(包含但不限于算法、模型、方案等)知识产权归出题单位、参赛者单位共享;获奖参赛作品(包含但不限于算法、模型、方案等)知识产权归属以定向项目研究资助协议约定为准;大赛组织单位拥有对参赛作品组织投资对接和产品孵化服务的优先权利;大赛组织方有权利将参赛作品、比赛信息、参赛团队信息用于宣传品、相关出版物、制定及授权媒体发布、官方网站浏览及下载、展览(含巡展)等活动项目。
竞赛数据说明:组委会授权参赛人员使用提供的数据进行指定比赛的模型训练工作,参赛人员不得将数据用于任何商业用途。若做科研使用,请与赛事主办方联系确认。
作品合规性:参赛团队需保证提交作品的合规性,若出现下列或其他重大违规的情况,经大赛组委会合议后,取消参赛团队的参赛资格和成绩,获奖团队名单依次顺延。重大违规情况如下: 1)使用小号、串通、剽窃他人代码等涉嫌违规、作弊行为;2)不经允许使用外部数据;3)团队提交的材料内容不完整,或提交任何虚假信息;4)参赛团队无法就作品疑议进行足够信服的解释说明;5)提交的作品包含不健康、淫秽、色情或诽谤任何第三方的内容等其他重大违规行为。
评审规则
评审条件:所有符合资格的参赛团队在初赛截止日期前所提交的作品均会纳入评审。大赛组委会不对任何因电脑、互联网、移动网络故障而造成的参赛作品损坏、缺失、提交延时等后果承担责任。
公平竞技:参赛团队禁止在指定考核技术能力的范围外,利用规则漏洞或技术漏洞等不良途径提高成绩与排名,禁止在比赛中抄袭他人作品、交换答案、使用多个小号,一经发现将取消比赛成绩并严肃处理。
评审方向:大赛组委会将组织评审专家对作品进行评审,包括但不限于作品的成熟度、先进性、创新性、实用性、普适性、社会效益、商业价值等因素。
作品复现及验证:参赛选手需要配合大赛组委会对比赛作品的有效性与真实性进行验证,同时自行检查提交作品的正确性,确认无误后再进行提交,大赛组委会不负责对比赛作品进行更改和调整。
评审结果确认:大赛专家委员会对作品的评审结果一旦给出则为最终结果,不另对评审结果给出反馈意见。
组织方权利
(1)大赛组委会保留拒绝某人、某团队参赛或提交作品的权利。
(2)大赛组委会拥有对比赛违规、作弊行为的判定权利和处置权利,对影响比赛组织及比赛公平性的参赛团队,大赛组委会保留收回或拒绝授予其奖项、项目资助的权利。
(3)若因故出现数据更新、评审代码更新、作弊检查等原因,大赛组委会有权对参赛结果进行重新测评并更新排行榜。
(4)大赛组委会保留修改比赛各环节时间,包括但不限于作品提交截止日期、线上线下活动日期以及路演、颁奖典礼日期的权利。
(5)大赛组委会保留调整比赛各阶段入围团队数量的权利,调整奖项设置及项目资助的权利,收回或拒绝授予某个特定参赛团队奖项、项目资助的权利。
(6)大赛组委会保留对比赛规则进行调整修改的权利,大赛主办方拥有对大赛的最终解释权。