

Arithmetic Abnormal detection others
2020/10/13 11:51:44 data
(Data can be downloaded after registration) 训练集 - MD5: 165f3014ca14bc1c1dd8ede6d1b98cd7
2020/10/13 11:52:28 data
(Data can be downloaded after registration) A榜测试集 - MD5: 93fd7b4cf959638335fc9fc0c844ff30
2020/11/30 16:57:33 data
(Data can be downloaded after registration) B榜测试集 - MD5: 999956a6919ebc949a05b7bdfc129879
我们收集并提供了多个地区已脱敏的遥感影像数据,参赛队可以基于这些数据构建自己的地块分割模型。
样例图片及其标注如下图所示:
训练集图像文件名称:train.zip
包含140,000张分辨率为2m/pixel,尺寸为256256的JPG图片,文件名称形如T000123.jpg
训练集标注文件名称:annotation.zip
包含和图像文件同等数量,尺寸为256256的PNG格式的单通道伪彩色标注图片,图片的文件名称与train.zip中的图片名称对应, 文件名称形如T000123.png,像素值与类别对应关系如表1所示:
像素值 | 类别 |
---|---|
0 | 建筑 |
1 | 耕地 |
2 | 林地 |
3 | 水体 |
4 | 道路 |
5 | 草地 |
6 | 其他 |
255 | 未标注区域 |
其中,255代表了未标注区域,表示对应区域的所属类别并不确定,在评测中也不会考虑这部分区域。
测试集A文件名称:testA.zip
包含10,000张分辨率为2m/pixel,尺寸为256256的JPG图片,文件名称形如A000123.jpg
测试集B文件名称:testB.zip
包含20,000张分辨率为2m/pixel,尺寸为256256的JPG图片,文件名称形如B000123.jpg
复赛指标说明
复赛指标公式:
公式中:
p: 有效图像数量
c: 在第i张图中有效类别数量
m: 在第i张图的第j个类别中,ground truth中连通域个数
n: 在第i张图的第j个类别中的第k个连通域中,被分成n个部分
mIoU: 初赛指标
说明:
1.只统计类别3、类别4的区域连续性,故称类别3、类别4为有效类别
2.包含类别3或类别4的图像为有效图像
3.对于连通域个数的计算举例如下图ground truth,下图蓝色类别的连通域为2(因为图中有两个连续的蓝色区域),故在计算时m=2
假设下图为3中ground truth对应图像的模型预测结果,由3可知m=2,而模型将一处连通域“分割”成了3部分,故此处n=3。故这张图对应蓝色类别的连通性的计算为
1)本次比赛的测评分三阶段进行,我们会准备两个测试集,测试集A和测试集B,测试集A和测试集B中的图片与训练集中的图片均为相同来源。
2)初赛阶段和复赛阶段提交的预测结果均为zip压缩包,压缩包中包含与测试集中的文件名相同的单通道PNG图片。
3)初赛、复赛阶段提交的zip包中的图片格式必须为单通道PNG,文件数需要与测试集中的文件数相同,且文件名需要与测试集中的文件名一一对应。
4)提交的单通道PNG图片中的像素值必须在0~6之间,像素值不能为255,如果测试集中存在未标注区域,评测系统会自动忽略对应区域的提交结果。
初赛、复赛提交文件的命名:ccf_baidu_remote_sense.zip。提交的zip文件的组织方式如下所示:
主目录
├── A000001.png #每个结果文件以测试集图像名称+.png命名
├── A000002.png
├── A000003.png
├── …
主目录中必须包含与测试集相同数目、名称相对应的单通道PNG图片。每张单通道PNG图片中的像素值必须在0~6之间。
为方便参赛者快速了解比赛流程,我们提供了Baseline模型的训练方法和提交结果的生成方法,参赛者们可以报名百度大脑AI Studio官方练习场(https://aistudio.baidu.com/aistudio/competition/detail/54)一键获取官方Baseline。
初赛评测标准:
初赛使用国际通用指标平均交并比MIoU,记真实值为i,预测为j的像素数量为,则MIoU的具体计算公式为:
初赛测试使用的评估脚本也在baseline代码库中,可用于自测验证。
复赛时,评测系统除了计算MIoU外,还会结合遥感任务的特点,根据区域的连续性和边缘的准确度进行打分,具体的评测标准将在复赛开始时公布。
复赛评测标准:
公式中:
p: 有效图像数量
c: 在第i张图中有效类别数量
m: 在第i张图的第j个类别中,ground truth中连通域个数
n: 在第i张图的第j个类别中的第k个连通域中,被分成n个部分
mIoU: 初赛指标
说明:
1.只统计类别3、类别4的区域连续性,故称类别3、类别4为有效类别
2.包含类别3或类别4的图像为有效图像
3.对于连通域个数的计算举例如下图ground truth,下图蓝色类别的连通域为2(因为图中有两个连续的蓝色区域),故在计算时m=2
4、假设下图为3中ground truth对应图像的模型预测结果,由3可知m=2,而模型将一处连通域“分割”成了3部分,故此处n=3。故这张图对应蓝色类别的连通性的计算为