全部分类
测试标签

[真实或伪造]伪造职位发布预测

该数据集包含18K职位描述,其中约800个是伪造的。数据包括文本信息和有关作业的元信息。该数据集可用于创建分类模型,该分类模型可学习欺诈的职位描述。

2020/03/27 58 数据来源于 kaggle
环境

美国环境污染数据

数据包括2000年到2016年美国环保署记录的四种主要污染物情况,包括二氧化氮、二氧化硫、一氧化碳和臭氧的含量。

2020/03/27 50 数据来源于 kaggle
传染性疾病

SARS 2003爆发完整数据集

严重急性呼吸道综合症(SARS)是由SARS冠状病毒(SARS-CoV)引起的人畜共患病毒性呼吸道疾病,此数据集是来自全球的病例,死亡和康复数据。

2020/03/26 82 数据来源于 kaggle
图像识别

MPII Human Shape 人体模型数据

MPII Human Shape 人体模型数据是一系列人体轮廓和形状的3D模型及工具,模型是从平面扫描数据库 CAESAR 学习得到。

2020/03/26 39 数据来源于 humanshape
汽车

瓜子二手车汽车数据

6k辆瓜子二手车汽车数据。

2020/03/20 225 数据来源于 Kesci
传染性疾病

IT意大利2019新型冠状病毒COVID-19数据

截至当地时间16日18时,意大利新冠肺炎累计确诊27980例,其中死亡2158例,治愈2749例。在现有23073例确诊病例中,有11025名患者在医院接受普通治疗,1851人在重症监护室接受治疗,另有10197人居家隔离。

2020/03/20 203 数据来源于 github
图片分类

巴塞罗那城市风景数据集

数据集包含共15150张巴塞罗那的城市风景照,图片覆盖151类场景,可用于图片分类、语义分割等研究.

2020/03/19 56 数据来源于 KOTO
图片分类

血细胞图像

该数据集包含12500张血细胞增强图像(JPEG),并带有伴随的细胞类型标签(CSV)。

2020/03/19 50 数据来源于 kaggle
人口统计

1960-2018年世界人口

1960年至2018年每个国家/地区的人口

2020/03/13 137 数据来源于 kaggle
医疗卫生

帕金森疾病诊断数据集

本数据集包含188个患帕金森疾病的病人的相关数据,包含107男性和81个女性,年龄分布在33-87。

2020/03/12 88 数据来源于 UCI
医疗卫生

甲状腺疾病数据集

由Garavan研究所提供的甲状腺研究病例数据集。

2020/03/12 83 数据来源于 KOTO
传染性疾病

冠状病毒数据集 韩国的COVID-19数据集

COVID-19已在韩国感染了7000多人。 韩国疾病预防控制中心(KCDC)迅速透明地宣布了COVID-19的信息。 我们根据KCDC和地方政府的报告材料制作结构化的数据集。

2020/03/11 229 数据来源于 Kaggle
传染性疾病

意大利的COVID-19

意大利冠状病毒病2019例

2020/03/09 178 数据来源于 Kaggle
传染性疾病

冠状病毒数据集 韩国的COVID-19数据集

COVID-19已在韩国感染了7000多人。 韩国目前是全球感染率第二高的国家。

2020/03/09 99 数据来源于 kaggle
传染性疾病

丁香园论坛疫情讨论数据

DXY.com丁香园是国内最大的医学综合网站之一,其医学论坛聚集了国内的专业人士。在本次疫情的信息更新发布中也有着举足轻重的作用。数据集爬取自丁香园论坛,可用于分析网民对于疫情的讨论热点。

2020/03/06 302 数据来源于 丁香园