逻辑回归测试数据
NEZHA预训练模型
贝壳找房-房产行业聊天问答匹配
账号样本集(accounts.txt)和关联样本集(relatins.txt)。账号样本集,包含两个字段,分别为临时唯一id和账号字段,关联账号样本集,包含4个字段,分别为关联A账号临时唯一id、关联A账号账号字段、分别为关联B账号临时唯一id和关联B账号账号字段
2020CCF BDCI 基于买方意向的货物撮合交易赛道数据集
0000
基于随机森林算法实现电信用户流失预测任务
SNLI语料库(1.0版)是一个570k人工编写的英语句子对的集合,这些句子对经过手动标记以实现平衡分类,并带有enume,矛盾和中性标签,支持自然语言推理(NLI)的任务,也称为识别文本蕴涵(RTE)。
Quora Question Pair是美国知识问答网站Quora发布的数据集,包括超过40万个问题对,旨在检测出重复的问题对
命名实体识别中的常用数据集
该数据集包含来自亚马逊的精美食品评论。
训练集中有8000个句子,测试集中有2717个句子。
Ubuntu Dialog Corpus是Ubuntu平台的技术支持人员与用户之间的对话数据集,包括大约930000个多轮对话,我们采样部分数据作为本案例使用的数据集。
MMDetection是基于PyTorch的开源对象检测工具箱。这是香港中文大学多媒体实验室开发的OpenMMLab项目的一部分。