数据集
< 返回列表时间: 2020-07-16来源:OSCHINA
网罗数据集,不定期更新!
数据集链接:https://pan.baidu.com/s/1RgmRv80zQB71HSze8bQvwA
提取码:ih2c
酒品数据集( wine.csv) 数据格式:wine.csv 标签:有 语言: 英文

Wine
Alcohol
Malic.acid
Ash
Acl
Mg
Phenols
Flavanoids
Nonflavanoid.phenols
Proanth
Color.int
Hue
OD
Proline

X: [1:] 13个feature
y: [0] 3分类(1 2 3) 数据大小:10.8k,178条数据 数据用途:多分类任务 预处理代码:
构造Dataset & Dataloader : https://my.oschina.net/u/4228078/blog/4320363
纯英文预料数据集(text8.zip) 数据格式:text8.train.txt text8.dev.txt text8.test.txt 英文数据集,无标点无换行 标签:无 语言: 英文 数据大小:95M 数据用途:文本分析 预处理代码: https://my.oschina.net/u/4228078/blog/4405730 项目:语言模型实现: https://my.oschina.net/u/4228078/blog/4462382
名字-国家数据集(names.csv.gz.zip) 数据格式:names_train.csv.gz names_test.csv.gz csv的压缩gz格式文件
第一列[0]:人名
第二列[1]:人名对应的国家 标签:有 语言: 英文 数据大小:train:13374条数据 test:6700条数据 数据用途:根据人名预测国籍 预处理代码: https://my.oschina.net/u/4228078/blog/4415324
青云数据集(qingyun.tsv) 数据格式:qingyun.tsv
第一列[0]:问题
第二列[1]:回答 标签:有 语言: 中文 数据大小:105914条对话 数据用途:开放式聊天机器人 预处理代码:
英文-中文翻译数据集(translate_en2cn) 数据格式:英文+'\t' + 中文 标签:有 语言: 中英文 数据大小:1.1M 数据用途:机器翻译 预处理代码: https://my.oschina.net/u/4228078/blog/4471073
图片数据集(ants, bees) 数据格式:图片 标签:有 语言: 数据大小:400张图片 数据用途:图片分类 预处理代码:
热门排行