深度学习开放数据集

最近添加

符号化音乐数据集

自然图像数据集

人工数据集

脸部图像数据集

文本数据库

语音数据集

  • TIMIT语音语料库:音素分类
  • MovieLens 第一个数据集包含943位用户对1682部电影的10万项评价,分为五个不相交的子集。第二个数据集有6040位用户对3900部电影的100万项评价。
  • Jester:73421位用户对100个笑话的410万项连续评价(-10.00到+10.00)。
  • Netflix Prize:Netflix发布了其电影评价数据集的匿名版本;其中包括1亿项评价,共有48万名用户参与评价,每人评价的电影数量为1部到所有17770部不等。
  • Book-Crossing数据集:来自Book-Crossing社区。包括278858位用户对271379本书的1149780项评价。

其他数据集

感谢deeplearning.net提供多项链接和数据集说明。欢迎提出其他任何值得向Deeplearning4j社区介绍的开数据集!

与我们在Gitter聊天