深度学习的准确率

自2006年以来,深度学习不断刷新着一个又一个基准数据集的测试纪录。在许多竞赛中,深度学习也所向披靡,横扫所有其他算法。下列报道和资源足以证明深度神经网络功能强大,发展势不可挡:

  • MNIST:用DropConnect对神经网络进行正则化;使用DropConnect后误差率为0.21%
  • DeepFace:接近人类水平的面部确认;处理自然脸部检测(LFW)数据集的准确率达到97.35%,误差比之前最先进的水平降低了27%,接近于人类的识别水平(约为97.53%)。
  • Andrew Ng在他2011年的深度学习讲座里概述了深度学习在许多领域中实现的准确率上的飞跃
  • 而最近他也带领百度团队在语音和图像识别方面取得了多项突破:
  • Deep Speech处理Hub5’00数据集的结果优于学术界多种最先进的语音识别模型,拉开了大约9%的差距,而且经证实在嘈杂环境中也能达到81%的准确率,击败各类领先的商业算法。
  • 谷歌的深度神经网络以6.66%的误差率赢得了2014年ImageNet大赛冠军。
  • CIFAR-10数据集测试结果列表
  • Rodrigo Benenson的博客,包括CIFAR-10、CIFAR-100、STL-10、SVHN、ILSVRC2012 task 1、Pascal VOC 2011 comp3、Caltech Pedestrians USA、INRIA Persons、MSRC-21、利兹大学体育姿势数据集(Leeds Sport Poses)和显著物体检测数据集(Salient Object Detection)等基准数据集的测试结果。
  • 谷歌在其安卓智能手机操作系统中采用了基于深度学习的语音识别后,单词错误减少了25%。
  • Kaggle前总裁及Enlitic创始人Jeremy Howard在2013年曾说过,大多数获奖者使用的都是决策树(随机森林)的集成算法或深度学习算法
  • 曾经师从Yann LeCun的Pierre Sermanet用一个深度学习库夺得了Kaggle猫狗分类竞赛的冠军。
  • George Dahl等人在2012年用深度学习帮助默克制药公司将预测有效候选药物的能力提高了15%。
  • 2013年ImageNet大赛的所有参赛选手都使用了深度学习算法。

Juergen Schmidhuber和他的团队用深度循环网络在下列竞赛中获胜

  • IJCNN 2011交通标志识别竞赛
  • ICPR 2012 “乳腺癌组织图像有丝分裂检测”竞赛。这对于乳腺癌预后十分重要。人工识别组织中的有丝分裂细胞是很困难的。
  • ISBI 2012神经元结构分割挑战赛。竞赛的目标是依据大量动物大脑切片的电子显微镜图像来建立脑内神经元及树突的模型。
  • ICDAR 2011离线汉字手写识别竞赛。Schmidhuber的团队获得了冠军,而全体成员无一人通汉语。
  • 在线德国交通标志识别竞赛(2011年,包揽第一、第二名)。
  • ICDAR 2009阿拉伯语连续手写识别竞赛
  • ICDAR 2009波斯语/阿拉伯语字符手写识别竞赛(同上)
  • ICDAR 2009法语连续手写识别竞赛。

我们还可以继续写下去,但那样就有点像老和尚念经了。:)

与我们在Gitter聊天