案例 :SVP/一种用于深度学习的高效数据选择方法
本文长度为1800字,建议阅读7分钟
本文为你介绍SVP方法如何在保证识别准确率的同时,有效地提高深度学习中计算效率。
本文主要介绍了SVP(Selection via proxy)方法。作为一种用于深度学习的数据选择方法,其可以在保证识别准确率的同时,有效地提高深度学习中计算效率。例如,在主动学习中,SVP运行速度最多可提高41.9倍,同时误差没有显著增加,这对于深度学习中提高模型训练速度来说是一个有效方法。
论文链接:
https://openreview.net/pdf?id=HJg2b0VYDr
代码链接:
https://github.com/stanford-futuredata/selection-via-proxy
直觉:模型架构对样本的排序相似
根据一些信息的度量(例如:熵)对样本进行排序;
选择排名最高的样本;
根据选定的样本更新模型。
创建高效且有用的代理模型
缩小网络规模
对于具有多层的深层模型,我们可以减小隐藏层的大小或数量,这是在权衡模型精度下减少训练时间的简单方法。例如,ResNet20模型在26分钟内在CIFAR10数据集中取得了7.6% 的 top-1误差,而更大的ResNet164模型花费了4小时才减少了2.5%的误差。
训练轮数减少
在训练期间,大部分时间都花在了误差减少相对较小的时间段。例如,在训练ResNet20模型时,几乎一半的训练时间(26分钟中的12分钟)都花费在改进测试集的1.4%错误率上。基于这些观察,我们还研究了可以更快地获得目标模型决策边界的近似值并且使用较少迭代次数的代理训练模型。
结果
总结
原文标题:
Selection via Proxy: Efficient Data Selection for Deep Learning
原文链接:
https://dawn.cs.stanford.edu/2020/04/23/selection-via-proxy/
END
转自: 数据派THU 公众号;
版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。
合作请加QQ:365242293
数据分析(ID : ecshujufenxi )互联网科技与数据圈自己的微信,也是WeMedia自媒体联盟成员之一,WeMedia联盟覆盖5000万人群。
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

随时掌握互联网精彩
- 1 跟着总书记探寻文明之光 7904203
- 2 中方回应朝鲜确认向俄罗斯派兵 7809532
- 3 新娘因长相太美被质疑AI换脸 7714170
- 4 关税冲击如何应对 7616909
- 5 今年首个“蛇年蛇月蛇日蛇时”来了 7521110
- 6 曹骏 内娱寻亲第一人 7427210
- 7 外交部回应李嘉诚卖港口:望审慎行事 7332940
- 8 太原现“晋A好几个8”车牌 交警调查 7234965
- 9 郭晶晶夫妇现身李兆基丧礼 7143792
- 10 夫妻俩因为孩子丢失 35年几乎不说话 7043137