案例 :SVP/一种用于深度学习的高效数据选择方法
本文长度为1800字,建议阅读7分钟
本文为你介绍SVP方法如何在保证识别准确率的同时,有效地提高深度学习中计算效率。
本文主要介绍了SVP(Selection via proxy)方法。作为一种用于深度学习的数据选择方法,其可以在保证识别准确率的同时,有效地提高深度学习中计算效率。例如,在主动学习中,SVP运行速度最多可提高41.9倍,同时误差没有显著增加,这对于深度学习中提高模型训练速度来说是一个有效方法。
论文链接:
https://openreview.net/pdf?id=HJg2b0VYDr
代码链接:
https://github.com/stanford-futuredata/selection-via-proxy
直觉:模型架构对样本的排序相似
根据一些信息的度量(例如:熵)对样本进行排序;
选择排名最高的样本;
根据选定的样本更新模型。

创建高效且有用的代理模型
缩小网络规模
对于具有多层的深层模型,我们可以减小隐藏层的大小或数量,这是在权衡模型精度下减少训练时间的简单方法。例如,ResNet20模型在26分钟内在CIFAR10数据集中取得了7.6% 的 top-1误差,而更大的ResNet164模型花费了4小时才减少了2.5%的误差。
训练轮数减少
在训练期间,大部分时间都花在了误差减少相对较小的时间段。例如,在训练ResNet20模型时,几乎一半的训练时间(26分钟中的12分钟)都花费在改进测试集的1.4%错误率上。基于这些观察,我们还研究了可以更快地获得目标模型决策边界的近似值并且使用较少迭代次数的代理训练模型。
结果


总结
原文标题:
Selection via Proxy: Efficient Data Selection for Deep Learning
原文链接:
https://dawn.cs.stanford.edu/2020/04/23/selection-via-proxy/
END
转自: 数据派THU 公众号;
版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。
合作请加QQ:365242293
数据分析(ID : ecshujufenxi )互联网科技与数据圈自己的微信,也是WeMedia自媒体联盟成员之一,WeMedia联盟覆盖5000万人群。

关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
- 1 习近平同马克龙交流互动的经典瞬间 7904661
- 2 微信表情包戒烟再度翻红 7807868
- 3 黑龙江水库冰面下现13匹冰冻马 7714631
- 4 2025你的消费习惯“更新”了吗 7617932
- 5 存100万存20万利率一样透露啥信号 7519729
- 6 劲酒如何成了年轻女性的神仙水 7424217
- 7 你以为的进口尖货 其实早已国产了 7333269
- 8 杭州野生动物园黑熊突然袭击饲养员 7235354
- 9 美军承认:击落美军战机 7141010
- 10 中疾控流感防治七问七答 7046521







数据分析
