谷歌大脑负责人:深度学习需要至少十万个样本

百家 作者:硅谷洞察 2017-11-08 05:00:07



硅谷Live / 实地探访 / 热点探秘 / 深度探讨




深度学习究竟需要多少数据才足够?





虽然如今深度学习科技已经进一步点燃了 AI 之火,但这项技术却常因需要大量的数据而备受诟病。人们也一直在争论,究竟深度学习需要多少数据才足够呢?

( Jeff Dean , 图片来自网络)


“我认为那些至少拥有数以万计或是十万计的客户群体的公司才需要考虑是否使用深度学习技术的问题,” Jeff Dean,谷歌的资深研究员,近期在伯克利举行的一场大会上接受采访时说到,“如果你只有十个样本,那你与深度学习无关。如果你有将近十万件你关心的事情,数据,记录,这时你才应该开始考虑使用这方面的技术。”


Dean 是机器学习方面的专家,他是谷歌大脑团队的负责人,这个团队专门研究计算机科学和人工智能相关的各种问题。他本人自从1990年代就开始研究神经网络,而当时他还在撰写关于人工神经网络的本科毕业论文。


在他看来,机器学习技术有机会影响到所有产业。但其发展速度要视各个产业的具体情况而定。


在人们使用机器学习技术之前,他们需要跨过多重障碍。首当其冲的,就是处理数据,一项颇为耗时且需要大量人为干预的工作。


“其实许多存在于机器学习系统中的工作并不是真正的机器学习,” Dean 如此说道。“但你仍然需要大量地去做这些工作。你需要将数据聚集到一起,然后人工地为他们都贴好样本标签,再之后,你需要写一些数据处理管道来生成你希望机器学习使用的数据组。”


为了能简化生成机器学习习系统的全过程,谷歌正在尝试利用机器学习技术来决定解决特定问题该使用怎样的系统。这是一个极复杂的任务,但是 Dean 透露,整个团队的初期研究成果展现出了颇为乐观的前景。


本文编译自VB


想和探长聊一聊?来加探长个人微信号 svinsight




推荐阅读


卫哲 | 王刚 | 姚劲波

胡海泉 | 朱啸虎

区块链报告 | 脑机接口报告 

硅谷人工智能 | 斯坦福校长

王者荣耀 | 返老还童 




关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接