64000张汽车图片,再也没有理由说做汽车项目没有数据了

大数据文摘出品
作者:曹培信
找不到合适的数据集来解决对应的机器学习问题,这种痛苦大概只有MLer们才知道。
关于汽车的项目很多,比如拍照识车、汽车比价等等,尽管这些项目本身难度不大,但是往往受制于数据集的质量,模型的效果不能很好的发挥。
Github上一位名叫Nicolas Gervais的小哥就给出了一个关于汽车的数据集,数据相当全质量也相当高,在汽车方面有机器学习项目要做的同学,赶紧码住!
数据集的来源是The Car Connection网站,该网站是全球最大的汽车评测网站之一,致力于让汽车研究更加容易,Nicolas就是从这个网站上爬取的汽车数据。
??
数据集包括它收集了297000张图片,但是其中许多是汽车的内部图像,关于汽车的外观应该有大约60000张照片。
所有的文件都对汽车的15个参数进行了标注:
'Make', 'Model', 'Year', 'MSRP', 'Front Wheel Size (in)', 'SAE Net Horsepower @ RPM',
'Displacement', 'Engine Type', 'Width, Max w/o mirrors (in)', 'Height, Overall (in)',
'Length, Overall (in)', 'Gas Mileage', 'Drivetrain', 'Passenger Capacity', 'Passenger Doors',
'Body Style'并且根据这些参数来对图像进行命名,比如说名为Audi_A5_2013_43_18_210_20_4_73_54_182_24_FWD_4_2_Convertible_eUH.jpg的图片,代表的就是这样一辆车:

数据集下载链接:
https://drive.google.com/open?id=1TQQuT60bddyeGBVfwNOk6nxYavxQdZJD
可以说小哥爬的数据是相当用心了,其实在网上还有很多好的机器学习数据集,需要大家去慢慢探索,文摘菌也给大家再推荐一些可以找到好的数据集的网站。
Kaggle数据集:
www.kaggle.com/datasets
亚马逊数据集:
registry.opendata.aws
UCI机器学习库:
谷歌的数据集搜索引擎:
toolbox.google.com/datasetsearch
微软数据集:
Awesome公共数据集:
计算机视觉数据集:
2020年机器都在日夜学习了,数据集也给你准备好了,赶紧开始你的机器学习之旅吧!
实习/全职编辑记者招聘ing
加入我们,亲身体验一家专业科技媒体采写的每个细节,在最有前景的行业,和一群遍布全球最优秀的人一起成长。坐标北京·清华东门,在大数据文摘主页对话页回复“招聘”了解详情。简历请直接发送至zz@bigdatadigest.cn


关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
- 1 中国经济向世界提供“机遇清单” 7904789
- 2 再次提醒:中国公民近期避免前往日本 7808906
- 3 狂甩45次 无汞体温计才降到36℃ 7714510
- 4 2025这些“经济”持续成长壮大 7616719
- 5 女生被宿舍孤立关门外一夜?学校回应 7524457
- 6 “无名”男子医院躺7年半 警方介入 7424522
- 7 网警:男子AI生成车展低俗视频被拘 7334293
- 8 北冥有鱼竟然是真的 7236378
- 9 5000万粉丝女网红涉嫌逃税仍直播 7138466
- 10 寒潮来袭!多地气温将创下半年来新低 7040245



![抱走星星啊啊啊存图日常分享给大家[开学季] ](https://imgs.knowsafe.com:8087/img/aideep/2022/2/12/7a12a543b2504f68ca96da34e8d37ee7.jpg?w=250)
![马心瑞#你好春天# 穿上好看的衣服[微风]一起去春游吧 ](https://imgs.knowsafe.com:8087/img/aideep/2025/4/28/c4aee5ec7b8d98e3ddefd1de546aa600.jpg?w=250)


大数据文摘
