小米进军仿生四足机器人了,中文名「铁蛋」,英文名「CyberDog」。
在昨晚 MIX4 发布会的结尾,雷军突然公布了小米家族的新成员——「铁蛋」。「铁蛋」是它在小米内部的昵称,据说如此取名一般都会「命硬」,预示着开发容易成功。中文名主要负责接地气,英文名还得兼顾国际范儿,「CyberDog」在气质这一块拿捏得死死的。据雷军介绍,CyberDog 仿生四足机器人拥有仿生的运动步态,还拥有仿生的视觉和听觉交互体验,让它可以听从指令、识别主人甚至自动跟随主人运动。关键在于,和 B 家机器狗 50 多万元的价格相比,CyberDog 工程探索版的购入价格仅为 9999 元,小米表示将先拿出 700 台进行小范围限量发售。CyberDog 内置小米自研的伺服马达,提供 32N·m 最大输出扭矩、220rpm 最大转速以及 3.2m/s 的最快移动速度。这是它完成诸多复杂动作的基础:奔跑、跳跑、左右转体、前倾后仰、作揖、握手、打滚、后空翻。搭配运动控制算法,CyberDog 能够适应多种复杂地形,即使受到外力干扰也能快速恢复平衡。CyberDog 的大脑是英伟达的 Jetson Xavier NX 平台,这是一台用于嵌入式和边缘系统的 AI 超级计算机,包括 384 个 CUDA 核心、48 个张量核心、6 个 Carmel ARM CPU、2 个深度学习加速引擎。这保证了 CyberDog 可以毫无障碍地处理从传感器系统捕获的大量数据,准确领会主人的意图。为了完全模拟生物体,CyberDog 搭载了高精度环境感知系统,全身 11 个高精度传感器向 AI 大脑实时传输信息,包括触摸传感器、摄像头、超声波传感器、 GPS 模块等,可以感知图像、光线、距离、速度、声音等环境信息,通过即时反馈来引导自身运动。在 CyberDog 的设计上,小米工程师特别注重增强其感知周围环境的能力。机器狗嵌入了一系列摄像头传感器,包括人工智能交互式摄像机,双目超广角鱼眼摄像机,以及 Intel RealSense D450 深度模块,并且可以通过计算机视觉算法进行训练。建立在这个视觉传感器系统上的是自主的目标跟踪、 SLAM 和厘米级的避障及导航。这意味着 CyberDog 可以实时分析周围环境,创建导航地图、标出目的地、避开障碍物。结合人体姿势和人脸识别跟踪,CyberDog 能够跟随主人并绕过障碍物。用户可以通过语音助手设置唤醒词来命令和控制 CyberDog,也可以用附带的远程和智能手机应用程序。此外,CyberDog 提供了丰富的外部接口,包括 3 个 C 型端口和 1 个 HDMI 端口,开发者可以自由探索和集成各种创新的硬件附加组件或软件系统,比如搜索灯、全景摄像机、动态摄像机、 LiDAR 或其他。最后,CyberDog 负重为 3kg,比 Spot 机器狗弱一些。成熟的业界仿生四足机器人,是由波士顿动力创始的。后续追随者所打造的产品总有「大同小异」的味道,不过硬件价格一直在下降,这或许会带来更多的落地应用契机。斯坦福学生机器人俱乐部曾经开源了 Stanford Doggo 四足机器人,所有代码和设计图都能免费获得,DIY 成本不高于 3000 美元。Doggo 能完成走路、慢跑、跳舞、跳跃等动作,偶尔也能表演一下后空翻。今年 6 月,国内的宇树科技发布了 Unitree GO1,共有三个版本:售价 2700 美元的 G01 Air base 型号、售价 3500 美元的 G01 和售价 8500 美元的 G01 Edu。也就是说,Unitree GO1 起步价仅需 1.6 万元人民币,然而这个价格纪录目前已被小米的「铁蛋」打破了。
一位「铁蛋」诞生过程的参与者,在知乎平台分享了项目开发的经历:十个月前我们的狗子只是个构想,连个电机都没有。一路来从第一台样机到几台到几十台到几百台,人员也从几个人壮大到几十,从一两个部门到十几个部门参与。
在不到一年的时间里,小米工程师们是怎么打造出「铁蛋」的?雷军在演讲中提到,CyberDog 是基于 MIT Mini Cheetah 以及 ROS 2 的开源平台打造的。MIT 的 Mini Cheetah 算是后空翻机器人界的首位选手,同时拥有横向移动、跳跃、自动从摔倒中爬起等技能。小米此次也承诺,仿生四足机器人研发成果将向全球开源。一位参与铁蛋研发的小米工程师在知乎表示,「未来会进行项目的一期开源,并且会陆续把从嵌入式(电机,传感器,外设),Linux 内核,定制后的 rootfs,裁过的 ROS 2 的 repos,还有我们写的基于 ROS 2 的代码,以及基于 Mini Cheetah 改过的代码等等都开源出来。」NVIDIA对话式AI开发工具NeMo的应用
开源工具包 NeMo 是一个集成自动语音识别(ASR)、自然语言处理(NLP)和语音合成(TTS)的对话式 AI 工具包,便于开发者开箱即用,仅用几行代码便可以方便快速的完成对话式 AI 场景中的相关任务。8月12日开始,英伟达专家将带来三期直播分享,通过理论解读和实战演示,展示如何使用 NeMo 快速完成文本分类任务、快速构建智能问答系统、构建智能对话机器人。
直播链接:https://jmq.h5.xeknow.com/s/how4w(点击阅读原文直达)
报名方式:进入直播间——移动端点击底部「观看直播」、PC端点击「立即学习」——填写报名表单后即可进入直播间观看。
交流答疑群:直播间详情页扫码即可加入。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/