推广 热搜:   中国  公司  行业  设备  快速  企业  上海  未来  技术 

2022 AI Day干货大全:马斯克的擎天柱是好机器人吗?

   日期:2024-12-06     移动:http://www78564.xrbh.cn/mobile/quote/26251.html
2022 AI Day干货大全:马斯克的擎天柱是好机器人吗? 马斯克

受大量影视剧的影响,人们一提到AI(人工智能)与机器人,往往会想到“毁灭世界”的《终结者》或是“背叛人类”的《西部世界》,但在加利福尼亚州帕罗奥图举行的2022 AI Day(人工智能日)活动中,特斯拉CEO埃隆·马斯克极为详尽地介绍了其开发团队是如何打造特斯拉机器人(Tesla Bot)及其背后的硬核实力,并且强调这不会是一台“吓坏小朋友”的机器人,而是可以用来“实现更低的劳动力成本,终将带来更快速的经济发展”的机器人;甚至在解决机器人核心的智能和执行器等相关问题之后,将会成为“人类的伙伴”:“人们可以带它出去吃喝玩乐、为它穿上各色服装、选择多种相处方式让它形成独特的性格。我相信在每个人的创意下,将创造出精彩纷呈的Optimus。”

2022 AI Day干货大全:马斯克的擎天柱是好机器人吗?

特斯拉在电动汽车、航天领域的开创性和成功固然人所共知,但由于一些难以突破的技术瓶颈且缺乏清晰的应用场景(看不到刚需),“人形机器人”近年来并不受资本界的待见,学术界甚至悲观地认为:“除非像尼古拉斯·特斯拉这样的天才人物出现,否则能获得公众认可、严格意义上的双足人形机器人的诞生只能是‘有生之年系列’”,哪怕出现也只能是富人才能负担得起的“玩具”;再加上一些厂商正在开发的能够行走、奔跑甚至跳跃的机器人或机器动物似乎更具商业潜力,因此马斯克自从去年AI Day“画饼”之后没少受到业内专家的质疑:你一个“外行”凭什么创造奇迹呢?

出乎大部分人的是,特斯拉只用了短短6个月时间,Tesla Bot就来了。

“今天是我们第一次将Tesla Bot展现给世人,准备好了吗?”马斯克话音未落,内部代号为Optimus(其中文名会让绝大多数国人虎躯一震——“擎天柱”)的原型机闪亮登场,虽然只是简单的转身、停止、挥手问候等一系列动作,但已经引起了现场观众的齐声欢呼。

马斯克表示,这是Optimus第一次在无人操作的情况下自主行走(也是第一次在没有系安全绳的情况下进行展示),开发团队没有为它安装外壳,而是直接将内部构造呈现出来,关节、骨骼、电缆等设备清晰可见,从而直观展示每个动作细节。而在官方视频中,还展现了Optimus目前的使用场景:在办公室内,它可以灵活地提起水壶浇花、双手搬运物料至目标位置、准确定位周围人员并主动避让。据介绍,Optimus已经在特斯拉弗里蒙特工厂投入到简单工作之中(比如抓取和运送部分零部件),并拥有自己的行动路线,接下来还会部署数千台人形机器人,以推动研发进程的加快。

有意思的是,这并非当天亮相的唯一“选手”,另一台安装有外壳的“擎天柱”随后也走上了舞台并展示了更为丰富的手部动作,从紧跟在身后的数名开发人员就能看出,这台特斯拉机器人的版本要“新鲜”得多。马斯克指出,Optimus的版本迭代十分之快,会远超汽车等产品。

当然了,令大家最为兴奋的还是马斯克预测的“时间表”,Optimus有望在3-5年间量产上市:“我们的产量应该可以达到数百万台,预计它的价格比汽车便宜得多,预估机器人最终价格将达到2万美元以下。”

那么,在过去半年时间里,Tesla Bot是如何从一个概念迅速走向现实的呢?首先,特斯拉工程师必须解决一个核心问题:“如何让机器人像人(一样行动)?”

行走,对于人类来说可能是再简单不过的日常动作,但机器人要实现稳定行走则充满巨大挑战。首先特斯拉需要让机器人具备物理层面的自我认知,保障运动能效、保持平衡以及迅速应对环境中的风险,同时也要兼顾四肢长度、重量等方面。“我们一直在从生物学中汲取更多灵感,”特斯拉工程师表示,“在运动、规划和控制性上,我们在汽车领域已经积累了充分经验,在机器人上得以活用。”

在机器人的内部结构设计上,特斯拉科研人员基于对人体特征的洞察,对各执行器与电力系统进行了缜密的布局(当然并非最终形态,仍会不断调整)。据介绍,Optimus的身体共有28个自由度,采用了相较此前“友商”更为灵活的弹簧负载设计以及6种类型执行器,在关节上采用了仿生学关节设计,模拟人类关节与肌腱形态,可以完成行走、上楼梯、下蹲、拿取物体等动作。

特斯拉机器人的手部同样采用了人体工程学设计,拥有11个自由度,得益于合理的手指关节设置,拥有不错的柔韧性和强度表现,其执行器既能够承受约半吨重的钢琴这样的重物,也可以完成轻薄物体抓取、操作机械装置、复杂手势等高精度动作。

在动力方面(你没听错,扭矩有望成为将来评价机器人性能的一大重要指标),Optimus的躯干处搭载了2.3kWh、52V电池包,并高度集成了充电管理、传感器和冷却系统。从公开信息来看,Optimus静坐时功耗约100瓦,慢走时功耗约为500瓦,此外其拥有自动寻找充电站的能力。“这意味着从传感到融合、再到充电管理,都汇集到这一系统内,这也是借鉴了我们在汽车设计方面的经验。”特斯拉工程师介绍道。

双足机器人的一大挑战是不仅仅在能够平稳行走,还要能在少量外部干扰的情况下依旧保持平衡。在现场播放的视频中,特斯拉展示了测试人员如何不断用木棍戳刺Optimus的上半身,以挑战其保持平衡的能力。视频显示,Optimus在一定的戳刺力度下稍微前倾后便能稳住姿态,并未摔倒或长时间摇晃。当然了,包括波士顿动力的机器狗等产品也展现出过极强的防踢或摔倒再起的能力,但这种挑战对于双足机器人来说更有难度,特斯拉工程师也表示还在进行更加深入的研究和测试,以开发出媲美人类行动能力的“擎天柱”。

当然了,就像人类一样,人形机器人也有自己的“软肋”,首当其冲的就是“大脑”,特斯拉工程师表示,开发团队正在基于汽车安全模拟分析能力打造机器人安全性:在交通事故模拟中,特斯拉通过软件优化和改进车辆溃缩、电池保护等提升安全表现,而在机器人设计上,特斯拉也以同样的方式保障Optimus 保护自身和周围人安全的能力。例如在跌倒、碰撞等外部状况下,机器人将采取和人类一致的决策——最大程度优先保障“大脑”安全,其次是躯干电池组的安全,此外在结构设计、材料应用方面特斯拉也在不断发力,避免出现“一碰就坏”的情况。

既然说到“大脑”,这也正是机器人最难突破的瓶颈之一。“机器人需要有‘大脑’,也就是人工智能。”马斯克表示,在设计、训练与制造Optimus的过程中,特斯拉大量应用了人工智能技术;在“感官”方面,得益于完全自动驾驶能力系统的实际应用验证,特斯拉强大的计算机视觉已可直接应用于机器人开发。

Optimus搭载了与特斯拉车辆相同的FSD电脑以及Autopilot相关神经网络技术,自动驾驶技术上的研究成果也正在帮助开发团队在人形机器人领域去的突破。特斯拉工程师表示:“其实特斯拉车辆已经安装了FSD电脑,我们希望可以将自动驾驶经验与人形平台相结合,当然机器人的实际需求和形式都与汽车存在差异,所以我们还需要适当调整。”

也就是说,每一位参加FSD Beta测试的用户,实际上都为特斯拉开发出更智能的机器人“添砖加瓦”。如今参与FSD Beta版本测试的特斯拉用户,已从最初2021年的2000人扩大至16万人;在这一年中,特斯拉自动驾驶开发团队已经测试了7.5万个软件模型,并且发布了多达281个模块,更新了35个版本。该测试版软件的累计行驶里程已经突破4000万英里,2023年年底有望超过1亿英里。

这样的测试力度、数据积累以及分析能力,不要说世界上其他机器人公司,哪怕任何一家汽车“友商”也是难以比肩的。

在最新的FSD版本上,特斯拉提升了交叉路口转弯的决策优化,通过更复杂场景中路面行人和其他车辆的轨迹的研究和模拟,提升决策的安全性和舒适性,并在100毫秒内作出决策。值得一提的是,在上个月发布的Occupancy Network中,工程师透过视频(而不是分格的图像)来训练AI预测物体轨迹,计算出最佳路线,其运算时间仅需10毫秒。此外,在“车道模型”“动态预测”“自动驾驶算法”等方面也有了重大升级。目前FSD Beta的深度神经网络达到100万参数,15万+神经网络层,37.5万个连接。可以在5分钟内模拟出现实中未出现的场景。

特斯拉希望机器人的“大脑”要尽可能做到人类大脑所能实现的一切,比如处理视觉数据、基于多个传感器输入做出行动决策、支持通信交流等,这就意味着需要超高算力、足够的带宽、较小的时延并且可控的成本来进行人工智能训练。特斯拉工程师指出,算力是自动驾驶的根本:“我们要让Dojo超级计算机成为在AI训练方面全球最强的超算系统。”自从应用Dojo超级计算机以来,特斯拉在神经网络训练上已经取得了明显的进步。

据悉,Dojo超级计算机的单个训练模块由25个特斯拉自主研发的神经网络训练芯片—— D1芯片组成,每个Dojo ExaPod集成了120个训练模块,内置3000个D1芯片,拥有超过100万个训练节点,算力达到1.1 EFLOP(每秒千万亿次浮点运算)。得益于训练模块的独立运行能力和无限链接能力,Dojo超级计算机的性能拓展在理论上并无上限,它可以提供非常庞大且高效的系统。Dojo超级计算机投入使用后,特斯拉在代码、设计方面已经实现了30%的训练速度提升,如通过自动标注技术,特斯拉将训练场景的标注速度大幅提升,在人工操作的情况下这些或许需要一两周甚至几个月时间。

不仅拥有超高算力,Dojo还有着十分重要的特性——高效。据了解,只需使用一个由25个D1芯片组成的训练模块,就能实现6个GPU Boxes的性能,且成本低于一个GPU Box;而只需要4个Dojo超级计算机机柜的算力,就能实现72个GPU机柜的自动标注性能。明眼人都能看出,这是马斯克的一个“广告”,但其面向的并非投资人,而是有志于实现“人形机器人”抱负的潜在人才。

在高效的神经网络训练下,特斯拉FSD软件在技术层面已经逐渐趋于成熟。马斯克表示:“目前FSD软件已经可以适用于全球各个地区的路况,如果地方监管政策允许,我们可以在今年年底面向全球推出FSD Beta版本软件。”而Dojo超级计算机也将成为引领行业发展的另一个“杀手锏”。特斯拉表示,将在2023年第一季度布置第一批10个Dojo超级计算机机柜,即算力超过1.1EFLOPS的ExaPOD,将自动标注能力提升2.5倍;未来,特斯拉共将在位于加州旧金山湾区的帕罗奥图(Palo Alto)布置7个这样的集群,以提供超乎想象的庞大算力。

为了控制成本和实现商业化量产,Optimus采用了与Tesla车辆相同的芯片,支持Wi-Fi、LTE链接和音频交流,其系统软硬件的安全性保障也正在不断提升。

比较有趣的是,Optimus还可以通过动作捕捉“学习”人类。以搬运物品为例,特斯拉研发人员通过穿戴式设备输入动作,机器人通过神经网络学习,从在同一地点完成相同的动作,到进化推演出在其他场景下的方案,从而学会在不同环境中搬运不同的物品。同时,特斯拉工程师也科普了一些如何让机器人“做正确的事”的训练方法,与人类的学习过程十分相似。

在向观众“安利”时,马斯克直言大众对AI人工智能过于“高估”了(用行话来说即“技术的作用总是在短期内被高估,而在长期内被低估”),他强调不应该害怕“广义人工智能”(artificial general intelligence,缩写为AGI,即“打造出与人类一样运作的自主机器人”),实际上人类在连弱人工智能或狭义人工智能(ANI)的研究都处于十分粗浅的阶段(但由于部分学者担忧其“边界问题”,“人工智能失控”的言论甚嚣尘上),而发现可能性的边界的唯一途径,就是跨越这一边界,进入到不可能的领域。

懂论

本次AI Day活动的内容相当硬核(甚至有些枯燥),小到机器人的关节设计、人工智能的工作逻辑与训练细节,大到特斯拉的规划、机器人与智能汽车的前景,都事无巨细地呈现在公众眼前,也无怪乎有观众会当场发问:“这其实是一场面向全球的大型‘招聘会’?”

对此,马斯克毫不犹豫地作出了肯定的回答:“我们希望不仅仅有好的想法,还要有好的结果,”他呼吁道:“希望大家对特斯拉的认识跳出电动汽车的范围,我们在AI方面已经成为先行者,软硬件层面都进行了大量探索。我们也在构建更强的系统、全球最强的计算机结构。如果大家有兴趣可以加入我们,贡献自己的聪明才智,一起影响世界。”也许在许多网友的眼里,特斯拉的“擎天柱”并没有展现出超越同行的能力(甚至有些笨拙),但在机器人从业者眼中,马斯克的勇气和决心无疑是激动人心的。

本文地址:http://www78564.xrbh.cn/quote/26251.html    迅博思语 http://www78564.xrbh.cn/ , 查看更多

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


相关最新动态
推荐最新动态
点击排行
网站首页  |  二维码  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  粤ICP备2023022329号