南京奥特赛人工智能技术研发有限公司

2025年人形机器人:科技浪潮下的璀璨前景

近距离观察定义 2024 年的人形机器人,包括特斯拉机器人“Optimus”和波士顿动力公司的“Atlas”,这些机器人被设计用来执行曾经被认为只有人类才能完成的任务。




我们热衷于按照自己的形象创造机器,这让我们取得了非凡的成就。我们成功地突破了人工智能和机器人技术的界限,如今的人形机器人不仅可以模仿人类,还可以增强人类的互动。

从赫菲斯托斯神话中的自动仆人到 C-3PO 和终结者等标志性人物,曾经只局限于神话和小说中的人形机器人如今已经走进我们身边。

这些机械化的机器人可以协助我们进行手术、在装配线上快速行驶,甚至探索外太空。这里,我们列出了 2024 年最先进的人形机器人,它们的实际能力与曾经想象的童话一样非凡。

图片

AMECA






当您搜索“世界上最先进的人形机器人”时,大多数路径都会指向 Engineered Arts 的 AMECA,原因显而易见。AMECA 采用模块化设计,硬件和软件均可升级,设计具有中性和非威胁性的外观,以促进舒适的人机交互。

它利用了嵌入式麦克风、双目眼部摄像头、胸部摄像头和面部识别软件。它是进一步开发专注于人机交互的机器人技术的绝佳平台。虽然 AMECA 目前还不能行走,但它被设计为具有未来移动的潜力。

AMeca 的认知能力通过与 OpenAI 的 GPT-3 和 GPT-4 语言模型集成得到增强,使其能够理解和回答问题、讲笑话、模仿名人或著名电视角色的声音、跳舞和进行有趣的对话。

AMECA 的独特之处在于其面部表情和动作极为逼真,27 个执行器控制着嘴唇和眉毛动作等细微细节,以及电动手臂、手指和颈部,总共 61 个自由度。这些功能使 AMECA 能够自然而富有表现力地进行交流,与其他机器人截然不同。


Atlas





Atlas 由波士顿动力公司开发,以其运动能力而闻名,通常通过其令人印象深刻的舞步和后空翻来展示。这款机器人最初是作为美国国防高级研究计划局 (DARPA) 于 2009 年的一个研究项目而创建的。一个重大进展是,液压 Atlas (HD Atlas) 于 2024 年 4 月退役,第二天宣布推出一款全新的全电动版本。

从液压系统到电动系统的转变标志着向更高效率和环境可持续性迈出的一大步。Atlas 是基于数十年的机器人研究而打造的,采用定制电池和高度紧凑的原液压系统,现已重新设计为电动操作。

其先进的控制算法使 Atlas 能够规划和执行复杂的动作,同时考虑环境因素,并实现高达 2.5 米/秒的速度。Atlas 由钛和铝制成,并配有 3D 打印部件,其强度重量比有利于其动态机动。

该机器人身高 1.5 米,体重 89 公斤,有 28 个关节,支持灵活多样的运动。Atlas 配备先进的红外立体和深度传感器,可创建详细的环境点云,并结合视觉、力和本体感受传感器来适应环境变化

图片

Optimus





Optimus,也称为特斯拉机器人,以变形金刚角色命名,是一种通用人形机器人,最初于 2021 年 8 月 19 日特斯拉人工智能日期间发布。原型机于 2022 年亮相,到 2023 年 12 月,特斯拉推出了第二代 Optimus,其身材更苗条,手部和动作都有所改进。

2024 年,这款新机器人在特斯拉工厂展示了各种任务,凸显了其增强的功能,比其前代产品轻 10 公斤且速度更快。

2024 年 6 月,埃隆·马斯克宣布 Optimus 计划于 2025 年开始限量生产,其中计划在特斯拉工厂使用 1,000 多台,到 2026 年可能为其他公司进行更大规模生产。Optimus 的售价预计为 30,000 美元,马斯克设想 Optimus 可以在家庭内外执行各种日常任务。

该机器人采用双足步行系统,旨在保持平衡和稳定,脚上装有压力传感器,可实时调整姿势。它的“面部”装有多个摄像头,用于物体检测、深度测量和空间处理,同时还配有一个用于学习和适应的机载神经网络处理系统。

Optimus 可以响应语音命令并理解基本的对话背景。它由 2.3 千瓦时的电池组供电,类似于特斯拉的电动汽车。它包括一个专有的电池管理系统,使其能够以高达 5 英里/小时(8 公里/小时)的速度行驶,并承载高达 45 磅(20 公斤)的负载。


Figure 02





Figure AI 于 2022 年推出了其初始原型 Figure 01。这是一款双足机器人,旨在完成物流和仓储中的体力劳动任务。2024 年 8 月 6 日,该公司推出了其下一代人形机器人 Figure 02。这个版本采用了更时尚、更纤薄的设计,四肢集成了电缆,Figure AI 声称这是世界上第一个可商业化的自主人形机器人。

新款机器人的电池容量比上一代增加了 50%,配备 6 个 RGB 摄像头和板载视觉语言模型。计算能力显著增强,采用基于 NVIDIA RTX GPU 的模块,推理能力是上一代的三倍。

此外,Figure 02 还配备了麦克风和扬声器,以及与 OpenAI 合作开发的定制 AI 模型,增强了其与人类的对话能力。其重新设计的五指手拥有 16 个自由度,使其能够携带重达 25 公斤的物体。目前,Figure 02 正在南卡罗来纳州的宝马工厂进行测试,以收集训练数据,用于进一步开发 AI 模型。


Digit





Digit 是由 Agility Robotics 设计的人形机器人,其独特的内弯腿部设计增强了机动性,使其能够在复杂环境中动态移动。这种独特的结构与优雅的四肢和配备先进传感器和计算能力的躯干相得益彰,使 Digit 非常适合在仓库等地方导航和执行任务。

Digit 于 2023 年发布,代表着机器人功能的重大进步, Agility Robotics宣布将推出首个人形机器人工厂 RoboFab,该工厂每年可生产多达 10,000 台机器人。

Digit 由铝、热成型聚碳酸酯和碳纤维复合材料组件制成,既轻便又坚固。它配备了一系列传感器,包括激光雷达、四个英特尔 RealSense 深度摄像头和 MEMS IMU,以及增强其本体感受的绝对编码器和增量编码器。

该机器人采用无刷直流电机和定制设计的传动装置,并拥有 16 个独立关节。这些关节让 Digity 能够以 10 种不同的方式移动其腿部和手臂,拥有四个自由度,并配备 6 种不同方式的抓手。

该机器人的计算需求由两个英特尔 i7 多线程 CPU 处理,并有一个有效载荷托架可用于其他计算机,如英特尔 NUC 或 Nvidia Jetson,可用于增强感知或机器学习任务。

Digit 的主控制计算机采用基于 Linux 的实时操作系统,高级规划和感知则由辅助计算机管理。它由定制的 1.2 千瓦时锂聚合物电池组供电,在电源效率和强大的操作能力之间取得平衡。


Apollo





Apollo 由 Apptronik 开发,是另一款具有突破性的人形机器人,得益于该公司在机器人领域的丰富经验,包括他们在 NASA 的 Valkyrie 机器人上的工作。Apollo 专为大规模制造而设计,旨在在具有高有效载荷和安全标准的协作环境中运行。

Apollo 重量约为 72.6 公斤,使用一块电池就可以运行长达 4 小时,其设计与人类的体型和能力相符,适合执行各种需要类似人类属性的任务。

Apollo 的设计使其能够承载高达 25 公斤的有效载荷,突出了其执行大量举重和搬运任务的能力。该机器人用途广泛,采用模块化设计,可以安装在任何移动平台上,无论是固定的还是完全移动的,只要有腿。

它的头部、嘴部和胸部配有 LED 灯来指示其状态,并配备热插拔电池组,每个电池组可提供四小时的运行时间,只需简单更换电池即可连续运行,而不需要停机充电。

此外,Apollo 还采用了先进的力控制架构,并定义了安全区,以增强操作安全性。它可以通过任何设备上可访问的直观软件进行控制,从而简化了人机交互。梅赛德斯-奔驰已经认识到 Apollo 的实用性,并将这些机器人整合到他们的工厂中,以协助完成体力密集型和低技能任务,展示了 Apollo 的工业适用性和效率。


ALTER 3





ALTER 3 凭借其独特的 AI 与音乐天赋在顶级人形机器人榜单中脱颖而出,尤其是其指挥管弦乐队的能力。这款人形机器人由大阪大学和 Mixi 公司开发,已用于各种实验环境,包括指挥管弦乐队、参加戏剧表演以及探索机器人技术与艺术的交汇点。

ALTER 3 的设计特点是面部表情非常丰富,能够展现多种情绪,如微笑、皱眉甚至唱歌,增强与人类观众的互动。

机器人的身体结合了面部、颈部和手臂(直至肘部)的假肢皮肤,其他部位则保持为裸露的机械,以唤起生命的机械本质。这种设计选择凸显了机器人的内部机制,引发了关于人类本质和人工智能潜力的讨论。

ALTER 3 采用气动和伺服执行器组合,由 42 个执行器和集成神经网络的中央模式发生器 (CPG) 控制,实现流畅而逼真的动作。

该机器人配备了光学和距离传感器,可实现自主移动,其传感器和麦克风可输入 AI 系统,使其能够动态响应周围环境。ALTER 3 的开发旨在探究机器人是否能够感知生命以及生命本身可能意味着什么等基本问题。


Unitree G1





Unitree G1 以其出色的灵活性和经济性而受到认可,使其成为机器人研究和开发的杰出选择。该机器人旨在促进对先进运动和操控技术的探索,能够进行高达 1.4 米的立定跳远 - 这可能是同等尺寸的人形机器人有史以来实现的最长跳跃。

G1 机器人配备灵巧的三指手,可进行精确操作,最大关节扭矩为 120 Nm。它拥有 43 个自由度,可实现复杂的运动,移动速度为 2 米/秒。传感和通信增强功能包括 3D LIDAR、用于 360° 检测的 LIVOX MID360、英特尔 RealSense D435i 深度摄像头以及具有噪音和回声消除功能的麦克风阵列。

其电池和电源系统采用超大快速释放电池,支持约两小时的电池续航时间,机器人的设计包括空心接头接线,无需外部电缆。G1 和 G1 EDU 型号均配备高性能 8 核 CPU、深度摄像头、3D LiDAR、四麦克风阵列以及 WiFi 6 和蓝牙 5.2 等连接选项。

配件包括带快速释放功能的智能电池(9000mAh)、54V 5A 充电器和手动控制器。G1 提供 8 个月保修,而 G1 EDU 提供 1 年保修,G1 的起价为 16,000 美元。


ARMAR-6





ARMAR-6 是卡尔斯鲁厄理工学院开发的 ARMAR 系列人形机器人的一部分,代表了可追溯到 2000 年的 ARMAR-1 机器人系列,最初专注于基本运动和操控。ARMAR-2、ARMAR-3a 和 ARMAR-3b(于 2004 年至 2007 年间开发)等后续型号不断改进,增强了交互能力和更复杂的任务能力。

ARMAR-6 是一款专为工业环境设计的协作人形助手,它体现了这些进步。

ARMAR-6 具有类似人类的躯干和安装在轮式底座上的两只手臂,使其能够在工业环境中导航并使用为人类设计的工具,例如电钻和锤子。该机器人的移动底座上有四台计算机,通过其 ArmarX 软件架构为控制、图像处理、交互算法以及实现机器学习和人工智能提供了强大的计算能力。

它的关节由专门开发的传感器-执行器-控制器单元提供动力,可实现精确的、力控制的运动,包括由滑环促进的连续关节旋转。

该机器人拥有 27 个自由度,手臂完全伸展时可举起 10 公斤的重物,在平均距离下最大举重能力可达 14 公斤。ARMAR-6 身高 192 厘米,臂展 310 厘米,工作高度范围为 0 厘米至 240 厘米,不含电池时重量为 160 公斤。

它的传感器包括遍布关节的位置、IMU、扭矩和温度传感器,以及用于交互的 6D 力矩传感器和用于导航的激光扫描仪。两个立体摄像头系统、一个深度摄像头和麦克风增强了感知能力。ARMAR-6 在 EtherCAT 总线系统上运行,连接其多台高端 PC和 GPU,确保强大的电池系统实现强大的自主操作。

图片

Astribot S1






Astribot S1 被描述为一款“万能”家用机器人,专为烹饪、折叠衣服和操作吸尘器等家务而设计。与传统的带腿人形机器人不同,Astribot S1 具有电动轮和可在中间弯曲的灵活下身,以令人印象深刻的敏捷性和机动性支持其在家中执行任务。

Astribot S1身高约 5 英尺 8 英寸,采用纤细、光滑的白色设计。它每只手臂的有效载荷为 10 公斤,每只手臂有 7 个自由度,运动范围可与人类肢体相媲美。机器人的手臂配有触摸传感器,可与物体和人安全互动。它不是典型的人形手,而是带有传感器的双指夹持器,增强了其执行各种精确任务的能力。

Astribot S1 的敏捷性和灵巧性非常引人注目,最高速度为每秒 10 米,比普通成年人快。它可以通过模仿学习来学习新任务,这一功能在各种在线演示中都有展示,其中机器人可以进行武术、做煎饼和倒饮料等活动。该机器人宣布将于 2024 年投入商业使用,但该公司尚未披露有关其硬件规格或 AI 学习方法的具体细节。

图片

人形机器人正在向前发展

图片

当我们结束对 2024 年最引人注目的人形机器人的探索时,很明显,机器人领域继续突破界限并挑战我们的期望。除了讨论的关键参与者之外,许多其他人形机器人也在专业领域取得长足进步。

其中包括提供宝贵社交互动的 Nadine、执行太空任务的 Robonaut 2、引人入胜的讨论的 Sophia、服务行业中扮演的角色 Pepper 以及教育领域的 NAO 贡献。SEO1 人形机器人在实现类人步态方面取得的最新进展也预示着许多其他开创性项目的到来。

虽然我们重点介绍了一些关键参与者,但世界各地的实验室和机构还在取得无数其他进步,每一项进步都有可能进一步彻底改变我们与机器的互动方式。

© Copyright 2013 南京奥特赛人工智能技术研发有限公司 版权所有 备案号:苏ICP备19032300号-1 苏公网安备32011602010459 技术支持:科威鲸网络