返回栏目
首页人工智能 • 正文

李飞飞团队建立深度学习“游乐园”: AI也在自我进化,仔细想想很可怕

发布时间:  来源:河洛网

动物的智慧在与环境相互作用的过程中与身体形态同步进化。

李飞飞团队建立深度学习“游乐园”: AI也在自我进化,仔细想想很可怕

例如,仓鼠通过“进化”长腿仓鼠的球来逃避猫的追踪( doge )。

好了,言归正传,AI也相当聪明,但和动物不同,AI通常由硅基芯片实现,没有实体。

那么,如果给AI“身体”,它对智能的进化重要吗? 如果是这样,如何制造更聪明的人工智能呢?

在李飞飞飞的指导下,斯坦福大学的研究小组举办了计算机模拟的“游乐园”— — DERL (深层进化强化学习),其中被称为“Unimals”的主体不断变异,经历着自然选择。 论文刊登在《自然通讯》杂志上。

htps://www.nature.com/articles/s 41467-021-25874-z

研究结果表明,虚拟生物的身体形态比学习新任务的能力、在更具挑战性的环境中学习进化的形态、或者在执行更复杂的任务时在更简单的环境中学习进化的形态更快、更好。

在这项研究中,尽管最初基线的智力水平与上一代相同,但形态最成功的Unimal也比上一代更早地掌握了任务。 也就是说,“具体化”是智能进化的关键。

研究小组成员斯坦福大学海的共同主任李飞飞说:“我们通常集中于AI如何实现人脑中的神经元功能。” “但是,将AI视为具有物理实体是完全不同的范式。 “”

研究报告的共同作者、人文科学学院应用物理学副教授HAI副主任Surya Ganguli说:“据我们所知,这是第一次相关模拟,结果表明,改变形态可以加快学习速度。 “”

“Unimal”宇宙队设置了虚拟空间,加入了简单的模拟生物。 当然,这些生物不过是用“随机方法”移动的“几何图形”( Unimal )。

在学习阶段,有平坦的地形,有块状的山脊、楼梯、光滑的小山等更具挑战性的地形。 Unimal必须在变化的地形上将区块移动到目标位置。

训练结束后,各Unimal将与其他3个相同环境/任务的组合进行训练的Unimal的比赛。 胜利者在面对与父母相同的任务之前,会产生经历了肢体和关节变化相关的突变的单一后代。

最终,在训练了4000种不同的形态之后,队伍结束了模拟。 这个时候,幸存下来的Unimal经过平均10代的进化,其形态惊人地多样化了。 包括两足动物、三足动物、没有手臂和手臂的四足动物。

一开始,“大部分图形”只有一个“头”和发达的“四肢”,他们长得很奇怪。 “有摇摇晃晃地走着的人,也有像蜥蜴一样走着的人。 别人挥舞着非常有趣的行为方式,让人联想到“八爪鱼”。

那个? 看起来和旧实验没有什么不同。 别着急。 进化才刚刚开始。

这些Unimal生长在不同的星球上,星星中充满了“起伏的小山”和“低矮的障碍物”,他们在更激烈的环境中展开竞争。 正如大家所说,让我们来看看“逆境是不是成功之母”。

各环境前10名的Unimal将被安排到新的任务中,从“新的障碍”中将球移动到目标位置,将箱子推上山,在两点之间巡逻。 这些“角斗士”真的展现了他们虚拟的勇气。

最终,能走“复杂地形”的Unimal能比“平地表哥”更快地学习新任务,更好地工作。

也就是说,它们通过“活着”来“进化”,但并不是“边做边学”。 通过在楼梯、丘陵、山脊、有移动的地形等复杂环境中同时进行“进化”和“学习”,可以在这些复杂环境中进行操作。

在平坦的地形上,“章鱼环”可能在同一时间到达终点线,但“适应山丘和山脊的身体配置”往往更快、更稳定、能力最高。 他们多余的身体能更好地利用他们的经验和教训,很快他们就抛弃了竞争对手。

交给“进化”吧。 通用计算框架DERL利用两个交互的自适应过程来创建有形的代理

进化的外循环通过变异操作优化了主体的形态( b ),内部强化学习循环优化了神经控制器的参数) c )。 在可变地形的操作中,代理必须从初始位置(绿色球体)开始,将箱子移动到目标位置)红色的四边形)。

在每个环境进行了三次进化后,球队为每个环境选出了表现最好的10个Unimal,从一开始就训练了8个全新的任务,包括绕过障碍物、操纵球、将箱子推上斜坡等。

最成功的Unimal在个体(通过较少的训练获得更好的表现)、世代间的学习上也很快。 小组发现,早期祖先生命后期学习的行为可以在后代生命早期表现出来。

另外,10多岁以后,最成功的Unimal形态是学习同一任务时间最早的祖先的一半。

这验证了美国心理学家James Mark Baldwin在19世纪末提出的假设。 “学习适应性强的东西的能力”将由达尔文的自然选择继承。

人类未必知道如何为奇怪的任务设计机器人的身体,比如爬核反应堆取出废弃物,地震后提供救援,让纳米机器人穿过人体,或者做洗碗、叠衣服等家务。

设计这些机器人的唯一方法可能就是交给“进化”。

【编辑推荐】

    相关文章Related

    返回栏目>>

    河洛网首页

    Copyright © 2019 河洛网 版权所有 dahuimr@163.com