开放性:你可能没听说过的终极大挑战
开放性既是驱动探索智能的力量之一,也可能直接就是AI本身的组成部分。
编者注:更多关于人工智能信息请关注2018年4月10-13日人工智能北京大会。2018年1月26日之前购买门票享有早期最惠价格

人工智能(Artificial Intelligence, AI)是计算机科学中的巨大挑战。人们投入了毕生的精力和大量美元,去加速对AI领域发展的追求。 然而至今,这一领域中最雄心勃勃的愿景仍未实现:尽管仍然在前进,但我们还是无法达到能和人类匹敌的通用智能。不管怎么说,这么一个虚无缥缈的目标,正是我们所期待的“巨大挑战”,需要大量的时间和无法想象的努力才能获得,值得我们期待。还有一些其他的巨大挑战,比如治愈癌症,实现100%的可再生能源,或统一物理理论等等。某些领域还存在一系列的重大挑战,比如David Hilbert的23个尚未解决的数学问题,横亘二十世纪为全世界下了战书。本问题(通用人工智能)的不同寻常之处在于,它的解决方案可能从根本上改变我们的文明,以及重构我们对自己的了解,但只有极少数研究人员才明白这一点。 不管听上去有多么荒诞不经,但今天,来自开放性问题的挑战恰恰就是这种情况。几乎没有人听说过这个问题,更不用说关心它的解决方案了;尽管如此,在最迷人和最深刻的挑战当中,它是有可能被解决的。 通过这篇文章,我们希望把碎片拼好:我们将解释这个挑战是什么,解决该挑战有何重大意义,以及感兴趣的你如何加入这一挑战。

迎接挑战:几十亿年前,某种像单一的原核细胞的生命形态第一次出现了。虽然我们并不知道其起源的完整过程,但我们知道的是,在接下来的几十亿年里,这个不起眼的细胞分化到整个地球上所有物种中,产生了令人赞叹的物种多样性。在这条壮丽的进化道路上,细胞在一开始以阳光为食,进而更复杂的真核细胞产生了,首次交配发生了,多细胞生物第一次开始繁殖(大约十亿年前)。在接下来的约5亿年之后,在一波被称为“寒武纪大爆发”的物种创始大潮中,几乎所有的主要动物种群都诞生了。随着这些种群进一步分化成为我们今天所熟知的物种,植物在大陆上展现了无尽的变化。最后,鱼类演化成了陆地动物,我们的星球在海平面以上拥有了大量生物。所有的两栖动物、爬行动物、鸟类、哺乳动物诞生了,每一只“动物”实际上是一组百万到几万亿的真核细胞的复杂共舞,而对于更高层次的由捕食、被猎食、交配、繁殖组成的生态圈而言,每一只动物都在其中共舞。一路走来,奇妙的造物以超越今天所有人类工程学的能力展示着里程碑:光合作用,鸟类飞行,人类智慧本身都是其中少有的巨大成功。这个史诗般的故事被称为『进化』,但这样一个不起眼的词汇很难与其达到的成就相匹敌。

问题在于,『进化』听起来只是一个简单的过程,或者是类似万有引力的一种物理学;然而生命在地球上的繁荣昭式着,这种理解严重低估了它的真正内涵。进化,与其说是一种单纯的物理过程,更像是万年不遇的创造性天才:在任何时候它都是最伟大的发明家。如果把它和计算做比喻去思考的话,地球上发生的进化是某个单一的算法,它发明了所有的自然。如果我们今天运行一个机器学习算法,如果它给了我们单一的最优解或者几个次优解,我们会觉得不错,但是问题在于不管它最后有没有给出解,只要程序结束,然后就没有然后了。地球上的进化则有着惊人的不同,它看上去永远不会结束。尽管『永不』是个夸张的词汇,但是数十亿年的持续创造力,使我们无法看到这一进程的尽头,趋近于永远。所以,我们一方面把它称为进化,但也要认识到它的确是一种永无止境的算法,这个过程在不可思议的时间跨度上,不知疲倦地展现出更多的复杂性和新颖性。

事实上,针对这个在几近无限的时间上创造出巨大复杂性的单一过程,还有另外一个术语抓住了它的特点,我们称之为『开放性』。自然界中所存在的开放性,是现代科学最大的奥秘之一,然而它却极少受到关注。我们的教科书描述进化时,就好像它已经被理解、被解决了一样,但实际上,就算我们补充再多的细节,这一令人震惊的属性——开放性——仍然存在,而且默认是被接纳的、理所当然的。如果从计算机科学家的角度来看,你很容易发现,如果我们能够知道对这一属性的终极解释,那么这个解释必然是深刻的、强有力的。这仍然是一个谜,到目前为止,就算加入人工智能,开放性也被证明是不可能编程求解的。我们可能会认为我们知道地球上发生进化的种种要素,我们可能会试图将它们形式化为某种算法(通常称为Evolutionary Algorithm, 进化算法, EA),不过,迄今为止,还没有哪种算法展现出哪怕是一丁点『带来无尽繁荣的创造性』的潜力。尽管在科研界,有一个叫做“虚拟生命”(Artificial Life, 简称“alife”)的小型科学家社区意识到了这个难题并在过去的二三十年内加以研究,但是开放性研究的前景仍然不明朗,而且只引起了科学世界一小撮的人的兴趣。这实在是不应当。

你看,有些东西在这里讲不通。当某些东西讲不通的时候,在阴影中的某处常常会有一个范式转移级别的大发现在等待着我们。在这种情况下的线索就是,一般的进化算法(EA)和我们在自然界中观察到的情况相比,简直愚蠢,怎么也不算是开放性。 大多数EA运行很短时间,也许是几天;它们在理想情况下会收敛到最优解,或者卡在其他的局部最优上。即使是最复杂、甚至是专注于制造多样性的EA,在耗尽它们的搜索空间后,也会很快停止。

起初,你可能会认为,EA无法描述大自然是很正常的事。 毕竟,EA只是一小段程序,通过运行一段时间来解决一个特定的问题,只是机器学习的许多选择之一。 不过,鉴于进化的开放性,EA从原理上来说本该比它们现在强大的多。由于某些原因,尽管有许多聪明的头脑倾尽毕生心血发明越来越强的EA,举办致力于进化计算的会议,让EA有能力解决更多特定的挑战,类似自然界的那种开放性的创造力仍然是无处可寻的。 现代的EA压根不会发明那些你从未想象过的新事物。

一些机器学习研究人员进一步提出,EA是劣等优化器,而替代算法(如深度学习)以更简单的形式适配优化问题。 然而,这种批评忽略了真正的问题。 进化,作为计算机科学中算法的灵感,并不是因为它是某个特定问题的优化器,而是因为它发明了自然界的一切。 机器学习中没有任何东西可以与之相提并论,而且大多数情况下,我们也不应该因为EA有缺陷不去研究它,恰恰是因此我们才更应该大力研究(和AI一起研究)。想象一下,那是我们本可能实现却错过了的东西!

就在此刻抽空想象一下吧: 如果我们真的可以靠编程发明一个真正的开放式算法,将会造成极大的影响。你对新的建筑学院、新的车辆设计、新的计算机算法,新的一般性发明感兴趣吗?如何不断地产生它们?如何产生更复杂的东西?音乐和艺术的无限新形式,让人乐此不疲的电子游戏所打开的新世界,在你的计算机内出现的独一无二的新宇宙… 自然界的力量就是创造的力量,它蕴含在开放性之谜中。这些梦想听起来也像是我们热衷于用AI解决的一些愿望,但是如果它们是AI的一部分,那么它们刚好是AI没有集中关注的领域(AI投注了大量精力针对特定问题寻找答案)。实际上,开放性可能是通向人工智能的道路之一,甚至也可能是唯一的道路 —— 毕竟是自然界的开放性进化第一次赋予了人类以智慧,况且,人类的智慧也仅仅是自然界的一种创造而已。因此,开放性与寻求人工智能肯定有所重叠,但它所探索的领域更广泛,而不仅仅是机器内部创造力的缩影。在地球上,自然界的自我生成能力令人惊异,而且只是无穷可能性的一小部分而已。

这一愿景绝非童话。 实际上,作为一种巨大挑战,『开放性』最激动人心的一个方面是,它显得非常可行。举例来说,构建一个生成系统(比如那种能够生成大量不同工件的系统),比直接用人类的智慧手动制造这些工件更简单,这一切听上去是可信的。或者换一种思考方式,尽管连接数万亿的大脑是自然进化的产物,但是进化本身的过程有可能更容易描述或实现。因此,我们可能真的能够鉴别出进化的必要条件——甚至在不久的将来就可以。

那么你可能会诧异地首先想到一个问题:如果开放性真这么简单,那为何还没得到解决? 其中一个原因是因为偶然的历史走向,这个特别的巨大挑战根本没有引起任何关注,而且导致很少有人(更别提那些有巨大才华的人)知道这个问题。 这个领域缺乏应有的思想沟通。但这不是全部的答案。答案的另一面指出,和许多重大挑战一样,其核心解决方案已经证明了比问题提出伊始时容易得多了。

现在越来越明朗的一点是,开放性尽管可能很简单,却牵涉到一种思维游戏,它迫使我们重新检查我们所有关于进化的假设。关于选择、生存、适应、竞争和适应的整个故事,的确对于分析来说是有说服力和启发性的,但综合到一起实在勉强:它并没有告诉我们如何把整个过程写成一个开放性的算法。为了明确我们在自然界看到开放性的原因(并据此能够写出一个具有类似能力的算法),我们很可能需要一个完全不同于惯常的对于演化的阐述。这种说法令人信服的原因之一在于,尽管程序可能很简单,但需要全新的视角打破江局。比如,人脑看上去能够展现出它独道的开放性创造力,因此开放性的过程可能从不同的基础架构(比如深度学习中)涌现出来。

要清楚的是,我们不是在暗示想要重现大自然的一切荣光。重点是什么?大自然的存在已经是既定事实了,我们更倾向于在创造『适用于任何领域、通用的、永不停歇的创造性算法』上挖掘潜力。假定我们所观察到的自然界,只是开放式系统大类中的一个特例。当然,有些人会基于某些原因辩驳说,现在的自然界是唯一可能的实现,但是没有明显的解释能够说明为何它就是唯一的,就像我们无法断定,在可以飞行的物种大类中,鸟类是唯一可能的。整个过程中的要素,包括个体(或者机器学习研究者可能称之为“候选者”)之间的互动、选择、繁衍等等,看上去都是通用性的。通用的开放性算法是可能实现的,理应激发许多聪慧的人类寻找具有巨大潜在回报的挑战。在名垂科学史这一点上,还有更多的空间留给另一个爱因斯坦,或者另一个沃森-克里克团队。

开放性简史

受到自然进化的启发,到目前为止,尽管非演化过程(比如产生新概念的单个神经网络)可以表现出开放属性,对开放性算法的研究的重心还是集中在EA上。然而,由于历史研究重心的原因,该领域的研究人员往往将其称为“开放式进化”。 纯技术角度而言,它们也属于进化算法大类,但其形式和语境通常与演化计算大相径庭,所以不应把它们与传统有关基因算法和EA的算法混为一谈。开放性进化位于完全不同的赛道。

首先,与几乎所有机器学习算法都不同的是,当研究人员构建开放性算法时,他们通常不打算解决任何问题。 相反,他们希望观察到一种爆炸性的复杂体系,其中演化出更加精妙、复杂的个体和形态。因此,该领域的许多早期工作,都集中在虚拟的世界(Artificial Worlds,通常被称为“alife world”)里,有潜力通往开放性的理论能够在这种世界中得到验证。这些虚拟世界里通常都会有一些“生物”,其行为包括跑来跑去,吃掉其他生物等等。

一些经典的虚拟世界案例包括Thomas Ray建立的Tierra,最初由Charles Ofria,Chris Adami和Titus Brown建立的历史悠久的Avida,Larry Yaeger建立的Polyworld,Alastair Channon建立的Geb,Lee Spector,Jon Klein和Mark Feinstein建立的Division Blocks,  和Thomas Miconi和Alastair Channon建立的Evosphere等等。 这些系统涵盖的范围包括使抽象计算机代码能够自行演化,以及让三维的类生命体互相打斗、竞争;他们至少有希望使得在环境中爆发出复杂性、多样性。一般来说,人们期望在虚拟世界中的生物可以会演变出越来越复杂的策略(有时是体态规划),因为它们都想在竞争中更胜一筹。

回顾来看,虚拟世界的这种模仿微型地球生态系统的倾向,可能无意中使得该领域看起来比实际上更狭窄。乍看之下,这些虚拟世界像是在试图使用比地球相对简单的模拟,复制地球上一小部分的生态行为。这一部分解释了为什么这个领域没有吸引到应有的兴趣。但是,在开放性研究的语境下,虚拟世界并不是真的在研究小型生态圈内的互动。相反地,它们的目的是为了寻求如何解决一个深层次的问题:如何触动某个诱发复杂性大爆炸的开关。如果你还记得开放性是一大类可能存在的系统这一假说的话,所谓『大爆炸』并不意味着仅限于类地球的这种模型。在本领域的发展初期,在真实世界(最早产生开放性的系统)和虚拟世界之间建立简单比喻,是使人能够方便地进行现象研究的方案之一。我们将看到,开放性实际上可以在虚拟世界之外进行研究。也就是说,本领域的宏图不在于仅仅创造一个开放性的世界,而在于满足开放性的需求,制造一个可以应用于任何事物的创造性平台。

针对远超过单一类别的系统,并以更严格的科学严谨性为目标,1992年,Mark Bedau提出了一套称为『活动统计量』的测量标准,旨在衡量此类开放系统所表现出的开放程度。有了这个工具(在某些方面上该工具甚至可以用来衡量文化进化 ),研究人员能够表明,至少就活动统计量数据而言,某些虚拟世界产生了开放性的动态行为。 比如,Alistair Channon建立的世界『Geb』评分不错,号称是『通过』了活动统计量检验的最高显著水平。

但这并不令人满意,因为不管统计检验如何解读,人们都清楚,所有这类系统都与自然相去甚远。的确你可以看到生物们正在学习相互追逐、加速成长,但除此之外还有什么?很明显这使人鲜有兴奋点。这种结果导致人们对于『开放性实际意味着什么』展开了辩论:Bedau的检验法是不是在某种程度上错失了关键点?毕竟通过标准还是要搞一些。这个辩论与其他新兴领域的类似辩论,比如如何用AI定义智力的辩论,是相近的。我们必须小心防止陷入无尽的语义争论的泥潭,这种争论价值很低。

2015年,在描述了抓住这个问题的关键的难点之后,Emily Dolson,Anya Vostinar和Charles Ofria提供了一个有趣的视角,试图找出『开放性演化不是什么』。也许这样,我们可以更接近本质。为了反映开放性的关键因素,在其他历史方法中,Russell Standish在2003年强调了新颖性的产生,Carlo Maley在1999年强调了复杂性的演进

还有一个需要强调而且引人入胜的重点在于,可能存在着不同程度的开放性(Bedau检验确实包含了这个思想)。 也就是说,对开放性的评价不仅仅是一个关乎『是与否』的二元命题。 就算我们更有可能通过高瞻远瞩获得最深刻的洞见,我们也将看到在实践中,哪怕是那些抓住了开放性有限特性的系统和想法,仍然能够以实用为目标,在通往全方位的无尽的创新之路上,教会我们重要的一课。

关于测量或定义开放性,一部分问题在于,关于其解释的一部分存在主观因素。也就是说,对创新的偏爱(这是开放性的关键)可能与特定的观点或语境有关。我们被某些设计强烈打动,是因为最终我们欣赏它们的功能;但是如果约束条件改变,使得设计不太有用(或者无法让人在情感上满意),那么即使设计看上去并非截然不同,我们也不太可能被打动。比如,如果世界上有山,而且我们真正关心到达顶峰,那么一辆自行车在上山下坡时的换挡能力看起来就像是一个真正的创新,因此,在不考虑问题提出的语境下,世界上是否存在对创新的本质性的衡量,目前还仍然不明朗。虽然科学家们通常都对主观因素敬谢不敏,不过也可能有办法在不牺牲科学严谨性的前提下使得开放性接纳主观性。 例如,我们仍然可以尝试对主观概念进行形式化,比如Ken Stanley and Joel Lehman对『印象深刻性』这种主观概念的研究。开放性中存在主观性这个问题,是有趣但微妙的。Stanley在其他地方已经进行了不少描述,但重点在于,开放性是一个棘手的问题,要想取得进展,我们可能最终需要退一步,抓住一个万无一失的客观评价标准,就像人工智能一样,就算没有就如何衡量智力达成共识,但仍不妨碍AI取得长足进步。也许Bedau的『活动统计量』在某天会被视为『开放性』领域的图灵测试 —— 那是最早捕捉到问题本质的启发性的一小步,而绝非全部精妙的复杂性质的最终断言。

与此同时,一些研究者通过攻克开放性问题的某些方面来接近开放性问题,而不是试图一次性解决整个问题。 例如,在一篇具有影响力的《自然》杂志论文中,Richard Lenski,Charles Ofria,Robert Pennock和Christoph Adami研究了如何凭借不可预测的进化路径,来演化出复杂的特征,这说明看似棘手的复杂性可以通过随机突变演化出来。其他人则强调了复杂性涌现行为的不同方面,例如Josh Bongard关于形态变化(即生物身体形态在其一生中的变化,以及跨代差异)如何能够加速演化出健壮行为进行了研究。尽管这样的研究没有着眼于全方位的开放性,但他们暗示,研究中存在着一些因素,使得其未来可能对开放性研究作出贡献。

随着新颖性搜索算法(由Stanley和Lehman提出,详见介绍性论文网站)的引入,对于开放性的研究范围进一步扩大。在开放性的语境下,新颖性搜索因为独立于任何特定的虚拟世界或者是特定的问题,因而显得特别值得注意。它采纳了开放性的某些特征,作为一种通用算法,它几乎适用于任何领域。把它与传统EA更加封闭的过程进行比较会帮助我们看清这一点,传统EA过程通常会将演化推向特定的能够预期的结果。在这种传统的算法中,自由探索的机会有限,因为选择压力会直接寻求改善问题的目标性能(比如尽快向前走)。比如,该算法可能会找到一个垫脚石,这可能会导致一些有趣的事情(比如这是产生翅膀的前兆),但由于初级的探索并不能直接提高性能,所以方案会被简单地丢弃掉。新颖性搜索的思路,是采取刚好相反的方法,而不是选择『改进』:新颖性搜索只会选择新颖的方案。也就是说,如果在进化算法中出生的候选人与之前在搜索中看到的相比是新颖的,那么它就有了更大的繁衍机会。从某种意义上来说,新颖性搜索是开放性的,因为它倾向于开辟新的搜索路径,而不是关闭通往这些路径的大门。

起初,这种方法看上去与随机搜索密切相关,因此几乎没有用处;但事实上,这种方法比随机搜索有趣的多。其不同之处在于,计算在搜索空间中某个候选人的新颖性需要一些关于『跟过去的探索相比,这批候选人的行为有何不同』的真实信息(随机搜索将被忽略)我们可能会问,现在的机器人的步态与前辈的步态究竟如何不同。如果差异足够大,那么它被认为是新颖的,并选择进一步的进化。结果就是,候选人的新策略(比如在步行模拟器中产生的新的机器人步态)发生了快速分支(即扩散)。我们发现这种发散的搜索算法实际上导致了初代不能走的两足步行机器人演化出了行走功能! 不仅如此,通过新颖性搜索演变而来的步行策略,平均也显著优于传统的、直接尝试培育最好步行者的步行策略。因此,开放性的、新颖性搜索式的探索,真的可以找到一些十分有趣的、功能性的解决方案,哪怕只运行一次程序,也可以得到多样性的结果。

在新颖性搜索诞生之后,一类新的算法开始出现,旨在将新颖性概念与更客观的进步或者质量评价相结合。例如,你可能想要搜索机器人能够行走的所有可能方式,但目标是要找出每个这种变体的最佳版本。这些算法(包括『局部竞争的新颖性搜索算法』或称NSLC算法,以及『多维表型精英归档法』或称MAP-Elites)产生了,它们被称为质量多样性(Quality diversity , QD)算法。来自Antoine Cully,Jeff Clune,Danesh Tarapore和Jean-Baptiste Mouret的基于MAP-Elites的算法是一个具备很高影响力的QD项目,它曾经登上《自然》杂志的封面:其思想是,在程序一次运行中,演化出一系列的步态,一旦机器人受到损坏,那么就使用这些步态来快速适应。这是一个很好的例子,它展示了开放性和QD如何能够把单纯的理论生态系统模拟转化为现实世界中对机器人技术的实际贡献,这一进展从开放性搜索带来的多样性中受益良多。

尽管听上去我们几乎已经解决了这个问题,不过事实是,这些早期的方法论只揭示了神秘的冰山一角。在我们的理解范围内,它们肯定算得上取得了一些进展,然而它们仍然缺少开放性的关键因素——这些算法注定要从开始执行的几天以内停止产生任何有趣的东西,而我们爱莫能助。究其原因,它们的问题领域只包含很一小部分的可能的搜索空间。在显得开始愚蠢之前,有趣的走路方式也就这么多。迷宫导航曾经是一种流行的新颖性搜索的早期应用,但是需要再一次强调的是,一旦你穷尽了迷宫里的所有能到达位置,离对这个领域失去兴趣也就不远了。的确,那些看上去疯狂的、躁动的(高熵的)轨迹或策略可以一直持续生成,但是对于最具野心的、真正的开放精神来说,这并没有多少吸引力。事情并不像『突然,一个新物种,比如鸟类,出现了』那么简单。在这种状况下, 令人感到神秘的是,就算我们能很好的理解如何在空间中对可能性进行持续搜索,我们也不是真的理解如何同时扩展可能性本身的空间。这意味着,开放性的最高水平,不仅要产生新的最优解,同时还要解决新问题。

举例来说,考虑长颈鹿和树木。 有意思的是,虽然树木本身就是解决生存和繁殖问题的一种可行的方案,但它带来了一种副作用,无意之间,它为长颈鹿涌现出全然不同的生存策略创造了契机。总之,如果没有树,长颈鹿就无法存在。 自然演化所产生的解决方案同时也为将来即将出现的(应对于新的挑战的)全新解决方案提供了机会。新颖性搜索和QD只能真正开放性地为现有挑战提供新解决方案,但它们本质上没有不会产生新的挑战。 而最强大的开放性系统中,两者都会产生。

长颈鹿与树木相互作用的思想与协同进化有关,当一个种群中的不同个体在进化过程中彼此相互作用时,就会发生这种情况,这就是自然界发生的事情。因为这种相互作用在开放式系统中看上去很重要,在协同进化计算领域中的工作(结合进化计算)与开放性也有关系。从计算的角度来看,许多研究人员在数年间对于我们理解协同进化系统做出了贡献。 Elena Popovici,Anthony Bucci,Paul Wiegand和Edwin de Jong对这方面工作进行了全面的综述。虽然协同进化肯定与开放性有关,但它也算是一个独立的研究领域。它探索了博弈论——竞赛的理论方面,协同进化的群体中发生的『军备竞赛』动态机制,以及导致此类军备竞赛升级或停滞的原因。Jorge Gomes、Pedro Mariano和Anders Lyhne Christensen把协同进化理论与新颖性搜索整合到了同一个系统中。当开放性算法本身备受关注时,过去对协同进化算法的研究可能会得到重新关注,甚至还可能引起那些从事深度学习的人的兴趣,最近一些人高调发表的结果,从类似协同进化的动力学中收获颇丰。例如,生成对抗网络(GAN)利用生成器网络和鉴别器网络之间的军备竞赛进行无监督学习;棋盘游戏中通过自我对弈学习、让具有强化学习能力的机器人之间进行的竞争等等也产生了惊人的成效。

总而言之,开放性领域是跨学科的,年轻的,相对而言是待开发的处女地。 迄今为止的实验结果结果,暗示了开放式系统的无限可能性,揭示了棘手的哲学问题还有待解决。太多事情还是未知数。事实上,该领域的文化是围绕着实验程序建立的,并且仍处于动荡之中,持续不断的投入努力是成功或者成功的基本条件——这是我们接下来要深入探讨的一个命题。

必备的要素

我们正在积累通用性的洞察力,比如,全面的开放性看上去可能需要协同进化的实体进行相互作用,这种作用超越了新颖性搜索,或者QD。什么是开放性的核心呢?这种思考激发了人们尝试着对其必要条件进行形式化描述。为了让一个系统有望呈现出高等的开放性动力学,所需要的最低条件是什么?理想的条件当然是充分且必要的, 不过就算只是确定一些必要条件,也算是个有意义的起点。必要条件不仅能帮助我们实现一个有效的模型,而且实际上也能暗示开放性系统潜在的广度。这意味着,如果必要条件具备足够的一般性与抽象性,许多和大自然不同的、形态各异的系统是可能被生成的。如若不然,如果它们具有高度的特定性,比如要求对量子物理进行模拟,那么开放性系统潜在的广度就会更窄。

关于必要条件集合的推测,可以追溯到1969年,Conrad Waddington分析了『典型』的进化系统中,个体如何与环境进行相互作用(原始论文位于这里,Tim Taylor做了一个很好的综述),重点在于研究导致多样性的机制。很久以后(2004年),Tim Taylor在具体工作中,试着把Waddington的假设检验法套用在一个被称作『Cosmos』的系统里,同时评价了把理论条件付诸实践的难度。后来,他自己的提出了一些条件(这里这里)。Lisa Soros和Ken Stanley最近合作的工作中,提出了一组条件(与以前的此类条件有某些相似之处),以及设计了一个测试这些条件的系统(称为Chromaria的虚拟世界,)。尽管关于必要条件的讨论还没有最终定论,不过,关于人们如何思考这个问题,提出一些条件集合的案例,对于给你一些直觉性的启发会有些帮助。这里,可以追溯一下Soros and Stanley在2014年给出的建议:

条件1:应该强制规定,个体必须符合一些最低标准(Minimal Criterion, MC,)才能复制,并且该标准必须是非平凡的。 推论:最初的种子个体(进化的起源)本身必须符合MC,必须非平凡以满足满足条件1。

条件2:新个体的进化,应该提供足够的新颖性以满足MC。

条件3:个体何时与世界发生怎样交互的决策,应该让个体自己决定。

条件4:个体表型的潜在种类和复杂性(原则上)应该是无界的。

当然,随着时间的推移,研究人员可能会改变他们的假设,比如,Stanley已经扩展了他对条件3的观点(他现在允许个体可以忽略条件3,只要计算复杂度可行,可以允许个体与世界里所有的其他个体进行交互)。不过,这里的重点并不在于要建立教条式的规则,在早期阶段这不仅不负责任而且危险;相较而言,我们是要在这种程度的抽象层面上,培养一种思想的品位。

就在今年,Jonathan Brant和Stanley提出了一种被称为最小标准协同进化(Minimal Criterion Coevolution, MCC,)的新算法,实现了让新颖的个体为彼此创造新机会的想法。其目的是,促进一种通用语境下的开放性,这种开放性独立于任何特定世界或领域(这里提供了代码)。其思想是,让两个互相交互的种群进行进化,通过比对方种群更好的满足最小标准(MC),来获得繁殖的权利。一个迷宫的种群,和一个受控于神经网络的迷宫求解器的种群,发生协同进化 —— 迷宫变得越来越复杂,神经网络不断进化试图解决迷宫问题。 从而,新的迷宫为迷宫求解器提供了新的创新机会,反之亦然。这个实验,及其(未发表)后续实验的有趣指出在于,如果有足够的计算资源,如果我们让它持续地运行数十亿年,我们可能会找到太阳系大小的迷宫,以及一些能够求解这种迷宫的、受控于神经网络的机器人。这个思想实验处于我们当前理解能力的边界,需要强调这一点的原因在于,这种巨型迷宫及其求解器在多大程度上能满足最具雄心的开放性目标,现在仍未可知。

不过,这个实验更有趣的含义是在于,在同类的MCC设置中,有可能存在各种令人意外的协同配对方式与细节。 比如,想象机器人的身体与控制身体的大脑协同进化。开放性开始变得像一个适应实际领域的工具了。

即使像MCC这样对开放性的尝试在不断改进,我们将会不断重新观察到的是,大自然的复杂程度所呈现出的创新性,仍然是我们远远无法企及的。基本的研究还等待着我们去突破,如果这个领域发展成熟起来,抓住了更深层原理的一点点蛛丝马迹,那么突破可能就在不久的将来。

实践领域中的开放性

开放性系统的一个潜在的重要应用是富含创造力的设计。从建筑物到汽车、药品、玩具、机器人、在超市购买的饮料,我们所创造的所有东西,几乎都是由某种设计过程产生的。设计师,通常而言是人类,必须同时考虑产品的功能以及美学形式。有时候,类似的产品应用在完全不同的场合,例如有些船是针对豪华出行设计的,另一些则是用于航运。在你能想象到的任何领域中,开放性系统都能提供生成无数备选方案的潜力,就像自然进化为生存和繁衍的问题产生了无尽的解决方案一样。从商业公司到个人爱好者(有可能是在改进三维打印技术的帮助下),开放性可以大大扩展选择范围,产生之前不可想象的新的可能性。这种进步可以在各种意料之外(有时还很有趣)的方向上进行,如全新的、有趣的食谱。它可能与人类互相协作,人类可能会影响搜索行为(这一行为有时被冠以『交互式进化』的名头),也可能自动地、源源不断地产生新想法,人们可以在闲暇时看到最新的创意。

在音乐和艺术领域中,开放性也蕴含着巨大的潜力。它可能也会要求人类参与到创造过程的某个环节中,不过数百年来,音乐和艺术的进步是自然而然开放性的——一个音乐流派,或者一种音乐风格,一个又一个的相继产生,不断发展。诚然,我们对艺术史的欣赏带有主观性,单从理论上来说,没有什么能够阻止我们在我们乐在其中的主观领域中加速展开探索。已经有一些蛛丝马迹显示,交互式进化(进化循环中包含人类)展现出了开放性属性,例如Ken Stanley实验室的Picbreeder在线实验,允许用户产生新的图像。在那里,你可以看到越来越多的存档图像进入了全新的图像空间(如昆虫,动物和脸部)。但是这个案例只抓住了表面现象:个性化的香水,新的饮料大类,或者家庭建筑——谁知道还会有什么——都可以被交互式地共同创造出来。能够创造一种开放性系统,并把人类纳入交互循环中,具备这种能力预示着未来可能会产生不少有趣的东西。

数学系统和法律体系与生俱来地包含着开放性的美。例如,开放性探索所带来的非欧几何是一个丰富的领域,把传统欧几里德几何中某些公理放松,这种试验性的探索带来了非欧几何。给一些好奇的数学家们一些初始的『种子公理』,算法的开放性系统是否能够地不断产生有趣的以及令人惊讶的证明?法律制度也有半正式的规则,立法者为了某种目的而制定法条,另一些人专门钻空子,这种猫鼠游戏体现出一种开放性的生态。 开放性系统可以帮助政治家们自动找到那些他们尚未考虑的极端情况还有哪些其他的标准或半标准的系统,能够凭借开放性的创造力,蕴含着有趣的惊喜呢?

游戏是开放性的另一类有前景的应用。开放世界、内容生成已经是业界潮流,不过一个原生开放性的世界有潜力给人带来非凡的体验。想象一下,游戏世界不断重构自己,增加复杂性,简直就是一个独立的自然界。内容也可能会无休止地演变成无法想象的崭新形式。游戏可能不再仅仅是游戏,而是快要演化成为一种形态——人类可以像自然学家探索一个各种造物都令人震惊的外星世界一样探索它。有望达到这种水平的一个早期案例是『银河系军备竞赛』,这个视频游戏最初也是在Ken Stanley的实验室里开发的。其中,游戏持续不断地根据玩家的行为发明新的粒子武器。关于可能发生的一切,尽管这个游戏可能只捕捉到了肤浅的表面,但它有助于说明,就算是现在,让游戏自动地生成新颖内容也是可能的。在商业游戏世界里,『无人之星』和更早出现的『孢子』都展现出了对具有无限创造力的时尚世界的渴求。虽然都让人感到印象深刻了,但想象一下真正的开放性——它们不局限于巧妙手工编码的参数空间——将会是多么的壮观。

AI中的开放性问题

关于开放性的挑战,天生就是关于人工智能挑战的姐妹问题。『地球上的进化是一个开放性的过程』,如果我们接受这一论断,那么其中最深奥的关系,可能是『人类水平的智慧』是地球上的很多种产品之一。换句话说,开放性可能是人工智能的先决条件,或者至少是一种很有前景的道路。 大部分研究AI的方式和研究开放性的方式大相径庭,而『开放性是通往AI之路』这种思想显得很有趣。在AI研究中,优化特定客观目标的方法无处不在,这却几乎与开放式系统如何生成其产品完全相反。

AI和开放性的重叠之处远非止步于此。一个有趣的事实是,一方面开放性可以驱动寻找智能的过程,它也可以是智能自身的引擎。人性,看上去至少有一部分是开放性的。我们不仅要优化思路以完成任务,而且还不断创造新任务、识别新的待解决的问题。我们很贪玩,比如在艺术和音乐方面,就算没有什么特定的问题需要解决,我们也会通过创新来激发自己。我们人类,不管是作为一个社会,还是作为需要度过一生的个人的集合(当然有些人是要比另一些人活的久一些),倾向于产生一套连续的思想和发明,这之中并没有统一的方向,或者一个整体的单一目标。此外,在最能体现人性的特征里,创造力也占据一席之地。当我们看到算术天才心算乘法时,我们首先不会想到这种才华能体现出多少人性;但如果他们会谱写一首美丽的歌曲,或创造一种改变我们生活的设备,那么他们展现出人类奋斗的最好一面。

简而言之,我们头脑中开放性部分,是令我们有别于机器的那种『灵光一现』,这意味着,开放性是我们所说的一般智力的核心组成部分。 这一点相当重要,因为AI领域中有一种倾向,让智能的定义包含『解决问题』或者『学会有效地解决问题』。然而,开放性却被排除在外。 一个『一般性』的开放式系统,不是一个机器般的问题求解器,而是一个徜徉于想象空间中,具有创造性的造物主。 这当然也在人类智慧的广袤范畴之内。

在这种背景下,经年累月聚集了大量发明的社会组织也是值得思考的。诚然,智慧是文化进步的一个因素,毕竟文化是大脑的产物;但是亿万大脑形成的网络看上去形成的效应要远远超过单个大脑能做到的事情——思想在整个网络中传播,成为新想法的垫脚石,然后继续传播,循环往复。事实上,文化在某种程度上让人联想到进化。当然,文化变迁与演化之间的共鸣,在过去已经被讨论过许多次了,这里姑且不做评价,但它突显出了一个相关的事实:当我们理解开放性时,我们也就对文化更有洞察力。文化是众多智能交互的产物,对理解人工智能也十分有价值。

反思文化的智慧及其创新动力,我们激动地注意到,开放性似乎包含了一些接近闭环的“元创造”的核心:生物进化产生了人类思想;人类思想发明了无数新的开放性进程,比如如艺术与科学;科学可能最终将开放性提炼出来创造出一种算法,这种算法有潜力孕育出有能力匹敌(甚至超越)其人类创造者的AI,其本身也可以产生新的开放性形态。考虑到开放性巨大的投资潜力,它和AI安全也有着明确的联系,人们对强人工智能所诱发的社会风险的担忧日益受到关注。例如,AI安全中的一个挑战,就是所谓的价值匹配),其目标是确保强大的AI的目标函数在数学上是围绕着人的价值观建立的。有趣的是,如果开放性是通往人工智能的一条可行路径,那么,相对于用数学定义它们而言,理解什么样的环境因素会鼓励这种价值观的进化是更容易的。例如,我们可以创造一个虚拟的世界,使得其中自然孕育的大量合作是温和的。毕竟,是开放性亲自开创性的构建了人类价值观。

最后,开放性挑战会给AI中的特定领域带来繁荣发展。特别是涉及大型高维空间搜索的领域,也就是演化计算和深度学习,受到开放性领域研究进步的深刻影响。进化算法作为自然界的隐喻在开放性领域研究的传承者,不过深度学习也正处于研究处女地的前沿,开始尝试用它独特的能力抓住一些人类思维开放性的本质。精确的梯度跟随(深度学习的核心精神)如果设计得足够聪明,也可能加速开放性的发展进程,也许最终,把演化计算和深度学习融合在一起的产物,可以抓住某些文化开放性的特征,或者寻找到近代生物史上大脑快速进化的蛛丝马迹。

实际上,开放性的挑战和人工智能的挑战之间,存在着大量关联,今后可能还会有更多的关联等待我们揭开面纱。

加入挑战

虽然只有相对一小部分人在长期研究开放性,由于迄今为止缺乏协调一致的努力,或一笔足够的资金支持,该领域基本上还处于萌芽阶段。我们对开放性系统的广度,潜在的开放性程度,触发开放性的『复杂度大爆发』的必要条件,只有初级的认识。在我们的军火库里包含一些可能管用的武器:演化计算,神经进化,深度学习,虚拟生命世界,新颖性和扩散性,协同进化和自我对弈,最低开放性准则等等,它们是强有力的,引人注目的,但是关于如何把他们组织成为一副宏大的图景,我们还是知之甚少。简而言之,为了参与一场我们所知道的最被低估的伟大挑战,一万年太久,只争朝夕。这个领域是开放的,最伟大的发现还有待探索,潜在的应用场景和影响力是巨大的,而且从此以后人们对它的兴趣肯定会与日俱增。

那么为了加入到其中,你需要做些什么呢来介入?首先,如果你能进行电脑编程,那么你应该具备必要技能了。不过,就算没有,也许你可以提供一些专家意见或者洞察力。生物学,数学或人工智能的一些知识可能会有所帮助,不过现在我们并不确定哪些部分是必需的。因此,各种不同的知识背景都具备潜在的价值——哲学,艺术,物理,文化研究,甚至更多的学科——开放性,本质上是跨学科的。你只需要记住,在这个领域,单独一个解释是不够的,我们要建立行之有效的体系来演示开放性,这就是挑战如此伟大的原因。所以,你必须要真正把想法付诸实践,清晰并且稳健地经受住评估。在真正成功之前,我们必须避免沾沾自喜。观察到一些有趣的事情正在发生,可能效果显著,可能是一个重要的进步,但与大自然(或文化)中的那种『复杂性大爆发』不可同日而语。对我们迄今所取得的成就保持现实和清醒, 能够让我们避免陷入沾沾自喜,在未来取得革命性的进展。

如果加入这个挑战让你备受鼓舞,这里要提到有几个有用的资源。首先,大多数关于开放性的出版物和会议,到目前为止都是由国际人工生命协会管理的,所以你可能想要看一下。他们将会于2018年7月在东京举行的人工生命会议。近两年,在这些会议上举办了开放性的研讨会,来自这些活动的一些想法和参与者被记录在案,例如2015年第一次OEE研讨会的报告,以及一个包含会谈视频的简单网站。2016年第二次研讨会的论文位于本网站。通过在谷歌学术搜索『开放性进化』或者『开放性』关键字,可以找到一些经典的这方面的学术文献。神经网络领域也与开放性相关,其中神经网络(深度学习使用了同样的结构)是通过EA进化而来的。通常,开放性实验涉及某种形态的神经进化。Ken Stanley在另一篇O’Reilly的文章中对神经进化做了一个一般性的介绍

要找到一份已有的源代码开始研究的话,像Avida或者Chromaria这种虚拟生命世界平台, 新颖性搜索MCC即最小准则协同进化都可能作为研究的起点。不过需要记住的是,该领域并不绑定任何特定的平台、基准测试或者算法。所以,现有这些源代码在将来可能被迅速超越,而且,就算是现在的领先方法,在很多议题上也都没有达成共识。 开放性仍然是科学的狂野西部,存在着不确定性,然而令人激动。

在写下此文之时,我们还不知道已经有一个活跃地讨论开放性的公开论坛。不过,事实上Reddit是有一个关于『开放性进化』的论坛,最近一年也不太活跃了。我们本可以把读者导流到那个论坛(说不定还能复活它),我们仔细考虑过这个选项,在深思熟虑和讨论后,我们得出的结论认为,开启一个全新的关于开放性的subreddit子串较为审慎,因为我们觉得,开放性可能不仅是一种进化现象,我们也不想排除可能来自演化计算领域以外的所有惊人想法(比如,来自深度学习,贝叶斯方法,生物学或神经科学等)。与此同时,我们对这个领域的先驱们表示出最大的尊重,这些先驱者基本上是以进化方法(和人类的进化类似)为基础开展研究的,因而我们也希望他们能加入到这个重新充满活力的对话中来。总之,我们认为,通过这篇文章的发表,创建一个大跨专业领域专家讨论的纽带,是值得尝试的。希望读者能考虑加入我们。

在今天,计算机科学、人工智能或者机器学习领域的这种『问题-解答』的主流范式,被开放性研究发起了挑战。在那些领域中,你可以选择一个问题和案例,在某些基准测试上给出更好的结果,而开放性并不是那样的。开放性是冒险家的游戏,这些冒险家渴望着没有明确目的地的冒险。这种冒险本身就是创造力之路,路的尽头是生成我们现在无法想象的东西。欢迎加入最新的宏伟挑战。

鸣谢:

我们要感谢来自UCF的进化复杂性研究小组的杰出同事,David D’Ambrosio,Jonathan Brant,Jason Gauci,Erin Hastings,Amy Hoover,Navid Kardan,Greg Morse,Justin Pugh,Sebastian Risi,Jimmy Secretan,Paul Szerlip,Phillip Verbancsics和Brian Woolley。感谢他们多年来帮助我们理解开放性和热爱作出的贡献。 还要感谢一些把这一新兴领域奋勇扩展为整个开放性进化社区做出的巨大贡献的人,我们本希望对你们在本文中充分表达诚挚的谢意,由于完整名单太长暂且略去。我们知道的是,你们在几乎没有资金支持或被人认知到的条件下,争先探索了其他人甚至不敢涉足的领域。

Kenneth O. Stanley

Kenneth O. Stanley 是中佛罗里达大学(UCF)的一名教授, 在那里他担任进化复杂性(Evolutionary Complexity, EPlex)研究组的主任。同时,他也是Uber AI实验室的高级研究科学家。可以通过kenstanley001@gmail.com联系到他,或者在Twitter上搜索@kenneth0stanley找到他。

Joel Lehman

Joel Lehman 是Uber AI 实验室的一名研究科学家,在那里,他进行深度学习和演化计算的研究。若要联系他请发邮件至lehman.154@gmail.com。

Lisa Soros

Lisa Soros是尚普兰学院计算机科学与创新系的副教授。同时,她还担任国际人工生命学会的董事会成员。可以通过lisa.soros@gmail.com向她发送邮件,以及可以在Twitter上关注她@err_more。

分形(图像来源:Pixabay)