春节特辑:胡昂院士讲座|AI汹涌而来--与人类共生的未来(下)
以下文章来源于胡藤井研究室 ,作者HUFUJII Lab.
引 言
回顾人类创造的从0到1的伟大变革,一同展望未来。探讨当前大语言模型的缺点与不足,那人类又是如何做到的呢?从人脑的奇妙来看人类为何如此聪明。如果大型人工神经网络也可以做人脑类似的事情,那么AGI应该往何处去?什么才是未来有价值的事情和方向?人类未来应与AI如何共存?讲座抛砖引玉,试图回答上述问题。
04.回顾变革:那些人类创造的从0到1的伟大变革!超前50年的IPAD:DYNABOOK
· 超前50年的IPAD:DYNABOOK(1972)(来源:Google)
1968年,在施乐公司的电脑工程师 阿兰·凯伊 构想出了一种全新的电脑形态,取名"Dynabook"。凯伊所构想的Dynabook是一件如同笔记本大小的设备,拥有一个等离子屏幕,能够像书本那样以同等大小比率来显示文本和动态图像。此外,Dynabook还可以连接上高带宽的网络,并且附带有虚拟键盘的功能。实际上,这种功能就是后来所谓的触摸屏技术。凯伊当时对友人所说的:“把手写识别应用到计算机上,我能创造出一种超媒体,就像现在的报纸,但它是电子化的。”此外,根据凯伊的设想,这件设备还可以储存“数个小时的音频或视频文件”,甚至连网络下载这种方式也在他的考虑之内。
如果今天的人们能够再阅读一遍这篇文章的话,会惊讶地发现凯伊的描述就像是在五十年前指导人们如何使用iPad一样,这无疑是一个超越时代的伟大构想。但是令人遗憾的是,这篇文章在当时没有引起任何注意,凯伊所设想的Dynabook成为一个虚无缥缈的设想。但神奇的是,这个方案的设想在展览上被年轻的乔布斯看到了,乔布斯对当时Dynabook的用户界面的前卫设计印象极深。
· IPAD(来源:Apple)
在电子产品的发展史上,"Dynabook"有其重要的地位。尽管这款产品从未真正被生产,也从未被大众使用。但是,它对后来手机、微型电脑技术的发展有重要的影响。在那个电脑技术都还很生涩的年代,阿兰·凯伊的设想领先了大众近50年。这种先见之明源于凯伊对当时的时代以及电脑科技的敏锐观察,这是一种难得的天赋。所谓「超前」,是说事情做得太早,大众理解不了,但并非毫无价值。
· MAD北京2050和英国建筑电讯小组实验作品(来源:Google)
试想,假设有一项任务是给100年后的北京做城市规划,比建筑学知识更重要的事情是,要思考“100年后的北京是什么样子?”立足于当下去推测未来世界的模样,这并不是一件容易的事情,而所有关注未来的学者所要解决的就是这样的难题。今天的乌托邦很可能变成明天的现实,各种乌托邦都常常是早产的真理而已。——卡尔·曼海姆
接下来让我们通过一些图片,回顾一下人类发展至今,形同天方夜谭般的想象力创造出了前所未有的,实现了从0到1的变革。
埃菲尔铁塔(公元1887- 1889) 近代技术的里程碑
· 埃菲尔铁塔(来源:Google)
由居斯塔夫·埃菲尔设计,作为巴黎世博会的象征而建。高300.65米,高度在当时是独一无二的。它是近代初期钢铁构造工学、美学的集大成者,也是近代技术的纪念碑。作为最初的市民建筑具有里程碑意义。
达芬奇.飞机手稿(始於1502年)对太空未知的探索
· 达·芬奇飞机手稿(来源:Google)
在达·芬奇的智慧笔记中有着大量关于飞行研究的记录,其中就包括他对小鸟飞行的观察,并在他的《鸟类飞行手稿》(1502年)中设计了人机,他将这种同时具备推动力和提升力的设计称为“扑翼飞机”。
奔驰一号(1885年)对速度的向往
· 奔驰一号(来源:Google)
1885年研制出世界上第一辆马车式三轮汽车,并于1886年1月29日获得世界第一项汽车发明专利,这一天被大多数人称为现代汽车诞生日,奔驰也被后人誉为“汽车之父”。
向星空外进发(公元1968)
· 向星空外进发(来源:Google)
1968年12月24日“阿波罗8号”的宇航员拍摄的《地球》照片,是有史以来从太空拍摄的第一张彩色照片,它显示的是一颗蓝色球体悬挂在灰色月表上空。
阿波罗计划(公元1969)
· 阿波罗计划(来源:Google)
1969年7月20日,尼尔·阿姆斯特朗在月球上刻下了人类的第一步。从这一瞬间开始,对于人类来说是一个新的纪元。这个足迹距离地球384400千米。
走向21世纪——幻想的未来:X-Seed 4000(公元1990s)
90年代初,大成建设开始X-Seed 4000塔的超高建筑物计划。设想中,该建筑物共有800层,高达4000米,底部直径达6000米。这座山体形建筑物可容纳500000到1000000人居住。蕴涵着未来环境保护主义的建筑物,将现代化的生活方式与自然环境有机地结合起来,是一座可以自给自足的人工智能型生态城。
· 超高层塔·X-Seed 4000塔(来源:Google)
· 超高层塔·X-Seed 4000塔(来源:Google)
互联网和万维网(20世纪60年代末及20世纪末)
互联网(Internet)是指一种连接了全球计算机网络的基础设施。它最初由美国国防部在上世纪60年代末建立的,旨在连接分散的计算机网络,以便进行信息共享和通信。互联网是一个巨大的网络结构,允许全球范围内的计算机和设备相互连接和交换数据。
万维网(World Wide Web)是由英国计算机科学家蒂姆·伯纳斯-李提出,在互联网基础之上的一种信息系统,它使用超链接将分散的信息资源组织起来。创建了第一个Web浏览器、Web服务器和用于创建和管理网页的基本技术。它的核心是使用URL(统一资源定位器)来定位信息资源,并通过超链接将这些资源连接起来,使得用户可以轻松地浏览和访问网页。
· 万维网·互联网(来源:Google)
这两个发明都在技术和信息传播方面带来了革命性的改变,互联网提供了连接各种计算机网络的基础架构,而万维网则是在互联网基础上的一种信息组织和访问方式。两者共同推动了信息的快速传播、全球性的交流与合作,成为了现代社会和经济的重要基石。
手机
· 手机(来源:Google)
手机最早起源于20世纪70年代末和80年代初。第一部商用移动电话是由美国Motorola公司推出的,名为DynaTAC 8000X,于1983年问世。这款手机体积庞大、重量沉重,只能实现基本的语音通信,通话时间也相对较短。1990年代末至2000年代初,手机开始融入更多功能,如简单的游戏、日历、短信功能等。真正意义上的智能手机在2007年由苹果公司推出的第一代iPhone引领,它将触摸屏技术、强大的处理能力和直观的用户界面结合在一起。iPhone的成功激发了其他厂商的竞争,推动了智能手机市场的快速发展。
量子计算机(英语:Quantum computer)
· 量子计算机(来源:Google)
传统计算机使用的是经典比特来存储和处理信息。每个比特都可以表示0或1。但量子计算机使用的是量子比特,这些量子比特可以同时处于0和1的叠加状态,而不仅仅局限于0或1。这使得量子计算机在处理信息时具有一些独特的优势。量子计算机能够利用量子叠加和纠缠等特性,以一种并行和高度并发的方式处理信息。这意味着在某些情况下,量子计算机可以以指数级速度执行某些特定类型的计算,相较于传统计算机,能够更快地解决某些问题,如因子分解、优化问题、模拟量子系统等。目前,量子计算机仍处于发展阶段,面临着许多技术挑战。
展望未来:人类与AI共生,机会在哪儿?话题再次回到建筑学领域,这是通过模型训练,掌握了维多利亚式、巴洛克式、曼哈顿式住宅设计手法后,由AI自动生成的上述风格新住宅设计。
· 曼哈顿式(来源:Google)
· 巴洛克式(来源:Google)
· 维多利亚式(来源:Google)
那么,AI可以替代建筑家吗?
· 弗兰克·劳埃德·赖特(来源:Google)
形状文法(Shape Grammars)是沟通计算机与建筑生成设计的重要桥梁,人工智能中生成几何形状的基于规则的系统。与传统语法类似,建筑语言也有自己的语法规则,支配着分析、设计和创造建筑的过程。任何一种建筑形式都可以被解释为一套有自己一套形成规则、句法和语义语法的形式语法系统。
· MIT用形状文法研究赖特的草原住宅(来源:Google)
上世纪90年代MIT持续将形状文法用于研究赖特的草原住宅,用形状文法分析Wright的草原风格住宅的组成形式。后来研究人员根据研究结果推测出赖特会选择建造的住宅模式,但这些模式并没有在赖特的后来的作品中出现。研究人员发现,赖特的创作手法发生着某种转向,这种转向的次数、时间、途径都是偶发性的。人身处在一个极大的算法内,这个算法包含一切「形」和「物」,在那个强大的算法中一切都井然有序,自成逻辑。而人工智能的算法系统,尚且无从模拟如此复杂的过程。
因此,若要穷尽一个创作者的所有创作路径并预言其中的变化几乎是不可能的。因为建筑家的创作包含很多跳跃性思维,有很多源于经验和阅历的联想。建筑家的跨界创作也是影响其风格变化的重要元素,而这些都是人工智能所不能取代的。
结论:形状文法能够分析赖特的草原风格住宅的创作特征,也能模仿制造具有相同特征的建筑,但是无法真正推测赖特的创作手法,形状文法只能“抄袭”旧有的赖特,但无法预言未来的赖特。人的主观能动性能在创作中“否定自己”,推翻“习惯路径”,这是现有的建筑智能领域无法达成的。
从形状文法的案例中,我想强调的是:只有人类才会具有的“精神的力量”。我们追逐信仰,在偶然中创造新事物,拥抱命运可能性。有时人类从错误和失败中挖掘出一条新的发展方向,在“试错“”走弯路”的途中找到一个未知问题的答案。
人工智能则无法摆脱大量学习后的习惯路径,无法面对未知。而未来也是不可计算的。“重要的是要承认,人工智能技术目前还远未具备与人类意识相媲美的真正智能和情感。它可以完成的任务类型有限,但人们普遍认为现有的技术具有极其强大的潜力。” – Kåre Stokholm Poulsgaard,GXN 创新主管。
憧憬未来代表一种人类向前看的进步思维。“自从人类第一次学会分析思考并使用合适的材料让生活变得更舒适、更安稳以来,我们就面临着穿越一道又一道的边缘地带不断开拓新疆域的任务,这些边缘地带一直是通向未来世界的必经的入口。”
从某种角度来说,设计的生命力一一甚至可以进一步说一一人的生命力,正是体现在描述未来梦想与绘制远景蓝图的能力。我们最好的面对人工智能的解决办法就是“一直向前”。
AI与人类的对弈
· ChatGPT(来源:Google)
回望过去的这一年,大模型的出现永远改变了当前的技术产业格局,却鲜少有人说起大模型真正的致命缺点。“如果你问 ChatGPT,乌干达总统是谁?它会给出一个答案。但你问它对刚才说的话有多确定?它表示无法回答。”这就是当前大语言模型最欠缺的:缺乏量化不确定性并进行干预的能力。机器学习中的算法可以从数据中学习,但对于不确定性、如何量化不确定性以及在不确定情况下采取行动并没有太多复杂的解释。
那人类又是怎样做到的呢?
· 对世界地观察和理解(来源:Google)
最直观的理解是,人类擅长对世界的观察和理解。面对周遭世界的复杂性以及周围所有的不确定性,人类会“随遇而安”,顺应环境。我们采取行动,做出承诺,选择持续数天或数年的行动路径。或许应该获取更多数据,来应对不确定性。人类很擅长统计数据和针对不确定性的推理。
人类为什么这么聪明?
· 200个细胞与功能数据匹配(来源:www.microns-explorer.org)
让我们来看看人脑的奇妙。人类大脑的神经纤维总长度是18万公里,能绕地球四周半。一个正常人约有100亿个神经元、 1000亿个神经元胶质细胞。神经元彼此之间要建立关联,要形成突触,这是十兆级的。
· 脑血管图(来源:www.microns-explorer.org)
大脑血管加起来的长度约有160万公里,相当于绕地球赤道40圈。因此,为维持生理需求,虽然大脑只占全身体重的2%,却消耗人体1/5的能量。
如何理解人类的行为,这一点非常困难且颇具挑战性,在认知和神经科学领域也进展缓慢。人类的智慧决策也许远比我们现在所知的更复杂,理解大脑的思维模式并不适合我们这代人,也许需要很长的一段时间。
· OpenAI首席科学家Ilya Sutskever(来源:Google)
另一种观点则认为:“如果将神经网络和大脑的运作方式做类比:两者都接收数据,汇总数据中的信号,然后根据一些简单的过程(神经网络中的数学,大脑中的化学物质和生物电)来决定是否传播这些信号。这是简化的比喻,但原理是类似的。如果你有一个非常大的人工神经网络,它应该能做很多事情。特别是,如果人脑可以做一些事情,那么一个大型人工神经网络也可以做类似的事情。”(Sutskever)
AGI应往何处去?
· AGI(来源:Google)
接下来我们讨论一下AGI(通用人工智能,像人类一样聪明的AI)“它是指人工智能的智能程度,如果人类能完成的任务,人工智能也能完成。然后,你可以说实现了AGI。”
Sam Altman声称人类在2030年前会实现AGI,尚且无法确定。通过暴力运算的方式可以从大量文本或者其他数据中,实现在某种程度上模仿人类并执行一些有限推理的系统。
但这些只是工具,就像搜索引擎。搜索引擎出现时的概念就是,一个小盒子在手,就可以拥有世界上所有的知识,提出问题就会得到答案,这是我父母那一辈从未想象过的事。看起来很疯狂,但它没有占领我们的世界。它使我们让自己变得更聪明、探索更多、做得更好的工具。自然语言模型也一样,可以交互,为我们提供信息。只是在搜素引擎基础上更进了一步。
AGI 是一个变动的目标,比如进行积分的数值计算,建立网络索引和查找信息等等,在很多方面计算机都比我们更好。但比如说在交流或者写歌(这种偏人文的领域)方面也需要比我们更厉害的计算机吗,我不确定这个的意义是什么?所以这个意义上,AGI不是一个非常明确的工程或科学目标。
我们必须清醒地认识到,利用AGI做什么才是有价值的事情。
12月20日,Nature上刊登的最新科研成果,卡内基梅隆大学研究团队开发的AI化学家Coscientist能自主设计、规划和执行复杂实验。这款基于GPT4等大型语言模型的AI系统,成功实现阿司匹林、布诺芬等药物的合成,并在几分钟内优化了”钯催化交叉偶联反应”,而这正是2010年诺贝尔化学奖的获奖研究。
未来,你可以用AGI做很多了不起的,甚至不可思议的事情:实现医疗自动化,让医疗成本低一千倍,医疗效果好一千倍,治愈很多疾病,造福全人类;或者是真正解决全球变暖问题。而不仅仅是单纯盲目地收集越来越多的数据,训练越来越大的系统,期待超级智能将会从中涌现。需要确定更具体的工程目标,发现问题并解决问题,比如改善医疗保健、交通或教育系统。(现在很多人把创建超级智能说成是他们的目标,我觉得这有点盲目。)
未来应与AI如何共存?
在当今科技飞速发展的时代,如何与人工智能和谐共生成为关键议题。人工智能对于现有问题的研究效率确实令人叹为观止,我们的确需要面对Ai技术发展带来的生存焦虑,但其被发明的初衷,应该成为人类的助手而非敌人。
· 探索垂直领域(来源:Google)
首先,关键在于寻找主导权,深入探索垂直领域,发现并解决行业内部的痛点。创作新事物的能力,是弱人工智能阶段,人之所以不会被人工智能替代的唯一方案。创造是人们描绘梦想的一种方式。对于倾心未来的人而言,这是对自身直觉能力更高层次的要求:能不能从社会表层上发掘出常人不易觉察到的潜在需求,并针对这些需求提出具有前瞻性的解决方案。这需要精准洞察细节,发掘那些标准助手API无法满足的复杂场景和细分市场机会。在技术差距逐渐缩小的背景下,更精准地把握市场痛点和用户需求,会带来新的生存空间和发展优势。
解决社会中的任何问题都可以从集体层面来思考。比如交通,设计一辆自动驾驶的汽车,这是一个很好的目标。但这只是一个起点,真正的目标当然是建立一个交通系统,让人们快速、安全地从 A 点到达 B 点,仅仅实现驾驶的全自动并不能一劳永逸,因为自动驾驶汽车需要与周围的其他汽车进行互动。
· 无人机自主巡航(来源:Plateau)
飞机系统的工作原理也类似。我们现在没有太多飞机失事,世界上每天有数十万次航班,它的工作原理是因为它是一个由飞机组成的整体系统。它们相互通信,与地面通信,并且在飞机网络层面有一个整体的大规划,这样它们就不会相互碰撞,并且即使天气恶劣,整个系统也能正常工作等等,虽然不完美。重点不是自动驾驶飞机,而是整个系统的设计。
· 车辆自主巡航(来源:Plateau)
对汽车也是同样的道理。汽车应该相互通信。如果一个孩子跑到街上并且遇到危险,汽车会告诉周围的所有其他汽车,他们应该小心,减速,这种汽车的集体行为会更安全,也不会导致太多交通堵塞。类似一种市场协议。同理应用在人们的医疗保健或教育计划当中,人们将以复杂的方式相互交互,发展出学习算法,问题变得非常新奇和有趣,这才是我认为需要花时间思考的问题。
其次,是要与时代同行,我们要毫不犹豫地拥抱科技的浪潮。根据特定客户要求、环境需求及社会文化背景做出独特的设计。关键在于与彼此的优势合作:计算机和软件可以将繁琐和重复的日常工作自动化,为建筑师腾出更多的时间来专注于建筑的创造性和个人化方面。
· 未来社区规划发展思路(来源:Google)
· 探索垂直领域轨道交通多式联运与集约化Maas(来源:Google)
· 规划、交通与低碳一体化(来源:Google)
那些对地球生态、城市未来、科技变革关注备至的建筑师,他们是变革的先锋,是迅速响应时代呼唤的英雄。他们以超前的设计作品勾勒出未来的蓝图,在这个飞速发展的时代,依托人工智能这一颠覆性技术,特别是像ChatGPT这样的前沿力量,他们能够深入融入行业潮流,引领未来的建筑革新。
尽管人工智能极大地提高了效率,我们永远不能忘记,它的初衷是服务人类。在设计与创意的领域,人类的独特创造力与灵感始终是无可替代的核心动力。因此,我们每个行业都需要审视如何提升自身独特价值,实现人机共融,而非被冷冰冰的机器取代。
· 规划交通与智慧零碳社区一体化(来源:Google)
在今天人工智能蓬勃发展的时刻,实现和谐共存的关键在于找到技术与人文的完美平衡,让技术成为人类进步的助推器,而非掌握人类未来的主宰者。这是我们走向智能未来的必由之路,是创造一个更加激动人心、创新无限、充满人性关怀的世界的关键所在。
只有与科技同行,我们才能引领未来的奇迹。观众提问环节问题一:
听了胡院士的讲座,我受益匪浅。我从未想过人工智能能够有如此广泛的应用,您今天的演讲让我眼前一亮。您的演讲也让我想到了有趣的问题。比如,您说当前弱人工智能可以创新,例如找到问题新颖的解决办法,但只有人可以创造,实现从0到1的突破。您是否又觉得将来的强人工智能、甚至超人工智能也不能创造呢?您是觉得人工智能这种存在本身就无法创造,还是说有创造的潜力,只是目前为止还没有被开发?
回答:
目前弱人工智能的开发很大程度上是算力增强的产物,其依赖于越来越大的训练集和计算。这种算力需求一定程度上甚至为Open Ai的发展都带来了相当大的负担。如果以现在的潮流为主,则需要更多的资源(包含财力、水资源、电力等等)来开发更加聪明的智能系统。最新在AI领域的论文表明,提出一个更加成熟的基于推理的认知模型框架,可能有助于开发出更丰富和智能的AI系统。因此未来不是不能创造,而可能是需要等待更大的技术升级来实现。
问题二:
您提到未来人工智能必须服务人类。那我想问:如果人工智能产生了自我意识,并且届时就不会甘愿服务于人类,您是否认为人类和人工智能之间会必然地出现矛盾甚至暴力冲突?又或者,您觉得双方是否可以作为平等的存在共存互助?换句话说,您是否认为强人工智能和人类是平等的?您认为平等关系的条件是什么,人类和强人工智能又是否符合条件?是否平等就可以共存互助?
回答:
诚然越厉害的人工智能,越会产生争议。关于人工智能服务人类的问题,我想和你交流一个著名的机器人三原则(Isaac Asimov):机器人不得伤害人类,或坐视人类受到伤害;机器人必须服从人类命令,除非命令与第一法则发生冲突;在不违背第一或第二法则之下,机器人可以保护自己。这是从工业应用出发的观点,我认为其能一定程度上解释你关于平等的疑惑。不过,关于人工智能的安全问题,将是今后长期性的重要议题,的确值得倍加关注。
问题三:
当前有一种流行观点:人工智能是碳基生命的下一个阶段,即硅基生命;物种进化的目的是为了产出更高级的生命,而我们碳基生命的目的就是为了产出硅基生命。我个人怀疑这个观点,但很好奇您的想法。您是否认为人工智能将来可以算一种生命,又或者已经成为了一种生命?人工智能生命是否比人类更高级?
回答:
我个人不认同碳基生命的目的就是为了产出硅基生命的观点,但是可能存在没有被我们所感知到的高维生命。就目前的人工智能发展来看,只要它没有真正创造出属于未知的产物,就无法被视为一种生命,也谈不上高级与否。在今天的演讲中,我仔细描述了人脑的奇妙,强调人类惊人的创造力。也许不久的将来大型人工神经网络真的可以做人脑类似的事情,到那时候确定AGI的方向就尤为重要。AI协作解决人类共同面对的重要问题,比研究如何用AI替代人类作家和艺术家的工作更为重要,为什么一定要摧毁人类信念与文明的灯塔呢?用AI去发展科技服务人类未来生活,我认为才是有价值的事情。
