日本华侨华人博士协会

春节特辑:胡昂院士讲座|AI汹涌而来--与人类共生的未来(上)

发布时间 2024-01-31

以下文章来源于胡藤井研究室 ,作者HUFUJII Lab.

引  言

2023年被誉为人工智能元年,AI汹涌而来引发全球风潮。AI已经对人类构成“威胁”,是否会进而取代人类?人类从事的哪些工作最有可能被淘汰?人类探索、尝试、感悟,创造;AI学习、训练、模仿、创新;那么人类创造与AI创新的区别是什么?人类与AI共生的机会在哪儿?新年伊始,胡昂院士走进成都大学,面向500余名学校师生与各界人士举行专场讲座,与大家共同展望未来。

2022年11月30日,ChatGPT横空出世,这款全新的语言模型标志着人工智能元年的到来。OpenAI打造了这个可进行自然交流、解答问题、提供信息的新型ChatGPT。它所涵盖的话题范围从科技到艺术,乃至日常生活琐事,广泛而丰富。在训练过程中,它吸纳了海量互联网语言、语法规则和词汇关联,使其在理解和生成文本,解答各种问题方面更为出色。”

· ChatGPT(来源:Valerie Ranum × DALL·E)

“ChatGPT的诞生宛若一次爆炸,在大量文本积累和支持下,形成了现今高准确性和适应性的人工智能模型。仅推出两个月,其月活用户已突破1亿,注册需求火爆,引发了人工智能风潮。百度推出了中国版人工智能聊天机器人程序“文心一言”,微软也推出了“Bing”机器人等,类似的人工智能应运而生。2023年毫无疑问是被誉为人工智能元年的一年。”

· OPEN AI(来源:Google)

2023年10月27日,全球顶级机器人开发商波士顿动力(Boston Dynamics)展示了一项新的研究,通过将ChatGPT、Spot以及其他AI模型相结合,开发了一种会说话的导游机器狗。该机器狗能够根据文字、语音提示与人类进行交谈,同时提供了视觉问答功能可以分析摄像头拍摄的画面自动生成图像说明。波士顿动力使用了自研的四足机器人Spot作为物理机器人框架,实现了行走、监控、导航、扫描等基础功能。

,时长01:12

· 给波士顿动力机械狗装上ChatGPT后(来源:Google)

ChatGPT的注入让Spot整体反应都变得更智能、更交互。Spot在说“Follow me(跟着我)”的时候,会自动做出转身引路的动作。能跟游客插科打诨:“希望你不会因为速度太慢而跟不上机器狗的脚步”这是人工智能和机器人技术的交叉点,是两种技术是绝妙的搭配。

2023年11月6日,OpenAI发布了ChatGPT的更新,其功能得到了明显的升级。这种惊叹和冲击使得在场的人们,即便是经历过诸多硅谷发布会的人士,也开始感到了一丝不安。

· ChatGPT再度升级(来源:Google)

2023年12 月 6 日,谷歌发布Gemini,Gemini 团队在发布会上正式推出原生多模态大模型Gemini,它拥有「视觉」和「听觉」,还有学习和推理能力。作为谷歌迄今为止最强大、最全面的模型,在大多数基准测试中, Gemini 性能都超越了 GPT-4。

· 最新发布谷歌Gemini(来源:Google)

谷歌已经在研究如何将 Gemini 与机器人技术结合,与世界进行物理交互。具备触摸和触觉反馈的真正的多模态大模型,呼之欲出。这条从未被前人踏过的路,未来可能带来重大新突破。

01.直面当下:AI汹涌而来,已经对人类构成“威胁”?“几十年间,人类便迈入了信息时代……在宇宙的时间长河中,这看似微不足道,却是一次爆炸式的进步!技术突破潜藏在每个文明之中,宛如内部或外部的火种点燃,顷刻间便引爆全局。”

最新技术发展

在2023年11月6日,Sam Altman带来的keynote speech仅有45分钟。介绍了ChatGPT更新的各个方面,其功能明显得到了升级:

· ChatGPT最新技术发展(来源:https://www.playpcesor.com/ )

●对话范围更广了:新的GPT-4 Turbo就像是一位超级速阅读者,以最快的速度,能在数分钟内吸收处理长达300页的文字,大概是一本3公分厚小说的量。而且它的阅读能力就像是得到了一次巨大的提升,准确性更是让人惊叹。

●知识库扩充:经过升级的GPT已经学习到了2023年4月的最新数据,成为多方面的超级大脑。

●新GPT支持图像、语音、代码解释器:DALLE-3拥有强大的视觉能力,而开源语音识别系统Whisper v3的价格比ElevenLabs便宜了近20倍。不仅能处理文字,还能处理图像、语音和代码。

巴别塔(圣经传说,无确切时间)

· 空中传说·巴别塔(来源:Google)

圣经《创世纪》里宣说:洪水之后,从方舟中出来的诺亚的子孙们看到了平地,想要建造城市,建造通往天空的塔,以此成名。在建造时,被他们的傲慢所触怒的神使他们之间语言不通而中途停工。这个城市就叫巴别,意味“变乱”之意。

在数字时代的巴别塔中,ChatGPT犹如一位现代化的沟通奇才。这个智能语言模型能够迅速穿越各种语言的障碍,为人们创造了一个通用的沟通平台。无论是中文、英文、法文,还是任何其他语言,ChatGPT可以轻松地理解和产生自然流畅的文本。如同一个语言翻译大师,帮助人们实现语言间的即时互通。

· 打破壁垒、消除障碍(来源:midjourney)

企业可以利用ChatGPT打破国际业务中的语言壁垒,消除翻译的障碍,促进全球合作。学生可以通过ChatGPT获得多语言学习的支持,将语言学科成为连接不同文化的纽带。社交互动也因ChatGPT而更加多元,让人们能够轻松地与世界各地的人交流,分享想法和文化。ChatGPT的作用不仅是简化语言,更是促成了全球社区的形成,让人们能够用无障碍的方式交流,共建一个更加紧密而和谐的全球化社会。

其余的更新还有:

●AI小工具和GPT助手:现在,任何人都能像搭积木一样轻松地打造自己的聊天机器人,就像是每个人都有了一个个性化的数字助手。打造一个属于自己的数字产品,甚至可以在GPT商店赚取回报。

●AI助手——Assistant API推出:只需用自然语言描述你的需求,它就会变身为一个智能助手,陪你无限畅聊,就像是一个永远不疲倦的谈话伙伴。在这个过程中,ChatGPT就像是变身为了一个全能的数字助手,为你的创意和需求提供了强大的支持。

· 危机浮现(来源:midjourney)

几乎可以说是一夜之间,有人形容,近一半的创业公司失去了存在的意义。这种危机感源自于OpenAI发展的速度,带来了对人类生存和发展的威胁。OpenAI不仅看到并改进了各个小创业公司所发现的商机,更是将这些商机迅速实现,且速度更快、效果更好、范围更广。02.理性分析:人类会被人工智能替代?哪些工作会淘汰?

有了感性的冲击,接下来让我们来理性地分析一下。回顾AI发展的历史,在20世纪40年代和50年代,来自数学、心理学、工程学、经济学和政治学等不同领域的科学家开始探讨制造人工智能的可能性。1956年,人工智能正式确立为一门学科。

· 1950图灵测试(来源:Google)

1950年,图灵发表了一篇开创性的论文,其中预测了创造具有真正智能的机器的可能性。由于“智能”这一概念难以明确定义,他提出了著名的图灵测试:如果一台机器能够通过电传设备与人类进行对话,且无法被辨别出其机器身份,那么这台机器就被称为具有智能。这一简化定义使得图灵能够令人信服地论证“思考的机器”是可能存在的。

· 1956达特茅斯会议(来源:Google)

1956年达特茅斯会议标志着人工智能的诞生。由马文·明斯基、约翰·麦卡锡和其他两位资深科学家克劳德·香农以及内森·罗彻斯特(Nathan Rochester)组织。会议提出的一项断言是:“学习或者智能的任何其他特性的每一个方面都应该被精确描述,以便机器可以模拟。”纽厄尔和西蒙在会上讨论了“逻辑理论家”,而麦卡锡则成功说服与会者接受“人工智能”一词作为该领域的名称。1956年达特茅斯会议确定了人工智能的名称和任务,并迎来了最初的成就和研究者群体,因此被广泛认为是AI诞生的标志性事件。

· 语义网的AI程序(来源:维基百科)

1956年至1974年,是人工智能的黄金时代。接下来的数年间被认为是巨大发现的时期。对许多人来说,那个时候所开发的程序几乎被视为神奇:计算机可以解决代数问题、证明几何定理,甚至学习和使用英语。当时大多数人几乎无法相信机器能够展现如此程度的“智能”。研究者们在私下和公开的论文中都表达出相当乐观的情绪,认为二十年内将出现具有完全智能的机器。

1993年至2011年,AI已经超过半个世纪,最初的目标逐渐实现。它已经成功地应用于技术产业,尽管有时是在幕后。这些成就部分归功于计算机性能的提升,部分是出于对特定课题的高尚科学责任感驱动。然而,至少在商业领域,AI的声誉已不如早期。在60年代,实现人类水平智能的最初梦想曾激发全球的想象力,至今其失败的原因仍然有诸多解释。各种因素导致AI分散为几个子领域,AI变得比以往任何时候都更加谨慎,但也更加成功。

· 2019年AlphaGo击败中国围棋冠军柯洁(来源:Google)

在这之后AI技术逐渐的取得进展:2019年AlphaGo击败中国围棋冠军柯洁“阿狗流”招式前所未见。

· AI机器人Ai-da(艾达)在牛津大学展览中展示她的原创作品(来源:Google)


2019年6月12日开展,AI机器人Ai-da在牛津大学展览中展示她的原创作品。画廊老板Aidan Meller说:“艾达是一场新人工智能艺术运动的先驱。这件由AI完成的艺术作品最终售出35万美元!加佣金43.25万美元(约300万元人民币)成交!这是第一次由拍卖行公开拍卖人工智能作品。

· 第一张由拍卖行公开拍卖人工智能作品,售出300万元(来源:Google)

音乐领域,艾瓦(Aiva)成为第一位将其作品注册到作者权利协会(SACEM)的虚拟艺术家。

· AIVA(艾瓦)作曲(来源:Google)


AIVA(Artificial Intelligence Virtual Artist)通过阅读历史上最优秀的三万份乐谱,她学会了作曲,将音符规则置换成矩阵图,利用深层神经网络AIVA开始从这些乐谱中寻找规律,它能根据一个音符推测接下来出现的音符,一旦预测变得越来越准确,AIVA就会为该曲风建立一套数学规则,从某种程度上,这非常接近我们人类的作曲方式,反复实验寻找最合适的音色,只是我们依据的是经验和耳朵自我修正,并且要经历几十年的学习,而这三万份的乐谱学习,AIVA只用了几个小时。并且制作者在数据库中为每份乐谱制作了三十余种的标签,它能够根据不同人的喜好,选择不同的音乐密度、曲风,作品年代等。

,时长00:44

· 由指挥家约翰·比尔领衔的好莱坞CMG管弦乐队演奏的AIVA的作品《众星之中》(来源:Google)

· 画家作画(来源:Google)

那么,人工智能是否会在未来替代画家、作曲家?

这是上述事件发生时,大众的思考和追问,这是个看似遥远但又切实逼近的问题。绘画和音乐作为人类历史上很古老的纯艺术形式,它的创作途径具有所有创作门类里最大的主观性和不确定特质,在这些方面的探索证明了人工智能已经具备了相当的创作能力。但却无法完全替代画家与作曲家。

那么,AI可以替代建筑师吗?

人工智能对建筑行业的波及,还没有正式来临,但这已经是未来必然的趋势。在未来,人工智能或许无法完全掌握绘画和音乐,但它必然能掌握建筑,现有的人工智能在建筑方面的应用,已经向我们展示,建筑行业里的很多工作将在不久之后被机器取代。

第一个人工智能建筑师——小库。创作方给小库的核心定位是“给建筑师减负,让他们腾出时间去做该做的事”,它从很多方面着手来改变建筑师的工作方式。小库科技联合创始人表示:“思考你来,行动小库来;决策你来,执行小库来;表演你来,表现小库来。”把不属于设计的工作交给机器来完成,使得设计师和小库能够真正在人机协作中,释放最多的设计能量。

· 小库单机版花了几秒钟做的强排方案(来源:知乎)

通常,设计师做拿地方案一般要1到2周,然而通过小库,可以在即时智能设计出多个方案,一天内就能完成拿地方案的比选,并一键生成ppt。包括区域介绍、项目信息、地理位置、周边分析、经济指标、方案对比、总平面图、日照分析图、成果展示等等,都按照模板一键生成,直接拿着PPT去做汇报就可以了。

事实上,担心人工智能会取代人类工作的声音一直存在。2023年11月《Financial Times》(金融时报)发布了一篇关于ChatGPT是否会影响就业的文章,研究表明,在ChatGPT发布之后的几个月内,在线自由职业平台上的文案撰稿人以及图形设计师们的工作数量大幅下降,收入下降幅度更大。这不仅表明了生成式AI在短时间内拥有正在夺走某些特定人群工作机会的能力,而且表明了在市场选择的推动下,很多工作的价值将会”贬值”,而在未来,可能会有更多的工作受到影响。这种影响并不是说处于该技能的顶端水平就能够得以幸免。人工智能的发展日新月异,或许就在不久的将来,人类就会被无所不能的AI所取代吗?

· 消失的人工智能(来源:世界银行)

那么,AI可能替代哪些职位?

· GPT问世后自由职业者收入的影响(来源:future of jobs report 2023)

图表中显示了接受调查的许多职位预计相对于他们目前在劳动力中的比例,增长和下降的速度。其中:

人工智能和机器学习专家在快速增长的职位列表中名列前茅,其次是可持续发展专家和商业智能分析师。

列表中增长最快的职位大多数是与科技相关的职位。下降最快的职位大多数是文员或秘书职位,其中银行出纳员和相关职员、邮政服务职员、收银员和票务职员预计下降最快。劳动力市场的结构性重组源于使用技术和自动化所造成的影响。

所有四份报告中都强调这些新兴角色:包括高级数据工程师/科学家、人工智能和机器学习专家和数字化转型专家岗位在增长;与之相反,数据录入文员,执行和行政秘书,以及会计、簿记和工资文员等包含重复性工作的职位在减少。

· GPT问世后自由职业者收入的影响(来源:Google)


令人意外的是一些基础的脑力工作也存在失业风险:比如基础的数据分析师,UI界面设计或是软件测试员等职位。对数据分析师来说,AI能够处理大量数据并生成洞察力,这可能在某些领域减少了人工分析的需求。某些常规的数据整理和分析任务可能会被自动化完成,这可能导致数据分析师工作范围的某些方面受到影响。AI驱动的设计系统可以自动生成某些设计元素,使得某些设计任务变得更加可自动化。UI设计师的挑战可能在于自动化工具的普及,使得某些基本设计任务变得更加可自动化。对软件测试员来说,AI能够处理大量数据并生成洞察力,自动化测试工具和AI算法可以帮助快速识别和测试代码中的缺陷这可能在某些领域减少了人工分析的需求。

如此多的行业终将被AI所替代,那么人类又该何去何从?是从地球上消失吗?人类还有存在的价值吗?接下来,让我们一起来回顾地球上的人类文明辉煌篇章,那些由人类创造的建筑经典,重拾信心与勇气。03.重现经典:人类创造的建筑经典,辉煌篇章!空中几何学·吉萨的金字塔(公元前2631~公元前2498)

· 吉萨金字塔群(来源:Google)

规模最大的胡夫金字塔底座边长230米,高146.6米(现在137.2米)。曾经在将近4000年的时间里是世界上最高的建筑,直到1311年被英国林肯大教堂所超越。不过16世纪时,林肯大教堂的座堂中心尖端崩坍,最高纪录重回到吉萨的胡夫大金字塔,直到埃菲尔铁塔出现。

空中纪念碑·卡纳克方尖碑(公元前1550~公元前1530)

· 卡纳克的方尖碑(来源:Google)


在尼罗河的下游祭祀太阳神主神阿蒙神的壮大建筑群。方尖碑作为太阳神的象徵。

空中圣地·佛陀伽耶大菩提寺(公元前3世纪)

· 佛陀伽耶大菩提寺(来源:Google)

位于印度东北部的佛教圣地,是释迦牟尼在菩提树下顿悟的场所。这座塔是光与影,生与死的表象。

空中之宴·圣吉米亚诺(公元前3世纪始建)

· 圣吉米亚诺(来源:Google)

意大利北部高塔林立的小镇。只剩15座,据推测繁盛期有72座塔。但丁也曾在此居住。塔是由于防御的功能而修建的,同时也作为繁荣的象徵。

空中之井·万神庙(公元前27年)

· 万神庙(来源:Google)

罗马时代的杰作,万神庙穹顶中央开了一个直径8.9米的圆洞,是最美的天窗“光之井”。

空中指南·嵩岳寺塔 (公元520年~公元525年)

· 嵩岳寺塔(来源:Google)

中国现存最古的砖塔,15层的宝刹受印度建筑的影响。多角形密檐式砖塔形象,多层构造出的宇宙的象徵。

空中祭坛·蒂卡尔神庙(公元7世纪~公元9世纪)

· 蒂卡尔神庙(来源:Google)

丛林中雅典神庙建筑。这个金字塔也被认为是“大美洲豹的神庙“,高约45米,站在顶部看丛林如同浮在空中的花园般。

空中之壁·布达拉宫(公元7世纪始建)

· 布达拉宫(来源:Google)

宫殿建在海拔超过3600米的高台上,高117米,长约360米。是石造和木造建筑的复合体,利用自然的地形,朝着天空耸立。

空中之塚·达玛亚齐卡(公元1075—公元1287)


· 达玛亚齐卡(来源:Google)



缅甸的蒲甘平原据推测曾有13000座佛塔,现存2217座佛塔林立的壮观景象。形态来自佛教教义的表象。

空中之杖·比萨斜塔(公元1173年~公元1372年)

· 比萨斜塔(来源:Google)

意大利比萨大教堂的附属钟塔,因倾斜世人熟知。原定建造100米,因不久后地盘不断开始下沉,以55.2米的高度完工。伽利略在这里做了自由落体实验,该塔成为了物理学的一个纪念碑。

空中之门·巴黎圣母院(公元1163~公元1250年)

· 巴黎圣母院(来源:Google)

塞纳河畔哥特式代表性建筑。正面的钟楼高达63米。此后哥特式的教堂不断将室内屋顶升高,与此相对朝向天空的塔也不断地升高。巴黎的象徵,它是众多故事的舞台,一个历史性的建筑。

空中之镇·圣托里尼(公元1207更名为圣托里尼)

· 圣托里尼(来源:Google)

爱琴海中央圣托里尼岛断崖上的聚落,保留了古代地中海周边人们的居住样式是横穴住宅。从海上看去,白色房屋就像是顶着白雪的山脉漂浮在空中一样。这座活用地形的空中城市,从港口到村落有800多段台阶。

空中瀑布·科隆大教堂(公元1248-公元1800)

· 科隆大教堂(来源:Google)

科隆大教堂,建造时间长达近600年,绘制它顶部的起重机的画成了这所教堂的象征。它正面的双尖塔高达157米,朝向天空,给人一种上升之感的哥特式建筑,再加上它绚烂的外表,是科隆建筑的顶点。

空中之家·迈泰奥拉修道院(公元1356年~公元1382年)

· 迈泰奥拉修道院(来源:Google)

希腊北部的山岳中的修道院。它的名字意为“悬在空中的“。巧用了岩山这个特殊的地形,建造出了我们今天也能看到的远离俗世、漂浮在空中的修道院。当时是利用绳索来吊运物资,完全是一个世外桃源。


空中斗笠·天坛(公元1420年始建)

· 天坛(来源:Google)

在中国冬至的时候,天子举行祭天仪式的地方。从15世纪开始被称作天坛。现在的天坛是1749年清朝时期建造的木造建筑。内部有一个房间,屋顶高达15米。在代表天空宇宙的圆形建筑中,天坛更具仪式感。

空中秘境·马丘比丘(公元1500年左右)

· 马丘比丘(来源:Google)

秘鲁境内安第斯山脉上遗存的印加文明遗址。周围险峻的山谷构成的神秘地形,几乎是垂直的山崖,高度达400多米。给人一种废墟浮在空中之感。这是一座由神殿、住所、广场、梯田等构成的复合型建筑群。这座废墟到底是什么现在仍然是个迷。在西班牙人到达的1572年这里已经是废墟了。

空中之池·泰姬陵(公元1631—公元1653)

· 泰姬陵(来源:Google)

融合伊斯兰和印度文化的壮丽陵墓建筑。沙·贾汗为悼念他死去的妃子泰姬·玛哈尔而建。圆穹高65米,它的样子能够以天空为背景倒影在前面的水池里。在随处可见有色石造建筑的印度,白色的建筑充满了透明感,它独特的几何学平衡也让人们惊叹。

空中之花·圣家族大教堂(公元1883~2021)

· 圣家族大教堂(来源:Google)

作为西班牙巴塞罗那象徵的建筑,由安东尼奥·高迪设计,近140年才完工。高达100—150米的四座塔只是规划的一部分,原计划架起12座塔和中心部高达160米的圆穹。这座高迪理想的建筑,充满了生命力,不愧是天空的颂赞之歌。

空中的音乐剧·帝国大厦(公元1930-公元1931)

· 帝国大厦(来源:Google)

帝国大厦由威廉·拉姆设计,1931年建成,是纽约曼哈顿区高层建筑林立中的佼佼者。建成之后的帝国大厦因它448.67的高度,保持着长达三十年的世界第一。

空中的结晶·纽约世贸中心(公元1969-公元1973)

· 纽约世贸中心(来源:Google)

纽约曼哈顿的双塔式高层建筑。60年代由山崎实设计。高411米,总共110层。均质的玻璃对称结构下的直方体形状,简练地表现了现代建筑的设计原理,使曼哈顿的景观焕然一新。毁损于911事件。

空中的钥匙·哈利法塔(公元2004~公元2010)

· 哈利法塔(来源:Google)哈利法塔始建于2004年,2010年揭幕,成为世界第一高楼与人工构造物。高828米,总共162层。哈利法塔上超透光玻璃的混凝土建筑,使中东重新成为世界最高建筑的所在地。未完待续

博 协 宗 旨
务实 架桥 创新 贡献
务实开展中日两国科技和学术交流,架起中日两国科技、文化及教育合作交流的桥梁,促进会员在中日两国创新发展,为增进中日两国人民相互了解和合作共赢贡献自己的智慧和力量。
博 协 理 念
博采众长   协调发展
通过中日两国在科学技术和文化教育等方面的交流,取长补短,互学互鉴,协调合作实现共同发展的目标。
申 请 加 入
点此填报《入会申请表
如有疑问,请联系 ribenboxie@gmail.com