“AI教母”李飞飞巴黎AI峰会演讲:现在是真实的“第一个AI时期”

发布日期:2025-02-13 13:43    点击次数:120

“东说念主工智能的将来应栽种在科学基础之上,而不是张大其辞的科幻情节。现时,无论是寻常巷陌如故华尔街,对于AI的话题中王人充斥着夸张炒作和骇东说念主闻听的形貌,通常导致对AI的解决议略被多样误导。”2月10日,在法国巴黎大皇宫举行的“东说念主工智能行径峰会上”, AI学者、斯坦福大学进修李飞飞发表开幕演讲。

怒放新闻客户端 进步3倍辅导度

李飞飞演讲视频(02:58)

在这次演讲中,李飞飞系统地梳理了东说念主工智能发展的历史线索。她合计,“毫无疑问,历史学家今后一定会把这段时刻称作‘真实的第一个AI时期'”。在她看来,从任何维度来看——无论是计较机专科中东说念主工智能主张的学生东说念主数、投资金额、新创企业数目,如故技艺冲破——AI王人正在掀翻一场深度和广度空前的鼎新。

以下是李飞飞演讲内容,略有删减:

AI三大要道因素:感知算法的冲破、领路科学的启发、计较智商的跃升

咱们咫尺所处的当代AI时期,正是三项极其要害又各自沉寂的技艺与科学跳动汇注而成的效果。

第一项是对感知算法的研究——即生物(包括动物乃至东说念主类)怎么辅导周围全国,并最终创造出让机器也能具备类似智商的数学模子。在达特茅斯AI夏日计议会上不时了图灵的斗胆假定之后,神经生理学家戴维·休伯尔(David Hubel)和托斯坦·维厄瑟尔(Torsten Wiesel)率先揭示了哺乳动物视觉皮层中神经处理的条理结构,这为他们赢得了诺贝尔奖,也透顶改变了咱们对视觉处理的领路。毛糙在团结时期,形貌学家弗兰克·罗森布拉特

(Frank Rosenblatt)搭建了最早的神经蚁集原型之一——感知器(Perceptron)。这项使命启发了数十年后无数计较机科学家,尤其是早期前驱者,如福岛邦彦(Kunihiko Fukushima)、杰弗里·辛顿(Jeff Hinton)、杨立昆(Yann LeCun)、约书亚·本吉奥(Yoshua Bengio)等,去想象愈发先进的模子,最终酿成了咱们今天所熟知的深度学习神经蚁集算法,让机器领有了自身近乎神奇的感知和分析智商。

与此同期,第二条研究线索也开动出现——领路科学家转而研究东说念主类自身的大脑,揭示咱们对周围环境进行感知时所领有的惊东说念主深度和复杂性。他们的研究明确指出,无法将咱们的脑与其所处的进化环境分割开来。大脑不外是一个被禁绝在颅骨阴沉之中的机器,却又从生命最先时刻开动,就紧急地向外部学习,通过每一次后光的照耀、每一次触觉刺激、每一声细语来获取信息。

对我个东说念主而言,算作在21世纪初成长起来的科学家,其时感知算法险些是我地点领域的惟一关注点,而领路科学带给我的启示在于“规模”。演化与发育能如斯有用地塑造东说念主类颖慧,是因为它们能愚弄多量数据来驱动咱们的学习。我和我的合营者、学生们推测,通常的规章也适用于机器,只不外这一次,数据来自当代数字开导和互联网,而不再是依靠生物感官。由此引发了我地点实验室发起的ImageNet格式——它是第一个针对东说念主工智能的大规模互联网磨真金不怕火与评测数据集。咱们提议了一个要道假定:数据是让神经蚁集等高容量算法真实“活起来”的要道。这个理念让神经蚁集振奋重生,开启了愚弄海量数据来鼓吹AI跳动的全球趋势,也成为如今所说的AI“规模定律”(scaling law)的一部分。

终末,若是莫得极其遒劲的运算智商来撑捏,以上总共树立王人不会发生,或者压根连起原王人无法跨越。最先的里程碑包括冯·诺依曼(von Neumann)在20世纪40年代提议的计较机体捆绑构表面,它一直沿用于今,并在70年代初催生了第一批微处理器。可趣味的是,真实让硅芯片原始运算速率得回飞跃的,竟是电子游戏。为追求更传神的游戏画面,上世纪90年代初出身了一个微型产业,但在短短二十年迅速延迟为全球巨头——以英伟达(NVIDIA)等公司为代表,开发出了越来越遒劲的图形处理器(GPU)。终局证明,这恰正是让神经蚁集算法得以愚弄互联网规模大数据进行学习的终末一块拼图。是以,若是现场有游戏玩家,那咱们要感谢你们。

大语言模子将三大因素推向更极致的规模

后头的故事不单是是“历史”,更是建构将来的“配方”。2012年,在ImageNet挑战赛上,我的实验室率先将算法、数据和计较这三大因素初次大规模息争在沿途,险些在整夜之间就改变了咱们总共这个词领域。那是机器初次大约辅导并准确地形貌海量图像——成百上千万张之多。如今咱们对此也曾习以为常,但在其时,这是一项前所未有的豪举,甚而有些像科幻演义里的场景。它就像推倒了第一块多米诺骨牌,随后的一系列冲破接连不停,而况来得越来越快。

如今,十多年往常了,咱们依然在探索这一切的意旨。当初只是学术界的一个好奇心驱动的研究,如今却无时无刻地眩惑着商界首长、创业者、行业分析师,甚而政事家们的要害关注。如今,十多年往常了,咱们依然看不到很是。毫无疑问,历史学家今后一定会把这段时刻称作“真实的第一个AI时期”。

高校、本钱对AI的保养 来源:李飞飞演讲截图

从任何一个你能料到的方针来看——无论是计较机专科中东说念主工智能主张的学生东说念主数、投资金额、新创企业数目,如故其他方面——AI王人是一场在深度和广度上不停扩大的鼎新。我想在座的诸君主人不需要我来类似,往常几年里,贵丰优配东说念主工智能又迎来了更惊东说念主的跃进——也就是大型语言模子的出现。

这些大型语言模子把当代AI所依赖的三大因素——算法、数据和计较力——王人推向了更极致的规模。它们继承了一种名为“Transformer”的新式模子架构,磨真金不怕火数据险些掩盖了总共这个词互联网,并在数目惊东说念主的最新、最遒劲芯片上运行。正如咱们所见,其终局是在机器智商上比往常十年来的任何一次冲破王人更为迅猛。现在咱们险些将“AI不错用天然语言辅导地跟咱们对话”视为理所天然,AI能复兴咱们提议的险些任何领域的问题,甚而大约生成多样复杂体式的内容——从图像、声息、音乐到视频,兼容并包。ChatGPT所取得的惊东说念主树立是这项创新怎么影响咱们正常糊口的最好例证,因其创造了用户继承速率的历史新记录。

而且,这些智商并不单是名义上看着“会言语”费事。

现在AI模子在多样基准测试(从手写识别到博士水平的科知识答)上的阐扬近几年王人在马上攀升;其中一些难度极高、对东说念主类来说具有挑战性的任务,AI的收获简直像坐火箭一样往上蹿,险些呈垂直飞腾的趋势。

大模子正朝着更具“主动性”主张发展

不仅如斯,从大约辅导使用语言开动,大型语言模子还执政更具“主动性”的主张发展——它们学会了将复杂任务阐明成些许设施,并慢慢筹算怎么完满主张。东说念主们咫尺将这种趋势称作“具备代明智商(agentic)的AI”。而在2025年,这似乎正成为这场真切技艺演进的新篇章。对许多用户和企业而言,这些智商也曾极端实用,而它们还远不啻于此,后续的发展后劲更是不能估量。

咱们咫尺所议论的还大多停留在“语言智能”层面,但东说念主类之是以为东说念主,是因为咱们领有更全面、更圆善的智能。从“被迫感知”到“主动行径”的新阶段正在到来。在我我方的研究领域——触及录像头和机器东说念主时,我看到AI正渐渐具备“创造、辅导、推理和交互”这些维度,进而在数字或物理的三维空间里与东说念主和环境互相作用。咱们称之为“空间智能(spatial intelligence)”和“具身智能(embodied intelligence)”。

举个例子:假定你看到这么一张图片,视觉智能很容易让咱们识别出内部的总共物品:那只猫、那盆植物、那张桌子,以及那杯牛奶。然则,这就代表咱们感知系统的全部功能了吗?我敢打赌,其中不少东说念主不单是“看懂了”那张图,还会产生“哎呀,快伸手把那杯牛奶收拢,别让它掉到地上打碎了!”的冲动。这只是个小例子,但它清澈展示了“从不雅察到行径”之间何等广泛的死别,也阐发了我合计咱们如今所处的拐点:AI正从不雅察者变成与咱们并肩行径的“实行者”。

推行上,就连我一直珍惜的图灵先生,他对于将来的意想在这少许上也可能有些“过于短促”或“向内看”了。因为进化自己也曾一再告诉咱们:智能的真实遒劲之处,不单是在于“想考”,而在于让想考能驱动行径。想想看,东说念主类的空间智能让咱们得以栽种灿烂的文静:从陈旧的金字塔到工业鼎新,从科学发现到艺术创作。如今,当AI渐渐拓展咱们的空间和具身智能,这将怎么进一步改变咱们与周遭全国的关系?它又能匡助咱们创造和发现些什么?不错意想,咱们也曾在打造某种面向将来的新形态了。

以东说念主为本的AI的中枢价值:庄严、能动性、社区

这个问题其实一直在指引我的研究使命。诚然我细目,想要找到淘气谜底险些不能能,但有一个干线在我多年的探索中永恒辅导,那就是我所说的“以东说念主为本的AI(Human-Centered AI)”,而况它包含三个中枢价值:庄严(dignity)、能动性(agency)和社区(community)。

最先是庄严。迎濒临越来越遒劲的技艺时,咱们东说念主类频频会反想:到底是什么在界说“咱们是谁”?若是把咱们能作念的总共事情王人逐个剥离,剩下的、那份大约自主决议并躬行行径的庄严感,依然是咱们算作东说念主的骨子之一。若是AI这项技艺能匡助咱们看守而况“找回”这份庄严,尤其是能匡助到最脆弱的东说念主群,那将是让我最粗野的事情。

在这少许上,我想给诸君看一个例子:怎么让机器东说念主和AI技艺匡助那些严重瘫痪患者再行得回自主行径的可能。在这项斯坦福大学的研究中,我的学生愚弄统统“非侵入式”脑电波(EEG)记录获取使用者的想维信号,通过AI算法对这些信号进行解码并发送指示给机械手臂。最终,机械手臂在患者“意念”的为止下作念出包括烹制日式寿喜烧在内的一整套烹改革作。这即是AI匡助东说念主们再行赢得自主与庄严的一个示例。

其次是能动性(agency)。我地点实验室多年来的核形貌念,就是探索怎么让AI“增强(augment)”东说念主类的智商,而不是取代东说念主类。毫无疑问,每一次要紧的技艺变革王人会对劳能源市集产生冲击,AI也不例外。筹画词,我敬佩AI不错匡助咱们从创造力到医疗保健、从科研到制造业,在方方面面得回新的智商。因为在许多方面,AI的技巧与东说念主类的技巧其实是互补关系。咱们统统不错愚弄这个“数字或物理上的合营者”来强化自身智商。

往常十年里,我的实验室一直在研究AI怎么修订医疗工作,这让我观念到许多能让AI匡助提高医疗质地、同期消弱医护东说念主员职守的契机。这里给环球展示三个例子:愚弄搭载AI的智能录像头来协助病院监督医护东说念主员的洗手规律,提拔记录病东说念主复健时的挪动磨真金不怕火情况,以及追踪手术器械的使用情景。

终末是社区(community)。往常十年里,科技也频频被诟病“把东说念主们越拉越远”,催生了多样“信息茧房”和“狂热话题钓饵”等。如今,AI又一次走到了十字街头:一条路是让AI主导好多应对体验,甚而为每个东说念主极端定制并强化他们蓝本的偏见;另一条路则可能匡助咱们构建更健康、更遒劲并具有包容性的社区,比如借助AI造就助手,让更多东说念主(包括孩子和成东说念主)得回学习的契机。