大家好!我是来自复旦大学计算机学院的张奇。
从事人工智能领域的研究20年。回想起2022年11月,Chatgpt犹如一颗璀璨的新星横空出世,瞬间让大模型和通用人工智能成为大众关注的焦点。大模型如今的发展势头可谓极其迅猛,这也使得不少人产生一种错觉,仿佛通用人工智能在短短几年内就能成为现实。然而,通用人工智能究竟距离人类还有多久呢?人类要怎样准备迎接?今天,我就围绕这个话题,从通用人工智能实际进化方向和程度,及其为人类在科技进步、学习就业、科学伦理方面产生的影响,这两方面分享我的见解与思考。
首先,明确一下通用人工智能,其英文是 artificial General Intelligence,简称 AGI。自 1956 年人工智能这个名词诞生起,它就成为了人工智能领域始终不懈追求的终极目标。
从名字看通用人工智能意味着拥有如同人类一样的认知能力,是可以处置多种类别任务的人工智能体系。这和以往那些专注于单一特定任务,像是语音识别、图像分类之类的狭义人工智能大不一样。AGI 能够去理解、去学习,并且能在形形色色的领域以及任务情境当中展开推理,进而解决问题。
通用人工智能所设定的目标极为宏大,其愿景是能够完全取代人类所从事的所有脑力劳动。然而,如此宏伟的目标并非一蹴而就,必然要经历一个漫长且复杂的发展过程。虽然人工智能的发展进程并不完全与人类的认知能力发展轨迹相契合。但当下,已经有大量的相关工作逐步开展起来了。
比如 2024 年众多手机厂商纷纷推出了具备一定程度自主决策能力的手机。这些手机能够依据用户所下达的指令,在多个APP之间自如切换,并且可以根据用户的具体要求,自主地对界面内容进行分析,进而完成诸如搜索、点选等操作,甚至在某些情况下还能够直接替用户下单。可以想象,不久之后我们或许就能够直接通过语音控制手机,轻松地让它帮我们完成订外卖、修改各种APP中的设置等一系列操作,这无疑将为用户带来极大的便利。
有了上述简单的基础分析之后,接下来我们回到这次的核心问题,通用人工智能距离我们还有多远?当前,大模型普遍被认为是实现AGI最有可能的道路,也是目前绝大部分公司和研究人员所走的道路。那么大模型真的是实现 AGI 的必由之路吗?
当下大模型的推理能力究竟处于怎样的一个水平呢?我们注意到了几个具有代表性的实验以及相关现象。
苹果AI研究院,近期采用了和我们类似的思路,针对小学应用题开展了相关测试。比如,原题是 “小明在星期五摘了44个猕猴桃,然后在星期六摘了58个猕猴桃,星期天,他摘的猕猴桃数量是星期五的两倍。小明一共摘了多少个猕猴桃?” 而苹果AI研究院的研究人员在这道题目的最后增加了一个与题目原本计算并无直接关联,但是又包含数字的问题,比如 “但其中 5 个比平均大小要小”。在面对这样经过修改的题目时,GPT O1 模型的分数下降了18分,其他模型在这种情况下分数下降得更为严重,有的模型甚至下降了 60 分。
不难发现就目前的情况来看,大模型似乎尚未真正地理解各个知识点,或者说至少还没有能够做到对知识点进行灵活自如地运用。
现阶段,大模型所采用的是纯数据驱动的学习方式。这种学习方式倘若不加以改变,那么它将很难真正学习到因果逻辑。要知道,构建不了因果逻辑,也就很难完成真正意义上的推理。就拿在大数据分析领域经常被提及的一个经典问题来说吧,在网上小超市商品购买的情境下,从销售数据上我们会发现一个有趣的现象,那就是小孩子尿布和啤酒这两种商品经常会一起出现在顾客的购物清单当中。并且,如果我们将尿布的陈列位置和啤酒的陈列位置摆放得较为靠近,啤酒的销量还会进一步增加。实际上,这是因为在小超市购买尿布的情况大多是应急性使用,而前来购买尿布的更多的是男人,所以他们在购买尿布的同时,顺道购买一瓶啤酒的概率就会很高。然而,像这样的因果逻辑关系,仅仅通过数据是很难被学习到的。
尽管如此,现阶段的大模型也已经展现出了很多此前小模型所没有的能力,包括长上下文建模、多任务学习、跨语言迁移以及文本生成等能力。 这些能力都是之前小模型所不具备的,倘若能够充分利用好这些能力,同样可以发挥出非常不错的作用。例如,现在的AI搜索就完整地利用了上述大模型所具备的这些能力,它能够高效地帮助我们解决以往在搜索结果中需要我们自己仔细阅读大量内容才能解决的问题。所以说,根据大模型所已经验证过的能力,去积极探寻与之匹配的应用场景,也是当下一个极为重要的发展方向。
公司简介:招金矿业股份有限公司从事金银产品的开采、加工、冶炼和销售,以及黄金等金属产品的勘探、开采、选矿、冶炼、销售,是专业从事黄金生产的大型综合性矿山企业。 生产两种招金牌Au9999和Au9995金条。 其拥有三个可报告的经营分部,黄金经营分部包括黄金开采和冶炼业务; 铜业务部门包括铜开采和冶炼业务; 其他部门包括其他投资活动、金融公司的运营、酒店的运营和餐饮服务、勘探服务以及工程设计和咨询服务。
但是我自己觉得仅靠加大模型参数量,使用更多的数据,很难达到解决人类水平问题的AGI系统。需要进一步考虑如何使得AI系统具备真正的推理能力,这不仅仅是参数量和数据量的问题,更多的是如何设计模型架构,训练方法以及人工智能理论上的突破,而这个时间很难预估。可能明天出现了新的人工智能理论,1个月就可以实现 Level5能力的AGI系统,也可能我们沿着大模型的道路走了10年也无法真正达到 Level2 水平的AGI系统。 这需要更多更基础性的研究。
接下来我想通过梳理AGI或者AI给人类社会带来哪些影响,聊聊人类又该如何接招呢?
第一个思考:无法分割。
无法否认 AI 已然悄无声息地融入了我们的日常生活,成为其中不可或缺的一部分。就拿日常使用的输入法来说吧。早期的拼音输入法十分机械、 刻板,每次输入拼音,呈现字词的顺序固定不变,全然不顾此前输入的内容,这极大限制了输入效率,打字速度慢得让人着急。随着计算机运算速度的不断提升,研究人员开始将语言模型开始引入输入法。它能依据用户此前输入的文字,精准预测当下要打出字的概率,把最复合的词语优先推送出来,极大地提高了输入速度,现在的拼音输入法使得我们几乎不需要对文字进行选择,仅输入拼音串就可以完成文字输入。再比如我们使用的搜索引擎,我说的不是现在的AI搜索,而是传统搜索,我们每次输入关键词,背后有超过 200 个模型从各个层面协同工作,为我们找到最相关的文档。再比如我们日常浏览的短视频、新闻、外卖等 APP,也都使用了大量AI技术,支撑产品服务。但是,这些 AI 技术都隐藏在产品的背后,大众并不容易直接感知到。
第二个思考:事实偏差。
AI 技术也宛如一把双刃剑,在为我们带来巨大效率提升与优质服务时,也裹挟着一系列潜在问题。AI 能够依据所学到的大量知识和模式快速生成文本、图像等各类内容,其表述往往看似合理且颇具逻辑性。比如生成一篇新闻报道或学术论文片段,初看可能很难发现其中的不实之处。但AI可能存在对知识理解不够深入准确的情况,或者因数据偏差等原因编造出不符合事实的内容。而且,由于其生成速度快、产量大,在缺乏严格审核机 制的情况下,就很容易让大量真假混杂的内容流入网络等传播渠道,进而误导读者、干扰正常的信息获取与判断,给人们在辨别信息真实性上增加了不小的难度。
思考三:兴趣茧房。
AI 驱动的个性化推荐系统无处不在,社交APP们依据用户过往浏览偏好、点赞评论行为,精准推送契合个人喜好的内容。长此以往,用户仿若置身于一间无形的“茧房”之中,目光所及皆是熟悉、认同的信息,难以接触多元观点与异质思维。人们不自觉地被困在思维定势里,对复杂现实的认知越发片面,偏见越发根深蒂固,进而在重大议题上判断失误,加剧社会群体间的认知隔阂与分歧。比如,关注娱乐八卦的用户,页面会被海量明星资讯填满,无暇顾及科技前沿、民生百态;热衷某类偏激观点的受众,持续接收同类信息,越发笃定自身立场,不愿换位思考、理性探讨,致使社会舆论环境越发浮躁、极端,给公共理性讨论空间带来挤压。“新型信息茧房”正悄然筑起。
当然解决这些问题,绝非单一主体能够解决,而是迫切需要法律层面筑牢根基、企业主动担当、政府有力引导、个人积极适应,凝聚全社会之力,协同寻求破局之策。
最后说说人类要如何应对呢?
大模型的发展速度着实惊人,其迅猛程度甚至让我这个在人工智能领域工作了20年的从业者都深感焦虑与巨大压力。回顾往昔,人工智能的发展原本就在逐年加速,然而之前的模型往往只能解决单一的特定问题,所以每当一种新算法问世,便能够开拓出众多崭新的研究方向。但如今的大模型却截然不同,其具备多任务处理和多语言交互的特性,这使得原本需要几十个不同任务模型和研究方向的工作,如今都能够整合到一个大模型的研究框架之中。不仅如此,大模型的研究对资金的需求极为庞大,相较于以往,其所需资金常常是过去的数百倍之多。一个千亿模型完成一次训练需要花费近千万的费用。在这样激烈的竞争环境下,如果研发速度稍有迟缓,就极有可能陷入落后的困境,进而陷入恶性循环难以自拔。
就拿2022年11月 ChatGPT 的横空出世来说,在其后的半年时间里,我们整个实验室几乎全员处于每周7天、每天14个小时连轴转的高强度工作状态。不过,辛勤的付出也换来了相应的回报,复旦自然语言处理实验室相继成功发布了 MOSS 以及多模态模式模型等成果,同时还推出了许多关键技术。但是回顾整个过程,其实大模型的发展也对人工智能研究界产生了巨大的影响,很多原来的研究方向已经消失或者不再重要,大量的低能力水平人工智能研究员面临淘汰,大模型最直接最快速影响到的岗位其实是我们人工智能的研究员。
所以即便是我们这样的行业从业者,也必须以积极的心态面对,拥抱它,接受它,使用它。
大模型在很多领域也彰显出其强大的影响力与巨大潜力。在客服领域,其替代率从过去的60%大幅跃升至80%。在编程领域,工作效率普遍提升了 20%左右,对于一些简单常见的编程任务,效率提升幅度甚至能够达到 40%。而这些显著的变化仅仅发生在短短一年内。我今天的分享也是在书写完初稿之后,使用大模型进行了润色和修改,我觉得整体上节省了我超过 2 天的时间。再以图像生成领域为例,如果我们将现在的模型与2023年底的模型进行对比,就会由衷地惊叹于图像质量提升的速度之快。然而,这些技术的飞速进步也不可避免地导致了许多岗位数量的减少。例如,随着大模型强大的多语言回答能力的出现,小语种岗位的人力需求在短时间内迅速萎缩。从短期来看,美工、客服、程序员等,以及算法研究员岗位都存在大幅度减少的可能性;从长远视角出发,当前人们从事的工作中可以被自动化技术所涵盖的部分,都极有可能被AI逐步替代。
这一严峻的形势无疑对我们提出了更高的要求,促使我们必须努力提升自身的能力,以便能够胜任那些需要更高技能水平与深度思考的工作,而不是仅仅局限于简单的文字整理、数据收集等基础工作。
其实我想要着重倡导的是,我们务必积极主动地拥抱 AI。无论 AGI 是否会在短期内得以实现,AI 早已悄无声息地渗透进我们生活的方方面面。唯有不断提升自我能力,更加积极地将自身工作与新技术深度融合,通过提升工作效率、持续不断学习新知识,才能够在工作中不断取得进步,从而在 AI 浪潮汹涌澎湃的时代中站稳脚跟,实现个人与社会的协同发展。
谢谢大家,我在第一财经一财号等你。
此为第一财经一财号2024“年度财经思想者”盛典上年度行业新锐演说原稿。
(本文内容仅代表作者本人观点)
文章作者张奇
相关视频 00'48'' 张奇:AI大模型让人难“躺平” 低水平脑力劳动将被淘汰 0 4小时前 00'49'' 张奇:大模型最先淘汰的可能是人工智能研究员 17 昨天 15:20 00'14'' 周鸿祎:大模型面临知识深度挑战 关键行业技术仍掌握在企业手中丨一手 30 2024-12-14 12:46 00'31'' 合力投资张敏:人工智能一定会出现万亿甚至10万亿级的公司|一手合力投资张敏:人工智能一定会出现万亿甚至10万亿级的公司
48 2024-12-11 17:26 00'50'' 省了2秒,竟提升1%的生产效率! 5G及大模型加速工业智效升级|一探在 2024 中国 5G + 工业互联网大会上,中国移动带来的 5G 确定性技术在汽车焊装产线大显身手,为汽车制造产业加速赋能。中国铁塔通过5G安庆股票配资,能远程监控重要点位,保障安全无死角。同时,大模型技术正成为工业转型升级的重要引擎,以科技之力驱动工业转型升级,开启智能制造新时代。
105 2024-11-20 20:43 一财最热 点击关闭