当前所在位置:首页 > 正规炒股配资申请

大模型突飞猛进,但我们离真正的AGI还有距离

742

2024-06-17 【 字体:

一次可读30万汉字,大模型又“上新”了。

1月17日,上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式发布新一代大语言模型书⽣·浦语2.0(InternLM2),相比此前的版本,书⽣·浦语2.0在长语境输入及理解能力、基础语言能力上都有大幅提升,拓宽了大模型向行业落地的可能性。实验室表示将继续提供InternLM2免费商用授权。

在过去的一年,大模型接连发布、不断迭代,来到2024年这种势头还未停止。上海人工智能实验室领军科学家林达华对第一财经表示,大模型会比去年发展更快,“如果说2023年大家可能都是朝着一个目标,就是去追赶GPT-3.5或者GPT-4的性能目标去走的话,未来不同的机构、企业和团队会朝着不同的方向去发展,会更加多样化。”寻求基础技术提升和向行业去落地是未来两大主题。

对于此次书⽣·浦语2.0的更新,一次可读30万汉字(约五六百页的文档)、200k的长语境输入及理解能力是亮点,除了支持超长上下文外,其能够准确提取关键信息,这意味着模型可以显著拓展应用场景,比如支持大型文档的处理、复杂的推理演算和实际场景的工具调用等。

在具体应用方面,上海人工智能实验室领军科学家林达华对第一财经介绍,可用书⽣·浦语2.0模型尝试去读几百页的财报,它能够将财报里面一些非常细致的信息精准提取出来,形成摘要,或者能听一场几个小时的会议,虽然语音识别文档会有错误,但这并不影响理解,模型依然能很好地将会议的关键信息摘取出来。

InternLM2总结“联合国2023年10月2日召开的联合国贸易和发展会议记录”

除此外,此次更新后更强大的数理能力、工具调用的能力,以及明显改善的对话创作等方面的能力,都能够为大模型的应用带来很大的帮助。

“能力的持续提升,能够拓宽大模型向行业落地的可能性,它不仅仅是做对话,在行业里,它还能自由调用工具给很多垂直场景提供助手的能力,将一个大模型从闲聊的工具,逐渐变成能够和场景需要相结合、深入落地提供价值的利器。”林达华表示,媒体、教育、金融、传统制造业这些场景,都可以受益于大模型技术的进展。

回顾2023年,林达华认为有非常多惊喜,大模型有几个非常关键的进展。一是GPT-4的出现,让大家看到了大模型不仅仅是一个一本正经胡说八道的聊天工具,意味着它真正有用,其次,函数工具调用的能力、代码解释能力,让大家看到了大模型向现实场景衔接的可能性和技术途径,对于落地很有帮助。另外很重要的是模型推理能力、推理速度、推理性能的急剧提升,对于降低落地成本、门槛也非常重要。

对于未来大模型发展的趋势,林达华认为,一方面是基础能力的提升,“我们现在离真正的通用人工智能有较大的距离,无论是国内的模型还是GPT-4。”因此,未来会有顶尖的研究机构沿着更强的技术手段,如扩大规模、用更好的数据,或改进训练的方法,模型架构,逐渐向通用人工智能靠近,这是一个核心技术层面的突破,也是顶尖研究机构的使命。

上海人工智能实验室主任助理、领军科学家乔宇同样表示,我们做大模型能力越来越强,但离真正比肩人类的、可信的AGI还有距离。他认为,过去人工智能兴起核心的一点是大力出奇迹,堆更多的数据、用更多的算力,但只靠规模、只靠数据解决不了幻觉、可信和可控的问题。未来大模型的发展应该是以规模增长为主线、但又要充分吸纳其他技术路线的方向。

林达华对第一财经补充表示,规模(scale)路线确实是在过去这两年验证了的非常有效的手段,无论是数据规模和算力规模,但很多学者认为单纯依靠这个路径,不一定能够真正到达AGI的彼岸,有些核心的问题如幻觉、可信,需要规模路线与其他手段结合才能到达,这个是未来需要去探索的。

另一方面,大模型的能力已经到了一定的高度,具备了逐渐向某些行业去渗透的条件,很多机构也会逐渐将模型结合工具调用能力、交互能力、计划决策的能力,逐渐探索向各个行业去落地的可能性。

“我相信这些探索能够将大模型真正从去年能力的展现,变成真正能变革生产力的一个工具,我觉得这两方面今年都会有巨大的竞争。”林达华说。

在发布会现场,徐汇区委常委、副区长俞林伟表示,对于2024年,他较为关注的方面是,美国能不能够逼近真正的通用人工智能、大模型的“iPhone时刻”什么时候能够到位,以及,中国的大模型谁先能够逼近OpenAI的GPT-4。

俞林伟谈到,在和行业交流时他发现,大家普遍认为GPT-4是主力应用的起点,要做真正的垂类市场闭环应用,必须以GPT-4作为能力的起点,“所以对我们来说,能不能在2024年实现突破,谁能率先跑过这根线我觉得很重要。”

举报 第一财经广告合作,请点击这里此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。 文章作者

刘晓洁

关键字

大模型AGI落地OpenAIGPT-4人工智能

相关阅读 行业大模型如何拥抱应用场景?︱AI大模型十问(四)

编者按:ChatGPT爆火后,AI大模型层出不穷,面向行业的垂直大模型也陆续发布。那么,怎么才算一个合格的行业大模型?行业数据哪里来?如何将行业know how更好地融入大模型?第一财经推出“十问AI大模型”专题,进一步追问与解密。

01-23 11:15 书生·浦语2.0正式开源,回归语言建模本质,综合性能领先开源社区

1月17日,书生·浦语2.0(InternLM2)发布会暨书生·浦源大模型挑战赛启动仪式在上海举行。

01-18 14:15 “保姆级”人形机器人来了?千亿美元市场下,中国赛道已火热

不管是最近在港交所上市的“人形机器人第一股”优必选,还是由“90后”科技博主、前华为“天才少年”彭志辉创办的智元机器人,近年来,中国人形机器人赛道火热。

01-09 22:24 国内大模型创新发展与软硬件协同生态论坛在上海徐汇成功举办

2023年12月28日下午,国内大模型创新发展与软硬件协同生态论坛在上海徐汇成功举办。

01-02 14:07 OpenAI风波后,人工智能安全发展与监管将何去何从?

人工智能的风险和对人类可能产生的根本性的影响,其重要性和后果一点都不逊于碳排放等问题,可以说有过之而无不及。正如代表中国参会的科技部副部长吴朝晖所指出的,人工智能的治理攸关全人类的命运,是世界各国面临的共同课题。

2023-12-29 15:38 一财最热 点击关闭

阅读全文
相关推荐

康宁医院(02120)7月25日斥资47926万港元回购3427万股

康宁医院(02120)7月25日斥资47926万港元回购3427万股
智通财经APP讯,康宁医院(02120)发布公告,该公司于2024年7月25日斥...

1964年,毛主席向周总理问出多年的疑惑:55年了,你怎么不回家乡

1964年,毛主席向周总理问出多年的疑惑:55年了,你怎么不回家乡
1964年,新中国大力推动移风易俗运动。周总理向毛主席提出,他的老家淮安,过去一...

“中国达沃斯”,在黄埔举行!

“中国达沃斯”,在黄埔举行!
素有“中国达沃斯”之称的 亚布力论坛 首次来到广州 在黄埔举行! 8月3...

钱不到账,文章不撤?利用自媒体有偿删帖敲诈企业,判刑

钱不到账,文章不撤?利用自媒体有偿删帖敲诈企业,判刑
“以前遇到这种事情总是忍气吞声,经过这个案子,我们感受到法律才能真正保护企业的合...

淘宝将支持微信支付 微信支付回应:目前与淘宝平台商户的功能适配正在开通中

淘宝将支持微信支付 微信支付回应:目前与淘宝平台商户的功能适配正在开通中
智通财经APP获悉,9月4日下午,淘宝发布《关于淘宝网新增微信支付能力的意见征集...

刺入面部10厘米!电动车上千万别装这个!

刺入面部10厘米!电动车上千万别装这个!
近日在广东东莞 发生惊魂一幕 一女子在骑电动自行车外出时 与其他车辆不慎发...

大湾区特殊资产常态化路演中心在广州启动

大湾区特殊资产常态化路演中心在广州启动
8月8日,大湾区特殊资产赋能服务平台(下称“大湾区特资平台”)成功举办大湾区特殊...

万里股份最新公告:至创天地拟要约收购公司20%股份

万里股份最新公告:至创天地拟要约收购公司20%股份
万里股份公告,近日收到北京至创天地科技发展有限公司发来的《重庆万里新能源股份有限...

港股异动 速腾聚创(02498)高开逾7% 公司拟斥不超2亿港元回购

港股异动  速腾聚创(02498)高开逾7% 公司拟斥不超2亿港元回购
速腾聚创(02498)高开逾7%,截至发稿,涨7.49%,报17.22港元,成交...

蒸米饭用凉水还是热水?很多人都做错了,难怪不好吃

蒸米饭用凉水还是热水?很多人都做错了,难怪不好吃
我们中国的传统美食博大精深,我们的主食大多以大米和小麦为主。在我们北方,主要以小...