我们对AI大模型的误解有多深?_新浪财经_新浪网 和另外 2 个页面 - 个人
意见领袖 | 新金融联盟NFA
大模型可以无所不能吗?怎样让模型少犯错?企业应该部署多大的模型,一个超级大模型还是一堆专业模型? 对于这些问题,第四范式联合创始人、首席架构师胡时伟认为:类GPT模型是高级复读机,有多少“人工”就有多少“智能”,绝非无所不能。模型100%会犯错,一味地追求算力和数据并不能解决这个问题,因此模型之上必须要有运营兜底机制,知错就改。算力决定参数规模,一堆专业模型比一个超级大模型更有落地可行性。 上述观点源于6月10日新金融联盟举办的“金融机构数智化转型与大模型技术应用”内部研讨会。大模型并非“无所不能”
现在各行各业都十分关注大模型这一话题。第四范式在自己的大模型产品“式说”2月份发布以来,与17个行业的114家企业进行了密集与深入的沟通,发现业界普遍对大模型存在一些误解,需要纠偏。
(资料图)
第一,要相信科学。大家普遍认为大模型已经具备“涌现”能力,可以无师自通。但大模型的能力主要还是源于给它提供了什么样的数据,并不是直接“涌现”出来的。本质上讲,类GPT模型的背后还是机器学习,需要高质量的数据训练而来,并通过Fine-tuning(微调)进行调优才能实现一些特定的能力。
第二,有多少人工,就有多少智能。生成式AI到底能解决什么问题?通俗地讲,从基础大模型到行业大模型甚至到场景定制,我们目前认为它可以用以完成一份文档。在一个特定场景下正确地完成一个文档,一定来自于人反馈的数据。就像GPT要用到非常多维基百科的数据,是因为该数据质量更高。我们行业要做的是,一定要对大模型形成反馈闭环和迭代,即告诉大模型什么是好的,训练它达到更好的效果。这件事情本质还是依赖人工。
第三,大模型生成一定会出错。哪怕是GPT-4,在行业专业、严肃场景的应用也远未达到工业可用的效果。这是技术本身的缺陷所致,靠算力和数据也无法从根本上解决这个问题。目前大部分企业的共识是模型之上必须加一层运营机制来兜底。
企业应该部署多大的模型?
企业在大模型落地过程中会面临一个现实问题——预算有限,预算决定了算力,算力决定了参数规模。
因此,我们需要抉择:应该部署一个超级大模型,期待它能够把能力上升到一定程度,还是应该从解决问题出发,部署一堆专业模型,让它们各司其职。这里面涉及两个不同的思路。
第一个思路是通过增加参数和堆砌算力,把所有参数都给NLP模型。但从实际落地的角度来看,根据No Free Lunch(没有免费的午餐)定理,没有哪一个模型能以最优的方式解决所有问题。如果我们把所有的东西都放在一个模型里,最后会花出极大的代价,超级英雄成本很高,也很难管理。
因此,我个人认为会走向另外一个方向,即Learnware(学件)的思路,我们要做一堆参数过亿的专业模型,来组成整体企业系统,这种方式更利于模型迭代、维护,同时更利于控制成本。就如同一家公司里不能都是董秘,还得有销售、产研、市场等各个专业线。
大模型可实现传统软件两大升级
“介质”同样是企业落地大模型的关键要素。
想象一下,如果没有APP,推荐算法能用吗?没有搜索,广告算法能用吗?APP和搜索就是推荐算法和广告算法的介质。同样,大模型在企业落地时,企业软件就是大模型的介质。如果介质没有革新,只有算法革新,就像是一个人只有脑没有手。
因此,我们非常需要关注介质层面的革新。企业中大部分工作的完成都需要使用软件,但是大量软件交互的方式都非常低效、复杂,现在我们可基于大模型解决两个升级:
第一,由生成式大模型负责软件界面的升级。人机交互要变成多模态,通过大模型更强的语义理解能力,可以更直接调用企业内部各种形式的信息、数据和模型。
第二,由判别式大模型负责软件内核的升级。以前的软件主要围绕数据库做增删改查,现在可由判别式大模型对软件进行智能化升级。
让大模型成为知错就改的小助手
由于GPT在技术上存在局限性,因而无法做到百分之百准确,尤其在应用于严肃的金融场景时,大模型之上必须要加一层运营体系兜底,让模型的输出和操作从不可用变成可用,并且能做到知错就改。
知错就改有三个机制叠加保障:一是专家给答案。虽然听起来不是那么智能,但在专家能给答案的地方一定要给答案,因为这个是最准确的。二是专家给示例,模型进行一定的上下文学习也可以表现更好。三是模型自主学习,基于专家生成的知识反馈给模型,让模型少犯错。
生成式大模型加上“执行可控、知错能改”的运营体系,我们可以期待有一位善于理解、准确执行的工作助手。这位助手需要让用户可以清晰了解哪些内容是“100%准确”,哪些是“不确定的”,并且知错能改。
总体来说,底层大模型不能解决所有问题,介质层及运营机制的革新对于数字化推动作用同样重要。企业需重新打造决策类AI、生成式AI、应用层、介质层。我们目前探索落地的重点是让生成式大模型结合介质,围绕企业数字化转型的目标,在企业里生成一堆Agent,分别用以查资料、查数据、准确操作软件等,这可能是当下一个更加贴合实际、可落地的方向。
(本文作者介绍:一个高质量的新金融政策研讨和行业交流平台。)
责任编辑:张文
新浪财经意见领袖专栏文章均为作者个人观点,不代表新浪财经的立场和观点。
关键词:
下一篇:最后一页
- 我们对AI大模型的误解有多深?_新浪财经_新浪网 和另外 2 个页面 - 个人
- 全球热讯:求人办事客气话怎么说_求人办事怎么送礼
- 小逄观星丨我能为老师们做些什么
- 全球动态:小伟窗口放大器如何使用视频_小伟窗口放大器
- 全国二本大学2023年最新排名 全国各地区最好的二本大学
- 世界观速讯丨英雄联盟狗头天赋符文_狗头天赋符文
- 全国最长过海管廊向海底掘进 计划4年内竣工验收
- 最新资讯:增加“熊猫元素”助力经济发展 房山水峪筹建“北京熊猫文化村”
- 优秀作品丨李和卿:《载歌载舞庆舍巴》
- 【全球报资讯】职业经理人生存秘籍
-
重庆警方去年破获毒品案件3800余起 天天报资讯
▲新闻发布会现场第36个国际禁毒日即将到来之际,6月20日,重庆市公安
-
商汤再遭阿里减持5000万股股票!一年内两大股东接连抛售
今年以来,随着AI市场持续火爆,科技企业走出了一波行情。但正是在这喧
-
神兵小将第二季(关于神兵小将第二季介绍)
1、《神兵小将第二季》是2018年播出的教育类动画作品。2、共52集。
-
世界观热点:武汉江夏城投集团挂牌勤缘房地产100%股权
观点网讯:6月20日,北京产权交易所显示,武汉市勤缘房地产综合开发有
-
shutdown.exe文件在哪(shutdown.exe)_环球速讯
来为大家解答以上问题,shutdown exe文件在哪,shutdown exe很多人还不
-
实时焦点:m是什么意思单位名称(m是什么意思)
来为大家解答以上的问题。m是什么意思单位名称,m是什么意思这个很多人
-
天天快看点丨实名曝光33人!安徽一地公布醉驾名单!
大多数人都明白喝酒不开车即便如此还有人心存侥幸顶风作案无视法律和生
-
环球关注:丰立智能6月20日快速反弹
以下是丰立智能在北京时间6月20日10:07分盘口异动快照:6月20日,丰立
-
天天观天下!高新土地推介会后,二批次土拍地块提前曝光!
自今年5月12日航天基地推出一宗商住用地之后,截止到今天,西安土拍市
-
生意社:6月19日中石油华东乳聚丁苯价格暂稳
6月19日,中石油华东销售公司乳聚丁苯橡胶价格暂稳:抚顺1502库提价格
X 关闭
战时防疫用!宝安首批667间集中居住板房移交管理
西安新增本土确诊病例150例 详情发布
广东最低气温跌至-6℃现冰挂 部分道路及海上交通受影响
“2022科学跨年系列活动”启动 提高公众对科学类流言“免疫力”
珠科院多举措助力大湾区抗旱防咸保供水
X 关闭
得知西安疫情防控“升级” 男子夜骑共享单车回咸阳淳化
中国医生将任SIU主席背后:从追随者同行者到引领者
海南省通报政法队伍教育整顿成果
云南两地发现核酸阳性人员 西安实行最严格的社会面管控
广东梅州大埔中央红色交通线沿线发现多株百岁古树