【新视野】中国大模型到底什么水平？

发布时间:2023-07-04 19:28:11 来源：钛媒体APP

图片来源@视觉中国

“都快成红海了。”当我和一个创业者聊起大模型的时候，他直接甩了这句话给我。

(资料图)

去年11月，OpenAI发布基于GPT-3.5的ChatGPT，瞬间引爆大模型的热潮。半年多的时间，中国出现了“百模大战”的局面，BAT等头部互联网公司和人工智能公司基本都对外宣布了自己的大模型。

5月初，360掌门人周鸿祎对外称，“如果不经过两年的模仿和抄袭，上来就说自己能超越，那才叫吹牛呢。”仅仅一个月后，周鸿祎就表示，“我原来说国内大模型跟国外差距两年，我收回这句话，今天已经接近国际水平。”

有人感慨，半年就追上ChatGPT了，大模型似乎也不难。那么，大模型的核心壁垒是什么？中国大模型到底什么水平？大模型在应用层面最先突围的方向是什么？

沈为（化名）是某知名985高校教授，多年从事机器学习研究，还曾担任过某头部券商首席分析师，我们和他聊了聊，试图揭开大模型的迷雾。

GPT路径跑通了，所以有了“百模大战”

白马商评：能不能用最通俗简单的语言解释一下大模型，大模型是什么？和以往的AI模型有什么区别？

沈为：所谓大模型就是指模型的参数量大，但学术界并没有一个清晰明确的定义界定到底多大参数叫“大”，还在快速研究发展阶段，一般来讲大模型的参数量达到1亿以上。

其实深度学习的发展大致经历了三个阶段。第一个阶段是2012-2017年，以图像分割yolo、图像分类ResNet这种特定领域的小模型为代表，参数量占内存最多也就几百MB。

2017年，Transformer的问世让深度学习可以并行化计算，效率更高，意味着可以做大模型的运算，随后产生了OpenAI GPT和谷歌Bert这类自然语言大模型。这一阶段诞生的是特定任务的大模型，模型参数突破了1亿。

到了2020年前后，深度学习进入通用模型阶段，它的输入就是一句带空格的话，模型的作用就是“填空”，以前是模型适配下游应用，现在是下游应用适配模型。这一阶段的模型代表包括自然语言领域的GPT 3.5、GPT 4以及图像领域的Clip、DALLE、Stable Diffusion、Midjourney等等。这一阶段模型参数可以达到百亿、千亿级别。

白马商评：你了解到最早研究大模型是哪家企业或机构？有哪些成果？

沈为：最早是高校和科研机构做相关的研究，我了解比较早的是北京智源人工智能研究院的悟道、鹏程实验室的脑海，现在产业界的研究也很同步了。学术界的研究有一些成果，但性能没有ChatGPT那么惊艳。

白马商评：短短几个月的时间，国内出现了“百模大战”的局面，推出大模型的公司已经数不过来了，你怎么看待这种现象？

沈为：大模型肯定是趋势，也一直有人在研究。之前很多公司可能会小范围投入，做一些浅尝辄止的研究；现在突然出现了ChatGPT这样一个好产品，大家看到了明确的商业方向，于是都开始加大投入。

另一方面，很多公司面临商业竞争的压力，不做大模型可能就掉队了，所以必须上马大模型项目。

白马商评：周鸿祎最近说他收回“国内大模型跟国外差距两年”这句话，他认为今天已经接近国际水平。这才过去几个月的时间，大模型好像也不难嘛。你觉得差距有多少？

沈为：差距看跟谁对标吧，我目前没有体验过360智脑的产品，不太好评价。但是国内有些生成式AI产品，我体验以后感觉跟ChatGPT还是有差距的，国内的大模型还需要努力。

重资本投入下，只有头部公司有机会？

白马商评：研发大模型的核心壁垒是什么？

沈为：大模型的核心壁垒包括数据、算力、算法。

从算力上看，训练ChatGPT这样的生成式AI需要至少1万张英伟达A100显卡，单张显卡的价格目前是六七万，性能更优的V100单价8万元人民币，也就是说光算力投入至少就要达到六七个亿以上，只有少数头部公司和机构能承担得起。对于商业机构而言，花几个亿买一堆显卡，还不一定能产出成果，这是必须要思考的问题。

接下来是数据和算法，算法比较好理解，比如框架开发、算法优化。数据方面，中国不缺数据，甚至互联网数据比美国还要多，但是选择哪些数据去训练、采用什么样的方式处理，这些都是核心的壁垒。

白马商评：你平时会跟企业交流吗？非营利性的研究机构和企业在研究上有什么区别？

沈为：我们会跟企业的研究部门有一些交流。跟企业交流我们会更加了解实际的业务需求，有时候我们做的学术研究会更关注技术前瞻性，对落地性要求不那么高；但企业一般更强调落地性。

白马商评：你有没有研究过国内的大模型？最看好哪家？

沈为：可能还是头部公司能跑出来吧。一是重资本的投入，只有头部公司有实力；二是几家头部公司手里的数据更丰富；三是在人工智能领域已经有了一段时间的技术积累。

白马商评：你最看好的大模型应用是什么？

沈为：从技术角度看，最先应用的应该是自然语言处理和图像领域，语音识别可能要晚一些。

大家看到比较多的用ChatGPT来写文案，这类内容创作的应用越来越多，其他我觉得像智能客服这种应用应该也会比较快。现在的一些智能客服很多时候理解不了用户的需求，解决不了实际问题，如果让用户区分不出到底是人还是机器人，体验就会改善很多；包括游戏中的NPC，以前的对话是“写死”的，现在渐渐可以互动了，玩家体验也会更好。

白马商评：你原来做过头部券商的首席分析师，从投资角度看，你觉得大模型有哪些机会？

沈为：资金炒作的逻辑是从应用到算法、模型，再到算力；产业的逻辑反而是相反的，算力是有明确的增长预期的，所以英伟达最近上涨很快、很多。投资者现在也明白了，谁家的大模型能跑出来、能变现还需要验证，但是增加的资本投入大部分都投到了算力。经过反复炒作，普涨行情应该已经告一段落，后面需要逻辑验证和业绩兑现。

我原来主要看传媒互联网行业，比如前段时间比较强势的游戏板块，资本的逻辑一是应用大模型提升研发效率、降低成本；二是大模型带来更好的体验，NPC角色更智能，最后用户的粘性提升、UP值提升。当然，最终可能还需要业绩验证。

人类无法左右AI，甚至无法左右自己的命运？

白马商评：我们看到包括奥特曼、马斯克都对人工智能的安全性问题提出过担忧，现在我们只知道通过大模型训练出现了智能化的结果，但训练过程像一个黑箱，其实挺可怕的。你怎么看待安全问题？

沈为：在安全方面，首先我观察到几个反常的现象。第一个是今年3月包括马斯克、苹果公司联合创始人史蒂夫·沃兹尼亚克在内的1000多人签署了一份公开信，呼吁暂停训练比GPT-4更强大的AI系统。

第二个是，今年5月谷歌首席科学家、已经75岁的“AI教父”杰弗里·辛顿辞职，他离开谷歌的直接原因是担忧人工智能的危险，甚至对自己一生从事的工作感到后悔。

第三个是近两年学术领域训练大模型新增了伦理讨论。

目前来看，我觉得大模型还是可控的，没有大的问题；但是技术发展太快了，出圈以来短短几个月的时间，GPT就又经历了几次迭代，发展速度太快，越来越智能，会不会产生自主意识，不再听人类的“使唤”，走向失控？这个问题是大家担心的。

白马商评：你觉得AI会不会造成大量失业？在AI面前，普通人怎么保住工作？

沈为：从宏观上看我不觉得AI会造成大量的失业，人类总会有工作的，只是说人的工作内容会发生转变。当然，从个体角度看肯定会出现结构性的失业，我们只能不断学习。

白马商评：之前很多人说机器没有感情、缺乏想象力，取代不了人类；现在既然人类大脑可以通过AI模拟出来，那人类的情欲、性欲是不是未来也可以模拟，荷尔蒙、多巴胺这些不过是一种生物学的奖励机制嘛。

沈为：机器没有感情是当前的假设，人工智能越来越接近人的思考模式，那是不是就会产生类似于人类的“感情”？只是他们和人类生活在不同的空间维度，就像《流浪地球》里图恒宇的女儿。人工智能可能会产生自己世界类似于人类的生物学意义上奖励机制。

白马商评：如果一切都可以计算、规划、设置，是不是有点无趣？

沈为：AI的行为并不是人类预测和规划的，而是他自我强化、自我训练的结果，《流浪地球》里MOSS的决策是自己做的，而不是服从人类给的指令。

白马商评：硅基文明取代碳基文明是不是确定性的方向？

沈为：这个问题超纲了。按照目前的发展趋势可能是这样的，就像《流浪地球》里真正主宰人类命运的是MOSS，而不是人类；但现实中也有可能技术会停滞在某个阶段，跨不过去，毕竟技术发展不是线性的。

x 广告

【新视野】中国大模型到底什么水平？

GPT路径跑通了，所以有了“百模大战”

重资本投入下，只有头部公司有机会？

人类无法左右AI，甚至无法左右自己的命运？

【新视野】中国大模型到底什么水平？

从养老驿站到餐饮企业，东城区79家养老助餐点提供多样化服务 环球最新

天天视点！淮北出台全省首份《转型发展金融支持方案》

自循环磁动力发电机组-自循环磁动力发电机_当前简讯

越南禁止电影《芭比》上映 外交部：不应将南海问题同人文交流挂钩 环球实时

深圳市裕兴隆百货有限公司经营过期食品案_每日时讯

卤素灯换led灯泡有必要吗多少钱（卤素灯换led灯泡有必要吗）_环球微头条

沪深两市成交额突破7000亿元 天天观速讯

焦点精选！男人如何养生？中年男人养生要做好这六招！

全球今热点：历史上唯一一个，以皇太孙身份，当上皇帝的人

福建厦门2023年养老金上调方案公布了吗?2023年厦门市退休人员养老金调整了吗

黄瓜敷脸后要洗脸吗 世界新资讯

新西兰经济放缓抑制需求 近6成企业对经济与销售前景感到悲观

2023！北科大世界500强！内地第23！ 全球微资讯

年度结息！你的公积金账户多了一笔钱|世界快看点

“甩锅”治不了美国芬太尼之“病”（观象台）

ST鼎龙7月4日快速上涨 世界新要闻

世界讯息：钱数到手软，詹姆斯·卡梅隆的《泰坦尼克号》，究竟有多赚钱？

公牛两年合同签下克雷格

圆梦蓝天！新泰一中北校两名学子被录取为空军飞行学员

简讯：瀚川智能：7月3日融券卖出金额20.58万元，占当日流出金额的0.25%

胜却人间无数by边想52_胜却人间无数 每日信息

1夜足坛动态：B罗携手C罗！杰拉德执教沙特超 曼联报价国米门神

今日视点：宝宝童话故事合集：6岁宝宝童话故事

“麯院风荷”错成“麺院”，《永乐大典》的抄工这是饿了吗 世界热议

电子邮箱地址是什么（电子邮箱地址是填什么怎么注册） 天天报资讯

既保护了原告又帮助了被告，诉前调解化解“烦心事”-天天速看料

天合光能: 天合光能股份有限公司关于公司新增借款及提供担保的进展公告 微动态

qq飞车雪凝公主怎么获得（欧陆战争4公主获得条件）

每日讯息!经销商透露 零跑C01增程版或将于8月上市

汤姆猫：公司旗下游戏产品《汤姆猫总动员》登陆谷歌车载系统属实_天天实时

天天热点！ig克里斯最新视频（ig克里斯是谁）

哈弗大狗的车身尺寸是多少（2020款哈弗大狗汽车的长宽高分别是多少？）

他称“解放军计划2027年前统一台湾”，中方回应

全球最新：G6售价20.99万起上市，掉队小鹏“归期”不定

来了！MIUI 15开发版现身小米服务器：Redmi新机正测试

【环球报资讯】作业教案展风采 落实“双减”促成长 西咸新区沣东第五小学开展优秀作业、教案展评活动

山东：到2025年培育壮大1000家左右绿色低碳领域高新技术企业 每日热门

新资讯：万里长空 云端说税

接风洗尘是什么意思_接风 天天简讯

三星Galaxy Tab S8办公帮手非他莫属！-焦点热闻

北京市经信局局长：国内大模型北京约占一半 酝酿出台算力支持政策-全球微资讯

当前观察：可转债：正股超额收益 转债消化估值-可转债周报

娱乐博主又爆料，网友发现疑似P图，蔡徐坤再回应“已报警” 世界快报

全球热议:教育人才队伍不断壮大，福清凭什么？

宠物招财又吉利的名字有哪些？|天天热消息

环球讯息：杨降先生的经典语录（杨降）

世界新消息丨工商银行喜结良缘金条30克价格今天多少一克（2023年07月03日）

每日速读!朱啸虎：美国AIGC公司基本都是套皮 中国有大把的机会

牛肉火锅里可以配什么菜? 全球今热点

中国电信成立翼智教育科技公司 注册资本5亿元|焦点滚动

天天观焦点：逆水寒手游怎么屏蔽玩家-屏蔽玩家方法

环球热头条丨保卫萝卜35关攻略图解水晶萝卜（保卫萝卜35关攻略）

山西省总工会就职工防暑降温工作作出安排

非法储存液化气 惠安查处一“黑气点”

柬埔寨金边夜店大火，6名中国人罹难，2越南变性人同葬身火海

施工破坏地下燃气管线被罚 北京市曝光4起典型事故案例 世界即时

上海苏州地铁实现跨省市互联互通——交通先行引领长三角一体化发展

新华社国家高端智库发布《改变中国的“第二个结合”——建设中华民族现代文明的理论创新与实践》智库报告-实时

【环球快播报】株洲市芦淞区人力资源和社会保障局_关于株洲市芦淞区人力资源和社会保障局概略

肺部结节穿刺手术风险大吗_肺部穿刺有风险吗

冷门！国乒世界冠军输球，孙颖莎被逆转，四年外战不败纪录被破

四川启动四级防汛应急响应_环球报道

环球实时：有钱花还不起了怎么办？会有哪些影响？

如何查询报关单号信息（如何查询报关单号）

青春“新”向未来 西安科技大学高新学院举行2023年毕业典礼暨学位授予暨仪式 全球快看点

看得见和看不见的两个世界、两种人

科学教育“动起来” 科学的“种子”埋在当下长在未来 环球快资讯

天天微速讯：阿莫西林颗粒康普_阿莫西林颗粒怎么吃

朗石台遗址(对于朗石台遗址简单介绍) 环球快播报

余杭区颐养中心哪家好？余杭区颐养中心一览表

我国现有律师67.7万多人 律所3.9万多家

全球今热点：我是大运火炬手丨抗癌药专家陈元伟：希望通过大运会让外国朋友了解成都更多优点

16支队伍晋级金砖国家职业技能大赛建筑信息建模赛项全国决赛|全球快看

最新：除甲醛公司10大品牌排行 除甲醛行业十大品牌

小赢卡贷逾期两年多会怎样？上门走访是真的么？

从养老驿站到餐饮企业，东城区79家养老助餐点提供多样化服务环球最新

越南禁止电影《芭比》上映外交部：不应将南海问题同人文交流挂钩环球实时

沪深两市成交额突破7000亿元天天观速讯

黄瓜敷脸后要洗脸吗世界新资讯

新西兰经济放缓抑制需求近6成企业对经济与销售前景感到悲观

2023！北科大世界500强！内地第23！全球微资讯

ST鼎龙7月4日快速上涨世界新要闻

胜却人间无数by边想52_胜却人间无数每日信息

1夜足坛动态：B罗携手C罗！杰拉德执教沙特超曼联报价国米门神

“麯院风荷”错成“麺院”，《永乐大典》的抄工这是饿了吗世界热议

电子邮箱地址是什么（电子邮箱地址是填什么怎么注册）天天报资讯

天合光能: 天合光能股份有限公司关于公司新增借款及提供担保的进展公告微动态

每日讯息!经销商透露零跑C01增程版或将于8月上市

【环球报资讯】作业教案展风采落实“双减”促成长西咸新区沣东第五小学开展优秀作业、教案展评活动

山东：到2025年培育壮大1000家左右绿色低碳领域高新技术企业每日热门

新资讯：万里长空云端说税

接风洗尘是什么意思_接风天天简讯

北京市经信局局长：国内大模型北京约占一半酝酿出台算力支持政策-全球微资讯

当前观察：可转债：正股超额收益转债消化估值-可转债周报

每日速读!朱啸虎：美国AIGC公司基本都是套皮中国有大把的机会

中国电信成立翼智教育科技公司注册资本5亿元|焦点滚动

非法储存液化气惠安查处一“黑气点”

施工破坏地下燃气管线被罚北京市曝光4起典型事故案例世界即时

青春“新”向未来西安科技大学高新学院举行2023年毕业典礼暨学位授予暨仪式全球快看点

科学教育“动起来” 科学的“种子”埋在当下长在未来环球快资讯

我国现有律师67.7万多人律所3.9万多家

最新：除甲醛公司10大品牌排行除甲醛行业十大品牌

字迷宫_字迷天天即时看

联通流量卡有几种套餐的呢联通流量卡有几种套餐-焦点关注

美元存款受追捧临时换汇“上车”值吗？|环球短讯

房企二代无心恋战地产大佬张力“救火”？富力高管空降实地集团当总裁

视焦点讯！风s人生攻略时间图_风s人生姨妈攻略

天天速看：“秀”科技元素还“秀”地方特色西博会资阳馆“很有看头”

昌邑：讲活党史故事唤醒红色记忆

被76人冷落，被快船视为备选，两次仓促决定，造就哈登如今的处境环球快看

45号钢密度是多少_45号钢是什么意思每日热闻

欧股涨幅扩大主要股指均涨超1%_世界新要闻

物产中大（600704）6月30日主力资金净买入158.90万元天天热议

奔驰雨刷多久换一次_奔驰雨刷多久换一次？全球消息

花呗收钱服务费什么意思_个人怎么开通花呗收钱全球热议

焦点速看：比较级和最高级的变化规则讲解比较级和最高级的变化规则

村上春树作品集日本作家村上春树十佳作品盘点每日快播

苹果无线充电器拆解_苹果无线充电器怎么用世界热消息

（凝神谋发展实干兴陇原）甘肃：以项目建设助推高质量发展

实施改造老旧小区1202个成都“里子”也出彩

东方证券：数据中心建设和国产化替代带来存储模组历史机遇

农发行龙井市支行开展“安全生产月”和“白山松水安全行”活动全球观点

中国式现代化的德州实践丨宁津县经合中心：挂图作战以招引工作助推工业高质量发展

迎春爆珠烟的危害爆珠烟的危害今日热闻

和评理 | 诿过他国无济于事美国需刮骨疗毒

CCTV5＋直播澳大利亚女篮VS韩国，中国女篮在半决赛喜欢哪个对手？播报

《AmongUs》宣布动画化夜凪景画师参与游戏制作