首页 > 要闻 > 正文

【财经分析】“百模大战”日趋白热化大模型正重塑移动终端载体

新华财经|2024年05月16日

阅读量：

经过2023年大模型领域的摸索，由ChatGPT带热的AI大模型也走到了终端之战的阶段，AI正加速从云端向移动终端落地。

新华财经上海5月16日电（葛佳明）本周，AI圈“爆款”频出，OpenAI发布首个端到端多模态模型GPT-4o，谷歌发布基于Gemini的视觉与语音交互通用AI智能体——Project Astra，字节发布豆包大模型并宣布成立智能终端大模型联盟……

同时，据小米公司官方今日发布微博，小米大语言模型 MiLM正式通过大模型备案，小米大模型将逐步应用于小米汽车、手机、智能家居等产品中。

一场由AI主导的人机交互变革正引爆终端市场，手机、电脑、汽车、智能家居等一些列产品如何更好的嵌入大模型也正在成为软件、硬件厂商们关注的焦点。

经过2023年大模型领域的摸索，由ChatGPT带热的AI大模型也走到了终端之战的阶段。

国内外大模型“百花齐放“， “价格力”加速应用落地

在AI发展日新月异的时代里，国内外厂商正不断推出新的大模型并对原有大模型进行优化，随着竞争加剧，AI大模型也打响“价格战”。

5月15日，字节跳动正式发布“豆包大模型”，成为国内又一家发布自研大语言模型的互联网巨头。

而最让人市场瞩目的便是字节极具“价格力”的定价。火山引擎总裁谭待在会上宣布，豆包Pro 32k模型正式定价是1千Tokens 0.8厘，比行业的价格降低99.3%；豆包Pro 128k模型正式定价为是1千Tokens5厘钱，较行业价格降低了95.8%。

在发布会后的群采中，谭待对于超低定价给出了解释，一方面，字节可以在大模型产品上做到低价，在模型结构、训练、生产等技术层面有很多优化手段能够实现降价，另一方面则是因为市场对降价呼声比较大，必须把试错成本做到非常低，才能让大家用起来。

不仅是字节跳动，短短一周时间多家大模型公司宣布降价的消息。

5月14日，OpenAI发布GPT-4o炸场，在API调用方面，相比GPT-4-turbo，GPT-4o价格降低一半，速度提升两倍。

同一天，智谱大模型开放平台上线了新的价格体系，其入门级产品GLM-3 Turbo模型调用价格下调80%，从5元／百万tokens降至1元／百万tokens。

5月9日，阿里云正式发布通义千问2.5，称个人用户可从APP、官网和小程序免费使用通义。

5月6日，幻方量化旗下DeepSeek（深度求索）发布第二代MoE模型DeepSeek-V2，称DeepSeek-V2“性能比肩GPT-4，每百万token输入1元、输出2元（32K上下文），仅是GPT-4的近百分之一水平。

正如谭待所说，调用API的成本其实就是AI应用普及的第一座难关，豆包的低价使得更多企业和个人能够负担大模型的使用费用，降低了大模型技术的使用门槛，助力大模型在更多行业和场景中的落地应用。

当竞争进一步加剧，对大模型公司来说，低价是否意味着盈利空间被进一步挤压，也将成为核心议题。

华泰证券在近期发布的研报中分析称，预计未来在AI大模型的商业模式和竞争格局方面，可能形成赢者通吃或国内外寡头竞争的局面，行业大模型则有望百花齐放，训练基础大模型的高成本和高技术壁垒，决定了科技巨头或成为主要玩家。目前“基础大模型”到“行业大模型”再到“终端应用”的大模型路线已非常清晰。

AI部署正从云端走向终端

业内普遍认为，从大模型的落地发展趋势看，从云端向终端推进是目前的重点发展方向之一。

如果大模型部署在云端，则需要通过终端访问云端，而这样的部署方式存在不足：比如云部署需要保证有足够的参数量和算力，对于轻量化、低时延的任务，显然不具备优势，同时数据上传和存储在云端，有隐私泄露的风险。

而端侧大模型解决了这些问题。相比于云端大模型，端侧大模型具备隐私性、本地可靠性、响应快等差异化优势。此外，终端部署有助于节省数据中心硬件、场地、能耗、运营、额外带宽和网络传输的成本。

而端侧AI的核心优势也正在于，它能够在不依赖云端服务器的情况下，快速响应用户需求，处理本地数据，保护用户隐私。

摩根士丹利Edward Stanley分析师团队发布研报称，端侧AI将在2024年下半年和2025年成为消费电子市场的重要驱动力，预计2025-2026年，AI PC的渗透率将从2024年的8%分别飙升到30%和50%。

根据国际数据公司IDC的预测，2024年全球新一代AI手机的出货量将达到1.7亿部，约占智能手机整体出货量的15%。仅在中国市场，2027年AI手机将达1.5亿部且占市场份额超过50%。

但要想把大模型装进终端，真正要解决的问题还包括模型压缩技术，与此同时还要保证硬件性能跟上，以及如何确保隐私安全性和软硬件兼容等等问题。

AI应用将成为终端与用户的连接点

正如谭待所说，未来一年，大模型将运用到越来越多的企业场景，从概念验证（POC）阶段走到真实的生产系统。

联想集团副总裁、中国区首席市场官王传东在5月11日的演讲中则表示，2024年已经成为AI应用元年，AI应用开发面临着前所未有的机遇。而要让AI真正落地应用，离不开智能终端和AI应用生态两大必要条件。

华泰证券称，GPT-4o此次发布的主要亮点在于大模型响应时延大幅缩短。根据OpenAI披露，GPT-4o语音模式平均时延320毫秒，与人类在对话中的响应时间相似，而GPT-3.5及GPT-4的时延分别为2.8秒和5.4秒，这为大模型在手机，耳机等移动设备上的应用落地铺平了道路。

国盛证券研报认为，GPT-4o是迈向更自然的人机交互的重大进步，新功能带来了崭新的多模态交互能力，通过新的端到端模型实现了体验上的新突破，有望在各类终端实现用户体验的最大化，利好智能终端Agent、机器人等方向。

就在OpenAI发布会的一天后，科技巨头谷歌公司召开了一年一度的I/O开发者大会，展示了一系列AI技术突破谷歌（Google）的新品发布会则更侧重于AI落地，与OpenAI相比，谷歌的优势在于其手握安卓系统和搜索，因而谷歌宣布依托大模型Gemini，很快用户就能感知到AI搜索和AI安卓系统在应用端的落地。

此外，谷歌将端侧大模型GeminiNano整合至安卓系统，可处理文本、图像、音频和语音，同时保持设备信息的私密性，未来手机可以通过文本、图像、声音和口语，按照用户理解的方式理解世界。

中国银河证券发布研报称，谷歌AI全线升级，有望带动下游应用及端侧AI。第六代TPU芯片Trillium的性能提升和能效比的改善，将加速AI模型的训练和推理过程，利好云、边、端AI全面升级，尤其端侧AI革命一触即发。

编辑：谈瑞

声明：新华财经为新华社承建的国家金融信息平台。任何情况下，本平台所发布的信息均不构成投资建议。如有问题，请联系客服：400-6123115

新华财经声明：本文内容仅供参考，不构成投资建议。投资者据此操作，风险自担。

传播矩阵

主题

热点

首页

股票

债券

外汇

基金

期货

指数

研报金榜

合规评测

丝路数据库

新华财经

新华丝路

新华信用

新华指数

【财经分析】“百模大战”日趋白热化大模型正重塑移动终端载体

传媒矩阵

友情链接

主题

热点

首页

股票

债券

外汇

基金

期货

指数

研报金榜

合规评测

丝路数据库

新华财经

新华丝路

新华信用

新华指数

【财经分析】“百模大战”日趋白热化 大模型正重塑移动终端载体

传媒矩阵

友情链接

提示

订单支付

【财经分析】“百模大战”日趋白热化大模型正重塑移动终端载体