【财经分析】“百模大战”日趋白热化 大模型正重塑移动终端载体
经过2023年大模型领域的摸索,由ChatGPT带热的AI大模型也走到了终端之战的阶段,AI正加速从云端向移动终端落地。
新华财经上海5月16日电(葛佳明)本周,AI圈“爆款”频出,OpenAI发布首个端到端多模态模型GPT-4o,谷歌发布基于Gemini的视觉与语音交互通用AI智能体——Project Astra,字节发布豆包大模型并宣布成立智能终端大模型联盟……
同时,据小米公司官方今日发布微博,小米大语言模型 MiLM正式通过大模型备案,小米大模型将逐步应用于小米汽车、手机、智能家居等产品中。
一场由AI主导的人机交互变革正引爆终端市场,手机、电脑、汽车、智能家居等一些列产品如何更好的嵌入大模型也正在成为软件、硬件厂商们关注的焦点。
经过2023年大模型领域的摸索,由ChatGPT带热的AI大模型也走到了终端之战的阶段。
国内外大模型“百花齐放“, “价格力”加速应用落地
在AI发展日新月异的时代里,国内外厂商正不断推出新的大模型并对原有大模型进行优化,随着竞争加剧,AI大模型也打响“价格战”。
5月15日,字节跳动正式发布“豆包大模型”,成为国内又一家发布自研大语言模型的互联网巨头。
而最让人市场瞩目的便是字节极具“价格力”的定价。火山引擎总裁谭待在会上宣布,豆包Pro 32k模型正式定价是1千Tokens 0.8厘,比行业的价格降低99.3%;豆包Pro 128k模型正式定价为是1千Tokens5厘钱,较行业价格降低了95.8%。
在发布会后的群采中,谭待对于超低定价给出了解释,一方面,字节可以在大模型产品上做到低价,在模型结构、训练、生产等技术层面有很多优化手段能够实现降价,另一方面则是因为市场对降价呼声比较大,必须把试错成本做到非常低,才能让大家用起来。
不仅是字节跳动,短短一周时间多家大模型公司宣布降价的消息。
5月14日,OpenAI发布GPT-4o炸场,在API调用方面,相比GPT-4-turbo,GPT-4o价格降低一半,速度提升两倍。
同一天,智谱大模型开放平台上线了新的价格体系,其入门级产品GLM-3 Turbo模型调用价格下调80%,从5元/百万tokens降至1元/百万tokens。
5月9日,阿里云正式发布通义千问2.5,称个人用户可从APP、官网和小程序免费使用通义。
5月6日,幻方量化旗下DeepSeek(深度求索)发布第二代MoE模型DeepSeek-V2,称DeepSeek-V2“性能比肩GPT-4,每百万token输入1元、输出2元(32K上下文),仅是GPT-4的近百分之一水平。
正如谭待所说,调用API的成本其实就是AI应用普及的第一座难关,豆包的低价使得更多企业和个人能够负担大模型的使用费用,降低了大模型技术的使用门槛,助力大模型在更多行业和场景中的落地应用。
当竞争进一步加剧,对大模型公司来说,低价是否意味着盈利空间被进一步挤压,也将成为核心议题。
华泰证券在近期发布的研报中分析称,预计未来在AI大模型的商业模式和竞争格局方面,可能形成赢者通吃或国内外寡头竞争的局面,行业大模型则有望百花齐放,训练基础大模型的高成本和高技术壁垒,决定了科技巨头或成为主要玩家。目前“基础大模型”到“行业大模型”再到“终端应用”的大模型路线已非常清晰。
AI部署正从云端走向终端
业内普遍认为,从大模型的落地发展趋势看,从云端向终端推进是目前的重点发展方向之一。
如果大模型部署在云端,则需要通过终端访问云端,而这样的部署方式存在不足:比如云部署需要保证有足够的参数量和算力,对于轻量化、低时延的任务,显然不具备优势,同时数据上传和存储在云端,有隐私泄露的风险。
而端侧大模型解决了这些问题。相比于云端大模型,端侧大模型具备隐私性、本地可靠性、响应快等差异化优势。此外,终端部署有助于节省数据中心硬件、场地、能耗、运营、额外带宽和网络传输的成本。
而端侧AI的核心优势也正在于,它能够在不依赖云端服务器的情况下,快速响应用户需求,处理本地数据,保护用户隐私。
摩根士丹利Edward Stanley分析师团队发布研报称,端侧AI将在2024年下半年和2025年成为消费电子市场的重要驱动力,预计2025-2026年,AI PC的渗透率将从2024年的8%分别飙升到30%和50%。
根据国际数据公司IDC的预测,2024年全球新一代AI手机的出货量将达到1.7亿部,约占智能手机整体出货量的15%。仅在中国市场,2027年AI手机将达1.5亿部且占市场份额超过50%。
但要想把大模型装进终端,真正要解决的问题还包括模型压缩技术,与此同时还要保证硬件性能跟上,以及如何确保隐私安全性和软硬件兼容等等问题。
AI应用将成为终端与用户的连接点
正如谭待所说,未来一年,大模型将运用到越来越多的企业场景,从概念验证(POC)阶段走到真实的生产系统。
联想集团副总裁、中国区首席市场官王传东在5月11日的演讲中则表示,2024年已经成为AI应用元年,AI应用开发面临着前所未有的机遇。而要让AI真正落地应用,离不开智能终端和AI应用生态两大必要条件。
华泰证券称,GPT-4o此次发布的主要亮点在于大模型响应时延大幅缩短。根据OpenAI披露,GPT-4o语音模式平均时延320毫秒,与人类在对话中的响应时间相似,而GPT-3.5及GPT-4的时延分别为2.8秒和5.4秒,这为大模型在手机,耳机等移动设备上的应用落地铺平了道路。
国盛证券研报认为,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化,利好智能终端Agent、机器人等方向。
就在OpenAI发布会的一天后, 科技巨头谷歌公司召开了一年一度的I/O开发者大会,展示了一系列AI技术突破谷歌(Google)的新品发布会则更侧重于AI落地, 与OpenAI相比,谷歌的优势在于其手握安卓系统和搜索,因而谷歌宣布依托大模型Gemini,很快用户就能感知到AI搜索和AI安卓系统在应用端的落地。
此外,谷歌将端侧大模型GeminiNano整合至安卓系统,可处理文本、图像、音频和语音,同时保持设备信息的私密性,未来手机可以通过文本、图像、声音和口语,按照用户理解的方式理解世界。
中国银河证券发布研报称,谷歌AI全线升级,有望带动下游应用及端侧AI。第六代TPU芯片Trillium的性能提升和能效比的改善,将加速AI模型的训练和推理过程,利好云、边、端AI全面升级,尤其端侧AI革命一触即发。
编辑:谈瑞
声明:新华财经为新华社承建的国家金融信息平台。任何情况下,本平台所发布的信息均不构成投资建议。如有问题,请联系客服:400-6123115