再不跟 Meta 联合,微软就会被 OpenAI 掏空了

祖克柏最近心情很不错。与马斯克隔空互喷垃圾话後,「元宇宙版 Twitter」Threads 不到五天就跨过 1 亿用户门槛,成为全球用户总数破亿速度最快的社群平台。Threads 可说是祖克柏狠狠揍了马斯克一拳。

但商场擂台没有裁判叫停,祖克柏说Threads用户规模目标是10亿,达成目标後,Meta才会认真考虑Threads赚钱与否。10亿是Twitter用户数两倍。

祖克柏是认真的。无论反感马斯克版Twitter的愤怒用户,还是Meta帝国累积多年的庞大商业网,都极短时间涌入Threads。而无数游牧用户里更藏着矽谷最有权势的光头──微软CEO萨蒂亚·纳德拉(Satya Nadella)。

纳德拉之前是尊贵的Twitter蓝勾勾,有307万追随者,每天像AI毫无感情转推微软新闻公关稿。不过这次他有注册Threads帐号,热情洋溢宣布微软将与Meta「大模型联姻」:

如双方官方公告,Azure从设备、硬体和软体(facility, hardware and software)层面设计,支援世界领先AI训练。合作後Llama开发者可用Azure AI工具训练、微调、推理和安全功能开发。巨头的云端合作屡见不鲜,但全世界都知道,Azure可是OpenAI御用云端平台。

2019年微软掏出10亿美元投资OpenAI後,Azure就一直是OpenAI独家云端服务商。Azure为了提供算力和服务,重新设计部分架构,甚至某些观察者说微软拍板投资OpenAI的核心原因,就是Azure发展。

毕竟Transformer还没有完全验证,但微软已押注AI多年并将云端愿景视作「为AI服务的超级计算设施」。无论算力支援或OpenAI测试Chatbot,Azure都功不可没。山姆·阿特曼(Samuel Altman)甚至还推文对Azure团队支持表示感谢,高度评价微软是「世界最佳AI基础设施」。

如今阿特曼前脚刚烧两炷香,纳德拉转手就把「世界最佳AI基础设施」租给祖克柏。不知道两人是否商量好,又或许对纳德拉来说,大概都是计画的一部分。总之祖克柏表现得很高兴。

祖克柏Instagram帐号贴出与纳德拉的亲密合影以「感谢纳德拉」。祖克柏表示:「(Meta)将Llama2开源微软,(这次开源)将成为下一代大模型建设的基础。」

(Source:祖克柏)

微软与Meta的确相互需要。Meta走向大模型「深水区」,70B参数的Llama2已达GPT3.0水准,几乎是口碑最好的大模型底座。对闭源大模型阵营来说,Llama2成功的压力毫不亚於Threads给Twitter的震撼教育。

闭源公司花几千万做不出来的东西,开源社群可直接用,等於将全球开源大模型社群起跑线提高到3.0水准。最近登顶HuggingFace开源大模型榜单的Stability的Freewilly模型,最接近3.5,正是基於Llama2.0调教最佳化後的产品。

对Meta来说,参数提升使计算量攀升、模型逐步成熟也看到更多商用潜力。但如果要战胜困难、发挥潜力,祖克柏需要更有力的夥伴,Azure已经有的、Meta没有的东西,对Llama显得更重要,如Azure的算力经验、Azure的AI工具箱、Azure本身。

Meta是为数不多没有自家云端服务的网路科技巨头。过去Meta与亚马逊互为大客户,Meta某些AI研发算力都采购AWS。微软这次挖墙角,除了开放Windows场景,还开放Azure企业管道能力,将Llama2加入自己产品线。

Azure虽然在整体市场占比依然落後AWS,但是在SaaS销售领域却显着领先於同类竞争对手。而随着云与SaaS的融合,微软在通路上有显着的差异化优势。藉由Azure,Meta和它的生态追随者们可以直接透过云端来销售和使用Llama2的产品。

对於微软来说,大模型的挑战则更加多元。

微软过去在大模型应用层面几乎是all in OpenAI的产品。无论是最早接入的Bing,还是基於Windows生态的Copilot面向开发者的工具生态AI Studio,甚至是新的AI云端服务品牌OpenAI Azure,背後都是OpenAI的影子。

OpenAI是全球最好的大模型公司,Windows依然是全球最重要的生产力软体生态。但在大模型全球军备竞赛中,这两者的结合并不意味着绝对的胜券在握。

与Meta和微软结合几乎同时宣布的,则是苹果的大模型计画。

据海外媒体报导,苹果已经完成了名为「Ajax」的大预言模型基础框架,将开发类似ChatGPT的对话式AI。而消费级产品的推出时间则计划在明年发布。

苹果的入场被认为是矽谷大模型竞赛中的重要变数。

比起公有云的网路科技风口,AI是被苹果管理层高度认可的科技方向,近期管理层口风也有朝着AI加码的趋势。

除了长期关注AI科技外,苹果是全球最有钱、最有场景的公司。苹果每年净利润接近1,000亿美元、经营净现金流超过1,200亿美元,相当於微软与Meta的总和。苹果生态已经超过微软成为全球最大的封闭操作系统,活跃设备数量超过20亿,而微软只有15亿。

而相比於帐面实力外,苹果更具想像力的是它的半导体能力。它或许是全球参与大模型竞赛的科技企业中,为数不多将来可以不用外采GPU与CPU的厂商。不仅如此,苹果的晶片效率似乎更有想像力。

在2023年WWDC上,苹果推出的M2 Ultra晶片。相比於普通厂商CPU、GPU分离的部署方式,M2 Ultra统一记忆体架构以及随之带来的超高记忆体频宽,甚至可以让开发者在一张卡上就能跑大模型。

尽管类似的消费级晶片还无法和辉达(NVIDIA)的专业晶片相媲美,但类似小秀肌肉,也让外界对苹果未来的GPU算力延展能力产生了兴趣。

以OpenAI为例,外界预估其大概同时动用了2万张显卡进行计算。但王小川(搜狗创始人、百川智能CEO)近期对媒体表示,OpenAI正在测试1,000万张显卡同时计算的模型,相当於辉达目前10年的产能,「完全是登月计画等级」。

除了苹果以外,微软、Google、Meta、亚马逊等巨头都有自研AI晶片的计画,但已经有顶尖半导体开发能力的苹果依然是最有资格「大力出奇蹟」的人。

▲ Apple将两枚M2 Max 的晶片连接在一起打造出M2 Ultra。(Source:苹果)

Google凶猛、苹果虎视眈眈,微软和Meta选择结盟。

对於纳德拉来说,与Meta合作可以让微软在大模型的生态战争中更加稳固。

首先,微软依然需要开源,开源在未来的大模型竞争中将持续扮演重要角色。

开源天然具有人才参与众多、迭代速度快、垂直领域覆盖效率更高的生态能力。虽然OpenAI拿下头筹,但开源社群的进步速度依然很可观。比如Llama只用了大半年的时间,使用参数70B,已经赶上了175B、耗时2年的GPT3。

尤其是如果未来开源路线成为解决方案主流,Llama与Azure深度结合,或许真可帮助微软云端业务完成对AWS的弯道超车(2022年底Azure市占率23%、AWS为32%)。毕竟相比於Windows和Office,Azure才是微软最赚钱、最有潜力的业务。

其次,开源大模型的不断发展,必然让愿意砸钱做封闭系统的厂商也自然越来越少。比如Bard在Llama2之後就受到不小压力。除了许多好事者在晚上讨论Bard未来长期发展的压力外,有媒体报导称Google内部人士也曾撰文称Bard在对抗开源社群时有点吃力,後者进步神速且成本更少、应用场景更丰富。

在大模型超级投入的产业结构没有变化的情况下,封闭式大模型依然会有其存在的合理性,但可能会仅限於极少数领先者,而其中就可能会有OpenAI。

如果OpenAI有护城河,那它的名字可能叫Llama2。

当然,OpenAI其实也并不是微软的「亲儿子」。

在100亿美元投资後,微软虽然拥有75%的分红权,但实际上也只占OpenAI 49%的股权。换言之,微软虽然手握大量的OpenAI资源,但并不完全拥有OpenAI绝对的控制权。

但与Llama合作像是一个讯号,手握OpenAI的微软其实正在成为游戏规则的制定者:

它既有最具潜力的AI基础设施Azure,也有最前端的商业化变现接口Windows copilot。而当最核心的基础设施和通路在微软手上时,OpenAI也只是微软的「超级程式设计师」。

当Meta等平台成熟後,微软可以再引入更多的「程式设计师」,甚至开放更多的系统级场景给开源生态,进而让Windows系统的生产力进一步提升。

实际上,OpenAI原本就只是纳德拉重注AI和语言大模型的一个选项。

在ChatGPT之前,微软甚至和辉达合作开发过5,300亿参数的大语言模型「Megatron-Turing」,是当年基於transformer的最大模型,参数比GPT3多了好几倍,讲究的是绝对的大力出奇蹟。可最後Megatron还是输给了奥特曼,於是才选择了买下奥特曼。

但微软内部其实一直没有放弃大模型的相关技术路线开发。

例如6月时,微软就发布了13亿参数的「小型」大语言模型phi-1。有OpenAI做为核心资产,微软不走「大力奇蹟」模式,而是改用号称「教科书等级」的高品质资料集训练模型,让实际效果胜於千亿参数的GPT 3.5。7月时,微软还提出了新的大模型架构RetNet,称其可以在更大数据维度基础上,比transformer更优。

大模型的战事还远没到中场,Megatron与奥特曼们的游戏或许才刚刚开始。

(本文由 品玩 授权转载;首图来源:祖克柏)

0 0 投票数
Article Rating
订阅评论
提醒
guest
0 Comments
内联反馈
查看所有评论
0
希望看到您的想法,请您发表评论x