一直在思考大模型之战的最后赢家会是谁,断断续续有一些片段,今天恰好想记录下来。
首先,大模型毋庸置疑是一个划时代的产品,与之比肩的大概就是计算机的发明、互联网的发明和智能手机的出现。
然后就是NVIDIA对算力垄断,必然会被破除。一方面就是因为中美的芯片战争,必然会出现CUDA的兼容框架,现在华为、阿里都在搞这些国产替代,据说百度也在搞。另一方面,像谷歌这些大厂,也会TPU这些专门的芯片,以破除NVDA的垄断。到了后期,能投钱投人来训模型的公司会更少了,那么对算力的需求,也不像现在这么强了。而做推理,可选择的硬件就相对来说更多了,AMD在推理上,也能提供一些平替方案。
所以最后的赢家,还是会在应用层。除了文本大模型,还要考虑多模态。那么是哪些厂商可以同时控制这几个方面呢?用户入口、音频采集、视频采集、操作界面录屏、操控其他App或者硬件设备。所以答案其实很明显,微软、苹果和谷歌。条件放宽一点,超级App,那就加上腾讯和Meta。
这五家里面,能独立训模型的谷歌、腾讯和Meta;有卡的,谷歌;有数据的谷歌、腾讯和Meta;有钱的,好像都挺有钱的,但是美国公司应该更有优势;有人才的,必然是谷歌和Meta,微软都软了一点,苹果在这方面确实弱一些;
当然,阿里、字节、OpenAI和Anthropic也能一战,但是多多少少欠缺一些系统级的支持。所以被OS稍微一抄,也就没什么优势了。
所以,我认为OS最重要,其次是业务场景。业务场景方面,微软最有优势,毕竟Office套件覆盖面太广了。除了处理文字,就是图片,Adobe和Figma是主力。
最后,总结,谷歌的优势最多,其次是苹果,然后才是微软、Meta和腾讯。垂直领域,就是各种代表出马了。写作的、画图的、写代码的和做视频的。