技术 | yanunon

借着iPhone 17的上市，测试了各大AI的DeepResearch能力，研究课题就是“iPhone 17系列的销售情况”。

个人感受输出质量的排名是：Gemini > Grok > ChatGPT > 豆包。

说说各家的优缺点：

Gemini：内容的丰富程度是最好的，更像一个专业的研究报告。包括首发销量，型号对比，定价策略。还谈到了iPhone 17基础款爆火的原因，在中国市场的国补，印度市场的促销政策，供应链追加订单等信息。

Grok：内容不够Gemini那么丰富，但是各个方面都谈到了。亮点是大V的数据也利用起来了，引用了一些郭明錤在X上的Tweet，感觉很对味儿。

ChatGPT：感觉就一般般了，出结果等得最久，内容也一般，有比较多的用户评价和体验反馈。感觉就是将所有爬虫结果做了一次总结。

豆包：很尴尬的，一来就搞错了时间，说iPhone 17 是2024年发售的，还有模有样的输出了2024Q4、2025Q1和2025Q2的销量。然后又是一通胡扯，把国内外形势，行业现状，汇率都谈论了一遍，让人感觉很有道理的样子。最后还输出了一个网页，做了一些图表，还是很炫酷的，这个算是一个亮点。豆包的参考文档，几乎都是中文文档，有一半是来自今日头条的文章，所以输出这个结果，也是可以理解的。

最近Gemini真的越来越强了，iPhone也迎来了新的一轮换机潮，GOOG和AAPL的股东们要牢牢抓住，别被甩下车了。

四个报告的链接在这里：
Gemini：iPhone 17 销售情况研究方案
 Grok：iPhone 17系列销售情况分析
 ChatGPT：iPhone 17系列全球销量表现分析
 豆包：iPhone 17 系列全球销售情况分析报告

一直在思考大模型之战的最后赢家会是谁，断断续续有一些片段，今天恰好想记录下来。

首先，大模型毋庸置疑是一个划时代的产品，与之比肩的大概就是计算机的发明、互联网的发明和智能手机的出现。

然后就是NVIDIA对算力垄断，必然会被破除。一方面就是因为中美的芯片战争，必然会出现CUDA的兼容框架，现在华为、阿里都在搞这些国产替代，据说百度也在搞。另一方面，像谷歌这些大厂，也会TPU这些专门的芯片，以破除NVDA的垄断。到了后期，能投钱投人来训模型的公司会更少了，那么对算力的需求，也不像现在这么强了。而做推理，可选择的硬件就相对来说更多了，AMD在推理上，也能提供一些平替方案。

所以最后的赢家，还是会在应用层。除了文本大模型，还要考虑多模态。那么是哪些厂商可以同时控制这几个方面呢？用户入口、音频采集、视频采集、操作界面录屏、操控其他App或者硬件设备。所以答案其实很明显，微软、苹果和谷歌。条件放宽一点，超级App，那就加上腾讯和Meta。

这五家里面，能独立训模型的谷歌、腾讯和Meta；有卡的，谷歌；有数据的谷歌、腾讯和Meta；有钱的，好像都挺有钱的，但是美国公司应该更有优势；有人才的，必然是谷歌和Meta，微软都软了一点，苹果在这方面确实弱一些；

当然，阿里、字节、OpenAI和Anthropic也能一战，但是多多少少欠缺一些系统级的支持。所以被OS稍微一抄，也就没什么优势了。

所以，我认为OS最重要，其次是业务场景。业务场景方面，微软最有优势，毕竟Office套件覆盖面太广了。除了处理文字，就是图片，Adobe和Figma是主力。

最后，总结，谷歌的优势最多，其次是苹果，然后才是微软、Meta和腾讯。垂直领域，就是各种代表出马了。写作的、画图的、写代码的和做视频的。

yanunon

分类目录归档：技术

DeepResearch哪家强？

大模型之战的终局