分类目录归档:技术

DeepResearch哪家强?

借着iPhone 17的上市,测试了各大AI的DeepResearch能力,研究课题就是“iPhone 17系列的销售情况”。

个人感受输出质量的排名是:Gemini > Grok > ChatGPT > 豆包。

说说各家的优缺点:

Gemini:内容的丰富程度是最好的,更像一个专业的研究报告。包括首发销量,型号对比,定价策略。还谈到了iPhone 17基础款爆火的原因,在中国市场的国补,印度市场的促销政策,供应链追加订单等信息。

Grok:内容不够Gemini那么丰富,但是各个方面都谈到了。亮点是大V的数据也利用起来了,引用了一些郭明錤在X上的Tweet,感觉很对味儿。

ChatGPT:感觉就一般般了,出结果等得最久,内容也一般,有比较多的用户评价和体验反馈。感觉就是将所有爬虫结果做了一次总结。

豆包:很尴尬的,一来就搞错了时间,说iPhone 17 是2024年发售的,还有模有样的输出了2024Q4、2025Q1和2025Q2的销量。然后又是一通胡扯,把国内外形势,行业现状,汇率都谈论了一遍,让人感觉很有道理的样子。最后还输出了一个网页,做了一些图表,还是很炫酷的,这个算是一个亮点。豆包的参考文档,几乎都是中文文档,有一半是来自今日头条的文章,所以输出这个结果,也是可以理解的。

最近Gemini真的越来越强了,iPhone也迎来了新的一轮换机潮,GOOG和AAPL的股东们要牢牢抓住,别被甩下车了。

四个报告的链接在这里:
Gemini:iPhone 17 销售情况研究方案
Grok:iPhone 17系列销售情况分析
ChatGPT:iPhone 17系列全球销量表现分析
豆包:iPhone 17 系列全球销售情况分析报告​

大模型之战的终局

一直在思考大模型之战的最后赢家会是谁,断断续续有一些片段,今天恰好想记录下来。

首先,大模型毋庸置疑是一个划时代的产品,与之比肩的大概就是计算机的发明、互联网的发明和智能手机的出现。

然后就是NVIDIA对算力垄断,必然会被破除。一方面就是因为中美的芯片战争,必然会出现CUDA的兼容框架,现在华为、阿里都在搞这些国产替代,据说百度也在搞。另一方面,像谷歌这些大厂,也会TPU这些专门的芯片,以破除NVDA的垄断。到了后期,能投钱投人来训模型的公司会更少了,那么对算力的需求,也不像现在这么强了。而做推理,可选择的硬件就相对来说更多了,AMD在推理上,也能提供一些平替方案。

所以最后的赢家,还是会在应用层。除了文本大模型,还要考虑多模态。那么是哪些厂商可以同时控制这几个方面呢?用户入口、音频采集、视频采集、操作界面录屏、操控其他App或者硬件设备。所以答案其实很明显,微软、苹果和谷歌。条件放宽一点,超级App,那就加上腾讯和Meta。

这五家里面,能独立训模型的谷歌、腾讯和Meta;有卡的,谷歌;有数据的谷歌、腾讯和Meta;有钱的,好像都挺有钱的,但是美国公司应该更有优势;有人才的,必然是谷歌和Meta,微软都软了一点,苹果在这方面确实弱一些;

当然,阿里、字节、OpenAI和Anthropic也能一战,但是多多少少欠缺一些系统级的支持。所以被OS稍微一抄,也就没什么优势了。

所以,我认为OS最重要,其次是业务场景。业务场景方面,微软最有优势,毕竟Office套件覆盖面太广了。除了处理文字,就是图片,Adobe和Figma是主力。

最后,总结,谷歌的优势最多,其次是苹果,然后才是微软、Meta和腾讯。垂直领域,就是各种代表出马了。写作的、画图的、写代码的和做视频的。