DeepResearch哪家强?

借着iPhone 17的上市,测试了各大AI的DeepResearch能力,研究课题就是“iPhone 17系列的销售情况”。

个人感受输出质量的排名是:Gemini > Grok > ChatGPT > 豆包。

说说各家的优缺点:

Gemini:内容的丰富程度是最好的,更像一个专业的研究报告。包括首发销量,型号对比,定价策略。还谈到了iPhone 17基础款爆火的原因,在中国市场的国补,印度市场的促销政策,供应链追加订单等信息。

Grok:内容不够Gemini那么丰富,但是各个方面都谈到了。亮点是大V的数据也利用起来了,引用了一些郭明錤在X上的Tweet,感觉很对味儿。

ChatGPT:感觉就一般般了,出结果等得最久,内容也一般,有比较多的用户评价和体验反馈。感觉就是将所有爬虫结果做了一次总结。

豆包:很尴尬的,一来就搞错了时间,说iPhone 17 是2024年发售的,还有模有样的输出了2024Q4、2025Q1和2025Q2的销量。然后又是一通胡扯,把国内外形势,行业现状,汇率都谈论了一遍,让人感觉很有道理的样子。最后还输出了一个网页,做了一些图表,还是很炫酷的,这个算是一个亮点。豆包的参考文档,几乎都是中文文档,有一半是来自今日头条的文章,所以输出这个结果,也是可以理解的。

最近Gemini真的越来越强了,iPhone也迎来了新的一轮换机潮,GOOG和AAPL的股东们要牢牢抓住,别被甩下车了。

四个报告的链接在这里:
Gemini:iPhone 17 销售情况研究方案
Grok:iPhone 17系列销售情况分析
ChatGPT:iPhone 17系列全球销量表现分析
豆包:iPhone 17 系列全球销售情况分析报告​