一上线就翻车 OpenAI到底咋了
OpenAI 的故事告诉我们,不要内斗,不要打架。
2024 年都快结束了, OpenAI 的 AI 搜索终于在昨晚姗姗来迟。
背后是基于 GPT-4o 模型的一个微调版本。现在充值用户,还有部分内测到的免费用户,已经可以抢先用上了。
隔壁江江这波被内测到了,大家现在也可以点开看看,自己剽到了没。有搜索功能的账号的输入框前面,会多出一个圆球的 Search 标志。

一上线就翻车 OpenAI到底咋了
这玩意一上线,奥特曼这边乐观得不行:
铁子们,俺最喜欢的功能闪亮登场了,过去几周我天天用。

一上线就翻车 OpenAI到底咋了
尽管他很兴奋,但大家好像这次不太买这个 AI 巨头的账了。
汽车撞墙你知道拐了,大鼻涕流嘴里你想起来甩了。别人 AI 搜索都迭代 800回,你 OpenAI 知道要来劲了。
而且,这回急了忙慌上线,很多人猜是又是为了压谷歌的热度。因为几乎前后脚,隔壁谷歌给Gemini API新增了一个“搜索锚定”的功能。大致能力就是减少幻觉,获取消息更及时,然后回答更有深度。

一上线就翻车 OpenAI到底咋了
但它更新了啥不重要,重要的是 OepnAI 一搅局,已经没人关心谷歌到底干了啥。
与此同时, OpenAI 还偷偷更新了一个 Chrome 插件。安装之后,咱们在浏览器的 URL 栏里问问题,就会直接跳转到 ChatGPT 里搜索了。
撬流量撬到人家里来了。谷歌:你礼貌吗?

一上线就翻车 OpenAI到底咋了
不过,世超观察了一下大家反应,意外地发现,很多人上手后的第一感觉,却是OpenAI这玩意蠢得让人发笑。
在网上随便翻一翻,就能找到各种它被免费的 AI 搜索工具吊打的吐槽。。。

一上线就翻车 OpenAI到底咋了
那么财力雄厚,坐拥各家 AI 网站会员的世超,就带大家看看 OpenAI 的乐子,啊不是,水平。我还顺便找了 kimi 和 perplexity 两个免费选手,跟它简单比划一下。
这回 OpenAI 官方说自己能搜天气、新闻还有股价这些。
我就试着搜了一下杭州天气,结果 ChatGPT 显示得确实挺精准的。而且,做了小组件,小表格一拉,看起来比隔壁 kimi 直观得多。
左:ChatGPT 右:Kimi

一上线就翻车 OpenAI到底咋了
在直观和方便上,ChatGPT 做的还可以。
和 Kimi 一样, ChatGPT 也会把句子的相关来源标注出来,并以侧边栏的形式,显示在右侧。鼠标移动到引用的位置,还会自动弹出出来源的方框。

一上线就翻车 OpenAI到底咋了
看到这,你可能觉得那 OpenAI 这玩意不错啊,那大伙骂什么呢?
别急,咱们继续。世超我接着问它了一些有点时效性的问题:果子这周发了什么产品。
这回 ChatGPT 没一个讲的是对的,给我的每个产品都是去年发布的。哪怕去果子官网随手抓一把,都不至于全错吧。

一上线就翻车 OpenAI到底咋了
点开它给的原文链接,文章标题下面大大地写着“ 2023 年 10月 30日。”

一上线就翻车 OpenAI到底咋了
而之所以它会错误的抓取,世超猜了一下,估计是因为页面底下有最新消息的相关推荐,导致 AI 错误抓取了。

一上线就翻车 OpenAI到底咋了
但这件事其实没那么难解决,像 Kimi 这边答得就挺精准的,最新的 iMac 和 Mac mini 都提到了。
虽然也有小瑕疵,它给出第二个结果 iPad Pro 是今年 5 月份发布的。但在 OpenAI 的衬托下,显得格外机灵,格外聪明。

一上线就翻车 OpenAI到底咋了
抓取时间不准还算好的,有些时候,它的回答和关联的网站是错位的。
让它找点科技新闻看看,但点进给出的原文链接,发现给的链接里根本没有它引用的信息。。。

一上线就翻车 OpenAI到底咋了
问到一些比较抽象问题,比如:中国现在万圣节活动和国外有啥不一样。
Kimi 能精准报出本不该和万圣节这三个字联系在一起的名字,比如安陵容,观音菩萨。ChatGPT 给的答案,就完全没 get 到我的用意。
左:ChatGPT 右:Kimi

一上线就翻车 OpenAI到底咋了
当然了, ChatGPT 并不是没有赢过。比如中国万圣节这个问题,后面我又问了一遍, ChatGPT 就可以给出正确的答案。
而且有时候,它的抓取比 Kimi 精准。像:差评君有哪些有意思的梗。
ChatGPT 就能说出 925 (虽然解释错了)、 Debug the world,还报出了世超的大名,但 Kimi 则就说对了个 slogan 。
左:ChatGPT 右:Kimi

一上线就翻车 OpenAI到底咋了
而且,反复测试中,世超发现 ChaGPT 英文搜索结果会比中文搜索更全面一点。但跟免费 AI 搜索鼻祖 Perplexity 对比的时候,还是会觉得差点意思。
比如同样问一个冷门的概念“业余无线电”,对于定义的解释上, Perplexity 形容它是“一项爱好和志愿公共服务,个人用专门的非商业用途的无线电进行交流。”
但是, ChatGPT 却只说这是一种把人、电子设备还有通信结合在一起的流行爱好和服务。也没错,但就是解释的不够好理解。
左:ChatGPT 右:Perplexity

一上线就翻车 OpenAI到底咋了
几轮测试看下来, ChatGPT 虽然偶尔会出现幻觉和引用问题,但基本上能算一个合格的 AI 搜索工具。
它只是比较无聊。如果再早几个月发,可能还有点嚼头。现在掏出来,实在食之无味了。更别说有些人放出的什么“杀死谷歌”的屁话。
如果非要说有啥有意思的,不如看看奥特曼这次随机抖落的其他消息。比如 OpenAI 今年估计又要发新版本模型了,而且也不叫 GPT-5 。这题我已经会抢答了,赌 5 毛叫 GPT-4 abcd 之类的。

一上线就翻车 OpenAI到底咋了
除此之外呢,高管们也在网上跟小报记者一样,四处公布新动向。目前收集到的消息来看, OpenAI 一边宫斗的同时,一边在捣鼓它的音乐、图像和 3D 模型生成模型,而且估计很快就能见到。但到底啥时候愿意发,具体没说。
估计得等谷歌放点东西出来,它才会火急火燎地跑出来截胡(不是)。不过,说实话吧,这几个领域就和这次的 AI 搜索一样,现在公开可用到的模型和应用都在疯狂迭代了。说视频生成,几个人还会提到 Sora 的名号呢。
这次的AI搜索,也是平平无奇到我都差点水写不出一整篇的量来。在如此纸带的情况下, OpenAI 要不端点狠活出来,大家以后就真不关心你了。

一上线就翻车 OpenAI到底咋了
版权声明
本站所有文章来源于本站原创或网络,如有侵权请联系删除。文章观点并不代表本站观点,请网友自行判断,如涉及投资、理财请谨慎应对!
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。