公众号手机端

一上线就翻车 OpenAI到底咋了

zhiyongz 2周前 (11-02) 阅读数 #人工智能
文章标签 OpenAI

OpenAI 的故事告诉我们,不要内斗,不要打架。
2024 年都快结束了, OpenAI 的 AI 搜索终于在昨晚姗姗来迟。
背后是基于 GPT-4o 模型的一个微调版本。现在充值用户,还有部分内测到的免费用户,已经可以抢先用上了。
隔壁江江这波被内测到了,大家现在也可以点开看看,自己剽到了没。有搜索功能的账号的输入框前面,会多出一个圆球的 Search 标志。
一上线就翻车 OpenAI到底咋了
一上线就翻车 OpenAI到底咋了
这玩意一上线,奥特曼这边乐观得不行:
铁子们,俺最喜欢的功能闪亮登场了,过去几周我天天用。
一上线就翻车 OpenAI到底咋了
一上线就翻车 OpenAI到底咋了
尽管他很兴奋,但大家好像这次不太买这个 AI 巨头的账了。
汽车撞墙你知道拐了,大鼻涕流嘴里你想起来甩了。别人 AI 搜索都迭代 800回,你 OpenAI 知道要来劲了。
而且,这回急了忙慌上线,很多人猜是又是为了压谷歌的热度。因为几乎前后脚,隔壁谷歌给Gemini API新增了一个“搜索锚定”的功能。大致能力就是减少幻觉,获取消息更及时,然后回答更有深度。
一上线就翻车 OpenAI到底咋了
一上线就翻车 OpenAI到底咋了
但它更新了啥不重要,重要的是 OepnAI 一搅局,已经没人关心谷歌到底干了啥。
与此同时, OpenAI 还偷偷更新了一个 Chrome 插件。安装之后,咱们在浏览器的 URL 栏里问问题,就会直接跳转到 ChatGPT 里搜索了。
撬流量撬到人家里来了。谷歌:你礼貌吗?
一上线就翻车 OpenAI到底咋了
一上线就翻车 OpenAI到底咋了
不过,世超观察了一下大家反应,意外地发现,很多人上手后的第一感觉,却是OpenAI这玩意蠢得让人发笑。
在网上随便翻一翻,就能找到各种它被免费的 AI 搜索工具吊打的吐槽。。。
一上线就翻车 OpenAI到底咋了
一上线就翻车 OpenAI到底咋了
那么财力雄厚,坐拥各家 AI 网站会员的世超,就带大家看看 OpenAI 的乐子,啊不是,水平。我还顺便找了 kimi 和 perplexity 两个免费选手,跟它简单比划一下。
这回 OpenAI 官方说自己能搜天气、新闻还有股价这些。
我就试着搜了一下杭州天气,结果 ChatGPT 显示得确实挺精准的。而且,做了小组件,小表格一拉,看起来比隔壁 kimi 直观得多。
左:ChatGPT 右:Kimi
一上线就翻车 OpenAI到底咋了
一上线就翻车 OpenAI到底咋了
在直观和方便上,ChatGPT 做的还可以。
和 Kimi 一样, ChatGPT 也会把句子的相关来源标注出来,并以侧边栏的形式,显示在右侧。鼠标移动到引用的位置,还会自动弹出出来源的方框。
一上线就翻车 OpenAI到底咋了
一上线就翻车 OpenAI到底咋了
看到这,你可能觉得那 OpenAI 这玩意不错啊,那大伙骂什么呢?
别急,咱们继续。世超我接着问它了一些有点时效性的问题:果子这周发了什么产品。
这回 ChatGPT 没一个讲的是对的,给我的每个产品都是去年发布的。哪怕去果子官网随手抓一把,都不至于全错吧。
一上线就翻车 OpenAI到底咋了
一上线就翻车 OpenAI到底咋了
点开它给的原文链接,文章标题下面大大地写着“ 2023 年 10月 30日。”
一上线就翻车 OpenAI到底咋了
一上线就翻车 OpenAI到底咋了
而之所以它会错误的抓取,世超猜了一下,估计是因为页面底下有最新消息的相关推荐,导致 AI 错误抓取了。
一上线就翻车 OpenAI到底咋了
一上线就翻车 OpenAI到底咋了
但这件事其实没那么难解决,像 Kimi 这边答得就挺精准的,最新的 iMac 和 Mac mini 都提到了。
虽然也有小瑕疵,它给出第二个结果 iPad Pro 是今年 5 月份发布的。但在 OpenAI 的衬托下,显得格外机灵,格外聪明。
一上线就翻车 OpenAI到底咋了
一上线就翻车 OpenAI到底咋了
抓取时间不准还算好的,有些时候,它的回答和关联的网站是错位的。
让它找点科技新闻看看,但点进给出的原文链接,发现给的链接里根本没有它引用的信息。。。
一上线就翻车 OpenAI到底咋了
一上线就翻车 OpenAI到底咋了
问到一些比较抽象问题,比如:中国现在万圣节活动和国外有啥不一样。
Kimi 能精准报出本不该和万圣节这三个字联系在一起的名字,比如安陵容,观音菩萨。ChatGPT 给的答案,就完全没 get 到我的用意。
左:ChatGPT 右:Kimi
一上线就翻车 OpenAI到底咋了
一上线就翻车 OpenAI到底咋了
当然了, ChatGPT 并不是没有赢过。比如中国万圣节这个问题,后面我又问了一遍, ChatGPT 就可以给出正确的答案。
而且有时候,它的抓取比 Kimi 精准。像:差评君有哪些有意思的梗。
ChatGPT 就能说出 925 (虽然解释错了)、 Debug the world,还报出了世超的大名,但 Kimi 则就说对了个 slogan 。
左:ChatGPT 右:Kimi
一上线就翻车 OpenAI到底咋了
一上线就翻车 OpenAI到底咋了
而且,反复测试中,世超发现 ChaGPT 英文搜索结果会比中文搜索更全面一点。但跟免费 AI 搜索鼻祖 Perplexity 对比的时候,还是会觉得差点意思。
比如同样问一个冷门的概念“业余无线电”,对于定义的解释上, Perplexity 形容它是“一项爱好和志愿公共服务,个人用专门的非商业用途的无线电进行交流。”
但是, ChatGPT 却只说这是一种把人、电子设备还有通信结合在一起的流行爱好和服务。也没错,但就是解释的不够好理解。
左:ChatGPT 右:Perplexity
一上线就翻车 OpenAI到底咋了
一上线就翻车 OpenAI到底咋了
几轮测试看下来, ChatGPT 虽然偶尔会出现幻觉和引用问题,但基本上能算一个合格的 AI 搜索工具。
它只是比较无聊。如果再早几个月发,可能还有点嚼头。现在掏出来,实在食之无味了。更别说有些人放出的什么“杀死谷歌”的屁话。
如果非要说有啥有意思的,不如看看奥特曼这次随机抖落的其他消息。比如 OpenAI 今年估计又要发新版本模型了,而且也不叫 GPT-5 。这题我已经会抢答了,赌 5 毛叫 GPT-4 abcd 之类的。
一上线就翻车 OpenAI到底咋了
一上线就翻车 OpenAI到底咋了
除此之外呢,高管们也在网上跟小报记者一样,四处公布新动向。目前收集到的消息来看, OpenAI 一边宫斗的同时,一边在捣鼓它的音乐、图像和 3D 模型生成模型,而且估计很快就能见到。但到底啥时候愿意发,具体没说。
估计得等谷歌放点东西出来,它才会火急火燎地跑出来截胡(不是)。不过,说实话吧,这几个领域就和这次的 AI 搜索一样,现在公开可用到的模型和应用都在疯狂迭代了。说视频生成,几个人还会提到 Sora 的名号呢。
这次的AI搜索,也是平平无奇到我都差点水写不出一整篇的量来。在如此纸带的情况下, OpenAI 要不端点狠活出来,大家以后就真不关心你了。
一上线就翻车 OpenAI到底咋了
一上线就翻车 OpenAI到底咋了

版权声明

本站所有文章来源于本站原创或网络,如有侵权请联系删除。文章观点并不代表本站观点,请网友自行判断,如涉及投资、理财请谨慎应对!

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门