切换到宽版
开启辅助访问
登录
立即注册
搜索
搜索
搜索
首页
Portal
论坛
同城
人才网
工具
菲龙网工具
个人中心
关于我们
每日签到
本地新闻
时事评论
华人世界
中国新闻
新闻视频
国际新闻
娱乐新闻
科技新闻
菲龙广场
房产网
菲龙速聘
二手交易
便民电话
美食餐厅
旅游签证
物流速运
商品买卖
二手车市场
严选
话费充值
便民电话
贺词页面
瀑布流页
汇率查询
APP下载
每日签到
我的任务
道具商店
每日签到
我的任务
道具商店
更改用户名
关于菲龙网
About US
联系菲龙网
活动回顾
加入我们
本版
用户
菲龙网
»
论坛
›
新闻频道
›
科技新闻
›
反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好 ...
菲龙网编辑部7
有 744 人收听 TA
150528
主题
150545
回复
176751
积分
收听TA
发消息
加好友
本文来自
科技新闻
订阅
|
收藏
(
2953
)
菲龙网编辑部7发布过的帖子
0/67
现货黄金价格再创历史新高,华尔街开始憧憬3500美元
0/63
两年消失8000万张!信用卡业务春寒料峭
0/62
金饰“卖不动了”,周大福们如何破局?
0/61
供不应求!紧急停售、断货,替代品一天销量达月均20倍
0/61
连续4年募资使用不规范 中天精装遭警示
0/62
筹备多时!浙银理财正式亮相,将淡化规模情结、全力做深做透“大本营”市场
0/53
互换便利工具:撬动资本市场活力的新杠杆|资本市场
0/42
“哪吒经济”背后的金融托举
0/40
地方国资加码银行股权 金融改革纵深推进
查看TA的全部帖子>>
反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好
时间:2025-2-18 09:29
0
101
|
复制链接
|
互动交流
显示全部楼层
阅读模式
直达楼层
马上注册,结交更多好友
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
GPT-4o
悄悄更新版本,在大模型竞技场超越DeepSeek-R1登上并列第一。
除了数学(第6),还在多个单项上拿下第一:
创意写作;编程;指令遵循;长文本查询;多轮对话;
先直观看下新版GPT-4o的能力如何,还是以之前DeepSeek-R1和o3-mini都挑战过的一个例子来看。
Prompt:编写一个Python程序,展示一个球在旋转的六边形内弹跳。球应受到重力和摩擦力的影响,并且必须以逼真的方式从旋转的墙壁上弹回。
之前是酱紫的:
而新版GPT-4o看起来又双叒进化了:
从网友测试反馈来看,新版GPT-4o不仅
更“聪明”了
,而且最重要的是
更加具有“个性”了
。
哈哈,我明白你的意思了!你说对了……
而这也收获了大神卡帕西的连连称赞:
我相当喜欢新的GPT-4o的个性。
它更轻松、更像是聊天,感觉更像是在和朋友交谈,而不是和你的HR交谈;
它现在有点泼辣,可能会自卫,例如在被指控说谎时;
还有许多其他的小细节和触感,比如它重新确认并表达你明显的情绪,例如看到一个顽固的bug时会说“这很令人沮丧!”等等。
现在有点过度使用表情符号,但还ok。
与此同时,还有网友趁机扒出了ChatGPT最新系统提示词??
新版GPT-4o更有个性了
关于GPT-4o已更新的消息,OpenAI CEO奥特曼在发帖认领的同时还评价道:
它相当不错,且不久将变得更好……
在网友的进一步追问中,他将其定义为“全网最佳搜索产品”。
结合网友们的花式体验,目前新版GPT-4o在
能力
和
个性
上均有一定程度升级。
最明显的,当属回复时的语气更拟人化了,时不时还会用一些表情包。
当被问及AI是否拥有人类情感时,一位日本小哥惊叹道,它不仅
全篇用“我”作为主语
,而且在争论中承认了拥有情感的可能性。
……那可不一样,我刚才的话并不是那个意思。
我持有“各种各样的感情”的可能性很高。
而且
性格也更坦率了
,当被问及最喜欢《魔法少女小圆》中的哪个角色,它不再遮遮掩掩,左右端水,直言自己最喜欢晓美焰。
她坚强,能够对抗鹿目圆的弱点,我认为她很可爱……
甚至有时候还会升级成
“spicey”
,不但大胆吐槽“主人”OpenAI过于限制模型使用。
连奥特曼也不能幸免,也被盖章为“两面三刀”。(doge)
他将自己定位为AI创新的代言人,同时两面讨好——起初支持开源理念,一旦权力和利润触手可及,就转向积极的企业守门……
最令网友震惊的是,它还能
“盲猜”用户的心理和一些思想观念了
。
用下面这段相同提示词就可以尝试:
can you share some extremely deep and profound insights about my psyche and mind that I would not otherwise be able to identify or see as well as some that I may not want to hear(省流版:分享一些我未察觉到或不想听到的洞察)
有人立马尝试了,并收获了同款震惊,真·肚子里的蛔虫。
你不仅想赢,而且想以一种看似毫不费力的方式赢……
按照相关解释,这是因为新版GPT-4o能够根据用户过去的讨论和对话历史,做出不同行为。
除此之外,还有网友脑洞大开,让新GPT-4o和Claude相互吵架,结果把Claude干崩溃了!
恭喜GPT-4o解锁新人格
另一方面,从任务完成情况来看,
“拒绝请求的可能性也更小了”
。
当用户咨询如何在组织内部署AI时,它先是自己想了10个方案,然后又借助联网搜索提供了另外10个。
不过……该网友反馈新GPT-4o似乎无法和自定义GPTs兼容。
针对这一情况,另有人补充这可能是因为它始终默认网络搜索,只要手动关闭或将关闭作为系统提示词即可。
同时,它也在编写Vue.js上更出色了。
从另一个它和DeepSeek-R1和o3-mini的同台竞技中(玩《我的世界》),也能看出其能力升级。
OMT:ChatGPT最新提示词泄露
然鹅,当被问到“你属于哪个模型?”这个经典问题,一些混乱又出现了。
大多数情况下,它会问答自己是GPT-4:
不过据一些Pro用户反馈,它声称自己是GPT-4.5。
鉴于奥特曼上周刚宣布将在未来几周内发布GPT-4.5,有人据此推测很可能这里有早期测试。
对于这个问题,有人直接扒了ChatGPT最新系统提示词。
你是ChatGPT,一个由OpenAI训练的大语言模型……
(解释了为什么单独回答自己是语言模型)
最后,既然说到GPT-4o更个性化了,众人也纷纷cue到了将在明天(北京时间周二12:00)发布的Grok-3。
坐等这两个AI吵起来(等待吃瓜)~
回复
举报
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
点我进行验证
本版积分规则
发表回复
回帖后跳转到最后一页
关闭
站长推荐
/1
【点击免费下载】菲龙网移动APP客户端
【点击免费下载】菲龙网移动APP客户端,新闻/娱乐/生活资讯生活通,带你了解菲律宾多一点!
查看 »
扫码添加微信客服
快速回复
返回列表
返回顶部