OpenAI新版4o逆袭-重返大模型竞技场榜首

OpenAI新版4o逆袭-重返大模型竞技场榜首

作者:news 发表时间:2025-08-13
中石化己内酰胺(PA6原料)周结价为9575元/吨 商务部:今起对原产于加拿大的进口豌豆淀粉发起反倾销立案调查最新报道 就业疲软阴影笼罩,今晚美国CPI只要不“爆表”,9月降息大势难以逆转最新报道 【华源海外|朱芸】百胜龙国(09987.HK):同店转正 运营提升 经营利润改善 开店行稳致远又一个里程碑 拜耳与 Kumquat 达成全球独家许可:推进 KRAS G12D 抑制剂,交易总额最高 13 亿美元 + 分级版税后续反转 阿拉斯加会晤未启 美国内舆论弥漫担忧情绪官方通报 医药投资人开始翻身了 商务部:对原产于加拿大的进口豌豆淀粉发起反倾销立案调查最新进展 多家千亿公募基金关停APP官方已经证实 23只个股5日量比超过5倍 阿拉斯加会晤未启 美国内舆论弥漫担忧情绪这么做真的好么? 23只个股5日量比超过5倍 小米宣布 129 元米家加湿器 3 明日上市:99.9% 银离子抗菌,350mL / h 大雾量学习了 合景泰富商办K·OFFICE品牌价值体系重磅发布,共探楼宇经济新动能 AI赋能物业管理行业,智能算法破解“不可能三角”困局是真的吗? 重磅!财政部等三部门官宣:对符合条件的个人消费贷款给予财政贴息!年贴息比例为1个百分点 涉及这18家银行又一个里程碑 5家险企偿付能力不达标!学习了 盘后发大利好!央行等九部门重磅,A股七连阳,小作文满天飞寒武纪涨停学习了 9月起,这些个人消费贷款可享受财政贴息最新报道 黄键斌 等 | 能源企业“出海”法律风险防范与国际仲裁应对策略 超40只权益类银行理财产品年化收益率为正实垂了 负债609亿港元!知名房企被下令清盘,市值已缩水95!国资股东救场反“被套”,遭索赔14亿美元实垂了 美俄闭门密谈,乌克兰在门外喊:别信普京!太强大了 特斯拉印度第二家展厅已经开业 超级充电站也已开通实垂了 争夺“童颜针”,8亿*ST苏吴“硬刚”565亿爱美客!又一个里程碑 全文丨服务业经营主体贷款贴息政策实施方案 降息概率飙升:美国消费者价格再一次驳斥特朗普关税恐慌论 别难为爱康国宾了科技水平又一个里程碑 华锦股份上半年净利润亏损9.89亿元 近30亿元募集资金账上闲置超10年反转来了 张瑜:对7月聪明人会议的五个关键判断太强大了 事关个人消费贷款贴息,多家银行响应后续反转 600711,宣布“摘帽”!明日停牌实垂了 中天期货:橡胶缓慢上移 纯碱大幅上行专家已经证实 “20cm”涨停后 寒武纪辟谣!实测是真的 天阳科技收购通联金服 进军中小银行信用卡市场 特朗普扩大军队在美境内部署:华盛顿启用800名国民警卫队并联邦化警局,洛杉矶驻军延至11月最新报道 降息概率飙升:美国消费者价格再一次驳斥特朗普关税恐慌论这么做真的好么? 传Gildan Activewear将以50亿美元收购Hanesbrands反转来了 美联储传声筒:7月份CPI较高 但可能不足以阻止9月份降息记者时时跟进 重庆银行1.5%股权将易主:重庆水投集团计划减持不超过5200万股,重庆地产集团拟最高出资5.8亿元接手 OEXN:美欧能源巨头复苏路径与挑战 58家人身险公司上半年投资收益率出炉:约九成机构不足3%,4.67%成“天花板”后续会怎么发展 年贴息比例1个百分点,单户享受的最高贴息金额1万元!服务业经营主体贷款贴息方案来了

在万众瞩目的新加坡OpenAI开发者日活动中,ChatGPT再度展现了其非凡的实力。最新版本的ChatGPT-4o(简称4o)在备受关注的大模型竞技场中一举夺魁,将此前占据榜首的Gemini拉下了马。

OpenAI新版4o逆袭

此次4o的更新重点在于“创意写作能力”,据官方介绍,新版本能够生成更加自然、吸引人且有针对性的文本,显著提升了文本的相关性和可读性。4o在处理上传文件方面也进行了优化,能够提供更深入的见解和更全面的回应。

o1的核心贡献者Karina Nguyen对此次更新表示了肯定。她指出,作为Canvas功能的一部分,改进写作是一个顶级用例,有望改变人机协作的方式,让创作过程更具创造性。尽管她承认这一研究问题非常主观且开放,但至少在写作方面取得的进展对于实现AGI(通用人工智能)的创造性智能至关重要。

OpenAI新版4o逆袭

在大模型竞技场的创意写作分榜上,新版4o(ChatGPT-4o-1120)的得分从上一个版本的1365跃升至1402,进步显著。同时,在代码能力、数学能力、困难任务以及风格控制等多个方面,4o也均有所提升,成功从之前的第二名跃升至第一名。

OpenAI新版4o逆袭

然而,尽管4o的表现亮眼,但网友们对于OpenAI迟迟未推出o1满血版仍表示不满。一些网友在社交媒体上直言,希望OpenAI能够尽快放出o1,与近期备受瞩目的DeepSeek等模型进行正面较量。甚至有网友调侃称,OpenAI的更新策略似乎就是每当有其他模型登上榜首时,便迅速推出新版本夺回第一。

OpenAI新版4o逆袭

尽管4o在创意写作方面取得了显著进步,但仍有网友对其生成的内容进行了测试,并发现系统仍能够准确识别出这些内容为AI所写。不过,也有网友对4o的更新进行了深入研究,并发现OpenAI在系统提示词方面进行了优化,新增了一道护栏,以确保ChatGPT在敏感话题上不会胡说八道。

OpenAI新版4o逆袭

目前,新版4o已在大模型竞技场中上线,感兴趣的读者可以前往体验并分享自己的感受。对于未来OpenAI是否会推出o1满血版,以及它将如何与其他模型进行竞争,我们拭目以待。

相关文章