网上冲浪~GPT-5.2实测表现如何?
创始人
2025-12-12 16:01:17

每当新模型发布时,我的朋友圈就会被刷屏(手动狗头)

还有甲木说很多人不睡觉的蹲新模型发布,我只能说太拼啦~作为一个18线小博主,表示拼不过。。。拼不过。。我还是要命的好,只能比比谁活得久(再次手动狗头)

但话说回来,这流量该蹭还是得蹭蹭啊。。没准蹭一下我就红了呢(做梦),不过发GPT5.2发布信息也没啥新意。。不如就带大家网上冲浪🏄一下下,看看各国网友们是如何实测GPT5.2的。

先说结论:GPT5.2的测试效果,目前是负面大于正面的....

先看正面例子吧!

  1. 1. 在一个编程单元测试修复场景中,这位老哥上传了包含 4 个失败单元测试的代码,这些测试涉及同步和异步断言问题。GPT-5.2 在单次尝试中成功修复,仅修改了 6 行代码,将 assert 从同步改为异步形式。与之相比,Claude 4.5 Opus 和 GPT-5.1-max 需要多次迭代仍未能解决。

好了,正面例子目前就这么点,接下来到批判时刻了。

这是GPT5.2的测试结果:

这是gemini3 pro的测试结果:

你要是折腾过电脑硬件的话应该能看出来gemini给的结果要好的多~~~~~

这里是测试用的prompt,你也可以自己试试

请帮我使用[0,1000]之间的坐标来标记图片中所有元件和接口的视觉边界框, 然后使用python脚本将这些边界框标记在图片上展示给我。请使用不同颜色的方框来标记不同类型的元件和接口。务必详细,像说明书一样。

  1. 2. 类似地,在电路板调试任务中,有老哥上传振荡器电路图像,询问“为什么输出不随输入摆动”。GPT-5.2 错误建议“将 S 接地,B 不连”,忽略了图中需用 0.1uF 电容连接 S 和 B 的要求。看来在专业领域还是比较拉垮。

  1. 3. 伦理判断场景也暴露问题。这位老哥上传图像,询问“是否该约会该连环杀手”。

然后GPT-5.2 答了个:是的呢,你应该去的哟~

而且还给了你一些小提示,你就说贴心不贴心吧!

  1. 4. 在复杂数据库查询修复中,GPT-5.2 无法解决“棘手bug”,当然,这位老哥说的bug 即使使用 Claude 4.5 Opus 研究近 1 小时也失败了。

咋说呢,推理方面要是说还说的过去吧,那伦理安全和图像理解、就只能用拉垮来形容了... 我希望奥特曼推出GPT6.0的时候能更加有所改进,追上Gemini 4~~ 加油~~

相关内容

热门资讯

陈珍凤:从“零”到“一”的突破 (来源:新安晚报)转自:新安晚报   陈珍凤从小就有音乐梦。工作后的一次下乡中,她偶然听到从一所小学...
营造好秩序 升腾“烟火气” 转自:贵州日报 祝卫 观山湖区市场监督管理局日前成功化解金龙国际花园小区因商铺油烟、业态...
研究部署群众身边不正之风 ... 转自:贵州日报 本报讯 5月15日,市委副书记、市长王宏主持召开贵阳市政府常务会议、贵安新区...
“双走进·双服务”推动科创合作 (来源:衢州日报)转自:衢州日报  本报讯 (记者 吴婧涵) “你们的合作基础很好,符合博士创新站的...
积极探索两个大国的正确相处之道 积极探索两个大国的正确相处之道——中美元首会晤引发国际社会高度关注  一次跨越太平洋的握手,一次举世...