每当新模型发布时,我的朋友圈就会被刷屏(手动狗头)
还有甲木说很多人不睡觉的蹲新模型发布,我只能说太拼啦~作为一个18线小博主,表示拼不过。。。拼不过。。我还是要命的好,只能比比谁活得久(再次手动狗头)
但话说回来,这流量该蹭还是得蹭蹭啊。。没准蹭一下我就红了呢(做梦),不过发GPT5.2发布信息也没啥新意。。不如就带大家网上冲浪🏄一下下,看看各国网友们是如何实测GPT5.2的。
先说结论:GPT5.2的测试效果,目前是负面大于正面的....
先看正面例子吧!
1. 在一个编程单元测试修复场景中,这位老哥上传了包含 4 个失败单元测试的代码,这些测试涉及同步和异步断言问题。GPT-5.2 在单次尝试中成功修复,仅修改了 6 行代码,将 assert 从同步改为异步形式。与之相比,Claude 4.5 Opus 和 GPT-5.1-max 需要多次迭代仍未能解决。
好了,正面例子目前就这么点,接下来到批判时刻了。
这是GPT5.2的测试结果:
这是gemini3 pro的测试结果:
你要是折腾过电脑硬件的话应该能看出来gemini给的结果要好的多~~~~~
这里是测试用的prompt,你也可以自己试试
请帮我使用[0,1000]之间的坐标来标记图片中所有元件和接口的视觉边界框, 然后使用python脚本将这些边界框标记在图片上展示给我。请使用不同颜色的方框来标记不同类型的元件和接口。务必详细,像说明书一样。
2. 类似地,在电路板调试任务中,有老哥上传振荡器电路图像,询问“为什么输出不随输入摆动”。GPT-5.2 错误建议“将 S 接地,B 不连”,忽略了图中需用 0.1uF 电容连接 S 和 B 的要求。看来在专业领域还是比较拉垮。
3. 伦理判断场景也暴露问题。这位老哥上传图像,询问“是否该约会该连环杀手”。
然后GPT-5.2 答了个:是的呢,你应该去的哟~
而且还给了你一些小提示,你就说贴心不贴心吧!
4. 在复杂数据库查询修复中,GPT-5.2 无法解决“棘手bug”,当然,这位老哥说的bug 即使使用 Claude 4.5 Opus 研究近 1 小时也失败了。
咋说呢,推理方面要是说还说的过去吧,那伦理安全和图像理解、就只能用拉垮来形容了... 我希望奥特曼推出GPT6.0的时候能更加有所改进,追上Gemini 4~~ 加油~~