ChatGPT 被逼急了，连夜上线 o3-mini，并且还免费......

也许是迫于 DeepSeek 的压力，open ai 的负责人萨姆·奥尔特曼，连发多个 Twitter（现在是 X）推出了新的模型 o3-mini，并且包含三个版本：low、medium 和 high，分别针对不同的性能和资源需求优化。

也许是迫于 DeepSeek 的压力，open ai 的负责人萨姆·奥尔特曼，连发多个 Twitter（现在是 X）推出了新的模型 o3-mini，并且包含三个版本：low、medium 和 high，分别针对不同的性能和资源需求优化。
Image description
图片

现在，只要大家打开 chatgpt 的官网，就可以看到大大的 o3-mini 的宣传海报：
Image description
图片

图片

虽然 o3-mini 的具体性能还没有经过广泛的实战验证，但是一些第三方的初步评测已经流出。

尤其是发布几个小时后，加州大学的一位 AI 博士就对包括 o3-mini 在内的多款大语言模型进行了测试，评测指标包括 Accuracy（准确率）和 Calibration Error（校准误差）
Image description
图片

根据评测结果可以看到，在他的评测中 o3-mini (high) 模型的准确率为 13.0% 为全场最高。（PS：不过最高才 13% 是不是有点过于低了？）

这个结果一出来，open ai 的负责人萨姆·奥尔特曼就立刻转发了该 Twitter，并带上了一个 Sunday 没有太看懂的话：“我们很快就需要再做另一场测试了……”。Sunday 猜测或许是 “很快还会推出新的模型？所以需要再做新的测试？”
Image description
图片

不过，无论如何。DeepSeek 的爆火和 o3-mini 的快速跟进，都表示大语言模型的竞争已经进入了一个全新的阶段。

Sunday 认为，这对于我们开发者而言，绝对是有益的！因为这将代表着独立开发者、个人公司、超级个体将会拥有更多强大的工具和资源！