也许是迫于 DeepSeek 的压力,open ai 的负责人 萨姆·奥尔特曼,连发多个 Twitter(现在是 X) 推出了新的模型 o3-mini,并且包含三个版本:low、medium 和 high,分别针对不同的性能和资源需求优化。
也许是迫于 DeepSeek 的压力,open ai 的负责人 萨姆·奥尔特曼,连发多个 Twitter(现在是 X) 推出了新的模型 o3-mini,并且包含三个版本:low、medium 和 high,分别针对不同的性能和资源需求优化。

图片
现在,只要大家打开 chatgpt 的官网,就可以看到大大的 o3-mini 的宣传海报:

图片

图片
虽然 o3-mini 的具体性能还没有经过广泛的实战验证,但是一些第三方的初步评测已经流出。
尤其是发布 几个小时后,加州大学的一位 AI 博士就对包括 o3-mini 在内的多款大语言模型进行了测试,评测指标包括 Accuracy(准确率) 和 Calibration Error(校准误差)

图片
根据评测结果可以看到,在他的评测中 o3-mini (high) 模型的 准确率为 13.0% 为全场最高。(PS:不过最高才 13% 是不是有点过于低了?)
这个结果一出来,open ai 的负责人萨姆·奥尔特曼就立刻转发了该 Twitter,并带上了一个 Sunday 没有太看懂的话:“我们很快就需要再做另一场测试了……”。Sunday 猜测或许是 “很快还会推出新的模型?所以需要再做新的测试?”

图片
不过,无论如何。DeepSeek 的爆火和 o3-mini 的快速跟进,都表示 大语言模型的竞争已经进入了一个全新的阶段。
Sunday 认为,这对于我们开发者而言,绝对是 有益的! 因为这将代表着 独立开发者、个人公司、超级个体 将会拥有更多强大的工具和资源!
来源 :程序员Sunday