OpenAI發(fā)布o(jì)3與o4-mini:多模態(tài)推理的新紀(jì)元來臨!
時(shí)間:2025-04-20 18:17 來源:必應(yīng) 責(zé)任編輯:毛青青
原標(biāo)題:OpenAI發(fā)布o(jì)3與o4-mini:多模態(tài)推理的新紀(jì)元來臨!
2025年4月17日,全球矚目的人工智能先鋒,OpenAI,向世人推出了其最新的o系列多模態(tài)推理模型o3與o4-mini。這一重磅發(fā)布不僅在技術(shù)領(lǐng)域引發(fā)了重要的反響,也對(duì)人工智能的應(yīng)用場(chǎng)景產(chǎn)生了深遠(yuǎn)的影響。隨著這些模型在大規(guī)模強(qiáng)化學(xué)習(xí)與圖像思維鏈整合技術(shù)的助力下,多模態(tài)推理能力得以顯著增強(qiáng),工具應(yīng)用能力也隨之提升,推理成本也大幅降低。
在多模態(tài)推理這一領(lǐng)域,o3模型與其前身o1相比,定價(jià)降低了33%;而新推出的o4-mini則將成本壓至同類競(jìng)品Gemini 2.5 Pro與Claude 3.7 Sonnet的50%以下,呈現(xiàn)出良好的性價(jià)比。這一變革勢(shì)必將推動(dòng)AI的廣泛應(yīng)用,為諸如科研、編程等高價(jià)值場(chǎng)景提供更高的可靠性和效率。
—— 推理性能提升:Scaling Law的延續(xù)——
根據(jù)OpenAI發(fā)布的信息,兩款新模型在多個(gè)領(lǐng)域的表現(xiàn)較前者都有顯著的提升。例如,在通用知識(shí)測(cè)評(píng)GPQA-Diamond中,o3的正確率達(dá)到83.3%,而o1為78%;在數(shù)學(xué)測(cè)試AIME2025中的正確率則從79.2%提升至88.9%。在代碼能力方面,o3也表現(xiàn)不俗,其在SWE-Bench Verified測(cè)試集中的正確率為69.1%。多模態(tài)能力同樣驚艷,o3在MMMU測(cè)試集中的正確率為82.9%。此外,o3的重大錯(cuò)誤率相較上一代模型降低了20%,可用性得到了顯著提升。
o4-mini,雖小巧,卻在多模態(tài)推理和視覺特性上表現(xiàn)卓越,它的應(yīng)用已不再局限于STEM(科學(xué)、技術(shù)、工程、數(shù)學(xué))領(lǐng)域,能夠覆蓋更多的復(fù)雜場(chǎng)景,這為未來發(fā)展提供了極大可能。
這一系列進(jìn)步得益于OpenAI持續(xù)遵循Scaling Law的原則,即大規(guī)模計(jì)算投入所帶來的性能提升。隨著訓(xùn)練和推理階段計(jì)算量與思考時(shí)間的增加,模型表現(xiàn)也得到了質(zhì)的飛躍。特別是在圖像與推理的結(jié)合上,o系列模型首次將圖像處理與智能思維鏈結(jié)合,讓它們?cè)谕评磉^程中能實(shí)時(shí)操控如旋轉(zhuǎn)、縮放等操作,讓多模態(tài)交互的體驗(yàn)更為流暢。
—— 市場(chǎng)前景:應(yīng)用場(chǎng)景的持續(xù)擴(kuò)展——
在定價(jià)方面,OpenAI的o3與o4-mini展現(xiàn)了其在成本優(yōu)化上的優(yōu)勢(shì)。o3的輸入成本為10美元/百萬Token,輸出成本為40美元/百萬Token,相比o1的15美元/百萬Token與60美元/百萬Token,有著顯著的降低。o4-mini的輸入僅需1.1美元/百萬Token,輸出為4.4美元/百萬Token,這在當(dāng)今AI市場(chǎng)中使其極具競(jìng)爭(zhēng)力。與此同時(shí),o系列模型更強(qiáng)的多模態(tài)推理能力有望推動(dòng)應(yīng)用場(chǎng)景的進(jìn)一步拓展,從文本主導(dǎo)的應(yīng)用逐步發(fā)展到容錯(cuò)率較低的復(fù)雜場(chǎng)景,如工業(yè)應(yīng)用。
安全性也是OpenAI此次更新的重要一步。o3與o4-mini在安全性訓(xùn)練數(shù)據(jù)集的重構(gòu)下,加強(qiáng)了模型對(duì)生物威脅、惡意軟件生成等方面的防護(hù)能力。這表明,OpenAI在推理能力提升的同時(shí),也增強(qiáng)了模型的安全性,為更廣泛的應(yīng)用奠定了基礎(chǔ)。
—— 未來展望:多模態(tài)技術(shù)與強(qiáng)化學(xué)習(xí)的投資機(jī)遇——
OpenAI通過o3與o4-mini的推出,再次證明了強(qiáng)化學(xué)習(xí)與Scaling Law在AI模型中的持續(xù)適用性。隨著多模態(tài)能力的不斷增強(qiáng),行業(yè)內(nèi)的分化及多元化將更為明顯,原生多模態(tài)模式的到來,必將帶來全新的視野與機(jī)遇。通過對(duì)模型推理能力的提升,OpenAI開辟了科研、編程等高價(jià)值場(chǎng)景的全新應(yīng)用道路,同時(shí)也給投資者帶來了新的機(jī)遇。
在這一過程中,硬件需求的提高與中期AI算力板塊的投資潛力也是值得持續(xù)關(guān)注的。隨著每一次技術(shù)的飛躍,行業(yè)鏈條的各個(gè)環(huán)節(jié)都可能迎來新一輪的投資機(jī)會(huì)。OpenAI的o3與o4-mini不僅象征著AI技術(shù)的進(jìn)步,更是未來市場(chǎng)可能發(fā)生的一系列改變的縮影。
總之,OpenAI的新一代多模態(tài)推理模型o3與o4-mini的上市不僅帶來了技術(shù)的突破,也為各行各業(yè)的智能化轉(zhuǎn)型指明了方向。AI的未來,是多模態(tài)融合的未來,提升推理能力將給整個(gè)行業(yè)注入新的活力。
投稿郵箱:chuanbeiol@163.com 詳情請(qǐng)?jiān)L問川北在線:http://m.fishbao.com.cn/