OpenAI公司CEO奧特曼宣布,從12月6日(北京時(shí)間)起開(kāi)啟一場(chǎng)為期12天的12場(chǎng)OpenAI直播活動(dòng)。這是妥妥重新定義了發(fā)布會(huì),遙遙領(lǐng)先。
在第一場(chǎng)直播首秀中,ChatGPT Pro套餐與推理模o1系列亮相。
OpenAI推出了一款Ultra級(jí)別的服務(wù)套餐ChatGPT Pro。每月200美元的費(fèi)用在OpenAI當(dāng)前各產(chǎn)品中屬于最貴的一檔,該套餐提供OpenAI當(dāng)前所有模型及工具的服務(wù),其中就包括最強(qiáng)推理模型o1及o1系列不同版本。
9月份,o1模型就以預(yù)覽版的形式上線。此次發(fā)布后,用戶將逐步體驗(yàn)到完整版的o1模型。o1模型回答問(wèn)題時(shí)不是“脫口而出”,而是經(jīng)過(guò)一個(gè)類人類的思考過(guò)程,進(jìn)而提高答案的準(zhǔn)確性。
換言之,完整版的o1模型會(huì)更快、更強(qiáng)大、更準(zhǔn)確、更像人類,同時(shí)增加了上傳圖片等多模態(tài)輸入能力。相比預(yù)覽版,o1模型完整版“思維已經(jīng)被訓(xùn)練得更加簡(jiǎn)潔”,回答困難現(xiàn)實(shí)問(wèn)題時(shí),出現(xiàn)重大錯(cuò)誤的概率減少了34%。
產(chǎn)品演示環(huán)節(jié),完整版的o1模型在回答“列出2世紀(jì)羅馬皇帝的名字、任期和主要成就”時(shí)“思考”了14秒,而預(yù)覽版花了34秒,能力更差的GPT-4o回答問(wèn)題時(shí)會(huì)犯錯(cuò)。
o1模型的另一個(gè)重要更新在于支持圖片輸入,現(xiàn)在可以在詢問(wèn)模型“太空數(shù)據(jù)中心散熱問(wèn)題”時(shí),附上一張手繪的示意圖。OpenAI表示,計(jì)劃在未來(lái)幾個(gè)月里增加網(wǎng)頁(yè)瀏覽、文件上傳等功能的支持。
在數(shù)學(xué)、科學(xué)和編碼等具有挑戰(zhàn)性的機(jī)器學(xué)習(xí)(ML)基準(zhǔn)測(cè)試中,不同版本的o1模型有著差異化表現(xiàn)。回答數(shù)學(xué)、編程、博士級(jí)別科學(xué)問(wèn)題時(shí),o1模型(中間柱狀)的準(zhǔn)確率明顯高于o1預(yù)覽版(左側(cè)柱狀),ChatGPT Pro用戶專屬的o1 Pro模式(右側(cè)柱狀)表現(xiàn)優(yōu)于前兩者。
在發(fā)布會(huì)的最后環(huán)節(jié),奧爾特曼提到明天的演示會(huì)有“對(duì)開(kāi)發(fā)者很棒的東西”。
一起期待OpenAI第二次直播吧!