GPT-5發布:API調用超20億次/分鐘、性能超Claude
作者|竹心 來源|第一新聲(ID:thefirstnewvoice)
北京時間 8 月 8 日凌晨 1 點,Open AI 準時舉行備受矚目的發布會,正式推出 GPT-5。
此次發布會通過線上直播形式進行,OpenAI 首席執行官Sam Altman親自登臺,向全球觀眾介紹這一全新人工智能模型的卓越特性與顯著升級。
發布會流程上,先是Altman回顧 OpenAI 過往發展及 AI 領域變革,隨后詳細展示 GPT-5 在多方面的升級,并通過多個生動演示呈現其強大功能,最后設置問答環節,解答媒體與觀眾疑問。
亮點一:API調用量每分鐘超20億次
根據OpenAI CEO Sam Altman 的介紹:GPT-5 目前已向 20% 的付費用戶開放,并且其 API 端的調用量已超過每分鐘 20 億次(TPM)。

亮點二:推理能力進入到“人類專家級”
GPT-5 推理能力有質的飛躍,內測階段測試顯示,面對復雜邏輯推理題,它的正確率超人類平均水平。
面對博士水平的科學問題,GPT-5 表現卓越,準確率高達 89.4%。比如解答邏輯推理問題時,它能迅速梳理復雜條件,給出準確且條理清晰的答案,推理過程詳細且合理,在處理復雜問題上遠超同類模型。
Altman認為GPT-5是“世界上最好的編程和寫作大模型”(“the best model in the world at coding and writing)。

亮點三:減少幻覺與錯誤信息
“幻覺” 問題一直困擾大語言模型,GPT-5 在這方面有重大改進。與前一代模型 GPT-4 相比,GPT-5 在減少幻覺方面取得了飛躍式的進步。官方數據顯示,相較于 GPT-4,GPT-5 在事實性錯誤方面減少了 45%,在開放事實上的幻覺降低了 6 倍之多,而在缺失數據上的欺騙性回答更是減少了 80%。這一系列數據直觀地展現出 GPT-5 在可靠性上的巨大提升。

亮點四:性能超過Claude
在軟件開發領域的重要評估 ——SWE-bench Verified 基準測試中,OpenAI 的 GPT-5 展現出了卓越的實力。首次嘗試,GPT-5 便在這一嚴格的基準測試里斬獲了 74.9% 的得分,這一成績使其成功超越了 Anthropic 公司的 Claude,在解決實際軟件問題能力的評估中占據了領先地位。

亮點五:價格親民
OpenAI 為 GPT-5 構建了一套更為多元化且親民的價格體系。在 API 定價方面,推出了標準、mini 和 nano 三種版本。
其中,標準版本的 GPT-5 輸入價格為每百萬 token 1.25 美元,輸出價格為每百萬 token 10 美元;而 GPT-5 mini 的輸入價格降至每百萬 token 0.25 美元,輸出價格為每百萬 token 2 美元;GPT-5 nano 的價格則更加低廉,輸入價格為每百萬 token 0.05 美元,輸出價格為每百萬 token 0.4 美元。
這種分層定價模式,充分考慮了不同用戶群體的需求和預算。對于個人開發者、小型企業或對 AI 使用頻率較低的用戶來說,GPT-5 mini 和 nano 版本以較低的成本門檻,讓他們也能夠輕松接入強大的 AI 能力,嘗試將其應用于自身的業務場景或項目開發中。

編者按:本文轉載自微信公眾號:第一新聲(ID:thefirstnewvoice),作者:竹心

前瞻經濟學人
專注于中國各行業市場分析、未來發展趨勢等。掃一掃立即關注。

























