【AI新聞】OpenAI 發布全新旗艦模型 ChatGPT-5性能全面提升,發表會與新功能彙整

08/09/2025

2025 年 8 月 7 日,美國加州舊金山 — OpenAI 今日宣布推出全新旗艦模型 ChatGPT-5(GPT-5),以智慧路由、一體化體驗與跨領域能力提升為核心,為生成式 AI 帶來顯著飛躍。新版本無須選擇任務或是問題模型, 並大幅降低錯誤率,整合於 Microsoft 與 Apple 生態系,被視為向通用人工智慧(AGI)邁進的重要一步。


核心亮點

  • 智慧路由系統(Real-time Router):
    首次引入自動分配技術,會依對話型態、問題複雜度、工具需求與使用者明確意圖(如「think hard about this」)即時決定採用 gpt-5-main 或 gpt-5-thinking,在速度與推理深度間自動取捨。路由以真實訊號(模型切換、偏好評分、測得正確率等)持續學習,越用越準;達到使用上限時亦由 mini 版本承接請求。

  • 性能躍升:
    在多個專業領域展現出博士級水準,特別是高階數學推導、程式開發與除錯、健康資訊分析以及專業與創意寫作上都有突破。根據官方實測,其答案精確度相較 GPT-4o 提升顯著,誤差率下降約 45%,相較 o3 模型更降低約 80%。在應對複雜多步驟推理、跨領域知識整合與長篇內容生成時,5.0 能大幅減少「幻覺」與邏輯漏洞,並提供結構化、具依據的回覆,讓輸出更符合專業需求與真實情境。

  • 應用深化:
    GPT-5應用已從單純的對話延伸至多元場景,涵蓋教育、科研、商業決策、醫療輔助、內容創作與程式開發等領域。在教育與科研中,它能精確解析複雜理論並生成清晰的學術內容;在商業應用中,可協助數據分析、策略規劃與市場預測;於醫療輔助上,能提供基於權威資料的健康資訊與病理推理;在創作領域,則能產出結構完整且具創意的文本、腳本或設計構想。

  • 個性化體驗:
    能根據使用者的語氣、偏好與互動歷史,動態調整回應風格與內容深度。它可記住長期的對話脈絡與特定需求,提供專屬化的知識建議與解決方案,無論是專業領域的技術討論,還是日常生活的交流,都能展現高度貼合的互動品質。此外,5.0 支援更細緻的角色設定與語氣控制,讓使用者能創造符合自身需求的 AI 助手體驗,實現真正的「專屬對話夥伴」。

  • 生態整合:
    能與多種應用程式、雲端服務及開發工具無縫連接,形成智慧化的工作與生活網絡。無論是協助資料分析、生成報告、優化工作流程,或與 IoT 裝置互動,5.0 都能在單一介面中完成多元任務,打造高度協同、即時反應的 AI 生態系統。此外微軟將 GPT-5 植入 Copilot,蘋果亦計劃將其引入 Apple Intelligence。


發表會上展示的應用

  • 進階程式碼生成與多步驟 UI 構建 
    發表會中,ChatGPT-5 在短時間內從一行描述生成了具有視覺與互動元素的前端網頁與法語學習遊戲。它展示了包括 HTML、CSS 與 JavaScript 的 UI 元件,並成功執行語音或音訊功能,完整實現一個 Drag-and-Drop 學習介面。此用途突顯其在程式開發與前端構建方面的強大 agent 能力。該片段可於 TechRadar 的直播報導中觀賞示範動態介面生成過程


  • 自然語音互動模式(ChatGPT Voice)
    發表會中特別展示了新版語音模式,「ChatGPT Voice」更加自然流暢,可用一字概括《傲慢與偏見》的主題(如回答 "relationships"),體現其語氣與語調控制能力。此功能由「Advanced Voice Mode」改名而來,Free 等級的用戶也可限量體驗。可參見 TechRadar 活動實況中對語音回應的即時演示。


  • Office 流程整合與工作效率提升
    在微軟整合示範中,GPT-5 強化版的 Copilot 可理解複雜文檔與對話內容,協助 Office 文件、電子郵件撰寫、 行程安排與數據分析。企業用戶可透過 Copilot Studio 建立自訂代理流程,處理更高階的業務規劃與任務執行。這提升了商業生產力並擴展 GPT-5 在實務環境的深度應用


  • 企業多步驟 Agent 任務自動化
    來自 GitHub、BBVA、Atlassian 等技術領導者提供實測反饋:GPT-5 在 refactor 大型代碼庫、管理多階段工作流程、生成反饋測試與 CI 更新等任務上表現傑出。部分企業表示,原需數週的任務經 GPT-5 幫助後縮短至數小時完成,展現出其 agentic 多步驟執行能力與高效可靠性

與先前版本(如 GPT-4、GPT-4o、o3、GPT-4.5)之比較


總體來說,GPT-5 是 OpenAI 技術演進的重大突破,其一次整合多項強化功能、提升使用體驗,並成為多平台 AI 應用的核心引擎。但不少網友對GPT-5的期待很高,但同時也有不少負面聲音和質疑。首先,有人認為GPT-5雖然提升了語言理解和生成的流暢度,但在事實準確性上依然存在很大問題,容易產生「幻覺」(hallucination),尤其在專業領域回答時仍不夠可靠。另一些人質疑,OpenAI在推廣GPT-5時過度強調其突破性,實際體驗卻沒有感受到明顯的差異或提升,讓人懷疑是否只是市場炒作。還有技術層面的聲音認為,雖然GPT-5模型規模更大,但硬體成本與能耗過高,這不符合永續發展的方向。總體來說,網友的負面評價集中在準確度不足、創新有限、偏見難解及高昂資源消耗等方面,期待未來版本能真正解決這些問題。