跳至內容

GPT-OSS

維基百科,自由的百科全書

GPT-OSS是一系列由OpenAI於2025年8月5日發布的開放權重推理模型。採用transformer架構混合專家模型、非監督式思維鏈及後訓練機制。OpenAI稱GPT-OSS在預訓練過程中過濾掉了與化學、生物、放射性和核 (CBRN) 相關的某些有害數據。[1][2]目前有兩個版本——大型1170億參數模型gpt-oss-120b,以及小型210億參數模型gpt-oss-20b。[3]兩者皆採用Apache2.0授權,允許商業及非商業使用。據OpenAI表示,其效能分別可與o4-mini和o3-mini 相當。[3]

參考資料

[編輯]
  1. ^ Introducing gpt-oss. openai.com. 2025-08-04 [2025-08-05] (美國英語). 
  2. ^ Heath, Alex. OpenAI releases a free GPT model that can run on your laptop. The Verge. 2025-08-05 [2025-08-05] (美國英語). 
  3. ^ 3.0 3.1 gpt-oss-120b & gpt-oss-20b Model Card. openai.com. 2025-08-05 [2025-08-05] (美國英語).