圖/newsbytesapp
Meta推出全新一代開放大型語言模型Meta Llama 3
發布日期:4/23/2024
新聞視界時報 記者 李翌淳 整理報導
Meta宣布推出全新一代開放大型語言模型Meta Llama 3,標榜為目前功能最強大的開放式大型語言模型。
初步釋出的版本包括8B參數和70B參數兩個版本,而更大參數規模的模型仍在訓練與驗證中,預計後續將釋出最大超過400B參數的版本。
這款全新的Llama 3模型具有多項產業指標紀錄,提供更精確的推論能力,同時支援多語言、多語態,並提供更長的上下文語境。
Meta承諾將Llama 3基於開放創新的精神提供給社群使用,並建立專屬內容。
平台支援與硬體配備
Llama 3模型預計將在多個平台上使用,包括AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM和Snowflake等。
同時,該模型將由AMD、AWS、Dell、Intel、NVIDIA和Qualcomm等硬體平台支援運作。
表現優勢與安全保障
相較於之前的版本,Llama 3的8B和70B參數模型有顯著的進步,具有更好的錯誤拒絕率、一致性和多樣性。
Meta著重於在真實情境中的體驗,並進行全新的人類評估,以確保模型的表現。
為了負責任地使用Llama 3,Meta強調將在部署模型時採取系統性方式,確保模型的安全性和可靠性。
他們不僅進行第三方公信力的基準評估,還限制內部模型建立團隊對模型的存取,並透過紅隊測試確保安全性。
負責任使用者南
Meta正在更新其負責任使用者南(RUG),提供全面性指南,以確保開發者負責任地使用大型語言模型。
他們將鼓勵開發者使用雲端服務供應商提供的內容檢核API與其他用於負責任部署的工具。
未來展望
Meta也釋出了400B參數模型的預覽版表現,雖然仍未達到最終階段,但已展現出相當驚人的結果,讓開發者對Llama 3的潛力有所期待。