法國人工智慧初創公司Mistral AI也加入了競爭。
剛剛,Mistral AI宣布了下一代旗艦開源模型:Mistral Large 2,該模型擁有1230億個參數,在代碼生成、數學、推理等方面與OpenAI和Meta的最新前沿模型不相上下。
繼Lama 3.1 405 B之後,Mistral Large 2的發布突然讓開源模型的賽道變得活躍起來,而這個模型的特點是「足夠大。"
具體來看,雖然Mistral Large 2參數數量低於Llama 3. 1的4050億,但兩者的表現卻相差無幾。在多個基準測試中,它也與GPT-4 o和Anthropic的Claude 3.5 Sonnet相當。
2月,Mistral AI推出了其最初的Large模型,其上下文窗口包含32,000個代幣。新模型建立在此基礎上,具有更大的128,000個上下文窗口(大約相當於一本300頁的書)-與OpenAI的GPT-4 o和GPT-4 o mini以及Meta的Llama 3.1相匹配。
目前,Mistral Large 2支持數十種語言,包括法語、德語、西班牙語、義大利語、葡萄牙語、阿拉伯語、印地語、俄語、中文、日語和韓語,以及80多種程式語言,包括Python、Java、C、C++、JavaScript和Bash。
Mistral AI指出,新模式將繼續突破成本效率、速度和性能的界限,同時為用戶提供包括高級功能調用和檢索在內的新功能,以構建高性能人工智慧應用程式。
評價結果:
性能/成本:Mistral Large 2在性能和成本之間的權衡方面設定了新標準。在MMLU(多任務語言理解)評估中,預訓練版本的準確率達到了84.0%,在開源模型中處於性能/成本前沿。
代碼和推理能力
代碼生成基準:Mistral Large 2在代碼生成基準方面表現出色,與GPT-4 o、Claude 3 Opus和Llama 3 405 B等領先型號相當。
推理能力:模型的推理能力顯著提高。通過精心微調,減少產生不準確或不相關信息的「錯覺」現象。該模型在數學基準測試中的表現證明了其增強的推理和解決問題的能力。
如果您想了解更多信息,可以單擊視頻下方的連結。
感謝您觀看此視頻。如果您喜歡,請訂閱並點讚。謝謝
詳情:https://mistral.ai/news/mistral-large-2407/
型號下載:https://huggingface.co/mistralai/Mistral-Large-Instruct-2407
輸油管: