Mistral AI和NVIDIA發布Mistral NeMo 12 B

英偉達Mistral AI聯手，120億小型號之王登台，以4090分的成績碾壓Lama 3單板。

Mistral AI宣布發布Mistral NeMo，這是一個由英偉達聯合開發的12 B參數模型，具有高達128，000個代幣的上下文窗口。
該模型旨在支持企業應用程式，包括聊天機器人、多語言任務、編碼和摘要。在尺寸類別中，Mistral NeMo在推理、世界知識和代碼準確性方面處於領先地位。Mistral NeMo採用標準架構，易於使用，可直接替代任何Mistral 7 B系統。

為了鼓勵採用和進一步研究，Mistral AI根據Apache 2.0許可證提供了預訓練基礎知識和指令調優檢查點。這種開源方法可能會吸引研究人員和企業，加速模型在各種應用程式中的集成。

Mistral NeMo的一個關鍵功能是訓練過程中的量化意識，這使得在不影響性能的情況下實現FP 8推斷。對於想要高效部署大型語言模型的組織來說，這種功能可能至關重要。

Mistral AI提供了Mistral NeMo基礎模型與兩種最近的開源預訓練模型：Gemma 29 B和Llama 38 B之間的性能比較。

Mistral NeMo推出了Tekken，這是一種基於Tiktoken的新標記。Tekken經過100多種語言的訓練，與之前Mistral模型中使用的SentencePiece標記器相比，提供了更好的自然語言文本和原始碼壓縮效率。該公司報告稱，Tekken在壓縮原始碼和幾種主要語言方面的效率提高了約30%，其中韓語和阿拉伯語的效率提高得更為明顯。

Mistral AI還聲稱，Tekken在文本壓縮方面優於Llama 3標籤器，並且適用於大約85%的所有語言，這可能使Mistral NeMo在多語言應用中具有優勢。

該模型的權重現已在HuggingFace上提供，包括基礎版本和指令版本。開發人員可以開始使用Mistral推理工具嘗試Mistral NeMo，並通過Mistral-Finetune進行調整。對於使用Mistral平台的用戶，該模型以open-mistral-nemo的名稱提供。

為了紀念與英偉達的合作，Mistral NeMo還被打包為英偉達NIM推理微服務，並通過ai.nvidia.com提供該集成可以簡化已經投資英偉達AI生態系統的組織的部署。

Mistral NeMo的發布代表著先進人工智慧模型民主化的重要進展。通過結合高性能、多語言功能和開源可用性，Mistral AI和英偉達將該模型定位為廣泛應用於各個行業和研究領域的多功能工具。

如果您想了解更多信息，可以單擊視頻下方的連結。
感謝您觀看此視頻。如果您喜歡，請訂閱並點讚。謝謝

官方居間：https://mistral.ai/news/mistral-nemo

輸油管：