ChatMusician：能夠理解和生成音樂的大型語言模型

通過使用給定的文本提示、和弦序列、旋律線索、音樂主題或形式等條件。
ChatMusician可以自動生成結構完整、風格多樣的音樂作品。
包括單部分旋律、和聲編曲，甚至音樂的完整結構設計。
它還可以理解和分析音樂理論的各個方面。
通過對LLaMA 2的持續預訓練和微調，ChatMusician結合了文本兼容的音樂表示法（ABC符號），使模型能夠在處理語言文本時理解和生成音樂。
ABC符號是一種以文本字符表示音樂的方式，它將音符，節奏和其他音樂元素轉換為可以通過鍵盤輸入的字符。這種表示的優點是它允許像處理文本語言一樣處理音樂。簡單地說，它允許模型「閱讀」和「編寫」音樂，就像它處理英語或其他自然語言文本一樣。

主要功能：

1.音樂世代：ChatMusician可以根據文本提示、和弦序列、旋律線索、音樂主題或曲式等給定條件，自動生成結構完整、風格多樣的音樂作品。這包括單聲部旋律、和聲編曲，甚至音樂的完整結構設計。性能超過GPT-4基線。
2.音樂理解：這個模型不僅可以創作音樂，還可以理解和分析音樂理論的各個方面，例如和聲分析、旋律結構、音樂形式等，這使得ChatMusician在音樂教育和理論分析中發揮作用。在專門設計的大學級音樂理解基準MusicTheoryBench上，ChatMusician在零樣本設置下的表現優於LLaMA 2和GPT-3.5，展示了其在音樂理論理解方面的出色表現。
資源共享：該項目為研究和教育提供大規模的音樂語言語料庫、音樂理論平台、模型代碼和在線演示。

項目地址：https://shanghaicannon.github.io/ChatMusician/
論文：https://arxiv.org/abs/2402.16153

視頻：