开源项目

斯坦福大学开发出一个几乎不会产生幻觉的模型:WikiChat

高度准确:因为它直接依赖于维基百科这个权威且更新频繁的信息源,所以WikiChat在提供事实和数据时非常准确。
减少“幻觉”:LLM在谈论最新事件或不太流行的话题时容易产生错误信息。WikiChat通过结合维基百科数据,减少了这种信息幻觉的发生。
对话性强:尽管重视准确性,WikiChat仍然能够维持流畅、自然的对话风格。
适应性强:它可以适应各种类型的查询和对话场景。
高效性能:通过优化,WikiChat在回答问题时更快速,同时减少了运行成本

M2UGen:多模态音乐理解和生成模型

M2UGen能够理解各种音乐,包括风格、演奏乐器、表达的情绪情感等,并进行音乐问答。
而且还能根据文本、图像、视频和音频生成各种音乐,同时对生成的音乐也能理解并根据文字描述对音乐进行编辑。

苹果发布了一个多模态大模型

苹果12月14日释放了一个名为Ferret的多模态大语言模型,该模型不仅可以准确识别图像并描述其内容。

同时它还能够识别和定位图像中的各种元素,无论你用怎样的方式描述图像内容,Ferret都能准确地在图像中找到并识别出来。