Amphion:是一个开源工具包,可实现语音、声音和歌唱功能。
除了文字转语音功能,它还能可以将一首歌的声音换成另一个歌手的声音。还支持声音转换、歌声合成、文本到音频、文本到音乐等功能!
除了文字转语音功能,它还能可以将一首歌的声音换成另一个歌手的声音。还支持声音转换、歌声合成、文本到音频、文本到音乐等功能!
苹果12月14日释放了一个名为Ferret的多模态大语言模型,该模型不仅可以准确识别图像并描述其内容。
同时它还能够识别和定位图像中的各种元素,无论你用怎样的方式描述图像内容,Ferret都能准确地在图像中找到并识别出来。
此外,来自 Google、ChatGPT、Gemini、Dictionary、Lightricks、Anthropic、Chevrolet、GPT-Engineer 在 AI 方面取得了巨大进展。