Amphion:是一个开源工具包,可实现语音、声音和歌唱功能。
除了文字转语音功能,它还能可以将一首歌的声音换成另一个歌手的声音。还支持声音转换、歌声合成、文本到音频、文本到音乐等功能!
除了文字转语音功能,它还能可以将一首歌的声音换成另一个歌手的声音。还支持声音转换、歌声合成、文本到音频、文本到音乐等功能!
MedLM 帮助 HCA Healthcare 等医疗系统自动记录急诊室就诊情况。
它获取医患会面的记录,并将其拆分成医疗服务提供者说明的组成部分。
日本农业初创公司AGRIST在拉斯维加斯举行的2023年消费电子展(CES)上发布了他们的智能型收获机器人”L” 。该机器人可以穿过分层的叶子,采摘辣椒。
这个模型统一了之前的三个Seamless系列模型,可以实时翻译100多种语言,延迟不到2秒钟,说话者仍在讲话时就开始翻译。