多媒体处理

AI行业应用, 多媒体处理

ElevenLabs 发布Turbo 2.5模型

23 8 月, 2024

该模型支持包括普通话在内的 32 种语言，能为全球近…

AI行业应用, 多媒体处理

Emilia 一个开源多语言高质量语音数据集

22 8 月, 2024

港中大（深圳）联合中科院声学所、上海人工智能实验室等…

AI行业应用, 多媒体处理

DETECT-2B ：音频深度伪造检测工具

19 8 月, 2024

etect-2B的子模型由带有关键层插入适配模块的冻…

AI行业应用, 多媒体处理

StreamVC: 实时低延迟语音转换

17 8 月, 2024

StreamVC 即使在移动平台上也能以低延迟从输入…

AI行业应用, AI项目, 多媒体处理

RenderNet Al 推出视频换脸功能

16 8 月, 2024

RenderNet Al是一款强大的图像生成工具，专…

AI行业应用, 多媒体处理

这家人工智能公司希望彻底改变将对话重新配音成不同语言的方式

15 8 月, 2024

Flawless 是一家人工智能驱动的电影制作工作室…

AI行业应用, AI项目, 多媒体处理

Stability AI推出Stable Assistant两大新功能

14 8 月, 2024

Stability AI宣布为其用户友好型聊天机器人…

AI行业应用, 多媒体处理

Kyutai 发布全新的开源 AI语音助手 Moshi

13 8 月, 2024

法国独立非盈利AI研究实验室Kyutai推出了具备7…

AI项目, 多媒体处理

Odyssey：提供影视级别的 AI 视频生成和编辑工具

3 8 月, 2024

高质量几何生成：生成精细的三维几何形状，用于构建逼真…

AI项目, 多媒体处理, 开源项目

根据单张图像和音频输入生成唱歌和说话视频

28 7 月, 2024

和EMO相比，该项目已开源😄
它能够通过输入语音，生…

AI行业应用, AI项目, 多媒体处理

苹果发布的Translation API

26 7 月, 2024

苹果新出的翻译 API，不需要联网，完全使用本机大语…

AI项目, 多媒体处理, 开源项目

Diffutoon：将任何真实感视频直接渲染为高清动漫风格

16 7 月, 2024

提供了 Colab 笔记，直接运行就可以，不需要摆弄…