多媒体处理

AI项目, 多媒体处理

Vidu：可生成16秒、1080P视频的模型

29 5 月, 2024

这款模型被视为国内首个达到Sora级别的视频模型。
…

AI项目, 多媒体处理

SpeechAlign：利用人类反馈改变语音合成，以增强技术交互的自然性和表现力

24 5 月, 2024

复旦大学的一个研究团队开发了 SpeechAlign…

AI项目, 多媒体处理

Open Sora 团队发布了另一个视频生成项目 MagicTime

21 5 月, 2024

开发了一套名为 MagicAdapter 的技术，通…

AI项目, 多媒体处理

SAM模型视频分割项目

17 5 月, 2024

本项目的目标是运动分割——发现并分割视频中的运动对象…

AI项目, 多媒体处理

NoLang：输入任何主题或者网页链接直接生成视频

17 4 月, 2024

它支持文字、网页链接、PDF、提问等直接转视频
也就…

AI项目, 多媒体处理, 开源项目

VoiceCraft：官宣超过XTTS的语音模型

12 4 月, 2024

支持克隆音频，支持通过修改原始音频的文本来编辑音频，…

AI行业应用, AI项目, 多媒体处理

FRESCO这个视频转绘项目

11 4 月, 2024

FRESCO这个视频转绘项目的代码已经发布，也在项目…

AI行业应用, AI项目, 多媒体处理

Gatekeep：一个新型的文本转视频 AI，专注与教学

11 4 月, 2024

它可以通过文本提示将数学、物理问题转换成视频内容
它…

AI行业应用, AI项目, 多媒体处理

Google也弄了一个：一张照片+音频即可生成会说话唱歌的视频的项目

4 4 月, 2024

Google也弄了一个：一张照片+音频即可生成会说话…

AI行业应用, AI项目, 多媒体处理

Optimizer AI：专门为视频自动生成音效的AI工具可以为AI视频自动配音

31 3 月, 2024

能够通过文字提示创造出适用于各种场景的声音和音效

…

AI项目, 多媒体处理

ChatGPT 语音朗读功能开始灰度测试

26 3 月, 2024

设置好语音，点击播放按钮，可以自动朗读GPT生成的内…

AI项目, 多媒体处理

Pika推出LipSync【唇部同步】功能

21 3 月, 2024

Lip Sync即可将生成视频中人物的嘴部动画和音频…