谷歌剛剛發布了VideoPoet:多模式視頻生成模型!作者: / 24 1 月, 2024 它是大規模多模式的,可用作輸入:文本、圖像、深度和光流或屏蔽視頻,是最早生成視頻+音頻的模型之一! 更多信息如下''️ 通過輸入視頻,它會生成可信的音頻,而無需任何文本提示! 僅此而已,原作者@alexcarliera