开源项目

AI项目, OpenAI, 开源项目

北京大学Yuangroup团队发起了一个 Open-Sora计划

24 3 月, 2024

旨在复现OpenAI 的Sora模型

Open-S…

AI项目, 开源项目

MeloTTS：由MyShell AI开发的一个高质量的多语言文本到语音（TTS）库

19 3 月, 2024

支持英语、西班牙语、法语、中文、日语和韩语等多种语言…

AI项目, 开源项目

SDXL Lightning 实时生图

16 3 月, 2024

边打字边生成图片，速度贼拉快

AI项目, 开源项目, 自动驾驶

YOLOv9：实时对象检测，能够快速准确地在图像或视频中识别和定位多个对象

15 3 月, 2024

之前的YOLO系列模型相比，YOLOv9在不牺牲性能…

AI项目, 开源项目

YOLO-World&EfficientSAM&Stable Diffusion 能干啥？

14 3 月, 2024

实时检测视频中的特定对象，然后分割对象，使用自然语言…

AI项目, 开源项目, 机器人

UMI：斯坦福开发的一个机器人数据收集和策略学习框架

13 3 月, 2024

UMI可以将人类在复杂环境下的操作技能直接转移给机器…

AI项目, 开源项目, 自动驾驶

YOLOv8：目标检测跟踪模型

13 3 月, 2024

YOLOv8能够在图像或视频帧中快速准确地识别和定位…

AI项目, OpenAI, 开源项目

OpenAI推出的一音乐生成模型：Jukebox

11 3 月, 2024

OpenAI在2019年8月份就推出了他们的一音乐生…

AI项目, 开源项目

AnyGPT：任意模态到任意多模态的大语言模型

10 3 月, 2024

通过连接大语言模型与多模态适配器和扩散解码器，Any…

AI项目, 开源项目

OOTDiffusion：一个高度可控的虚拟服装试穿开源工具

10 3 月, 2024

可以根据不同性别和体型自动调整，和模特非常贴合。也可…

AI项目, 开源项目

PixelPlayer：MIT研究团队开发的项目

9 3 月, 2024

能自动从视频中识别和分离出不同的声音源，并与画面位置…

AI项目, 开源项目

UFO：由微软开发的专注于Windows操作系统交互的UI代理

8 3 月, 2024

它可以通过理解用户的自然语言指令和屏幕的视觉内容，自…