用语言控制 3D 模型动作的 AI 系统
一个基于大语言模型的开源项目,通过自然语言描述生成MMD角色的姿势和动画。
使用了一种名为MPL(MMD Pose Language)的语义姿势描述语言,使得AI能够理解和生成符合解剖学的姿势。
一个基于大语言模型的开源项目,通过自然语言描述生成MMD角色的姿势和动画。
使用了一种名为MPL(MMD Pose Language)的语义姿势描述语言,使得AI能够理解和生成符合解剖学的姿势。
可以快速模糊照片中的敏感信息,以保护隐私。支持多种图片格式(如 JPG、PNG 和 WebP),只需上传图片,选择模糊类型和强度,便可在几秒钟内获得模糊效果。
WhisperLiveKit 项目是一个集成了最新研究成果的实时语音转文本系统,包括 SimulStreaming、WhisperStreaming、Streaming Sortformer 和 Diart 等技术,支持多种语言和说话人识别。
能够通过运动数据精确稳定视频。支持多种现代相机(如GoPro、Sony、Insta360等)内部记录的陀螺仪数据,也可以使用外部设备(如Betaflight黑匣子)提供的陀螺仪数据
一个基于GPT-4O技术的AI图像生成平台,可以通过上传参考图像或直接输入创意描述,IGenie能够理解复杂的艺术概念,并生成高质量的图像。
除了基本的表情符号查询功能,EmojiAll还提供了表情符号排行榜、情感分析、表情符号聊天、表情符号翻译和自定义表情符号制作等多种功能。
专为 website-scraper 主库设计,能够用于抓取动态渲染的网站(即通过 JavaScript 加载内容的网站),并返回完整 HTML。
致力于提供多模态、多语言、高性能的语音理解能力
SenseVoice 是 FunAudioLLM 项目中负责“语音理解”的基础模型