分類: 多媒体处理

AI行业应用多媒体处理

digiKam：开源数字资产管理和图像编辑软件

能够轻松导入和组织照片，利用相册、标签和标签进行分类。还具备智能的AI驱动标签和评分功能，自动丰富图像的元数据，从而简化了图像的管理和查找过程。还提供了丰富的编辑工具，如颜色校正、裁剪和修饰，可以应用滤镜和效果，使图像更具专业水准。

20 11 月, 2025

AI行业应用多媒体处理

DeepSeek-OCR：让长文档“看得懂”的光学压缩

在大模型的世界里，上下文长度始终是一个限制。当文档太长、图表太复杂，传统语言模型往往“看不完”。而最近，来自 DeepSeek AI 的一个开源项目——DeepSeek-OCR，

14 11 月, 2025

AI行业应用多媒体处理

一个免费的在线拼图有意思的工具

提供了布局拼图和长图拼接两种主要功能，可以在画布上自由添加、编辑和移动文字、箭头、方框和圆圈等创意元素。

13 11 月, 2025

AI行业应用多媒体处理

专业的Midjourney提示词优化器

用于生成高质量的AI绘画提示词。特别关注Blade Runner风格和80年代复古美学，提供多种风格模板，包括赛博朋克、合成波和霓虹黑色电影等。

11 11 月, 2025

AI行业应用多媒体处理

ChronoFrame：丝滑的照片展示和管理应用

一款现代化的照片展示与管理应用，不仅界面流畅，还支持多种图片格式与大尺寸渲染，让摄影师、设计师、博主都能轻松管理自己的影像档案。

10 11 月, 2025

AI行业应用多媒体处理

AI Similarity 快速检测两张图片的相似度

可以上传两张图片，系统会自动分析并提供相似度评分，不仅适用于简单的图片比较，还支持详细的视觉分析，用户可以通过滑动条查看图片的不同之处。

9 11 月, 2025

AI行业应用多媒体处理

ThumbnailCreator一条命令生成油管封面图

输入一个主题，AI 帮你想创意、出素材、排版加字，几秒钟出一张 1280×720 的 YouTube 缩略图。

2 11 月, 2025

AI行业应用 AI项目多媒体处理开源项目

KDE出品，专业级开源剪辑软件

精准的多轨时间轴、波形、代理剪辑，支持 LUT 调色、字幕编辑、音频滤镜
高度可定制，专业水准，与 Whisper / ffmpeg 集成方便（可自动生成字幕轨）

29 10 月, 2025

AI行业应用多媒体处理

一键将视频和音频转化为各种风格的文档

AI 视频图文创作助手是一款 Web 工具, 基于 AI 大模型, 无需登录注册, 前后端本地部署，以极低的成本体验 AI 视频/音频转风格文档服务。

25 10 月, 2025

AI行业应用多媒体处理

Kimu：视频编辑工具，支持非线性视频编辑

Kimu：一个视频编辑工具，支持非线性视频编辑，允许在多个轨道上进行编辑，并提供实时预览功能，方便在编辑过程中查看效果。

21 10 月, 2025

AI行业应用多媒体处理

「剪映」的草稿文件自动化操作工具

让用户用脚本控制“剪映草稿”（即剪映项目的工程文件 /草稿文件），从而自动化地生成、编辑、组合、导出视频。

换句话说，它是「对剪映的工程文件层面做自动化操作」的工具，而不是在视频像素层面做处理

20 10 月, 2025

AI行业应用多媒体处理

用语言控制 3D 模型动作的 AI 系统

一个基于大语言模型的开源项目，通过自然语言描述生成MMD角色的姿势和动画。
使用了一种名为MPL（MMD Pose Language）的语义姿势描述语言，使得AI能够理解和生成符合解剖学的姿势。

17 10 月, 2025

AI行业应用多媒体处理

适合所有人的美丽 AI 涂色页面

提供丰富多样的涂色页的网站。可以通过简单的步骤生成个性化的涂色页，或者从数千个现成的设计中进行选择。

7 10 月, 2025

AI行业应用多媒体处理

BlurImg：免费的在线图片模糊工具

可以快速模糊照片中的敏感信息，以保护隐私。支持多种图片格式（如 JPG、PNG 和 WebP），只需上传图片，选择模糊类型和强度，便可在几秒钟内获得模糊效果。

6 10 月, 2025

AI行业应用多媒体处理

实时和本地语音到文字、翻译、说话人区分的开源项目

WhisperLiveKit 项目是一个集成了最新研究成果的实时语音转文本系统，包括 SimulStreaming、WhisperStreaming、Streaming Sortformer 和 Diart 等技术，支持多种语言和说话人识别。

4 10 月, 2025

AI行业应用多媒体处理

Gyroflow：基于陀螺仪数据的视频稳定化应用程序

能够通过运动数据精确稳定视频。支持多种现代相机（如GoPro、Sony、Insta360等）内部记录的陀螺仪数据，也可以使用外部设备（如Betaflight黑匣子）提供的陀螺仪数据

2 10 月, 2025

多媒体处理

digiKam：开源数字资产管理和图像编辑软件

DeepSeek-OCR：让长文档“看得懂”的光学压缩

一个免费的在线拼图有意思的工具

专业的Midjourney提示词优化器

ChronoFrame：丝滑的照片展示和管理应用

AI Similarity 快速检测两张图片的相似度

ThumbnailCreator一条命令生成油管封面图

KDE出品，专业级开源剪辑软件

一键将视频和音频转化为各种风格的文档

Kimu：视频编辑工具，支持非线性视频编辑

「剪映」的草稿文件自动化操作工具

用语言控制 3D 模型动作的 AI 系统

适合所有人的美丽 AI 涂色页面

BlurImg：免费的在线图片模糊工具

实时和本地语音到文字、翻译、说话人区分的开源项目

Gyroflow：基于陀螺仪数据的视频稳定化应用程序

精选内容 · 赞助推荐

多语言翻译

Donate

热门关键词

分類

Subscribe to Blog via Email