digiKam:开源数字资产管理和图像编辑软件
能够轻松导入和组织照片,利用相册、标签和标签进行分类。还具备智能的AI驱动标签和评分功能,自动丰富图像的元数据,从而简化了图像的管理和查找过程。还提供了丰富的编辑工具,如颜色校正、裁剪和修饰,可以应用滤镜和效果,使图像更具专业水准。
能够轻松导入和组织照片,利用相册、标签和标签进行分类。还具备智能的AI驱动标签和评分功能,自动丰富图像的元数据,从而简化了图像的管理和查找过程。还提供了丰富的编辑工具,如颜色校正、裁剪和修饰,可以应用滤镜和效果,使图像更具专业水准。
在大模型的世界里,上下文长度始终是一个限制。当文档太长、图表太复杂,传统语言模型往往“看不完”。而最近,来自 DeepSeek AI 的一个开源项目——DeepSeek-OCR,
用于生成高质量的AI绘画提示词。特别关注Blade Runner风格和80年代复古美学,提供多种风格模板,包括赛博朋克、合成波和霓虹黑色电影等。
一款现代化的 照片展示与管理应用,不仅界面流畅,还支持多种图片格式与大尺寸渲染,让摄影师、设计师、博主都能轻松管理自己的影像档案。
可以上传两张图片,系统会自动分析并提供相似度评分,不仅适用于简单的图片比较,还支持详细的视觉分析,用户可以通过滑动条查看图片的不同之处。
精准的多轨时间轴、波形、代理剪辑,支持 LUT 调色、字幕编辑、音频滤镜
高度可定制,专业水准,与 Whisper / ffmpeg 集成方便(可自动生成字幕轨)
AI 视频图文创作助手是一款 Web 工具, 基于 AI 大模型, 无需登录注册, 前后端本地部署,以极低的成本体验 AI 视频/音频转风格文档服务。
让用户用脚本控制“剪映草稿”(即剪映项目的工程文件 /草稿文件),从而自动化地生成、编辑、组合、导出视频。
换句话说,它是「对剪映的工程文件层面做自动化操作」的工具,而不是在视频像素层面做处理
一个基于大语言模型的开源项目,通过自然语言描述生成MMD角色的姿势和动画。
使用了一种名为MPL(MMD Pose Language)的语义姿势描述语言,使得AI能够理解和生成符合解剖学的姿势。
可以快速模糊照片中的敏感信息,以保护隐私。支持多种图片格式(如 JPG、PNG 和 WebP),只需上传图片,选择模糊类型和强度,便可在几秒钟内获得模糊效果。
WhisperLiveKit 项目是一个集成了最新研究成果的实时语音转文本系统,包括 SimulStreaming、WhisperStreaming、Streaming Sortformer 和 Diart 等技术,支持多种语言和说话人识别。
能够通过运动数据精确稳定视频。支持多种现代相机(如GoPro、Sony、Insta360等)内部记录的陀螺仪数据,也可以使用外部设备(如Betaflight黑匣子)提供的陀螺仪数据