Proxy-lite:轻量级、开源权重的自主助手项目
Convergence AI 开源的一个轻量(mini)版本的代理 / 助手框架。它可以让模型在一个环境中,自主地使用工具 (如浏览器、点击、搜索) 来完成任务。
Convergence AI 开源的一个轻量(mini)版本的代理 / 助手框架。它可以让模型在一个环境中,自主地使用工具 (如浏览器、点击、搜索) 来完成任务。
让用户用脚本控制“剪映草稿”(即剪映项目的工程文件 /草稿文件),从而自动化地生成、编辑、组合、导出视频。
换句话说,它是「对剪映的工程文件层面做自动化操作」的工具,而不是在视频像素层面做处理
支持一键自动翻译 RPG、SLG 等游戏,Epub、TXT 小说,Srt、Vtt、Lrc 字幕,Word、MD文档等复杂长文本。基于 AI 翻译,确保长文本翻译的连贯性与准确性。
一个基于大语言模型的开源项目,通过自然语言描述生成MMD角色的姿势和动画。
使用了一种名为MPL(MMD Pose Language)的语义姿势描述语言,使得AI能够理解和生成符合解剖学的姿势。
项目全称是 Subtitle Edit(简称 SE) “the subtitle editor”
它是一个开源软件,采用 GPL-3.0 许可
在 GitHub 上有较活跃的维护与社区贡献(有许多 stars 和 forks)
Tero Subtitler(由 URUWorks 维护):提供一个友好的多语言界面和全面的字幕编辑功能。
支持多种字幕格式,具备强大的编辑工具,包括时间轴波形可视化、自动备份、翻译记忆、音视频预览等功能,可以轻松进行字幕的创建、编辑和导出。
可以快速模糊照片中的敏感信息,以保护隐私。支持多种图片格式(如 JPG、PNG 和 WebP),只需上传图片,选择模糊类型和强度,便可在几秒钟内获得模糊效果。
LiquidText 是一款面向“重度文献/资料阅读 + 批注 + 笔记 + 文档分析”的应用程序,定位类似一个“第二大脑”(Second Brain)。
WhisperLiveKit 项目是一个集成了最新研究成果的实时语音转文本系统,包括 SimulStreaming、WhisperStreaming、Streaming Sortformer 和 Diart 等技术,支持多种语言和说话人识别。
能够通过运动数据精确稳定视频。支持多种现代相机(如GoPro、Sony、Insta360等)内部记录的陀螺仪数据,也可以使用外部设备(如Betaflight黑匣子)提供的陀螺仪数据
玩游戏时有时候要查攻略,要么切换窗口去查、要么用手机,都不怎么方便。
有 2 个核心功能:
▫️一键呼出:按下Ctrl+Q,无需切屏即可查询攻略
▫️ AI游戏专家:基于Google Gemini + 本地知识库对游戏内容智能问答
模拟 Gemini CLI Kiro 客户端请求,兼容 OpenAI API。可每日千次Gemini模型请求, 免费使用Kiro 内置 Claude 模型。