开源应用为Win11用户带来于苹果AI的写作功能
一款名为Writing Tools的开源应用为Windows 11用户带来了类似Apple Intelligence的写作工具功能。该应用支持与多种大型语言模型(LLM)连接,包括Gemini、OpenAI等,提供翻译、摘要、校对等多项功能。用户只需简单配置,即可在Windows系统上无缝使用这些高级写作辅助工具
一款名为Writing Tools的开源应用为Windows 11用户带来了类似Apple Intelligence的写作工具功能。该应用支持与多种大型语言模型(LLM)连接,包括Gemini、OpenAI等,提供翻译、摘要、校对等多项功能。用户只需简单配置,即可在Windows系统上无缝使用这些高级写作辅助工具
可控人物影像產生旨在產生以參考影像為條件的人物影像,從而允許精確控制人物的外觀或姿勢。然而,現有方法儘管實現了較高的整體影像質量,但通常會扭曲參考影像的細粒度紋理細節。我們將這些扭曲歸因於對參考影像中相應區域的關注不夠
智音语音助手(Zhiyin_Butler)旨在开发一款通用型智能电脑管家,支持在桌面电脑Windows 10/11系统上安装和部署。项目的所有内容遵循Apache License 2.0开源协议,作为通用型电脑管家系统示例供开发者参考学习。
支持在移动设备上实时运行的超轻量级数字人模型
Ultralight-Digital-Human 是一个创新的开源项目,使得数字人在移动设备上的实时应用成为可能,旨在实现超轻量级的数字人模型,其能够在移动设备上实时运行。
支持在移动设备上实时运行的超轻量级数字人模型
提供了详细的训练和推理步骤
SynthID 使用各种深度学习模型和算法进行水印嵌入和识别,在不影响原始内容质量的前提下,帮助用户确定内容是否由 Google 的 AI 工具生成,并已集成到 Imagen、ImageFX、Gemini 等 Google 产品中
现代计算设备功能强大且小巧,可以轻松佩戴在身体上。然而,电池成为设计和用户体验的主要障碍,增加了设备的重量和体积,并且需要定期充电和移除设备。
为了解决这些问题,卡内基梅隆大学的研究人员提出了通过人体传输能量的“皮肤供电”技术。
強大的計算設備現在足夠小,可以輕鬆佩戴在身上。然而,電池造成了主要的設計和使用者體驗障礙
Ebook2Audiobook开源项目
将电子书自动转换为有声书 支持语音克隆、多种语言
Hertz-dev:首个会话音频开源模型
小宾AI抠图
AI 头像动起来
科学家们开发了一种易于使用的软件解决方案,专门用于分析复杂的医疗健康数据。名为“ehrapy”的开源软件使研究人员能够构建和系统地检查大型异构数据集。该软件可供全球科学界使用和进一步开发。
主要开发者之一、慕尼黑亥姆霍兹计算生物学研究所和慕尼黑工业大学 (TUM) 的科学家 Lukas Heumos
AI视频剪辑
一个靠口头描述来转换文件格式的程序。
字面意思,就是口述。
例如,你拖动或者上传了一份mp4,然后你只需在输入框内描述你想干的内容。 像是“转成webm”“只保留视频第10秒到20秒之间的内容”“提取音频文件”“将视频倒放”这类。 然后点击按钮们等待进度条完成就行。 运用了ChatGPT和FFmpeg的对接。
一个开源项目,旨在代理Midjourney的Discord频道,通过API形式调用AI绘图,提供免费的绘图接口。
支持多账号配置,每个账号可设置任务队列,并提供不同的生成速度模式(RELAX、FAST、TURBO)