开源项目

帶有微型攝影機的智慧環讓用戶透過點擊來控製家庭設備

雖然家庭中的智慧型設備已經發展到包括揚聲器、安全系統、燈光和恆溫器,但控制它們的方式仍然相對穩定。用戶可以與手機交互,或與技術人員交談,但這些通常不如它們所取代的簡單開關方便:“打開燈…不是那個…調高揚聲器音量…不要那麼大聲!”
華盛頓大學的研究人員開發了 IRIS

Ebook2Audiobook开源项目

将电子书自动转换为有声书 支持语音克隆、多种语言
ebook2audiobookXTTS 是一个开源项目,旨在将电子书自动转换为有声书,并支持多种语言、语音克隆和章节信息的生成。该项目结合了 Calibre(电子书转换工具)和 Coqui XTTS(文本转语音引擎),通过简单的命令或Web界面完成转换

Ultralight-Digital-Human数字人模型

支持在移动设备上实时运行的超轻量级数字人模型
Ultralight-Digital-Human 是一个创新的开源项目,使得数字人在移动设备上的实时应用成为可能,旨在实现超轻量级的数字人模型,其能够在移动设备上实时运行。
支持在移动设备上实时运行的超轻量级数字人模型
提供了详细的训练和推理步骤

Power-over-Skin “皮肤供电”技术

现代计算设备功能强大且小巧,可以轻松佩戴在身体上。然而,电池成为设计和用户体验的主要障碍,增加了设备的重量和体积,并且需要定期充电和移除设备。

为了解决这些问题,卡内基梅隆大学的研究人员提出了通过人体传输能量的“皮肤供电”技术。

強大的計算設備現在足夠小,可以輕鬆佩戴在身上。然而,電池造成了主要的設計和使用者體驗障礙

PDF2Audio

将 PDF 文件转换为播客、讲座、摘要等音频内容

PDF2Audio 是一个开源项目,旨在将 PDF 文件转换为音频格式,如播客、讲座或摘要。该项目利用 OpenAI 的 GPT 模型进行文本生成和文本转语音(TTS)转换。用户可以上传多个 PDF 文件,并根据不同的模板(例如播客、讲座、摘要)生成音频内容。

几个AI项目介绍

项目简介:一个基于VITS的简单易用的变声框架,可以帮助用户在10分钟以内用自己的语音数据训练出高质量的语音转换(VC)模型。
支持不同硬件设备,提供简单的网页界面和实时变声功能,适用于各类音色转换与合成应用。

Ehrrapy 一种用于分析复杂健康数据的新开源工具

科学家们开发了一种易于使用的软件解决方案,专门用于分析复杂的医疗健康数据。名为“ehrapy”的开源软件使研究人员能够构建和系统地检查大型异构数据集。该软件可供全球科学界使用和进一步开发。
主要开发者之一、慕尼黑亥姆霍兹计算生物学研究所和慕尼黑工业大学 (TUM) 的科学家 Lukas Heumos

WechatFerry:一个开源微信机器人框架

助你轻松开发微信聊天机器人
WechatFerry 是一个微信机器人框架,提供了一套强大、快速且可定制的解决方案,适用于开发和集成微信机器人。为开发微信机器人的用户提供了 SDK 封装和多种插件,能够轻松调用微信的相关功能,适用于需要与微信进行交互的自动化任务。此项目包含多个组件和插件模块

AI视频剪辑软件:Kurisu

AI视频剪辑

一个靠口头描述来转换文件格式的程序。

字面意思,就是口述。

例如,你拖动或者上传了一份mp4,然后你只需在输入框内描述你想干的内容。 像是“转成webm”“只保留视频第10秒到20秒之间的内容”“提取音频文件”“将视频倒放”这类。 然后点击按钮们等待进度条完成就行。 运用了ChatGPT和FFmpeg的对接。