多媒体处理

Power-over-Skin “皮肤供电”技术

现代计算设备功能强大且小巧,可以轻松佩戴在身体上。然而,电池成为设计和用户体验的主要障碍,增加了设备的重量和体积,并且需要定期充电和移除设备。

为了解决这些问题,卡内基梅隆大学的研究人员提出了通过人体传输能量的“皮肤供电”技术。

強大的計算設備現在足夠小,可以輕鬆佩戴在身上。然而,電池造成了主要的設計和使用者體驗障礙

PDF2Audio

将 PDF 文件转换为播客、讲座、摘要等音频内容

PDF2Audio 是一个开源项目,旨在将 PDF 文件转换为音频格式,如播客、讲座或摘要。该项目利用 OpenAI 的 GPT 模型进行文本生成和文本转语音(TTS)转换。用户可以上传多个 PDF 文件,并根据不同的模板(例如播客、讲座、摘要)生成音频内容。

詹姆斯·厄尔·琼斯的达斯·维德声音通过人工智能得以延续

配音演员从中看到了希望和危险
在长达六十多年的演艺生涯中,詹姆斯·厄尔·琼斯的声音成为他作为表演者作品中不可磨灭的一部分。
琼斯于周一去世,享年 93 岁。在银幕上,琼斯在《梦想之地》中再现了一位隐居的作家,在《梦想之地》中重新回到聚光灯下,在《来到美国》中再现了一位虚构土地上傲慢的国王。

WechatFerry:一个开源微信机器人框架

助你轻松开发微信聊天机器人
WechatFerry 是一个微信机器人框架,提供了一套强大、快速且可定制的解决方案,适用于开发和集成微信机器人。为开发微信机器人的用户提供了 SDK 封装和多种插件,能够轻松调用微信的相关功能,适用于需要与微信进行交互的自动化任务。此项目包含多个组件和插件模块

Audible 推出 AI 语音复制功能

Audible 即将推出新功能,邀请在美国的精选朗读员创建其声音的 AI 生成复制品,以丰富其有声书产品。此举旨在满足日益增长的音频内容需求,因为许多书籍仍未以这种格式提供。参与者将提交语音样本,Audible 将将其转化为高质量的复制品,作者可以在有声书创作交易所 (ACX) 上选择这些复制品用于他们的有声书。

Storybooks玩具变故事书

一个在线插图工具,帮助作者、教育工作者和创意家长快速为儿童书籍创建插图。
可以使用先进的生成式AI模型,如Imagen、Stable Diffusion、DALL-E等,轻松地在几分钟内完成插图工作。
插图作品可以导出到各种媒体,如印刷书籍、电子书、YouTube等,且所有图像都可商用,无需支付版权费用。

xAI 的 Grok 现在可以在 X 上生成图像

xAI 的 Grok AI 模型现在可以在 X 社交网络上生成图像,尽管 Grok 访问目前仅限于 X 上的 Premium 和 Premium+ 用户。

示例图像下方的文字提示表明,Grok正在使用 Black Forest Labs 的 FLUX.1 来创建这些图像。用户生成的早期图像表明,Grok 的图像生成功能在创建政治人物图像方面没有任何限制,目前许多用户正在利用这一点。然而,随着美国总统大选的临近,该公司可能会面临对这些功能进行限制的压力。

网站名称:Immersity AI

提供了将 2D 图像和视频快速转换为 3D 内容的工具,使用其独特的神经深度引擎生成精确的深度图,从而实现逼真的 3D 效果。

LeiaSR™是一个可以将2D显示转换为3D显示的技术平台,帮助观看者体验身临其境的感觉,就像他们是场景的一部分一样。
LeiaSR™ 结合了专利的可切换显示技术、先进的人工智能面部跟踪和内容转换。
LeiaSR™ 可在不影响原始显示质量的情况下实现令人惊叹的 3D 内容体验。它还与更广泛的 3D|XR 行业兼容。