AI工具

詹姆斯·厄尔·琼斯的达斯·维德声音通过人工智能得以延续

配音演员从中看到了希望和危险
在长达六十多年的演艺生涯中,詹姆斯·厄尔·琼斯的声音成为他作为表演者作品中不可磨灭的一部分。
琼斯于周一去世,享年 93 岁。在银幕上,琼斯在《梦想之地》中再现了一位隐居的作家,在《梦想之地》中重新回到聚光灯下,在《来到美国》中再现了一位虚构土地上傲慢的国王。

WechatFerry:一个开源微信机器人框架

助你轻松开发微信聊天机器人
WechatFerry 是一个微信机器人框架,提供了一套强大、快速且可定制的解决方案,适用于开发和集成微信机器人。为开发微信机器人的用户提供了 SDK 封装和多种插件,能够轻松调用微信的相关功能,适用于需要与微信进行交互的自动化任务。此项目包含多个组件和插件模块

新的人工智能学习模型提高了姿态检测性能和效率

可以利用旨在提高更专业场景的人工智能输出的效率、相关性和准确性的新模型。

大型预训练语言模型 (PLM) 使用越来越大的数据集(例如维基百科)来训练和优化机器学习 (ML) 模型以执行特定任务。虽然 ChatGPT 等大型 PLM 的准确性和性能随着时间的推移而有所提高,但在大型数据集不可用或由于计算限制而无法使用的情况下,大型 PLM 无法正常工作。

几个AI网站介绍

卡通与真实结合
一个专门训练用于生成融合现实和插画元素图像的 LoRA 模型。
AI 视频
MiniMax 推出的基于多模态大语言模型的生产力工具
AI 图像处理
一个功能齐全的人工智能图像处理平台
AI 视频生成
一款提供基于先进的 Flux.1 AI 模型的图像和视频生成工具。

HuggingFace 开源低成本解决方案 LeRobot

HuggingFace 开源了低成本 AI 机器人 LeRobot,并指导大家从头开始构建 AI 控制的机器人,包括组装、配置到训练控制机器人的神经网络。
该项目由前特斯拉工程师 Remi Cadene(现在是 HuggingFace 的 principal research scientist)所领导,并给出了一份详细的指南。项目基于开源的 Koch v1.1 机器人套件(也可以是别的硬件或者虚拟平台),包含两个六电机的机械臂,可使用一个或多个摄像头作为视觉传感器。

工程師開發人工智慧系統即時感知被淹沒的道路

萊斯大學的工程師開發了一個可能的解決方案來解決這個問題:一個名為 OpenSafe Fusion 的自動化資料融合框架。 OpenSafe Fusion 是使用資料融合的開源態勢感知行動框架的縮寫,它利用現有的個人報告機制和公共資料來源來感知日益頻繁的城市洪水事件期間快速變化的道路狀況。
萊斯大學斯坦利·C·摩爾工程教授兼土木與環境工程系系主任傑米·帕吉特 (Jamie Padgett) 與土木與環境工程博士後研究員普拉納韋什·帕納卡爾(Pranavesh Panakkal) 一起分析了來自休士頓九個來源的數據,然後制定了綜合框架他們的研究中的自動化數據系統。

生成式人工智慧讓我們更接近自動化投資專業知識

大型語言模型 ( LLMs ) 擅長在大型資料集上進行訓練,以產生針對提示的資訊豐富的回應。喬治梅森大學唐納德·G·科斯特洛商學院會計學助理教授曹毅和科斯特洛商學院會計學副教授兼區域主席陳龍正在積極探索個人投資者如何利用LLMs從有關公司的大量可用數據令人眼花撩亂。
他們的新工作論文發表在SSRN Electronic Journal上,由佛羅裡達大學的 Jennifer Wu Tucker 和馬薩諸塞大學波士頓分校的 Chi Wan 共同撰寫,研究了人工智慧識別「同行公司」或行業中產品市場競爭對手的能力。

新型兩指機器人可以解決現實世界實驗中的日常操作任務

Improbable AI 實驗室和麻省理工學院 (MIT) 的研究人員最近設計了一種新型兩指機器人抓手,旨在更有效地處理日常操作任務。
他們提出的機器人系統在預印本伺服器arXiv上的一篇論文中被介紹,並將被納入IEEE ICRA 2024 會議記錄中,該系統可以成功拾取具有不同形狀和紋理的物體,隨後將它們放置在指定位置。

谷歌为 Gemini 订阅者推出定制 AI 聊天机器人

谷歌正在通过其 Gemini AI 聊天机器人重新引入生成人物图像的功能。此前,由于对历史不准确的描绘的担忧,该功能在今年早些时候被暂停。该功能将在几天内以早期访问版本的形式提供给使用英语的 Gemini Advanced、Business 和 Enterprise 用户。此升级利用了 Imagen 3,这是谷歌最新的文本到图像生成器,能够从逼真的风景到纹理绘画创建各种视觉效果。

AI-Vtuber数字人

一个高自由度的端到端的可定制AI-VTuber。
支持对接哔哩哔哩直播间,以智谱API作为语言基座模型,拥有意图识别、长短期记忆(直接记忆和联想记忆),支持搭建认知库、歌曲作品库,接入了当前热门的一些语音转换、语音合成、图像生成、数字人驱动项目,并提供了一个便于操作的客户端。

研究人員提出了一種更小、更耐雜訊的密碼學量子分解電路

研究人員在過去 30 年裡取得了長足的進步,但科學家尚未建造出足夠強大的量子電腦來運行 Shor 的演算法。
當一些研究人員致力於建造更大的量子電腦時,其他研究人員一直在嘗試改進 Shor 的演算法,以便它可以在更小的量子電路上運行。大約一年前,紐約大學電腦科學家 Oded Regev 提出了一項重大理論改進。他的演算法可以運行得更快,但電路需要更多的記憶體。

Storybooks玩具变故事书

一个在线插图工具,帮助作者、教育工作者和创意家长快速为儿童书籍创建插图。
可以使用先进的生成式AI模型,如Imagen、Stable Diffusion、DALL-E等,轻松地在几分钟内完成插图工作。
插图作品可以导出到各种媒体,如印刷书籍、电子书、YouTube等,且所有图像都可商用,无需支付版权费用。

谷歌将AI驱动的搜索摘要扩展到六个新国家

谷歌将AI驱动的搜索摘要扩展到六个新国家

谷歌现在在搜索页面顶部显示基于人工智能的便捷答案,这意味着用户可能永远不会点击进入那些为这些结果提供数据的网站。
但许多网站所有者表示,他们无法承受阻止谷歌人工智能总结他们的内容的后果。

xAI 的 Grok 现在可以在 X 上生成图像

xAI 的 Grok AI 模型现在可以在 X 社交网络上生成图像,尽管 Grok 访问目前仅限于 X 上的 Premium 和 Premium+ 用户。

示例图像下方的文字提示表明,Grok正在使用 Black Forest Labs 的 FLUX.1 来创建这些图像。用户生成的早期图像表明,Grok 的图像生成功能在创建政治人物图像方面没有任何限制,目前许多用户正在利用这一点。然而,随着美国总统大选的临近,该公司可能会面临对这些功能进行限制的压力。