分類: AI行业应用 - 第 22 頁 - Tarogo Cloud Bloger & Shop

AI项目多媒体处理

自动将你的网页内容转换为播客

Audio Native 是一个嵌入式音频播放器，可以自动为网页内容生成语音

只需插入一段简短的代码，即可插入到任何网页和内容中，自动为内容生成语音旁白。

您现在正在阅读的这一行的上方有一个播放按钮。按播放键，您可以收听由 ElevenLabs 语音自动生成的这篇文章的旁白。我们将这种嵌入式语音播放器称为“Audio Native”。

13 6 月, 2024

Google DeepMind 发布了 AlphaFold 3

能够预测所有生命分子结构和相互作用 AI 模型

该模型能够生成蛋白质、DNA 和其他分子的 3D 结构，并揭示它们如何组合在一起。

该模型还能够模拟影响细胞健康的化学变化，并检测可能导致疾病的异常。

AlphaFold 3 将为全球科学研究人员和机构免费开放。它的高精度和新一代架构可支持药物发现和生物学的突破性进展。

6 6 月, 2024

AI项目机器人

特斯拉放出了擎天柱机器人最新训练视频

最罕见的是特斯拉曝光了机器人的训练情况

似乎是完全靠视觉辅助和人类示范进行训练，也就是和特斯拉汽车一样的逻辑！

6 6 月, 2024

AI项目医疗AI

科学家通过机器学习模型，为脓毒症治疗“争分夺秒”

这项研究的结果表明，个性化的抗生素治疗时间建议模型可以帮助医生更好地决策，避免治疗延迟或过早给药带来的潜在危害，同时降低患者的死亡率和医疗成本。

5 6 月, 2024

AI项目多媒体处理开源项目

OpenVoice V2版本发布

OpenVoice，这是一种多功能的即时语音克隆方法，只需要参考说话者的一个简短的音频剪辑即可复制他们的声音并生成多种语言的语音。除了复制参考说话者的音色之外，OpenVoice 还可以对语音风格进行精细控制，包括情感、口音、节奏、停顿和语调。

3 6 月, 2024

Adobe AI项目多媒体处理

Adobe发布了视频超分项目VideoGigaGAN

VideoGigaGAN，这是一种新的生成 VSR 模型，可以生成具有高频细节和时间一致性的视频。
VideoGigaGAN 基于大规模图像上采样器——GigaGAN。简单地通过添加时间模块将 GigaGAN 扩展到视频模型会产生严重的时间闪烁。
确定了几个关键问题，并提出了显着提高上采样视频的时间一致性的技术。

2 6 月, 2024

AI新搜索 AI行业应用 AI项目 MicroSoft

微软必应的一项新专利详细介绍了“视觉搜索”

微软在 Bing 图片搜索中已引入视觉搜索选项，通过识别图片中的内容，并扩展显示相关的图片资源，实现以图搜图功能。

微软计划将必应的图片搜索引入到聊天平台上，增强用户参与度并提供更全面的搜索结果。

31 5 月, 2024

AI项目机器人

中国机器人公司LimX Dynamics

中国机器人公司LimX Dynamics展示了双足平衡和导航技术已经发展到了多么高的水平

专为人体模拟而设计的机器人开发商。公司产品主要专注于运动智能和腿式机器人的研发和制造，包括仿人双足和四足机器人及相关解决方案，应用在工业检测、物流配送、特种作业、家居服务等领域，为为客户提供高品质、创新的产品。

31 5 月, 2024

AI项目多媒体处理

Vidu：可生成16秒、1080P视频的模型

这款模型被视为国内首个达到Sora级别的视频模型。

Vidu 不仅能模拟真实物理世界，还具备丰富的想象力，支持多镜头生成和高时空一致性。

Vidu 模型融合了 Diffusion 与 Transformer 技术，创新性地开发了 U-ViT 架构。

29 5 月, 2024

AI项目 Meta 医疗AI

基于LLAMA3构建的医疗领域的多模态模型

@ICepfl 和 @YaleMed 的研究人员联手构建了 Meditron，这是一款适用于资源匮乏的医疗环境的 LLM 套件。借助 Llama 3，他们的新模型在 MedQA 和 MedMCQA 等基准测试中优于其参数类别中的大多数开放模型。

26 5 月, 2024

AI项目医疗AI

希波克拉底：用于推进医疗保健领域大型语言模型的开源机器学习框架

Koç 大学、Hacettepe 大学、Yıldız Technical University 和 Robert College 的研究人员推出了“Hippocrates”，这是一个专为 LLMs 医疗保健应用量身定制的开源框架。与依赖专有数据的先前模型不同，希波克拉底授予对其广泛资源的完全访问权限，从而促进医疗人工智能研究领域的更大创新和协作。该框架的突出之处在于将持续的预训练和强化学习与人类专家的反馈相结合，增强了模型在医疗环境中的实用性。