分類: AI行业应用 - 第 34 頁 - Tarogo Cloud Bloger & Tech News

基于LLAMA3构建的医疗领域的多模态模型

26 5 月, 2024

@ICepfl 和 @YaleMed 的研究人员联手构建了 Meditron，这是一款适用于资源匮乏的医疗环境的 LLM 套件。借助 Llama 3，他们的新模型在 MedQA 和 MedMCQA 等基准测试中优于其参数类别中的大多数开放模型。

AI项目, 医疗AI

希波克拉底：用于推进医疗保健领域大型语言模型的开源机器学习框架

26 5 月, 2024

Koç 大学、Hacettepe 大学、Yıldız Technical University 和 Robert College 的研究人员推出了“Hippocrates”，这是一个专为 LLMs 医疗保健应用量身定制的开源框架。与依赖专有数据的先前模型不同，希波克拉底授予对其广泛资源的完全访问权限，从而促进医疗人工智能研究领域的更大创新和协作。该框架的突出之处在于将持续的预训练和强化学习与人类专家的反馈相结合，增强了模型在医疗环境中的实用性。

AI项目, Alphabet, 医疗AI

谷歌发布基于 Gemini 微调的医疗领域模型 Med-Gemini

25 5 月, 2024

在临床推理、多模态理解和长文本处理方面都有很大的提升。

研究人员用了14个医疗基准测试Med-Gemini的能力。

结果发现,它在10个基准上都取得了最佳表现,远超之前最强的GPT-4模型。

AI项目, 多媒体处理

SpeechAlign：利用人类反馈改变语音合成，以增强技术交互的自然性和表现力

24 5 月, 2024

复旦大学的一个研究团队开发了 SpeechAlign，这是一个针对语音合成核心的创新框架，使生成的语音与人类偏好保持一致。与优先考虑技术准确性的传统模型不同，SpeechAlign 通过直接将人类反馈纳入语音生成而引入了巨大转变。这个反馈循环确保产生的语音在技术上是合理的并且在人类层面上产生共鸣。

AI项目, 多媒体处理

Open Sora 团队发布了另一个视频生成项目 MagicTime

21 5 月, 2024

开发了一套名为 MagicAdapter 的技术，通过分开处理空间和时间训练，它能从变形视频中提取更多的物理知识，并使预训练的T2V模型能够生成这类视频。

接着，引入了动态帧提取策略，这个策略特别适用于变形时光延续视频，因为这类视频变化范围广泛，涵盖了物体戏剧性的变化过程，从而包含了更丰富的物理知识。

AI项目, 机器人

国产的机器人：星尘智能AI机器人S1

20 5 月, 2024

星尘智能的英文名：Astribot

一款超级令人印象深刻的家用机器人，可以做饭、打扫卫生、洗衣服等。

它可以模仿人类动作迅速做出学习，而且灵活性极强

AI项目, 多媒体处理

SAM模型视频分割项目

17 5 月, 2024

本项目的目标是运动分割——发现并分割视频中的运动对象。这是一个被广泛研究的领域，有许多仔细的、有时甚至是复杂的方法和训练方案，包括：自监督学习、从合成数据集学习、以对象为中心的表示、非模态表示等等。对本文的兴趣是确定 Segment Anything 模型 (SAM) 是否有助于完成此任务。

AI新搜索, AI行业应用, AI项目, 网上课程

斯坦福大学和麻省理工学院的研究人员推出了搜索流

16 5 月, 2024

来自斯坦福大学、麻省理工学院和 Harvey Mudd 的研究人员设计了一种方法，通过将搜索过程表示为序列化字符串“搜索流”(SoS)，来教授语言模型如何搜索和回溯。他们提出了一种统一的搜索语言，并通过倒计时游戏进行了演示。在搜索流上预训练基于 Transformer 的语言模型将准确率提高了 25%，而通过策略改进方法进一步微调则解决了 36% 以前未解决的问题。这表明语言模型可以学习通过搜索解决问题、自我改进并自主发现新策略。