分類: AI行业应用 - 第 29 頁 - Tarogo Cloud Bloger & Tech News

Google 开发出一个能够达到人类业余水平的乒乓球机器人

5 10 月, 2024

DeepMind的工程师团队开发了一款能够打业余水平乒乓球的机器人。该机器人的核心硬件基于ABB IRB 1100机械臂，这款机械臂以其高速度和高精度著称，广泛应用于工业场景。通过结合了先进的机器人技术和人工智能，能够执行快速且有策略的乒乓球动作。

通过观看物理模拟和人类比赛，使用小规模数据集进行训练，并通过迭代过程不断提升技能。机器人在与不同水平的人类选手对战时，轻松战胜了初学者，并在与中级选手的比赛中赢得了超过一半的比赛，但在面对高级选手时表现不佳。

AI行业应用, AI项目, 多媒体处理, 开源项目

AI视频剪辑软件：Kurisu

3 10 月, 2024

AI视频剪辑

一个靠口头描述来转换文件格式的程序。

字面意思，就是口述。

例如，你拖动或者上传了一份mp4，然后你只需在输入框内描述你想干的内容。像是“转成webm”“只保留视频第10秒到20秒之间的内容”“提取音频文件”“将视频倒放”这类。然后点击按钮们等待进度条完成就行。运用了ChatGPT和FFmpeg的对接。

AI行业应用, 机器人

电装公司研发出自动采摘番茄的机器人

30 9 月, 2024

电装公司研发出自动采摘小番茄的机器人，已开始在欧洲接受订单。研发中运用了迄今制造汽车零件所培养的图像识别与安全行驶技术。在欧洲，人口减少带来的劳动力短缺和工资上涨成为问题，预计对自动化的需求将增长。5月开始接受订单以来，各方的咨询相继而来，目前也正讨论在日本国内发售。

机器人由电装与在荷兰开展智慧农业的集团公司共同研发，能在塑料大棚里自动行驶，若人工智能（AI）判定番茄已熟，就用剪刀采摘。若搭载的6个箱子都已装满，还能替换成空箱子。

AI巨头, AI行业应用, AI项目, OpenAI, 多媒体处理, 开源项目

ChatGPT API SRT 字幕翻译器

26 9 月, 2024

此工具采用OpenAI ChatGPT API进行文本翻译，专注于行对行翻译，特别用于SRT字幕。通过去除SRT文件的额外开销并将文本分批处理，优化了令牌使用，确保输入和输出行数一致。支持Web UI和CLI接口，提供流式输出、请求速率限制、进度恢复等功能，适用于多种语言和特殊书写形式，如表情符号和单词打乱排序。

AI行业应用, 多媒体处理

Pikimov视频编辑器

24 9 月, 2024

Pikimov 是一款基于Web 的应用程序，允许用户创建和编辑各种媒体类型，包括图像、视频、音频和3D 模型。
它为运动设计提供了基于图层的合成系统和关键帧动画系统。
该应用程序与Windows、macOS 和Linux 操作系统兼容，无需任何安装。所有用户文件都保留在本地计算机上，不会上传到服务器

AI行业应用, 多媒体处理

海绵音乐

23 9 月, 2024

海绵音乐是由字节跳动最新推出的免费AI音乐创作和分享平台，旨在利用人工智能技术生成个性化音乐，海绵音乐在人声处理方面表现优异，尤其是在中文歌曲中，减少了电音的使用，提高了吐字清晰度和演唱流畅性。相比较Suno，海绵音乐的音乐风格更符合国人的喜好。

AI新搜索, AI行业应用

MindSearch 是一个开源的 AI 搜索引擎框架

21 9 月, 2024

MindSearch是由上海人工智能实验室开发的一个基于大语言模型（LLM）和搜索引擎相结合的系统，旨在模仿人类在网络上寻找和整合信息的过程。性能可与 Perplexity.ai Pro 相媲美，能够处理超过 300 个网页的长上下文信息。而且是开源的，你可以轻松用它部署来构建您自己的搜索引擎。

AI行业应用, 多媒体处理

Canva 收购 Leonardo.ai，提升生成式 AI 能力

13 9 月, 2024

Canva 已收购澳大利亚 AI 初创公司 Leonardo.ai，获得了其文本转图像和文本转视频生成器的访问权限。此举加强了 Canva 在生成式 AI 市场的地位，有可能挑战 Adobe 的主导地位。
Leonardo.ai 的技术将被整合到 Canva 的 Magic Studio 产品中，而其平台将保持独立运营。此次收购正值 Canva 寻求扩展其创意套件并与 Adobe 的 Firefly 模型竞争之际。然而，Canva 面临对其数据训练实践的审查，需要应对围绕生成式 AI 的伦理问题。