AI行业应用

让 AI 通过 MCP 使用 Chrome 调试能力

Chrome DevTools MCP 可以让 Gemini、Claude 或是 Cursor 这类 AI 编码工具控制处于运行状态的 Chrome 浏览器,以此实现自动化操作、调试以及性能检测。
可以在自己的 MCP 配置中,通过npx chrome-devtools-mcp@latest这个命令轻松完成安装,之后只需要输入 “检测网站性能” 这类提示词,它就会自动完成追踪记录、截图、网络分析,并且可靠地修复问题。
这个工具能够让 AI 在网页编码方面的表现更智能,它可以实时验证修改内容、快速定位漏洞、提升网站运行速度,全程无需手动操作,为你带来帮助。
油管:https://youtu.be/YNwquBI20hE

从零开始学习构建智能 AI 智能体

该教程的内容十分全面,涵盖了 AI 智能体的基础概念、发展历史,还包含了实操项目,比如创建专属的 AI 智能体框架、构建多智能体系统。课程会教授多项实用技能,比如记忆管理、上下文处理、通信协议,以及大语言模型的训练方法。跟着这个教程学习,你可以深入理解相关知识,同时获得真实的编码实践经验,从单纯使用 AI 模型,进阶到自主设计智能系统。这能够帮你培养高阶的 AI 技能,这些技能对求职、科研,或是打造创新 AI 应用都很有帮助。相关学习材料在线上发布,随时都可以轻松获取。
油管:https://youtu.be/D1UUyKB3bfc

VibeSDK应用生成、运行、托管的平台

Cloudflare VibeSDK 能让你仅通过自然语言描述需求,即可创建基于人工智能的网络应用。它是一款开源工具,运行于 Cloudflare 平台之上,可提供安全、隔离的环境,支持一键式快速完成应用的构建、预览与部署。你可以自定义 AI 的行为模式、管控代码范式,同时保障数据隐私。
油管:https://youtu.be/szm99yk5qXo

从 Prompt 到 Agent:agents项目

一段谁也不敢改的“超级 Prompt”。
wshobson/agents 这个项目,关注的正是这个问题本身:
当 AI 不再只是聊天,而是参与真实任务时,我们应该如何“工程化”它。
油管:https://youtu.be/GDcv83yuFI0

Argos离线可用的开源机器翻译工具

Argos Translate 是一个基于神经网络、完全离线运行的机器翻译系统。
它基于 OpenNMT 框架,可以在 CPU 上执行翻译模型,支持多语言包切换,并提供 CLI、GUI 和 Python API。
一个可以在你电脑本地运行的开源 Google Translate。
油管:https://youtu.be/fuNJrBCO0gc

Kandinsky5.0:视频与图像生成的扩散模型系列

旗舰版 Video Pro 的视觉质量媲美 Veo 3,并超越 Wan 2.2-A14B,而 Video Lite 与 Image Lite 则为实时应用场景提供快速且轻量化的替代方案。该套件由高性能开源视觉编码器 K-VAE 1.0 驱动,具备强大压缩能力,并为生成式模型训练奠定坚实基础。整个技术栈在性能、可扩展性与实用性之间取得平衡。
油管:https://youtu.be/C00vTubNf5I

arXiv Paper Curator:AI 科研助手

在信息爆炸的时代,arXiv 上每天都有成百上千篇论文发布。
无论你关注 AI、数学、物理还是计算机系统,手动筛论文、写摘要、整理阅读清单 都是一件极其耗时的事情。
GitHub 项目 arxiv-paper-curator 提供了一个优雅的解决方案

LEANN能让你的笔记本电脑变身私人 AI 助手

针对这一问题,LEANN(Light Embedding-based AI Neural Network)项目提出了一种创新的解决方案。LEANN不仅显著减少了存储需求,而且通过高效的计算方式,提供了一个强大的、隐私保护的个人AI助手系统。它采用了按需计算嵌入(on-demand embedding computation)技术和图结构选择性重新计算(graph-based selective recomputation)方法,旨在以较低的存储消耗为用户提供准确的人工智能服务。
报道:https://youtu.be/YRoJnaZR2hw

GigaChat 3:下一代专家混合(MoE)模型

GigaChat 3 项目是由俄罗斯的一个开发团队——Salute Developers(萨路特开发者团队)主导的。
在人工智能领域,随着对话系统的不断发展,新的技术与架构不断涌现。在众多创新中,GigaChat 3作为一个开源的专家混合(MoE)模型,凭借其强大的性能和高效的推理能力,成为了值得关注的项目之一。
油管:https://youtu.be/GE9w0tBULGw

Tinker Cookbook:4 个最核心的训练示例

您可以使用 Tinker 和 Tinker Cookbook 轻松微调大型语言模型(LLM),满足您的特定需求,而无需管理复杂的训练基础设施。Tinker 负责分布式训练,并使用高效的 LoRA 适配器来降低成本并加快定制速度。Cookbook 提供了现成的示例和工具,适用于聊天、数学推理和强化学习等任务,帮助您快速构建和改进 AI 模型。

nanoGPT:用最小代码理解 GPT 是怎么训练出来的

Star 数:48.4K+ 最简洁、高效的 GPT 训练与微调仓库,300 行代码实现中等规模 GPT nanoGPT 是 Andrej Karpathy 推出的开源项目,旨在提供最简单、最快的从零训练或微调中等规模 GPT 模型的代码库。它基于 PyTorch,重写了 minGPT 以优先性能,适合初学者快速上手 Transformer 架构,同时支持专业级实验,如复现 GPT-2 在 OpenWebText 上的结果。
油管:https://youtu.be/ySZQOiJWMWU

Agent-S:让 AI 像人类一样操作电脑的开源框架

Star 数:7.7K+ 开源代理框架:像人类一样使用电脑,实现自主 GUI 交互与任务自动化 Agent-S 是 Simular AI 开发的开源代理框架,旨在让 AI 代理像人类用户一样自主操作电脑。
它通过 Agent-Computer Interface 实现复杂 GUI 交互,支持跨平台桌面环境自动化,已在 OSWorld 等基准上达到 SOTA 性能。该项目强调零样本泛化与安全执行,适用于研究与生产级代理开发。
油管:https://youtu.be/4DXNYzfplPs

Memori :用来让大模型“拥有长期记忆”的开源框架

不管你讲了多少偏好、资料、习惯、背景信息——下一次对话,它又是一个新的 AI。
但如果我们想做一个真正的 AI 助理、AI Agent、知识管理系统,就必须让模型能记住东西。
这正是 Memori(GibsonAI/Memori) 想要解决的问题。
油管:https://youtu.be/nqv9VeANaSw

ebook2audiobook:中文快速上手指南

AI 驱动的电子书转有声书工具,支持语音克隆与 1100+ 语言 ebook2audiobook 是一个开源项目,由 DrewThomasson 开发,专注于将非 DRM 电子书(EPUB/MOBI 等)自动转换为高质量有声书。它集成多种先进 TTS 模型,支持章节拆分、元数据嵌入、语音克隆与多语言输出,提供 Gradio Web UI、CLI 与 Docker 部署选项。
油管:https://youtu.be/VRVhzdaYFXg

免费可以轻松创建专业的前后对比的工具

支持多种对比布局,包括并排展示、交互式滑块、分割视图和垂直堆叠,适用于展示健身变化、家居装修、美容效果等多种场景。只需上传两张图片,选择所需的布局,添加标签,即可生成高质量的对比图或视频。
油管:https://youtu.be/fyzayHwjFGc

MinIO:开源版的 Amazon S3

高性能开源对象存储,S3 兼容,专为 AI/ML 与大数据优化 MinIO 是一个高性能、S3 兼容的对象存储解决方案,由 MinIO 团队开发并以 GNU AGPLv3 许可开源。
它专为云原生环境设计,支持大规模数据湖、AI/ML 工作负载与分析管道,提供无缝的 AWS S3 API 集成与企业级耐用性。该项目强调速度与可扩展性,已成为 Kubernetes 原生存储的首选,已被全球数千组织采用。
油管:https://youtu.be/3D5-n6cCwMQ