Claude

Claude3最新已经上线AWS

Anthropic太牛了。Claude-3 发布的两件事:

领域专家基准。我对饱和的 MMLU 和 HumanEval 不那么感兴趣。Claude特别挑选了金融、医学和哲学作为专家领域并报告性能。我建议所有 LLM 模型卡都遵循这一点,这样不同的下游应用程序就会知道该期待什么。

拒绝率分析。LLMs’对无辜问题过于谨慎的回答正在成为一种流行病。Anthropic 通常处于极端安全的一端,但他们认识到了这个问题,并强调了他们在这方面的努力。好极了!

Claude.ai更方便

直接复制粘贴用户原始声音到Claude,写上Prompt让AI去扮演产品经理去整理反馈类型和用户痛点