蘋果研究院質疑人工智慧推理

蘋果研究員Mehrdad Farajtabar等人發表的一篇論文質疑了大型語言模型（LLM）的推理能力，認為LLM所謂的「推理」能力實際上只是複雜的模式匹配，而不是真正的邏輯推理。
研究團隊開發了GSM-Symbolic工具，用於基於GSM 8 K測試集生成符號模板，發現當前Llama、Phi、Gemma、Mistral等LLM開源模型以及GPT-4 o、o 1系列等閉源模型對專有名詞和數字的變化非常敏感，表現出對數學概念的理解不足。
實驗結果表明，即使隨著參數和數據量的增加，LLM的推理能力並沒有得到實質性提高，而只是成為「更好的模式匹配器」。"

六名蘋果人工智慧研究人員（其中一名是實習生）在預印本平台arxiv上發表了一篇論文《GSM-Symbolic：理解大型語言模型中數學推理的局限性》，他們發現大型模型無法正式推理。研究人員表示，GSM 8 K基準被廣泛用於評估大型模型在小學水平問題上的數學推理能力。過去幾年，大型型號在GSM 8 K上的性能有了明顯提升，但它們的數學推理能力真的提高了嗎？
研究人員使用符號模板創建了改進的基準GSM-Symbolic，可以對大型模型的推理能力進行更可控的評估。結果表明，大模型不具備真正的邏輯推理能力。僅僅改變問題的一定值或添加一個條款就會顯著降低大型模型的性能。

原文：https://arxiv.org/pdf/2410.05229

Meta研究人員認為大模特比貓還笨

Meta高級研究員、紐約大學教授Yann LeCun認為，對人工智慧威脅人類的擔憂是無稽之談。他喜歡用貓來類比，貓擁有物理世界的心理模型、持久的記憶以及有限的推理和規劃能力。最先進的大型型號並不具備所有這些。Yann LeCun於2018年榮獲圖靈獎，表彰她與Yoshu Bengio和Geoffrey Hinton一起對深度學習的貢獻，後者今年也獲得了諾貝爾獎。LeCun認為人工智慧是一個強大的工具，但今天的人工智慧無論如何都不能被稱為智能。然而，科技行業的許多人，尤其是人工智慧初創公司，都以荒謬的方式輕信其最近的進展。他認為，創造通用人工智慧可能需要幾十年的時間，而當今的主流方法無法讓我們實現這一目標。大型模型只是預測文本中的下一個單詞，受益於其巨大的記憶容量，它們似乎在推理，但實際上只是機械地重複已經訓練的信息。

原文：https://tech.slashdot.org/story/24/10/13/2220258/ai-threats-complete-bs-says-meta-senior-research-who-thinks-ai-is-dumber-than-a-cat

該男子通過蘋果AI的短信得知分手的消息

紐約程式設計師尼克·斯普林（Nick Spreen）周三通過iPhone 15 Pro AI功能Apple Intelligence Beta提供的短信摘要功能得知了分手消息。
他在社交媒體上分享了這一消息，人工智慧匯總了女友發送的多條短信，宣布分手，稱他想從公寓取回自己的物品。
蘋果於今年6月發布了Apple Intelligence，目前正在進行公開測試。
Spreen在自己的iPhone上運行了測試版。它類似於ChatGPT的簡化版本，通過讀取用戶收到的短信提供摘要版本。

原文：https://entertainment.slashdot.org/story/24/10/10/228207/man-learns-hes-being-dumped-via-dystopian-ai-summary-of-texts

Adobe開始推出生成式人工智慧視頻工具

當地時間14日，Adobe表示已開始公開發布一種可以根據文本提示生成視頻的人工智慧模型，加入了越來越多試圖利用生成的人工智慧顛覆影視製作的公司的行列。這項名為Firefly Video Model的技術將與OpenAI今年早些時候推出的Sora競爭。
Adobe將開始向加入等候名單的用戶提供該工具，但沒有透露具體的發布日期。Adobe表示，已將一項功能集成到其視頻編輯軟體Premiere中，允許用戶使用生成性人工智慧來擴展視頻剪輯。
其他在線工具允許用戶根據文本提示和現有圖像創建視頻。

本文原文的連結均位於視頻下方的描述欄中。
感謝您觀看此視頻。如果您喜歡，請訂閱並點讚。謝謝

輸油管：