AI助手的新語音聊天功能
在Pixel 9發布會上,谷歌推出了Gemini的新語音聊天模式,名為Gemini Live,現已向高級訂閱者開放。該功能允許用戶通過多個語音選項進行自然對話,並支持中斷而無需單擊按鈕。用戶可以暫停討論並稍後恢復,從而增強對話流程。
Gemini Live目前正在Android設備上推出英語版本,並計劃在未來幾周內支持iOS和其他語言。該更新還引入了十項新的語音和上下文感知功能,允許用戶詢問屏幕或視頻上顯示的內容。其他即將推出的功能包括Keep和YouTube Music等應用程式的擴展。
谷歌在今天的Pixel 9系列手機發布會上發布了其AI語音助手Gemini Live。Gemini Live是OpenAI ChatGPT推出的最新高級語音模型,可以進行更連貫、更有情感表達力、更真實的對話。
Gemini Live支持免提操作,使其在後台始終保持運行,Gemini Live允許用戶與Gemini進行類似於真人的自由對話。用戶可以在對話過程中隨時打斷Gemini的回應以深入研究特定主題,或者暫停對話並稍後在不丟失上下文的情況下繼續。這種體驗使與人工智慧的交互更加直觀和靈活,類似於與實時助理的通信。
雙子座實時:充滿希望但略顯尷尬的語音助理體驗
新的語音助手Gemini Live在提供解決方案的速度方面表現出色,在最近的一次測試中,它在大約15秒內給出答案,比Google Assistant快得多。然而,由於其擬人化性質,用戶報告稱,在與其互動時會遇到一些尷尬。The Verge的最初經歷凸顯了打斷助手的挑戰;它經常在沒有提示的情況下繼續說話。
例如,當被問及狗對娛樂有何看法時,Gemini Live給出了一個冗長的回答,感覺更像是「說教」,並導致用戶感到沮喪。相比之下,另一位測試者發現參與更容易,並毫不猶豫地收到創意建議,例如創建《龍與地下城之戰》。
Gemini Live目前面向在功能強大的Android設備上擁有Gemini Advanced訂閱的用戶提供;iOS用戶將不得不等待更長時間才能訪問它。隨著該產品的進一步推出,預計它將與其他數字助理進行比較,例如OpenAI的ChatGPT語音助理和蘋果的Siri。
Gemini Live語音對話功能現已提供:
- 可以隨時中斷
- 實時視頻解讀
- 10+個聲音可供選擇
- 從今天開始,擁有Gemini Advanced訂閱的Android用戶將開始灰度測試該功能,目前僅支持英語
- iOS版本將在未來幾周內推出
如果您想了解更多信息,可以單擊視頻下方的連結。
感謝您觀看此視頻。如果您喜歡,請訂閱並點讚。謝謝
原文:https://www.theverge.com/2024/8/13/24219553/google-gemini-live-voice-chat-mode
輸油管:
