當馬克·長谷川-詹森(Mark Hasegawa-Johnson)梳理他最新項目的數據時,他驚喜地發現了佛羅倫斯雞蛋的配方。他說,篩選數百小時的錄音會發現一兩件寶藏。
長谷川·詹森(Hasegawa Johnson)領導了語音無障礙項目,這是伊利諾伊大學厄巴納-香檳分校的一項倡議,旨在使語音識別設備對言語障礙者更有用。
在該項目首次發表的研究中,研究人員要求自動語音識別器收聽帕金森病相關言語障礙患者的錄音長達151小時(近六天半)。他們的模型轉錄了一個類似於錄音的新數據集,準確性比沒有聽到帕金森患者說話的對照模型高出30%。
該研究發表在《言語、語言和聽力研究雜誌》上。研究中使用的錄音可免費提供給希望改進語音識別設備的研究人員、非營利組織和公司。
伊利諾州電氣和計算機工程教授、該大學貝克曼高級科學技術研究所的研究員長谷川·詹森(Hasegawa Johnson)說:「我們的結果表明,大型非典型言語資料庫可以顯著改善殘疾人的言語技術。」該項目所在地。「我期待看到其他組織如何使用這些數據來使語音識別設備更具包容性。"
智慧型手機和虛擬助理等機器使用自動語音識別來理解聲音的含義,使人們能夠排隊觀看播放列表、口述免提消息、無縫參與虛擬會議並與朋友和家人進行清晰溝通。
語音識別技術並不適合所有人;尤其是那些患有帕金森病等神經運動障礙的人,這種疾病可能會導致一系列緊張、模糊或不和諧的言語模式,統稱為構音障礙。
長谷川·詹森說:「不幸的是,這意味著許多最需要語音控制設備的人可能在使用它們時遇到了最大的困難。」
「我們從現有的研究中了解到,如果根據某人的聲音訓練ASB,它就會開始更準確地理解他們。我們問:您能否通過將自動語音識別器暴露給一小群帕金森病患者來訓練它來理解帕金森病患者?
長谷川·詹森和他的同事招募了大約250名患有不同程度帕金森病相關構音障礙的成年人。在加入研究之前,潛在的參與者會見了言語病理學家以評估他們的資格。
該團隊的言語病理學家克拉里昂·門德斯說:「許多長期與溝通障礙作鬥爭的人,尤其是進行性溝通障礙,可能會退出日常溝通。」「他們可能越來越少地分享自己獨特的想法、需求和想法,認為他們的溝通受到影響太大,無法進行有意義的對話。
「這些就是我們要找的人,」她說。
選定的參與者使用個人電腦和智慧型手機提交錄音。他們按照自己的節奏工作,並在護理人員的可選幫助下,重複舊的口頭命令,例如「設置鬧鐘」,背誦小說中的段落,並通過打開複本提示表達意見,例如「請解釋為四人做早餐的步驟。"」。
對於後者,一位參與者列出了製作佛羅倫斯雞蛋、荷蘭醬等的步驟,而另一位參與者則務實地建議訂購送貨。
門德斯說:「我們從許多參與者那裡聽說,參與過程不僅令人愉快,而且讓他們有信心再次與家人溝通。」「這個項目為我們的許多參與者及其親人帶來了希望、興奮和活力--人類獨特的品質。"
她說,該團隊諮詢了帕金森病專家和社區成員,以開發與參與者生活相關的內容。提示是具體且自發的:例如,訓練語音算法來識別藥物名稱可能有助於最終用戶與藥房進行溝通,而隨意的對話開始者將模仿日常聊天的節奏。
「我們告訴參與者:我們知道你可以通過盡你所能的努力使你的演講更清晰,但是你可能厭倦了為了別人的利益而試圖被理解。試著放鬆和溝通,就像你在沙發上和家人聊天一樣,」門德斯說。
為了衡量語音算法的聽力和學習有效性,研究人員將樣本分為三組。第一組190名參與者(即,記錄151小時)訓練模型。隨著其性能的提高,研究人員通過將模型引入第二組較小的記錄來確認該模型正在被仔細學習(而不僅僅是記住參與者的反應)。當該模型在第二組中達到峰值性能時,研究人員用測試集對其進行了挑戰。
平均而言,研究團隊成員為每位參與者手動轉錄了400段錄音,以檢查模型的工作情況。
他們發現,在聽完訓練集後,ASB系統轉錄了測試集的錄音,單詞錯誤率為23.69%。相比之下,使用未患有帕金森病的人的語音樣本訓練的系統在轉錄測試集時的單字錯誤率為36.3%,準確性約低30%。
測試集中幾乎所有個體的錯誤率也有所下降。即使是言語不太典型(例如言語異常快速或口吃)的帕金森病患者,也經歷了適度的改善。
長谷川·詹森說:「我很高興看到如此巨大的好處。」
他補充說,參與者的反饋增強了他的熱情:
「我採訪了一位對這項技術的未來感興趣的參與者,」他說。「這就是這個項目的美妙之處:看看人們對他們的智能揚聲器和手部技能能夠理解他們的可能性有多興奮。這正是我們正在努力做的事情。"
原文在視頻下方的文字描述中
感謝您觀看此視頻。如果您喜歡,請訂閱並點讚。謝謝
原文:https://medicalxpress.com/news/2024-09-automatic-speech-recognition-people-parkinson.html
更多信息:Mark Hasekawa-Johnson等人,「社區支持的共享基礎設施支持語音無障礙」,《語音、語言和聽力研究雜誌》(2024年)。DOI:10.1044/2024_JSL HR-24-00122
貝克曼高級科學技術研究所提供
輸油管: