對聽障人士而言,在嘈雜場所中捕捉特定的說話內容是一件非常困難的事。據世界衛生組織預測,到2050年全球將有約25億人出現聽力問題。近日,波士頓大學開發出首次模擬人腦工作原理的新型聲音處理演算法BOSSA(Biologically Oriented Sound Segregation Algorithm),可為助聽器過濾干擾,在嘈雜環境中準確鎖定特定說話者的聲音。測試發現,該演算法在識別辭彙的準確率方面,相較當前助聽器所用的演算法提高40%,該研究成果已發表於《Communications Engineering》期刊。
BOSSA演算法的靈感來自大腦處理聲音的模式。該演算法開發者、波士頓大學工程學院生物醫學工程副教授Kamal Sen和其所在的“自然聲音與神經編碼實驗室”,多年來致力於研究大腦篩選不同聲源的機制,並探究神經回路如何壓制干擾信號,發現大腦通過“抑制性神經元”實現內部降噪,從而幫助個體聚焦某個特定聲源。
“它本質上就是一個模仿大腦功能的計算模型”,Sen表示。該演算法通過模擬人腦的神經機制,分析聲音的空間線索,如音量、聲源方向、傳入時間等,並根據個體需要“調諧”,適當增強或抑制不同聲源,從而真正將聲音源分離並優化處理。
為驗證BOSSA的實用性,波士頓大學健康與康復科學學院語言、語言學與聽力科學副研究教授Virginia Best召集一批患有感音神經性聽力損失的年輕人,使其在實驗室內佩戴耳機,模擬多人交談情境。
實驗分別測試了採用新演算法、傳統演算法與無演算法三種情境下受試者識別特定聲源的能力,結果顯示,傳統演算法幾乎無法改善識別效果,而BOSSA則帶來顯著提升。但Best也指出,“要確定這項技術最終是否對聽障用戶有幫助,還必須通過行為學研究才能驗證。”
更重要的是,該演算法的意義遠不止緩解聽力障礙。Sen認為,大腦神經回路是通用的,核心是聚焦注意力,他希望該技術能夠幫助更多有患有注意力缺陷障礙(ADHD)或自閉症的群體。當前,該團隊正測試升級版演算法,加入眼動追蹤功能,幫助用戶通過視線控制聚焦聽覺焦點,進一步提升演算法的交互性與實用性。
目前, Sen已為這款新演算法申請專利,希望能與對該技術感興趣的公司開展授權合作。他指出,“如果傳統助聽器企業不盡快創新,可能會被市場淘汰。”當前,蘋果公司的最新款AirPods Pro 2就已宣傳其具備臨床級助聽功能。“這是一個臨界點。若能將其及時落地,BOSSA有可能徹底改變助聽設備的語音處理方式”,Sen表示。
來源:中國澎湃新聞