2007年11月26日 星期一

[摘要]Speech signal modification to increase intelligibility in noisy environments

1 意見

撰稿人:賴穎暉 (陽明大學醫工所聽語工程實驗室/博士研究生)
審稿人:蔡昆憲 (陽明大學醫工所聽語工程實驗室/博士候選人)

文章原始出處:
篇名:Speech signal modification to increase intelligibility in noisy environments
作者:Sungyub D. Yoo, J. Robert Boston, Amro El-Jaroudi, Ching-Chung Li, John D. Durrant, Kristie Kovacyk, and Susan Shaiman
出處: J. Acoust. Soc. Am., 122(2), pp: 1138-1149.
出版年份: 2007

研究動機:
此篇文章的研究動機主要想找出一個新的演算法,來提高語音於噪音環境下之語音理解度,並將此演算法實際運用於聲音處理裝置,讓使用者能於噪音環境中有更佳的語音溝通效果。



研究方法:
對於一段語音來說,可以將其分解成兩個成份,其分別為:穩定成份 (quasi–steady-state, QSS)及轉變成份 (transition component),作者基於此理論,將語音利用圖1.1之訊號處理方法分解出穩定成份與轉變成份。


(圖1.1) 轉變成份=語音訊息-穩定成份



接著把分解出之”轉變成份”乘上放大係數K值產生修改語音,其修正後之語音為:

S修正語音(t) = m*(S原始語音(t)+K*S轉變成份(t))


再利用Mackersie於1999年提出之單字監聽測驗進行實驗,每次使用六個不同的短音節字透過此演算法處理後配合TDH-39耳機於六個不同的SNRs (-25,-20,-15,-10,-5,0)噪音環境下進行播音測驗,藉此觀察出修正後之語音的效果。

研究結果與討論:
經過此演算法處理後,將分解出之穩定成份及轉變成份各別進行語音理解度實驗,發現到穩定成份雖然為一段語音下主要的能量,卻為一個低語音理解成份;然而轉變成份雖只有較少的能量,但卻是一個高語音理解成份。經過字詞測驗證明,轉變成份對於一段語音辨識上來說是非常重要的。圖1.2為此實驗結果,可以看見轉變成份之語音理解度只有輕微的低於原始語音,而穩定成份之語音理解度卻遠低於原始語音。

(圖1.2)實驗結果



(圖1.3)實線-原始語音,虛線-修正後語音



作者再將修改語音置於不同的SNR環境中做字詞測驗,發現在較低SNR (-25,-20,-15)之語音環境下,透過此演算法的修改,可以增加語音理解度,改善語音於噪音環境下的語音理解度,其實驗結果如圖1.3,橫軸表示SNR的改變、縱軸表示語音辨識正確率。因此作者認為,在較低SNRs環境中,對轉變成份做適當放大,有助於提高語音理解度,得到更佳的語音溝通效果。

個人心得:
此篇文獻主要想找出一個新的演算法,能使語音於較低的SNR環境中,也能有較佳的語音辨識度。經過實驗後,發現對於語音辨識來說,轉變成份是一個非常重要的因素,對此成份做合適的放大,會讓語音於噪音環境中的辨識度增加;基於此結果,讓我覺得或許能將此運用於許多的語音播放裝置中(如:手機、助聽器等),使其聲音接收者能於噪音環境中,有較高的語音理解度,使溝通更有效率。

[摘要]Unilateral hearing loss in children: A mountain or a molehill?

0 意見

撰稿人:張秀雯 (振興醫院聽覺醫學中心/聽力師)
審稿人:蔡昆憲 (陽明大學醫工所聽語工程實驗室/博士候選人)

文章原始出處:
篇名:Unilateral hearing loss in children: A mountain or a molehill?
作者:Anne Marie Tharpe
出處: The Hearing Journal, 60(7), pp: 10-16.
出版年份: 2007

文章內容摘要:
這是一篇回顧性的文章,作者Anne Marie Tharpe透過淺顯的文字敘述,以問答的方式為讀者說明單側聽損對於兒童的影響。在文章中,作者整理了歷年來學術界中對於此一主題的研究結果,摘要如下:



1. 單側聽損兒童在學校被留級的機率是聽常兒童的10倍,其中又有35%需要學業資源的協助(Bess et al, 1986)。
2. 單側聽損兒童中有20%有行為上的問題。
3. 有一些單側聽損兒童呈現學習上的困難,但是有一些卻沒有。有研究報告發現單側聽損發生在右耳時較容易導致學業上的困難(Bess et al, 1986; Hartving, et al, 1989)。另外,聽損的嚴重度亦是影響因素之一。有學者亦指出,導致單側聽損的病灶可能是造成學業成績低落的主因,例如,「巨細胞病毒」(cytomegalovirus, CMV),在美國是造成習語前兒童單側聽損的主要原因之一,亦會導致神經系統的缺陷,進而造成學習上的障礙(Nance, 2007)。
4. 在出生時單耳未通過聽力篩檢的嬰幼兒中有40%後續發展為雙耳聽損(Neault, 2005)。
5. 相較於聽常兒童,一般認為單側聽損兒童在吵雜環境中呈現聽取上的困難,對於音源的辨位能力較差。然而,有研究指出,即使是語音來自於好耳側、噪音在壞耳側的狀況下,單側聽損兒童仍有聽取上的困難(Tharpe, 1986)。此研究結果點出了一般建議單側聽損兒童在教室中的座位安排(preferential classroom seating)並非真正的有幫助。

對於單側聽損兒童是否需要聽覺輔具的協助,作者建議聽力師們採用問卷的方式讓家長填寫,以評估這群兒童在日常生活中的聽取能力,並以問卷結果作為選配輔具與否的依據。可採用的問卷包括CHILD(Children’s Home Inventory for Listening Difficulties)與SIFTER(Screening Inventory for Targeting Educational Risk)。

一般對於單側聽損兒童適合使用何種聽覺輔具有許多的爭議。作者所整理的文獻報告中,以個人化的調頻助聽系統(personal FM system)提供最顯著的成效。例如,Kenworthy與其研究團隊在1990年的報告中比較使用「對側傳導型助聽器」(CROS)、個人化調頻助聽系統、未配戴任何助聽輔具三種情況下所測得的語音理解分數,結果顯示以個人化調頻助聽系統所提供的效果最為顯著。亦有學者比較壞耳側配戴助聽器、使用對側傳導型助聽器、以及個人化調頻助聽系統的差異(Updike, 1994),結論仍為調頻系統提供最佳的語音辨識能力。

作者目前並不建議單側聽損兒童使用骨導植入式助聽器(Bone-Anchored Hearing Aid, BAHA),因為尚未有具體的文獻證據顯示此種輔具對於單側聽損兒童的幫助。

作者最後列舉出幾個有待學術界回答的問題:
1. 單側聽損兒童在教室外是否需要使用助聽器呢?
2. 助聽器對於各種單側聽損程度是否均有幫助呢?
3. 單側聽損耳助聽後是否有雙耳的優勢呢?
4. 如何在一群單側聽損兒童中鑑別出可能影響其學習能力的個案?

個人心得:
在臨床上所觀察到單側聽損的影響似乎也與患者本身適應能力及學習能力呈現相關。有些患者完全不以為意,直到成年接受健康檢查時才發現單耳失聽的狀況。但是也有些患者將單側聽損所造成的影響視為洪水猛獸般,將生活中一切的不順利均歸因於一耳失聽。後者對於聽覺輔具的接受度極高,即使是只有些微的幫助,也願意花錢購買高價的輔具。有趣的是,這些患者本身對於輔具的效益,似乎與時間呈現負相關,從剛開始使用時的高滿意度,經過一段時間後,有些患者就將輔具收在抽屜中不用了。如何鑑別出會持續使用輔具的患者應是一有趣的研究主題。

[摘要]Language Progress of Children Using Advanced Hearing Aids: A Multisite Clinical Research Project Report

0 意見

撰稿人:張慧珊 (陽明大學醫工所聽語工程實驗室/博士研究生)
審稿人:張秀雯 (振興醫院聽覺醫學中心/聽力師)

文章原始出處:
篇名:Language Progress of Children Using Advanced Hearing Aids: A Multisite Clinical Research Project Report
作者:Jane Auriemmo, Chi Lau, and Frances Kuk
出處: The Hearing Review, 2007(July)
出版年份: 2007

研究動機:
因為新生兒聽力篩檢的普遍,所以可以早期診斷出聽損嬰幼兒、早期為他們選配助聽器。此外,助聽器科技越來越進步,因此聽力師為他們選配助聽器時也越來越具有挑戰性。助聽器高階的功能包括寬頻動態範圍壓縮(WDRC)、低壓縮閾值(CT)、多頻道與有效的回饋音消除系統等,這些高階功能可以使聽損的嬰幼兒聽得更好;但這些高階功能並沒有被所有的人認同,尤其是嬰幼兒使用噪音消除系統(噪音環境中聽得更舒適)與方向性麥克風系統(噪音環境中聽得更清晰)的議題更是爭論不休,因為學者們認為使用這些功能或許會剝奪孩童們伴隨性的學習(例如:”隨機聽取的能力”的機會);更糟的情況還會影響孩童們的溝通與語言能力的發展。美國聽力學會(AAA)和疾病控制與預防中心-早期聽覺偵查與介入計畫認為這個議題需要一些研究報告,因此他們建議可以評估孩童使用不同助聽器科技(特別是噪音消除系統與方向性麥克風系統)後的語言發展狀況。因此,本文的研究目的即是追蹤49位孩童配戴有噪音消除系統與全自動方向性麥克風之高階助聽器後的語言/言語發展。



研究方法:
2001年,Widex公司執行了嬰幼兒聽覺協助計畫(PHAP),這個計畫即是提供高階助聽器給家庭經濟較貧困的孩童,唯一條件就是需要定期到Widex公司雇用的10個嬰幼兒選配診所追蹤他們的語言/言語發展狀況。一共有49位孩童(25男24女;年齡從2個月到13歲;25位小於5歲,24位大於5歲)參與此計畫,他們所配戴的助聽器分別是Widex Senso Diva SD9M與SD19M(強力款)的耳掛型助聽器,此款助聽器的功能特色為15個獨立頻道、低壓縮閾值 (可能是0 dB HL)與五階段自動壓縮之輸入-輸出功能操作、自全動雙麥克風系統、噪音消除器(大於語音的音量才會啟動)與語音強化系統(speech intensification system, SIS)。小於5歲的孩童每6個月評估一次,而大於5歲的孩童則每一年評估一次。使用的評估工具分別為Receptive Expressive Emergent Language Test (REEL3), Pre-School Language Scale 3, 4 (PLS3, PLS4), Test of Auditory Comprehension of Language, Revised (TACL-R), Comprehensive Assessment of Spoken Language (CASL), Oral & Written Language Scales (OWLS), Goldman Firstoe Test of Articulation 2 (GFTA2), Carolina Picture Vocabulary Test (CPVT), Peabody Picture Vocabulary Test (PPVT III, PPVT III-A and B), Expressive Vocabulary Test (EVT), Expressive One Word Picture Vocabulary Test (EOWPVT),這些工具是用來評估孩童們的語彚接收與表達、語意、語用的語言結構及高階層的語言處理能力。

研究結果與討論:
參與PHAP計畫的聽損孩童在語言接收與語言表達較正常聽力的同儕有較大的進步。小於5歲孩童的進步速度比大於5歲的孩童快。而在選配助聽器6個月後,小於5歲孩童的整體語言成績已經很接近正常聽力的同儕。因此本文研究結果即是:助聽器在噪音環境中可提昇語音清晰度的功能對嬰幼兒的語言發展將不會有負面的影響。

個人心得:
以前在嬰幼兒助聽器選配時,比較不會選擇噪音消除器或方向性麥克風等功能來使用,因為擔心嬰幼兒不會主動尋找聲源而會遺漏掉某些方向來的聲音,或是剝奪了他們"隨機聽取的能力"的機會。但是隨著助聽器科技的日新月異,助聽器的功能越來越方便,也越來越容易使用,例如:自動性方向性麥克風,可以自己尋找語音聲源,壓抑環境噪音;或是當環境中有較大音量的環境噪音出現時,助聽器會自動開啟噪音消除器,使嬰幼兒在噪音環境中聆聽更舒適。當今助聽器有如此多且好的功能可以使用,而且本篇研究也讓大家明白這些功能不會影響嬰幼兒的語言/言語發展,所以建議在選配嬰幼兒的助聽器時,這些較高階的功能應該可以考慮讓他們使用。

2007年11月25日 星期日

[摘要]New algorithm is designed to take the annoyance out of transient noise

0 意見

撰稿人:姚讚峰 (陽明大學醫工所聽語工程實驗室/碩士研究生)
審稿人:張秀雯 (振興醫院聽覺醫學中心/聽力師)

文章原始出處:
篇名:New algorithm is designed to take the annoyance out of transient noise
作者:Josef Chalupper and Thomas A. Powers
出處:The Hearing Journal, 60(7), pp: 42-48.
出版年份: 2007

研究動機:
背景噪音長久以來在助聽器的處理上都是一個很大的議題,它除了會造成語音理解度的下降外,還有可能對配戴者帶來十分大的困惱,這會讓助聽器配戴者產生不好的經驗,進而將選購的助聽器棄之不用。2007年七月,Hernandez與其研究團隊在The Hearing Review中發表了一篇文章”An Assessment of Everyday Noises and Their Annoyance”,文中對於在真實環境中常發生的噪音種類百分比以及各種噪音種類造成助聽器配戴者的困擾程度做統計,結果顯示環境中的短暫噪音(如碗盤撞擊的喀喀聲)占了環境各式噪音的33%。而各種噪音所造成的困惱程度,從完全沒有困惱到十分困惱可劃分為0~10,11個困惱程度指數,其中短暫噪音的困惱程度指數統計為5.8。依據以上的數據我們可以知道短暫的噪音對於助聽器配戴者會造成一定程度的影響。因此在這篇文章中,西門子的助聽器-CENTRA-提出一個針對短暫噪音處理的新架構,希望在助聽器的噪音處理上能更加改善。

研究方法

對於短暫噪音的處理我們可以由上面的架構流程圖來做說明,這種短暫噪音處理的新演算法稱之為SoundSmoothing。首先,把輸入訊號分成頻域以及時域兩種型態,頻域上的分析是希望在做某頻帶的噪音削減時,不會影響到其他頻帶的訊號增益大小,而時域部分則需要有較高的解析度以及小於1毫秒的延遲時間來完成短暫噪音的削減。接著把訊號的尖峰值作封包的動作,得到的封包型態便可以跟語音的形態作比對,藉此將非語音的部分萃取出來,再來就可以在判斷為短暫噪音的頻帶上做增益的修改,最後訊號合成處理完便可以在輸出訊號中得到短暫噪音消除後的訊號。經過以上的處理,短暫噪音可以大幅減少40dB,這將會減少配戴者對於短暫噪音的困擾程度。

這樣的噪音處理並不會與其他種噪音處理功能相衝突。針於穩定的噪音,可以使用數位噪音削減(Digital noise reduction,DNR)來做處理,而在短暫的噪音處理則使用SoundSmoothing。在兩者的合併使用下,助聽器對於噪音的處理功能將會更為強大。

研究結果與討論:
澳洲國家聲學實驗室(Australia´s National Acoustic Laboratories,NAL)、德國的Giessen大學醫院、以及Oldenburg大學對於具有SoundSmoothing效能的西門子助聽器-CENTRA-,分別做實驗室測試以及實際環境的臨床測試,其結果表示在SoundSmoothing功能開啟時,配戴者的困惱程度指標都會比功能關閉時的指標要來的小,此現象在較大聲或較短暫的刺激音下尤其明顯。因此SoundSmoothing的處理對於助聽器配戴者的噪音困惱,的確是有所改善。

個人心得:
噪音處理一直都是個熱門的議題,這方面技術的應用不只在助聽器上,在許多日常生活的電子產品或公司工廠都可以看到噪音削減技術的應用。這篇文章提供了一個更多元的應用角度,讓我們可以不只用一種技術去做噪音削減的處理,而是由多方面來提升噪音削減的功能,我想在未來的噪音處理也會朝著這種方向去進行,讓多種技術可以互相發揮其功能,達到最佳的噪音處理效果。

2007年11月15日 星期四

[摘要]Effects of noise and distortion on speech quality judgments in normal-hearing and hearing-impaired listeners

0 意見

撰稿人:李讓 (陽明大學醫工所聽語工程實驗室/碩士研究生)
審稿人:蔡昆憲 (陽明大學醫工所聽語工程實驗室/博士候選人)

文章原始出處:
篇名:Effects of noise and distortion on speech quality judgments in normal-hearing and hearing-impaired listeners
作者:Kathryn H. Arehart, James M. Kates, Melinda C. Anderson, and Lewis O. Harvey, Jr.
出處:J. Acoust. Soc. Am., 122(2), pp: 1150-1164.
出版年份:2007
關鍵字:語音音質判斷(speech quality judgments)

研究動機:
本篇研究論文探討聽常者以及聽損者在不同程度的噪音及失真情況下對聲音品質的感知及預測;希望由此模擬並比較助聽器等成音裝置產生的噪音及失真對語音音質感知的影響。



研究方法:
助聽器的噪音及失真現象可能源自外部環境的噪音、助聽器內部噪音削減等演算法以及收音播音器材的限制等等。本研究以三種信號處理方法,每種狀況分成八級,共24種條件,來模擬及量化助聽器的噪音及失真情形。如下表所示:

兩則句子語料分別經過24種條件的處理後(兩則句子共有24*24=576種組合方式),播放給14名聽力正常以及18名聽損(聽損程度輕重不一)受測者。受測者要選擇其中一則感知上音質較佳的句子語料;全體受測者對於同組語料(共有576組)的選擇結果經累加後可得該組語料的『偏好值』(preferences)。

研究結果與討論:
原始的實驗結果是兩個24*24的二維矩陣,分別記錄14名聽力正常以及18名聽損受測者的偏好值。

原始的實驗結果經過『相同條件內』(兩則句子語料在同一種噪音失真情形但不同程度下)及『相異條件間』(兩則句子語句分別在不同的噪音失真情形下)的變異數分析(ANOVA)可得到六組『偏好計分』(preference scores),分別是:附加噪音、尖峰削波、中心削波在相同條件內變異數分析下的偏好計分以及附加噪音、尖峰削波、中心削波在相異條件間變異數分析下的偏好計分。在三組條件內變異數分析中,聽常者及聽損者兩群體並無明顯差異;暗示兩群體於同類種噪音失真下對音質感知判斷的機制相同;相比之下,在三組條件間變異數分析中,兩群體間存在明顯差異;暗示聽力正常者及聽損者於不同噪音失真下對音質感知判斷的機制不相同。

進一步地,作者對原始資料進行不同噪音失真程度間的一維及多維模型分析(模型分析的詳細作法,請見page1158~1162),得到以下幾點結論:
1. 一維分析結果精確的預測兩群體的音質感知判斷;這暗示可聽度可能是音質感知判斷的因素之一。
2. 當受測者為重度聽損時,預測的精確度降低;這可能源於不完整的模型分析。
3. 語音音質感知也可能受其他額外因素影響。多維度的分析指出,需要若干維度才能較全面的解釋受測者判斷不同噪音失真種類下的模型。

本研究中所提的模型是簡化的。更複雜的周邊聽損模型將更精準的預測。這些更複雜的周邊聽損模型將考慮更多因素,諸如:較寬的聽覺濾波器、遮蔽效應等等。

個人心得:
本研究的實驗方法、實驗流程及原始的結果都非常簡單,然而在結果討論部分,應用了現代的多維度模型分析來解釋數據。讀者在讀本篇原文時,要特別注意不同分析方法之間的差異(如:within conditions、across conditions、across degradation、one dimensional及multi-dimensional等等),以及作者如何解釋分析的結果。有關於模型分析部份,較為抽象,也應用了較為複雜的數學式,雖然不易理解,卻也是本篇研究最富原創精神的所在。讀者若欲分析聽知覺實驗結果,本實驗的分析方法,可以好好參考參考。

[摘要]Amplified Telephones: Past, Present, and Future

0 意見

撰稿人:何承諭 (陽明大學醫工所聽語工程實驗室/碩士研究生)
審稿人:蔡昆憲 (陽明大學醫工所聽語工程實驗室/博士候選人)

文章原始出處:
篇名:Amplified Telephones: Past, Present, and Future
作者:Carsten Trads
期刊名:The Hearing Review
期號:July
年份:2007

文章內容摘要:
作者Carsten Trads是Clarity公司的總裁,公司主要專注在為聽損者提供放大電話(amplified telephones)、通報系統(notification systems)、助聽輔具(assistive listening devices)與其它溝通輔具(communication devices)。作者在文章中,簡要回顧了放大電話過去、現在與未來的發展。摘要如下:



1. 聽力損失是年邁的美國人是第二常見的症狀,而且根據研究顯示在年輕一代的美國人中,這個狀況也越來越常見。根據EAR Foundation and Clarity的研究指出,約有一半的美國戰後嬰兒潮世代(現在年齡在43到61歲之間,約有3800萬人)具有某種程度的聽力損失。且這些具有聽損的人中,只有26%的患者有使用某種型式的助聽輔具。助聽器通常是最佳的選擇,但許多有需求的人卻因為助聽器過於昂貴或保險不給付而無法使用。

2. 數位訊號處理(DSP)這項技術在1987年最先被使用,後來在1990年代後期被廣泛的應用在助聽器上,而這項技術降低助聽器的環境噪音與回饋音,進而提升配戴的舒適度。

3. 作者發展DCP(Digital Clarity PowerTM)的技術來消除通話時的背景噪音,內建DCP晶片的電話可以執行許多演算法以改善聆聽環境。例如,有一種演算法可以將冷氣機發出的那種固定的噪音消除,使得溝通更佳方便。

4. 現今放大電話的消費者對電話的功能講求多功能,除了來電顯示、來電等待、聽筒麥克風以及數位答錄系統之外,針對聽損者還需包含高亮度按鍵、視覺性的鈴聲以及頭戴式響鈴(headset alerts)等功能。這些講究人因工程的產品證明了針對聽損者市場的需求。儘管在聲音處理上的改善,放大電話由於成本與獲利上的考量仍然還無法突破無線電話的瓶頸。

5. 未來放大電話將可整合其它溝通裝置,甚至可以配合網路來彼此連結。透過ZigBee技術、無線網路和乙太網路技術的發展,網路產品的應用將可以提供遠端監控與遠端感測的服務。ZigBee可以應用在聽損者的通信與感測,例如,無線網路的居家安全通報、遠端的溫控系統以及火災的感測系統等。

個人心得:
從這篇文章發現將訊號數位化之後,有別於類比訊號,經由數位訊號處理技術可以對訊號作更多改善。DSP(Digital Signal Processer)技術將會在語音處理上扮演更關鍵的角色。