音質的評價
何謂聲音的質量
所謂聲音的質量,是指經傳輸、處理後音頻信號的保真度。目前,業界公認的聲音質量標準分為4級,即數位鐳射唱盤 CD-DA 質量,其信號帶寬為 10Hz~20kHz;調頻廣播 FM質量,其信號帶寬為 20Hz~15kHz;調幅廣播 AM 質量,其信號帶寬為50Hz~7kHz;電話的話音質量,其信號帶寬為 200Hz~3400Hz。可見,數位鐳射唱盤的聲音質量最高,電話的話音質量最低。除了頻率範圍外,人們往往還用其他方法和指標來進一步描述不同用途的音質標準。
類比音頻與數位音頻
對類比音頻來說,再現聲音的頻率成分越多,失真與干擾越小,聲音保真度越高,音質也越好。如在通信科學中,聲音質量的等級除了用音頻信號的頻率範圍外,還用失真度、信噪比等指標來衡量。
對數位音頻來說,再現聲音頻率的成分越多,誤碼率越小,音質越好。通常用數碼率(或儲存容量)來衡量,取樣頻率越高、量化比特數越大,聲道數越多,存儲容量越大,當然保真度就高,音質就好。
語音的音質與音樂的音質
聲音的類別特點不同,音質要求也不一樣。如,語音音質傳真度主要體現在清晰、不失真、再現平面聲象;樂音的傳真度要求較高,營造空間聲象主要體現在用多聲道模擬立體環繞聲,或虛擬雙聲道3D環繞聲等方法,再現原來聲源的一切聲象。
音頻信號的用途不同,採用壓縮的質量標準也不一樣。如,電話質量的音頻信號採用ITU-TG·711 標準,8kHz取 樣,8bit 量化,碼率 64Kbps。AM 廣播採用 ITU-TG·722 標準,16kHz 取樣,14bit 量化,碼率 224Kbps。高傳真身歷聲音頻壓縮標準由 ISO 和 ITU-T聯合制訂,CD11172-3MPEG 音頻標準為 48kHz、44.1kHz、32kHz 取樣,每聲道數碼率32Kbps~448Kbps,適合 CD-DA 光碟用。
音質評價方法
評價再現聲音的質量有以下主觀評價和客觀評價兩種方法。
一、主客觀測試技術指標
通常,據樂音音質聽感三要素,即響度、音調和愉快感的變化和組合來主觀評價音質的各種屬性,如低頻響亮為聲音豐滿,高頻響亮為聲音明亮,低頻微弱為聲音平滑,高頻微弱為聲音清澄。下面結合聲源、聲場及信號特性介紹幾種典型的聽感。
1、立體感
主要由聲音的空間感(環繞感)、定位感(方向感)、層次感(厚度感)等所構成的聽感,具有這些聽感的聲音稱為身歷聲。自然界的各種聲場本身都是富有立體感的,它是模擬聲源聲象最重要的一個特徵。德·波爾效應證明,人耳的生理特點是:人耳在兩聲源的對稱軸上,當聲壓差 △p=0dB 和時間差 △t=0ms 時,感覺兩聲源聲象相同,分不出有兩個聲源;而當 △p>15dB 或 △t>3ms 時,人耳就感覺到有兩個聲源,聲像往聲壓大或導前的聲源移動,每 5dB 的聲壓差相當於 lms 的時間差。哈斯效應又進一步證明,當 △t=5ms~35ms 時,人耳感到有兩個聲源;而當近次反射聲、滯後直達聲或兩個聲源的時間差△t>50ms 時,即使一次反射聲(又稱近次或前期反射聲)或滯後聲的響度比直達聲或導前聲的響度大許多倍,聲源方位仍由直達聲或導前聲決定。
根據人耳的這個生理特點,只要通過對聲音的強度、延時、混響、空間效應等進行適當控制和處理,在兩耳人為的製造具有一定的時間差 △t、相位差 △θ、聲壓差 △P 的聲波狀態,並使這種狀態和原聲源在雙耳處產生的聲波狀態完全相同,人就能真實、完整地感受到重現聲音的立體感。與單聲道聲音相比,身歷聲通常具有聲象分散、各聲部音量分佈得當、清晰度高、背景雜訊低的特點。
2、定位感
若聲源是以左右、上下、前後不同方位錄音後發送,則接收重放的聲音應能將原聲場中聲源的方位重現出來,這就是定位感。根據人耳的生理特點,由同一聲源首先到達兩耳的直達聲的最大時間差為 0.44ms~0.5ms,同時還有一定的聲壓差、相位差。生理心理學證明:20Hz~200Hz 低音主要靠人兩耳的相位差定位,300Hz~4kHz 中音主要靠聲壓差定位,更高的高音主要靠時間差定位。可見,定位感主要由首先到達兩耳的直達聲決定,而滯後到達兩耳的一次反射聲和經四面八方多次反射的混響聲主要模擬聲象的空間環繞感。
3、空間感
一次反射聲和多次反射混響聲雖然滯後直達聲,對聲音方向感影響不大,但反射聲總是從四面八方到達兩耳,對聽覺判斷周圍空間大小有重要影響,使人耳有被環繞包圍的感覺,這就是空間感。空間感比定位感更重要。
4、層次感
聲音高、中、低頻頻響均衡,高音諧音豐富,清澈纖細而不刺耳,中音明亮突出,豐滿充實而不生硬,低音厚實而無鼻音。
5、厚度感
低音沉穩有力,重厚而不渾濁,高音不缺,音量適中,有一定亮度,混響合適,失真小。除此之外,還有許多評價音質的聽感,象力度感、亮度感、臨場感、軟硬感、鬆緊感、寬窄感等。
二、客觀測試技術指標
1、失真度
諧波失真,主要引起聲音發硬、發炸;而穩態或瞬態互調失真主要引起聲音毛糙、尖硬和混濁。二者均使音質劣化,若失真度超過 3% 時,音質劣化明顯。音響系統的音箱失真度最大,一般最小的失真度也要超過 1%。
相位失真,主要引起 1kHz 以下的低頻聲音模糊,同時影響中頻聲音層次和聲象定位。 抖晃失真,主要是電機轉速不穩,主導軸 - 壓帶輪壓力不穩,磁頭拍打磁帶等造成磁帶震動和捲帶量變化,進而使信號頻率被調製,聲音音調出現混濁、顫抖。抖晃通常用音調變化的均方根值表示,通常,答錄機的抖晃率 <0.1%,Hi-Fi 答錄機 <0.005%,普通錄影機<0.3%,視盤機 <0.001%。
2、頻響與瞬態回應
頻響,指音響設備的增益或靈敏度隨信號頻率變化的情況,用通頻帶寬度和帶內不均勻度表示(如優質功放的頻響 1Hz~200kHz±ldB)。帶寬越寬 、高,低頻回應越好:不均勻度越小,頻率均衡性能越好。通常,30Hz~150Hz 低頻使聲音有一定厚度基礎,150Hz~500Hz 中低頻使聲音有一定力度,300Hz~500Hz 中低頻聲壓過分加強時,聲音渾濁,過分衰減時,聲音乏力;500Hz~5kHz 中高頻使聲音有一定明亮度,過分加強時,聲音生硬;過分衰減時,聲音散、飄;5kHz~10kHz 高頻段使聲音有一定層次、色彩;過分加強時,聲音尖刺;過分衰減時,聲音暗淡、發悶。按此規律,可根據各種聽感,定量調節音響系統的頻響效果。
瞬態回應,是指音響系統對突變信號的跟隨能力。實質上它反映脈衝信號的高次諧波失真大小,嚴重時影響音質的透明度和層次感。瞬態回應常用轉換速率 V/μs 表示,指標越高,諧波失真越小。如,一般放大器的轉換速率 >10V/μs。
3、信噪比
信噪比,表示信號與雜訊電平的分貝差,用 S/N 或 SNR(dB)表示。雜訊頻率的高低,信號的強弱對人耳的影響不一樣。通常,人耳對 4~8kHz 的雜訊最靈敏,弱信號比強信號受雜訊影響較突出。而音響設備不同,信噪比要求也不一樣,如 Hi-Fi 音響要求 SNR>70dB,CD 機要求 SNR>90dB。
4、聲道分離度和平衡度
聲道分離度,是指不同聲道間身歷聲的隔離程度,用一個聲道的信號電平與串入另一聲道的信號電平差來表示。這個差值越大越好。一般要求 Hi-Fi 音響分離度 >50dB。
聲道平衡度,是指兩個聲道的增益、頻響等特性的一致性。否則,將造成聲道聲象的偏移。
結論
世界上還沒有比音還主觀的東西,所以一個真正公平公正的音評人,絕對會以非常謹慎的態度去評價一套音響設備, 他們經常會分別以人聲及樂器兩者的表現來綜合評分。
一、語音音質
評定語音編碼質量的方法為主觀評定和客觀評定。目前常用的是主觀評定,即以主觀打分(MOS)來度量,它分為以下五級:5(優),不察覺失真;4(良),剛察覺失真,但不討厭;3(中),察覺失真,稍微討厭;2(差),討厭,但不令人反感;1(劣),極其討厭,令人反感。一般再現語音頻率若達 7kHz 以上,MOS 可評5分。這種評價標準廣泛應用於多媒體技術和通信中,如可視電話、電視會議、語音電子郵件、語音信箱等。
二、樂音音質
樂音音質的優劣取決於多種因素,如聲源特性(聲壓、頻率、頻譜等)、音響器材的信號特性(如失真度、頻響、動態範圍、信噪比、瞬態特性、身歷聲分離度等)、聲場特性(如直達聲、前期反射聲、混響聲、兩耳間互相關係數、基準振動、吸聲率等)、聽覺特性(如響度曲線、可聽範圍、各種聽感)等。所以,對音響設備再現音質的評價難度較大。通常用下列兩種方法:一是使用儀器測試技術指標;二是憑主觀聆聽各種音效。由於樂音音質屬性複雜,主觀評價的個人色彩較濃,而現有的音響測試技術又只能從某些側面反映其保真度。所以迄今為止,還沒有一個能真正定量反映樂音音質保真度的國際公認的評價標準。但也有報導,國際電信聯盟(ITU-T)近期已批准一種客觀評價音質的被稱之為電子耳的新型測量方法,可對任何音響器材的音質進行客觀聽音評價,也可用於檢測電話通訊語音編碼系統的缺陷。
留言列表