leslie
- 论坛博士后
- 19720110
- 27155
- 28495
- 2003-01-24
|
1#
t
T
发表于 2011-04-11 17:48
|只看楼主
贵族压力金耳朵们在自欺欺人吗?
分类: 2010/02/13 19:34
唐凌按:在许多极为顶尖性的试听比较机会中,当我坦率地向左右的金耳朵们表示我的耳朵无法分辨被比较的扩大机间有些什么差异时,我常常会留意对方的表情,大多数的情况,我所发现的,并不是他们对我如此迟钝的一脸疑惑,而是金耳朵们会逐渐地收敛自己,不再那么放肆地评某一台扩大机的音色较为甜润、清澈而另一台则稍硬一些并带有金属音。 我自己一直相信自己的耳朵并不是顶坏的,这种信心即使不能建立在我能听到由信号产生器所发出的将近18KHz 的声音(相对地大约只有一半的人能听到15KHz 以上),而在其他机会里,我仍然能够得到一些印证。 例如说,我与金耳朵们同行时,我常常会因为汽车刹车时所发出的一声尖锐响声(大约也在十数KHz 以上)而惊奇地去找寻发出此尖声的汽车,然而金耳朵们却仍若无其事地迈着方步。 然而究竟什么原因,使得一干金耳朵们,仍然热衷于鉴赏式的评价呢?本文并没有给我们明朗的答案,不过它却给我们指出了正途,怎样做比较、怎样统计以及怎样寻求比较近接的结论。 这是一篇极为珍贵的文章,尽管译者为了存真,而译得有些生涩。 在一些主要的音响杂志上,到底有多少对扩大机所做的测试报告肯承认受测器材『不具本身特有的声音』?失真如此低,频率响应如此平坦,这台器材可说是『一条有增益的导线』。 然而这些同样完美的放大机仍在许多『地下』刊物或音响极品沙龙里受到主观的评估。 不可避免地,他们总是详细地描述各扩大机独一无二的声音(很不幸的是,若干主观的评论者常常在那些扩大机听起来较轻快』,『甜美』,抑或『晦暗』、『粗糙』的意见上彼此不一致),许多音响器材销售者都赞同这些主观评论者的金耳朵,他们坚信这些这些经验丰富的聆听者的确可以轻易地辨别音响组件的差异,即使第一流的功率扩大机亦然。 即使有了这些彼此矛盾的论调,双方似乎都未以科学的数据来支持各自的说法。 那么到底哪一边才是正确的呢?再者,这些存在于不同器材,例如扩大机之间的歧异真的可以听出来吗? 身为科学研究者及业余的音响迷,这种争论不休的现象激起我们起而探讨的兴趣,于是我们试图寻找出一些有关的数据来支持其中一方的说法。 在一般性的音响杂志里可以找到许多有关这个主题的文章,但却没有可以直接应用的数据,我们与一些音响工业界的人士接触过后也仅能得到非常有限的数据。 我们还在技术性的音响杂志中寻得一些较切题的文章,但是他们所做的测试不是涉及特殊的仪器设备就是使用了非音乐性的素材,例如Sine 波等。 对此困境深加思索之后,我们决定建立一种可资信赖的方法来澄清这一切。 于是根据我们所从事的供作在科学上的要求与原则,我们开始着手于这些试验。 我们的测试结果显示这些即将购买音响的人既不必受相互牴触的意见所困惑,亦不应受到那些自诩知道哪些器材较好听的金耳朵们所唬倒。 本篇文章所描述的是一种精密的AB 测试,这个测试可以洞悉那些出现于主观的评论文章或销售者口中的相互牴触的意见。 这个精密的测试法适用于任何音响组件上。 我们用它来解决这样的一个问题:聆听者是否真能不矛盾地分辨出一流的功率扩大机声音的差异?这些出乎意料──可能引起争论──的结果可使人们对功率扩大机的性能水准及比较组件性能之AB 测试有新一层的认识。 在我们致力于建立科学的AB 测试的理论基础几个月后,供给我们研究的组件送来了,这使我们兴奋的程度提高不少。 这些慷慨的制造商出借的器材计有:Accuphase P300,Dynaco Stereo 400,Phase Linear 400 功率扩大机及一前置扩大机Quintessence Model I。 使用的喇叭扬声器则是由我们这一群17 个人所组成的聆赏会捐赠的,计有arge Advent,Magnepan MG II 及Fulton FMI 80。 这个聆赏会的成员包括了11 位普通聆赏者及6 位自称金耳朵的聆赏者。 这6 位金耳朵之中有二位职业音乐家,一位音响极品的销售者。 所有金耳朵们都拥有所谓的极品。
图(一) 表示了这个用以比较功率扩大机的AB测试的设备安置情形。 一个强力,多极的肘节开关可同时开关(multipole toggle Switch)功率扩大机的输入与输出,如此,扩大机『看到』的负载仅为扬声器,而不会是另一扩大机的输出。 又,肘节开关没有中间『关』的位置,因此我们驳接一个平时置于闭接位置的暂歇(断离)开关。 最末的准备工作是对二部扩大机的输出做仔细精密的匹配。 首先送1KHz 的正弦波进入前置扩大机,然后读出跨过扬声器接线端的电压值。 我们使其匹配电平在0.1dB 以内,这是我们所使用的真空管电压计解析度的极限。 我们又以宽频带的FM 台间杂音及1KHz 方波来查验先前的匹配是否良好,其结果都维持在0.1dB 内。最后我们以100H 及10KHz 的正弦波来查验输出电平。 在匹配过的功率扩大机,以其他频率的正弦波及方波查验的结果分别在0.2dB 及0.5dB 内。 我们未曾等化扩大机的频率响应,否则就与这个测试的目的相牴触。 每一测试都借功率扩大机上的增益控制以匹配电平,但有一个例外,这例外的一个不能用前述的方式来匹配:我们在其输入端串联一对Cermet 电位器。 后来的试听比较显示不同的电平匹配方法并不造成什么影响。 接下来的六个星期里,聆听者参加了14 个不同的测试。 每一测试里,每一聆听者都接受一组(通常为18 个,有时12 或8 个)AB 比较。 在这些比较的半数里,先由一个功率扩大机放出音乐,然后换另外一座扩大机,试扩大机A 或B 先使用,我们称之为AB 或BA 。 在其余比较中,我们让音乐经由同一扩大机放出来,但是在音乐播放途中,我们把开关拨离扩大机A,然后扳回同一扩大机A 而不置于扩大机B,我们称之为AA(若使用的扩大机为B,则称为BB)。 聆听时并不知道AB,BA,AA 及BB 比较的次序。 这四种比较出现的频率相同,但在事前先随机安排使它们的次序混杂。 聆听者所要做的就只是判断声音特质是否已因开关的扳动而有所变化,于是他就在评分卡上的两种可能答案中选取其一:他认为扩大机未变?或另一扩大机已被切入?然后把他这的评分卡与操作者的切换序相比较以决定他的分数。 前八个测试,我们使用切换法(I):聆听者每作一次判断,操作者即切换一次。 切换时机则恰好在半分钟的音乐播放中间,切换动作历时1/5 秒以使聆听者知道已经切换过了。 操作者在扳动肘节开关时同时按下断离开关(这个技巧也可不让聆听者得到是否已切入不同扩大机的线索)。 比较音响组件性能之正确原则与方法 我们采用的测试步骤可以反映出一种原则,这种原则支配了我们在聆听环境中比较音响组件性能之科学方法,我们将此原则汇要于次。 我们相信品论组件性能的最高前提是让人们在正常的聆赏状况中听到经过准确再生的音乐。 以电子器材来量测其性能或许有所帮助,尤其对设计者为然,但这种量测结果不能立刻与可听觉的因素有必然的相关性。 电子量测可能包含某些在听觉上毫无影响的参数也可能漏去那些与音质有关的参数(Davis,1978)。 更明显的一点是,可量测的参数仍有一个听觉上的极限,在此极限以内,人类的耳朵就无法辨识它们的差异(Fletcher,1953)。 因此我们确信,以听觉来比较组件的性能才是正本清源之道。 『AB』试听比较(在两个单元间来回切换)是一种应为应用──亦被滥用──于这种比较的方法之一。 但是此种AB 试听法内藏许多陷阱。 例如,组件的输出电平应该借电子仪器严密地匹配过(Hirsch,1975)。 我们的测试结果提供了这种匹配所应该达到的精确度。 Lipshitz 等(1979)曾做过更详细的测试。 借人耳来作电平的匹配无法获致足够的准确度。 此外,我们还应考虑待测组件与其以从麦克风到人类听觉系统之间各环节之元件可能能产生的交互作用(Hodges,1974),当然这些元件内的残余失真与其他缺陷都应一并考虑(Moucieff, 1978; Moir, 1978)。 若不遵循科学的方法,即使完全符合前述要求的AB 测试仍不完全可信。 欲使AB 测试的结果足以为科学上的证据,这个测试必须符合下列七项要求: (1)测试程序应该基于『差异测试』,这是研究主观现象的一种客观方法(可见于Bindra 等,1965; Bryan 与Parbrook, 1960; Gabrielsson Sjogren, 1972; Bose, 1973)。 在差异测试中,受测的聆声者并不宣称较偏好哪一组件发出的声音,他仅指出二者发出的声音是否有所差异,如此一来,个人之品味或偏好的影响就被摒除(若分别以录音及现场乐段为素材时,差异测试更可间接地指出到底哪一组件发出的声音较近于现场音乐)。 (2)应该在『盲目』中聆听。 也就是说,在任一设定的时间内不应让聆听者察觉到底正在使用哪一组件。 非盲目的聆听结果可能被聆听者的偏见所影响。 (3)每一聆听者应被『隔离』使其不受他人的影响(Hope, 1978; Colloms, 1978)。 (4)测试状况及辅助仪器设备都应交代清楚。 测试结果可能与这些因素有关。 (5)应该包括控制测试。 这些测试可评估主要变数之外的可能影响因素。 控制测试应包括极限状况或边界研究使组件的差异显现或消失。 譬如说,如果聆听者听出了差异,则应该要求他再比较两不同型的扩大机,甚或就在AB 测试中作同一扩大机的自相比较。 如果无法使差异出现,或是在不同状况下不能使差异消失,那么此测试必然存在一未被发觉的系统因素同时偏置了测试结果。 (6)应以统计学的方法来处理结果,如此才能识别瞎猜的可能影响。 当然获得的数据或判断的个数必须在统计上显著(通常需要数百甚或数千个数据,我们的测试得到1211 个聆听判断, Colloms 的为143 个,Moir 576 个,Bindra 等2048 个,Gabrielsson与Sjogren 则达万个)。 最后的结论亦应说明统计的信赖水平。 (7)研究者发表的数据在统计变量内应该可以再生。 如果个人的研究结果与其他研究者研究同一测试之结果不尽相符时,在此歧异解决之前,这些数据仍不能算是正确。 就我们所知,几乎所有的AB 测试──在陈列室、在家里,或为了作组件性能之主观评论──都不尽符合前列的七项要求,但其中有三个例外(Chadwick, 1978; Moir, 1978; Colloms, 1978)将讨论于后。 比较起来,心理声学现象的专业研究者所使用、发表的AB 测试法通常较合于这七项要求──可见于Bindra 等,Bryan 及Parbrook, Gabrielsson 及Sjogren。 因此他们的结果就可被科技界接受为科学的证据。 然而他们采用为素材的Sine 波及许多专业化的仪器并不可能出现于一般典型的家居聆赏状况中。 在本测试里,我们遵循了前述七项要求,并采用心理声学的研究方法来探讨有关音响组件之种种。 在我们整理两年来的研究结果之同时,Moir, Chadwick 及Colloms 等亦各自在英国发表了他们的测试结果。 他们的方法差不多都符合我们的七点要求,诸位可发觉我们的结果与这些新近的研究相当一致。 Moir 还提供了其他新近的研究以为参考,结果都相近。 以唱片为音源将不合于此种应具重复特性的测试工作。 除却两个以外的所有测试所使用的录音带包括了风琴的现场录音及摘录自高品质唱片者。 使用的制带器材为:Braun TG 1000 录音座,Mark Levinson JC-2 前置扩大机,Denon 103 唱头,Decca International 唱臂及Technics SP 10 唱盘。 Tandberg 3000X 录音座则用以播放带子。 第一个测试乃经由Advent 扬声器来比较二扩大机之异同,其结果可窥得本项研究结果之端倪:聆听者在180 个判断中仅对了46%,这个结果与完全瞎猜对率50%很相近(『相同』与『不同』的切换次数相同,且仅此二种答案)。 我们可以看出来,一个控制下的科学测试显示所有参加聆听者──普通人或金耳朵皆同──都无法一致地分辨出受测扩大机之区别。 我们一开始就认定功率扩大机本身以外的其他变数也一定会影响到扩大机相异处的可听辨程度。 第13 与14 个测试正是企图在聆听者的分数上指出这些可能的影响变数。 首先,我们研究每一次判断时,聆听时间的长短对判断『相同』或『不同』的影响。 双倍的时间使分数从46%上升至53%,亦即90次判断中对了48次。 这种改变在统计上并不显著。大多数的聆听者都说他们根据切换前后的一刹那间声音的差异来做判断 。 聆听时间的增长对他们的帮助极小。 或许是因为人类记忆对细微印象仅保留一段很短的时间(Sekuler Bauer,(1965)在精神物理学的研究里发现类似的结果),这一点将在底下再度论及。 接下来要研究的变数是声压水平(SPL)。 几乎所有测试的平均SPL 都在80~85dB 间,有的在70~75dB 及90~95dB 重覆多次。 结果显示SPL 对歧异的识别度并无抑制的影响。 因此SPL 上升或降低对结果的改善在统计上不显著。 其次再研究音乐复杂度的影响。 本研究所使用的音乐素材大多属于小型乐团,偶或加上独奏的乐曲。 复杂的管弦乐使分数下降了一些,但在统计上不显著:108 次判断中有47 个正确,即44%。 因此音乐的复杂并非本测试状况中的主要变数。 扬声器是否可能掩盖了扩大机之间的差异?这是接下来所要探讨的变数。 某些扬声器可能较易于显现扩大机间细微的差异。 我们以一些人认为是『现阶段最高技艺』的Magnepan's MG II 替代Advent。 但是其结果并未达到统计上的显著(162 个判断中正确率为54%)。 其次再研究潜能相差较大的扩大机的影响。 为了使分数提高些,我们拿一顶级的功率扩大机与一较廉价的收音扩大机(Allied Model 395)内的扩大机部分相较,但是聆听者仍然不能听出它们的差别,252 个判断中正确率为49%。 至此为止,所有聆听者都未能一致地听出扩大机的差异。 我们重新检查一下仪器设备。 甚至有一位聆听者怀疑肘节开关是否真的拨动过呢?但在他瞥见扩大机输出指示表上指针的移动时又不得不信了。 为了提高分数,我们又故意将扩大机之一的输出电平较另一扩大机调高1dB,我们以普通的音乐为素材,其中音符的范围很少维持在1dB 内。 以切换法(I)操作时,这种不平衡的现象依旧未能听辨:在72 个判断的正确率为44%。 其次,我们想出另一种切换方式:切换法(II),以使辨识的行为较容易进行些。 我们让聆听者在判断时往复拨动开关,而不是仅扳动一次,同时也取消了以前在二扩大机切换中途的短暂的时间空档。 在切换法II 中,聆听者亲自操作开关,但他并不知道肘节开关上的『A』与『B』二位置究竟是接到不同或相同的扩大机上(在前后两个判断之间,聆听者被送至另一房间,操作者就把信号线接成特定的AB 形式,然后才让聆听者回来操作开关)。 聆听者可在他作出判断前的三分钟内随意拨动肘节开关。 此时以不用暂歇开关。 因此切换法II 的开关效果是即时的。 我们让扩大机的输出作1dB 的输出补偿,然后以切换法(II)重覆以前的测试项目。 现在每一个聆听者都做出了正确的判断!我们终于摘出了一些可以听辨的差异。 依此看来,切换方式好像就是主要的支配变数了。 因此我们使用这种新的切换方式重覆了一些原先的测试项目,但此次我们重新使扩大机电平恢复平衡,并再度启用两部顶级的功率扩大机。 其结果是:没有可听变的差异(96 个判断中,正确率45%)。 换成Fulton FMI 80 扬声器仍就无法辨别扩大机的差异(36 个判断中,正确率50%)。 我们又怀疑录音座或是录音过程是否掩盖了扩大机的差异。 但,我们使用Technics SL 1300 自动唱盘与ADC XLM MK II 唱头来播放最高品质的唱片仍未能使分数获得改善,现场录音带亦未能改善此种局面。 为了对此项研究作个结论,先让我们回头看看先前因电平未匹配的程度降至 ½ dB,则此时不论音乐来源是录音带或唱片,聆听者均无法辨识相异处(24个判断中,正确率为46%),此处使用的录音带包括了录自唱片及现场录音二种。 若维持 ½ dB的不平衡,但聆听素材却换成Heathkit Sine-Sq-uare Audio Generator Model IG-18产生的1KHz Sine波,则聆听者的分数为100%正确。 现在让我们把这些结果综合一下吧!就我们研究的变数范围内及使用的器材种类而言,所有下列的因素均不会抑制电平匹配妥当的扩大机之可听辨差异:平均声压水平、聆听时间、音乐复杂度,录音媒介、扬声器厂牌、扩大机厂牌、或是AB切换方式。 对输出电平不平衡达1dB的二功率扩大机而言,亦仅在聆听者重覆,不停滞地亲自扳动开关之时才能辨识出差异(即使用切换法II )。 在 ½ dB不平衡时,只能听出单频声调之差异,对真实的音乐则无法辨别不同点──即使采切换法II亦然。 这个因电平不平衡所得到的结果与Hirsch(1975)所讨论的及Fletcher(1953)的结果均相符。 输出电平达到平衡时,所有测试的整体分数为:17 位聆听者所作的1104 个判断中,正确率49.1%,这个结果与纯粹猜选的预期比例50% 相当接近。 个别聆听者的整体分数则从35% 至57% 皆有之。 金耳朵们──即使那些自认曾听出功率扩大机差异者──的分数并不比普通的聆听者为佳。 在我们刻意模拟的家居聆听状况里,没有一位受测的聆听者肯定自己一直听出功率扩大机的相异点。 我们所使用的器材的性能水准已足以使它们之间的差异低于可听辨的极限了。 这些结果使我们不得不问:在作功率扩大机的AB 比较中『听到』的差异真的存在吗?又有多少是想像出来的呢?我们已经识明,未精确匹配的输出电平可诱使聆听者做出违背事实的判断。 其他可能的原因则是偏见与贵族压力(译注:这里所谓的『贵族压力』大概是指,一般人总以为金耳朵们的耳朵的确比普通人高明些,因而热切地期望他们可以品列各种器材之高下)。 Brindra 等(1965)发现聆听者想像不存在的差异还多过未能察觉真正出现的差异。 就那些主观的评论员们对顶极功率扩大机分歧的评价,我们的结果也提供了一种可能的解释:不同的人可对同一件事物作出不同的想像。 某些读者可能怀疑这些结果,那么我们首先建议他们回想本文及比较测试时正确的原则与方法,数据之说服力在于他们赖以建立基础的实验方法。 其次,我们也期望这些心存怀疑的读者亲自来一次这种科学的测试以查覆我们的结果之再生性与代表性又是如何。 但是,在把我们结论扩充至其他与我们测试状况不同的状况下之时必须格外小心。 可能在某些情况下,一些聆听者可证明他们的确听出功率扩大机之间的差异,我们期望这种证明与其是准则,无宁仅是例外罢了。 当然了,我们不可能以『所有』音乐素材及『所有』类型的扩大机对『所有』聆听者测试,但我们相信我们所做的测试乃在具有代表性的状况中进行的。 我们避免用同一类的辅助组件,专业卷带等等,因为这种理想状况不能代表大多数的家居聆赏状况。 我们当然不把本项研究视作AB 比较的定论之作。 相反的,以较科学的态度与方法评估各组件的努力过程中,我们希望它是一个有用的起步。 我们应该继续研究其他对功率扩大机差异之可听辨度有所影响的变数。 此外,我们还猜想前置扩大机,唱头及其他组件之差异是否也应该和功率扩大机一样不易听辨,这个疑问可以用此处使用的方法逐一研究(扬声器之比较则要求特殊方法以把辐射之方向性一并考虑)。 末了,我们想说的是,音响迷总是狂热的搜集性能极致的组件,就像当年寻金者寻找大金矿一样(译注:指1849 年,大批狂热的寻金者涌入California 采掘黄金一事)。 然而这两群追寻者都以其行动证验了James Bonner 说过的一句话:『人心自欺的能力是无限的』(取材自Audio Amateur JAN. 1980) 今天我们在科学知识的学习过程中,最大的悲哀,乃是无可避免地受到商业化的影响,商业说全IC 电路最好,学者(学习者)便认为IC 真好,其实IC 好在哪里,好在装配生产简单,钱赚得快。 如有故障,推说偶然故障,换一个也可以毫不脸红。 (5-36) 转载音响技术第55期JUL. 1980 贵族压力金耳朵们在自欺欺人吗?/Thomas H. Smith Michael R. Peterson Peter O. Jackson 原著/杨瑾译述
|