![]() |
Submit News Tips | I4U Gadget Flyer | RSS Feed | |||
|
||||
| | 网站首页 | 文章中心 | | ||||
![]() |
|
|
|
| HOT TOPICS: Nintendo Wii | Sony PS3 | Xbox 360 | Gadget Models |
| I4U Latest News |
声色饕餮 解析创新X-Fi音频处理器Topic: 技术前沿 荐 ★★★★★ 作者:Rowan 文章来源:本站原创 点击数: 更新时间:2007-7-8
编者按:这篇文章成文于2005年7月19日,发表在《大众硬件》杂志上。是技术前沿栏目的一篇经典的文章。当时创新的X-Fi声卡蓄势待发,很多创新的粉丝都为了庆祝这一经典产品的上市。作为创新铁杆粉丝的我,也不能拉空。献上如此详细的技术解析文章,与诸位共赏。
声色饕餮——解析创新X-Fi音频处理器 大约16年以前,创新试验室赐予了电脑声音,那就是最初的Sound Blaster声卡。它具备11种FM合成器,支持文本朗读功能,集成有MIDI和游戏端口,8bit采样解码能力。此后创新转向了PC消费音像市场来扩大自己在数字娱乐方面的市场份额,并且浓缩了自己在传统PC音频领域的业务。而今天很多公司又极力想扩大声卡产品的市场份额。像Turtle Beach、M-Audio和VIA的Envy 24他们也都逐渐做出了自己的特色。但是这些仍然不足以挑战创新这个音频领域的王者。
在创新耳边嗡嗡叫板的公司还有很多,前不久Intel发布了HD音频规范。最初支持HD音频规范的是925/915芯片组,这些解决方案都可以实现基本的声卡功能。某些主板还可以支持数码娱乐领域的S/PDIF输出功能,并且还不会由于整合主板而提升噪音分贝。但是狂热的音频发烧友和民间数字工作室这样的用户群却只需要一款专业级的声卡。 七年前,创新推出了著名的“EMU10K1”音频处理器,也缔造了一个经典的Sound Blaster Live,现在基于创新的“EMU10K2.5”架构的声卡Audigy 2 ZS是目前主流民用声卡中最为强大的一款。长期以来创新都不断的为这个架构进行扩充和修补,使其成为了一套完备的硬件音频加速架构。近日,创新公司又宣布即将推出全新的一代架构产品,它就是网路中传闻以久的X-Fi音效处理器。创新公司希望通过X-Fi实现出色的高保真声音品质。X-Fi将给未来的电脑代来极为强大的音频处理能力,在游戏中实现更逼真的音效,并且可以让你轻松构建非常专业的数码音频工作室。今天我就来详细给大家介绍一下X-Fi的一些主要特色技术,并且带你畅游未来数码音频的绚丽殿堂。
规格分析 下面我们先来看看X-Fi的芯片制成规格。可以说X-Fi芯片的制造工艺都已经达到了目前CPU和GPU的水平。与目前顶级的GPU相比下面的规格表也许不会让你太吃惊,但你要记得X-Fi可是一款音频处理芯片。对于音频信号的处理要比图像和数据简单许多。它的芯片工作频率为400MHz,虽然目前的GeForce 6800 Ultra比X-Fi的晶体管数量要高4倍,但X-Fi的核心频率足以和现在主流的GPU芯片相匹敌。X-Fi的晶体管集成数量与它的前辈EMU10K2.5相比变化就更加惊人了。
首先我们来看具有大跳跃性的晶体管集成度,X-Fi的晶体管总数是前者的11倍。逻辑门的数量乍一看与晶体管的提高似乎不成比例,而且一颗音频处理器也不需要那么多的高速缓存。但你要知道逻辑门的数量与晶体管的集成度是不能同语的。并且依照创新公司的官方解释,他们大约用了40%的晶体管(大约2千万个)来实现所有的逻辑运算单元的数学运算功能。由此X-Fi芯片可以节省大量的高速缓存。高速缓存在专业的音频处理器中是最为关键的部分,像视频一样这些数据都要实时的被运算出来。为了让录音、回放没有延迟音频处理器必须和时间赛跑,高速缓存就是一双胶钉跑鞋。在X-Fi中使用了大量的FIFO先进先出策略,双端口内存通道和大量的数据存储寄存器。不同于3D图像的处理,在音频处理过程中高速缓存一旦“错过”将会严重影响后面的数据处理。缓存的错过会发生许多可怕的现象,会导致声音空缺、发出爆裂声、声音扭曲甚至能导致后面一系列声音的延迟。 X-Fi的设计工作是从3年前开始的,在那个时候PCI-Express接口规范还没有最终确定下来。创新的工程师仅能利用现有的PCI接口来设计芯片,因此X-Fi被设计成基于PCI端口也是可以理解的。依照创新的说法PCI-Express接口的X-Fi声卡将在不久之后发布,但是第一款X-Fi音频处理器肯定是采用PCI界面的。 重要的采样率转换 在音频处理器领域中采样率换算是非常重要的性能参数。因为采样率的规格直接影响到录音、回放的音质和音频文件的容量。通常采样率有很多格式可以选择,例如22.05KHz、44.1KHz、48KHz、96KHz等等。尽管如此业内的音频采样率一般都是应用于影视行业,通常的采样率在48KHz至44.1KHz之间。而传统的创新10Kx系列音频处理器在采样率规格的转换方面就出现许多问题。我们大家都知道标准的CD音频流采样率为44.1KHz,然而传统的创新10Kx音频处理器的默认采样率为48KHz。这就意味着在整个录音的过程中,系统会存在两种截然不同的采样率。在协调两种不同采样率时,音频处理器需要不断对两种采样率进行相互转换。
(如图3 采样率格式转换的过程) 也就是说,当你要得到44.1KHz的音频数据,需要从48KHz采样率的音频数据转换而来,整个过程需要音频处理器进行处理,最终由10Kx处理输出44.1KHz格式的音频。因此结果会导致高度交互失真现象,这要归咎于系统中存在两种不同的采样率。并且过去创新在宣传自己的产品时理所应当的回避了这个问题。但现在出于信誉的考虑创新公司也开始尽力改善这种情况。在最新的X-Fi音频处理器中加强了采样率转换的算法,这使得数据运算量也大大增加,在X-Fi中70%的性能用来处理采样率格式的转换工作。结果怎样呢?创新公司表示在44.1KHz至48KHz的采样率转换过程中信噪比为136dB,误差小于+/-0.00025dB。
(如图4 X-Fi音频处理器性能分布)
在X-Fi中主要有5个强力的运算引擎,通过上面的图表你可以看到采样率转换占据大部分音频处理器的资源,而且混音和数字信号处理也占据着相当多的资源。这几个模块在音频处理器中负有重要的使命,下面我们就来逐一探讨在X-Fi中的这几个先进的模块。 首先我们来聊聊采样率转换模块,它是一个极为强大的加速计算处理单元。创新公司也承认10K2.5音频信号处理效能的低下,主要归咎于采样率转换模块。很明显创新这次在X-Fi中设计的采样率转换模块就是要尽可能的做到无损转换。创新的工程师为这个模块融会设计了两种灵活的工作模式,一种可以采用固化的硬件功能工作,一种采用硬件可编程设计。这种设计将尽可能的加速固化硬件的执行效率,许多弹性的操作又都可以通过可编程硬件来实现。创新这次也聪明了,X-Fi的核心内部可以运行两个不同采样率格式,一个是44.1KHz、一个是48KHz。若你明确的告诉它采样率规格,X-Fi在写入数据的时候就只能使用44.1KHz格式。创新的设计一切都围绕着适应性,分配了采样率转换单元许多可用资源。因为在电脑中有许多音频的采样率都是动态变化的。X-Fi能将一种采样率格式几乎无损耗的转换为另一种采样率。这些都要靠繁重的运算来实现。 从本质上来讲采样率转换单元的运算效能和适应性是对立矛盾的。创新声称音频信号的无损转换事实上全都要倚赖ADC/DAC(模数转换器/数模转换限制器)的性能。因此高端的声卡产品中会使用高档的DAC,反之低端声卡就要使用廉价的DAC。 频带分裂技术 另一个要探讨的问题是创新一直主张自己的声卡支持96KHz/24bit,自从2003年创新发布Audigy声卡以来就没有停止过宣传。因此创新还和人闹了一场很不愉快的官司。其中创新的一个重要的观点就是他们的声卡支持96KHz/24bit的解析度。因为创新的声卡完全支持DVD音频和SACD音频格式,当然这里指的是声卡在回放时的工作模式而非录音,并且数码音频的输入/输出并不支持更高的解析度。这些限制事实上都源于96KHz/24bit的信号通道,从本质上讲10Kx芯片的架构的确完全可以做到处理96KHz/24bit信号,但是10Kx的核心采样率格式却始终使用48KHz。这就是人们控告创新欺诈的原因。 如此高的采样解析度真的这么重要么?似乎与48KHz相比96KHz/24bit会极大的增加最大有效采样周期。其实在音频世界中32KHz的采样解析度就已经非常理想了。因为人类耳朵所能感知的频响范围在20Hz至22KHz之间,因此32KHz的解析度已经饱和。尽管是最为灵敏的年轻人的耳朵在经历数小时的重金属乐刺激或其他的声音刺激之后也会变得暂时非常迟钝。更重要的是,24bit采样深度太过于奢侈了。理论上来讲24bit的采样深度可以达到144dB的数码音频动态范围。这一动态范围已经远远高于人们耳朵的感知度,人耳大约仅能感受到120dB的音频动态范围。即使是目前最出色的回放硬件,在回放96KHz/24bit的声音素材时,也仅能产生113dB的动态范围。 在创新的X-Fi声卡中加入了一项新的“创造”模式,当这种播放模式被开启之后X-Fi芯片就会处理纯粹的96KHz/24-bit音频流。举例来说当你播放一张DVD音频碟片的时候,开启“创造”模式你就会欣赏到纯粹的96KHz/24-bit音频。不过此时你不能为音频添加任何的环境音效。当然X-Fi可以为44.1KHz或48KHz采样率的音频添加环境音效,但环境音效不能应用在96KHz下。对于想在DVD音频碟片上施加环境音效的发烧友来说,创新另外准备了一项叫做“频带分裂”的技术来实现。 频带分裂技术能够将高采样率的音频最多分割成4路48KHz的低采样率频带。在96 KHz/24-bit的情况下X-Fi可以分割出2路48KHz频带,这种分割96KHz采样率的算法在专业音频领域应用的非常广泛,它被称作正交镜像滤波算法。依照创新官方的说法这种算法像是基于时间的多重采样。环境音效就可以应用于分割开的频带上,并且频带可以被灵活的调配。频带分裂技术能够极大的减少数据运算量,尤其是将196KHz的音频流分割成4路48KHz来处理,速度会显著加快。创新公司表示这种算法对声音的振幅或者相位都没有任何影响,对于音质的影响更是微乎其微,人耳决不可能听出来。 创新采用的频带分裂技术是基于软件架构来实现的,用这种方式可以产生出更灵活更彭湃的环境音效。创新同时指出,在处理48KHz的环境音效时,整个分割频带的数据都会加上环境音效。但如果音频信号源自身的频率非常高就不会附加任何环境音效。为了保证更好的音质高于24KHz的振幅都不会加载环境音效。 依照创新的说法,在高解析度的音频录制过程中将不可能使用频带分裂技术来实现。这要归咎于很多因素,其中最重要的就是设计制造成本问题。要想实现96 KHz或192KHz录音时同步加载环境音效,那需要音频处理器集成更多的晶体管,增加芯片的尺寸。不要忘记这是一颗音频处理器,无论要加上多少特色功能,提高多快的速度,它最终的芯片价格也要定位在70美元以内。一般的用户宁愿使用简陋的板载声卡,而将钱都花在买更好的CPU和GPU上。 一个环连接了所有 除了采样率转换引擎之外,X-Fi芯片也涵盖了其他四个处理引擎。不过在详细介绍他们之前我们还是先来看看各个处理引擎之间是由一个怎样的架构连接起来的。创新将它称为——音频环架构。这是一个非常新颖的环形架构,它是一种非常有适应性的拓扑结构,无论在环中的某一点,都可以处理音频数据。最终数据又会回到原点。X-Fi可以在音频处理器的任何地方为数据制定出处理路线。音频环是一个管道,它采用分时多路方式的总线结构,支持最大4096条音频处理通道。在这里声音像是许多条通道,但他们不仅仅是数字混音台上传统意义的音轨。在通道中也有内部信号的反响、动态处理和特效处理等分支。为了保持饥渴的音频处理器能有源源不绝的食料,在整个音频环架构中使用了SDRAM界面的缓存机制。这看上去更像是现代3D加速卡了。标准的X-Fi声卡将会配备有2MB的“声存”,而高端的X-Fi声卡将会配置多达64MB的声存。音频环架构的表现还要事实来证明,不过创新先前的10Kx架构已经服役多达7年以上,相信凭借强大的性能X-Fi架构会服役更久。
在X-Fi中具有5个不同的关键引擎这包括:采样率转换、延迟特效、混音、过滤、和数字信号处理引擎,他们每个引擎都有各自的使命和运作方式。采样率转换引擎上文已经详细介绍过了,下面我们就从延迟特效引擎说起。 延迟引擎 声音的延迟现象在我们的日常生活中经常发生。在X-Fi中它是一种数字延迟线引擎,它的任务就是处理声音在扩散时的变化特效。例如,日常的声音会有回响,合唱时会有共鸣,两耳接受声音时会有不同程度的延迟,宽敞的教堂内声音会有反射等等。 延迟引擎大约具备440 MIPS的处理能力,它能在其他的数字信号处理器或主CPU中调用超长的地址进行计算。它也可以进行局部计算,这样可以避免具有超常流水线的CPU发生停滞等待。它会避免强大的音频处理器空挡,避免输出的音频发生暴烈和冲突等杂音。这就是在内存中的延迟线执行方式,它并不会真正移动内存中的数据,它会重新计算内存地址的指针。延迟引擎会将数据和地址用不同的管道分开处理。 混音引擎 在X-Fi的音频环架构中,混音引擎是一个比较关键的元素。它负责测量、统计和重新分配音频环中的通道,它控制着4096条通道的工作。混音引擎也可以为内部电子合成器、反响、均衡器等节点作混合,并且可以动态的处理数据。要知道混合4096条通道内的数据可不是件简单的任务。混音引擎具备1210 MIPS的处理能力。
过滤引擎 它有些类似于延迟引擎,过滤引擎会提供数百种为环境音效而制定的数码过滤。它可以过滤环境的模型、位置声音、音乐合成和一些自定义的对象。它可以根据不同的指令作不同的过滤,因此这个过滤引擎也是可编程的。由于它内部有许多高度优化的固化函数,因此它不必需要担负繁重的计算任务,它的处理能力仅为200 MIPS 四重揍的DSP引擎 X-Fi内置的DSP引擎非常强大,它可以实现同时处理四个线程。因此创新的工程师又亲切的称它为四重揍引擎。四重揍引擎由三个SIMD单指令多数据单元构成,其中一个SIMD单元负责处理数据,另外两个负责执行数据分支。这样的设计会让DSP引擎能轻松的胜任立体声和复数类型的数据处理。创新将这种能联合多个子线程进行隔行交错处理可实现多通道数据处理的运算模式叫做“TIMD”架构。四重揍引擎的指令系统可以同时支持定点和浮点数据类型。这种设计可以有效的执行时域延迟处理和频率范围信号处理。 四重揍引擎具备1200 MFLOP(每秒百万次浮点指令)的处理能力。由于DSP的特殊性质,它不必进行任何的地址计算和数据移动。并且创新设计的这种特殊的架构就是为了能让X-Fi支持更多的通用处理器。例如它可以让一个指令的运算结果直接输入到下一个指令中,在这个过程处理管道不会停滞,并且也不会干预到其他数据的移动。 四重揍也可以在一个时钟周期内执行四次内存数据移动操作。创新声称TIMD架构也可以执行复合浮点乘法运算或SIMD线性插入运算,并且不需要任何管线来操作,这就不会让处理管线停滞。DSP在整个声卡中肩负起重要的作用,它可以说是真正的音频处理中心,X-Fi在执行每一个分支计算时DSP都要参与。 时域延迟与频率范围 音效经常作用在两个范围:时域与频率范围。举例来说,时域的作用是确定回响,通过延迟来模拟出声音在一个房子内扩散和重复反射后的情况。另外像是被广泛使用的HRTF头部相关传输函数技术和EQ频率调节技术都属于利用频率范围来进行3D音频定位,营造出3D音场的效果。
(如图7 这是用RightMark Audio Analyzer 5.4来测试一块声卡总谐波失真的频率范围) 在游戏中的声音大都使用时域延迟技术来实现不同的环境音效。例如,在玩第一人称射击游戏时,如果你身处一个宽敞的洞穴,就能听到很多回响。若你是在一间狭小的办公室就没有这些回响。另一种是频率范围特效,它并不像时域延迟那样应用的广泛。它所营造的空间感比时域延迟特效强,但还要花费更多的DSP资源来处理数据。而且许多DSP引擎都不是专门为频率范围特效而制定的,其运算能力可能不能达到游戏的要求。创新凭借着X-Fi强大的运算能力希望在PC游戏界使用频率范围技术来为游戏营造更逼真的音效。 依照创新官方的说法X-Fi使用了最为快速的傅氏变换算法来处理音效,它会检验所有声道音频,以调整为人耳最能接受的频率范围来输出。回放系统能够感知识别这些特殊的音频单元信息,并且将会对他们作一些特效的处理。这些处理方式相当有效,与原有声音相比我们能够更加深刻的感受到直达声音和反响声音的区别。例如敲鼓的时候会有余音萦绕耳畔。更复杂的是直达的声音会与回响声音发生碰撞。声卡要模拟这些环境声音需要处理许多数据。X-Fi声卡就能捕获这些信息,并且建立主声道和环境音效声道。最后将这两条音轨合并成多声道音效,在你的5.1/6.1/7.1音箱中播放出来的就是逼真的声音了。
在X-Fi中另一项创新技术叫做“Active Premium Audio”。简单的说它能够最大限度的优化声音的质量,让音箱能够展现更多声音的细节,让收听者能有身临其境的感受。很显然,它能够自动的优化音质和环境音效。通常声卡要想提高音质,都会将音频转换为更高的采样率格式,转换为更深的bit位宽。但是这种处理方法是比较被动的。这样作仅仅是尽量让收听者欣赏到无损的音质。而依照创新的说法,他们的APA声音系统通过复杂的算法可以提升任何多声道音频的音质。甚至可以将普通的立体声音频加工成具有彭湃感染力的多声道DVD音频。现在你知道创新为什么形象的称它为:激活白金音频了巴。任何一款X-Fi声卡都会支持APA功能,不过为了区别声卡的档次会有不同的命名形式。 APA技术可以很好的复原压缩格式音频的动态范围和高频部分的信息。比如播放像MP3、WMA和AAC这些压缩格式的文件音质提升会更加明显。类似APA的优化播放技术现在有很多种,许多MP3播放器的厂商都将它视为一项重大卖点,比如现在最火的SRS技术。但许多亲身体验过SRS的人都说,它提升音质的能力并没有商家鼓吹的那么出色。创新官方指出,由于受到MP3硬件运算水平的限制SRS只能采用比较简单的算法来增强音质。而X-Fi声卡本身有着强大的运算能力,在APA中可以使用更为复杂的算法。音质的改善自然就比SRS明显了。一旦你选择使用APA处理一段音频,你就可以选择将它导出为采用无损压缩的WMA Pro格式。如果音频采用了DRM数字防拷贝加密,你虽然不能将它另存为,但是你仍然可以实时的欣赏APA的魅力。 OpenAL初露端倪 下面我们再来谈谈X-Fi在游戏方面的一大创新。API应用程序接口技术已经在游戏界服役多年。我们最为熟悉的就是Dricet3D和OpenGL,以前还有Voodoo的Glide。他们都是家喻户晓的3D图形API。现在创新也在力推自己制定的OpenAL,它是可以在众多平台上使用的音频API。它可以支持Windows、Linux、Mac操作系统。《虚幻》系列的最近几部大作就使用的是OpenAL。还有像“Psychopaths”、“部落: 复仇”亦如是。虽然OpenAL是一项音频API但是它不会削弱DirectSound/DirectSound3D在程序中的作用。创新真正用来与DS3D抗衡的是EAX扩展指令集。
创新不会孤注的发布硬件加速产品,他们很清楚这些新标准需要软件商来支持。根据可靠消息微软的下一代操作系统Longhorn已经开始支持OpenAL,创新的下一代声卡可以直接为音频处理进行硬件加速。
这对于创新来说可谓喜忧参半。一方面,创新在业界的根基十分深厚,在长达7年的时间里无人可以动摇创新音频霸主的地位。几乎目前每一款新作问世都会支持EAX和OpenAL。另一方面这也是对于开发人员的一种挑战。创新在不断的催促开发人员使用自己的API,现在又仅有X-Fi才能支持这些丰富的音频特效。X-Fi的性能的确让人馋涎,但10,000 MIPS以上的性能并不能说明一切。对于X-Fi和下一代音频加速器而言,10K2.5也是一个重要的敌人。虽然10K2.5比X-Fi慢24倍,但是前者可以拿出主板集成的解决方案,并且还可以省略DSP引擎大大节省成本。其实创新最大的敌人是NVIDIA和ATI他们的新显卡层出不穷,游戏画面一代比一代绚丽,每个游戏玩家都盘算着用口袋里的银子升级显卡而非声卡。这些都将成为高端X-Fi声卡致命的弱点。 最后的办法——听 今天的PC声卡市场就好像回到了上世纪90年代中期,创新携全新的技术架构准备再次席卷PC音频市场。亦或X-Fi像是一颗彗星在久已黯淡无光的PC音频市场只是一瞬的火热。一切的答案会在不久的未来揭晓,所有先进的技术是否真的如创新宣传的那么出色,只有真正的聆听者才能知道。
|
|||||||||||||||||||||||||||||||||||||||||||
| 起居室变摄影棚 DIY摄影背景幕布 mod地带:恶龙传说MOD主题机箱改造 |
|||||||||||||||||||||||||||||||||||||||||||
|
|