Submit News Tips | I4U Gadget Flyer | RSS Feed
I4U Shopping : Cool Gadgets and Consumer Electronics Store
 
HOT TOPICS: Nintendo Wii | Sony PS3 | Xbox 360 | Gadget Models

I4U Latest News

火影忍者 nForce4芯片组技术架构全面解析

Topic: 技术前沿         ★★★★★

作者:Rowan    文章来源:本站原创    点击数:    更新时间:2007-7-2

编者按:这篇文章成文于2004年10月21日,发表在《大众硬件》杂志上。其实人写作,无外乎两个原因。1是求财,2是求名。我自认为自己比较猥琐,既求财又求名。不过求名儿的成分更大一些。因此我总写一些比较有历史意义的文章。妄图能像叶圣陶他老人家一样,能将自己的名字永远留在中学语文课本里。所以我也更喜欢给杂志投稿,不仅仅是因为平面媒体的稿费高。更多的是因为平面媒体能够将知识更安全的保留下来。

Intel、AMD、NVIDIA、ATI每当这四大家有新东西出来的时候,我总是不遗余力的抢先报道。这次能赶上nForce4的技术解析我感到非常荣幸。总认为这样能做个历史的见证人……


火影忍者 nForce4 芯片组全面解析

NVIDIA——就是这个拥有酷似火影忍者标志的公司,成就了一代显示芯片的辉煌,不断引领个人计算机图形技术的发展方向。就在人们猝不及防的时候,NVIDIA又凭借着nForce系列芯片组在主板领域称王称霸。在nForce2芯片组取得了巨大的成功之后,NVIDIA就成为了AMD平台最为忠实的铁干球迷。当AMD的处理器全面升级到64bit运算架构的时候NVIDIA也义无反顾的推出了新一代nForce4主板芯片组。同时新的芯片组也带来了PCI Express、SLI、SATA2、千兆网卡等等许多令人兴奋的新特性。本篇文章就深入到技术层面,带你领略nForce4无穷的技术魅力。

nForce4兄弟连介绍

面向不同消费阶层推出多款系列芯片,NVIDIA的这种营销模式从TNT2时代开始就已经获得了巨大的成功。此后无论是显示芯片还是主板芯片组,每一代NVIDIA的产品都会推出多个版本如:标准版、LE简化版、GT加强版、Ultra超强版等等。在nForce4时代也不会例外,你愿意为nForce4主板出多少钱,就能买到相映价位的产品。NVIDIA试图扩大nForce4系列芯片组的产品阵线来满足不同阶层用户的需求。各个版本主要是面向平台与集成功能之间有所差别,但是所有的芯片组都是基于nForce4核心。

如图1~3,各个版本的nForce4芯片组LOGO

根据目前确切的消息,NVIDIA网站上提供了三个nForce4版本的介绍。他们分别是nForce4标准版、nForce4 Ultra加强版、nForce 4 SLI双显卡串连版。其中nForce4标准版是最为基础的版本它仅针对廉价的入门级市场。但它还是支持千兆网卡、完全的RAID功能、10个USB2.0接口、NVIDIA Firewall 2.0以及最新的nTune性能调节工具。提供4个SATA驱动接口,PATA速度1.5GB/s。该芯片组的最大缺点就是仅支持800MHz Hyper Transport,并且HT总线已经被锁定来防止Hyper Transport超频。它是未来的主打产品,每块主板的售价会控制在400至800元之间。这个价格也是大多数消费者可以负担的起的。

nForce4 Ultra是前者的加强版,它可支持NVIDIA千兆以太网卡并带有硬件级别的防火墙机制(ActiveArmor安全网络引擎),还集成有nvRAID功能和支持1GHz Hyper Transport总线。最令人兴奋的是它可支持SATA II,即SATA-300,每秒磁盘数据吞吐量可高达300MB/s,所有SATA设备支持高达3GB/s的带宽。它定位于豪华版产品,每块主板的售价会控制在850至1200元之间,是中高端消费群体的首选。

nForce 4 SLI顾名思义它在nForce4的基础上提供了两条PCI Express图形总线,可支持NVIDIA SLI双显卡技术。有意思的是这两条PCI Express图形总线由一条x16和一条x8组成。它也是唯一能够支持PCI-E lanes可编程的版本。用单显卡时可以实现PCI-E x16;用双显卡则可以实现两个PCI-E x8。其他特性和nForce4 Ultra相同。此款主板定位在高级图形工作站和超级3D发烧友阶层,你可以使用这款主板构建起性能强大的图形处理系统。然而它的售价并不便宜,每块主板售价会在1600元以上。

nForce 4 Pro是最为神秘的一款芯片组,这是一款针对服务器市场的产品,它可支持两路甚至八路的Opteron系统,同样可支持PCI Express总线。在早些时候,从互联网上曾经流传出它的一些规格介绍,但是直到今年10月nForce 4系列芯片组正式发布的时候在NVIDIA的网站上仍然没有看到任何关于nForce 4 Pro的介绍。这款高端服务器主板有可能会在随后的几个月内发布。

新的MCP芯片

几乎所有的nForce4芯片组的新特性都是由这颗小小的MCP芯片来完成的。全新设计的MCP芯片给这个系统注入了巨大的活力,它可以说是nForce4芯片组的精华萃取。如图4

在这颗MCP芯片中包含了四大组成部分:

1、NVIDIA ActiveArmor这是在主板芯片组层次上的硬件级别的防火墙,NVIDIA宣称这个硬件防火墙是绝对的安全。

2、支持PCI Express系统总线,具备强大的数据吞吐能力和扩展适应能力。图形子系统彻底摒弃了APG总线。

3、支持Serial ATA2协议,磁盘子系统的数据吞吐量可以达到300M/s并且还集成了nvRAID功能,方便用户使用SATA硬盘构建高速磁盘阵列系统。他们都可以大大提高系统的磁盘效能。

4、nForce4独有的SLI显卡串连工作模式,让你可以轻松构建起性能强劲的3D图形处理系统。

机动装甲ActiveArmor防火墙

对于现在高度发达的互连网络来说,防火墙已经不是什么新鲜的技术了。在互联网络中装有各式各样的防火墙,例如路由器和软件防火墙。在每一台Windows XP操作系统中就都集成有软件的防火墙。可以说防火墙无处不在。但是这些防火墙不是内装的软件就是外置的硬件,可以说都是系统的附加产物。他们就像系统一层层的防弹背心一样,只能被动的防御黑客的攻击。而在nForce4芯片组中集成的ActiveArmor防火墙则是一种纯硬件级别的防火墙,并且它集成在系统芯片组内部,可以直接增加系统的健壮性。很多用户都热切盼望能使用到这项新技术。

一般普通的个人电脑上都安装的是软件防火墙,它对cpu的依赖非常高,占用的系统资源也非常多。每一个从网络中接收到的数据包,都需要经过严格的分析处理,最终系统会判断这个数据包是合法还是非法的。合法的包会得到进一步的处理,而非法的数据包将会被抛弃。那么如果系统不能确定一个数据包是否合法,系统将会反复检测这个数据包,查看它是否有效。检测数据包的这个过程会消耗大量的系统资源,尤其是对于那些不能立刻确定合法性的数据包,更是需要处理器运行多个时钟周期。通常防火墙软件的算法决定了防火墙进程的cpu资源占用率,高级的软件防火墙的cpu占用率会低一些。尽管如此,对于数据吞吐量较大的宽带网络来说,防火墙软件的资源占用率还是非常高的。

如图5,这是一个非常典型的采用传统防火墙软件的系统流程图。你可以看到处理器在整个系统中需要负责许多环节的处理工作,每个环节都要消耗掉10%至30%的cpu资源。

可以设想一下,当我们运行光影效果逼真的DOOM3,与互联网上好友奋力厮杀的时候,防火墙软件会暗中托系统的后腿,整个系统会损失30%的速度,处理器必须花费更多的时钟频率处理来自互联网的数据包。在NVIDIA发布nForce4芯片组的时候作了一个非常有说服力的演示,它告诉我们在玩3D游戏和播放电影时,软件防火墙会对系统性能带来多大的影响。

在这项测试中,采用了nForce4 Ultra主板,AMD的Athlon64 3800+处理器,1GB内存和Geforce 6800 Ultra PCI Express显示卡。采用微软的nttcp网络工具来模拟出840Mbit的网络饱和流量。并且使用了Norton Internet网络防火墙来进行比较。结果如下:

在运行微软的地牢围攻3D游戏时,开启nForce4内置的防火墙,关闭Norton Internet网络防火墙,游戏显示的帧数为74fps。相反关闭nForce4内置的防火墙,开启Norton Internet网络防火墙,游戏显示的帧数仅为54fps。

在回放DVD影片时,开启nForce4内置的防火墙,关闭Norton Internet网络防火墙,画面非常平滑流畅,cpu的资源占用率仅有70%至80%。在关闭nForce4内置的防火墙,开启Norton Internet网络防火墙时,画面出现多处定格,声音也断断续续。

如图6,这是最新的nForce4芯片组中的防火墙工作流程图。你会发现黄色背景色的部分都是由防火墙硬件来处理。在这些环节中处理器不必参与计算,仅有一小部分蓝色背景色的部分是处理器要参与计算的。处理器仅需将合法的数据包传递给应用程序,开启新的网络传输进程。这样会大大降低处理器在数据包检测方面的资源占用率。

给人印象最为深刻的就是nForce4防火墙的防洪机制。使用nttcp网络工具模拟出的840Mbit网络流量相当于105MB/s的数据吞吐量。即使系统受到了巨大的DDoS(拒绝服务式攻击)或洪水数据包攻击时,处理器的资源占用率也不会超过15%。

我们平常使用的软防火墙一般都是在系统启动后才加载。由于应用程序的加载优先级别不同,因此启动候的执行顺序也就不一样。如果一些病毒在防火墙加载之前加载,那么防火墙就形同虚设。而nForce4所提供的硬防火墙却没有这种问题。因为系统在启动过程中,往往将硬件及硬件驱动程序放在队列的最前方执行。

防火墙的操作和设置也是非常方便的。整个ActiveArmor的设置界面是基于web形式的。你可以非常轻松的设置数据包的过滤规则,开启和关闭端口,允许和禁止应用程序访问网络,查看防火墙日志,备份和恢复设定等等。所有防火墙的管理软件都会封装在NVIDIA的Forceware主板驱动中,只要经常更新主板驱动程序就可对防火墙进行升级。

如图7,这是防火墙的设置界面。


如图8,这是防火墙的应用程序审核界面。

除此以外,nForce4芯片组所内置的防火墙还包括了许多其他的高级防火墙功能。例如:

1、对Linux操作系统的支持。这一点似乎非常重要,因为除了微软的Windows之外网络上很多形形色色的应用服务器也都采用Linux操作系统。
2、支持微软未来的Longhorn长角牛操作系统。微软和NVIDIA的合作非常密切,在下一代微软的操作系统中将全面支持nForce4芯片组内置的防火墙。
3、通过了ICSA的个人防火墙认证。ICSA是世界知名的反病毒组织,它会通过一系列严格而复杂的方法测试防火墙产品的安全性。
4、与微软的操作系统防火墙完美融合。NVIDIA的硬件防火墙可以完美的与Windows XP系统相融合,减缓处理器的资源占用率。
5、高级的散列式算法可以有效的防止病毒和黑客程序传播到其他电脑中。
总的来说具有革命性技术的ActiveArmor防火墙可以大大加强网络计算机系统的安全。但如果你仅仅因为特别青睐ActiveArmor防火墙技术而选购nForce4主板的话,你需要特别注意一下,在简化版的nForce4主板中并没有开启网络安全引擎功能。因此你需要选择更为高端的nForce4 Ultra或SLI版本。

磁盘性能的飞跃nvRAID 和 SATA2

现在的程序和游戏越来越庞大了,人们除了对硬盘的容量有要求之外,系统的磁盘性能也是倍受关注。下面就来让我们看一下在nForce4芯片组中的nvRAID和SATA2两大先进的磁盘技术。

如图10,nForce4中的双SATA 2磁盘控制器

如图11,其他竞争者的芯片组中仅有一个磁盘控制器

在磁盘控制器方面nForce4比它的前辈nForce3 250有很大的进步,虽然nForce3 250内置了SATA控制器,但是它仅仅支持SATA 1标准。而在nForce4的SLI和Ultra版本的芯片组中集成了两个SATA 2控制器,他们可以提供多达300MB/s的带宽。这样的传输能力看上去真是让人兴奋,但是也有不少人认为nForce4所支持的SATA 2功能在传输速率上实用意义仍并不是很大。目前普通7200转的SATA硬盘的最大内部传输率仅仅达到85MB/s左右,一般的PATA硬盘仅为70MB/s的水平。这还不能满足SATA 1的胃口需要,我们期望可以在几年内看到超过100 Mbps的硬盘已经很了不起了。

nForce4芯片组中所提供的nvRAID技术正好就可以将SATA 2的接口速率发挥到极限。它是集成在主板芯片组内部的磁盘阵列控制器。这样我们在构建高性能的磁盘子系统的时候就可以像普通的PATA硬盘一样使用RAID磁盘阵列技术得到双倍数据吞吐量。需要注意的是标准版的nForce4芯片组仍然采用SATA 1接口。

与传统的RAID磁盘阵列技术相比nvRAID要强大许多。以前要实现RAID功能都要额外购买RAID卡,并且要额外安装驱动程序还要进行复杂的设置。现在NVIDIA的Forceware主板驱动中已经包含了nvRAID磁盘阵列管理程序。你仅仅使用一只鼠标就能完成所有的设置。

如图12 这是nvRAID磁盘阵列的设置界面。你可以在这个窗口中完成创建分区、磁盘优化、磁盘修复和模式转换等操作。强大的软件还可以提示SATA 2接口的工作状态。在驱动程序设置中你可以看到亮有绿色指示灯处的SATA 2接口正在工作,亮有红色指示灯的SATA 2接口设备无法连通或是出现故障。另外在驱动程序中还可以方便的实现RAID 1到RAID 0模式的转换。

如图13,在磁盘驱动程序中你可以看到类似“红绿灯”的图示,显示主板SATA 2接口的工作状态。

除了操作界面更加人性化之外,磁盘控制电路也设计的非常强大。它支持SATA 2 v1.0协议的很多特性,这包括:硬盘的热插拔操作(Hot Plug),硬件辅助本机命令队列(HW Assisted Native Command Queuing)、冷设备存在检测(Cold device presence detect)、活动LED生成(Activity LED generation)、交错起转(Staggered Spin-up)和端口叠加(Port Multiplier)、本机命令排队(Native Command Queuing,NCQ)支持和32级命令队列深度等等一系列先进的功能。

在nForce4芯片组中还继承了nForce3的混合RAID磁盘阵列功能。即混合使用SATA串行和PATA并行硬盘来组建RAID 0、1、0+1模式的磁盘阵列系统。这项功能对于已经拥有PATA硬盘的用户来说可以最大限度的保证他们前期的投资。用户无需购买两块相同的SATA硬盘就可组建RAID。

如图14,混合模式的RAID磁盘阵列

当然目前的nvRAID也仅仅是第一代,它也还有许多不足之处。例如,nvRAID现在并不支持Linux的操作系统,目前它仅仅能应用在Windows操作系统中。为了向后兼容其他应用程序修补驱动程序的bug,你需要不断的下载新的nvRAID驱动。除了nvRAID驱动可以自动引导系统之外,现在还没有第三方的驱动可供选择。尤其是你在以RAID模式安装Win XP的时候需要按F6键手动安装nvRAID驱动。

PCI Express和SLI技术


随着现代个人计算机系统性能的大幅提升,使得古老的系统总线不堪重负。为了让计算机在未来几年内能够保持高速发展的态势,Intel在2001年的IDF开发者论坛上提出了PCI Express串行总线标准。nForce4也支持这一先进的系统总线技术,所有的PCI与AGP界面将统统由PCI Express界面取代。它与传统的PCI系统总线相比最大的特点就是支持“点对点”的数据传输模式。这意味着每一个PCI Express设备都会拥有自己独立的数据传输通路。系统内的各个设备不会相互争夺传输带宽。而传统的PCI总线采用并行结构,设备之间最容易发生哄抢或独自占用系统资源的情况。

PCI-E最大的特色就是可以根据不同设备的传输能力分配不同的数据带宽。PCI-E的连接能够设定为x1,x2,x4,x8,x12,x16,x32倍速。这就相当于利用多条串行总线建立并行界面,实际上独立的串行连接是可以组合在一起构建具有惊人吞吐量的超级传输总线,而且它不会有类似并行总线的各种信号问题。x1的传输速度为250MB/s。目前PCI-E图形子系统的接口为x16,数据传输能力为4GB/s。使用PCI Express x32接口,数据吞吐量将会达到惊人的8GB/s。正是有PCI-E这样强大的系统总线奠定坚实的技术基础,才有了后面的SLI技术。

如图15,PCI Express的LOGO,未来几年内的系统总线主流技术。

随着新一代NV40系列显示芯片的发布,GeForce6800Ultra 、GeForce6800GT、GeForce6600GT等这些强大的显卡都开始支持SLI双卡并行运行技术。在处理一个场景时,可由两块显卡协同处理,从而可以大幅提升系统的3D图像的显示效能。不过要想使用肥美的SLI技术,你的主板必须支持两条PCI Express x16插槽。

每一块nForce4 SLI版本的主板都装配有2条PCI Express x16插槽。若你单独使用一块显卡时,插在任意一条PCI-E x16插槽上均可。此时PCI-E插槽可以设定为x16模式。如果你使用SLI将两个PCI-E插槽都插满的话,为了让系统将两块物理显卡认定为一块逻辑显示卡,你必须将两个PCI-E x16插槽设定为x8工作模式。这样双PCI-E x8串连之后系统就会将他们检测成一块PCI-E x16显卡。这样作的最大好处就是两块显卡的性能均衡,带宽损失不大。而Intel的E7525芯片组实现SLI则是采用的“x16+x4”的畸形方案。两块显卡的性能发挥有所偏差,其中这块使用x4接口的显卡的数据带宽会明显不足,而另一个显卡使用x16接口带宽又出现冗余。因此还是nForce4的实现SLI的方式更为经济高效。最后为了让两块显卡协同工作,你还要在显卡的顶端加装一个SLI信号连接器。

如图16这是两块显卡SLI时的样子。


如图17这是显卡上的SLI插槽。


如图18这是SLI信号连接器。


如图19这是集成2条PCI Express x16插槽的主板

目前NVIDIA并不打算让更多块显卡串连工作,那样系统会需要很高的设计制造成本。但实际上SLI串连工作的两块GeForce 6800 Ultra PCI-E的表现可以达到单块GeForce 6800 Ultra PCI-E的1.87倍还多。当然,在3DMark2005下的平分也十分惊人,最近网络中就有报道,华硕的nForce4 SLI平台,双GeForce 6800 Ultra PCI-E可轻松突破10000得分。

nForce4 SLI性能比较

 

6600GT

6800GT

6800 Ultra

单显卡

SLI

性能提升

单显卡

SLI

性能提升

单显卡

SLI

性能提升

Doom3

17.3

32

85%

37.9

65.2

72%

42.4

71.7

69%

Halo

37.23

58.58

57%

50.01

72.76

45%

57.21

79.01

38%

3DMark05

3186

5698

85%

4588

8271

80%

5211

10118

78%

nTune性能配置工具

最后要向大家介绍的是nForce4主板所提供的最新系统性能配置工具——nTune。它是NVIDIA面向最终消费用户提供的一种系统性能调试优化配置工具。nTune配置工具支持目前所有的nForce系列主板。通常我们对系统的基本参数进行设置时,都需要进入主板的BIOS里进行设置。如果你使用nTune配置工具,你就可以轻松的在Windows中点几下鼠标进行设置了。nTune独有的时钟控制面板允许你调整许多硬件的工作频率。例如系统总线、内存总线、PCI Express总线、GPU的核心和显存工作速度等等。

最有趣的是它的Auto-Tuning自动调节功能,nTune可以自动检测系统的硬件配置信息,自动转换硬件设置参数,并且会与先前的设置参数做出比较,然后会保存性能表现优秀的设置。随后它会对硬件反复进行系统稳定性测试。如果测试系统工作不稳定,它就会恢复上一次成功测试的设置。通过这种方法,它会自动调整内存、磁盘和显卡的设置参数。通过小幅度的超频来最大优化系统的性能。

nTune优化程序甚至可以自动优化硬件的工作电压,前端总线的速度,对显卡的工作频率进行超频。如果你的系统在超频的状态下不能稳定工作,那么nTune也会在下次重新启动的时候恢复先前的设置。最终,nTune会给出一个最佳优化设置方案,所有的细节设置都将以web的形式呈现在你的屏幕上。

所有的系统设置参数都会保存成一个Profile设置文件。当然你也可以保存多个设置文件,在不同的环境下使用不同的Profile设置文件。例如,在你日常工作的时候,你可以选择使用“Windows最快启动”设置。在运行Photoshop时,你可以选择“大型应用程序优化”设置。当你玩DOOM3的时候,你可以选择“最佳游戏性能”设置。相信在未来随着nTune的普及,可以使用更丰富的Profile设置文件。

如图20,这是nTune的频率控制界面


如图21,这是nTune的系统性能优化界面


如图22,这是nTune的Profile设置文件管理界面

总结

处理器在革命,在从32bit向64bit运算架构转变;与之配套的主板也在发生着变革,AGP走了PCI Express来了。作为今后几年内的主打产品nForce4这次来势汹汹。几乎针对每个消费阶层,NVIDIA都拿出了与之对应的nForce4产品。这次nForce4也带来了许多先进的技术,比如SLI、PCI Express、ActiveArmor、SATA 2、nTune等等。下面这张表格就向你完全展示目前所有的nForce4家族成员规格细节。

功能特性

nForce 4 SLI双显卡版

nForce4 Ultra加强版

nForce4标准版

CPU

 

Athlon 64 FX

Athlon 64

Athlon 64 FX

Athlon 64

Athlon 64

Sempron

PCI Express

多倍速串行总线

20条可变串行

20条固顶串行(x16x1x1x1

20条固顶串行(x16x1x1x1

SLI

SLI技术双显卡支持

X

X

USB

支持端口个数

10

10

10

磁盘

SATA 支持

3/1.5

3/1.5

1.5

 

SATA/PATA端口个数

4/4

4/4

4/4

 

SATA控制器

 

RAID 0101

 

RAID混合模式

 

RAID交错控制器

网络/安全

网络安全引擎

X

 

本地千兆网卡

 

NVIDIA防火墙2.0

nTune性能优化

自动性能优化

 

参数自动恢复

 

GPU超频

 

 

发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口

  • 上一篇文章:
  • 下一篇文章:
  • 起居室变摄影棚 DIY摄影背景幕布
    mod地带:恶龙传说MOD主题机箱改造
     
    姓 名:

    评 分: 1分 2分 3分 4分 5分

    评 论: