Submit News Tips | I4U Gadget Flyer | RSS Feed
I4U Shopping : Cool Gadgets and Consumer Electronics Store
 
HOT TOPICS: Nintendo Wii | Sony PS3 | Xbox 360 | Gadget Models

I4U Latest News

四手联弹 AMD下一代架构K10架构技术

Topic: 技术前沿       ★★★★★

作者:Rowan    文章来源:本站原创    点击数:    更新时间:2007-8-25

编者按:这篇文章成文于2006年10月9日,发表在《电脑商情报》上。是一篇非常不错的技术解析文章。AMD将在2007年中旬发布新一代K8L架构,那才是真正的Core 2杀手。也就是说AMD的K8L至少要在Core 2发布后整整1年才能与广大的消费者见面。可是随后AMD正式宣布K8L就是传说中的K10处理器,并且要将发布日期再次向后拖延,直到2007年9月10日,才会与大家见面。而这个Intel的杀手,要直到11月以后的圣诞节期间才会真正摆上货架,与消费者见面。现在K10发布在即,让我们重温一下它的技术光环。


四手联弹
——AMD下一代架构K8L预览

四核心K8L揭密

2006年7月,Intel正是推出了新一代Core 2处理器。它是基于强大的Conroe核心架构,使处理器的运行效能大幅提升。而目前AMD并没有发布能与Core 2处理器相抗衡的新产品。不幸的是,AMD对于自己的高端K8系列处理器过于自信,他们并不准备在此时对Core 2予以反击。

AMD将在2007年中旬发布新一代K8L架构,那才是真正的Core 2杀手。也就是说AMD的K8L至少要在Core 2发布后整整1年才能与广大的消费者见面。最初的K8L被设计成4核心处理器。也就是说它会在一颗硅片上集成4个执行核心,并且他们会使用L3高速缓存作为数据链路来交换数据。在这篇文章中我们就来分析一下K8L架构的先进之处。

图,AMD下一代K8L处理器核心

32字节指令取回

在每个时钟周期内K8处理器可以取回一个长度为16个字节的代码块(byte)。处理器会从L1高速缓存中读取数据,将他们萃取成指令代码。此后将指令代码发送给解译器的通道进行处理。一般来说处理器中的指令长度为5字节,那么16字节长度的代码块可以包含3条指令。因此K8处理器每个时钟周期平均可以处理3条指令。不过需要注意的是,处理器的很多指令长度也有可能大于5个字节。

在这种情况中每个时钟周期取回16个字节的处理效率并不高。K8处理器中的解译器每个时钟周期可以解译3条指令,但是当单个指令长度过长时,就无法喂饱解译器。因此这就成为了K8处理器架构中最大的绊脚石。

AMD宣布,下一代K8L每次将能取回32字节的代码块,处理器每个时钟周期能处理的指令数将大幅提高。举例来说,若处理器一次能取回32字节的代码块,那么解译器平均就能得到5条指令。若处理器每次取回16字节代码块,那么必须使用2个时钟周期才能完成操作。


高效译码机制

在K8处理器中,SSE、SSE2、SSE3这几种扩展指令都是分门别类存放的。每一个64bit执行单元中,都会配置一对64bit长的SSE寄存器。因此K8每两个时钟周期才能处理3条指令。而在未来的K8L处理器中,执行单元的长度将会增加到128bit位宽。这样就不必将矢量指令拆分为两个部分进行群组处理。K8L内部译码器的算法也会有重大改善,每个时钟周期可以解译出3条128bit的宏指令。


128bit浮点运算

K8每一个调度列队可以分配一个80bit的FPU浮点运算单元,每个时钟周期进行一次浮点运算。解译器可以将一个128bit的SSE指令拆分为2个64bit的宏指令。每一个宏指令的调度需要2个时钟周期。理论上来说,每个时钟周期可以调度3个宏指令,但是在实际运行程序时由于受到解译器的瓶颈却无法达到。

而在K8L中,浮点加法和乘法运算部分都被扩展为128bit。由此可以极大的加强双精度浮点运算的性能,像是SSE这样具有128bit长度的指令都可以轻松应付。当然获益的并不仅仅是128bit长度的指令,它还可以增加解译器的工作效率和减少产生宏指令的个数。

如图,K8L具有128bit浮点运算能力

内存子系统

K8的L1高速缓存每个时钟周期可以读取128bit的数据。在未来的K8L处理器中,L1高速缓存可以实现每个时钟周期读取2个128bit数据,或实现同时一读一写的数据操作。有小道消息称,L1和L2的容量至少是K8的两倍。因为当缓存读取速度明显增长时,缓存的容量也要成倍增长。

由于K8L将被设计成多核心的处理器,因此在4核心以下的K8L都将共享L3高速缓存中的数据。届时L3也将会被集成到处理器内部,它的容量将在2MB以上,并且L3的速度将会同L2和处理器的主频保持一致。L3的引入将会很好的解决多核心处理器的数据交换问题。L3通过引出的各条数据链路连接临近的处理核心。

如图,K8L处理器为4核心设计

另外K8L还会支持更快速的DDR3内存和FB-DIMM技术,支持更高速的Hyper-Transport 3总线。这些新技术都会大幅提升内存子系统的运行效率。

总结

AMD虽然在64bit运算方面比Intel早迈出一步,又没有盲目的追求高主频的发展路线。但是Intel携“扣肉”的疯狂反击也让AMD以前多年积累的优势殆尽。在双核心领域Intel是小胜一筹,而在未来的四核心领域AMD能否重振雄风还要看K8L。在K8L没有发布之前我们难以对它的性能做出定论,但是它所展现出的实力显然足以成为Conroe杀手。

 

发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口

  • 上一篇文章:
  • 下一篇文章:
  • 起居室变摄影棚 DIY摄影背景幕布
    mod地带:恶龙传说MOD主题机箱改造
     
    姓 名:

    评 分: 1分 2分 3分 4分 5分

    评 论: