标签归档:cpu

linux让CPU利用率占满的命令

linux操作系统中,让CPU利用率占满的命令:

for i in `seq 1 $(cat /proc/cpuinfo |grep “physical id” |wc -l)`; do dd if=/dev/zero of=/dev/null & done

cat /proc/cpuinfo |grep “physical id” | wc -l 可以获得CPU的个数, 我们将其表示为N。
seq 1 N 用来生成1到N之间的数字,
for i in seq 1 N; 就是循环执行命令,从1到N,
dd if=/dev/zero of=/dev/null 执行dd命令, 输出到/dev/null, 实际上只占用CPU,没有IO操作。
由于连续执行N个(N是CPU个数)的dd 命令, 且使用率为100%,这时调度器会调度每个dd命令在不同的CPU上处理。最终就实现所有CPU占用率100%。

这条命令会再后台去执行,如果想中断这条命令,可以执行:

1. fg 后按 ctrl + c (因为该命令是放在后台执行)
2. pkill -9 dd

fg命令可将后台命令恢复到前台执行。

该命令在很多场景非常有用。

hdparm命令介绍

通常情况下可以使用fdisk、df等命令查看硬盘的分区情况以及当前已使用空间大小、剩余空间大小等信息。但是如果要查看硬盘的硬件信息如 硬盘型号、序列号、已运行时间等信息该用什么工具查看呢?

在Linux下可以使用hdparm工具查看硬盘的相关信息或对硬盘进行测速、优化、修改硬盘相关参数设定。我主要常用这个工具来测试硬盘速度。

hdparm(hard disk parameters)
功能说明:显示与设定硬盘的参数。

该命令用来获取或设置SATA/IDE设备的参数。注意了,既可以获取也可以设置,所以使用这个命令的时候务必要小心。当然我们只是为了获取查看硬盘信息,故不会对硬盘及系统造成什么危害。通常会配合 -i 或 -I(大写的i) 选项来取得硬盘的硬件信息。用法如下:

2.常用指令
a.安全擦除
hdparm –user-master u –security-set-pass PASSWORD /dev/sda 设置密码
hdparm –user-master u –security-erase PASSWORD /dev/sda 安全擦除
类似安全擦除:
hdparm –yes-i-know-what-i-am-doing –sanitize-crypto-scramle /dev/sdx
hdparm –yes-i-know-what-i-am-doing –sanitize-status /dev/sdx
b.设置硬盘容量(硬盘必须直连服务器,通过raid卡无法执行此项指令)
yum install sg3_utils.x86_64
sg_readcap /dev/sdb
hdparm -N VP –yes-i-know-what-i-am-doing /dev/sdb (VP: certain LBA blocks)
c.解锁
hdparm –user-master u –security-set-pass PASSWORD /dev/sda
hdparm –user-master u –security-unlock PASSWORD /dev/sda
hdparm –user-master u –security-disable PASSWORD /dev/sda
d.升级固件版本
hdparm –fwdownload /root/Desktop/xxx.bin –yes-i-know-what-i-am-doing –please-destroy-my-drive /dev/sdc
————————————————

hdparm -I /dev/sda

语法:hdparm [-CfghiIqtTvyYZ][-a <快取分区>][-A <0或1>][-c ][-d <0或1>][-k <0或1>][-K <0或1>][-m <分区数>][-n <0或1>][-p ][-P <分区数>][-r <0或1>][-S <时间>][-u <0或1>][-W <0或1>][-X <传输模式>][设备]

参数说明:

-a<快取分区> 设定读取文件时,预先存入块区的分区数,若不加上<快取分区>选项,则显示目前的设定。
-A<0或1> 启动或关闭读取文件时的快取功能。
-c 设定IDE32位I/O模式。
-C 检测IDE硬盘的电源管理模式。
-d<0或1> 设定磁盘的DMA模式。
-f 将内存缓冲区的数据写入硬盘,并清楚缓冲区。
-g 显示硬盘的磁轨,磁头,磁区等参数。
-h 显示帮助。
-i 显示硬盘的硬件规格信息,这些信息是在开机时由硬盘本身所提供。
-I 直接读取硬盘所提供的硬件规格信息。
-k<0或1> 重设硬盘时,保留-dmu参数的设定。
-K<0或1> 重设硬盘时,保留-APSWXZ参数的设定。
-m<磁区数> 设定硬盘多重分区存取的分区数。
-n<0或1> 忽略硬盘写入时所发生的错误。
-p 设定硬盘的PIO模式。
-P<磁区数> 设定硬盘内部快取的分区数。
-q 在执行后续的参数时,不在屏幕上显示任何信息。
-r<0或1> 设定硬盘的读写模式。
-S<时间> 设定硬盘进入省电模式前的等待时间。
-t 评估硬盘的读取效率。
-T 平谷硬盘快取的读取效率。
-u<0或1> 在硬盘存取时,允许其他中断要求同时执行。
-v 显示硬盘的相关设定。
-W<0或1> 设定硬盘的写入快取。
-X<传输模式> 设定硬盘的传输模式。
-y 使IDE硬盘进入省电模式。
-Y 使IDE硬盘进入睡眠模式。
-Z 关闭某些Seagate硬盘的自动省电功能。

hdparm常用参数使用举例:

1、显示硬盘的相关设置:
[root@oracle ~]# hdparm /dev/sda
/dev/sda:
IO_support = 0 (default 16-bit)
readonly = 0 (off)
readahead = 256 (on)
geometry = 19929[柱面数]/255[磁头数]/63[扇区数], sectors = 320173056[总扇区数], start = 0[起始扇区数]

2、显示硬盘的柱面、磁头、扇区数:
[root@oracle ~]# hdparm -g /dev/sda
/dev/sda:
geometry = 19929[柱面数]/255[磁头数]/63[扇区数], sectors = 320173056[总扇区数], start = 0[起始扇区数]

3、测试硬盘的读取速度:

[root@oracle ~]# hdparm -t /dev/xvda

/dev/xvda:
Timing buffered disk reads: 422 MB in 3.01 seconds = 140.20 MB/sec
[root@oracle ~]# hdparm -t /dev/xvda

/dev/xvda:
Timing buffered disk reads: 408 MB in 3.01 seconds = 135.59 MB/sec
[root@oracle ~]# hdparm -t /dev/xvda

/dev/xvda:
Timing buffered disk reads: 416 MB in 3.01 seconds = 138.24 MB/sec

4、测试硬盘缓存的读取速度:

[root@oracle ~]# hdparm -T /dev/xvda

/dev/xvda:
Timing cached reads: 11154 MB in 1.98 seconds = 5633.44 MB/sec
[root@oracle ~]# hdparm -T /dev/xvda

/dev/xvda:
Timing cached reads: 10064 MB in 1.98 seconds = 5077.92 MB/sec
[root@oracle ~]# hdparm -T /dev/xvda

/dev/xvda:
Timing cached reads: 10600 MB in 1.98 seconds = 5351.73 MB/sec


5、检测硬盘的电源管理模式:
[root@oracle ~]# hdparm -C /dev/sda
/dev/sda:
drive state is: standby [省电模式]

6、查询并设置硬盘多重扇区存取的扇区数,以增进硬盘的存取效率:
[root@oracle ~]# hdparm -m /dev/sda
[root@oracle ~]# hdparm -m 参数值为整数值如8 /dev/sda 附:硬盘坏道修复方法
检查:smartctl -l selftest /dev/sda
卸载:umount /dev/sda*
修复:badblocks /dev/sda

HP服务器Uncorrectable Machine Check Exception报错处理方法

现有一台HP DL560 G8服务器出现宕机现象,日志中有Uncorrectable Machine Check Exception相关的CPU报错信息,断电重启后即恢复正常。

对于这种相关的报错,可能是BIOS配置引起的问题,建议在BIOS中做以下几点配置:
1、关闭CPU的C-states,所谓C-states,即CPU的省电模式
2、关闭CPU的QPI链路电源管理,QPI链路电源管理,即Intel QPI Link Power Management
3、将电源配置修改为最高性能,即Maxumum Performance

CPU节能模式导致linux操作系统宕机的解决办法

有台HP DL380 G6服务器,安装有redhat linux as5.6 64位操作系统,安装好操作系统后,服务器有时出现宕机现象,每次重启后都恢复正常,经查看日志发现有CPU frequency相关的信息,根据该信息可以看出CPU不支持频率调整,需要设置“CPUFREQ_ENABLED=no”和“SUSPEND2RAM_FORCE=yes”的参数。

经过分析可以看出宕机现象是由服务器上CPU的节能模式引起,解决的办法就是在BIOS中关闭CPU的节能模式,或者修改cpufreq的配置参数:
#vi /etc/powersave/cpufreq
CPUFREQ_ENABLED=”no”
重启/etc/init.d/powersave即可。

cpufreq技术:

在cpufreq中内置了5种策略:performance、powersave、userspace、ondemand、conservation。默认采用ondemand策略,在该策略里每80个毫秒就采集一次cpu的使用率,同时假设前后两次cpu使用率是相同的。通过前一次的cpu使用率推出后一个cpu使用率,完了进行频率设置。所以就总的思想来说还不是很难理解。

变频技术是指CPU硬件本身支持在不同的频率下运行,系统在运行过程中可以根据随时可能发生变化的系统负载情况动态在这些不同的运行频率之间进行切换,从而达到对性能和功耗做到二者兼顾的目的。

虽然多个处理器生产厂家都提供了对变频技术的支持,但是其硬件实现和使用方法必然存在着细微甚至巨大的差别。这就使得每个处理器生产厂家都需要按照其特殊的硬件实现和使用方法向内核中添加代码,从而让自己产品中的变频技术在 Linux 中得到支持和使用。然而,这种内核开发模式所导致的后果是各个厂家的实现代码散落在 Linux 内核代码树的各个角落里,各种不同的实现之间没有任何代码是共享的,这给内核的维护以及将来添加对新的产品的支持都带来了巨大的开销,并直接导致了cpufreq 内核子系统的诞生。

管理策略:

Linux内部共有五种对频率的管理策略userspace,conservative,ondemand,powersave和 performance

1.performance :CPU会固定工作在其支持的最高运行频率上;

2.powersave :CPU会固定工作在其支持的最低运行频率上。因此这两种governors 都属于静态 governor ,即在使用它们时 CPU 的运行频率不会根据系统运行时负载的变化动态作出调整。这两种 governors 对应的是两种极端的应用场景,使用performance governor 体现的是对系统高性能的最大追求,而使用 powersave governor则是对系统低功耗的最大追求。

3.Userspace:最早的 cpufreq 子系统通过 userspace governor 为用户提供了这种灵活性。系统将变频策略的决策权交给了用户态应用程序,并提供了相应的接口供用户态应用程序调节 CPU 运行频率使用。 (可以使用Dominik 等人开发了 cpufrequtils工具包 )

4.ondemand :userspace是内核态的检测,效率低。而ondemand正是人们长期以来希望看到的一个完全在内核态下工作并且能够以更加细粒度的时间间隔对系统负载情况进行采样分析的 governor。当CPU有负载的时候选用最大的主频,当CPU空闲的时候一步步降低.

5.conservative : ondemand governor 的最初实现是在可选的频率范围内调低至下一个可用频率。即根据CPU使用情况进行升或降频,这种降频策略的主导思想是尽量减小对系统性能的负面影响,从而不会使得系统性能在短时间内迅速降低以影响用户体验。

但是在 ondemand governor 的这种最初实现版本在社区发布后,大量用户的使用结果表明这种担心实际上是多余的, ondemand governor 在降频时对于目标频率的选择完全可以更加激进。因此最新的 ondemand governor 在降频时会在所有可选频率中一次性选择出可以保证 CPU 工作在 80% 以上负荷的频率,当然如果没有任何一个可选频率满足要求的话则会选择 CPU 支持的最低运行频率。大量用户的测试结果表明这种新的算法可以在不影响系统性能的前提下做到更高效的节能。在算法改进后, ondemand governor 的名字并没有改变,而 ondemand governor 最初的实现也保存了下来,并且由于其算法的保守性而得名 conservative 。

Ondemand降频更加激进,conservative降频比较缓慢保守,事实使用ondemand的效果也是比较好的。和ondemand管理器不同的是,在CPU负载高的时候conservative 并不直接跳上最高的主频,而是采用步进的方式来升高主频。

闰秒导致linux服务器CPU利用率过高的解决办法

linux kernel 2.6.29之前版本存在bug,不仅仅是linux操作系统,一些服务器程序,如mysql和java都可能存在bug而导致服务器CPU利用率过高,有的能达到100%,原因可能为这些应用程序试图通过CPU硬件晶振的数据获得当前精确的时间。

解决这个问题的办法也很简单,只要关闭ntpd服务,并且修改系统时间,再开启ntpd服务即可,一般而言将服务器重启也可简单的解决问题。

CPU的18个参数详解

1.主频

主频也叫时钟频率,单位是MHz,用来表示CPU的运算速度。CPU的主频=外频×倍频系数。很多人认为主频就决定着CPU的运行速度,这不仅是个片面的,而且对于服务器来讲,这个认识也出现了偏差。至今,没有一条确定的公式能够实现主频和实际的运算速度两者之间的数值关系,即使是两大处理器厂家Intel和AMD,在这点上也存在着很大的争议,我们从Intel的产品的发展趋势,可以看出Intel很注重加强自身主频的发展。像其他的处理器厂家,有人曾经拿过一快1G的全美达来做比较,它的运行效率相当于2G的Intel处理器。

所以,CPU的主频与CPU实际的运算能力是没有直接关系的,主频表示在CPU内数字脉冲信号震荡的速度。在Intel的处理器产品中,我们也可以看到这样的例子:1 GHz Itanium芯片能够表现得差不多跟2.66 GHz Xeon/Opteron一样快,或是1.5 GHz Itanium 2大约跟4 GHz Xeon/Opteron一样快。CPU的运算速度还要看CPU的流水线的各方面的性能指标。

当然,主频和实际的运算速度是有关的,只能说主频仅仅是CPU性能表现的一个方面,而不代表CPU的整体性能。
2.外频

外频是CPU的基准频率,单位也是MHz。CPU的外频决定着整块主板的运行速度。说白了,在台式机中,我们所说的超频,都是超CPU的外频(当然一般情况下,CPU的倍频都是被锁住的)相信这点是很好理解的。但对于服务器CPU来讲,超频是绝对不允许的。前面说到CPU决定着主板的运行速度,两者是同步运行的,如果把服务器CPU超频了,改变了外频,会产生异步运行,(台式机很多主板都支持异步运行)这样会造成整个服务器系统的不稳定。

目前的绝大部分电脑系统中外频也是内存与主板之间的同步运行的速度,在这种方式下,可以理解为CPU的外频直接与内存相连通,实现两者间的同步运行状态。外频与前端总线(FSB)频率很容易被混为一谈,下面的前端总线介绍我们谈谈两者的区别。

3.前端总线(FSB)频率

前端总线(FSB)频率(即总线频率)是直接影响CPU与内存直接数据交换速度。有一条公式可以计算,即数据带宽=(总线频率×数据带宽)/8,数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率。比方,现在的支持64位的至强Nocona,前端总线是800MHz,按照公式,它的数据传输最大带宽是6.4GB/秒。

外频与前端总线(FSB)频率的区别:前端总线的速度指的是数据传输的速度,外频是CPU与主板之间同步运行的速度。也就是说,100MHz外频特指数字脉冲信号在每秒钟震荡一千万次;而100MHz前端总线指的是每秒钟CPU可接受的数据传输量是100MHz×64bit÷8Byte/bit=800MB/s。

其实现在“HyperTransport”构架的出现,让这种实际意义上的前端总线(FSB)频率发生了变化。之前我们知道IA-32架构必须有三大重要的构件:内存控制器Hub (MCH) ,I/O控制器Hub和PCI Hub,像Intel很典型的芯片组 Intel 7501、Intel7505芯片组,为双至强处理器量身定做的,它们所包含的MCH为CPU提供了频率为533MHz的前端总线,配合DDR内存,前端总线带宽可达到4.3GB/秒。但随着处理器性能不断提高同时给系统架构带来了很多问题。而“HyperTransport”构架不但解决了问题,而且更有效地提高了总线带宽,比方AMD Opteron处理器,灵活的HyperTransport I/O总线体系结构让它整合了内存控制器,使处理器不通过系统总线传给芯片组而直接和内存交换数据。

4、CPU的位和字长

位:在数字电路和电脑技术中采用二进制,代码只有“0”和“1”,其中无论是 “0”或是“1”在CPU中都是 一“位。

字长:电脑技术中对CPU在单位时间内(同一时间)能一次处理的二进制数的位数叫字长。所以能处理字长为8位数据的CPU通常就叫8位的CPU。同理32位的CPU就能在单位时间内处理字长为32位的二进制数据。字节和字长的区别:由于常用的英文字符用8位二进制就可以表示,所以通常就将8位称为一个字节。字长的长度是不固定的,对于不同的CPU、字长的长度也不一样。8位的CPU一次只能处理一个字节,而32位的CPU一次就能处理4个字节,同理字长为64位的CPU一次可以处理8个字节。

5.倍频系数

倍频系数是指CPU主频与外频之间的相对比例关系。在相同的外频下,倍频越高CPU的频率也越高。但实际上,在相同外频的前提下,高倍频的CPU本身意义并不大。这是因为CPU与系统之间数据传输速度是有限的,一味追求高倍频而得到高主频的CPU就会出现明显的“瓶颈效应—CPU从系统中得到数据的极限速度不能够满足CPU运算的速度。一般除了工程样版的Intel的CPU都是锁了倍频的,而AMD之前都没有锁。

6.缓存

缓存大小也是CPU的重要指标之一,而且缓存的结构和大小对CPU速度的影响非常大,CPU内缓存的运行频率极高,一般是和处理器同频运作,工作效率远远大于系统内存和硬盘。实际工作时,CPU往往需要重复读取同样的数据块,而缓存容量的增大,可以大幅度提升CPU内部读取数据的命中率,而不用再到内存或者硬盘上寻找,以此提高系统性能。但是由于CPU芯片面积和成本的因素来考虑,缓存都很小。

L1 Cache(一级缓存)是CPU第一层高速缓存,分为数据缓存和指令缓存。内置的L1高速缓存的容量和结构对CPU的性能影响较大,不过高速缓冲存储器均由静态RAM组成,结构较复杂,在CPU管芯面积不能太大的情况下,L1级高速缓存的容量不可能做得太大。一般服务器CPU的L1缓存的容量通常在32—256KB。

L2 Cache(二级缓存)是CPU的第二层高速缓存,分内部和外部两种芯片。内部的芯片二级缓存运行速度与主频相同,而外部的二级缓存则只有主频的一半。L2高速缓存容量也会影响CPU的性能,原则是越大越好,现在家庭用CPU容量最大的是512KB,而服务器和工作站上用CPU的L2高速缓存更高达256-1MB,有的高达2MB或者3MB。

L3 Cache(三级缓存),分为两种,早期的是外置,现在的都是内置的。而它的实际作用即是,L3缓存的应用可以进一步降低内存延迟,同时提升大数据量计算时处理器的性能。降低内存延迟和提升大数据量计算能力对游戏都很有帮助。而在服务器领域增加L3缓存在性能方面仍然有显著的提升。比方具有较大L3缓存的配置利用物理内存会更有效,故它比较慢的磁盘I/O子系统可以处理更多的数据请求。具有较大L3缓存的处理器提供更有效的文件系统缓存行为及较短消息和处理器队列长度。

其实最早的L3缓存被应用在AMD发布的K6-III处理器上,当时的L3缓存受限于制造工艺,并没有被集成进芯片内部,而是集成在主板上。在只能够和系统总线频率同步的L3缓存同主内存其实差不了多少。后来使用L3缓存的是英特尔为服务器市场所推出的Itanium处理器。接着就是P4EE和至强MP。Intel还打算推出一款9MB L3缓存的Itanium2处理器,和以后24MB L3缓存的双核心Itanium2处理器。

但基本上L3缓存对处理器的性能提高显得不是很重要,比方配备1MB L3缓存的Xeon MP处理器却仍然不是Opteron的对手,由此可见前端总线的增加,要比缓存增加带来更有效的性能提升。

7.CPU扩展指令集

CPU依靠指令来计算和控制系统,每款CPU在设计时就规定了一系列与其硬件电路相配合的指令系统。指令的强弱也是CPU的重要指标,指令集是提高微处理器效率的最有效工具之一。从现阶段的主流体系结构讲,指令集可分为复杂指令集和精简指令集两部分,而从具体运用看,如Intel的MMX(Multi Media Extended)、SSE、 SSE2(Streaming-Single instruction multiple data-Extensions 2)、SEE3和AMD的3DNow!等都是CPU的扩展指令集,分别增强了CPU的多媒体、图形图象和Internet等的处理能力。我们通常会把CPU的扩展指令集称为”CPU的指令集”。SSE3指令集也是目前规模最小的指令集,此前MMX包含有57条命令,SSE包含有50条命令,SSE2包含有144条命令,SSE3包含有13条命令。目前SSE3也是最先进的指令集,英特尔Prescott处理器已经支持SSE3指令集,AMD会在未来双核心处理器当中加入对SSE3指令集的支持,全美达的处理器也将支持这一指令集。

8.CPU内核和I/O工作电压

从586CPU开始,CPU的工作电压分为内核电压和I/O电压两种,通常CPU的核心电压小于等于I/O电压。其中内核电压的大小是根据CPU的生产工艺而定,一般制作工艺越小,内核工作电压越低;I/O电压一般都在1.6~5V。低电压能解决耗电过大和发热过高的问题。

9.制造工艺

制造工艺的微米是指IC内电路与电路之间的距离。制造工艺的趋势是向密集度愈高的方向发展。密度愈高的IC电路设计,意味着在同样大小面积的IC中,可以拥有密度更高、功能更复杂的电路设计。现在主要的180nm、130nm、90nm。最近官方已经表示有65nm的制造工艺了。

10.指令集

(1)CISC指令集

CISC指令集,也称为复杂指令集,英文名是CISC,(Complex Instruction Set Computer的缩写)。在CISC微处理器中,程序的各条指令是按顺序串行执行的,每条指令中的各个操作也是按顺序串行执行的。顺序执行的优点是控制简单,但计算机各部分的利用率不高,执行速度慢。其实它是英特尔生产的x86系列(也就是IA-32架构)CPU及其兼容CPU,如AMD、VIA的。即使是现在新起的X86-64(也被成AMD64)都是属于CISC的范畴。

要知道什么是指令集还要从当今的X86架构的CPU说起。X86指令集是Intel为其第一块16位CPU(i8086)专门开发的,IBM1981年推出的世界第一台PC机中的CPU—i8088(i8086简化版)使用的也是X86指令,同时电脑中为提高浮点数据处理能力而增加了X87芯片,以后就将X86指令集和X87指令集统称为X86指令集。

虽然随着CPU技术的不断发展,Intel陆续研制出更新型的i80386、i80486直到过去的PII至强、PIII至强、Pentium 3,最后到今天的Pentium 4系列、至强(不包括至强Nocona),但为了保证电脑能继续运行以往开发的各类应用程序以保护和继承丰富的软件资源,所以Intel公司所生产的所有CPU仍然继续使用X86指令集,所以它的CPU仍属于X86系列。由于Intel X86系列及其兼容CPU(如AMD Athlon MP、)都使用X86指令集,所以就形成了今天庞大的X86系列及兼容CPU阵容。x86CPU目前主要有intel的服务器CPU和AMD的服务器CPU两类。

(2)RISC指令集

RISC是英文“Reduced Instruction Set Computing ” 的缩写,中文意思是“精简指令集。它是在CISC指令系统基础上发展起来的,有人对CISC机进行测试表明,各种指令的使用频度相当悬殊,最常使用的是一些比较简单的指令,它们仅占指令总数的20%,但在程序中出现的频度却占80%。复杂的指令系统必然增加微处理器的复杂性,使处理器的研制时间长,成本高。并且复杂指令需要复杂的操作,必然会降低计算机的速度。基于上述原因,20世纪80年代RISC型CPU诞生了,相对于CISC型CPU ,RISC型CPU不仅精简了指令系统,还采用了一种叫做“超标量和超流水线结构”,大大增加了并行处理能力。RISC指令集是高性能CPU的发展方向。它与传统的CISC(复杂指令集)相对。相比而言,RISC的指令格式统一,种类比较少,寻址方式也比复杂指令集少。当然处理速度就提高很多了。目前在中高档服务器中普遍采用这一指令系统的CPU,特别是高档服务器全都采用RISC指令系统的CPU。RISC指令系统更加适合高档服务器的操作系统UNIX,现在Linux也属于类似UNIX的操作系统。RISC型CPU与Intel和AMD的CPU在软件和硬件上都不兼容。

目前,在中高档服务器中采用RISC指令的CPU主要有以下几类:PowerPC处理器、SPARC处理器、PA-RISC处理器、MIPS处理器、Alpha处理器。

(3)IA-64

EPIC(Explicitly Parallel Instruction Computers,精确并行指令计算机)是否是RISC和CISC体系的继承者的争论已经有很多,单以EPIC体系来说,它更像Intel的处理器迈向RISC体系的重要步骤。从理论上说,EPIC体系设计的CPU,在相同的主机配置下,处理Windows的应用软件比基于Unix下的应用软件要好得多。

Intel采用EPIC技术的服务器CPU是安腾Itanium(开发代号即Merced)。它是64位处理器,也是IA-64系列中的第一款。微软也已开发了代号为Win64的操作系统,在软件上加以支持。在Intel采用了X86指令集之后,它又转而寻求更先进的64-bit微处理器,Intel这样做的原因是,它们想摆脱容量巨大的x86架构,从而引入精力充沛而又功能强大的指令集,于是采用EPIC指令集的IA-64架构便诞生了。IA-64 在很多方面来说,度x86有了长足的进步。突破了传统IA32架构的许多限制,在数据的处理能力,系统的稳定性、安全性、可用性、可观理性等方面获得了突破性的提高。

IA-64微处理器最大的缺陷是它们缺乏与x86的兼容,而Intel为了IA-64处理器能够更好地运行两个朝代的软件,它在IA-64处理器上(Itanium、Itanium2 ……)引入了x86-to-IA-64的解码器,这样就能够把x86指令翻译为IA-64指令。这个解码器并不是最有效率的解码器,也不是运行x86代码的最好途径(最好的途径是直接在x86处理器上运行x86代码),因此Itanium 和Itanium2在运行x86应用程序时候的性能非常糟糕。这也成为X86-64产生的根本原因。

(4)X86-64 (AMD64 / EM64T)

AMD公司设计,可以在同一时间内处理64位的整数运算,并兼容于X86-32架构。其中支持64位逻辑定址,同时提供转换为32位定址选项;但数据操作指令默认为32位和8位,提供转换成64位和16位的选项;支持常规用途寄存器,如果是32位运算操作,就要将结果扩展成完整的64位。这样,指令中有“直接执行”和“转换执行”的区别,其指令字段是8位或32位,可以避免字段过长。

x86-64(也叫AMD64)的产生也并非空穴来风,x86处理器的32bit寻址空间限制在4GB内存,而IA-64的处理器又不能兼容x86。AMD充分考虑顾客的需求,加强x86指令集的功能,使这套指令集可同时支持64位的运算模式,因此AMD把它们的结构称之为x86-64。在技术上AMD在x86-64架构中为了进行64位运算,AMD为其引入了新增了R8-R15通用寄存器作为原有X86处理器寄存器的扩充,但在而在32位环境下并不完全使用到这些寄存器。原来的寄存器诸如EAX、EBX也由32位扩张至64位。在SSE单元中新加入了8个新寄存器以提供对SSE2的支持。寄存器数量的增加将带来性能的提升。与此同时,为了同时支持32和64位代码及寄存器,x86-64架构允许处理器工作在以下两种模式:Long Mode(长模式)和Legacy Mode(遗传模式),Long模式又分为两种子模式(64bit模式和Compatibility mode兼容模式)。该标准已经被引进在AMD服务器处理器中的Opteron处理器。

而今年也推出了支持64位的EM64T技术,再还没被正式命为EM64T之前是IA32E,这是英特尔64位扩展技术的名字,用来区别X86指令集。Intel的EM64T支持64位sub-mode,和AMD的X86-64技术类似,采用64位的线性平面寻址,加入8个新的通用寄存器(GPRs),还增加8个寄存器支持SSE指令。与AMD相类似,Intel的64位技术将兼容IA32和IA32E,只有在运行64位操作系统下的时候,才将会采用IA32E。IA32E将由2个sub-mode组成:64位sub-mode和32位sub-mode,同AMD64一样是向下兼容的。Intel的EM64T将完全兼容AMD的X86-64技术。现在Nocona处理器已经加入了一些64位技术,Intel的Pentium 4E处理器也支持64位技术。

应该说,这两者都是兼容x86指令集的64位微处理器架构,但EM64T与AMD64还是有一些不一样的地方,AMD64处理器中的NX位在Intel的处理器中将没有提供。

11.超流水线与超标量

在解释超流水线与超标量前,先了解流水线(pipeline)。流水线是Intel首次在486芯片中开始使用的。流水线的工作方式就象工业生产上的装配流水线。在CPU中由5—6个不同功能的电路单元组成一条指令处理流水线,然后将一条X86指令分成5—6步后再由这些电路单元分别执行,这样就能实现在一个CPU时钟周期完成一条指令,因此提高CPU的运算速度。经典奔腾每条整数流水线都分为四级流水,即指令预取、译码、执行、写回结果,浮点流水又分为八级流水。

超标量是通过内置多条流水线来同时执行多个处理器,其实质是以空间换取时间。而超流水线是通过细化流水、提高主频,使得在一个机器周期内完成一个甚至多个操作,其实质是以时间换取空间。例如Pentium 4的流水线就长达20级。将流水线设计的步(级)越长,其完成一条指令的速度越快,因此才能适应工作主频更高的CPU。但是流水线过长也带来了一定副作用,很可能会出现主频较高的CPU实际运算速度较低的现象,Intel的奔腾4就出现了这种情况,虽然它的主频可以高达1.4G以上,但其运算性能却远远比不上AMD 1.2G的速龙甚至奔腾III。

12.封装形式

CPU封装是采用特定的材料将CPU芯片或CPU模块固化在其中以防损坏的保护措施,一般必须在封装后CPU才能交付用户使用。CPU的封装方式取决于CPU安装形式和器件集成设计,从大的分类来看通常采用Socket插座进行安装的CPU使用PGA(栅格阵列)方式封装,而采用Slot x槽安装的CPU则全部采用SEC(单边接插盒)的形式封祝现在还有PLGA(Plastic Land Grid Array)、OLGA(Organic Land Grid Array)等封装技术。由于市场竞争日益激烈,目前CPU封装技术的发展方向以节约成本为主。

13、多线程

同时多线程Simultaneous multithreading,简称SMT。SMT可通过复制处理器上的结构状态,让同一个处理器上的多个线程同步执行并共享处理器的执行资源,可最大限度地实现宽发射、乱序的超标量处理,提高处理器运算部件的利用率,缓和由于数据相关或Cache未命中带来的访问内存延剩当没有多个线程可用时,SMT处理器几乎和传统的宽发射超标量处理器一样。SMT最具吸引力的是只需小规模改变处理器核心的设计,几乎不用增加额外的成本就可以显著地提升效能。多线程技术则可以为高速的运算核心赘更多的待处理数据,减少运算核心的闲置时间。这对于桌面低端系统来说无疑十分具有吸引力。Intel从3.06GHz Pentium 4开始,所有处理器都将支持SMT技术。

14、多核心

多核心,也指单芯片多处理器(Chip multiprocessors,简称CMP)。CMP是由美国斯坦福大学提出的,其思想是将大规模并行处理器中的SMP(对称多处理器)集成到同一芯片内,各个处理器并行执行不同的进程。与CMP比较, SMT处理器结构的灵活性比较突出。但是,当半导体工艺进入0.18微米以后,线延时已经超过了门延迟,要求微处理器的设计通过划分许多规模更小、局部性更好的基本单元结构来进行。相比之下,由于CMP结构已经被划分成多个处理器核来设计,每个核度较简单,有利于优化设计,因此更有发展前途。目前,IBM 的Power 4芯片和Sun的 MAJC5200芯片都采用了CMP结构。多核处理器可以在处理器内部共享缓存,提高缓存利用率,同时简化多处理器系统设计的复杂度。

2005年下半年,Intel和AMD的新型处理器也将融入CMP结构。新安腾处理器开发代码为Montecito,采用双核心设计,拥有最少18MB片内缓存,采取90nm工艺制造,它的设计绝对称得上是对当今芯片业的挑战。它的每个单独的核心都拥有独立的L1,L2和L3 cache,包含大约10亿支晶体管。

15、SMP

SMP(Symmetric Multi-Processing),对称多处理结构的简称,是指在一个计算机上汇集了一组处理器(多CPU),各CPU之间共享内存子系统以及总线结构。在这种技术的支持下,一个服务器系统可以同时运行多个处理器,并共享内存和其他的主机资源。像双至强,也就是我们所说的二路,这是在对称处理器系统中最常见的一种(至强MP可以支持到四路,AMD Opteron可以支持1-8路)。也有少数是16路的。但是一般来讲,SMP结构的机器可扩展性较差,很难做到100个以上多处理器,常规的一般是8个到16个,不过这对于多数的用户来说已经够用了。在高性能服务器和工作站级主板架构中最为常见,像UNIX服务器可支持最多256个CPU的系统。

构建一套SMP系统的必要条件是:支持SMP的硬件包括主板和CPU;支持SMP的系统平台,再就是支持SMP的应用软件。

为了能够使得SMP系统发挥高效的性能,操作系统必须支持SMP系统,如WINNT、LINUX、以及UNIX等等32位操作系统。即能够进行多任务和多线程处理。多任务是指操作系统能够在同一时间让不同的CPU完成不同的任务;多线程是指操作系统能够使得不同的CPU并行的完成同一个任务。

要组建SMP系统,对所选的CPU有很高的要求,首先、CPU内部必须内置APIC(Advanced Programmable Interrupt Controllers)单元。Intel 多处理规范的核心就是高级可编程中断控制器(Advanced Programmable Interrupt Controllers–APICs)的使用;再次,相同的产品型号,同样类型的CPU核心,完全相同的运行频率;最后,尽可能保持相同的产品序列编号,因为两个生产批次的CPU作为双处理器运行的时候,有可能会发生一颗CPU负担过高,而另一颗负担很少的情况,无法发挥最大性能,更糟糕的是可能导致死机。

16、NUMA技术

NUMA即非一致访问分布共享存储技术,它是由若干通过高速专用网络连接起来的独立节点构成的系统,各个节点可以是单个的CPU或是SMP系统。在NUMA中,Cache 的一致性有多种解决方案,需要操作系统和特殊软件的支持。图2中是Sequent公司NUMA系统的例子。这里有3个SMP模块用高速专用网络联起来,组成一个节点,每个节点可以有12个CPU。像Sequent的系统最多可以达到64个CPU甚至256个CPU。显然,这是在SMP的基础上,再用NUMA的技术加以扩展,是这两种技术的结合。

17、乱序执行技术

乱序执行(out-of-orderexecution),是指CPU允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理的技术。这样将根据个电路单元的状态和各指令能否提前执行的具体情况分析后,将能提前执行的指令立即发送给相应电路单元执行,在这期间不按规定顺序执行指令,然后由重新排列单元将各执行单元结果按指令顺序重新排列。采用乱序执行技术的目的是为了使CPU内部电路满负荷运转并相应提高了CPU的运行程序的速度。分枝技术:(branch)指令进行运算时需要等待结果,一般无条件分枝只需要按指令顺序执行,而条件分枝必须根据处理后的结果,再决定是否按原先顺序进行。

18、CPU内部的内存控制器

许多应用程序拥有更为复杂的读取模式(几乎是随机地,特别是当cache hit不可预测的时候),并且没有有效地利用带宽。典型的这类应用程序就是业务处理软件,即使拥有如乱序执行(out of order execution)这样的CPU特性,也会受内存延迟的限制。这样CPU必须得等到运算所需数据被除数装载完成才能执行指令(无论这些数据来自CPU cache还是主内存系统)。当前低段系统的内存延迟大约是120-150ns,而CPU速度则达到了3GHz以上,一次单独的内存请求可能会浪费200-300次CPU循环。即使在缓存命中率(cache hit rate)达到99%的情况下,CPU也可能会花50%的时间来等待内存请求的结束- 比如因为内存延迟的缘故。

你可以看到Opteron整合的内存控制器,它的延迟,与芯片组支持双通道DDR内存控制器的延迟相比来说,是要低很多的。英特尔也按照计划的那样在处理器内部整合内存控制器,这样导致北桥芯片将变得不那么重要。但改变了处理器访问主存的方式,有助于提高带宽、降低内存延时和提升处理器性能。

英特尔服务器处理器技术编年史

1995年:首款服务器CPU-Pentium Pro

  提起计算机,就不能不提CPU;说起CPU,就不能不说英特尔。英特尔不仅是IT产业的推动者,更是全球信息技术的领跑者。自从1971年英特尔公司推出全球第一款微处理器,时值四十载,正值“四十不惑”之年。

  英特尔推出的首款微处理器4004,是一款定位于商用领域的处理器芯片,是人类历史上最具创新性的产品之一。后来在服务器领域,英特尔持续发力。目前广为人知的至强处理器,在服务器市场领域占绝大份额。基于此认识,在迎来英特尔微处理发展四十周年之际,我们将为广大读者全方位扫描英特尔在服务器领域的CPU发展史。

  1995年:第一款专为服务器设计的处理器-Pentium Pro


英特尔服务器处理器技术编年史[组图]
Pentium Pro产品真图

英特尔服务器处理器技术编年史[组图]
Pentium Pro内核

  1995年11月1日,英特尔发布了Pentium Pro处理器。Pentium PRO是英特尔首个专门为32位服务器、工作站设计的处理器,可以应用在高速辅助设计、机械引擎、科学计算等领域。

英特尔服务器处理器技术编年史[组图]
Pentium Pro处理器背面

    英特尔在Pentium PRO的设计与制造上达到了历史性新的高度,它总共集成了550万个晶体管,并且整合了高速二级缓存芯片,它采用了socket 8方形多针脚插座(专为PentiumPro CPU而设计)。

英特尔服务器处理器技术编年史[组图]
Socket 针脚
 

英特尔服务器处理器技术编年史[组图]
Pentium Pro

英特尔服务器处理器技术编年史[组图]
Pentium Pro 200(1MB)外观

  根据国外维基百科介绍,英特尔在1995年和1997年,陆续推出了166MHz、180MHz、200MHz的Pentium Pro多个版本。其中1997年8月18日推出的Pentium Pro,制程工艺0.35微米,二级缓存1MB。

英特尔服务器处理器技术编年史[组图]
官方披露的Pentium Pro信息

英特尔服务器处理器技术编年史[组图]
Pentium Pro 200(1MB)参数

  点评:

    专门针对服务器、工作站应用领域,为运行32位程序而优化设计,但在16位程序上运行效果不佳。Pentium Pro不支持当时很流行的MMX指令集。专门针对服务器、工作站应用领域,为运行32位程序而优化设计,但在16位程序上运行效果不佳。Pentium Pro不支持当时很流行的MMX指令集。值得一提的是,Pentium Pro是首个支持4GB容量PAE物理地址扩展内存(36位物理寻址)的x86处理器。

产品:Xeon X5690 Intel 服务器CPU 回到顶部阅读

1998年:跨入至强时代-Pentium II Xeon

  时隔三年,也就是在1998年6月29日,英特尔在Pentium Pro的基础上进行了升级,推出了Pentium II Xeon(至强)处理器。Xeon是英特尔推出的一个新品牌,它取代了之前所使用的Pentium Pro。这预示着英特尔开启了服务器市场领域的新篇章。


英特尔服务器处理器技术编年史[组图]
Pentium II Xeon

英特尔服务器处理器技术编年史[组图]
Pentium II Xeon侧面(被动散热方式,没有采用风扇主动散热)

英特尔服务器处理器技术编年史[组图]
Pentium II Xeon内核

  Pentium II Xeon集成有750万个晶体管,它采用了Slot 2插槽技术,被安装一个金属外壳中,然后通过边缘连接触点插在主板上,类似于常见的PCI或ISA扩展卡插槽。每个Slot 2处理器使用330个连接触点,相比每个Slot 1CPU使用242个连接触点,封装Pentium II Xeon的金属外壳会比Slot 1所用的略大。

英特尔服务器处理器技术编年史[组图]
Pentium II Xeon 450 512

英特尔服务器处理器技术编年史[组图]
Slot 1和Slot 2对比

英特尔服务器处理器技术编年史[组图]
双插槽Slot 1和Slot对比

英特尔服务器处理器技术编年史[组图]
Slot 1 (SC242)插槽规格

英特尔服务器处理器技术编年史[组图]
Slot 2 (SC330)插槽规格

  Pentium II Xeon拥有3个主要版本,分别对应512KB、1MB和2MB L2高速缓存。其中1999年1月推出的Pentium II Xeon主要针对4路服务器和工作站。

英特尔服务器处理器技术编年史[组图]
官方公布的Pentium II Xeon各版本信息

  Pentium II Xeon是英特尔公司细分市场的重要步骤,Xeon系列处理器主要设计运行商业软件、Web服务、数据储存、数据归类、数据库、自动化设计等。它不仅改变了服务器市场,也改变了工作站市场。借助Pentium II Xeon,可以使用工作站进行汽车、房屋、桥梁等设计工作,也可以帮助人们进行CAD、计算机动画设计、3d游戏开发和数据库管理。

英特尔服务器处理器技术编年史[组图]
Pentium II Xeon外盒分解图

  点评:

  相比前代和Pentium系列产品,Pentium II Xeon最大的改进在于其二级高速缓存。Pentium II提供512KB,而Xeon最大可达2MB,而L2散热要求较高,这就是Pentium II Xeon采用了比Pentium II还大的塑料外盒的主要原因。也正是L2的改进使得其性能得到提升,不过在单处理器和单线程系统下性能效果并不明显。Pentium II Xeon也是当时能与数据中心产品相竞争的一大力作。

产品:Xeon E7420 Intel 服务器CPU 回到顶部阅读

1999年:增强互联网应用-Pentium III Xeon

  1999年,Pentium II Xeon被Pentium III Xeon取代。它体现了从Pentium II “Deschutes”到 Pentium III “Katmai”所增加的改进。Pentium III Xeon的第一个核心版本命名为Tanner,它与同系列的Pentium III核心没有区别,具备SSE及一少部份内存控制优化。第二个核心版本名称为Cascades,第一代的Pentium III Xeon处理器的外频为133MHz,二级缓存为256KB;第二 代的Pentium III Xeon将L2升级到1MB、2MB。


英特尔服务器处理器技术编年史[组图]
Pentium III Xeon

英特尔服务器处理器技术编年史[组图]
Pentium III Xeon内核

  除早期的几款型号采用0.25微米技术外,Pentium III Xeon均采用0.18微米工艺制造,集成了950万个晶体管,采用Slot 2架构和SECC封装形式,内置32KB一级缓存及256KB/512KB/1MB/2MB二级缓存。

英特尔服务器处理器技术编年史[组图]
Pentium III Xeon 550 MHz Slot 2

  Pentium III Xeon处理器继承了Pentium III处理器新增的70条指令集,以更好执行流式音视频、三维成像和语音识别等应用。其目的主要是着力提升互联网使用体验,为用户提供网上冲浪浏览高品质多媒体提供增强型功能。

英特尔服务器处理器技术编年史[组图]
Pentium III Xeon

英特尔服务器处理器技术编年史[组图]
Pentium III Xeon外盒顶部

英特尔服务器处理器技术编年史[组图]
Pentium III Xeon背面(被动散热)

英特尔服务器处理器技术编年史[组图]
Pentium III Xeon 550/100/512 BX80525KY550512

  高端Pentium III Xeon处理器基本上与低端的Pentium III处理器一样,不同的是它支持高达2MB的L2缓存以及36位虚拟内存系统,这使得高端系统拥有最高64GB的内存。

英特尔服务器处理器技术编年史[组图]
Pentium III Xeon外盒结构图解

  此外,Pentium III Xeon处理器内部采用错误监测和纠正(ECC)机制,可以自动更正单位bit错误,对双位bit错误进行报警,有效地保护重要数据提供了功能性冗余检测(FRC)以提高关键应用程序的完整性。

英特尔服务器处理器技术编年史[组图]
官方个公布的Pentium III Xeon处理器规格

  点评:

  Pentium III Xeon处理器在服务器处理器领域,第一次获得了性能的全面提升,优化了网络应用体验,并且加入了消费级处理器不具有的多种纠错功能,加速了服务器处理器的发展步伐。

产品:Xeon E5-2630 Intel 服务器CPU 回到顶部阅读

2001年:两种架构共生-Xeon和Itanium

  2001年9月25日,英特尔发布Pentium 4 Xeon处理器,也就是Xeon——预示着至强系列处理器正式以崭新面貌登上历史舞台。


英特尔服务器处理器技术编年史[组图]
Pentium 4 Xeon

英特尔服务器处理器技术编年史[组图]
Pentium 4 Xeon

英特尔服务器处理器技术编年史[组图]
Intel Xeon内核

  Xeon处理器基于英特尔的NetBurst架构,最早的Xeon(Foster)采用0.18微米工艺,采用了和奔腾4相同的Willamette核心,具 备256KB二级缓存,主频有1.4GHz、1.5Ghz、1.7GHz这几种,前端总线为400MHz。

  2002年,又推出了Prestonia核心的Xeon处理器,它采用0.13微米工艺制造,Prestonia核心最大的优势就是增加了对Hyper- Threading(超线程)的支持,二级缓存增加到512KB,主频从1.8GHz起跳,前端总线为533Mhz。

  Xeon处理器拥有更高级的网络功能,及更复杂更卓越的3D图形性能。另一方面,在并行运算、高性能I/O子系统、支持PCI总线 分段等方面能更好地支持服务器端的运算。

英特尔服务器处理器技术编年史[组图]
官方公布的Xeon处理器规格(点击查看官网详情)

  其实在推出Xeon处理器之前,英特尔早在同一年5月29日就发布了不同于X86架构的Itanium处理器。

英特尔服务器处理器技术编年史[组图]
Intel Itanium

英特尔服务器处理器技术编年史[组图]
代号为Merced的Itanium(点击查看超大图)

英特尔服务器处理器技术编年史[组图]
Intel Itanium内核

    Itanium处理器代号为 Merced,是英特尔第一款专门应用在高端企业级64位技术环境中的产品(Intel Architecture 64,简称IA-64架构)。这是为顶级、企业级服务器及工作站设计的,在Itanium处理器中体现了一种全新的设计思想,完全是基于平行并发计算而设计(EPIC) 。对于最苛求性能的企业或者需要高性能运算功能支持的应用(包括电子交易安全处理、超大型数据库、电脑辅助机械引擎、尖端科学运算等)而言,Itanium处理器正是大展身手的好舞台。

英特尔服务器处理器技术编年史[组图]
Itanium采用PAC封装

英特尔服务器处理器技术编年史[组图]
官方公布的Itanium处理器规格(点击查看官网详情)

  点评:

  Xeon处理器实际上还是基于Pentium 4的内核,而且同样是64位的数据带宽,但由于其利用了与AGP 4X相同的原理,其前端总线有了巨大的提升,性能远超Pentium III Xeon处理器。Itanium处理器的推出,为英特尔对抗RISC提供了新舞台,也为后来Itanium II的推出奠定了基础。

回到顶部阅读

2002年:高性能高可靠性的浓缩-Itanium 2

  2002年7月8日,英特尔发布了基于VLIW以及Explicitly Parallel Instruction Computing的Itanium 2,与第一代Itanium产品一 样,它也是采用了IA-64架构。在理论上,得益于其平行处理架构(Parallel Computing Microarchitecture),在同样工作频率 下其效能约为CISC与RISC的八倍。


英特尔服务器处理器技术编年史[组图]
Itanium 2

英特尔服务器处理器技术编年史[组图]
Itanium 2(点击查看超大图)

  Itanium 2处理器专为要求苛刻的企业和技术应用而设计。基于Itanium 2处理器的平台以较低的成本,提供了业界领先的性能 ,以及比专有RISC技术更广泛的选择空间,可帮助企业和机构最大地提高其投资回报。Itanium 2处理器得到了广泛生态系统的 支持,包括由40多家领先硬件厂商的具有出色可扩充的开放标准64位解决方案,诸如Windows Server 2003、HP-UX和Linux等的 超过5款操作系统,以及数百种应用和工具。

英特尔服务器处理器技术编年史[组图]
代号为McKinley的Itanium 2

英特尔服务器处理器技术编年史[组图]
Itanium 2内核

  此外,Itanium 2处理器还为现有的Itanium架构软件提供了出色的二进制兼容性,进而可使用户获得强大的投资保护。Itanium  2处理器家族支持32位Intel架构(IA-32)应用,并将随着32位Intel架构(IA-32)执行层技术的推出进一步增强。

英特尔服务器处理器技术编年史[组图]
Itanium 2 框架图

  Itanium 2在上一代产品基础上,提供了更高的性能,并以更低的成本为用户提供更多应用选择:

  6MB、9MB三级高速缓存的Intel安腾2处理器具有出色的并行计算能力,可扩充和可靠性,全面支持数据库、企业资源规划、供应链管理、业务智能以及诸如高性能计算(HPC)等其他数据密集型应用。通过采用兼容原有Intel安腾2处理器的插座设计,它可以为OEM和用户带来出色的投资保护。

   此外,它还二进制兼容现有Intel安腾架构软件 ,并且还可以提供比原有Intel安腾2处理器高出30%-50%或更高的性能。凭借大量执行资源、6.4GB/秒的系统总线带宽、6MB的 集成三级高速缓存和1.5GHz的主频,新型Intel安腾2处理器能够以相当于同档RISC平台一半的交易成本,提供两倍的交易性能 。

英特尔服务器处理器技术编年史[组图]
Itanium 2与其他系列产品的优势

  Itanium 2还为用户提供了经济性的多种选择。1.5MB三级高速缓存的Intel安腾2处理器主频1.5GHz,能为包括高性能和技术计算在内的计算密集型工作提供了领先的性价比,同时为网络前沿、安全性、和软件工程等应用提供了卓越的性能。与可以提供业界领先的RISC平台相比,专为DP服务器和工作站优化的带有1.5MB三级高速缓存的Intel安腾2处理器可提供更出色的性价比优势。

英特尔服务器处理器技术编年史[组图]
Itanium 2采用了更为紧密的PAC封装(PAC611)

英特尔服务器处理器技术编年史[组图]
安装了Itanium 2的电源盒

  采用低压Intel安腾2处理器的平台可以提供更低的功耗以支持与日俱增的计算密集型工作,这使得它成为数据中心内的高密度 机架安装式和刀片式配置的理想选择;同时它也是运行网络前沿、安全应用和软件工程应用的入门级服务器和工作站的最佳选择。Intel安腾2微体系结构的特性包括到集成高速缓存的快速访问,处理器与内存之间的出色带宽,以及可以显著高指令执行速度和吞吐率的大量执行资源。

英特尔服务器处理器技术编年史[组图]
官方公布的Itanium 2系列规格

  点评:

  Itanium处理器家族的第二代产品,Itanium 2带来出众的性能和无与伦比的经济性,在高密度数据运算、关键业务应用和科研计算等领域能大展身手,也能为数据库、CAD设计、在线安全交易等带来出色的可靠性和功能。Itanium 2的推出,再次点燃了人们对Itanium架构关注的热情。

产品:皓龙 850(散) AMD 服务器CPU 回到顶部阅读

2005年:支持混合计算的处理器-Nocona至强

  2005年,英特尔公司推出了90纳米Nocona至强处理器,支持EM64T技术的Nocona核心Xeon处理器,它采用Prescott核心,90nm工艺,配备1MB L2缓存。本次发布的Nocona Xeon频率包括2.8/3.0/3.2/3.4/3.6GHz等几款,能动态调整功率并降低处理器的耗电需求。


英特尔服务器处理器技术编年史[组图]
Nocona至强处理器

  Nocona至强兼容32、64位运算模式,支持市场上所有的基于16位和32位软件,同时对64位架构下开发的应用软件也能够完全兼容。

英特尔服务器处理器技术编年史[组图]
Opteron与Nocona至强处理器

英特尔服务器处理器技术编年史[组图]
Opteron与Nocona至强处理器针脚

  从内存寻址来说,它打破了以往纯32位架构最大232字节寻址能力的极限,最高可实现近4.5TB的寻址能力,如此大量的内存足以满足当前高端工作站、网络服务器、数据服务器的处理需求以及未来软件应用的需求。

英特尔服务器处理器技术编年史[组图]
Nocona至强处理器框架

  从技术角度来看,Nocona新至强处理器比传统的32位增加了8组寄存器,可减少CPU对L1、L2缓存以及内存的访问次数,从而提高CPU的工作速度;再加上英特尔处理器既有的耗电低、体积小、辐射少、兼容性强等特点,促成了Nocona新至强处理器在计算平台上无可比拟的优势,可为诸如媒体和游戏等应用带来出色的系统响应能力。

英特尔服务器处理器技术编年史[组图]
至强处理器(左侧为Nocona,右侧为Paxville)

    同年,在2005年10月10日,英特尔还发布了其首枚双核心Xeon DP(Paxville DP),这款全新的处理器将可以帮助提高多线程服务器应用的性能并缩短响应时间,同时它和50xx系列也是首个90nm的双核处理器。

英特尔服务器处理器技术编年史[组图] 英特尔服务器处理器技术编年史[组图]
Paxville DP

  2005年11月2日,英特尔推出至强7000系列处理器(原代号“Paxville MP”)发布,其主频为3.0 GHz,并带有 667 MHz双 独立系统总线。该全新处理器将适用于采用英特尔 E8500芯片组的现有平台,此芯片组专为双内核而设计。英特尔至强7000系 列处理器将全新水平的双核企业级性能引入了4路及更多路服务器,每个内核带有2MB二级高速缓存。

英特尔服务器处理器技术编年史[组图]
双路和多路服务器应用平台

英特尔服务器处理器技术编年史[组图]
DP和MP面向不同应用

  点评:

  Nocona至强处理器提供了32和64位的混合计算模式,但起初这款处理器的软件兼容性并不太令人满意。搭配微软64位Windows XP和64位Windows 2003都会出现一些不能识别的问题,相应的驱动也很不完善。在使用64位版本的Linux系统时,也不能够识别其为64位处理器。

回到顶部阅读

2006年:L2提升至2MB的处理器-Irwindale至强

  2005年2月,英特尔发布了“Irwindale”核心的至强处理器,这款产品与英特尔Pentium 4 600系列处理器的架构有些类似,Irwindale Xeon处理器采用了90nm制程,其时钟频率在3.0 GHz至3.6 GHz之间。


英特尔服务器处理器技术编年史[组图]
Irwindale至强处理器

  Irwindale核心是Nocona核心的升级版本,2级缓存增大1倍,升级为2MB,比“Nocona””核心的Xeon处理器多了1MB 。可以为用户带来至少18%的性能上的提升,Irwindale处理器能够兼容Nocona平台并支持DD2-400内存和PCI Express接口。

  Irwindale核心Xeon处理器支持SSE,SSE-2,SSE-3,采用了Intel EM64T技术,并且支持Hyper-Threading技术。Irwindale核心Xeon处理器主频最高已经达到3.6GHz,这也创造了服务器处理器主频的新高峰。

英特尔服务器处理器技术编年史[组图]
采用Irwindale至强处理器的机架服务器

    此外,在2006年3月14日,英特尔发布了全新的双核心Xeon LV〔低电压版本,核心Sossaman〕。Sossaman建基于Core Duo处理器技术,支持当时Xeon的所有技术,支持虚拟化应用,667MHz前置总线,双核心处理器只有32位元。

英特尔服务器处理器技术编年史[组图]
2.00GHz Xeon LV (Sossaman)

英特尔服务器处理器技术编年史[组图]
双核Xeon LV处理器介绍

  点评:

  Irwindale至强在至强处理器发展历史中,其创新性可圈可点。二级高速缓存上升到2MB,而且其支持的最高主频可以达到3.6GHz,成为当时服务器处理器主频的最高值。不过,在当时Irwindale至强处理器的高热量和低下的执行效率,使得该处理器 也成为人们热议的焦点之一。

回到顶部阅读

2006年:首款65nm至强处理器-5000系列

  2006年5月23日,英特尔发布了首款65纳米的双核心Xeon(Dempsey核心)至强处理器,并命名为Dual Core Xeon 5000系列。它除了制造工艺更为精细之外,与之前的至强处理器相比主要以下不同:


英特尔服务器处理器技术编年史[组图]
Xeon 5000 processzor (Dempsey)

   ●采用1066MHz前端总线,是先进的新一代服务器Bensley平台支持的第一款处理器。这也是由于性能有赖于频率,功耗过高、散热困难的NetBurst架构的终结产品。

  ●除了支持多处理器外,其他跟其桌面版本(Presler)一样。本系列主频由2.67至3.73GHz不等,二级高速缓存达到4MB(每核心2MB)。

  ●使用全新的接口Socket 771(LGA771)。

英特尔服务器处理器技术编年史[组图]
使用Socket771插槽

  Dempsey处理器的5000系列采用的是netburst架构,是90nm和65nm交替的过渡产品,也预示着双核、多核服务器产品逐渐成为市场主流。英特尔以新低价位推出的基于Netburst微架构的5000系列,已经为高价值的服务器和工作站市场,带来了更高性能和更低功耗的创新表现。

英特尔服务器处理器技术编年史[组图]
Dempsey至强处理器系列规格

  点评:

  Dempsey处理器开启了65nm制程的新历程,也成为了英特尔将至强处理器以数字命名的重要分水岭。得益于更为精细的制造工艺,至强5000系列较英特尔上一代双核至强产品(Paxville)性能有所提升。不过,更高的3.73GHz主频和1066MHz前端总线,随之而来的是高达130W的功耗。

英特尔服务器处理器技术编年史[组图]
至强5000处理器芯片组
 

 

回到顶部阅读

2006年:首款酷睿微架构处理器-至强5100

   同年,6月26日,英特尔发布了基于酷睿微体系架构的至强5100系列双核处理器。至强5100系列双核处理器的研发代号是“Woodcrest”,是英特尔推出的革命性的“酷睿(Core)”微体系架构的第一款处理器。


英特尔服务器处理器技术编年史[组图]
至强5100系列(Woodcrest)

英特尔服务器处理器技术编年史[组图]
至强5100系列(Woodcrest)背面

  该处理器与至强5000系列相同65nm制造工艺、双独立总线,LGA771接口。但是采用了两个可以共享的4MB缓存,以及高达1333MHz的前端总线。它除了具备酷睿微体系架构所具有的宽位动态执行、智能功率特性 、先进缓存管理、智能内存访问和高级数字媒体增强功能以外,它也支持MMX, SSE, SSE2, SSE3, SSSE3。

英特尔服务器处理器技术编年史[组图]
Woodcrest(至强5160)vs.Dempsey(至强 5080)

英特尔服务器处理器技术编年史[组图]
Woodcrest(至强5160)vs.Dempsey(至强 5080)

英特尔服务器处理器技术编年史[组图]
从左至右:Xeon Dempsey, Woodcrest和Clovertown

英特尔服务器处理器技术编年史[组图]
至强5100系列处理器规格

    点评:

  至强处理器5100系列作为基于英特尔酷睿微体系构架的第一款处理器,是英特尔未来服务器、移动和桌面产品构架统一的首发,它充分地体现了酷睿微体系构架在性能和能耗方面的优势。

回到顶部阅读

2006年:Netburst架构终结者-至强7100

  发布至强5100系列的同一年,英特尔在8月29日推出了Netburst架构的最后一款处理器——Tulsa Xeon MP 7100系列。


英特尔服务器处理器技术编年史[组图]
至强7100

英特尔服务器处理器技术编年史[组图]
Tulsa核心处理器晶圆(65nm,L3 16MB)

  Tulsa核心Xeon MP 7100处理器是Paxville MP的升级版本,二者之间的主要差别在于完成了由90nm向65nm制造工艺的过渡,从而改善了产品的性能和功耗水平。与Paxville MP相比,Tulsa的性能提升了1倍,每瓦性能比提升近2.8倍。

英特尔服务器处理器技术编年史[组图]
Intel Xeon 7100 (Tulsa)

  Tulsa完全兼容于至强MP其他系列(Potomac MP,Paxville MP),它适用于超级负载工作量的企业级服务器系统选择,创造了当前全球的最新效能基准测试成绩,在获得效能表现的同时也在最大限度上保护投资比例,提供足够可靠性。

  在至强7100处理器系统中,英特尔推出有两条产品线:N线使用667MT/s FSB,M线使用800MT/s FSB,N线时钟范围从2.5GHz到 3.5GHz(型号7110N-7150N),M线时钟范围从2.6GHz到3.4GHz(型号7110M-7140M),不同型号三级缓存从4MB到16MB不等。

英特尔服务器处理器技术编年史[组图]
Tulsa系列处理器规格(点击查看大图)

  根据英特尔官方的资料,采用Tulsa核心的Xeon 7100系列处理器在ERP、SCM、CRM等商业应用中性能有60%以上的提升,更可以将交易处理速度提升70%以上,部分电子商务应用软件中其性能提升1倍以上。同时,Intel还宣称Xeon 7100系列处理器的每瓦特性能是上一代产品的2.8倍。

  2006年11月,英特尔还发布了代号为“Clovertown”的四核处理器。Clovertown处理器是由2颗的Xeon DP双核心WoodCrest处理 器合并封装而成。Clovertown与Woodcrest都是基于Intel Core微架构,内含4MBx2二级缓存,支持对称式多重处理器技术,虚 拟化技术,Intel病毒防护技术,Intel 64位扩展技术(Intel EM64T)及Streaming SIMD Extensions 4 (SSE4)指令集。

英特尔服务器处理器技术编年史[组图]
Intel推出的四核处理器

  2006年,英特尔更新了Itanium处理器产品,推出代号为Montecito(也就是Itanium 2 9000系列)的新双核处理器。据称,该处理器性能提升两倍而功耗下降了20%。

  点评:

  至强7100系列处理器延用NetBurst平台,根据官方的说法是因为MP至强处理器开发周期长的缘故。不过,不论事实如何,它的确给用户带来了性能、功耗比提升的实惠,由于在使用65nm制程工艺条件下,高度集成13亿晶体管、整合了L3高速缓存,更加显现了其历史性的跨越。

产品:至强四核 E7310 联想 服务器配件 回到顶部阅读

2007年:酷睿微架构高端处理器-至强7300

  2007年,英特尔发布了两款基于酷睿微架构的Tigerton处理器,代号分别为Tigerton-QC(7300系列)和Tigerton-DC(7200系列)。


英特尔服务器处理器技术编年史[组图]
英特尔公司副总裁Tom Kilroy展示至强7300芯片

英特尔服务器处理器技术编年史[组图]
至强7300处理器晶圆

  7200系列处理器(产品代号为80564)与7300类似,支持多核,都将两个DIE封装在一起,每个DIE均有4MB L2缓存,都支持EM64T、EIST、EDbit、VT等技术,提供丰富的功能来满足多种应用的需求。不同的是,7200系列在每一块硅芯片上只有一个内 核被激活,其它都是被关闭的。7200系列处理器包括7210和7220两款型号。

英特尔服务器处理器技术编年史[组图]
至强7300

英特尔服务器处理器技术编年史[组图]
至强7300内核架构

  相比之下,7300系列则强悍的多。它是英特尔面向4路以上高端服务器的四核处理器。与英特尔前代双核产品相比,此次推出的 7300系列处理器的主频高达2.93GHz,具有高达2倍的性能,2.5倍的虚拟化性能,2倍的性能功耗比,高达4倍的内存容量。

英特尔服务器处理器技术编年史[组图]
至强7200、7300处理器规格

    由此,英特尔在不到15个月时间内完成了向酷睿微体系架构的快速切换,这也是英特尔历史上上市速度最快的多路处理器。

英特尔服务器处理器技术编年史[组图]
至强7300处理器

  同年发布的,还有代号为Kentsfield的至强3200系列、3300系列“Yorkfield”和3500系列“Bloomfield”。

    2007年11月1日,英特尔推出了双核英特尔安腾9100 系列处理器。该系列处理器专为运行高端应用而设计,具有更高可靠性和更低功耗等先进特性,它为那些从专有RISC产品向安腾架构服务器产品不断过渡的客户提供了新的选择。该系列处理器新增了“内核级锁步( Core Level Lock-Step)” 技术和“按需配电(DBS,Demand Based Switching)”技术。

    2007年11月11日英特尔还发布了基于至强的Yorkfield,代号为“Harpertown”的至强5400系列处理器。

英特尔服务器处理器技术编年史[组图]
代号为“Harpertown”的至强5400系列规格

  点评:

  英特尔通过推出基于酷睿架构的Tigerton处理器,来取代Netburst架构留下的能耗问题,为用户提供了高性能、低能耗的高端服务器解决方案。另外,从英特尔公司时隔15月时间就推出全新架构的多核处理器,我们看出,英特尔深刻意识到Netburst架构能耗问题给对手留下了可乘之机。不过这对用户和行业发展来说,不失为一个好消息。

回到顶部阅读

2008年:首款六核处理器-至强7400系列

   2008年9月15日,英特尔发布了首款搭载3MB二级高速缓存的六核处理器——至强7400系列(代号“Dunnington”)。


英特尔服务器处理器技术编年史[组图]
至强7400处理器(代号“Dunnington”)

英特尔服务器处理器技术编年史[组图]
7400系列内核结构图

英特尔服务器处理器技术编年史[组图]
Uncore在六核心至强Dunnington发挥重要作用

英特尔服务器处理器技术编年史[组图]
至强7400处理器及其晶圆展示图

  至强7400搭配三个统一的3MB二级缓存,一级缓存96KB,三级缓存16MB,1066MHz FSB,可以插入Tigerton的mPGA604插槽,与英特尔Caneland和IBM X4芯片组兼容,支持DDR2-1066 (533 MHz),最大TDP低于130W,主要定位于刀片和其它堆叠计算机系统。

英特尔服务器处理器技术编年史[组图]
发布会上展示7400晶圆

英特尔服务器处理器技术编年史[组图]
发布会上介绍7400产品的技术优势

  基于至强7400系列处理器的服务器平台可支持最多16个处理器插槽,以提供高达96个处理器核心的计算能力。它为企业数据中 心提供了出色的可扩展性、充足的计算线程、丰富的内存资源和无与伦比的可靠性。

英特尔服务器处理器技术编年史[组图]
至强7400系列规格表

  同年11月,英特尔发布了采用Nehalem架构的第一款处理器——英特尔酷睿i7,i7和之后的i5主要应用在高端桌面领域,因此, 本文不进行详细阐述。

  点评:

  至强7400处理器在虚拟化应用方面,被英特尔公司赋予了重要使命。至强7400凭借先进的制程工艺、6个核心的设计以及对 FlexMigration的加强,在某些虚拟化环境以及数据密集型工作负载应用程序(如数据库、商务智能、企业资源规划和服务器整 合)可以获得最多高达50%的大幅性能提升。

回到顶部阅读

2009年:最具革新性服务器CPU-至强5500

  2009年3月29日,英特尔公司宣布推出代号为Gainestown、基于45nm Nehalem架构的Xeon处理器,其中包括12款Xeon 5500双路系列和3款Xeon 3500单路系列产品。


英特尔服务器处理器技术编年史[组图]
至强5500处理器

英特尔服务器处理器技术编年史[组图]
至强5500

英特尔服务器处理器技术编年史[组图]
至强5500晶圆

英特尔服务器处理器技术编年史[组图]
英特尔高级副总裁Patrick Gelsinger展示至强5500晶圆

英特尔服务器处理器技术编年史[组图]
Patrick Gelsinger展示至强5500芯片

    Xeon 5500系列代号Nehalem-EP,支持QPI总线、HT超线程、Turbo Boost动态加速、Integrated  Power Gate电源管理、新一代HT虚拟化、DDR3内存等技术,取代了FSB的QPI总线,彻底解决多路互连的带宽局限。

英特尔服务器处理器技术编年史[组图]
至强5500支持超线程技术

英特尔服务器处理器技术编年史[组图]
支持QuickPath技术

  该系列处理器有W、X、E、L五个不同分类,除最低端的E5502是双核心型号外,其他均为四核心。至强5500处理器集成7.31亿个晶体管,主频1.86- 3.20GHz不等,QPI总线频率4.8/5.86/6.4GT/s,三级缓存4/8MB,热设计功耗60/80/95/130W,支持DDR3内存频率介于800MHz和1333MHz之间,最大容量144GB(18×8GB)或192GB(12×16GB)。

英特尔服务器处理器技术编年史[组图]
至强5500特性

英特尔服务器处理器技术编年史[组图]
至强5500平台为32nm产品提供支持

英特尔服务器处理器技术编年史[组图]
至强5500系列规格

  Xeon 5500系列的性能相比上一代Penryn Xeon 5400系列最多可提高125%、带宽最多提升250%,而且迄今为止已 经创下30多项新的世界纪录,比如戴尔、富士通、思科、惠普、IBM、Verari Systems的新款服务器分别在VMmark、 SPECint_rate_base2006/SPECfp_rate_base2006、SPEComp*Mbase2001、TPC-C、SAP-SD、SPECpower_ssj2008等测试项目里取得 了好成绩,超越此前记录幅度少则71%、多则152%。

英特尔服务器处理器技术编年史[组图]
至强5500平台带来的性能提升

  Xeon 5500系列支持Intelligent Power电源管理技术,拥有多达15个自动操作状态,可以根据实时输出负载自动调整系统功耗 而不会牺牲性能高,同时最低待机功耗只有10W,比上代Xeon 5400降低了50%之多。另外,该系列中的L5520/L5506两款型号都是节能型,热设计功耗只有60W。

英特尔服务器处理器技术编年史[组图]
至强5500支持Turbo Mode

英特尔服务器处理器技术编年史[组图]
至强5500支持Turbo Mode

英特尔服务器处理器技术编年史[组图]
Turbo Mode

  Xeon 3500系列代号Nehalem-WS,有W3570/W3540/W3520三款,就规格而言分别与Core i7-965/940/920完全相同,也是四核心八线程、3.20/2.93/2.66GHz频率、8MB三级缓存、QPI总线频率6.4GT/s或4.8GT/s、热设计功耗130W。

    点评:

    至强5500采用了多项突破性技术,速度、能效和智能化程度等都比以往产品有所提高,是其近15年来最具革命性的服务器芯片。也可以看做是英特尔公司在服务器领域多年的技术积累之后的爆发。

回到顶部阅读

2010年:智能提升性能加速-至强5600和7500

  2010年2月8日,英特尔发布了Tukwila安腾处理器Itanium 9300。Tukwila采用65nm制程工艺制造,拥有20亿颗晶体管的的四核心处理器性能比前一代增加了一倍,系统互连带宽增加800%,内存带宽增500%,并支持700%的内存支持能力。其它技术还包括与”Nehalem EX” Xeon共享QuickPath连接,可扩展内存互连,可扩展内存缓冲和7500芯片组。


英特尔服务器处理器技术编年史[组图]
Itanium 9300新特性

英特尔服务器处理器技术编年史[组图]
Itanium 9300晶圆

  安腾9300还支持英特尔VT虚拟化技术,Turbo Boost, Hyper-Threading,完全兼容现有应用程序。与上一代的Itanium 9100相比,缓存更大、内存带宽提升5倍、互连带宽(interconnect)也提升8倍,支持DDR3内存容量也增加至7倍,增加系统扩充性。

  Itanium 9300共推出5款,其中4款为四核心处理器,1款为低功耗的双核心处理器,频率从1.46GHz至1.86GHz,L3快取10MB起跳,最高至24MB。

  平台设计上,Itanium 9300也是英特尔简化Itanium、Xeon平台差异的开始,包括QuickPath互连带宽、IntelScalable Memory Interconnect、I/O Hub等平台组件都与代号Nehalem EX的Xeon平台共享。

英特尔服务器处理器技术编年史[组图]
Itanium 架构

  3月17日,英特尔正式发布了采用32nm工艺的新一代Nehalem微构架双路服务器处理器至强5600家族,代号“Westmere-EP”。它采用了第二代High-K金属栅工艺、增加了两个核心、增加了更高能效的低功耗CPU、支持低功耗DDR3内存,并且在智能节能技术和CPU功耗管理等方面均进行了优化。

英特尔服务器处理器技术编年史[组图]
至强5600处理器

英特尔服务器处理器技术编年史[组图]
至强5600晶圆

  至强5600在计算性能上相比至强5500有60%的提升,而与英特尔06年发布的单核产品相比性能提升则高达15倍。至强5600在功耗方面的改进除了制程提升带来了优势外,主要表现在两个方面:

  ●提供主动功耗控制

  为每个核心引入的Power Gate(功率门限)技术在至强5600身上得到进一步加强。

  ●对1.35v低电压DDR3内存的支持

  支持低电压内存的实际效果是在不牺牲性能的前提下可以降低20%的热量。

英特尔服务器处理器技术编年史[组图]
至强5600系列规格

  另外,在3月底,英特尔还推出了至强7500系列服务器处理器,它可以帮助构建从双路到最高256路的服务器系统,与采用上一代产品至强7400系列相比,其性能平均提升达3倍之多。

英特尔服务器处理器技术编年史[组图]
至强7500

英特尔服务器处理器技术编年史[组图]
至强7500晶圆

  至强7500与7400处理器的功耗水平几乎相似,但其性能却相比7400提升了3倍之多。也就是说,至强7500处理器性能功耗比会有超过2倍以上的提升,这也意味着,一台至强7500服务器可以相当于20台在2005年的单核至强多路服务器。

英特尔服务器处理器技术编年史[组图]
至强7500新特性

  点评:

  2010年,可谓英特尔产品大推广之年,仅在第一季度就相继推出了Itanium 9300、至强5600和7500系列产品。Itanium 9300扩大了对Xeon平台的共享;至强5600系列提升了产品的智能特性,降低了功耗;至强7500性能得到显著提升。可以说,在2010年 ,英特尔就带给人们很多憧憬,满足人们对性能、功耗和平台支持等多种诉求。

回到顶部阅读

2011年:关键业务领跑者-至强E7系列

  2011年4月,英特尔针对服务器和工作站推出了两大系列产品:面向高端关键业务应用、基于上代Westmere架构的至强E7系列和 面向中小企业工作站和入门级服务器、基于新一代Sandy Bridge架构的至强E3系列,它们的代号分别为Westmere-EX和Sandy Bridge-EN。


英特尔服务器处理器技术编年史[组图]
至强E7

英特尔服务器处理器技术编年史[组图]
至强E7晶圆

  至强E7主要包括E7-8800、E7-4800和E7-2800三大系列,总计有18款不同型号。它们全部采用32nm工艺制造,LGA1567封装接口,最多十个核心、30MB三级缓存,每处理器四条QPI总线(速度最高6.4GT/s),热设计功耗最高130W,支持HT超线程技术、Turbo Boost动态加速技术、VT虚拟化技术,具备先进的数据保护和可靠性技术AES-NI指令集、TXT可信赖执行,支持最多2TB DDR3(四路系统)和低压内存技术。

英特尔服务器处理器技术编年史[组图]
英特尔官网介绍至强E7

  至强E7系列产品性能整体上相比上代Xeon 7500系列提升最多40%,虚拟机性能提升最多25%,并在数据库、虚拟化、高性能计算、中间件、通用目的服务器、企业资源规划等方面创下了14个新的世界纪录。值得一提的是,英特尔为至强E7加入了新的节能技术“Intelligent Power”(智能供电),能够根据工作负载大幅降低待机功耗,并提供高级处理器电源管理能力。

英特尔服务器处理器技术编年史[组图]
至强E7新特性

  Xeon E7系列主要面向双路、四路和八路服务器,最高可以扩展至256路并行。IT企业可以用一台Xeon E7服务器取代之前的18台双路服务器。

英特尔服务器处理器技术编年史[组图]
至强E7产品线

  Xeon E3-1200系列是单路入门级处理器,可满足小型企业应用的独特需求,包括协作工具、存储系统、备份系统等等。它在核心架构上与桌面的Sandy Bridge Core i7/i5/i3同宗同源,也是LGA1155封装接口,不过全面支持AES-NI、TXT以及ECC内存错误校验功能,性能号称比上代Xeon 3400系列提升最多30%。

英特尔服务器处理器技术编年史[组图]
至强E3处理器

英特尔服务器处理器技术编年史[组图]
至强E3标识

  Xeon E3-1200系列共有11款型号,包括十款四核心和一款双核心,全部支持超线程技术和Turbo Boost动态加速技术,三级缓存 3-8MB,热设计功耗标准版80/95W,Xeon E3-1260L/1220L两款低压版本只有45W和20W,后者主要面向所谓的微型服务器(micro server)。

英特尔服务器处理器技术编年史[组图]
至强E3产品线

  点评:

  至强E3和E5两大系列,针对中小企业入门级市场和高端关键业务应用领域同时发力。其中主打工作站和入门级服务器的至强E3,更是将功耗降到了20W。而至强E7最高核心数达到10核,将英特尔处理器核心数量再次得到提升,30MB的三级高速缓存和多种关键技术的支持,使得其成为未来高端服务器领域的强大平台。

回到顶部阅读

四十不惑:回首过去展望未来

 2011年,英特尔全面开花,既有低端的至强E3系列,也有高端的E7系列,而且在服务器的其他技术领域,也有很多创新产品。就目前来看,短期内,我们可以展望英特尔即将推出的以下几款产品:


英特尔服务器处理器技术编年史[组图]
Intel Logo

  至强E5系列处理器将在今年Q4季度发布,E5系列将包括四个产品线:E5-1600、E5-2400、E5-2600和E5-4600。其中Xeon E5-1600虽然属于E5系列单路CPU,并不支持双路,但是定位于高端单路市场,包括E5-1620、E5-1650和E5-1660三个型号。

  至强E5-1620是一个四核芯片,时钟频率为3.6GHz,10MB三级缓存。其它的两个Xeon E5-1650和E5-1660具有6颗CPU核,但是时钟频率比E5-1620要低。E5-1650SKU的时钟频率为3.2GHz,并具有12MB的三级缓存。Intel E5-1660有3.3GHz主频和15MB的三级缓存。

  Xeon E5-2400,封装接口为LGA1356,已知有九款不同型号,核心数量4-8个,内存控制器全部为三通道。

  ●四核心四线程的入门级型号Xeon E5-2403/2407,主频1.8/2.2GHz,三级缓存10MB,内存支持DDR3-1066,热设计功耗80W。

  ●四款六核心十二线程的Xeon E5-2420/2430/2430L/2440,主频1.9/2.2/2.0/2.4GHz,三级缓存增大到15MB,内存频率提升到 DDR3-1333,热设计功耗标准版95W,2430L低功耗版则只有60W。

  ●八核心十六线程的高端型号Xeon E5-2450/2450L/2470,主频2.1/1.8/2.3GHz,三级缓存再次扩容到20MB,内存频率也进一步 提升至DDR3-1600,热设计功耗标准版仍是95W,低功耗版的2450L则是70W。

  Xeon E5-2600系列处理器采用32nm工艺制造和LGA2011封装接口,总计有17款不同型号,括一款双核心、三款四核心、五款六核心、八款八核心,线程、频率、三级缓存、内存、热设计功耗等各不相同。

英特尔服务器处理器技术编年史[组图]
Xeon E5-2600系列参数

  此外,下一代安腾芯片Poulson,将会步Itanium 9300后尘,进一步缩减Itanium、Xeon平台差异,最终实现与至强平台的兼容。

英特尔服务器处理器技术编年史[组图]
引领未来

  点评:

  可以看出,英特尔在服务器处理器领域的市场定位更加明晰了,E3、E5和E7分别对应低中高端,而每个系列又有针对不同需求的高中低配置。另外,下一代安腾处理器会进一步实现与至强平台的兼容,这让人看起来非常有意思。

  也许有人会认为这是多此一举。实则不然,就像近期IBM将大型机实现与Windows系统兼容的道理类似,要想长久发展,就需要打破封闭。面向Unix服务器和大型主机市场的安腾处理器,与针对面向Windows、Solaris和Linux服务器的至强实现兼容,更需要考虑的不是动机问题,而是由此引发的用户市场更迭和旗下产品线之间的定位问题。

  四十不惑,代表着遇事能明辨不疑。我相信,英特尔能够以更加睿智的眼光和成熟的心态迎接挑战、走向未来!

1971-2008年间历代处理器

Intel Xeon E7310(4M Cache, 1.60 GHz, 1066 MHz FSB)

规格

Essentials
状态 End of Life
发行日期 Q3’07
预期停产 Q3’2011
处理器号 E7310
内核数 4
时钟速度 1.6 GHz
二级高速缓存 4 MB
前端总线输出 1066 MHz
前端总线奇偶 Yes
指令集 64-bit
提供嵌入式方案

No
光刻 65 nm
最大散热设计功耗(TDP) 80 W
VID 电压范围 1.0V-1.5V
建议的客户价格 BOX : $890.00
Package Specifications
TCASE 66°C
封装大小 53.3mm x 53.3mm
处理芯片大小 286 mm2
处理芯片晶体管数 582 million
支持的插槽 PGA604, PPGA604
低卤素选项可用 参见 MDDS
Advanced Technologies
英特尔® 超线程技术

No
英特尔® 虚拟化技术

Yes
英特尔® 可信执行技术

No
英特尔® 64 位内存扩展技术

Yes
空闲状态 Yes
增强型Intel SpeedStep® 动态节能技术

Yes
英特尔® 按需配电技术

Yes
执行禁用位 Yes

http://ark.intel.com/zh-cn/products/30792/Intel-Xeon-Processor-E7310-4M-Cache-1_60-GHz-1066-MHz-FSB

Intel Xeon X5470(12M Cache, 3.33 GHz, 1333 MHz FSB)

规格

Essentials
状态 End of Life
发行日期 Q3’08
预期停产 Q4’2010
处理器号 X5470
内核数 4
时钟速度 3.33 GHz
二级高速缓存 12 MB
前端总线输出 1333 MHz
前端总线奇偶 Yes
指令集 64-bit
提供嵌入式方案

No
光刻 45 nm
最大散热设计功耗(TDP) 120 W
VID 电压范围 0.850V-1.3500V
建议的客户价格 TRAY: $1386.00
BOX : $1467.00
Package Specifications
TCASE 63°C
处理芯片大小 214 mm2
处理芯片晶体管数 820 million
支持的插槽 LGA771
低卤素选项可用 参见 MDDS
Advanced Technologies
英特尔® 超线程技术

No
英特尔® 虚拟化技术

Yes
有扩展页表 (EPT) 的英特尔® VT-x

No
英特尔® 可信执行技术

No
英特尔® 64 位内存扩展技术

Yes
空闲状态 Yes
增强型Intel SpeedStep® 动态节能技术

Yes
英特尔® 按需配电技术

Yes
温度监视技术 Yes
执行禁用位 Yes

http://ark.intel.com/zh-cn/products/35430/Intel-Xeon-Processor-X5470-12M-Cache-3_33-GHz-1333-MHz-FSB

HP DL580 G5服务器开不了机,且CPU告警的处理办法

现有一台HP DL580 G5服务器,应用突然中断,网络也连接不上,去机房查看,发现该服务器宕机,重启服务器后,开机自检屏幕无显示,诊断板上的内部组件灯亮,且四个CPU的告警灯也亮。断电后过两分钟开机,故障依旧。

由于该服务器安装有四个CPU,且服务器只能在安装有一个、两个、四个CPU的情况下运行,所以将三号和四号的CPU、CPU电压模块VRM拆下,可正常开机,进入操作系统后,使用HP软件查看硬件日志,发现日志中只记录POST ERROR,并未有详细的故障记录,且为了尽快恢复应用,并未详细测试拆下的CPU和VRM,在使用一号和二号CPU时,该服务器运行正常。

附1、HP DL580 G5服务器的诊断板位于开关的下部,光驱的上部;
附2、CPU告警可能为CPU、VRM、主板等故障引起,也可能散热不好,再次将三号、四号CPU装上,服务器可能可以正常开机自检运行。