比如9800GT 只有 100多, 与A 卡的同级别HD4830 相比少很多, 并且4830还可以刷到800SP 。
N 卡的SP 比A 卡少这么多, 还有什么优势呢?
比如9800GT 只有 100多, 与A 卡的同级别HD4830 相比少很多, 并且4830还可以刷到800SP 。
N 卡的SP 比A 卡少这么多, 还有什么优势呢?
N卡是标量的构架,4个SP单元一组,运算一次,可以是1个SP在4个时间单位内处理掉,也可以4个SP在一个时间单位内处理掉,也就是4D处理。缺点很明显,随着画面复杂和多元化,很多指令不是4D,而是1、2、3、4……那么效率上就很不好了,不过异步的着色器频率能缓解这个问题。
A卡是超标量构架,每个SP里有5个超标量的ALU,人们习惯以每个超标量的ALU来表示A卡的SP数量,故而A卡显得SP很多,实际除以5是可以的。这种构架优势是灵活,每个大SP里有一个branch execution单元管辖5个ALU,从而实现多元化处理,4+1、1+1+1+1+1、2+2+1等等指令都可以有效的处理掉,没有太多情况能闲置ALU,效率上很好。不过,A卡的失策很明显,1是公关太差,不会忽悠人,不会宣传和推广,2是没有重视与游戏开发商的合作,导致THE WAY横行……
要解释清楚这个问题,就要从N卡和A卡两种不同的流处理器结构谈起。流处理器的英文单词是StreamProcessor,简称SP。一个SP就好比多核CPU的一个核一样,是一个独立的计算单元。
A卡采用的是4D+1的矢量结构,它SP比N卡的SP结构上简单很多,5个SP一组,5个才有一个完整计算单元的功能。虽然单个SP功能和执行灵活程度上不如N卡SP,但是好处是结构简单易于堆砌,可以比较容易堆积更大数量。
N卡采用的是标量全1D的结构,1个SP就是1个完整的计算单元。虽然单个SP能力要功能和执行效率都要高于A卡的SP,但结构复杂,不利于大量堆积。具体原因只是两家的设计理念不同,没有谁好谁坏之分。
简单的推算,比如A卡的4850有800个SP,那800÷5,就相当于N卡的160个流处理器了。