流处理器数量:128SP中的SP是什么意思
2个回答
展开全部
ATI(AMD)的设计并不是忽悠人,它的这种设计也不能就说效率低下,从系统架构上来说,ATI(AMD)的设计并没有什么问题,它设计的是超标量处理单元,采用4D矢量+1D标量的SIMD架构,而NVIDIA则使用的是1D的标量MIMID架构。不理解没有关系,简单的说,假如要处理的数据能够拆分为4D或1D的方式,那么A卡的所有流处理器都将同时工作,而现实中并不是所有数据都可以拆分为4D和1D的方式,所以A卡的架构在实际运行中必然会有流处理器闲置的情况。从而影响性能,为了弥补流处理器闲置造成的性能损失,ATI(AMD)的做法是依靠提高流处理器数量来弥补。
细说一下A卡的架构,我个人理解A卡采用三层结构,最下面一层是流处理器,每5个流处理器组成一个流处理器单元(这也许是很多人觉得A卡和N卡的流处理器和实际性能应该是1:5的由来),这是架构的第二层,另外一定数量的流处理器单元组成流处理器阵列,由线程分配器或者说流处理单元控制器进行管理和资源分配。ATI(AMD)当然意识到作为历史上最失败的2900XT的架构的问题,但重新设计已不可能,同时也没有必要。所以在HD 3,HD 4系列的设计上持续的在做改进。
举个简单的例子,HD 4650的RV730核心和HD 3850的RV670核心,他们的流处理器数量同为320个,但是实际上,HD 4650的流处理器拥有8个流处理器阵列(也就是拥有8个流处理器单元控制器),每个阵列下拥有8个流处理单元,每个流处理单元拥有5个流处理器,因此是8*8*5=320的架构,而HD 3850则是4个流处理器阵列(所以只有4个流处理单元控制器),每个阵列下拥有16个流处理单元,每个流处理单元拥有5个流处理器,所以是4*16*5=320的架构,看起来流处理器数量相同,但是由于HD 4650的流处理单元控制器更多,或者说每一个线程分配器(流处理单元控制器)的管理的流处理单元更少,所以其架构效率要比HD 3850高不少。同时HD 3850本身纹理和光栅单元设计不足,所以HD 3850在开启抗锯齿或者高纹理游戏中心力交瘁。而HD 4650的架构则相对HD 3850直接将纹理单元加倍从16个涨到了32个,光栅单元也做了全新的设计。另外补充一下,目前3D处理处理依然是顶点单元构建3D骨架,纹理单元贴上皮肤,像素单元处理光影特效,最后将3D图像光栅化为2D图像输出。DX10架构不再区分顶点单元和像素单元,由流处理器代替,但是实际渲染中流处理器仍然一部分需要做顶点处理,一部分做像素处理。根据前面的说明,HD 4650由于拥有更少的流处理单元,加上纹理单元更多,所以每一个流处理单元可以分配到更多的纹理单元(其实还有缓存),帮助图形更快的渲染,加上全新设计的光栅单元,HD 4650的抗锯齿性能和纹理性能相对HD 3850有了翻天覆地的提升,只不过很可惜的是HD 4650的显存位宽进行了缩减,同时光栅单元数量也进行了缩减,影响了它的性能发挥,否则HD 4650超越HD 3850将是轻轻松松的事情(实际上HD 4650虽然跑分不怎么样,但实际性能完胜128BIT显存位宽的HD 3690或者HD 3850)
在说一下频率对A卡的影响,由于拥有数量庞大的流处理器,所以频率对A卡来说远比N卡重要,之所以这么说,看看同样架构,同样800个流处理器的RV770和RV790的4款产品就知道了,也就是800SP的HD 4830,HD 4850,HD 4870和HD 4890,他们的流处理器数量,纹理,光栅,显存位宽完全相同,不同的只是核心和显存频率,单纯提升显存频率其实对显卡性能提升有限,所以基本上他们的性能差距来自于核心频率的差距。比如HD 4870和HD 4850,核心频率仅仅相差125MHZ而已,不过要知道,这125MHZ可是800个流处理器的频率差距,其带来的性能差距是相当巨大的,所以HD 4850的性能仅和NVIDIA 128个流处理器的9800GTX+/GTX250相当,而HD 4870的性能就已经可以和216个流处理器的GTX260+有得一拼了。
另外ATI(AMD)的架构由于超标量执行能力远胜N卡,加上恐怖流处理器数量带来的恐怖浮点运算能力,所以非常适合做GPGPU通用计算,ATI(AMD)之所以没有更改初始的设计,一方面是成本和时间的考虑,另外一方面,ATI(AMD)借助架构强大的浮点运算能力和浮点运算的提升潜力已经在全力开发云计算领域。所以虽然在游戏领域可能A卡的架构仍然会被N FAN甚至大多数人诟病为效率低下,不过在专业的通用计算领域,不管是浮点运算能力还是线程处理能力(线程数量)都逊于ATI(AMD)的NVIDIA或许还有更长的路要走。毕竟ATI(AMD)可以以5个为单位轻松的提升流处理器数量,而NIDIA则由于架构的关系流处理器数量提升困难。
细说一下A卡的架构,我个人理解A卡采用三层结构,最下面一层是流处理器,每5个流处理器组成一个流处理器单元(这也许是很多人觉得A卡和N卡的流处理器和实际性能应该是1:5的由来),这是架构的第二层,另外一定数量的流处理器单元组成流处理器阵列,由线程分配器或者说流处理单元控制器进行管理和资源分配。ATI(AMD)当然意识到作为历史上最失败的2900XT的架构的问题,但重新设计已不可能,同时也没有必要。所以在HD 3,HD 4系列的设计上持续的在做改进。
举个简单的例子,HD 4650的RV730核心和HD 3850的RV670核心,他们的流处理器数量同为320个,但是实际上,HD 4650的流处理器拥有8个流处理器阵列(也就是拥有8个流处理器单元控制器),每个阵列下拥有8个流处理单元,每个流处理单元拥有5个流处理器,因此是8*8*5=320的架构,而HD 3850则是4个流处理器阵列(所以只有4个流处理单元控制器),每个阵列下拥有16个流处理单元,每个流处理单元拥有5个流处理器,所以是4*16*5=320的架构,看起来流处理器数量相同,但是由于HD 4650的流处理单元控制器更多,或者说每一个线程分配器(流处理单元控制器)的管理的流处理单元更少,所以其架构效率要比HD 3850高不少。同时HD 3850本身纹理和光栅单元设计不足,所以HD 3850在开启抗锯齿或者高纹理游戏中心力交瘁。而HD 4650的架构则相对HD 3850直接将纹理单元加倍从16个涨到了32个,光栅单元也做了全新的设计。另外补充一下,目前3D处理处理依然是顶点单元构建3D骨架,纹理单元贴上皮肤,像素单元处理光影特效,最后将3D图像光栅化为2D图像输出。DX10架构不再区分顶点单元和像素单元,由流处理器代替,但是实际渲染中流处理器仍然一部分需要做顶点处理,一部分做像素处理。根据前面的说明,HD 4650由于拥有更少的流处理单元,加上纹理单元更多,所以每一个流处理单元可以分配到更多的纹理单元(其实还有缓存),帮助图形更快的渲染,加上全新设计的光栅单元,HD 4650的抗锯齿性能和纹理性能相对HD 3850有了翻天覆地的提升,只不过很可惜的是HD 4650的显存位宽进行了缩减,同时光栅单元数量也进行了缩减,影响了它的性能发挥,否则HD 4650超越HD 3850将是轻轻松松的事情(实际上HD 4650虽然跑分不怎么样,但实际性能完胜128BIT显存位宽的HD 3690或者HD 3850)
在说一下频率对A卡的影响,由于拥有数量庞大的流处理器,所以频率对A卡来说远比N卡重要,之所以这么说,看看同样架构,同样800个流处理器的RV770和RV790的4款产品就知道了,也就是800SP的HD 4830,HD 4850,HD 4870和HD 4890,他们的流处理器数量,纹理,光栅,显存位宽完全相同,不同的只是核心和显存频率,单纯提升显存频率其实对显卡性能提升有限,所以基本上他们的性能差距来自于核心频率的差距。比如HD 4870和HD 4850,核心频率仅仅相差125MHZ而已,不过要知道,这125MHZ可是800个流处理器的频率差距,其带来的性能差距是相当巨大的,所以HD 4850的性能仅和NVIDIA 128个流处理器的9800GTX+/GTX250相当,而HD 4870的性能就已经可以和216个流处理器的GTX260+有得一拼了。
另外ATI(AMD)的架构由于超标量执行能力远胜N卡,加上恐怖流处理器数量带来的恐怖浮点运算能力,所以非常适合做GPGPU通用计算,ATI(AMD)之所以没有更改初始的设计,一方面是成本和时间的考虑,另外一方面,ATI(AMD)借助架构强大的浮点运算能力和浮点运算的提升潜力已经在全力开发云计算领域。所以虽然在游戏领域可能A卡的架构仍然会被N FAN甚至大多数人诟病为效率低下,不过在专业的通用计算领域,不管是浮点运算能力还是线程处理能力(线程数量)都逊于ATI(AMD)的NVIDIA或许还有更长的路要走。毕竟ATI(AMD)可以以5个为单位轻松的提升流处理器数量,而NIDIA则由于架构的关系流处理器数量提升困难。
上海巴鲁图工程机械科技有限公司_
2022-05-15 广告
2022-05-15 广告
光电编码器,是一种通过光电转换将输出轴上的机械几何位移量转换成脉冲或数字量的传感器。光电编码器每转输出60(我们用老板没有说)个脉冲,五线制。其中两根为电源线,三根为脉冲线(A相、B相、Z)。电源的工作电压为 (+5~+24V)直流电源。光...
点击进入详情页
本回答由上海巴鲁图工程机械科技有限公司_提供
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询