为什么CPU的浮点运算比不过GPU。
展开全部
速度区别主要是来自于架构上的区别。架构的不同则是因为硬件的设计目的不一样。
ALU就是“算术逻辑单元(Arithmetic logic unit)”。
CPU和GPU进行计算的部分都是ALU,GPU绝大部分的芯片面积都是ALU,而且是超大阵列排布的ALU。这些ALU都是可以并行运行的,所以浮点计算速度就特别高了。
相比起来,CPU大多数面积都需要给控制单元和Cache,因为CPU要承担整个计算机的控制工作,没有GPU那么单纯。
所以GPU的程序控制能力相比CPU来说不强,稍早时候的CUDA程序像是递归都是不能用的(较新的设备上可以了)。
我觉得也不是CPU不能提高浮点计算速度,而是因为没什么特别的必要了。咱们通常的桌面应用根本没有什么特别的浮点计算能力要求。而同时GPU这样的设备已经出现了,那么需要浮点计算的场合利用上就行了
ALU就是“算术逻辑单元(Arithmetic logic unit)”。
CPU和GPU进行计算的部分都是ALU,GPU绝大部分的芯片面积都是ALU,而且是超大阵列排布的ALU。这些ALU都是可以并行运行的,所以浮点计算速度就特别高了。
相比起来,CPU大多数面积都需要给控制单元和Cache,因为CPU要承担整个计算机的控制工作,没有GPU那么单纯。
所以GPU的程序控制能力相比CPU来说不强,稍早时候的CUDA程序像是递归都是不能用的(较新的设备上可以了)。
我觉得也不是CPU不能提高浮点计算速度,而是因为没什么特别的必要了。咱们通常的桌面应用根本没有什么特别的浮点计算能力要求。而同时GPU这样的设备已经出现了,那么需要浮点计算的场合利用上就行了
展开全部
呵呵
个人理解
GPU是并行运算器——一大堆ALU粘在一起,这样算图的时候可以一次算很多点,这样只要提高频率,并粘更多ALU,就能不断提高性能。
CPU是逻辑运算器——一大堆烂七八糟的东西年在一起,这样分步运算比较方便。同样可以靠提高频率提升性能,但不能靠粘更多的流水线提高性能,所以现在CPU发展暂时慢于GPU,晶体管数也与GPU相当了。
那么传说GPU比CPU浮点快1000倍是不是真的呢?
是真的因为GPU是平行运算,48个ALU同时算加上超超超超超超短流水线,超了CPU那3个ALU也不奇怪。
所以说,如果比两者性能是没有可比性的。
如果比算图的话,cpu一个点一个点算,GPU一片一片算,当然GPU强了,可要是算PI,GPU就可以去死了。
上边的HDTV解码还是比较能说明问题的,既不是逻辑运算,平行运算大概也能用上吧。
虽说GPU是模拟HDTV解码,但CPU也一样(CPU干吗都是模拟),况且,驱动也帮GPU特别优化了。
个人理解
GPU是并行运算器——一大堆ALU粘在一起,这样算图的时候可以一次算很多点,这样只要提高频率,并粘更多ALU,就能不断提高性能。
CPU是逻辑运算器——一大堆烂七八糟的东西年在一起,这样分步运算比较方便。同样可以靠提高频率提升性能,但不能靠粘更多的流水线提高性能,所以现在CPU发展暂时慢于GPU,晶体管数也与GPU相当了。
那么传说GPU比CPU浮点快1000倍是不是真的呢?
是真的因为GPU是平行运算,48个ALU同时算加上超超超超超超短流水线,超了CPU那3个ALU也不奇怪。
所以说,如果比两者性能是没有可比性的。
如果比算图的话,cpu一个点一个点算,GPU一片一片算,当然GPU强了,可要是算PI,GPU就可以去死了。
上边的HDTV解码还是比较能说明问题的,既不是逻辑运算,平行运算大概也能用上吧。
虽说GPU是模拟HDTV解码,但CPU也一样(CPU干吗都是模拟),况且,驱动也帮GPU特别优化了。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
架构的不同导致的。GPU有很多SP单元,并行处理能力很强,一块显卡中可能会有上百甚至上千个计算器(ALU)和累加器。显卡只是没有软件接口,所以他的运算性能得不到发挥,在以前也不被重视,现在的显卡性能越来越好,单纯用来玩游戏太可惜了。所以才出现CUDA这类的软件接口。总之答案就是GPU架构的特殊性决定了他有恐怖的浮点运算能力的。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
因为前者的晶体管没有后者多
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
你可以百度一下就知道了
本回答被提问者和网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询