CUDA下,如何测试1MB的数据从主机内存传输到gpu全局内存花费的时间?

我是这样测试,在主机内存申请一个数据,数组的大小为256,然后给其赋初始值,然后用cudaMemcpy函数拷贝,用time.h头文件里面获取时间,但是在cudaMemcp... 我是这样测试,在主机内存申请一个数据,数组的大小为256,然后给其赋初始值,然后用cudaMemcpy函数拷贝,用time.h头文件里面获取时间,但是在cudaMemcpy前后获取的时间一致,这是因为什么原因呢?求助,应该有啥好的方法测试所花费的时间? 展开
 我来答
BlueWanderer
2017-12-02 · TA获得超过9209个赞
知道大有可为答主
回答量:5673
采纳率:83%
帮助的人:2004万
展开全部
最简单的方法是用visual profiler,如果想自己测的话你得用GPU端的事件。而且1MB数据也太少点了吧,time.h里的计时精度根本不够。
另外你最好把CUDA完整学一下再用。
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式