CUDA核函数不执行通常是由于什么原因

 我来答
X先森说

2016-02-04 · TA获得超过1.4万个赞
知道大有可为答主
回答量:6377
采纳率:82%
帮助的人:695万
展开全部
原因有多种多样的:

(1)其中常见的一种是,32 * 32 = 1024线程的block大小,超出了贵卡的能力范围。
(需要fermi+的,请告知一下你的卡的信息)

(2)此外的一种常见原因是越界访存,请确保你用的数据(例如缓冲区)也随之相应扩大了。
建议:
(1)检查offset的值范围,看看能否在(32,32,1)的block shape下,超出有效范围。
(2)在代码里读取dis[offset]前, 用if (offset < ....) 来限制一下(....是你自己知道的一个范围)。
(3)如果(1)(2)未能解决问题,则开启nsight的cuda memory checker, 直接用nsight定位可能的越界位置。
泷皖莲6
2015-04-24 · TA获得超过622个赞
知道小有建树答主
回答量:304
采纳率:0%
帮助的人:315万
展开全部

原因一般是内存越界。你可以通过如下语句输出错误信息:

//在你的kernel调用下面这样写
// Kernel<<<  >>>
cudaError_t error = cudaGetLastError();
printf("CUDA error: %s\n", cudaGetErrorString(error));

谢谢!

本回答被提问者和网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式