CUDA核函数不执行通常是由于什么原因

 我来答

2个回答

#热议# 生活中有哪些实用的心理学知识？

X先森说

2016-02-04 · TA获得超过1.4万个赞

知道大有可为答主

回答量：6377

采纳率：82%

帮助的人：695万

我也去答题访问个人页

关注

展开全部

原因有多种多样的：

（1）其中常见的一种是，32 * 32 = 1024线程的block大小，超出了贵卡的能力范围。
（需要fermi+的，请告知一下你的卡的信息）

（2）此外的一种常见原因是越界访存，请确保你用的数据（例如缓冲区）也随之相应扩大了。
建议：
（1）检查offset的值范围，看看能否在(32,32,1)的block shape下，超出有效范围。
（2）在代码里读取dis[offset]前, 用if (offset < ....) 来限制一下（....是你自己知道的一个范围）。
（3）如果（1）（2）未能解决问题，则开启nsight的cuda memory checker, 直接用nsight定位可能的越界位置。

已赞过 已踩过<

评论收起

区块城市（广州）科技发展

广告2025-01-03

c语言开源代码不拘一格的元宇宙城市，去中心化的c语言开源代码，轻松开启你的元宇宙生涯——人人都可加入的c语言开源代码，无需下载安装

www.gzbluedata.com

泷皖莲6
2015-04-24 · TA获得超过622个赞

知道小有建树答主

回答量：304

采纳率：0%

帮助的人：315万

我也去答题访问个人页

关注

展开全部

原因一般是内存越界。你可以通过如下语句输出错误信息：

//在你的kernel调用下面这样写
// Kernel<<<  >>>
cudaError_t error = cudaGetLastError();
printf("CUDA error: %s\n", cudaGetErrorString(error));

谢谢！

本回答被提问者和网友采纳

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

c语言开源代码——看完你就明白了

c语言开源代码不拘一格的元宇宙城市，去中心化的c语言开源代码，轻松开启你的元宇宙生涯——人人都可加入的c语言开源代码，无需下载安装

www.gzbluedata.com广告

c语言开源代码——看下你就明白了

虚拟与现实结合的c语言开源代码，一个去中心化的平行世界，立即拥有你的数字分身区块链创新应用、c语言开源代码带你开启元宇宙生涯

www.gzbluedata.com广告

c运行_全面检测系统异常_快速修复丨必备工具

c运行，快速扫描并修复电脑中任何DLL错误，一键dll修复损坏、丢失的DLL文件的运行库和DirectX文件修复 Windows程序和游戏中的启动问题，运行库全能修复管家必备工具!

dll.ahmfsoft.com广告

CUDA核函数不执行通常是由于什么原因

您可能关注的内容

其他类似问题

为你推荐：