对CUDA实现的函数未定义的引用问题,怎么解决

 我来答
硪丨暧恋
2017-07-21 · TA获得超过8980个赞
知道大有可为答主
回答量:5336
采纳率:93%
帮助的人:2175万
展开全部
原因有多种多样的:

(1)其中常见的一种是,32 * 32 = 1024线程的block大小,超出了贵卡的能力范围。
(需要fermi+的,请告知一下你的卡的信息)

(2)此外的一种常见原因是越界访存,请确保你用的数据(例如缓冲区)也随之相应扩大了。
建议:
(1)检查offset的值范围,看看能否在(32,32,1)的block shape下,超出有效范围。
(2)在代码里读取dis[offset]前, 用if (offset < .) 来限制一下(.是你自己知道的一个范围)。
(3)如果(1)(2)未能解决问题,则开启nsight的cuda memory checker, 直接用nsight定位可能的越界位置。
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式