CUDA实现函数未定义的引用问题,怎么解决
展开全部
原因有多种多样的:
(1)其中常见的一种是,32 * 32 = 1024线程的block大小,超出了贵卡的能力范围。
(需要fermi+的,请告知一下你的卡的信息)
(2)此外的一种常见原因是越界访存,请确保你用的数据(例如缓冲区)也随之相应扩大了。
建议:
(1)检查offset的值范围,看看能否在(32,32,1)的block shape下,超出有效范围。
(2)在代码里读取dis[offset]前, 用if (offset < .) 来限制一下(.是你自己知道的一个范围)。
(3)如果(1)(2)未能解决问题,则开启nsight的cuda memory checker, 直接用nsight定位可能的越界位置。
(1)其中常见的一种是,32 * 32 = 1024线程的block大小,超出了贵卡的能力范围。
(需要fermi+的,请告知一下你的卡的信息)
(2)此外的一种常见原因是越界访存,请确保你用的数据(例如缓冲区)也随之相应扩大了。
建议:
(1)检查offset的值范围,看看能否在(32,32,1)的block shape下,超出有效范围。
(2)在代码里读取dis[offset]前, 用if (offset < .) 来限制一下(.是你自己知道的一个范围)。
(3)如果(1)(2)未能解决问题,则开启nsight的cuda memory checker, 直接用nsight定位可能的越界位置。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询