cuda 内核函数中的多线程访问变量是如何处理

 我来答
司马刀剑
高粉答主

2018-06-12 · 每个回答都超有意思的
知道顶级答主
回答量:4.6万
采纳率:93%
帮助的人:7452万
展开全部

你好,

楼主是说block级的同步吗?CUDA没有提供这样的函数,因为一是这种操作太耗时间,二是凡是这种操作都可以以其他方式解决。CUDA提供了一下两个同步函数:

  • __syncthreads(); 用来同步每个block内的线程,用于kernel当中。

  • cudaDeviceSyncronize(); 用来同步设备上所有之前的操作。在调用cudaStream或者多个GPU的时候需要用到这个函数来保证每个stream或每个GPU运行到同一点。

推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式