用户
 找回密码
 立即注册
episode 该用户已被删除
发表于 2013-7-26 17:07:36
42811
有一个比较小的问题想请教一下大家
我的数据的size是2000,因为要并行计算,所以就直接开了一个kernel,给的kernel function的参数是<<<2000,1>>>,
就是我是直接用了2000个block,每个block里面只有一个thread。
如果我把kernel function的参数设置为<<<10,200>>> 的话,是否运行会更快一些?
但是我的kernel里面的计算 并没有设计到thread之间的通信。
所以想问问。怎样的选择会更好?
谢谢.

使用道具 举报 回复
发表于 2013-7-26 17:10:36
LZ您好:

请您适当了解一下CUDA的基本内容,再考虑编写和优化您的程序。

本帖将被转移到水区。
使用道具 举报 回复 支持 反对
发新帖
您需要登录后才可以回帖 登录 | 立即注册