楼主您好,
您的理解正确,前者的确是SM(X), 后者也的确是SP.
计算能力1.x时代的确只有8个SP/SM, 但是后来的2.x和3.x都增加了这个数目。
您使用的是3.x的卡,所以一个SM有192个SP!
您可以看出,这是多么巨大的进步。
关于您的第二个疑问,这里的2048是指同时最多在执行中的线程数目。
也就是说,您的2个SM的卡,最多可以同时在执行4096个线程,
但是您依然可以执行更大线程规模的kernel, 但是每个时刻,同时在GPU上被执行的最多的只有4096个(当一些执行完毕后,另外一些将自动被放置到卡上执行)。
您想想您的CPU,1个核心,但却可以支持多线程(同时只有1个线程在执行), 道理类似。
以及,您可以看上,同时能执行4096个线程,贵卡是多么的威武!
所以也无需担忧这个。
感谢您的来访。 |