发表新帖
wzk6_3_8 发表于 2013-11-13 21:39 其实对于好的编译器,这个根本没差别。我一直就觉得CUDA编译器比较差。
iHakka 发表于 2013-11-21 00:30 恩...編譯器的做法確實可能跟我想的不太一樣... 補充:
gpu 发表于 2013-11-21 10:54 说的很好,我也认为ILP远比多线程重要。
ice 发表于 2013-11-21 12:26 gpu您好: 12#的观点有前提条件,我觉得不能直接推广到您的13#的结论。
gpu 发表于 2013-11-21 15:44 开普勒不是每次每个WARP发射2条指令码? 如果算法设计指令依赖严重,导致每次每个WARP只能发射1条指令, ...
玫瑰幻想 发表于 2013-11-21 15:46 这个是没错的.但是一般情况下,编译器会尽量安排平均4条指令里有2条可以同时发射的(因为实际上只需要有50% ...