ice 发表于 2013-11-3 21:11
LZ您好:
目测您似乎没有理解玫瑰斑竹的意思,我来稍微再解释一下:
ice 你好,谢谢的详细解答,其实在我的应用是一个迭代算法,
(1)zercoef是一个长度为65的向量,它所占的字节数为65*sizeof(double)= 520B,在每一轮迭代过程中zercoef都要更新,但是在每轮迭代中多个kernel都要用到同一个zercoef。
(2)wf65是一个256*256*65的一个三维矩阵,你可以把它想象成一个长=256 宽=256 高=65的立方体,这个立方体在我的迭代开始到结束都是固定的,共占用字节数为256*256*65*sizeof(double)= 32MB。
像我这样的应用,我觉得我的应用中对wf65的访问占用时间太多了,zercoef相对要少很多,你觉得这两个变量的访问怎么安排比较合理呢?谢谢啦! |