用户
 找回密码
 立即注册
gpu 该用户已被删除
发表于 2013-11-14 22:14:01
62733
编程指南里面没有,不知道64BIT的加减运算,乘加,移位等吞吐率如何?
另外“SIMD video instructions vabsdiff2 and vabsdiff2”这一行看着比较怪异。
使用道具 举报 回复
发表于 2013-11-14 22:17:42
楼主您好,

64-bit的整数运算需要两条或者多条32-bit整数运算来完成。
(不仅仅是64位整数运算,很多其他非直接支持的,需要展开成多个序列的操作均无吞吐率数据)

vabsdiff您可以暂时无视。(如果需要,请新开主题或者搜索论坛之前关于vabsdiff的介绍)

感谢您的深夜来访。
使用道具 举报 回复 支持 反对
发表于 2013-11-14 22:31:24
玫瑰幻想 发表于 2013-11-14 22:17
楼主您好,

64-bit的整数运算需要两条或者多条32-bit整数运算来完成。

是这样子的啊。那我算法里面的64BIT整形数据岂不是效率很低?
看来我理解错误了。原以为64BIT是硬件支持的,看PTX描述里面都有64BIT整数数据类型啊。
另外我说的怪异是那两个指令拼写是一样的,同一个词还弄个and来连接。
使用道具 举报 回复 支持 反对
发表于 2013-11-14 22:36:35
gpu 发表于 2013-11-14 22:31
是这样子的啊。那我算法里面的64BIT整形数据岂不是效率很低?
看来我理解错误了。原以为64BIT是硬件支持 ...

你的理解显然是不正确的,

某操作是否有直接对应的指令,和该操作的吞吐率完全无关的。

就拿你的int64_t的加法来说吧,这在硬件上被映射为2条32-bit的IADD指令,
最终的吞吐率是80条/cycle/smx的。(32位整数加法的一半)。

而很多直接被支持的操作,例如SFU的float的__sinf操作,却可能只有32条/cycle/smx。

因此您可以看到,是否被直接支持,和实际得到的吞吐率无关的。

请您知晓这点。

感谢您的深夜来访。
使用道具 举报 回复 支持 反对
发新帖
您需要登录后才可以回帖 登录 | 立即注册