用户
 找回密码
 立即注册
发表于 2010-1-25 10:10:03
7981567
本次活动已经截止,获奖名单如下:

第一名:

李修宇
点评:算法经过了精心优化,可以适应不同版本的硬件。对程序进行了良好的封装,文档详细
第二名:
马兆锋
点评:在实现方面进行了不少尝试
李晨
点评:比较优化的方法实现了算法
罗家华
点评:学习时间不长就成功实现了算法
吴圣召
点评:文档较为详细
徐辰
点评:尝试了多种算法,并选出了精度较优的算法
第三名:

许文浩
邓子岚
姜惟
Posix_man
starfuck


本次奖品发放走的是快递,因此请获奖者尽快将联系方式提交到qinli@it168.com ,联系方式必须具备以下几项:

联系地址:
邮编:
联系电话:
接收人:


联系方式:
MSN:qinli815@hotmail.com
邮箱:
qinli@it168.com(提交作品唯一指定邮箱)
电话:(086)10-59857748


CUDA是用于GPU计算的开发环境,它是一个全新的软硬件架构,可以将GPU视为一个并行数据计算的设备,对所进行的计算进行分配和管理。在CUDA的架构中,这些计算不再像过去所谓的GPGPU架构那样必须将计算映射到图形API(OpenGL和Direct 3D)中,因此对于开发者来说,CUDA的开发门槛大大降低了。CUDA的GPU编程语言基于标准的C语言,因此任何有C语言基础的用户都很容易地开发CUDA的应用程序。

由于GPU的特点是处理密集型数据和并行数据计算,因此CUDA非常适合需要大规模并行计算的领域。

小竞赛日程
参赛时间:2010年1月25日-2010年3月25日
奖项公布:2010年3月30日

小竞赛对象:
所有CUDA编程爱好者皆可参加。

小竞赛奖品:
特等奖(1名):奖品为神秘高端GeForce Fermi显卡一块备注:此显卡面对高端市场,具体型号未定,预计3月上市,该奖品发放的时间以产品实际上市时间为准
优秀奖(5名):奖品为纽曼C100手机1部。
入围奖(20名):奖品为《GPU高性能运算之CUDA》图书一本

所有提交有效解题代码的网友,将获得500PUB币奖励。


小竞赛说明:
本次趣味小竞赛为命题赛,有2道题目供网友选择,网友可以任选其一进行解题。参赛者的解题代码及说明文档请发送至参赛邮箱qinli@it168.com 或直接在本贴回帖里贴出代码跟说明文档。所有参赛者须在邮件中附带自己的个人信息及联系方式,便于奖品发放。

注:严禁抄袭,包括代码和说明文档,一经发现,取消评选资格;代码类似,以发表时间为准,取最早发布或者修改时间者为优秀


CUDA编程小竞赛须采用NVIDIA C for CUDA进行编程。所需要的软件和文档可以到NVIDIA CUDA Zone上下载。网址是:http://www.nvidia.cn/object/cuda_home_cn.html

心动不如行动,还等什么呢?赶快来解题吧。


题目1.并行编程求解线性方程
定义:


条件:
假定A,B为输入,X为输出;其中需满足,A为一个尺寸为1024x1024的上三角的矩阵,B为非0目标矩阵,矩阵中的元素均为single float型;
请用并行算法编程求解上述线性方程。程序封装为可以由C++调用的lib库,并需要提供源代码和接口。

评分方法:
精度较高的解法可以获得额外加分
可以兼容不同尺寸的矩阵可以获得额外加分

题目2:
1.编写程序,测试GPU的:host到device的带宽,device到device的带宽,利用global memory传输的时候带宽,shared memory的带宽,以及local memory的性能

2.程序封装为可以由C++调用的lib库,并需要提供源代码和接口。

3.撰写实验报告,并作出结论

评分方法:
分析数据类型对性能的影响可以获得额外加分
对global memory的性能进行全面分析(尺寸,合并访问条件,数据类型)可以获得额外加分
对host-device和device-host进行多种传输模式和多种尺寸的测试与分析可以获得额外加分
对local meory和shared memory进行详尽分析可以获得额外加分

[ 本帖最后由 图腾部落 于 2010-4-7 16:39 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
使用道具 举报 回复
发表于 2010-1-25 10:21:28

回复 #1 图腾部落 的帖子

使用道具 举报 回复 支持 反对
发表于 2010-1-25 10:30:03
原帖由 yyfn风辰 于 2010-1-25 10:21 发表


赶紧答题吧
使用道具 举报 回复 支持 反对
发表于 2010-1-25 10:30:13

问题?

利用global memory传输的时候带宽?

上面这话,能否详细说明一下,是否是指读写global带宽?
使用道具 举报 回复 支持 反对
发表于 2010-1-25 10:31:40

回复 #3 图腾部落 的帖子

题目一不容易啊
使用道具 举报 回复 支持 反对
发表于 2010-1-25 10:39:55
好难啊
使用道具 举报 回复 支持 反对
发表于 2010-1-25 10:53:31
第一题有些难度:p
使用道具 举报 回复 支持 反对
发表于 2010-1-25 10:57:15

回复 #6 shuazi313 的帖子

貌似 题目2 SDK和书中有例子
使用道具 举报 回复 支持 反对
发表于 2010-1-25 11:06:40
原帖由 shuazi313 于 2010-1-25 10:39 发表
好难啊


不是很难,2个月的时间足够了,重在参与嘛
使用道具 举报 回复 支持 反对
发表于 2010-1-25 11:13:54
只可惜o不会CUDA 啊
使用道具 举报 回复 支持 反对
发新帖
您需要登录后才可以回帖 登录 | 立即注册