找回密码
 注册账户
查看: 288|回复: 0

NVIDIA发布CUDA 3.2正式版

[复制链接]
admin 发表于 2011-12-19 10:13:36 | 显示全部楼层 |阅读模式
在9月份推出CUDA Toolkit 3.2 RC发布候选版进行测试后,NVIDIA今天发布了最终正式版本的CUDA 3.2工具包。新版本在性能上有了明显的提升,同时扩展了函数库,改进了集群管理特性,当然还包括对新硬件的支持。

CUDA Toolkit 3.2新特性包括:

扩充和改进CUDA函数库:

1. CUBLAS在Fermi架构下的矩阵乘法和置换性能提升50%到300%

2. CUFFT在Fermi架构下基数3、5、7的转换性能相比MKL加速2到10倍。

3. 新增CUSPARSE GPU加速稀疏矩阵函数库,性能比MKL快5到30倍。

4. 新增CURAND GPU加速随机数生成函数库,比MKL快10到20倍。

5. 加入H.264编解码库。

CUDA驱动和CUDA C改进:

- 支持6GB显存Quadro或Tesla卡。

- 在Windows平台工作站上支持Tesla开启Tesla Compute Cluster (TCC) 集群模式。

开发工具改进:

- CUDA-gdb和Parallel Nsight支持多GPU Debug。

- cuda-memcheck支持扩展至所有Fermi架构GPU。

- NVCC支持64bit Linux下的Intel C Compiler (ICC) v11.1

- 支持在4GB以上内存系统上进行GPU Debug。

其他:

- 支持在CUDA C核心使用malloc()/free()进行内存管理。

- NVIDIA System Management Interface (nvidia-smi)支持汇报GPU使用率以及多个GPU性能计数器。

新增多个CUDA GPU运算SDK程序样例。

CUDA Toolkit 3.2正式版下载:

http://developer.nvidia.com/object/cuda_3_2_downloads.html
您需要登录后才可以回帖 登录 | 注册账户

本版积分规则

存档|黑屋|手机|网络实验室 本站服务器由美国合租以及IDCLayer国际数据提供!!!

GMT+8, 2026-6-19 20:23 , Processed in 0.008661 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表