NVIDIA CUDA最新版是一款非常實(shí)用的顯卡驅(qū)動(dòng)程序。NVIDIA
CUDA官方版對于現(xiàn)有項(xiàng)目,第一步是評估應(yīng)用程序,以找到負(fù)責(zé)大部分執(zhí)行時(shí)間的代碼部分。NVIDIA
CUDA最新版在完成每一輪應(yīng)用程序并行化之后,開發(fā)人員可以著手優(yōu)化實(shí)現(xiàn)以提高性能。
基本簡介
NVIDIA CUDA最新版是一款由英偉達(dá)推出的顯卡驅(qū)動(dòng)程序。NVIDIA CUDA最新版涵蓋了GPU加速庫、性能分析工具、開發(fā)工具、示例代碼等功能,為編程人員提供了更好的運(yùn)行環(huán)境。NVIDIA CUDA軟件能夠幫助用戶提高gpu的運(yùn)行能力,解決復(fù)雜的計(jì)算問題。
功能介紹
1、高性能
NVIDIA CUDA最新版平臺(tái)經(jīng)過高度優(yōu)化,可在NVIDIA GPU上執(zhí)行,并且比僅限CPU的選擇速度快2至5倍。
2、特定領(lǐng)域的圖書館
高級(jí)庫支持跨域的GPU加速,包括線性代數(shù),圖像處理,深度學(xué)習(xí)和圖形分析。
3、開發(fā)一次,隨處部署
CUDA軟件平臺(tái)可跨GPU系列工作,因此您可以在任何平臺(tái)上開發(fā),而無需擔(dān)心最終的部署環(huán)境。
4、集成開發(fā)環(huán)境
IDE帶有用于調(diào)試的圖形和命令行工具,識(shí)別GPU和CPU上的性能瓶頸,并提供上下文相關(guān)的優(yōu)化指導(dǎo)。
5、語言整合
使用您已知的編程語言開發(fā)應(yīng)用程序,包括C,C ++,F(xiàn)ortran和Python。
軟件特色
NVIDIA CUDA最新版特色如下:
一、圖書館
1、使用cuBLAS中的新GEMM內(nèi)核加速高性能計(jì)算(HPC)和深度學(xué)習(xí)應(yīng)用程序。
2、通過cuFFT和NVIDIA Performance Primitives中多個(gè)GPU配置的性能優(yōu)化,可更快地執(zhí)行映像和信號(hào)處理應(yīng)用程序。
3、使用cuSOLVER和nvGRAPH中的新算法解決HPC中常見的線性和圖形分析問題。
二、合作團(tuán)體
1、使用從子貼圖到線程,塊和網(wǎng)格的線程表達(dá)豐富的并行算法。
2、使用新的API和函數(shù)原語在應(yīng)用程序內(nèi)高效地管理和重用線程。
3、在開普勒體系結(jié)構(gòu)及更高版本上用強(qiáng)大的編程模型替換warp-synchronous編程。
三、沃爾塔建筑
1、Tensor Cores比Pascal GPU執(zhí)行速度快5倍,可以更快地執(zhí)行AI應(yīng)用程序。
2、利用下一代NVLink提供前代產(chǎn)品的2倍吞吐量來擴(kuò)展多GPU應(yīng)用。
3、使用沃爾多多進(jìn)程服務(wù)(MPS)提高GPU利用率。
四、開發(fā)工具
1、通過識(shí)別在統(tǒng)一內(nèi)存中導(dǎo)致頁面錯(cuò)誤的源代碼來優(yōu)化和預(yù)取內(nèi)存訪問。
2、通過將事件添加到時(shí)間線和顏色編碼連接來高效地配置NVLink。
3、使用基于虛擬地址,遷移原因和頁面錯(cuò)誤訪問類型的新事件過濾器來檢查統(tǒng)一內(nèi)存性能瓶頸。