Nvidia CUDA i AMD Stream - możliwości i zaastosowania.pdf

(6332 KB) Pobierz
212212619 UNPDF
TECHNOLOGIE
Nvidia CUDA i AMD Stream – możliwości i zastosowania
DVD 8/2009
Grupa: UZUPEŁNIENIA
Artykuł archiwalny „Bliżej rzeczywi-
stości”, PC Format 12/2006
Artykuł archiwalny „Realistyczna
grafi ka 3D”, PC Format 4/2007
Zamiast procesora
Karty z technologiami
CUDA lub AMD Stream
KORZYSTAJĄ Z TECHNOLOGII CUDA
Gainward SilentFX GeForce
9400 GT – 190 zł
Palit GeForce 9800 GT – 410 zł
Asus GeForce GTS 250 – 560 zł
Gigabyte GeForce GTX 260
(Core216) – 780 zł
Palit GeForce GTX 275 – 960 zł
KORZYSTAJĄ Z TECHNOLOGII
AMD STREAM
Asus Radeon 3450 – 140 zł
Gainward Radeon 3850 – 230 zł
Gigabyte Radeon HD 4670 – 290 zł
Sapphire Radeon HD 4770 – 460 zł
HIS Radeon HD 4890 – 1040 zł
Technologie Nvidia CUDA i AMD Stream umożliwiają wykonywanie obliczeń
naukowo-inżynierskich oraz przetwarzanie strumienia wideo przy użyciu ogromnej
mocy obliczeniowej karty graficznej, a nie procesora. Powstało już kilkadziesiąt
aplikacji – także do domowego użytku – które potrafią to wykorzystać.
jednostki vertex shader 105 > 02
i pixel shader 105 > 03 – w jedną
fazę obliczeniową.
W wyniku opisanych zdarzeń
Nvidia opracowała układ grafi czny
GeForce 8800 GTX (nazwa kodowa
G80) z nową architekturą CUDA,
w której znalazły się ujednolicone,
uniwersalne shadery, pełniące rolę
vertex lub pixel shaderów w zależ-
ności od potrzeb. Właśnie z myślą
o efektywnym wykorzystaniu ta-
kiej architektury zostały stworzone
biblioteki DX 10. Również w kon-
strukcjach fi rmy ATI, począwszy od
procesora grafi cznego R600, wyko-
rzystanego w kartach Radeon HD
2000/3000, są stosowane zunifi ko-
wane shadery.
Profesjonalne CUDA
Aby móc wykorzystać moc obli-
czeniową shaderów (GeForce 8800
GTX ma ich 128) do obliczeń na-
ukowo-inżynierskich, programiści
Nvidii przygotowali odpowiednie
Zarówno Nvidia CUDA (Compu-
te Unifi ed Device Architecture),
jak i AMD Stream to połączenie
rozwiązań sprzętowych, czyli kart
grafi cznych, środowiska programi-
stycznego i stworzonych w nim apli-
kacji. Obie technologie umożliwiają
przeprowadzenie tego samego typu
obliczeń przy wykorzystaniu akce-
leratorów grafi cznych zamiast pro-
cesora. CUDA jest jednak bardziej
znana, a liczba wykorzystujących ją
programów – znacznie większa niż
tych do AMD Stream. Są to apli-
kacje do obróbki i montażu wideo,
a także specjalistyczne programy
np. do oceny ryzyka biznesowego
czy stosowane w tomografi i kompu-
terowej do generowania obrazu 3D
ze zdjęć rentgenowskich.
Maszyny wykorzystujące te tech-
nologie mają znacznie większą wy-
dajność niż komputer korzystający
z samego procesora. Przykładowo
CUDA przyspiesza obliczenia od
18 razy przy kodowaniu wideo do
nawet 149 razy podczas prowadze-
nia symulacji fi nansowych.
Skąd ten pomysł
Współczesne karty grafi czne mają
kilkaset programowalnych proce-
sorów, tzw. shaderów. Procesory
te są przystosowane do przetwa-
rzania strumieniowego, czyli wy-
konywania od kilku do kilkuna-
stu prostych operacji na ogromnej,
stale dostarczanej ilości danych.
Dzięki temu karty grafi czne mają
dużą moc obliczeniową, którą nie
tak dawno zapewniały wyłącznie
superkomputery.
Dla przykładu kość grafi czna i ba-
zujące na niej karty Nvidia GeForce
GTX 280 dysponują mocą oblicze-
niową rzędu 933 gigafl opów (0,933
terafl opa), co oznacza, że urządze-
nie potrafi wykonać 933 miliardów
operacji zmiennoprzecinkowych na
sekundę. Tymczasem moc oblicze-
niowa czterordzeniowego procesora
Intel Core i7 965 XE wynosi tyl-
ko 70 gigafl opów, a więc ponad 13
razy mniej. Ze względu na sposób
działania kart i procesorów tych
wartości nie można porównywać
wprost – trzeba najpierw podzielić
moc karty grafi cznej przez 5. Ale na-
wet wtedy moc karty jest ogromna
– blisko 190 gigafl opów – i znacznie
wyższa niż dla centralnego proce-
sora. Tę moc obliczeniową można
wykorzystać do innych celów niż
tylko generowanie grafi ki i ta idea
przyczyniła się do powstania opi-
sywanych tu technologii.
Stymulującą rolę w tworzeniu
CUDA odegrały fi rmy BionicFX
i Microsoft. Pierwsza opracowała
technologię, pozwalającą zamie-
niać cyfrowe dane audio na specjal-
nie spreparowane informacje, które
mogły być następnie przetwarzane
przez kartę grafi czną. Z kolei Micro-
soft w swoich bibliotekach DirectX 10
105 > 01 (wykorzystywanych głów-
nie w grach) połączył wszystkie ope-
racje przetwarzania kształtu i ruchu
obiektów oraz wyglądu pikseli – re-
alizowane dotąd przez oddzielne
bez technologii
CUDA
z włączoną
technologią CUDA
sora. Tę moc obliczeniową można
wykorzystać do innych celów niż
tylko generowanie grafi ki i ta idea
przyczyniła się do powstania opi-
Stymulującą rolę w tworzeniu
CUDA odegrały fi rmy BionicFX
i Microsoft. Pierwsza opracowała
technologię, pozwalającą zamie-
niać cyfrowe dane audio na specjal-
nie spreparowane informacje, które
mogły być następnie przetwarzane
przez kartę grafi czną. Z kolei Micro-
DirectX 10
(wykorzystywanych głów-
nie w grach) połączył wszystkie ope-
Zastosowanie programu do obróbki i montażu wideo ArcSoft SimHD i kart gra-
ficznych z architekturą CUDA lub AMD Stream pozwala uzyskać obraz o znacznie
lepszej jakości – ostrzejszy, o bardziej nasyconych kolorach.
Naukowcy wykorzystują Nvidia CUDA
do symulowania i wizualizacji procesów
biomolekularnych.
106 PC Format 8/2009
212212619.220.png 212212619.231.png 212212619.242.png 212212619.253.png 212212619.001.png 212212619.012.png 212212619.023.png 212212619.034.png 212212619.045.png 212212619.056.png 212212619.067.png 212212619.078.png
Nvidia CUDA i AMD Stream – możliwości i zastosowania
TECHNOLOGIE
biblioteki, sterowniki, interfejs pro-
gramowania aplikacji API 105 > 04
oraz środowisko programistyczne C,
umożliwiające pisanie aplikacji na
karty grafi czne. Jednocześnie opra-
cowali specjalny akcelerator oblicze-
niowy, bazujący na układzie G80,
o nazwie Tesla (T8P).
Obecnie dostępne są karty i ser-
wery obliczeniowe Tesla, bazujące
na układach grafi cznych Nvidia Ge-
Force GTX 280 (GT200), które nale-
żą do drugiej generacji procesorów
grafi cznych zgodnych z architekturą
CUDA. Podobnie jak GT200, tak
i zmodyfi kowany układ Tesla T10P,
ma do dyspozycji 240 programowal-
nych shaderów.
Po zainstalowaniu rozwiązania
Tesla pecet zmienia się w superkom-
puter. Teslę wykorzystuje do różnych
obliczeń ponad 50 uczelni, np. MIT
w USA, Politechnika Gdańska. Na
wielu uczelniach opracowywane są,
korzystające z technologii CUDA,
programy, wtyczki i procedury do
używanych przez naukowców, eko-
nomistów czy inżynierów aplikacji
do wysokowydajnych obliczeń. Ob-
liczenia takie obejmują m.in. fi zy-
kę jądrową, astrofi zykę, konstrukcje
silników, projekty wieżowców, mo-
stów, kodowanie wideo, symulacje
pogodowe i obliczenia związane
z zarządzaniem ryzykiem.
Co może domowy GeForce
Oczywiście do domu nikt nie kupi
sobie akceleratora Tesla, zwłaszcza
że kosztuje on ponad 1600 dolarów.
Jednak w wielu zwykłych pecetach
drzemie zaklęta w GeForce’y z se-
rii 8000, 9000 i GTX 200 ogromna
moc obliczeniowa. Pierwszym pro-
gramem dla domowych użytkow-
ników, wykorzystującym technolo-
gię CUDA, był Badaboom Media
Converter. Pozwala on na edycję,
montaż i konwersję materiałów wi-
deo w rozdzielczości HD 105 > 05 .
Przy wykorzystaniu technologii
CUDA operacje te prowadzone są
o ponad 60 proc. szybciej niż za
pomocą samego procesora.
Programów do edycji i konwersji
wideo, wspierających technologię
CUDA, jest znacznie więcej. Służą
nie tylko do przetwarzania mate-
riałów wideo w rozdzielczości HD,
konwertowania ich przed publikacją
w serwisach typu YouTube. Wielu
użytkowników chce też poprawić
jakość materiałów wideo nakrę-
conych komórką. Przyspieszenie
Przepływ danych w architekturze CUDA
Aby karta grafi ki wykorzystująca CUDA
mogła wykonać obliczenia niezwiązane
z generowaniem grafi ki, najpierw dane,
które mają być przetwarzane, kopiowane
są z głównej pamięci RAM do pamięci
procesora grafi cznego 1 . Gdy proce-
sor centralny poleci przetworzyć dane
2 , poszczególne rdzenie procesora
grafi cznego (shadery) równolegle wy-
konują obliczenia 3 . Wynik zapisywany
w pamięci procesora grafi cznego jest
natychmiast kopiowany do pamięci
RAM 4 . Taka organizacja przepływu
i wymiany danych między CPU a GPU
jest obecnie jedyną metodą wykorzy-
stania mocy obliczeniowej karty gra-
fi cznej. W przyszłości procesor i układ
grafi czny będą się ze sobą komunikować
bezpośrednio (np. w kartach AMD/ATI
przewidziano zastosowanie magistrali
HyperTransport), co jeszcze bardziej
usprawni obliczenia.
operacji związanych z szeroko po-
jętą obróbką wideo o 20–150 proc.
(na tyle pozwala moc obliczeniowa
karty) jest nie do pogardzenia. Przy
okazji można poprawić jakość takich
materiałów, wykorzystując wbudo-
wane w kartę grafi czną mechanizmy
przetwarzania obrazu wideo.
AMD Stream się rozwija
Technologia AMD Stream jest do-
stępna w kartach Radeon HD z serii
3800 i 4800 oraz na karcie AMD
FireStream 9270. Ta ostatnia jest
odpowiednikiem akceleratora Tesla
C1060. Jej moc obliczeniowa wynosi
1,2 terafl opa, a więc więcej niż dla
karty Nvidii o mocy 1 terafl opa.
Choć programów wspierają-
cych AMD Stream jest mniej niż
dla CUDA, sytuacja się stale popra-
wia. Domowi użytkownicy mogą
skorzystać z kilku programów wi-
deo. Osoby zajmujące się obróbką
zdjęć, fi lmów i tworzeniem materia-
łów w technologii fl ash zainteresuje
to, że niektóre aplikacje fi rmy Adobe
też korzystać z AMD Stream.
Dostępne na stronach ATI/AMD
1 demo Froblins pokazuje możliwe
efekty zastosowania AMD Stream
w grach. Froblins działa na kompu-
terach z kartą z serii Radeon HD
3000/4000 i wykorzystuje procesor
grafi czny nie tylko do generowania
scen 3D. Również obliczenia zwią-
zane ze sztuczną inteligencją tysięcy
występujących tam stworków – ich
reakcją na działania innych postaci
– są wykonywane jednocześnie przy
użyciu AMD Stream.
Nvidia CUDA meteorologom służy do szybkiego ana-
lizowania danych o warunkach pogodowych z całego
świata i prognozowania pogody, a projektantom
mody pomaga symulować w czasie rzeczywistym
wygląd ubioru wykonanego z danego materiału.
Adresy internetowe
1 http://ati.amd.com/technology/stre-
amcomputing/consumer-gaming.html
Oceń lub skomentuj na
www.pcformat.pl/ocena
Przykładowe programy wykorzystujące technologie CUDA oraz AMD Stream
WYKORZYSTUJĄ CUDA
vReveal fi rmy MotionDSP
– obróbka i montaż wideo
ArcSoft SimHD
– obróbka i montaż wideo
Ikena – rekonstrukcja detali
w materiałach wideo złej jakości
Cyberlink PowerDirector 7
– obróbka i montaż wideo
Loilo Scope Mars
– obróbka i montaż wideo
Nero MoveIt
– obróbka i montaż wideo
Nurien – gra społecznościowa
Manifold System GIS Internet
Map Server for web applications
zdjęć rentgenowskich m.in. na potrzeby
tomografi i komputerowej
SciFinance
– ocena ryzyka biznesowego inwestycji
giełdowych i fi nansowych
WIPRO
– platforma do zarządzania biznesem
Adobe Flash 10 – tworzenie
prezentacji i programów Flash
CyberLink PowerDirector 7
– obróbka i montaż wideo (na ekranie)
Cyberlink MediaShow Espresso
– odtwarzanie, konwersja i prosta
obróbka wideo
– tworzenie interaktywnych map do
publikacji w internecie (na ekranie)
High-Performance Distributed
Password Recovery fi rmy Elcomsoft
– łamanie zabezpieczeń kryptografi cz-
nych i haseł
North Star Imaging
– tworzenie obrazów 3D na podstawie
WSPIERAJĄ AMD STREAM
ATI Avivo Video Converter
– konwersja formatów wideo
ArcSoft TotalMedia Theater
– obróbka i montaż wideo
Adobe After Effects CS4
– obróbka i montaż wideo
Photoshop CS4 – obróbka zdjęć
PC Format 8/2009
107
212212619.089.png 212212619.100.png 212212619.111.png 212212619.122.png 212212619.133.png 212212619.144.png 212212619.155.png 212212619.166.png 212212619.177.png 212212619.187.png 212212619.188.png 212212619.189.png 212212619.190.png 212212619.191.png 212212619.192.png 212212619.193.png 212212619.194.png 212212619.195.png 212212619.196.png 212212619.197.png 212212619.198.png 212212619.199.png 212212619.200.png 212212619.201.png 212212619.202.png 212212619.203.png 212212619.204.png 212212619.205.png 212212619.206.png 212212619.207.png 212212619.208.png 212212619.209.png 212212619.210.png 212212619.211.png 212212619.212.png 212212619.213.png 212212619.214.png 212212619.215.png 212212619.216.png 212212619.217.png 212212619.218.png 212212619.219.png 212212619.221.png 212212619.222.png 212212619.223.png 212212619.224.png 212212619.225.png 212212619.226.png 212212619.227.png 212212619.228.png 212212619.229.png 212212619.230.png 212212619.232.png 212212619.233.png 212212619.234.png 212212619.235.png 212212619.236.png 212212619.237.png 212212619.238.png 212212619.239.png 212212619.240.png 212212619.241.png 212212619.243.png 212212619.244.png 212212619.245.png 212212619.246.png 212212619.247.png 212212619.248.png 212212619.249.png 212212619.250.png 212212619.251.png 212212619.252.png 212212619.254.png 212212619.255.png 212212619.256.png 212212619.257.png 212212619.258.png 212212619.259.png 212212619.260.png 212212619.261.png 212212619.262.png 212212619.263.png 212212619.002.png 212212619.003.png 212212619.004.png 212212619.005.png 212212619.006.png 212212619.007.png 212212619.008.png 212212619.009.png 212212619.010.png 212212619.011.png 212212619.013.png 212212619.014.png 212212619.015.png 212212619.016.png 212212619.017.png 212212619.018.png 212212619.019.png 212212619.020.png 212212619.021.png 212212619.022.png 212212619.024.png 212212619.025.png 212212619.026.png 212212619.027.png 212212619.028.png 212212619.029.png 212212619.030.png 212212619.031.png 212212619.032.png 212212619.033.png 212212619.035.png 212212619.036.png 212212619.037.png 212212619.038.png 212212619.039.png 212212619.040.png 212212619.041.png 212212619.042.png 212212619.043.png 212212619.044.png 212212619.046.png 212212619.047.png 212212619.048.png 212212619.049.png 212212619.050.png 212212619.051.png 212212619.052.png 212212619.053.png 212212619.054.png 212212619.055.png 212212619.057.png 212212619.058.png 212212619.059.png 212212619.060.png 212212619.061.png 212212619.062.png 212212619.063.png 212212619.064.png 212212619.065.png 212212619.066.png 212212619.068.png 212212619.069.png 212212619.070.png 212212619.071.png 212212619.072.png 212212619.073.png 212212619.074.png 212212619.075.png 212212619.076.png 212212619.077.png 212212619.079.png 212212619.080.png 212212619.081.png 212212619.082.png 212212619.083.png 212212619.084.png 212212619.085.png 212212619.086.png 212212619.087.png 212212619.088.png 212212619.090.png 212212619.091.png 212212619.092.png 212212619.093.png 212212619.094.png 212212619.095.png 212212619.096.png 212212619.097.png 212212619.098.png 212212619.099.png 212212619.101.png 212212619.102.png 212212619.103.png 212212619.104.png 212212619.105.png 212212619.106.png 212212619.107.png 212212619.108.png 212212619.109.png 212212619.110.png 212212619.112.png 212212619.113.png 212212619.114.png 212212619.115.png 212212619.116.png 212212619.117.png 212212619.118.png 212212619.119.png 212212619.120.png 212212619.121.png 212212619.123.png 212212619.124.png 212212619.125.png 212212619.126.png 212212619.127.png 212212619.128.png 212212619.129.png 212212619.130.png 212212619.131.png 212212619.132.png 212212619.134.png 212212619.135.png 212212619.136.png 212212619.137.png 212212619.138.png 212212619.139.png 212212619.140.png 212212619.141.png 212212619.142.png 212212619.143.png 212212619.145.png 212212619.146.png 212212619.147.png 212212619.148.png 212212619.149.png 212212619.150.png 212212619.151.png 212212619.152.png 212212619.153.png 212212619.154.png 212212619.156.png 212212619.157.png 212212619.158.png 212212619.159.png 212212619.160.png 212212619.161.png 212212619.162.png 212212619.163.png 212212619.164.png 212212619.165.png 212212619.167.png 212212619.168.png 212212619.169.png 212212619.170.png 212212619.171.png 212212619.172.png 212212619.173.png 212212619.174.png 212212619.175.png 212212619.176.png 212212619.178.png 212212619.179.png 212212619.180.png 212212619.181.png 212212619.182.png 212212619.183.png 212212619.184.png 212212619.185.png 212212619.186.png
Zgłoś jeśli naruszono regulamin