Vezető: Csébfalvi Balázs
A nagyteljesÃtményű számÃtások (High Performance Computing, HPC) ipari alkalmazása során olyan feladatokat kell megoldani, ahol nem csupán a bemeneti adathalmaz óriási, hanem a szükséges számÃtások nagyságrendekkel az CPU által megoldható felett vannak, sÅ‘t az eredményhalmaz tárolása, valamint az eredmények értelmezése is komoly kihÃvást jelent. Az adatmennyiség tárolása és elfogadható idÅ‘n belüli feldolgozása párhuzamos architektúrákon lehetséges. Az adatok értelmezéséhez pedig grafikus, adatvizualizációs eljárásokat szükséges alkalmazni.
Napjainkban a PC-k, játék konzolok magukkal hozták a grafikus processzorok (GPU) szédÃtÅ‘ fejlÅ‘dését. Ezek a grafikus processzorok nem csak grafikai feladatok, hanem általános célú számÃtási feladatok elvégzésére is alkalmasak. Egy új trend a HPC-ben, hogy a GPU-kban rejlÅ‘ hatalmas számÃtási kapacitást úgy aknázzák ki, hogy a videokártyákat lényegében matematikai koprocesszornak használják. A kereskedelmi forgalomban kapható személyi számÃtógép (PC) alkatrészekbÅ‘l, és a pillanatnyilag kÃnált grafikus kártya csúcs modellekbÅ‘l már egyetlen PC és 4 videókártya felhasználásával készÃthetÅ‘ több terafloppos – a magyarországon fellelhetÅ‘ legnagyobb szuperszámÃtógép teljesÃtményét is meghaladó – számÃtási kapacitású rendszer, mégpedig más megoldások árának töredékéért.
A CPU-t és GPU-t együttesen használó gépek önállóan vagy hálózatba kötve kitűnÅ‘ ár/teljesÃtmény viszonyuknak köszönhetÅ‘en új piaci szegmensek számára teszik megfizethetÅ‘vé a nagyobb számÃtási feladatok elvégzését. Ez hozzájárulhat versenyképességük növekedéséhez, piaci térhódÃtásukhoz. A technológia elterjedését gátolja, hogy az új felépÃtésű hardver nem Neumann architektúrájú, Ãgy elÅ‘nyeinek kihasználásához új algoritmusokra és új szemléletű szoftverfejlesztési módszerekre van szükség.
Ezt az elvet követve új adatvizualizációs algoritmusokat dolgozunk ki a GPU architektúra elvárásainak megfelelően.
A GPU implementáció szűk keresztmetszete általában a limitált textúramemória. A folytonos jelenségek diszkrét közelÃtéséhez ezért célszerű olyan mintavételezÅ‘ rácsot alkalmazni, amely egységnyi térfogatból a legkevesebb mintát veszi ahhoz, hogy egy sávkorlátozott jelet a diszkrét mintákból tökéletesen rekonstruálni lehessen. Ilyen értelemben a tércentrált kockarács (body-centered cubic lattice – BCC rács) egy optimális mintavételezÅ‘ rács. BCC rácson közel 30%-kal kevesebb mintát kell venni, mint egy vele ekvivalens, hagyományos kockarácson (Cartesian cubic lattice – CC rács). A BCC rácson mintavételezett térfogati adatok egyrészt kevesebb memóriát foglalnak, másrészt egy adott voxel (volume element – térfogati elem) környezetét képesek izotrópikusabban, azaz kevésbé irányfüggÅ‘en reprezentálni, mint a hagyományos CC rácson vett minták. A BCC rács ugyanakkor a CC ráccsal ellentétben nem szeparálható alacsonyabb dimenziókra, ezért a folytonos rekonstrukciós szűrést nehezebben lehet rajta implementálni. Mivel a modern GPU-k hardvertámogatást adnak a hagyományos trilineáris mintavételezéshez, ezért célszerű megvizsgálni, hogy a BCC rácsra kidolgozott nem szeparálható rekonstrukciós szűrÅ‘k kiértékelését miként lehet trilineáris mintavételezésre visszavezetni.
A kutatóegyetemi projektből erre a témára jutó támogatás: 500 eFt K+F és 457 eFt hallgatói támogatás.