Valódi mesterséges intelligencia megoldásokhoz, az autonóm vezetéstől a humanoid robotikáig elképesztő számítási kapacitás szükséges. Ennek a kihívásnak a teljesítéséhez a Tesla nemcsak saját, egyedi AI-tréninghardvert fejleszt, hanem a nyílt piacon is vásárol nagy teljesítményű eszközöket.
Most pedig beszámolók szerint a Dojo 2 következő generációs chip tömeggyártásba került a világ legnagyobb félvezetőgyártó vállalatánál, a TSMC-nél. Bár sokan ezt csupán „mellékküldetésnek” tekintik, a Tesla számítási kapacitásának bővítése elengedhetetlen az exascale szintű szuperszámítástechnika1 eléréséhez, amely alapvető fontosságú a vállalat mesterséges intelligencia törekvéseihez.
Elon Musk úgy fogalmazott, hogy a Dojo 2 „egy jó számítógép”, majd hozzátett egy klasszikus teljesítmény-poént: „A Dojo 2 tényleg képes futtatni a Crysist… akár milliárd képkocka/másodperc sebességgel.”
Exascale MI: FSD, Optimus és még sok más
Bár a Tesla eddig is hatékonyan használta a piacról elérhető, erőteljes GPU-kat modellek tanítására, a Dojo szuperszámítógép egy teljesen újratervezett, célorientált megoldás, amelyet egyetlen célra fejlesztettek: hatalmas mennyiségű videóadat gyors és hatékony feldolgozására neurális hálózatok tanításához. A Dojo 2 chip maga az a kulcselem, amely ezt a lehetőséget megnyitja.
A Dojo 2 az FSD (Full Self-Driving) látásalapú neurális hálózatának tanítását végzi, lehetővé téve a Tesla számára, hogy a világméretű flottájából származó videókat még gyorsabban dolgozza fel. Az FSD fejlesztésének egyik legnagyobb kihívása a ritka, úgynevezett edge case-ek (szélsőséges forgalmi helyzetek) felismerése és megtanítása.
Sokszor több százezer kilométernyi adat elemzése szükséges, hogy egy ilyen eset előforduljon és taníthatóvá váljon – ezek elemzése, címkézése és feldolgozása a Dojo 2 elsődleges feladata.
Ez a folyamat hatalmas számítási kapacitást és tréningidőt igényel – de elengedhetetlen az FSD folyamatos fejlődéséhez.
Természetesen ez túlmutat az autókon: a Tesla humanoid robotja, Optimus szintén az FSD rendszerére épül, hogy tájékozódni tudjon és interakcióba lépjen a fizikai világgal.
Bár az Optimus sajátos FSD-verziót futtat, alapjaiban ugyanazt a technológiát alkalmazza: a látásalapú neurális hálózatok elemzik a környezetet, és háromdimenziós térképet építenek – akár autóban, akár robotban.
Egyedi megközelítés az MI-hardver terén
A Dojo 2 ereje nem pusztán a nyers számítási teljesítményéből fakad, hanem olyan architekturális döntések sorából, amelyek kifejezetten az FSD tanítására optimalizálták, és élesen megkülönböztetik a piacon elérhető általános vagy AI-specifikus hardverektől.
A Tesla ehhez TSMC új InFO-SoW (Integrated Fan-Out with Silicon-on-Wafer) tokozási technológiáját használja. Az ilyen nagyszabású MI-munkafolyamatokban a hőleadás és a chipek közötti adatmozgás sebessége a szűk keresztmetszet.
Ez az új tokozási eljárás lehetővé teszi, hogy a feldolgozó lapkák között közvetlen, nagy sávszélességű kapcsolatok jöjjenek létre – ez csökkenti a késleltetést és jelentősen javítják a hőelvezetést, ami kulcsfontosságú a sűrű, nagy teljesítményű csomópontok/klaszterek kialakításához.
A Dojo 2 nem általános célú chip, hanem egyedi utasításkészlettel rendelkezik, amelyet kifejezetten az FSD tréningfolyamatok matematikai műveleteire – például mátrixszorzásra és szisztolikus tömbökre2 – optimalizáltak, amelyek az FSD látásalapú ideghálózatainak alapját adják.
Mivel a Tesla saját hardvert épít, saját szoftverét és fordítóit közvetlenül integrálhatja a szilíciumba, elkerülve azokat a teljesítményveszteségeket, amelyek külső megoldások, például az Nvidia CUDA használata során jelentkezhetnek.
Egyesek szerint mellékszál, valójában versenyelőny
Sokan még mindig úgy gondolják, hogy a Dojo 2 „csak” egy külön projekt a Teslánál, pedig valójában ez az egyik kulcsa annak, hogy a vállalat mesterséges intelligencia-alapú technológiái valódi versenyelőnyt szerezzenek a piacon – szemben azokkal, akik kizárólag polcról levehető hardverekre támaszkodnak.
A Tesla számára elengedhetetlen a további befektetés az egyedi MI-hardverbe, ha valóban tartani akarja az FSD fejlesztési ütemét – különösen most, amikor az előrehaladás tempója az utóbbi hónapokban kissé megtorpant.
- Az exascale szintű szuperszámítástechnika olyan számítógépes rendszerekre utal, amelyek teljesítménye eléri vagy meghaladja az egy exaflops (1 exaFLOPS, azaz ) lebegőpontos művelet/másodperc teljesítményt. Ez a szint olyan hatalmas számítási sebességet jelent, amely egyetlen másodperc alatt egymilliárdszor milliárd művelet elvégzését teszi lehetővé ↩︎
- A szisztolikus tömbök (angolul: systolic arrays) speciális architektúrájú, párhuzamos feldolgozásra tervezett processzorrendszerek. Ezek olyan tömbszerűen elrendezett processzoregységek (cellák), amelyek adatokat és rész-eredményeket továbbítanak egymás között szigorúan meghatározott, ritmikus „lépésekben”. A „szisztolikus” kifejezés is erre az ütemes adatmozgatásra utal, hasonlóan a szív pumpáló mozgásához ↩︎
Forrás:
Tesla’s Dojo 2 Supercomputer Chip Enters Mass Production
Számítógépes Látórendszerek – Szemenyei Márton – BME
Épül az EU legújabb szuperszámítógépe