Dojo2 – avagy az önvezetés mögötti szerkezet


Valódi mesterséges intelligencia megoldásokhoz, az autonóm vezetéstől a humanoid robotikáig elképesztő számítási kapacitás szükséges. Ennek a kihívásnak a teljesítéséhez a Tesla nemcsak saját, egyedi AI-tréninghardvert fejleszt, hanem a nyílt piacon is vásárol nagy teljesítményű eszközöket.

Most pedig beszámolók szerint a Dojo 2 következő generációs chip tömeggyártásba került a világ legnagyobb félvezetőgyártó vállalatánál, a TSMC-nél. Bár sokan ezt csupán „mellékküldetésnek” tekintik, a Tesla számítási kapacitásának bővítése elengedhetetlen az exascale szintű szuperszámítástechnika1 eléréséhez, amely alapvető fontosságú a vállalat mesterséges intelligencia törekvéseihez.

Elon Musk úgy fogalmazott, hogy a Dojo 2 „egy jó számítógép”, majd hozzátett egy klasszikus teljesítmény-poént: „A Dojo 2 tényleg képes futtatni a Crysist… akár milliárd képkocka/másodperc sebességgel.”


Exascale MI: FSD, Optimus és még sok más

Bár a Tesla eddig is hatékonyan használta a piacról elérhető, erőteljes GPU-kat modellek tanítására, a Dojo szuperszámítógép egy teljesen újratervezett, célorientált megoldás, amelyet egyetlen célra fejlesztettek: hatalmas mennyiségű videóadat gyors és hatékony feldolgozására neurális hálózatok tanításához. A Dojo 2 chip maga az a kulcselem, amely ezt a lehetőséget megnyitja.

A Dojo 2 az FSD (Full Self-Driving) látásalapú neurális hálózatának tanítását végzi, lehetővé téve a Tesla számára, hogy a világméretű flottájából származó videókat még gyorsabban dolgozza fel. Az FSD fejlesztésének egyik legnagyobb kihívása a ritka, úgynevezett edge case-ek (szélsőséges forgalmi helyzetek) felismerése és megtanítása.

Sokszor több százezer kilométernyi adat elemzése szükséges, hogy egy ilyen eset előforduljon és taníthatóvá váljon – ezek elemzése, címkézése és feldolgozása a Dojo 2 elsődleges feladata.

Ez a folyamat hatalmas számítási kapacitást és tréningidőt igényel – de elengedhetetlen az FSD folyamatos fejlődéséhez.

Természetesen ez túlmutat az autókon: a Tesla humanoid robotja, Optimus szintén az FSD rendszerére épül, hogy tájékozódni tudjon és interakcióba lépjen a fizikai világgal.

Bár az Optimus sajátos FSD-verziót futtat, alapjaiban ugyanazt a technológiát alkalmazza: a látásalapú neurális hálózatok elemzik a környezetet, és háromdimenziós térképet építenek – akár autóban, akár robotban.


Egyedi megközelítés az MI-hardver terén

A Dojo 2 ereje nem pusztán a nyers számítási teljesítményéből fakad, hanem olyan architekturális döntések sorából, amelyek kifejezetten az FSD tanítására optimalizálták, és élesen megkülönböztetik a piacon elérhető általános vagy AI-specifikus hardverektől.

A Tesla ehhez TSMC új InFO-SoW (Integrated Fan-Out with Silicon-on-Wafer) tokozási technológiáját használja. Az ilyen nagyszabású MI-munkafolyamatokban a hőleadás és a chipek közötti adatmozgás sebessége a szűk keresztmetszet.

Ez az új tokozási eljárás lehetővé teszi, hogy a feldolgozó lapkák között közvetlen, nagy sávszélességű kapcsolatok jöjjenek létre – ez csökkenti a késleltetést és jelentősen javítják a hőelvezetést, ami kulcsfontosságú a sűrű, nagy teljesítményű csomópontok/klaszterek kialakításához.

A Dojo 2 nem általános célú chip, hanem egyedi utasításkészlettel rendelkezik, amelyet kifejezetten az FSD tréningfolyamatok matematikai műveleteire – például mátrixszorzásra és szisztolikus tömbökre2 – optimalizáltak, amelyek az FSD látásalapú ideghálózatainak alapját adják.

Mivel a Tesla saját hardvert épít, saját szoftverét és fordítóit közvetlenül integrálhatja a szilíciumba, elkerülve azokat a teljesítményveszteségeket, amelyek külső megoldások, például az Nvidia CUDA használata során jelentkezhetnek.


Egyesek szerint mellékszál, valójában versenyelőny

Sokan még mindig úgy gondolják, hogy a Dojo 2 „csak” egy külön projekt a Teslánál, pedig valójában ez az egyik kulcsa annak, hogy a vállalat mesterséges intelligencia-alapú technológiái valódi versenyelőnyt szerezzenek a piacon – szemben azokkal, akik kizárólag polcról levehető hardverekre támaszkodnak.

A Tesla számára elengedhetetlen a további befektetés az egyedi MI-hardverbe, ha valóban tartani akarja az FSD fejlesztési ütemét – különösen most, amikor az előrehaladás tempója az utóbbi hónapokban kissé megtorpant.

  1. Az exascale szintű szuperszámítástechnika olyan számítógépes rendszerekre utal, amelyek teljesítménye eléri vagy meghaladja az egy exaflops (1 exaFLOPS, azaz ) lebegőpontos művelet/másodperc teljesítményt. Ez a szint olyan hatalmas számítási sebességet jelent, amely egyetlen másodperc alatt egymilliárdszor milliárd művelet elvégzését teszi lehetővé ↩︎
  2. A szisztolikus tömbök (angolul: systolic arrays) speciális architektúrájú, párhuzamos feldolgozásra tervezett processzorrendszerek. Ezek olyan tömbszerűen elrendezett processzoregységek (cellák), amelyek adatokat és rész-eredményeket továbbítanak egymás között szigorúan meghatározott, ritmikus „lépésekben”. A „szisztolikus” kifejezés is erre az ütemes adatmozgatásra utal, hasonlóan a szív pumpáló mozgásához ↩︎

Forrás:
Tesla’s Dojo 2 Supercomputer Chip Enters Mass Production

Számítógépes Látórendszerek – Szemenyei Márton – BME

ComputerTrends

Épül az EU legújabb szuperszámítógépe

Previous Article

Európa: Átvihető FSD?

Írj hozzászólást

Leave a Comment