TehnoȘtiri

UTILIZAREA UNOR ALGORITMI PENTRU OPTIMIZAREA REACȚIILOR DE FUZIUNE NUCLEARĂ

(c) DEEPMIND

O echipă de cercetători din cadrul organizației DeepMind și a Institutului Federal Elvețian de Tehnologie din Lausanne, Elveția (EPFL), a folosit un tip de algoritm bazat pe inteligență artificială (IA), denumit învățare prin consolidare profundă (RL), pentru a controla bobinele magnetice ale unui tokamak, un reactor în formă de gogoașă, folosit pentru cercetarea fuziunii și unul dintre candidații de top pentru generarea energiei electrice prin procesul de fuziune. Tokamak-urile creează o reacție de fuziune într-o plasmă fierbinte, aflată într-un câmp magnetic puternic, iar toate procesele sunt controlate de o structură de bobine magnetice. Deși sistemul pe bază de IA a mai fost folosit în cercetarea fuziunii în domenii precum analiza ex post facto, aceasta este pentru prima dată când tehnologia este folosită pentru a controla direct un tokamak. Această primă aplicare experimentală a unui RL în controlul unui tokamak ar putea sugera că aplicarea inteligenței artificiale pentru a ajuta la obținerea unor eficiențe mai mari de fuziune ar putea fi posibilă.

„Pentru moment, ne aflăm în primele etape de testare”, a declarat Martin Riedmiller, liderul echipei de control din cadrul DeepMind și autor al noii lucrări. El a adăugat faptul că, în viitor, colaborarea dintre modulele IA și cercetătorii de fuziune ar putea conduce la dezvoltarea unor modalități complet noi de realizare și susținere a reacțiilor de fuziune.

Algoritmii RL funcționează folosind un sistem de încercare și eroare. Aceștia oferă soluții aleatorii cu privire la ceea ce ar putea funcționa pentru a găsi o găsi pe cea mai eficientă. Pentru a-și antrena algoritmul, cercetătorii au expus sistemul la simulări matematice ale fizicii fuziunii.

„Calitatea reală a modelelor fizice de bază, pe care le folosim pentru a realiza simulările reactoarelor de fuziune, s-a îmbunătățit foarte mult”, a declarat Frederico Felici, cercetător în cadrul EPFL și un coautor al lucrării.

Cercetătorii au folosit o metodă de antrenament denumită metodă critică actor, în care o rețea neuronală evaluează dacă datele produc o soluție de înaltă calitate, în timp ce cealaltă rețea preia acele date și le folosește pentru a controla reacția de fuziune.

După ce algoritmul a fost antrenat folosind mediul simulat, cercetătorii l-au testat cu un tokamak real: Variable Configuration Tokamak (numit și Tokamak à Configuration Variable sau TCV), care se află în cadrul EPFL. În primul rând, cercetătorii au folosit metode tradiționale de control pentru a forma plasma și pentru a stabili locația și curentul acesteia. După aceea, echipa a „predat” controlul sistemului RL. Din cauza faptului că modificarea procesului real de fuziune poate fi periculoasă și distructivă, algoritmul nu a fost antrenat deloc pe reacții reale, ci doar pe simulări.

„Este extrem de important faptul că ei au putut să arate că au fost capabili să construiască acest model folosind mediul simulat și să-l aplice într-un experimentul real. Orice om de știință își dorește ca algoritmii dezvoltați să funcționeze optim din prima zi”, a declarat Chris Hansen, cercetător senior în cadrul Universității din Washington, care realizează cercetări despre fuziune și știința plasmei și care nu a fost implicat în studiu.

Inițial, cercetătorii au testat sistemul prin demararea experimentului, crescând instabilitatea plasmei și reducând-o la starea inițială. După acest test de bază, grupul a experimentat cu diferite configurații de plasmă. În esență, ei au reușit să „sculpteze” plasmă în diferite forme, permițându-le să studieze mai bine ce tipuri de structuri funcționează cel mai eficient în procesul de fuziune. Echipa a creat forme alungite și ovale, o configurație supranumită „fulg de zăpadă”, precum și una în formă de triunghi. De asemenea, aceștia au format pentru prima dată un model cu două „picături” independente de plasmă.

„Forma are un efect fundamental asupra calității plasmei. Aceasta influențează capacitatea de a menține căldura în interior și stabilitatea plasmei, adică măsura în care substanța este predispusă la orice evenimente instabile ce ar putea avea loc”, a declarat Felici. Evenimente precum perturbările, în care plasma iese din câmpul magnetic, întrerup reacția și pot provoca chiar daune.

Deși metoda de control bazată pe RL este mai simplă decât alte metode de control a fuziunii, aceasta nu este neapărat mai eficientă. De exemplu, metoda obișnuită de control al unui tokamak utilizează mai multe controlere independente, care lucrează în tandem. Noua metodă înlocuiește acest sistem cu un singur controler.

În viitor, cercetătorii speră să vină cu noi modalități de a simula și studia dinamica internă a diferitelor configurații de plasmă, nu doar de a controla bobinele magnetice ale reactorului. Utilizarea RL are și unele dezavantaje inerente. La urma urmei, orice sistem de deep learning este o „cutie neagră”. Din cauza faptului că modurile în care sistemul ajunge la concluzii nu sunt evidente, nu există o modalitate clară de a ști ce s-a întâmplat dacă ceva nu a mers bine. Cu toate acestea, utilizarea RL ca metodă de control al plasmei prezintă avantaje clare în controlul efectiv al sistemului, altfel notoriu de instabil, motiv pentru care cercetătorii continuă să-și exprime optimismul în ceea ce privește aceste tehnici și să-și îmbunătățească succesele inițiale.

„Va fi foarte interesant să vedem evoluția acestei tehnologii”, a declarat Hansen.