TehnoȘtiri

INTELIGENȚA ARTIFICIALĂ ÎȘI POATE CREA AUTOMAT PLANURI DE LECȚII

(c) OPENAI

Spre deosebire de oameni, computerele nu par să se plictisească sau să se frustreze atunci când o lecție este prea ușoară sau prea grea. Dar, la fel ca și oamenii, acestea se descurcă mai bine atunci când un plan de lecție este potrivit pentru nivelul lor de învățare. Cu toate acestea, conceperea unor programe potrivite nu este ușoară, așa că informaticienii s-au întrebat dacă ar putea face ca sistemele să-și proiecteze singure propriile programe.

În cadrul unor studii, o serie de cercetători au încercat să facă acest lucru posibil, creând un modul de inteligență artificială (IA) care poate determina cel mai bun mod de învățare. Lucrarea ar putea accelera procesul de învățare al mașinilor autonome și al roboților de uz casnic și ar putea chiar ajuta la rezolvarea problemelor matematice care nu au fost, până în prezent, rezolvate.

În cadrul unuia dintre noile experimente, un program IA încearcă să ajungă, rapid, la o destinație navigând pe o grilă 2D, populată cu blocuri solide. „Agentul” își îmbunătățește abilitățile printr-un proces denumit „reinforcement learning”, mai exact un tip de încercare și eșec.

Pentru a-l ajuta să navigheze prin zone din ce în ce mai complexe, o echipă de cercetători, conduși de către Michael Dennis, absolvent al Universității din California (UC) și Natasha Jaques, cercetător în cadrul companiei Google, au luat în considerare două moduri în care ar putea proiecta hărțile. O metodă a presupus o distribuție aleatorie a blocurilor. Totuși, prin această metodă computerul nu putea învăța foarte eficient. O altă metodă a presupus creșterea graduală a dificultății. Nici această metodă nu s-a dovedit eficientă, întrucât hărțile deveneau mult prea dificile pentru ca programul să le învețe.

Așadar, oamenii de știință au creat un scenariu, folosind o nouă abordare pe care o denumesc PAIRED. În primul rând, aceștia au cuplat IA-ul cu unul aproape identic, dar cu un set ușor diferit de puncte forte, pe care l-au denumit „antagonist”. După aceea, echipa de cercetători a implementat un a treilea modul de IA, care avea rolul de a crea mediile virtuale. Aceste medii virtuale erau ușor de învățat de către antagonist, dar greu de parcurs de către protagonistul original. Acest proces a condus la atingerea limitei capacității de rezolvare a protagonistului. Proiectantul, la fel ca cei doi agenți, folosea o rețea neuronală pentru a-și învăța sarcina cât mai bine după fiecare încercare.

După antrenament, protagonistul a primit un set de labirinturi dificile. Atunci când IA-ul s-a antrenat folosind cele două metode mai vechi, nu a putut rezolvat nici unul dintre labirinturile noi. Dar, după antrenamentul cu PAIRED, acesta a rezolvat unul din cinci labirinturi. Experimentul a fost raportat de către cercetători, în luna decembrie 2020, în cadrul Conferinței privind sistemele de procesare a informațiilor neuronale (NeurIPS). „Am fost entuziasmați de progresele făcute cu ajutorul sistemului PAIRED”, a declarat Dennis.

În cadrul unui alt studiu, prezentat la un atelier din cadrul NeurIPS, Jaques și colegii acesteia din cadrul Google au folosit o altă versiune a PAIRED pentru a învăța un agent IA să completeze formulare web și să rezerve bilete de avion. În timp ce o metodă de predare mai simplă a condus la eșec aproape de fiecare dată, un modul de inteligență artificială, antrenat prin metoda PAIRED, a avut o rată de succes de 50%.

„Metoda PAIRED este un mod inteligent de a învăța un modul IA”, a declarat Bart Selman, informatician în cadrul Universității Cornell și președinte al Asociației pentru Progresul Inteligenței Artificiale.

Selman și colegii acestuia au prezentat o altă abordare „autocurriculară”. Sarcina propusă era reprezentată de un joc denumit Sokoban, în care un agent IA trebuie să împingă blocuri în anumite zone. Totuși, blocurile se pot bloca, așa că succesul necesită, adesea, planificarea cu sute de pași în prealabil.

Sistemul lor creează o colecție de puzzle-uri mai simplu de antrenat, cu mai puține blocuri și ținte. Apoi, pe baza performanței recente a IA-ului, selectează puzzle-uri pe care agentul le rezolvă doar ocazional, realizând efectiv planul lecției la nivelul potrivit. „Uneori, puzzle-urile sunt greu de prezis. Noțiunea de sarcină mai simplă nu este întotdeauna evidentă”, a declarat Selman.

Cercetătorii au testat agentul instruit pe 225 de probleme, pe care niciun computer nu le-a rezolvat vreodată. Acesta a rezolvat 80% dintre ele, aproximativ o treime din succesul său datorându-se strict noii metode de învățare. Selman a declarat faptul că acesta primește mesaje de uimire de la cercetătorii care lucrează la astfel de probleme de zeci de ani. El speră să aplice această metodă pentru a finaliza și probleme matematice nerezolvate.

Pieter Abbeel, informatician în cadrul UC Berkeley, a demonstrat, în cadrul unei ședințe, faptul că autocurricula poate ajuta roboții să învețe să manipuleze obiecte. El a declarat faptul că abordarea ar putea fi folosită chiar și în cadrul studenților umani. „În calitate de instructor, sunt de părere că nu toți studenții au nevoie de aceleași exerciții”, a declarat Abbeel, menționând faptul că IA ar putea ajuta la adaptarea materiei în cazul unui elev.