Atunci când ființele umane vor să apuce un anumit obiect, deseori, îl izolează de restul lucrurilor din jur și se asigură că au suficient spațiu pentru manipularea acestuia. Deși oamenii nu sunt în totalitate conștienți că fac acest lucru, această strategie, cunoscută sub numele de „manipulare prealabilă”, permite o prindere mai eficientă a obiectelor.
În ultimii ani, mai mulți cercetători au încercat să reproducă strategiile de manipulare ale oamenilor pe roboți, însă mai puține studii s-au concentrat pe manipularea prealabilă (etapă anterioară prinderii obiectelor). Având în vedere acest lucru, o echipă de cercetători de la Institutul de Tehnologie Karlsruhe (KIT) a dezvoltat recent un algoritm care poate fi utilizat pentru a instrui roboții atât în strategii de manipulare generală, cât și în strategii de manipulare prealabilă. Această nouă abordare a fost prezentată într-o lucrare publicată pe arXiv – o bază de date de pre-printuri de actualitate stringentă din toate domeniile fizicii, matematicii, științelor nelineare, biologiei, științelor de calcul numeric..
„În timp ce prinderea este o sarcină bine înțeleasă în robotică, manipularea prealabilă este încă foarte dificilă”, a spus Lars Berscheid, unul dintre cercetătorii care au efectuat studiul. „Roboților le este foarte greu să manipuleze obiectele situate foarte aproape unele de altele sau în spații strâmte, cel puțin pentru moment. Datorită inovațiilor recente în ceea ce privește Robot Learning și Machine Learning, roboții pot învăța cum să rezolve diverse sarcini, interacționând cu mediul respectiv”, a adăugat cercetătorul.
Atunci când un robot învață cum să finalizeze o anumită sarcină, este esențial să-și dea seama cum să rezolve o problemă, bazându-se pe resursele pe care a fost programat. În studiul lor, cercetătorii s-au concentrat pe o sarcină care a implicat extragerea obiectelor dintr-un coș umplut la întâmplare. Robotul a fost instruit cu privire la modul de prindere al obiectelor timp de aproximativ 80 de ore, folosind o cameră video și feedback-ul primit de la dispozitivul de prindere. Algoritmul dezvoltat de Berscheid și colegii săi aduce antrenamentul robotului cu un pas mai aproape de scopurile propuse, de a rezolva strategiile de manipulare prealabilă.
„Ideea cheie a lucrării noastre a fost să extindem acțiunile de prindere ale obiectelor prin introducerea mișcărilor suplimentare, deplasarea sau împingerea”, a explicat Berscheid. „Astfel, robotul poate decide ce acțiune trebuie aplicată în diferite situații. Antrenarea roboților în realitate este foarte dificilă: în primul rând, este nevoie de mult timp, antrenamentul în sine trebuie automatizat și auto-supravegheat, iar în al doilea rând, pot apărea o mulțime de lucruri neașteptate pentru cazul în care robotul explorează mediul respectiv. Robot Learning, similar cu unele tehnici din Machine learning, este mereu limitat de consumul de date. Cu alte cuvinte, munca noastră este conectată la două întrebări de cercetare provocatoare: cum poate un robot să învețe cât mai repede și ce sarcini poate îndeplini utilizând perspectivele descoperite?”.
Berscheid continuă să explice faptul că un robot poate învăța mai eficient dacă primește feedback direct după fiecare acțiune pe care o realizează. Cu alte cuvinte, cu cât există un număr mai mare de feedback-uri (adică cu cât primește mai multe recompense pentru acțiunile de succes), cu atât mai rapid și mai eficient învață cum să finalizeze o sarcină dată.
„Aparent este ușor, însă, uneori, este dificil de implementat. De exemplu, cum definești calitatea manipulării prealabile?”, a spus Berscheid.
Abordarea propusă de cercetători se bazează pe un studiu anterior care a constat în investigarea utilizării diferențelor în ceea ce privește probabilitățile înainte și după o anumită acțiune, concentrându-se pe o zonă mică în cadrul căreia se desfășoară acțiunea. În noul lor studiu, Berscheid și colegii săi au încercat, de asemenea, să descopere acțiuni pe care un robot ar trebui să le învețe cât mai rapid.
„Aceasta este bine-cunoscuta problemă a explorării în Robot Learning”, a explicat Berscheid. „Definim o strategie de explorare care maximizează autoinformarea sau minimizează incertitudinea acțiunilor și poate fi calculată foarte eficient.”
Algoritmul prezentat de cercetători îi permite unui robot să învețe poziția optimă pentru acțiunile de pre-manipulare, ca de exemplu (prinderea), precum și modalitatea de a efectua aceste acțiuni pentru a crește probabilitatea de a îndeplini cu succes prinderea. Abordarea lor face ca o acțiune particulară să depindă de cealaltă, care în cele din urmă, va permite o învățare mai eficientă.
Cercetătorii și-au aplicat algoritmul pe un braț robotic Franka și apoi au evaluat performanța printr-o sarcină care a presupus ridicarea obiectelor dintr-un coș, până când acesta este complet gol. Au instruit sistemul folosind 25.000 de acțiuni de prindere diferite și 2.500 de acțiuni de schimbare. Descoperirile lor au fost promițătoare, brațul robotic prinzând și eliberând cu succes obiecte care acestuia îi erau familiare, dar și cele pe care nu le întâlnise niciodată.
„Consider că două rezultate ale activității noastre sunt deosebit de interesante”, a spus Berscheid.
„În primul rând, credem că această lucrare arată într-adevăr capacitatea de învățare a robotului. În loc să-l programăm cum să facă ceva, îi spunem robotului ce trebuie să facă pentru a-și da singur seama cum să îndeplinească sarcina. Acest lucru ar putea fi foarte util în automatizarea multor sarcini industriale, în special pentru preluarea coșului, unde robotul ar trebui să poată goli coșul, complet, de unul singur.”
În viitor, abordarea dezvoltată de Berscheid și colegii săi ar putea fi aplicată altor platforme robotice, îmbunătățindu-le astfel abilitățile de manipulare prealabilă. În prezent, cercetătorii plănuiesc să realizeze studii suplimentare în acest domeniu de cercetare.
De exemplu, până în prezent, abordarea lor permite doar ca brațul robotului Frank să prindă obiecte cu o mână orientată vertical, folosind ceea ce se numește „prindere planară”. Cercetătorii ar dori să-și extindă algoritmul pentru a permite, de asemenea, prinderea laterală, introducând mai mulți parametri și folosind date suplimentare de instruire. Potrivit lui Berscheid, principala provocare atunci când încearcă să realizeze acest lucru va fi asigurarea faptului că robotul dobândește aceste abilități păstrând, în același timp, numărul de încercări de prindere pe care le realizează constant.
„Cum putem plasa cu exactitate un obiect necunoscut? Cred că răspunsul la această întrebare este foarte important pentru a aborda atât aplicațiile industriale, cât și noile aplicații din cadrul roboticii de serviciu. În proiectul nostru dorim să ne concentrăm asupra învățării roboților din întreaga lume, aducând în discuție reducerea diferenței dintre exemplele din cercetare și aplicațiile complexe din realitate.”