Alfabetyzacja robotów


Naukowcy donoszą, iż nowy model komputera jest w stanie naśladować ludzką zdolność do uczenia się nowych koncepcji na podstawie pojedynczego przykładu. Jest to przełom, ponieważ dotychczasowe rozwiązania wymagały dziesiątek tysięcy prób i przykładów, aby uzyskać spójne efekty.

Ku zaskoczeniu grupy badawczej opracowany przez nich model analizowania znaków graficznych nauczył się zapisywać wymyślone symbole, które znalazły się w jednej z bajek. Równie dobrze poradził sobie z tuzinem alfabetów będących w użyciu na całym świecie. Co więcej, był w stanie stworzyć też własne nieistniejące dotąd znaki zapożyczając ze stylów charakterystycznych dla danych alfabetów.

Pomimo poważnego progresu, jaki dokonał się ostatnio na polu uczenia się maszyn, ludzie wciąż pozostają daleko w przodzie, jeżeli chodzi o pojmowanie nowych koncepcji i ogólnie cały proces uczenia się.

“Ludzie są zdolni przyswajać nowe zdolności niesamowicie szybko, czasami przy wyjątkowo niewielkiej ilości danych, czy po jedynie kilku zaobserwowanych przypadkach. Wyjątkowe pod tym względem są dzieci. Wystarczy raz im pokazać jak wygląda koń lub samochód, a one po tym jednym przykładzie dobrze sobie przyswoją daną koncepcję”, mówi współautor opracowania, Joshua Tenenbaum z Massachusetts Institute of Technology.

Aby skrócić czas w jakim maszyna mogłaby osiągnąć podobne wyniki jak dzieci, naukowcy poszukiwali sposobu na opracowanie modelu, który w zbliżony sposób naśladowałby ludzki proces uczenia się. Chodzi o zdolność do tworzenia abstrakcyjnych, ogólnych wyobrażeń, opierając się jedynie na kilku przykładach. Skupili się na uczeniu prostych koncepcji wizualnych, a nic lepiej nie nadawało się do tego eksperymentu, jak odręcznie pisane alfabety występujące w różnych odmianach. Model został ochrzczony nazwą Bayesian program learning, lub w skórcie BPL framework.

“Nasza praca ma dwa cele. Po pierwsze, lepsze zrozumienie ludzkich procesów poznawczych, dzięki odkryciom poczynionym na drodze inżynierii wstecznej. To z kolei pozwoli nam zbudować maszyny, które będą się uczyły w sposób zbliżony do ludzkiego”, wspomina Tenenbaum.

Dotychczasowo obecne systemy wykrywania wzorców graficznych opierały się na algorytmach, które rozpoznawały dany znak jako zbiór uporządkowanych pikseli lub konkretnych cech. Nowy model obrazuje dany symbol, jako prosty program komputerowy. Dla przykładu, litera “A” jest przedstawiana przez program, który generuje przykłady tej litery pociągnięcie za pociągnięciem. Nie potrzeba tu programisty, ponieważ model generuje te programy sam, na bieżąco.

Ponadto, każdy z programów został zaprojektowany tak, aby generować różne warianty danego symbolu. Dzięki temu analizie zostają poddane również odchyły do zasadniczego wzoru. To tak, jakby ocenie poddać ten sam tekst, jednak napisany przez dwie różne osoby.

“Idea tego algorytmu przyszła niespodziewanie, podczas gdy opracowywaliśmy wnioski po jednej z ankiet. W jej ramach badaniu zostały poddane różne wzory pisma dostarczone z całego świata. Odkryliśmy, iż jeżeli poprosi się grupę ludzi, aby ci narysowali jakiś nowy znak, narysowany kształt odznaczał się będzie zaskakującą spójnością,” wypowiada się Brenden Lake, główny autor opracowania, pracujący na Uniwersytecie Nowego Jorku.

“Gdy ludzie uczą się nowych koncepcji, nie widzą jedynie znaków, jako statycznej grafiki. Człowiek interpretuje go jako złożoną strukturę, skomponowaną z sekwencji ruchów pióra. Dzięki czemu tak sprawnie są w stanie powielać dopiero co poznane przykłady.”

Opracowany model wykorzystuje również zasoby wiedzy zgromadzone podczas analizy przeszłych koncepcji, tak aby przyspieszyć uczenie się nowych. Dla przykładu, model opracowany przy okazji poznawania alfabetu łacińskiego może z powodzeniem być wykorzystany, aby przyspieszyć pojęcie pisowni alfabetu greckiego.

Badacze podparli swoje badanie zastosowaniem autorskiego modelu w ponad 1600 przypadków odręcznego pisma pogrupowanego na 50 systemów piśmienniczych, w tym Sanskryt, alfabet tybetański, alfabet gujarati i Głagolicę. Ochotnicy którzy zapisali się do udziału w badaniu przez system Mechanical Turk prowadzonego przez Amazon mieli wyraźne problemy aby odróżnić odręczne pismo ludzkie od tego naśladowanego przez maszynę.

Idąc za ciosem, naukowcy zaszczepili w swojej latorośli zdolność podejmowania twórczych wyznań. Za zadanie postawiono mu stworzenie nowej litery do alfabetu tybetańskiego na podstawie dotychczasowych informacji, które posiadł na temat tego zapisu. Naukowcy ocenili, że efekt tego zadania, postawionego przed modelem oraz przykładowym człowiekiem nie różnił się znacznie, a grupa badana nie potrafiła jednoznacznie stwierdzić, które pismo jest ludzkie.

“Udało nam się osiągnąć skuteczność na poziomie człowieka, przy wykonywaniu tej kreatywnej czynności,” mówi Ruslan Salakhutdinov z University of Toronto, kolejny ze współautorów pracy.

Przykładowe zastosowania tego odkrycia mówią o rozpoznawaniu odręcznego pisma, gestów czy przedmiotów. “Naszym celem nadrzędnym jest ustalenie jak podobne systemy mogą zbliżyć się zdolnościami do ludzkiej inteligencji,” mówi Salakhutdinov i dodaje “Jednakże jesteśmy wciąż daleko od osiągnięcia go.”

 

Źródło: spectrum.ieee.org

Zobacz też:


Roboty coraz bliżej ludzi dzięki mięśniom inspirowanym naturą
ModuBot – elastyczna robotyka modułowa od MultiProjekt
Największe Targi Automatyki Przemysłowej i Robotyki w Polsce!
Czy roboty przewyższają koszty zatrudnienia?
Dlaczego pasta lutownicza często sprawia problemy techniczne?
Grupa RENEX na stoisku Yamaha podczas targów MOTEK 2024
Sztuczne oko zrewolucjonizuje widzenie robotów
Stwórz przedsiębiorstwo przyszłości z naszym audytem technologicznym – wywiad z MultiProjekt Automatyka