Jak se učí roboti? Stejně jako lidé: odměnou nebo trestem

7. listopad 2016

Do 20 let budeme mít prý každý svého osobního robota. Co už roboti umí, a co se ještě musí naučit, aby mohli stát po našem boku, popsal v Magazínu Leonardo Jan Peters z Technické univerzity v německém Darmstadtu.

„Dnes už roboti umí napodobit mnoho lidských pohybů,“ uvádí technik. „Podařilo se nám například vyrobit robota, který se sám od sebe během půl hodiny dokáže naučit hrát ping pong za použití obecného rámce učení dovedností.“

Tým německých robotiků naprogramoval do robota co je to forehand, backhand a smeč. „Pak jsme stroj nechali hrát proti stříleči míčků. Robot byl schopný vracet nejdřív 69 % míčků. Sledovali jsme, co se mu nedařilo, a namířili jsme míče tam, kde mu to šlo obzvlášť špatně.“

„Robot to zkoušel znovu a pomalu se zlepšoval. Na konci se mu dařilo v 97 % podání, což je úžasný úspěch,“ popisuje Peters.


„Inspirovali jsme se tím, jak se učí lidské bytosti. Neurovědci zjistili, že v bazální ganglii v mozku je centrum odměny a trestu, které nám pomáhá se učit určité úkony. Základní principy procesu učení jsou u robotů stejné jako u člověka.“

Vědci se také snaží rozvíjet manipulaci s objekty, aby byl robot schopný například něco sestavit společně s člověkem. „To by mohlo být zajímavé pro továrny a montážní linky. Dnes jsou chytré telefony stále sestavovány lidmi, protože je třeba mnoho jemné manipulace,“ vysvětluje expert.

Jaký je princip sebezdokonalování robota? „Vyvinuli jsme takzvaný posilovací učící algoritmus, který využívá systému odměn. Je to podobný systém jako známkování ve škole. Robot prostě zkouší různé věci, a variací tohoto hodnocení zjistí, jak se zlepšit.“

Co je teď hlavním cílem vědeckého týmu německých robotiků? „Snažíme se dělat sofistikovanější algoritmy, abychom mohli pracovat s menším objemem dat ve složitějších situacích.“

„Také se snažíme pracovat s více různými senzory a dalšími typy hardware. Hodně nás zajímají hmatové senzory, protože bychom rádi využili konečky prstů u robotů podobně jako je používají lidé. Uchopování a manipulace mohou být klíčová ingredience k tomu získat lidské nebo nadlidské schopnosti,“ shrnuje Jan Peters.

autoři: oci , Dalibor Zíta
Spustit audio