Boston Dynamics показала нові кадри, де робот-пес Spot стабільно виконує серії бекфліпів і надзвичайно плавно приземляється. Виглядає як шоу, але за ефектними трюками стоїть цілком практична мета — перевірити межі апаратної частини та алгоритмів керування, повідомляє NNews із посиланням на Interresting Engineering . Навіщо це індустрії У реальних умовах Spot носить корисне навантаження, інспектує цехи й будмайданчики, працює там, де небезпечно людині. Бекфліпи — це стрес-тест: вони змушують робота виходити на межу можливостей, штучно створюючи сценарії втрати рівноваги. Команда вивчає, як саме Spot може «провалитися» у балансі, і закладає ефективні стратегії відновлення, аби не пошкодити ні себе, ні вантаж. «Очевидно, клієнтам не потрібні сальто… Але бувають ситуації, коли ми маємо задіювати мотори й енергосистему на повну», — пояснює інженер команди Spot Behavior Арун Кумар. Ідея проста: якщо робот упорається з екстремумами, то типові збої та ковзання для нього стануть буденністю. Як навчили: підкріплювальне навчання Алгоритми Spot тренували в симуляціях за методом підкріплювального навчання (reinforcement learning). Робот-«агент» діє в змодельованому середовищі, отримує винагороди за правильні дії, а нейромережа поступово вчиться максимізувати ці винагороди — буквально як собаку навчають командами і «ласощами». Щойно поведінка працює у «віртуалці», її переносять на залізо, фіксують, що не спрацювало, і повторюють цикл, докручуючи рухи до стабільності. Шоу теж важливе Публіка любить видовища — згадайте виступи цілої зграї Spot на America’s Got Talent. Та розважальний ефект — лише фасад. За ним — надійність, адаптивність і безпечна робота поруч із людьми у складних середовищах. Що далі Еволюція Spot через підкріплювальне навчання означає більше «розумних» рефлексів у реальному світі: краща реакція на слизьку підлогу, нерівності, штовхання, неочікувані перешкоди. Чим складніші трюки вдаються в лабораторії, тим спокійніше робот почувається на справжньому об’єкті.