깊은 '강화 학습'은 로봇을 가르치는 것입니다.

로봇은 빨라진 가상 세계에서 작업을 완료하는 방법을 배우고 그렇지 않으면 수개월이 걸리는 기술을 개발합니다. 시뮬레이션 된 심층 강화 학습 (또는 Deep RL)은 A.I.에 대해 일반적으로 55 일이 걸리는 기술을 의미합니다. 현실 세계에서 배우는 것은 초고속 학습 교실에서 하루 만 걸립니다.

구글 DeepMind의 연구원 인 Raia Hadsell은 목요일 런던의 Re-Work Deep Learning Summit에서 "로봇 분야에서 할 수있는 것을 실제로 혁명적으로 바꿀 수있는 잠재력이있다"고 말했다. "인간 수준의 기술을 배울 수 있습니다."

그것은 반 직관적으로 들릴지도 모릅니다. 확실히 로봇의 전체 요점은 프로그래머가 그들에게 일을하도록 가르 칠 수 있겠습니까? 하지만 현실 세계에서 작동하는 기계를 설계 할 때 로봇은 익숙하지 않은 상황에서 작업을 수행하는 방법을 이해하기 위해 많은 양의 데이터가 필요합니다. 일체 포함. 이 데이터를 사용하여 이전에 온 모든 인스턴스를 기반으로 기술을 "습득"할 수 있습니다.

심층적 인 학습은 인간이 배우는 것과 비슷한 방식으로 데이터를 수집합니다. 로봇은 공을 잡는 것처럼 반복적으로 작업을 완료하고 데이터를 기록하여 새로운 상황에서 공을 가장 잘 잡을 수있는 방법을 보여줍니다. DeepMind가 2013 년에 모델을 사용하여 Atari 게임을 마스터하는 방법을 로봇에 가르치기 만하면 간단히 화면 앞에 앉아서 목표를 말하면서 과학 공동체는 Atari 게임을 좋아했습니다.

문제는 이것이 영원히 필요하다는 것입니다. 반복적으로 로봇에 공을 던지거나 Atari의 경우 로봇을 잠시 침실에 두십시오. 점진적 신경 네트워크와 결합 된 MuJoCo 시뮬레이션을 실행하면 트레이너가 로봇을 모방 한 프로그램을 실행하고 학습 된 동작을 로봇에 전송하고 가상 동작을 실제 세계로 매핑 할 수 있습니다.

Hadsell은 "우리는 하루 종일 밤새 시뮬레이터를 사용할 수 있습니다.

결과는 스스로를 말해줍니다. 잡기에 졸업장을받은이 로봇은 실제 볼처럼 가상 볼을 따라갈 수 있습니다. 실제 볼을 잡으라는 큰 하루를 기다립니다.

깊은 '강화 학습'은 로봇을 가르치는 것입니다.

이 로봇 암은 자체 로봇을 만들고 더 나은 로봇을 재 설계 할 수 있습니다.

왜 성격 테스트는 결코 당신이 로봇을 구입하는 데 도움 않을 것입니다

A.I. 소피아 뒤에있는 팀이 유네스코가 로봇에 관해 아이들을 가르치는 것을 도울 것입니다.