DeepMind가 얼마나 경솔한 자아를 개발했는지 A. A. 그것은 사람보다 현명 할 수있다.

$config[ads_kvadrat] not found

I'm Busy Remix

I'm Busy Remix

차례:

Anonim

컴퓨터는 이제 수십 년 동안 우리의 연약한 인간 엉덩이를 체스에서 발로 차고 있습니다. IBM의 Deep Blue가 세계 챔피언 Gary Kasperov를 격퇴시킬 수 있었던 1996 년에 처음 일어났습니다. 그러나 Alphabet의 A.I. 복장 DeepMind는 초기 승리가 실제로 얼마나 범위가 제한적 이었는지를 밝힙니다.

하나를 위해, Kasperov는 3 개의 게임에서 우승하며 6 개의 게임 플레이 오프에서 2 개의 그림을 그렸다. 매일 뉴스 보고서.

그러나 DeepMind의 연구원 인 Julian Schrittwieser가 말한 것처럼 훨씬 더 주목할만한 사실입니다. 역 Deep Blue와 같은 응용 프로그램도 수동으로 프로그래밍되었습니다. 이것은 인간이 A.I.을 가르쳐야한다는 것을 의미합니다. 모든 상상할 수있는 우연성을 다루는 방법에 대해 알아야 할 모든 것. 다른 말로 표현하면 프로그래밍하는 사람들만큼이나 훌륭 할 수 있습니다. 그리고 Deep Blue가 체스에서 꽤 잘할 수 있었던 것은 분명했습니다. 그것은 Go와 비슷한 또 다른 게임을 제공하고 그것은 우둔한 것입니다.

알파 제로는 완전히 다릅니다. 오늘 저널에 게재 된 새로운 연구에서 과학, 저자들은 체스에서 인간을 이길 수있는 방법을 알파 ゼロ에게 가르치는 것이 아니라 알파 제로를 가르치는 방법을 밝힙니다. 스스로 가르치다 여러 게임을 마스터 할 수 있습니다.

A.I.을 가르치는 방법. 스스로 가르치기

Alpha Zero는 심층 강화 학습이라는 기술을 사용하여 개발되었습니다. 본질적으로 이것은 A.I. 체스의 기본 규칙처럼 매우 단순한 것, 그리고 전략과 기법과 같이 더 복잡하고 흥미로운 것을 배우기까지 반복되는 것을 반복합니다.

"전통적으로 … 인간은 게임에 대한 지식을 습득하고 규칙에 따라 코드를 작성하려고합니다."라고 Schrittwieser는 약 4 년 동안 Alpha Zero에서 작업하고 있다고 말합니다. "우리의 접근 방법은 무작위로 초기화 한 다음 게임을 자체적으로 플레이하게하고 게임 자체에서 전략이 어떻게 작동 하는지를 배울 수 있습니다."

모든 알파 제로 가져 오는 것은 기본 규칙이며, 거기에서 스스로를 재생하여 승리하는 법을 배웁니다. 새로운 연구 결과에 따르면, 알파 제로가 체스를 마스터하는 데 단지 9 시간이 걸리고, 쇼기를 마스터하는 데는 12 시간이 걸리고, 이동을 마스터하는 데는 약 13 일이 걸립니다. 그것은 스스로 놀고 있기 때문에, 그것은 본질적으로 독학입니다. 쇼기 (Shogi)에서 2017 년 세계 챔피언을 91 % 나 앞질러 세계 챔피언 인 인간 유도 알고리즘을 사용했습니다.

"게임에 대한 흥미로운 지식을 독자적으로 발견 할 수 있습니다."라고 Schrittwieser는 말합니다. "더 인간과 같은 프로그램을 만듭니다."

그러나 Alpha Zero는 인간과 비슷하고 창조적이지만 Alpha Zero가 사용 가능한 모든 정보에 액세스 할 수있는 모든 게임을 지배 할 수있을만큼 최적이라고 그는 말합니다. 실제로 알파 제로 (Alpha Zero)는 매우 정교합니다. 우리는 A. A.의 경계를 계속 유지하기 위해 완전히 다른 종류의 게임으로 이동해야 할 수도 있습니다. 문제를 해결합니다.

왜 Alpa Zero가 그렇게 좋은가요?

일체 포함. 연구자들은이 게임을 몇 가지 이유로 더 정교한 알고리즘 형태의 테스트 근거로 사용하는 것을 좋아합니다. 우아하고 사람들은 수백 년 동안 게임을 해왔습니다. 즉, 알고리즘을 테스트 할 잠재적 도전자가 많이 있습니다. 그러나 그들은 복잡하고 복잡하기도하여 A.I.의 발판이 될 수 있습니다. 현실 세계의 문제를 해결할 수 있습니다. Schrittwieser는 다음 연구 분야가 불완전한 정보로 최적의 결정을 내릴 수있는 Alpha Zero와 같은 알고리즘을 만들고 있다고 말합니다.

"이 모든 게임에서 일어나는 모든 일을 알고 있습니다."라고 그는 말합니다. "현실 세계에서는 정보의 일부만 알 수 있습니다. 자신의 카드를 알고 있을지 모르지만 상대방을 알지 못하면 부분적인 정보가 있습니다."

Alpha Zero와 같은 알고리즘을 제공 할 수있는 보드 게임이 여전히 몇 가지 있습니다. Schrittwieser는 선수들이 서로의 움직임을 숨기는 Stratego와 DeepMind의 게임 중심 연구원이 관심을 갖는 또 다른 분야 인 Starcraft에 대해 언급했습니다.

"우리는 점점 더 복잡 해지는 문제를 만들고 싶습니다."라고 그는 말합니다. "그러나 항상 한 번에 하나의 차원입니다."

동시에 딥 마인드 (Deep Mind)의 차세대 컴퓨터 화 된 문제 해결 자들은 이미 게임 세계에서 현실 세계로 이동할 잠재력을 보여주고 있습니다. 이번 주 초 AlphaFold라는 또 다른 알고리즘을 발표했다. AlphaFold는 단백질 서열을 3D 구조의 정확한 예측으로 외삽 할 수있다.수십 년 동안 과학자들을 당황하게 한 문제이며 알츠하이머에서 낭포 성 섬유증에 이르는 질병을 치료할 수있는 문을 여는 데 도움이 될 수 있습니다.

$config[ads_kvadrat] not found