개척 된 딥 학습 방법 개선 탁구, 우주 침략군들, 기타 Atari 게임에서 스탠포드 대학의 컴퓨터 과학 학생 인 Kevin Chen은 고전적인 2014 측 스크롤러에 상당히 능숙한 알고리즘을 만들었습니다 플라 피 버드. Chen은 "q-learning"이라는 개념을 사용하여 요원이 거의 반복 불가능한 중독성 게임을 완벽하게 만들기 위해 매 경기마다 보상 점수를 향상시키는 것을 목표로 삼았습니다.
Chen은 자신의 알고리즘이 살아있는 각 프레임에 대해 작은 긍정적 인 보상, 파이프 통과에 대한 큰 보상, 그리고 죽는 것에 대한 동등한 (그러나 부정적인) 보상이라는 세 가지 보상을 추구하도록 최적화 된 시스템을 만들었습니다. Chen이 쓴 보고서에 따르면, 소위 deep-q 네트워크가 인간을 능가 할 수 있다고 동기 부여했다. "우리는 성공적으로 게임을 할 수있었습니다 플라 피 버드 슈퍼 인간의 결과를 달성 픽셀과 점수에서 바로 학습함으로써."
2015 년에 출판 된 원본 Atari 종이 자연 는 Google 소유의 DeepMind 회사 (고대 중국 보드 게임 Go의 숙달로 유명 함)에서 나왔습니다. DeepMind의 성취는 시각적 또는 픽셀 적 정보, 최소한의 정보를 얻었으며 최소한의 정보만으로 보상을 극대화 할 수 있다는 점에서 획기적인 성과였습니다. 이러한 보상 시스템은 단순화 된 뇌의 도파민 성 반응과 유사합니다.
알고리즘이 새가 날아 다니는 새를 정복 한 것은 이번이 처음은 아니다. 스탠포드 대학의 컴퓨터 과학 학생들은 이전 수업에서 밤새 훈련을 받으면 0 점에서 1600 점으로 점수가 올라 갔다.
왜 멋진 옥스 브릿지 뱅커가 당신의 그늘진 삼촌의 저택들에 의해 탁월한 지 알아 냈나?
투자와 도박의 차이는 퍼지 수 있습니다. puts, 옵션, short-sales 및 기타 많은 팬시 거래가 수년 간 이루어지면서 정말 탁월한 것이었다면, 예를 들어 왜 세계 최고의 은행가 중 일부는 최근에 한 무리에 의해 능가하지 못했습니다 중개인?
'사냥꾼'외계인은 기원 이야기를 얻고 탁월한 에피소드에서 첩자 공개
구하면 너희가받을 것이다. 계속해서 우리는 사냥꾼들에게 쇼 핵심에서 더 많은 신비를 드러내도록 요청했습니다. 그렇지 않으면 시청자들의 관심을 유지하기에 너무 불투명해질 위험이 있습니다. 에피소드 7 "기계에 키스하다"는 실수는 아닙니다. 청중에게 진실 폭탄을 많이 떨어 뜨 렸습니다.
소울 메이트는 진짜입니까? 당신을 완성한 사람을 발견 한 11 개의 신호
모두가 질문에 대한 답을 알고 싶어 죽이고 있습니다. 소울 메이트는 진짜입니까? 그들은 진짜입니까? 그리고이 사람이 당신의 소울 메이트임을 어떻게 알 수 있습니까?