MIT의 새로운 알고리즘은 어색하게되기 전에 인간의 상호 작용을 예측할 수 있습니다.

$config[ads_kvadrat] not found

Tofu & PC - If It (Prod. VoVanDuc) M/V

Tofu & PC - If It (Prod. VoVanDuc) M/V
Anonim

우리의 다른 사람들을 읽을 수 없다는 이유로 서사적 인 하이 파이브 5 실패와 키스를 놓쳤습니다. 일생 일대의 경험 후에도 인간의 상호 작용은 예측하기 어렵습니다. 그러나 MIT의 컴퓨터 과학 및 인공 지능 연구실 (CIT)의 연구자들은 다음과 같이 도울 수 있다고 생각합니다. 두 사람이 포옹, 키스, 악수 또는 상위 5 명을 예측할 수있는 새로운 심층 학습 알고리즘으로 미래를 향한 큰 발걸음을 내디뎠습니다. 그 어색한 순간을 축복없이 받았다.

그들은 600 시간의 YouTube 동영상 및 TV 프로그램에 대한 교육을 받기 위해 새로운 알고리즘을 기대합니다. 사무실, 스크럽, 빅뱅 이론, 및 위기의 주부들 - 사회적으로 어색한 로봇을 덜 프로그래밍하고 Google Glass 스타일의 헤드셋을 개발하여 놓치기 전에 행동을 제안 할 수 있습니다. 미래에 그들은 상상할 수 있습니다. 다시는 동료와 함께 5 등분 할 기회를 망칠 수 없습니다.

로봇이 우리와 같은 방식으로 소셜이된다는 것을 깨닫는 것은 알고리즘의 성공의 열쇠입니다. "인간은 경험을 통해 행동을 예측하는 것을 자동으로 배웁니다. 이것은 같은 종류의 상식을 지닌 컴퓨터에 관심을 갖게하려는 것입니다."라고 CSAIL Ph.D가 말했습니다. 학생 Carl Vondrick은 이번 주에 컴퓨터 비전 및 패턴 인식에 관한 국제 회의에서 관련 논문을 발표했습니다. "많은 양의 비디오를 보면서 컴퓨터가 주변 환경에 대한 예측을 일관성있게 유지하는 데 충분한 지식을 얻을 수 있음을 보여주고 싶었습니다."

Vondrick과 그의 팀은이 경우 엄청난 양의 데이터, Jim과 Pam의 최고 5 시간, Mike와 Susan의 은밀한 키스를 독자적으로 분석하기 위해 알고리즘의 여러 "신경 네트워크"를 가르쳤습니다. 팔을 벌린 손, 길쭉한 시선과 같은 요인을 고려할 때, 신경망 각각은 다음 순간에 일어날 일을 짐작하고, 네트워크의 일반적인 합의는 연구.

이 알고리즘은 시간의 43 % 이상을 올바르게 처리했습니다. 이것이 일상적인 상호 작용이 덜 이상하게 느껴질 정도로 충분히 높지는 않지만 36 %의 정밀도를 가진 기존 알고리즘을 크게 개선 한 것입니다.

게다가 인간은 행동을 71 % 예측할 수 있습니다. 우리가 얻을 수있는 모든 도움이 필요합니다.

연구의 두 번째 부분에서, 알고리즘은 리모콘, 접시, 쓰레기통과 같은 가정용 시트콤 스테이플이 5 초 후에 어떤 장면에 나타날지 예측하는 방법을 가르쳐주었습니다. 예를 들어 전자 레인지 도어를 열면 옆에 머그잔이 나타날 확률이 높아집니다.

Google Glass의 알고리즘은 아직 정확하지 않지만 공동 저자 인 Antonio Torralba (Ph.D.)와 함께합니다. - Google 교수 연구 상 및 Vondrick이 Google Ph.D와 협력하여 자금 지원 친목 - 우리는 거기에 도착할 수 있습니다. 본드릭 (Vondrick)은 미래 버전의 알고리즘은 로봇이 인간과 상호 작용할 수 있도록 프로그래밍하거나 사람이 넘어 지거나 부상 당했을 때 보안 카메라를 등록하도록 가르치는 데 사용될 수 있다고 예측했다.

"비디오는 잠재적 인 모든 경로를 볼 수있는 '자신의 모험을 선택하십시오'책과 같지 않습니다."라고 본드릭은 말합니다. "미래는 본질적으로 모호합니다. 따라서 이러한 가능성을 모두 예상하기 위해 이러한 표현을 사용하는 시스템을 개발하는 데 도전 해보십시오."

$config[ads_kvadrat] not found