Nvidia의이 AI 신경망이 사실적인 가짜 이미지를 만듭니다.

$config[ads_kvadrat] not found

인텔-늑대와여우-코디, 건강 파수꾼「헬스케어PC」한배 탔다

인텔-늑대와여우-코디, 건강 파수꾼「헬스케어PC」한배 탔다
Anonim

한 눈에 사진 위는 보통의 거리의 평범한 사진처럼 보입니다. 돌진 카메라에서 또는 평범한 장면의 그림을 찍기 위해 길을 돌아 다니기에 충분히 바보 같은 사람에게서 찍은 것입니다.

그러나 조금 더 가까이 보아라. 교통 신호가 약간 왜곡되거나 자동차의 일부가 어지럽게 보입니다. 여기 뭔가 잘못되었습니다. 이것은 전혀 사진이 아닙니다. 그것은 전적으로 A.I.에 의해 만들어진 이미지입니다.

Nvidia와 University of California, Berkeley의 컴퓨터 과학자들은 arXiv의 preprint에서 사용할 수있는 연구 논문을 작성하여 신경 네트워크를 통해 실제 거리 이미지와 인물 사진을 생성하는 방법을 자세히 설명했습니다. 그들은 심지어 당신이 여분의 단풍을 추가하거나 심지어 날씨를 변경하여 원하는거야 그림을 조정할 수있는 사용자 인터페이스가 포함되어 있습니다.

엔비디아의 수석 과학자 인 Ming-Yu Liu는 "사람들이 가상 환경에서 상호 작용하는 것을 좋아하기 때문에 게임이 빠르게 성장하고 있습니다. 역 이메일로. "그러나 가상 세계를 구축하는 것은 오늘날의 기술로 인해 값 비쌉니다. 왜냐하면 아티스트는 제작중인 세계의 질감과 조명을 명시 적으로 모델링하고 시뮬레이션해야하기 때문입니다. 이미지 - 이미지 변환 기능을 사용하면 가상 세계를 만들기 위해 실제 세계를 샘플링 할 수 있습니다."

신경망은 정보를 받아 들여 적용하고 결과로부터 학습함으로써 인간의 두뇌처럼 작동하도록 모델링 된 컴퓨터입니다. 이 연구에서는 2014 년 Ian Goodfellow가 소개 한 특수 유형의 신경망 인 Generative adversarial networks (GAN)를 사용했습니다. GAN은 일반적으로 두 개의 네트워크 인 생성기와 판별기로 구성됩니다.

생성기에는 사진이 제공되고 주어진 것과 유사한 합성 이미지를 만들기 시작합니다. 그런 다음 이미지에 혼합 된 이미지와 가짜 이미지를 구분자에게 보여줍니다.이 이미지는 구별되는 것입니다. 이 과정이 진행됨에 따라 원본 이미지를 모방하는 과정에서 발전기가 더 잘 작동하고 가짜 신호를 구분할 때 판별자가 더 좋아집니다. 그 결과는 꽤 설득력있는 - 그리고 완전히 가짜 - 그림들입니다.

이 연구는 발전기 및 판별 기 네트워크를 몇 개의 하위 네트워크로 분할하여 고해상도 이미지를 출력 할 수있게하여 기존의 GAN 모델을 기반으로합니다. 뉴럴 네트워크는 또한 의미 론적지도 또는 사진이 어떻게 보이는지에 대한 청사진을 가져 와서 자발적으로 텍스처를 채울 수 있습니다. 사용자는 가로보기에서 나무 대신 건물을 추가하거나 초상화에서 눈을 넓히려는 경우 청사진에 들어가서 사물을 변경할 수도 있습니다.

이 논문은 그 결과를이 방법을 사용하여 수행 한 유사한 실험과 비교합니다. 가장 주목할만한 것은 pix2pix입니다. Nvidia와 UC Berkeley 연구는 작고 정밀한 번호판처럼 세부적인 이미지를 생성 할 수있는 반면 pix2pix는 거의 수채화 그림처럼 보이는 이미지를 출력합니다.

이 도구를 사용하여 몇 가지 무료 사진을 얻는 데 사용할 수 있지만 저자는이 방법을 활용하여 단순한 청사진으로 사실적인 그래픽을 생성 할 수 있다는 큰 잠재력을 보았습니다.

수십 시간의 고된 노동력이 Google지도, 영화 및 비디오 게임에 사용하기 위해 가상 세계를 만들어냅니다. Liu는이 모델이 고통없이 디자인의 대부분을 완료 한 다음 나중에 세부 사항을 조정할 수있는 방법으로 사용될 수 있다고 말합니다.

"명시 적으로 모델링하여 세계를 렌더링하는 대신 이미지 - 이미지 변환을 사용하여 텍스처 또는 조명을 포함하지 않는 단순한 세계 모델과 사실적인 출력물을 변환하여 암시 적으로 세상을 구축 할 수 있습니다. 이 기능으로 가상 세계를 구축하는 것이 훨씬 저렴 해집니다. " 역.

이 연구의 다음 단계에서 팀은 현실적인 비디오를 만들기 위해 신경망을 사용하는 비디오 - 비디오 번역을 탐색하기를 희망합니다. Lui가 말한 목표는이 분야의 연구자들에게 도전을 제기했습니다.

이제 어떻게 가짜 이미지를 만들 수 있는지 쉽게 알 수 있습니다. Google 이미지에 표시되는 모든 것을 신뢰하지 마십시오.

$config[ads_kvadrat] not found