왜 A.I. 아랍어 이해하기 위해 노력할 수 있습니다.

$config[ads_kvadrat] not found

인텔-늑대와여우-코디, 건강 파수꾼「헬스케어PC」한배 탔다

인텔-늑대와여우-코디, 건강 파수꾼「헬스케어PC」한배 탔다
Anonim

인공 지능의 세계에서 데이터가 왕입니다. 더 많이 가질수록 시스템이 무엇을 기대하는지에 대해 "배울 수있는"도구가 될 수 있습니다. 그러나 플랫폼에 따라 A.I. 야후 연구소 (Yahoo Labs)의 연구 과학자 인 미리 암 레디 (Miriam Redi)에 따르면, 일부 언어가 다른 언어보다 더 잘 표현 될 수 있다고한다.

"우리가 데이터를 가져가는 플리커 (Flickr)와 같은 일부 언어는 거의 표현되지 않았습니다."라고 목요일의 런던의 Deep Learning Summit에서 Redi는 말했습니다. "영어가 있기 때문에 영어로 수백만 이미지가 있지만 아랍어로는 10 만개가 될 것입니다."

Redi 팀은 문화적 가치와 정서적 의미와 같이 이미지에 보이지 않는 요소를 식별 할 수있는 도구를 개발하고 있습니다. 이 도구는 Flickr에서 공개적으로 사용 가능한 이미지에 첨부 된 텍스트를 분석합니다. 시간이 지남에 따라 A.I. 왜 누군가가 이미지 "행복한 파티"또는 "어색한 순간"에 태그를 붙일 수 있는지 이해하기 시작하지만이 아이디어는 도구가 더 많은 이미지를 분석함에 따라 더욱 정확해질 것입니다.

"불행히도, 우리는 충분한 데이터가 없기 때문에 아랍어 이미지의 감정 탐지 정확도가 낮아지는 경향이 있습니다"라고 Redi는 말했습니다.

더 많은 양의 데이터를 보유한 언어에서 Redi 팀은 흥미로운 패턴을 발견했습니다. 프랑스어와 스페인어와 같은 로맨스 언어는 비슷한 방식으로 자신을 표현하는 경향이 있었지만 사용자가 '탈세'라는 용어로 이미지를 식별 한 유일한 언어 인 것으로 나타났습니다.

언어 장벽은 아직도 A.I. 연구원. Google 번역을 사용하는 사람이라면 전환 언어가 그다지 간단하지 않음을 알 수 있습니다. 그러나 새로운 개발은 변화하고 있습니다. 페이스 북이 이번 여름에 단일 언어 소셜 네트워크에 대한 꿈에 더 가까워지면서 사용자를 위해 텍스트를 자동으로 번역하고 있습니다.

언어 장벽을 없애기위한 개발은 국제 의사 소통을 촉진하는 데 도움이 될 수 있지만 Redi와 같은 프로젝트에는 인간이 만든 정서 데이터를 대체 할만한 것이 없습니다.

$config[ads_kvadrat] not found