Speechmatics는 AI를 사용하여 언어를 옮기고 Google을 능가합니다.

$config[ads_kvadrat] not found

15 I DON'T សុខ ស្រីនាង OFFICIAL MV YouTube

15 I DON'T សុខ ស្រីនាង OFFICIAL MV YouTube
Anonim

Speechmatics는 Google을 뒤쫓고 있습니다. 영국의 신생 기업은 지난 달 Automatic Linguist를 사용하지 않고 강력한 인공 지능을 사용하여 며칠 만에 음성 대 텍스트를위한 언어를 배울 수있었습니다. 팀은 생명을 변화시킬 잠재력을 지닌 세계에서 약 7,000 개 언어의 모든 기술에이 기술을 적용하고자합니다.

Speechmatics는 언어학 도구를 시작한 이래로 언어를 만드는 도전 인 Omniglot을 연구하고 있습니다. 지난 주,이 회사는 큰 이정표를 세웠습니다. 공식적으로 Google을 상대로 72 개의 고유 언어가 있습니다.

이 시스템은 기계 학습을 사용하여 오디오 데이터를 사본 사본과 대조합니다. 그런 다음 다른 언어의 언어 패턴을 사용하여 프로세스를 최대한 간단하게 만들고 사운드와 문법 구조 간의 유사점을 확인한 다음 새 언어에 적용합니다. 이 프로세스는 매우 효과적입니다. 예를 들어 힌디어에 대한 Speechmatics의 작업은 정확도가 80 %에 도달하는 데 단지 2 주가 걸렸습니다. 최종 제품이 Google의 노력에 대해 테스트되었을 때 실수가 23 % 감소했습니다.

역 Speechmatics의 CEO 인 Benedikt von Thüngen과 이야기를 나누었습니다.

어떻게 팀이 프로젝트에 착수 했습니까?

우리는 Omniglot 프로젝트를 6 주 후에 얼마나 많은 언어를 구축 할 수 있는지 알아보기위한 도전 과제로 시작했습니다. 빠른 속도로 확장하려는 경우 각 언어를 개별적으로 구축하는 전통적인 방식이 더 이상 실행 가능하지 않다는 것을 깨달았습니다. 이를 염두에두고 우리는 언어가 무엇인지, 언어가 어떻게 구성되어 있는지, 다른 언어간에 어떤 유사점이 있는지 다시 생각해야했습니다. 우리는 이러한 공통점을 사용하여 패턴을 확인하고 AI 기반 프레임 워크 인 자동 언어 작성자 (AL)가 6 주 동안 46 주를 정확하게 작성하거나 6 주 동안 하루에 1 개 언어를 구축 할 수있는 방법을 찾았습니다 !

이것이 Google의 노력과 어떻게 다른가요?

Google의 언어 구축 방식은 Google과 차별화되는 주요 측면 중 하나입니다. 우리가 언어를 개별적으로 (또는 '무차별 대항'이라고 부르는 것에 의해) 구축한다고 가정 할 때, 우리는 A. I.의 힘을 사용하고 있습니다. 언어 구축 프로세스를 간소화하고 신속하게 처리 할 수 ​​있습니다. 또한 Google과 같은 다른 서비스는 고유 한 언어가 아닌 방언을 만드는 데 중점을 두었지만 이전에는 큰 기술 회사가 제공하지 못했던 영역을 포함하여 전 세계의 고유 언어에 초점을 맞추고 있습니다.

이것에 대한 실제 응용 프로그램에는 어떤 것들이 있습니까?

우리는 지금까지보다 광범위하게 우리의 서비스를 제공하고 모든 사람에게 자동 음성 인식 (ASR)을 제공 할 수있는 기술과 지식을 보유하고 있습니다. 문맹 퇴치 율이 낮은 국가에서 특히 유용합니다. 이전에는 사용할 수없는 음성 - 텍스트 기술을 사용하여 의사 소통하는 능력은 사람들에게 모든 변화를 가져올 수 있습니다. ASR 기술이 접근성 문제와 관련이있는 다른 실제 사례 - 전 세계의 청각 및 시각 장애가있는 사람들은 이제 전화기와 같은 단순한 장치를 사용하여 주변 사람들과 상호 작용할 수 있습니다.

이렇게하면 영어와 같은 잘 덮인 언어의 정확성이 향상됩니까?

우리가 더 많은 언어를 개발하면서, 우리의 A.I. 프레임 워크는 점점 더 언어 적 특징과 패턴을 식별하는데 능숙해질 것입니다. 우리는이 지식을 사용하여 영어를 포함한 현재의 언어 기반을 계속 완성 할 것입니다.

이렇게하면 Google Pixel Buds의 실시간 번역 도구와 같은 기능이 향상 될 수 있습니까?

우리는 Omniglot과 같은 프로젝트가 앞으로 실시간 번역 도구를 향상시키는 데 도움이된다는 것을 확실히 알 수 있습니다. 언어의 도달 범위와 정확성을 높이는 데 더 많은 리소스가 투자되면서 번역 서비스 분야의 지속적인 개선이 이루어질 것입니다.

이 언어는 Klingon과 같은 언어로도 작동합니까?

우리는 아직 모든 회의실을 만들려고 노력하지 않았지만, 우리는 그들이 왜 일하지 않을지 아무 이유도 보이지 않습니다. 이러한 언어는 여전히 사람이 사용하기 때문에 일상적인 언어 (예: 음소의 수)와 유사한 구조 규칙 및 제약 조건을 따르므로 AL에 빌드를위한 충분한 데이터가 제공됩니다.

프로젝트를 오픈 소스로하고 있습니까?

아니, 우리는 그 계획을 가지고 있지 않다.

라이센싱은 어떻게됩니까?

Omniglot 프로젝트에서 제공되는 언어는 무료이며 상업적 목적으로 사용할 수 없습니다. 따라서 당분간은 라이센스가 부여되지 않습니다.

여기에서 다음 단계는 무엇입니까?

Project Omniglot은 우리를위한 시작일뿐입니다. 우리는 결국 세계의 모든 언어를 만들고 싶습니다. 그래서 우리는 그 목표를 향해 열심히 노력할 것입니다!

$config[ads_kvadrat] not found