페이스북 모기업인 메타플랫폼이 100여 개 언어를 통번역하는 인공지능 모델을 출시했다.
메타는 22일 '심리스M4T'라는 이름의 새로운 AI 모델을 홈페이지를 통해 공개했다. M4T는 '대규모 다국어 및 멀티모달 기계 번역'을 뜻하며 100여 개 언어를 지원한다.
텍스트를 텍스트로 번역하거나 스피치를 텍스트로 바꿀 때 100개 언어가 제공된다. 다만 텍스트를 스피치로 바꾸거나 스피치를 스피치로 통역할 때는 35개 언어만 지원한다. 영어, 중국어, 스페인어, 포르투갈어, 일본어 등 사용자가 많은 언어뿐만 아니라 한국어, 스웨덴어, 태국어 등 여러 언어를 지원하고 있다.
메타는 "이전에는 서로 다른 모델에서만 사용할 수 있었던 기술을 결합해 100개 언어를 지원할 수 있도록 했다"며 "이는 언어 차이를 넘어 실시간 의사소통을 가능하게 하는 잠재적 기반이 될 것"이라고 설명했다.
심리스M4T는 총 47만 시간 이상의 데이터를 포함한 심리스얼라인이라는 데이터셋을 통해 학습됐다. 텍스트 데이터는 위키피디아, 뉴스 등에서 추출된 문장들에서 나왔으며 음성 데이터는 공개된 웹 데이터에서 얻은 400만 시간의 원본 오디오에서 수집됐다. 마크 저커버그 메타 최고경영자(CEO)는 자신의 페이스북을 통해 "이 모델을 순차적으로 페이스북, 인스타그램 등에 적용할 것"이라고 밝혔다.
메타가 공개한 심리스M4T 데모는 특정 언어로 말하면 이것을 3가지 언어로 동시에 통 번역해준다. 한국어로 '안녕하세요'라고 말하면 영어, 일본어, 중국어로 번역된 텍스트와 스피치가 모두 생성된다.
메타에 따르면 심리스M4T의 능력은 비슷한 음성 언어인식 모델은 오픈AI의 위스퍼보다 뛰어나다. 다만 각 언어 간 번역 품질에 대해서는 공개하지 않았다. AI를 이용해 언어를 통번역하는 서비스는 이미 많이 출시돼 있다. 하지만 심리스M4T처럼 100여 개 언어의 음성까지 인식해 제공하는 서비스는 없었다.
※ 출처: 매일경제
'아이티 늬우스' 카테고리의 다른 글
Samsung Elec to face off with Apple after iPhone 15 launch in Sept. (0) | 2023.08.31 |
---|---|
기업용 챗GPT 나왔다... B2B 경쟁 후끈 (0) | 2023.08.30 |
AI가 그린 예술작품, 저작권 보호 못 받아 (0) | 2023.08.22 |
해외AI와 다국어 공동개발... 돌파구는 '멀티엔진' (0) | 2023.08.21 |
꼬마빌딩, 골드바, 명품백... 이제는 코인으로 (0) | 2023.08.19 |
댓글