메타, ‘모든 언어인식기’ 기술 공개…1천600여개 언어 받아쓰기

댓글 2025-11-10 (월) 04:12:09

글꼴 크게 작게 인쇄 facebook twitter 구글

▶ 소규모 데이터로도 언어 추가 가능…오픈소스로 공개

메타 로고[로이터]

페이스북 모회사 메타가 1천 가지가 넘는 음성 언어를 인식할 수 있는 인공지능(AI) 기술을 선보였다.

메타의 기초AI연구(FAIR) 팀은 소수 언어 등 1천600개 언어를 인식해 문자로 받아쓸 수 있는 자동음성인식(ASR) 체계를 10일 공개했다.

메타는 모든 언어를 인식할 수 있다는 뜻을 담아 이 기술을 '옴니링구얼'(Omnilingual)이라고 명명했다.

메타는 옴니링구얼이 지원하는 언어 가운데는 AI 전사(轉寫·한 언어의 발음을 다른 문자 체계로 옮기는 과정) 기능이 제공된 적이 없는 '저자원 언어'(데이터가 부족하거나 연구 또는 기술지원이 미흡한 언어) 500종이 포함됐다고 설명했다.

이는 지금까지 주요 AI가 공식적으로 수십 가지 정도의 언어를 지원하는 데 그친 것과 대조적이다.

대규모언어모델(LLM)에 의존하는 현재의 생성 AI는 관련 데이터가 많은 고자원 언어에서는 잘 동작하지만, 그렇지 않은 저자원 언어에서는 구동이 제한적이다.

또 출시한 모델에 새로운 언어 지원을 추가하려면 전문가가 주도하는 미세조정을 거쳐야 하는 불편함도 있었다.

그러나 옴니링구얼은 소량의 음성-문자 데이터 쌍만 있더라도 기본적인 수준의 음성 인식 기능을 쓸 수 있다는 것이 메타의 설명이다.

다만, 메타가 공개한 자료를 보면 옴니링구얼의 저자원 언어 문자 오류율은 고자원 언어보다는 상당히 높은 수준이다.

고자원 언어 249종과 중자원 언어 881종에서는 오류율 10% 미만인 언어가 95%에 달했지만, 저자원 언어 546종에서는 오류율 10% 미만인 언어가 36%에 불과했다.

메타는 이날 옴니링구얼에 적용된 매개변수 70억 개 규모 음성 인코더를 누구나 활용할 수 있도록 오픈소스로 풀었다. 음성 데이터를 자동으로 AI가 이해할 수 있는 벡터 데이터 형태로 정렬하는 도구다.

또 소수 언어 350종의 음성자료 말뭉치(corpus)도 공개했다.

<연합뉴스>

건전한 댓글 문화 운영 원칙

댓글 안에 당신의 성숙함도 담아 주세요.

'오늘의 한마디'는 기사에 대하여 자신의 생각을 말하고 남의 생각을 들으며 서로 다양한 의견을 나누는 공간입니다. 그러나 간혹 불건전한 내용을 올리시는 분들이 계셔서 건전한 인터넷문화 정착을 위해 아래와 같은 운영원칙을 적용합니다.

1. 댓글 삭제

자체 모니터링을 통해 아래에 해당하는 내용이 포함된 댓글이 발견되면 예고없이 삭제 조치를 하겠습니다.

타인에 대한 욕설 또는 비방
인신공격 또는 명예훼손
개인정보 유출 또는 사생활 침해
음란성 내용 또는 음란물 링크
상업적 광고 또는 사이트/홈피 홍보
불법정보 유출
같은 내용의 반복 (도배)
지역감정 조장
폭력 또는 사행심 조장
신고가 3번 이상 접수될 경우
기타 기사 내용과 관계없는 내용

2. 권한 제한

불건전한 댓글을 올리거나, 이름에 비속어 및 상대방의 불쾌감을 주는 단어를 사용, 유명인 또는 특정 일반인을 사칭하는 경우 이용에 대한 차단 제재를 받을 수 있습니다. 차단될 경우, 일주일간 댓글을 달수 없게 됩니다.
명예훼손, 개인정보 유출, 욕설 등 법률에 위반되는 댓글은 관계 법령에 의거 민형사상 처벌을 받을 수 있으니 이용에 주의를 부탁드립니다.

렌트/리스/하숙
구인구직
중고차
전문업체

오늘의 1면

트럼프 집권 후 첫 피격 위기…2년 만에 벌써 3번째
25일 백악관 출입기자단 만찬 행사장에서 벌어진 총격 사건은 …

오피니언

홍진배 정보통신기획평가원장
[로터리] 방산 AI가 국방력 좌우한다
오세정 전 서울대 총장 물리천문학부 명예교수
AI 기술의 위험성에 대비해야
박시진 서울경제 국제부 차장
[동십자각] 속도 파는 아마존, 속도 중독 한국

정숙희 논설위원
“인생은 거대한 농담” 베르디의 ‘팔스타프’
파리드 자카리아
중국의 눈으로 본 트럼프의 혼란스러운 이란 전쟁
김동찬 시민참여센터 대표
[미국은 지금] 푸틴의 러시아, 미국의 롤모델이 될 것인가?

이전 다음

1/3

지사별 뉴스

위클리 라이프

접수만 해도 ‘서울 왕복 항공권’ 응모…LA 한국 명의 건강설명회 5월 개최
무릎 통증으로 계단 오르내리기가 힘들거나, 시야가 흐려 일상생…

자동차

현대차·기아, 3월 美판매 감소에도 나란히 ‘역대 최고 1분기’
현대차와 기아가 3월 미국 시장에서 다소 주춤한 판매고를 올렸…

x

로그인

회원가입

Koreatimes.com 서비스는 Ktown1st.com과 통합계정입니다. 계정이 없으신 분은 회원가입을 해 주세요.

하단의 스팸방지코드(recaptcha)를 클릭해주세요.

회원가입

San Francisco - 사회

메타, ‘모든 언어인식기’ 기술 공개…1천600여개 언어 받아쓰기

댓글 안에 당신의 성숙함도 담아 주세요.

오늘의 1면

미주 한국일보 지면보기

지사별 뉴스

x 로그인 회원가입 Koreatimes.com 서비스는 Ktown1st.com과 통합계정입니다. 계정이 없으신 분은 회원가입을 해 주세요.

통합회원 전환 안내

비밀번호 재설정

x

로그인

회원가입

Koreatimes.com 서비스는 Ktown1st.com과 통합계정입니다. 계정이 없으신 분은 회원가입을 해 주세요.