跳至主要内容

플리토, AI 언어데이터 기술로 4년 연속 ‘국립국어원 병렬 말뭉치 사업’ 선정

 

플리토, AI 언어데이터 기술로 4년 연속 ‘국립국어원 병렬 말뭉치 사업’ 선정

  • 기자명 장세민 기자 
  •  
  •  입력 2024.03.21 14:02
  •  
  •  댓글 0
  •  
  •  좋아요 0
 
(사진=플리토)
(사진=플리토)

인공지능(AI) 전문 플리토(대표 이정수)는 국립국어원 주관 ‘한국어-외국어 병렬 말뭉치 구축 사업’ 수행기업으로 4년 연속 선정됐다고 21일 밝혔다.

한국어-외국어 병렬 말뭉치 구축은 문화체육관광부 산하 국립국어원이 언어문화산업을 활성화하기 위해 2021년부터 진행하는 사업이다. AI 기술을 활용한 언어 데이터 환경 구축을 목표로 한다.

올해 사업은 경희대학교산학협력단이 주 수행, 플리토가 참여하는 형태로 진행한다. 46억원 규모로, 플리토는 그중 20억9000만원에 해당하는 병렬 말뭉치 구축을 맡는다.

플리토가 수행하는 말뭉치 구축 언어는 총 9개로, 베트남어, 인도네시아어, 태국어, 인도 힌디어, 캄보디아 크메르어, 필리핀 타갈로그어, 러시아어, 우즈베크어, 영어 등이다. 언어별로 약 140만 어절로 총 1260만 어절을 구축할 계획이다. 올해 사업에서도 지난해와 마찬가지로 기존 언어 외에 영어 데이터를 추가 구축, 한국어-영어 병렬 말뭉치 데이터의 활용도를 극대화할 예정이다.

한편 플리토는 프로젝트 경험, 자체 플랫폼을 활용한 데이터 구축 능력, 전문 번역가 및 언어 전문가를 보유한 점 등을 토대로 안정적인 말뭉치 구축 능력을 인정 받아 4년 연속 참여 기업으로 선정됐다는 설명이다.

이번 사업으로 구축한 언어 데이터는 번역 소프트웨어 및 자연어처리 기술 등 정부의 문화산업 확산을 위한 AI 개발에 활용될 전망이다. 또 아시아 권역에서 저자원언어로 분류되는 언어 데이터를 풍부하게 구축, 언어적 불균형을 해소하고 국가 간 문화 교류를 효과적으로 촉진할 계획이다.

이정수 플리토 대표는 “언어 데이터 구축 경험과 전문성을 인정 받아 4년 연속으로 정부 말뭉치 사업에 참여할 수 있어 영광”이라며 “정부 육성 AI 분야에서 필요로 하는 양질의 언어 데이터를 지속적으로 공급해 국내 AI 산업이 글로벌 우위에 설 수 있도록 선도적 역할을 수행하겠다”라고 말했다.

장세민 기자 semim99@aitimes.com

评论

此博客中的热门博文

[인터뷰] 강위원 “250만 당원이 소수 팬덤? 대통령은 뭐하러 국민이 뽑나”

‘영일만 유전’ 기자회견, 3대 의혹 커지는데 설명은 ‘허술’

윤석열의 '서초동 권력'이 빚어낸 '대혼돈의 멀티버스'