KAIST, 점자 번역 엔진 ‘K-Braille’ 개발
한국 점자 규정 대응 자동 점역 기술
1만7000여 문장 검증서 정확도 100%
KAIST는 융합인재학부 가현욱 교수 연구팀이 일반 문자를 점자로 변환하는 차세대 점자 번역 엔진 ‘K-Braille’을 개발했다고 13일 밝혔다.
점역은 책과 문서, 웹페이지 등에 쓰인 일반 문자를 시각장애인이 읽을 수 있는 점자로 변환하는 기술이다. 그러나 한국어 점자 규정은 띄어쓰기와 기호, 외국어 표기 등 다양한 예외 규칙이 있어 자동 점역 정확도를 높이기 어려운 문제가 있었다.
기존 점역 프로그램은 문자와 기호를 단순 규칙에 따라 치환하는 방식이어서 한글과 외국어가 혼용된 문장이나 복합 기호 처리에서 오류가 발생하는 경우가 있었다.
연구팀이 개발한 K-Braille은 형태소 분석과 문장 구조 분석을 활용해 문장의 맥락을 이해한 뒤 점자로 변환하는 방식이 특징이다. 이를 통해 외국어 혼용 문장이나 복잡한 기호 조합, 단위 표기 등 다양한 예외 상황을 보다 정확하게 처리할 수 있다.
연구팀은 국립국어원이 구축한 ‘묵자-점자 병렬 말뭉치(NLPAK)’ 데이터를 활용해 기술 정확도를 검증했다. 일반 문자와 점자가 짝을 이루는 문장 1만7943개를 대상으로 평가한 결과 점자 규정 준수율이 100%를 기록했다. 점역 형태소 구조 유사도도 평균 99.81%로 나타났다.
또 국립국어원의 공식 점역 프로그램 ‘점사랑 6.3.5.8’과 동일한 문장 세트로 비교 검증한 결과에서도 더 높은 점역 일치율을 보였다.
가현욱 교수는 “점자는 시각장애인에게 세상을 읽는 언어와 같은 존재”라며 “앞으로 수학 수식과 과학 기호, 음악 악보까지 처리할 수 있는 점역 기술로 발전시킬 계획”이라고 말했다.
연구팀은 향후 점자 파일 형식의 한계를 개선한 새로운 전자 점자 파일 포맷 ‘.brfx(Braille File eXtended)’ 생태계 구축도 추진할 계획이다.
또 K-Braille 엔진을 공공기관과 교육청, 점자 도서관, 보조기기 제조사 등과 협력해 사회에 무상 제공할 방침이다. 이를 통해 시각장애인의 정보 접근성을 높이는 ‘포용적 인공지능’ 기술로 확산한다는 계획이다.