한국어학습자 '사람' 가장 많이 사용
2021-06-11 11:31:58 게재
국립국어원, 한국어 학습자 말뭉치 1차 구축 결과 공개
이번에 구축한 한국어 학습자 말뭉치 자료의 고빈도어를 분석한 결과, 표본 수가 가장 많은 5개 언어권(중국어 일본어 베트남어 영어 러시아어)의 한국어 학습자들이 많이 사용하는 단어(일반명사 기준)는 '사람'으로 나타났다. '사람' 다음으로 언어권별 일반명사 중 고빈도 어휘는 '친구 생각 때 일 공부 집'이 공통적으로 나타났다. 또 중국어권에서는 '사회', 일본어권에서는 '이야기', 베트남어권에서는 '여행', 영어권에서는 '시간', 러시아어권에서는 '가족, 남편' 등이 나타났다.
한국어 학습자들이 한국어를 사용할 때 가장 많이 오류를 범하는 것은 조사인 것으로 나타났다. 오류 주석 말뭉치에서 오류 빈도 상위 100건을 분석한 결과, 조사 오류가 전체 평균 45%로 가장 많은 것으로 나타나 한국어 학습자들이 한국어에서 조사 사용에 어려움을 겪고 있음을 알 수 있었다.
국립국어원은 한국어 학습자 말뭉치 1차 중장기 구축 결과를 바탕으로, 국가 언어자원으로서 한국어 학습자 말뭉치 구축과 활용의 체계적 절차를 마련하고자 2차 중장기 구축 사업 계획을 수립했다. 2021년부터 2025년까지 진행될 2차 중장기 사업에서는 한국어 학습자의 언어권별(일본어권·영어권·베트남어권·타이어권 학습자 확대)·수준별(학문 목적 고급 학습자 확대)·자료 유형별(구어 말뭉치 확대) 등 균형성을 확보해 560만어절을 추가 구축한다. 이를 통해 국가 수준의 한국어 학습자 말뭉치 총 1000만어절을 달성하는 것이 목표다. 한국어교육학계는 물론, 한국어교육용 인공지능 도구 개발 등 민간에서의 연구 개발을 위한 활용이 가능하도록 할 계획이다.
송현경 기자 funnysong@naeil.com
송현경 기자 기사 더보기