고려대, 정치권 ‘성인지 감수성’ AI로 평가한다

2025-12-27 17:26:19 게재

국회 발언 6천건 분석 … 정치·언어학 융합 연구로 정치 담론 분석 기준 제시

고려대학교(총장 김동원) 글로벌한국융합학부 박선경 교수, 언어학과 송상헌 교수, 정치외교학과 강우창 교수와 KAIST 디지털인문사회과학부 김태균 교수 연구팀이 정치 담론에서의 성인지 감수성을 체계적으로 평가할 수 있는 데이터셋을 구축하고, 이를 활용해 생성형 인공지능의 판단 능력을 검증했다.

26일 고려대에 따르면 최근 생성형 인공지능이 정치 담론 분석에 활용되고 있지만, 문화적 맥락에 따라 달라지는 성차별적 표현을 얼마나 정확히 인식하는지에 대한 검증은 충분하지 않았다. 특히 한국어 기반 성인지 감수성 평가 자원이 거의 없는 상황에서 이를 점검할 수 있는 기준의 필요성이 제기돼 왔다.

연구진은 1948년 제헌국회부터 2024년까지 76년간의 국회 회의록 1222건 가운데 젠더 관련 발화 6024개를 추출해 성인지 감수성 수준을 평가했다. 이를 바탕으로 성인지 감수성 수준이 반영된 데이터셋 ‘KOGENT(Korean GENder-sensitivity Tagged dataset)’를 구축했으며, 여성과 남성뿐 아니라 성소수자 관련 표현도 포함했다.

연구진은 KOGENT를 활용해 GPT-4 계열 언어모델의 성인지 감수성 판단 능력을 분석했다. 그 결과 GPT-4.1 모델은 성인지 감수성 수준이 높은 발언을 90% 이상 정확도로 분류했으며, 데이터셋에서 추출한 고품질 예시를 제공했을 때 성능이 더욱 향상되는 경향을 보였다. 연구진은 이를 통해 KOGENT가 성인지 감수성 평가를 위한 실증적 기준으로 활용될 수 있다고 설명했다.

송상헌 교수는 “정치학과 언어학이 인공지능을 매개로 결합된 연구”라며 “인공지능을 활용한 학제 간 연구의 한 사례”라고 말했다. 박선경 교수는 “겉으로는 중립적으로 보이지만 맥락상 편견을 담은 표현까지 분석 대상으로 삼았다는 점에서 기존 연구와 차별성이 있다”고 설명했다.

이번 연구는 교육부와 한국연구재단, 고려대학교 언어정보연구소의 지원을 받아 수행됐다. 구축한 데이터셋과 코드는 피그쉐어(Figshare)와 깃허브(GitHub)를 통해 공개됐다. 연구 성과는 네이처 자매지인 ‘사이언티픽 데이터(Scientific Data)’ 온라인판에 지난 11일 게재됐다.

장세풍 기자 spjang@naeil.com
장세풍 기자 기사 더보기