학생부 파고든 AI, 대학 서류 평가 흔들까

2025-12-10 13:00:06 게재

질 좋은 탐구 활동 급증했지만 면접서 진위 확인 … 고난도 주제만으론 경쟁력 없어

인공지능(AI)은 이제 학생들의 일상 속 학습 도우미로 자리 잡았다. 챗GPT 뤼튼 제미나이 퍼플렉시티 등 AI 플랫폼은 주제 탐색부터 자료 조사 보고서 작성까지 탐구 활동 전반을 돕고 있다. 정기고사와 수능 면접 예상 문제 확보에도 활용된다. 교사들도 학생부 작성에 AI를 활용하면서 학생부 곳곳에 AI가 영향을 미치고 있다. 올해 수시 학생부종합전형에서 파장이 예상됐고 서류 평가를 실시하는 대학도 고민이 깊었다. 앞으로 학생부에 AI가 더 티나지 않게 스며들 가능성이 높다. AI 시대를 맞아 학생부 기록의 신뢰성에 의문을 제기하는 목소리도 나온다. 이전과 달라진 학생부 기록과 대학의 서류 평가 방향 등 AI가 가져온 변화를 짚어봤다.

수시 모집 결과가 속속 발표되는 가운데 대학들은 2026학년 대입 서류 평가에서 학생부 변화가 크지 않았다는 입장을 내놓고 있다. 종합전형에서 성취도나 다른 기록과 맥락을 같이한다면 AI 플랫폼을 활용한 난도 높은 주제나 활동이 의미 있게 평가받을 수 있지만 단편적인 기록만으로는 긍정적인 평가를 받기 어렵다는 게 대학의 설명이다.

◆탐구 주제 난도 높아졌지만 큰 변화 체감 못해 = 일상에서 AI가 보편화되면서 2026학년 대입 서류 평가를 앞두고 우려의 목소리가 적지 않았다. 그러나 예상과 달리 학생부는 변화가 크지 않았다는 의견이 다수였다. 다양한 AI 서비스를 대중이 적극 활용하기 시작한 시점이 올해부터여서 2026 대입을 치른 고3은 3학년 1학기 학생부만 영향을 받았기 때문으로 분석된다.

이재원 동국대 책임입학사정관은 “종합전형은 단편적인 기록으로 평가하는 전형이 아니므로 학생부 자체의 변화가 감지되진 않았다”고 설명했다. 다만 일부 학생의 기록에서 대학 수준의 교육과정을 담은 주제가 다소 늘어난 인상을 받았다고 덧붙였다.

김지윤 덕성여대 입학사정관은 “올해는 탐구 주제 설정이나 활동이 교과 성적이나 성취도보다 더 깊이 있는 사례를 다수 접했다”며 “종합전형은 활동 자체보다는 성취 수준과 3년간의 다양한 활동, 그리고 교사 평가 등 학생부의 다른 기록을 함께 보며 맥락을 고려해 평가한다”고 말했다.

이치우 비상교육 입시평가소장은 “올해 상담을 하면 학생부가 굉장히 간결하고 매끄럽게 읽혔다”며 “예전에는 내용이 많고 복잡해 핵심이 잘 드러나지 않았다면 올해는 문장 간의 연결성이나 가독성이 확실히 좋아졌다”고 전했다.

학생부에 AI를 활용한 듯한 탐구 활동뿐 아니라 AI에 대한 언급도 늘었다. 방유리나 건국대 입학사정관은 “작년에 아두이노나 키트를 활용한 활동 기록이 많았다면 올해는 교육 사회 과학 문화 등 영역과 관계없이 AI를 활용한 문제 해결 방안이나 AI를 활용한 산출물 같은 기록이 많았다”고 전했다.

다만 AI 덕분에 데이터를 도출하는 것은 수월해졌지만 단순 짜깁기만으로는 학생 개인의 특성을 드러내기 어렵다는 게 대학의 입장이다. 허철 진학사 입시전략연구소 수석연구원도 “올해 학생부 세특이 학생에 대한 교사의 관찰이나 느낌이 배제되고 기록 중심으로 나열한 느낌을 받았다”고 밝혔다.

입학사정관들은 학생부 평가 과정에서 종종 이 학생이 활동을 직접 했을까라는 의구심이 들었다고 털어놓았다. 면접형 종합전형을 운영하는 대학은 서류 평가에서 생긴 궁금증을 학생부 기반 면접에서 진위 여부를 확인해 해소한다. 방 입학사정관은 “학생들은 거짓말을 못한다”며 “본인이 주도적으로 하지 않은 활동인데 마치 주도적으로 참여한 것처럼 기록된 내용과 관련해 질문을 받으면 티가 난다”고 전했다.

다만 100% 서류형 전형은 평가자가 직접 확인할 방법이 없어 서류 평가에서 판단을 내려야 한다. 권영신 성균관대 입학사정관실장은 “서류 평가는 학생부에 대한 신뢰를 기반으로 하므로 설령 AI를 활용해 과장한 기록이 있어도 믿을 수밖에 없다”며 “다만 종합전형은 단편적인 기록 하나하나에 집중하지 않고 학생의 성취도와 과목 선택, 세특 기록 등 다양한 정보들을 종합해 평가한다”고 강조했다.

◆AI가 학습 도우미로 자리 잡아 = 최근 일선 학교에선 단순한 검색이나 자료 수집을 넘어 생활 전반에 AI 활용이 확대되고 있다. 진학닷컴이 10월 고등학생 351명을 대상으로 실시한 설문 조사 결과 학교생활에서 AI 사용 빈도를 묻는 질문에 응답자의 78.1%가 대부분 또는 매번 사용한다고 답했다.

특히 수행평가나 학생부 준비 시 가장 많이 사용하는 수단을 묻는 질문에서 AI가 58.4%로 1위를 차지했다. 검색 엔진 20.8%와 논문 자료 사이트 10.5%보다 크게 앞섰다. 다만 AI 결과물을 그대로 사용하기보다는 가공하고 재구성한다고 답한 비율이 80%에 달했다.

서울 지역 일반고 3학년 정윤지 학생은 “예전에는 자료를 찾는 데 시간을 많이 투자했지만 지금은 필요한 자료를 몇 분이면 쉽게 찾을 수 있다”며 “검색된 자료에 관심 있게 읽었던 도서나 연관된 교과 단원 등 조건을 추가하면서 차별화된 자료를 얻는다”고 밝혔다.

오창욱 대동고교사는 “예전에는 교과와의 연관성과 진로 관심 분야를 바탕으로 탐구 주제를 찾아가고 보고서를 완성해가는 과정에서 학생 간의 역량 차이가 크게 나타났다면 최근에는 AI 활용으로 그 간극이 줄었다”고 설명했다. 다만 “학생마다 관심 분야나 성향 태도가 다른데 결과물을 보면 비슷한 소재 내용으로 개인의 특성을 잘 드러내지 못하는 경우도 많다”며 “AI를 활용하되 검색된 내용을 그대로 베끼는 것이 아니라 자신의 색을 입히는 작업이 필요하다”고 조언했다.

대학가에서 AI를 활용한 부정행위가 드러나 재시험을 보는 사례가 속출한 데 이어 서울의 한 고교에서도 태블릿PC를 활용한 국어 수행평가 중 AI 부정행위가 적발돼 논란이 일었다. 학생들이 챗GPT로 검색한 답변을 옮겨 적거나 메모장에 미리 복사해둔 내용을 수행평가지에 붙여 넣었다고 자백하면서 시험은 무효가 됐다.

오 교사도 “교내에서 영어 작문 수행평가를 진행할 때 수행평가에 필요한 프로그램 외에 크롬 페이지를 열어 AI를 활용하거나 번역기를 돌려 결과물을 만드는 경우를 종종 목격한다”고 토로했다. 학교 현장에서 AI 활용이 빠르게 확산되고 있지만 초중고교 학생을 위한 활용 지침이 따로 없다는 점도 문제로 지적된다. 교육부와 과학기술정보통신부는 AI 도입 및 활용을 위한 가이드라인을 연구 중이며 내년 새 학기 시작 전에 학교 현장에 배포하겠다고 발표했다.

교사 역시 학생 평가와 학생부 기록 과정에서 AI 활용 빈도가 급증하는 추세다. 최근에는 특정 플랫폼이 학생부 전용 기능을 탑재하거나 교사 연수에서 80여 명의 세부능력 및 특기사항을 1~2분 만에 생성하는 등 기술 의존도가 높아지고 있다.

교육부는 지난 7월 학생부 서술형 항목 관련 유의사항 안내를 각 시도교육청에 전달하며 AI 활용에 대한 기본 지침을 제시했다. 해당 자료는 학생부 서술형 항목은 교사가 평소 학생을 직접 관찰하고 평가한 내용을 바탕으로 작성해야 한다고 명시했다. 아울러 작성 과정에서 윤문 등 보조적으로 생성형 AI를 사용할 수 있으나 학생부 기재 내용에 대한 최종 책임은 교사에게 있다고 강조했다.

◆학생부 신뢰 기반 유지가 관건 = 향후 학생부에 AI의 영향이 더 커질 가능성이 농후한 가운데 대학은 어떤 대응책을 마련하고 있을까. 결국 어떤 형태로 AI가 도입되더라도 최종 평가는 사람 즉 평가자의 판단이 필수적이라는 데 대학은 대체로 의견을 같이한다.

강경진 서강대 책임입학사정관은 “종합전형은 학생부에 대한 신뢰를 기반으로 운영된다”며 “교사의 관찰과 기록을 신뢰하지 않으면 종합전형 자체가 성립하기 어렵다”고 강조했다. 다만 AI의 영향력이 커질수록 학생부를 어떻게 바라볼 것인지에 대한 논의가 불가피하고 팩트 중심의 평가 비중이 더 커질 가능성도 있다고 덧붙였다.

한편 대학 차원의 AI 기반 서류 평가나 AI 판독 프로그램 도입과 같은 이슈가 새롭게 부상할 가능성도 있다. AI를 활용한 평가는 많은 지원자의 학생부를 신속하게 분석하고 평가자별 편차를 줄일 수 있다는 장점이 있다. 그러나 원하는 결과를 얻기 위해 방대한 데이터를 학습시키는 과정에서 데이터 유출이나 오남용이 발생할 가능성이 존재한다. 특히 외부 기관이 AI를 운영하거나 클라우드 기반 외부 서버에 데이터가 저장될 경우 위험성은 더욱 커진다. 때문에 대학은 AI 평가 도입에 신중한 태도를 보이고 있다. 설령 AI가 평가 과정의 일부에 활용된다 하더라도 활동의 동기와 과정에서의 성장 그리고 기록 간 연계성 등의 정성적 요소는 대체하기 어렵다는 시각이 지배적이다.

입학사정관들은 “AI가 이미 광범위하게 활용되는 상황에서 학생부의 신뢰성 자체를 문제 삼는 것은 실효성이 없다”며 “대학이 학생부를 신뢰하는 만큼 교사도 책임감을 갖고 직접 관찰한 학생의 모습에 기반해 평가권을 올바르게 행사해야 한다”고 입을 모았다. 이어 “교육부 차원에서도 올바른 AI 활용 교육과 윤리 교육을 제도화해 학생부 기록의 진정성과 고유성을 지킬 수 있도록 해야 한다”고 강조했다. 무엇보다 수업 중 특이점이 없더라도 교사가 모든 학생의 세특을 의무적으로 기록해야 하는 현재의 고교 학생부 기재 구조도 재검토할 필요가 있다고 부연했다.

진수환 강릉명륜고 교사는 “학생들은 보고서 작성이나 추가 활동이 곧 종합전형의 경쟁력을 높이는 과정이라고 생각하지만 평가 관점에서 핵심은 활동의 양이 아니라 수업에서 출발해 어떻게 사고를 확장했는지와 탐구 과정에서 어떤 변화와 성장을 보였는지에 있다”고 조언했다. 중요한 것은 주제가 아니라 수업에서 확장된 모습과 탐구 과정이며 주제 역시 거창할 필요가 없다는 설명이다. 허철 진학사 입시전략연구소 수석연구원은 “AI의 기능은 적극적으로 활용하되 오류를 확인하는 과정과 더불어 탐구를 시작하게 된 동기와 과정에 대한 성찰이 필요하다”며 “AI 활용이 보편화될수록 AI가 개입할 수 없는 학생부의 스토리와 개별화 요소가 오히려 종합전형 평가의 핵심이 될 것”이라고 전망했다.

김기수 기자·민경순 내일교육 리포터 hellela@naeil.com

김기수 기자 기사 더보기