랜덤 포레스트를 활용한 전남학생들의 인지능력 성취에 영향을 미치는 요인 탐색

랜덤 포레스트를 활용한 전남학생들의 인지능력 성취에 영향을 미치는 요인 탐색
Photo by Tra Nguyen / Unsplash

송승훈(2024). 전남교육종단연구 제2회 학술대회 자료집.

이 연구는 랜덤 포레스트 기법을 활용하여 전남 지역 학생들의 인지능력 성취에 영향을 미치는 주요 요인을 분석한 연구 보고서입니다. 연구자는 기존의 선형 회귀 분석이나 다층 모형이 가진 복잡성과 한계를 극복하기 위해 다량의 데이터를 효과적으로 다루는 앙상블 학습 방식을 채택하였습니다. 

랜덤 포레스트(Random Forest)는 결정 트리(decision tree)를 기반으로 하는 앙상블(ensemble) 학습 기법입니다. 이 방법은 전체 데이터로부터 다수의 부트스트랩(bootstrap) 표본을 생성하고, 각 표본에서 도출된 개별 결정 트리들의 결과를 결합하여 종합적으로 분석함으로써 예측 성능을 높입니다.

랜덤 포레스트 기법은 교육종단연구와 같이 변수가 많고 복잡한 데이터를 다룰 때 다음과 같은 장점을 가집니다. 첫째, 예측 변수의 수나 종류에 제한 없이 투입할 수 있으며, 수백 개의 변수 중에서도 중요도와 상호작용을 효율적으로 검증할 수 있습니다. 둘째, 전통적인 회귀분석에서 다루기 힘든 선형성이나 단일 차원성 상호작용의 한계를 극복할 수 있습니다. 특히 SHAP(SHapely Addictive exPlanations) 값 등을 활용하면 개별 예측값에 대한 각 변수의 영향력을 정교하게 배분하여 해석할 수 있습니다. 셋째, 모델 내 결정 트리 구조를 통해 효율적으로 작동하며 범용적으로 활용이 가능합니다. 반면, 산출된 결과나 모수들이 어떤 이론적 기반을 갖는지 설명하기 어려운 '블랙박스' 모형이라는 점이 가장 큰 단점입니다. 또한, 학생과 학교 효과를 구분하는 등 다층모형으로 가능한 자료의 위계성을 반영하는 데는 한계가 있습니다. 전통적인 모델은 변수와 층위가 늘어날수록 모형이 지나치게 복잡해지고 검증이 어려워지는 반면, 랜덤 포레스트는 이를 효과적으로 처리합니다. 따라서 교육종단연구처럼 예측 변수가 방대한 경우, 초기 탐색적 데이터 분석(EDA) 단계에서 중요한 변수를 걸러내거나 상호작용을 파악하기 위해 랜덤 포레스트를 활용하는 것이 매우 효과적입니다.

이 연구는 전남교육종단연구(JELS) 1~6차년도 데이터를 활용하여 초등학교 4학년부터 중학교 3학년까지의 패널1(911명)과 중학교 1학년부터 고등학교 2학년까지의 패널2(1,138명) 자료를 분석 대상으로 삼았습니다. 분석의 종속변인은 국어, 수학, 사회, 과학 교과의 성취도이며, 예측변인으로는 학생 및 학부모 설문, 학교 기본 정보 등 약 30여 개의 변수를 투입하였습니다. 분석 도구로는 파이썬(Python)의 랜덤 포레스트(RandomForestRegressor) 모델을 활용하였으며, 개별 예측값에 대한 변수별 영향력을 정교하게 배분하여 해석하기 위해 SHAP(SHapely Addictive exPlanations) 라이브러리를 사용하였습니다.

분석 결과, 모든 패널과 교과 전반에서 '수업이해도'와 '학급수업분위기'가 학업 성취에 가장 강력한 긍정적 영향을 미치는 핵심 요인으로 나타났습니다. 반면, '게임시간'은 성취도에 일관되게 부정적인 영향을 주는 것으로 확인되었습니다. 특히 중·고등학생 단계인 패널 2에서는 메타인지, 정교화, 조직화와 같은 자기주도적 학습 전략이 성취도 향상에 기여하는 반면, 단순 암기식인 '시연' 전략은 오히려 부정적인 영향을 미치는 것으로 분석되었습니다.

분석 결과 중 패널2 수학 성취도 결과에 대한 시사점을 Google NotebookLM으로 요약하였습니다.

이러한 연구 결과는 전남 교육에 몇 가지 중요한 시사점을 제공합니다. 첫째, 학생들의 학업 성취를 높이기 위해서는 교실 내 수업 몰입도를 높이고 긍정적인 학습 분위기를 조성하는 현장 지원이 최우선되어야 합니다. 둘째, 상급 학교로 진학할수록 단순 암기보다는 메타인지 등 고차원적인 학습 전략을 익힐 수 있도록 돕는 교육적 개입이 필요합니다. 마지막으로, 적정 규모 학급에 대한 고민과 함께 학생들의 무분별한 게임 이용을 조절할 수 있는 생활지도 측면의 정책적 배려가 요구됩니다.

Read more

인천결대로자람학교 2차년도 종단연구

인천결대로자람학교 2차년도 종단연구

김성천, 강에스더, 김진철, 송승훈, 정해진, 최동규 등(2024). 인천광역시교육청. 이 보고서는 인천광역시교육청의 의뢰를 받아 한국교원대학교 산학협력단이 수행한 인천 결대로자람학교의 2차년도 종단연구 최종 결과물입니다. 연구진은 양적 분석과 질적 연구를 병행하여, 혁신미래교육 모델인 결대로자람학교가 학생의 행위주체성과 자기주도성, 교사의 교수학습 역량 등에 미치는 영향을 다각도로 검토하였습니다. 특히 기존의 단순 학업성취도 중심 평가에서 벗어나,

By Seunghun Song
중등 행복학교 성과분석을 통한 미래학교 모델 탐색

중등 행복학교 성과분석을 통한 미래학교 모델 탐색

김도영, 김성천, 송승훈, 김화정, 신선희, 이선옥, 조성준(2024). 경상남도교육청미래교육원. 본 연구는 경상남도교육청이 지난 10년간 운영해 온 경남형 헉신학교인 행복학교의 성과를 분석하고 이를 바탕으로 미래학교의 발전 방향을 제시하고 있습니다. 연구진은 중등 행복학교의 교육과정과 학교 문화가 일반 학교와 비교해 학생의 학습 동기와 학교 만족도를 높이는 데 유의미한 효과가 있음을 통계적으로 증명했습니다. 특히

By Seunghun Song
순천시 교육발전 지원사업 성과분석 및 모니터링

순천시 교육발전 지원사업 성과분석 및 모니터링

송승훈(2022, 2023, 2025). 전라남도 순천시. 제시된 자료는 순천시 교육발전(교육경비) 지원사업에 대한 성과를 정밀하게 진단하고 모니터링한 최종 보고서입니다. 해당 연구는 순천시청의 의뢰로 수행되었으며, 교육 예산이 지역 학생들의 학업 여건 개선과 복지 증진에 기여한 정도를 다각도로 분석하고 있습니다. 주요 내용은 교직원, 학생, 학부모를 대상으로 진행한 설문조사를 바탕으로 사업의 인지도와 만족도를

By Seunghun Song
전남농산어촌유학 성과분석 연구

전남농산어촌유학 성과분석 연구

송승훈(2023, 2025), 전라남도교육청. 전남농산어촌유학은 전남 이외 지역의 학생들이 전남 농산어촌의 청정한 자연에서 생태·환경 교육과 역량 중심의 맞춤형 교육과정을 경험하기 위해 최소 6개월 이상 전학하여 생활하는 프로그램으로, 2021년 전라남도교육청과 서울특별시교육청의 업무협약을 계기로 시작되었습니다. 이 사업의 운영 배경은 저출산으로 인한 학령인구 감소 및 폐교 위기에 처한 전남의 작은 학교들을 살리고,

By Seunghun Song