인공지능 개발자 수다(유튜브 바로가기) 자세히보기

논문요약

[논문 요약] 학생 맞춤형 교육 콘텐츠 (Automatic Concept Extraction for Domain and Student Modeling in Adaptive Textbooks)

Suda_777 2022. 12. 6. 19:23

목차

    반응형

    논문 정보

    • 논문 링크
    • 제목: 적응형 교과서에서 도메인 및 학생 모델링을 위한 자동 개념 추출
    • 날짜: 2021.12
    • 설명: 교육분야 NLP 연구

    0. Abstract

    • 최근 연구
      • 디지털 교과서의 인기가 높아짐
      • 독자의 학습 방식에 맞춰 적응형 교과서 개발
      • 학생 모델링, 적합한 네비게이션, 콘텐츠 추천시스템 등
    • 본 논문
      • FACE 를 제시
      • supervised feature-based
      • 자동 개념 추출

    1. Introduction

    • ITS 시스템 (인텔리전트 튜터링 시스템)
      • 도메인, 학생 모델링
    • 적응형 교과서 1세대
      • 내비게이션 서포트
      • 콘텐츠 추천
      • 전문가가 라벨링 해야하는 한계가 있음
    •  지난 10년간 변화
      • 전문가 라벨링 없이 자동으로 핵심 구문 추출하기 위해 노력
    • 현 연구
      • 교과서에서 개념 키워드를 추출
      • Concept annotation
        • 엄격하고 체계적으로 주석을 달았음
      • Concept extraction
        • 주석이 달린 개념을 추출하기 위해 매우 포괄적인 피쳐 셋을 사용
      • Extraction evaluation (추출 모델 평가)
      • Student modeling evaluation (학생 모델링 평가)

    2. Jim Greer, Student Modeling, and Knowledge-Based Hypermedia

    • 적응형 교과서
      • 지식 기반 하이퍼 미디어의 한 분야임
      • 유저의 지식에 적응하는 능력 관련 연구가 많음
    • Jim의 연구
      • 지능형 튜터, 학생 모델링 관련 연구
      • 개인화된 웹 기반 교육 시스템에 영향을 미침

    3. Adaptive Textbooks and Concept Extraction

    3.1. Adaptive Textbooks

    • 학생들의 행동을 추척
      • 학생에게 관련 페이지로 안내, 지식 제공
      • 수동으로 주석을 달았음(한계점)
    • 교과서에서 개념 추출 접근 방식 사용
    • 현 연구 방법
      • 디지털 교과서의 고유한 특징을 활용해 추출 방식 개선
      • 도메인과 학생 모델 모두 사용 가능한 개념 추출(concept extraction) 방식

    3.2. Concept Extraction

    • 데이터 전처리 및 핵심 문구 목록 추출
      • 목표: 후보 수를 적게 유지, 모든 잠재적 후보를 얻기
      • 후보를 점수화
        • 비지도학습: 그래프 기반
        • 지도학습: 딥러닝 (많은 양의 데이터가 필요한 한계점)
    • 순위 점수 기반 문구 결정
    • educational ontology 자동 구성: 텍스트마이닝, 자연어처리 기술 필요

    4. The Dataset

    • Introduction to Information Retrieval 책 처음 16장

    5. Automatic Concept Extraction

    5.1 The Task Formulation

    • 핵심 문구 추출, 개체명 인식 Task와 비슷함
    • 영역 간의 경계를 정의 하기 어렵
    • 추출된 후보 목록에 대한 이진 분류 문제로 재구성

    5.2. The Framework

    • 전처리
    • 데이터 준비
    • Feature extraction
    • Model training for concept classification
      • 로지스틱 회귀 모델

    5.3 Features

    5.3.1 Linguistic features

    • POS
      • 후보자의 품사구조를 인코딩함
    • Context
      • 후보의 주변 컨텍스트를 설명함
    • Length of candidate
      • 후보가 보유한 토큰 수

    5.3.2 Statistical features

    • Frequency : 세션에서 용어가 몇번 나오는지
    • Collection frequency: 전체 교과서에서 몇번 나오는지
    • Term frequency-inversed document frequency: informativeness를 측정
    • Language model

    5.3.3 외부 리소스

    • 이하 생략

    6. Static Evaluation: The Closeness of FACE to Expert Annotations

    • 전문가주석, FACE가 비슷한지 비교 평가
    • 이하생략

    7. Dynamic Evaluation: How Well FACE Works for Student Modeling

    • FACE가 학생 모델링에 잘 작동하는지 평가
    • 이하 생략

    8. Conclusions and Future Work

    • FACE가 학생 모델링이 잘 되었는지 평가함
    • 앞으로 계획은 다운스트림 task 에 대한 조사 할 것
    반응형