인공지능 개발자 수다(유튜브 바로가기) 자세히보기

논문요약

[논문 요약] 학생 맞춤형 교육 콘텐츠 (Automatic Concept Extraction for Domain and Student Modeling in Adaptive Textbooks)

Suda_777 2022. 12. 6. 19:23
반응형

논문 정보

  • 논문 링크
  • 제목: 적응형 교과서에서 도메인 및 학생 모델링을 위한 자동 개념 추출
  • 날짜: 2021.12
  • 설명: 교육분야 NLP 연구

0. Abstract

  • 최근 연구
    • 디지털 교과서의 인기가 높아짐
    • 독자의 학습 방식에 맞춰 적응형 교과서 개발
    • 학생 모델링, 적합한 네비게이션, 콘텐츠 추천시스템 등
  • 본 논문
    • FACE 를 제시
    • supervised feature-based
    • 자동 개념 추출

1. Introduction

  • ITS 시스템 (인텔리전트 튜터링 시스템)
    • 도메인, 학생 모델링
  • 적응형 교과서 1세대
    • 내비게이션 서포트
    • 콘텐츠 추천
    • 전문가가 라벨링 해야하는 한계가 있음
  •  지난 10년간 변화
    • 전문가 라벨링 없이 자동으로 핵심 구문 추출하기 위해 노력
  • 현 연구
    • 교과서에서 개념 키워드를 추출
    • Concept annotation
      • 엄격하고 체계적으로 주석을 달았음
    • Concept extraction
      • 주석이 달린 개념을 추출하기 위해 매우 포괄적인 피쳐 셋을 사용
    • Extraction evaluation (추출 모델 평가)
    • Student modeling evaluation (학생 모델링 평가)

2. Jim Greer, Student Modeling, and Knowledge-Based Hypermedia

  • 적응형 교과서
    • 지식 기반 하이퍼 미디어의 한 분야임
    • 유저의 지식에 적응하는 능력 관련 연구가 많음
  • Jim의 연구
    • 지능형 튜터, 학생 모델링 관련 연구
    • 개인화된 웹 기반 교육 시스템에 영향을 미침

3. Adaptive Textbooks and Concept Extraction

3.1. Adaptive Textbooks

  • 학생들의 행동을 추척
    • 학생에게 관련 페이지로 안내, 지식 제공
    • 수동으로 주석을 달았음(한계점)
  • 교과서에서 개념 추출 접근 방식 사용
  • 현 연구 방법
    • 디지털 교과서의 고유한 특징을 활용해 추출 방식 개선
    • 도메인과 학생 모델 모두 사용 가능한 개념 추출(concept extraction) 방식

3.2. Concept Extraction

  • 데이터 전처리 및 핵심 문구 목록 추출
    • 목표: 후보 수를 적게 유지, 모든 잠재적 후보를 얻기
    • 후보를 점수화
      • 비지도학습: 그래프 기반
      • 지도학습: 딥러닝 (많은 양의 데이터가 필요한 한계점)
  • 순위 점수 기반 문구 결정
  • educational ontology 자동 구성: 텍스트마이닝, 자연어처리 기술 필요

4. The Dataset

  • Introduction to Information Retrieval 책 처음 16장

5. Automatic Concept Extraction

5.1 The Task Formulation

  • 핵심 문구 추출, 개체명 인식 Task와 비슷함
  • 영역 간의 경계를 정의 하기 어렵
  • 추출된 후보 목록에 대한 이진 분류 문제로 재구성

5.2. The Framework

  • 전처리
  • 데이터 준비
  • Feature extraction
  • Model training for concept classification
    • 로지스틱 회귀 모델

5.3 Features

5.3.1 Linguistic features

  • POS
    • 후보자의 품사구조를 인코딩함
  • Context
    • 후보의 주변 컨텍스트를 설명함
  • Length of candidate
    • 후보가 보유한 토큰 수

5.3.2 Statistical features

  • Frequency : 세션에서 용어가 몇번 나오는지
  • Collection frequency: 전체 교과서에서 몇번 나오는지
  • Term frequency-inversed document frequency: informativeness를 측정
  • Language model

5.3.3 외부 리소스

  • 이하 생략

6. Static Evaluation: The Closeness of FACE to Expert Annotations

  • 전문가주석, FACE가 비슷한지 비교 평가
  • 이하생략

7. Dynamic Evaluation: How Well FACE Works for Student Modeling

  • FACE가 학생 모델링에 잘 작동하는지 평가
  • 이하 생략

8. Conclusions and Future Work

  • FACE가 학생 모델링이 잘 되었는지 평가함
  • 앞으로 계획은 다운스트림 task 에 대한 조사 할 것
반응형