고려대학교

QUICK MENU
  • 로그인
  • 고려대학교
  • 도서관
  • KUPID

AI 인문학

AI를 위한 인문학의 역할 창출

연구목표

영미권 중심 데이터에 편향된 LLM의 한계를 극복하기 위해 한국학을 활용. 한국의 언어・문화・역사를 포괄하는 평가 도구의 개발은 소버린 AI시대, 한국의 정체성과 고유문화를 보존하는 방법으로 기능함. 또한 좋은 품질의 LLM 학습데이터를 선별하는 기준을 수립하여 LLM의 편향성을 극복하는 인문학적 방안을 모색함.

 

연구내용

한국 사회 이해도를 평가하는 벤치마크(LLM 평가데이터) 1종, LLM의 가치관을 평가할 수 있는 벤치마크 1종을 구축함.

  • ① 한국어, 한국사, 한국문화의 평가 영역, 문항 유형과 평가 기준 수립, 벤치마크 샘플 구축.
  • ② 검토와 추가 구축 작업을 통해 벤치마크 1종 구축. 각종 LLM을 대상으로 평가 실험 진행.
  • ③ 인간 평가 기준을 바탕으로 한국어 텍스트의 품질을 정의하고 LLM의 학습데이터를 설계.
  • ④ LLM의 가치 판단을 평가하기 위한 문항으로 구성된 벤치마크 1종 개발 및 실험.

 

 

전통시대 한국학 연구를 위한 AI 개발

연구목표

디지털 인문학의 실질적인 활성화를 위해 전통시대 문헌을 AI로 분석할 수 있는 기술적인 토대를 마련하는 것이 목표임.

기존 문헌 DB를 AI가 이해할 수 있는 학습데이터로 구축하고 기술 및 지식그래프를 제작 및 공유하여 새로운 연구생태계를 조성하고자 함.

 

연구내용

전통시대 문헌의 AI 학습데이터 구축 및 기술을 개발하고, 소버린 AI시대의 인문학 연구 주제와 방법론을 모색함.

  • ① 국사편찬위원회의 전통시대 문헌 DB를 AI가 이해할 수 있도록 재구성하고자 함. AI의 자연어 처리 기술(NLP)을 적용할 수 있도록 구조화된 학습데이터를 구축할 예정임.
  • ② 전통시대 문헌 토크나이저와 NER 개발 계획. 원거리 학습(Distant Supervision)으로 학습데이터 자동 구축 후 사전 학습 모델에 훈련시켜 전통문헌에 적합한 기술을 개발할 계획임.
  • ③ 개체와 개체 간 관계 추출(Relation Extraction)을 통해 지식구조화(Knowledge Construction) 후 개체(Node), 관계(Edge)로 지식그래프(Knowledge Graph)를 만들고자 함.
  • ④ 결과물 공유로 연구생태계 조성 및 소버린 AI시대 인문학 연구 주제와 방법론을 모색함.