NLP Paper (10) - GLUE

» NLP

[GLUE] GLUE: A MULTI-TASK BENCHMARK AND ANALYSIS PLATFORM FOR NATURAL LANGUAGE UNDERSTANDING

[GLUE] GLUE: 멀티 태스크 벤치마크와 자연어 처리를 위한 분석 플랫폼

해당 번역본은 정식 번역본이 아니며 개인이 공부를 위해서 번역한 내용으로 많은 오역, 오타가 존재합니다. 이러한 점을 감안해주시고 읽어주시면 감사하겠습니다.

Abstract

  • GLUE는 일반화 언어 이해 평가 벤치마크로써 존재하는 자연어 이해 태스크에 대한 모델들의 성능을 평가하는 도구들의 집합입니다.
  • 제한된 훈련 데이터셋이라는 점을 포함하여, GLUE는 일반화된 언어 지식을 공유하는 모델을 선호하고 격려하도록 만들어졌습니다.
  • GLUE는 또한 손글씨 진단 테스트를 포함하고 있는데 이를 통하여 모델의 세부적인 언어학적 분석이 가능합니다.
  • 연구진은 적용되는 방법들의 베이스라인을 전이성과 표현학습, 태스크마다 학습을 하였을 때, 더 나은 성능을 만드는지 평가합니다.

Introduction

  • 더욱 통합적인 모델을 개발하는데 다른 도메인의 다른 언어적 태스크를 실행하는 것을 학습할 수 있게 하는 것은 중요한 사안입니다.
  • GLUE 벤치마크는 NLU 태스크들의 집합으로 question answering, sentiment analysis, textual entailment 그리고 모델 평가, 비교, 분석 플랫폼을 제공합니다.