NLP와 벤치마크 데이터셋
NLP(Natural Language Processing, 자연어 처리)
NLP는 여러가지 자연어 관련 테스크들로 이루어져 있다. 크게는 NLU(자연어의 의미적/문법적 이해), NLG(자연어 생성) 등으로 이루어져 있으며 각 테스크들은 완전히 독립되어 있지 않고 서로 연관되어 있다.
벤치마크 데이터셋
자연어 처리 테스크를 분류한 교집합 이미지에서 알 수 있듯, 각 NLP task 산하에는 여러가지 sub task들이 존재한다. 그리고 각 sub-task를 가장 잘 해결하는( =성능이 잘 나오는) Language Model(LM)을 가려내기 위한 task별 대표적 데이터 모음을 벤치마크 데이터셋이라고 부른다. 테스크 별로 SOTA(State-Of-The-Art)인 LM을 가려내기 위한 일종의 시험문제(대회) 같은 개념이다. 이 시험을 잘 봐서 점수를 잘 받으면 해당 테스크/ 해당 벤치마크의 SOTA 모델이 된다.
NLP 분야에서 유명한 벤치마크 데이터셋은 GLUE (자연어 이해 테스크), SqUAD (독해 테스크), SST (감성 분석 테스크), KLUE(한국어 벤치마크 데이터셋) 등이 존재한다. 그리고 각 벤치마크 데이터셋은 각 NLP sub task에 맞는 여러 데이터셋을 갖고있다. 따라서 풀어야할 테스크와 벤치마크 데이터셋을 잘 선택(mapping)하여 사용해야 한다.
Reference
- Week 43 - 벤치마크 데이터 셋 그리고 KLUE (https://jiho-ml.com/weekly-nlp-43/)
- 머신러닝 분야에서 벤치마크 데이터셋이 갖는 의의에 대해 알아볼 수 있다.
- 2018 - 2020 NLU 연구 동양을 소개합니다 (카카오브레인) (https://www.kakaobrain.com/blog/118)
018-2020 NLU 연구 동향을 소개합니다
2018-2020 NLU 연구 동향을 소개합니다
2018-2020 NLU 연구 동향을 소개합니다
'원티드 프리온보딩 AI•ML (NLP)' 카테고리의 다른 글
Week2-1. Pytorch tutorial (1) - Tensor (0) | 2022.04.07 |
---|---|
Week1-4. NLP의 Transfer Learning의 학습 방식 (0) | 2022.02.25 |
Week1-3. NLG와 extractive summarization task (4) | 2022.02.23 |
Week1-2. NLU와 Semantic Textual Similarity (5) | 2022.02.22 |
Week1-1. NLP Sub-Task 탐색 (3) | 2022.02.21 |