GPT-3 학습 방법 - Context Learning

Natural Language Process

GPT-3 학습 방법 - Context Learning

robin0309 2023. 3. 17. 01:23

Context Learning

대부분의 PLM은 사전학습 이후에 파인튜닝을 통해 Task를 학습하는데 파인튜닝 없이 PLM만으로 동작이 가능할까?

parameter update (back -prop)없이 feed - forward 만을 통해 학습 수행
Few shot example을 주고 학습을 하고 Query를 받고 결과를 산출

Context Learning 정의

각 time - step의 hidden representation은 해당 step 까지의 정보가 담겨 있음

비록 파라미터 업데이트는 없지만 , 이것을 학습의 일환으로 볼수 있지 않을까?
이전의 정보가 잘 인코딩 되어 있다면, 이후에 이 정보를 바탕으로 추론을 수행 할 수 있을 것이라는 원리

Few shot learning (finetuning 없이 추론 하는 방법)

P(output | input , task)
Text to Text Framework 를 활용하여 동작
- 1) task에 대한 자연어 instruction 과 몇 개의 예제(few - shot)를 feed - forward
- 2) 언어 모델로부터 정답 추론
- 3) 언어 모델이 잘 학습되었다면 주어진 문맥에 기반해서 나머지 알맞는 문장을 완성하는 방법으로 다음단어를 예측 할 것

보통 모델이 커질수록 In context Learning의 효율이 높아짐

저작자표시 비영리 변경금지 (새창열림)

'Natural Language Process' 카테고리의 다른 글

ALBERT 개념 정리 (0)	2023.02.13
From Seq2Seq to Transformer (0)	2023.01.30

현재글GPT-3 학습 방법 - Context Learning

Data Science 관련 지식들에 대해 정리하는 공간입니다.

추천시스템, deeplearning, 시계열, feature importance, 알고리즘, 딥러닝, matrix factorization, Word2Vec, Keras, ARIMA, deepfm, 앙상블, LEVEL2, 프로그래머스, 강화학습, Classification, pytorch, Kaggle, LEVEL 1, LEVEL1,

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

AI/ML 기술 블로그

GPT-3 학습 방법 - Context Learning

Context Learning

Context Learning 정의

Few shot learning (finetuning 없이 추론 하는 방법)

'Natural Language Process' 카테고리의 다른 글

'Natural Language Process'의 다른글

티스토리툴바

GPT-3 학습 방법 - Context Learning

Context Learning

Context Learning 정의

Few shot learning (finetuning 없이 추론 하는 방법)

'Natural Language Process' 카테고리의 다른 글

'Natural Language Process'의 다른글

관련글

티스토리툴바