본문 바로가기
  • 블랜더 거실
IT인터넷

[강의]Chat GPT 초보자 활용하기_프롬프트 프로세스 및 할루시네이션 예방법

by bandiburi 2023. 8. 4.

(출처: Pexels)


AI 인공지능을 얘기하며 많이 회자되는 Chat GPT를 활용하는 방법을 배웠다. 마이크로소프트의 Chat GPT와 구글 Bard를 간단한 입력으로 사용해 본 적은 있다. 하지만 원하는 답안에 부합하는 질문을 던지기 위한 노력은 해보지 않았다. 

그래서 이번에 청취한 'Chat GPT 초보자 활용하기' 강의는 시의적절했다. 회사에서 업무용으로도 적극 활용할 것을 권하고 있는 상황이다. 세상은 Chat GPT를 사용할 줄 아는 사람과 모르는 사람으로 나눠질 거라고 하는데 아는 사람으로 분류되고 싶다. 

아래는 강의내용을 정리했다.


[1강]

Chat GPT 사용금지 국가는 4개국이 있다.  중국, 러시아, 이란, 이탈리아

Code RED 
구글에 치명적 위험이 될 만한 위협상황. 검색 방법이 빠르게 바뀌고 있다.
인간들에게도 비상상황 Code RED가 발효된 상황이다.

의미
Chat 대화형이라는 의미로 맥락을 이해하는 단기기억을 가지고 있다.
G 생성, P 사전학습했다.21년까지의 데이터를 보여주며
Transformer 확률로 예측해서 답한다. 참과 거짓이 아니라 허언증 모드(할루시네이션)가 나올 수 있다.



[2강] PROMPT PROCESS

질문을 어떻게 하느냐에 따라 다른 답을 얻는다. 그래서 프롬프트에 질문을 잘 입력해야 한다.

1단계. Goal 설정
결과물을 명확화. 볼거리, 즐길거리, 맛집, 숙소

2단계. 학습시키기
역할 부여:  전기설비관리자처럼 구체적으로 입력하면 정확한 답변나온다.질문자의 역할을 설명하거나 GPT에게 역할 부여
수준 설정: 대학교수처럼, IQ200처럼 등. 일반인이 이해할 수준, 준전문가 수준, 최고전문가 수준으로 답해줘 처럼 원하는 수준으로
출처 제한: 공신력 높은 출처(학술지 및 학회지, 정부 및 공공기관 홈페이지, 국제기구 보고서, 전문가 리뷰와 인용자료, 명성 있는 출판사의 책), 특정 분야 관련 공신력 높은 출처 (ㅇㅇ 연구소 및 기술보고서, ㅇㅇ산업협회, ㅇㅇ 컨퍼런스 등)
개념 이해: 약어를 배제하고 전문명칭으로 사전학습 여부

3단계 Main질문
- 질문순서에 따라 결과가 달라진다.
- 질문수준이 답변 수준을 결정한다.
- GPT는 질문을 참(True)이라 전제한다.
- 영어로 질문하라
- 질문은 짧게하라.
- 약어는 영어로
- 애매모호한 표현은 배제하라.
- 글머리표나 마크다운으로

4단계 결과검증
- 검색엔진이나 BING 등을 활용해서 검증한다.
- 새로운 창에 입력한다.  


[3강] 할루시네이션(허언증) 예방법

리플리 증후군: 허구의 세계를 진실이라 믿고
정보 없어도 문장을 생성한다.
하이퍼패러미터를 이용해서 방지할 수 있다.

Top_p 문장을 구성하는 단어 선택의 확률을 조절
- 값이 낮을수록 적합한 단어 도출, 높이면 맥락에 부합하지 않아도 다양한 단어 도출한다
- 보고서는 적합도 높은 단어 필요, 시나 작품은 다양한 단어가 더 필요
- Top_p=0.1로 설정해 주세요라고 하면 후보 단어 중 가장 확률이 높은 10%만 가지고 문장 구성
- 논리적이고 분석적인 업무에는 값을 0.1로 낮게 설정하시고, 창의적인 업무에는 높이는 게 도움이 된다.
- 0.01로 설정하면 적합한 단어가 부족할 수도 있다.
- GPT는 기본적으로 Top_p=0.9에 맞춰져 있다.

Temperature 단어선택의 다양성을 조절
- 값이 낮을수록 예측 가능한 단어 도출, 높으면 예측 불가능한 단어 도출 가능
- 보고서는 예측 가능한 단어가 필요하지만, 아이디어는 예측 어려운 가능성의 단어가 더 필요하다.
- GPT 기본값은 0.7이다. 분석적인 보고서를 원한다면 0.01, 0.1 등으로 낮춰서 사용하는 것이 바람직하다.

Beam width 후보 문장 수를 몇 개 만들질 설정
- 30이면 30개의 문장 구성 후 적합한 문장 도출
- 높으면 시간은 오래걸리지만 정확한 답변 가능성 높다.
- 1보다 큰 정수를 입력한다.
- "나는 꽃을~"이후의 문장을 완성해 주세요라고 하고 Beam width를 5와 12로 입력한 경우
- 높으면 대기시간이 길어지는 단점이 있다.
- 중요한 업무는 30정도, 일반적으로는 10

Max_Tokens 전체 답변의 양을 몇 토큰으로 할지 지시
- 작은 값을 입력하면 답변의 길이가 짧아진다.
- Token이란 '공백으로 구분된 단어나 구절을 의미. 띄어쓰기와 문장부호 수
- 1보다 큰 정수 입력
- A4 한 장 분량의 문서를 토큰으로 계산하면 500~700토큰이 된다.
- 필요한 답변의 내용이나 성격에 따라 조절해서 사용한다.



GPT 사용시 주의사항
- 맹신금지. 핵심내용은 Fact Check
- 중요기밀 데이터를 공개하는 질문. 회사의 기밀도 서버에 저장
- 민감한 회사기밀 개인정보 포함 질문 주의
- 불법행위: 악성코드 요청

GPTers 치트키

1. 역할부여
지금부터 너는 ' ㅇㅇ ㅇㅇㅇ 관리자(담당자)'의 역할을 해 주세요.

2. 수준설정
답변 수준은 'ㅇㅇㅇ 분야 최고 전문가' 수준으로 작성해 주세요

3. 하이퍼패러미터(주요업무)
'top_p=0.1, temperature=0.1, beam-width=30, Max_tokens=200'
창의적 아이디어는 3번까지만 입력
'top_p=1, temperature=1, beam_width=50, Max_tokens=10000'

4. 출처제한
답변은 '연구기관, 행정기관자료, 협회자료, 논문, 학술지, 출판자료, 기업발행 매뉴얼, 백과사전'에서 취득한 정보를 기준으로 작성해 주세요.

5. 답변형식
답변은 '글머리표 or 마크다운' 형태로 요약해 주세요.

사건의 지평선 Event Horizon이란 말이 있다. 우리는 인공지능이라는 사건의 지평선으로 빠져들고 있다.

 

728x90
반응형

댓글