챗GPT 자연어처리란? 인공지능이 사람의 언어를 처리하는 분야를 말한다.
자연어를 이해하고
자연어를 생성하는 분야가 있다.
보기중 정답을 고르는 것이 자연어 이해이고
텍스트를 인공지능이 스스로 생성하는 문제를 자연어 생성이라고 한다.
*메일함의 스팸을 스팸메일함으로 분류하는 것 ; 자연어 이해
다른 나라 언어를 번역하는 구글번역기 ; 자연어 생성
이라고 볼 수 있다.
딥러닝이르는 용어는 신경망이 깊고 많은 신경망을 학습시킨다는 의미이다.
GPT-3, GPT-4와 같은 모델을 보면 파라미터가 많다, 거대하다는 표현이 있는데
인공 신경망의 크기를 표현하는 용어이다.
마이크로소프트에선 GPT
구글에선 LaMDA
네이버에선 하이퍼클로바
디코더 모델을 선보이고 있다.
OpenAI : 일론머스크 + 리드 호프먼 + 피터 틸 = 공동으로 설립한 스타트업이다.
구글 라이벌이다.
GPT란? Generative pre-trained transformer의 약자이며 현재, 엔진: GPT-3.5; GPT-4까지 진화하였다.
이들 공통점은 방대한 텍스트 데이터로 미리 학습된 상태이다.(사전학습)
GPT-3는 일반사용자의 접근성이 좋지 않아 지금의 Chat G PT의 인지도를 얻지 못했으나
2022년 12월 1일, OpenAI에서 GPT-3.5를 무료러 제공며 세계의 관심을 이끌어냈다.
Chat G PT사용자 100만 명 돌파하는데 5일 밖에 걸리지 않았다.
VS
-넷플릭스 3.5년
-페이스북 10개월
-유튜브 8개월
-인스타그램 2.5개월
-아이폰 74일
ChatGPT에게 요청하는 사용자의 입력을 프롬프트라고 한다.
ChatGPT가 실시간 학습하는 것 같이 보이지만,
현재 대화창에서만 기억하고 있으니 추후 다시 접속한 후 사용할 떄를 대비해 미리 교육하는 행동은 의미가 없다.
ChatGPT 이미 2021년 데이터 기준으로 학습이 끝난 모델이다.
따라서학습하지 못한 데이터가 있을 수 있어 잘못된 답변을 할 가능성도 있다.
사실이 중요한 질문은 ChatGPT에게 하는 것은 적절하지 않다.
2023년 3월 14일 4번째 모델인 GPT-4 가 출시 되었다.
내부 평가에서 허용되지 않은 콘텐츠에 대한 요청에 응답할 가능성이 82% 낮고 사실에 근거한 응답을 생성할 가능성이 GPT-3.5보다 40% 더 높아졌다고 한다.
ChatGPT 거짓 :할루시네이션
할루시네이션은 ChatGPT뿐만 아니라 많은 언어모델에서 문제점으로 지적되고 있다.
ChatGPT작성한 답변에는 항상 거짓이 포함되어 있을 수 있어 사실 여부가 중요한 경우에는 사용을 주의해야 한다.
-보고서 작성, 논문 작성, 법령, 의사의 진단 등 의존하지 않을 것!
ChatGPT는 한글로 요청했을 때와 영어로 요청했을 때 답변의 길이, 품질뿐만 아니라 답변 속도에서도 차이를 보인다.
한글의 경우 영어로 번역한 후에 요청하면 더 나은 답변을 받을 가능성이 높다.
한글로 요청할 경우 답변이 중간에 잘리는 현상,
이는 GPT의 파라미터와 연관된 문제로 한글을 훨씬 긴 텍스트로 판단하기 때문에 발생되는 문제이다.
-프롬프트 지니
-구글 번역기
-파파고
-딥엘
번역기를 사용하여 영어로 요청하는 것을 적극 활용하기 바란다.
ChatGPT가 답변을 생성하는 중간에 멈췄다면,
한글로 '계속' 또는
영어로 'continue'라고 입력하면 앞에서 했던 질문에 추가로 답변을 받을 수 있다.
'트렌드' 카테고리의 다른 글
한국에서 가장 인기 있는 블로그 주제 10가지 (3) | 2024.11.20 |
---|---|
ChatGPT의 활용 (2) | 2024.11.20 |
프롬프트 지니 (2) | 2024.11.20 |
ChatGPT말고 다른 ChatGPT 사용해보기 : 플레이그라운드 (0) | 2024.11.20 |
영 피프티(Young Fifty)를 아시나요? (0) | 2024.07.03 |