데이크루 5기

조선의 5대 검객중 한명은 황진이!? GPT의 문제점!

2023.04.25 17:22 1,868 Views

안녕하세요 !

Chat-GPT와 함께 성장 중인 누리고 입니다!

Chat-GPT가 가끔씩 정확하지 않은 정보를 줄 때가 있습니다.

여러가지 문제점들이 있지만 크게 두 가지로 뽑자면 데이터 셋 시점 문제와 생성 알고리즘 문제가 있습니다.

이 두가지 데이터를 각각 비교해서 보여드리겠습니다.

1. 데이터 셋 시점

Chat-GPT가 보유한 데이터 셋이 2021년 까지의 정보이기 때문에 현 대통령님에 대해서 물어보면

이런 식으로 알려 줍니다.


2.생성 알고리즘

사실상 가장 치명적인 맹점입니다.

Chat-GPT는 수많은 정보 안에서 특정 단어의 성격을 벡터로 정의하고, 단어의 관계성을 분석해 답을 내는 것으로 알려져있습니다.

이경전 경희대 경영학·빅데이터응용학과 교수는 “챗GPT는 단어 n을 인식하면 n+1을 만드는 방법론을 쓴다”며

“n 다음의 설명에 필요한 적절한 단어를 찾는 구조라 할로시네이션(hallucination·환각) 문제에서 자유로울 수 없다”고 말했습니다.

두 가지 재미있는 할로시네이션 현상을 보여드리겠습니다.

2-1 조선시대 5대 소드마스터..?

<GPT3.5>

<GPT4>

GPT3.5 버전에서는 정말 누군지 아무도 모르겠지만GPT 4 버전에서는 그래도 납득이 갈 만한 분을 찾아 오기는 했습니다.(이순신,임꺽정)

그래도 좀 이상하긴 합니다..

2-2 허씨 초콜렛

<GPT3.5>

(허효선씨는 누구..?)

<GPT4>

GPT4에서는 이러한 부분이 어느 정도 해소 된 것을 볼 수 있습니다.


이 문제는 생소한 사항을 질문하는 경우에 흔하게 발생됩니다. GPT-4에서는 모르는 사항은 모른다는 답변을 얻을 확률이 좀 더 높습니다.

그렇지만 GPT-4와 같은 업데이트를 통해 이러한 문제들이 개선되고 있으며, 시간이 지남에 따라 점점 더 정확하고 유용한 정보를 제공할 수 있게 될 것입니다. 이와 같은 기술의 발전과 성장을 지켜보며, 우리 모두는 AI와 함께 성장하고 발전할 수 있는 미래를 기대해 볼 수 있습니다.

긴 글 읽어 주셔서 감사합니다!