금요진단

'챗GPT'에 대한 아홉가지 질문

2023-02-17 12:07:55 게재
이해성 내일e비즈 CTO/부사장
인공지능(AI) 기술 중 오랜 기간 연구실 레벨에 머물던 딥러닝이 '알렉스넷'의 실질적인 성공으로 세상의 주목받은 이후 불과 십수년 만에 주류가 됐다. 또 영상인식과 생성을 넘어 이제는 자연어 처리 분야 등 AI 응용 전 분야로 활발하게 접목되고 있다.

특히 자연어 처리 분야는 인공지능 연구 초기부터 주요 주제였지만 오랜 기간 동안 제자리걸음을 반복해왔다. 하지만 구글의 워드투벡(Word2Vec) 등 검색엔진 관련 연구와 딥러닝 기반의 RNN, LSTM 등 방법론이 결합되면서 최근에는 BERT, LaMDA, GPT 등의 강력한 기술이 제시됐다. 이 가운데 구글이 개발한 BERT, LaMDA의 많은 부분이 일반인에게는 가려져 있었다. 반면 OpenAI에서 개발한 GPT는 최근 챗GPT라는 대화형 챗봇으로 일반인들에게 공개되면서 전세계적인 반향을 불러일으켰다. 챗GPT와 관련된 재미있는 사항들을 살펴보았다.

1. 챗GPT의 고향은?

인공지능 기술을 연구하는 비영리 회사인 OpenAI Inc.는 우수 인재 확보에 어려움을 겪자 상업화 자회사인 OpenAI LP를 설립, 마이크로소프트(MS)로부터 10억달러의 투자를 유치한다. 챗GPT는 OpenAI LP의 상용 제품이다.

수석과학자인 일리야 수츠케버는 1985년 구 소련 출생으로 이스라엘에서 학부를 마치고 딥러닝의 아버지라 할 수 있는 토론토대학의 제프리 힌튼 교수 아래서 박사학위를 받았다. 그는 알렉스넷 개발에도 기여했고, 구글의 자회사인 딥마인드에서 알파고 개발에도 참여했던 핵심 인재다.

2. 챗GPT만 독보적인가?

구글 메타 MS도 각각 BERT, LaMDA, Blenderbot, Tay 등의 훌륭한 모델 및 서비스를 가지고 있고, 몇몇 대학들도 이에 못잖거나 오히려 더 뛰어난 모델을 가진 것으로 알려졌다. 하지만 메타의 너무 조심스러운 행보로 인해 Blenderbot은 인기가 없었으며, MS의 Tay는 인종편견적 발언 때문에 서비스 개시 하루 만에 내려가 버렸다.

챗GPT의 차별점은 기술력이라기보다는 다소 민감한 주제에도 답하는 챗봇을 대중에게 대담하게 공개했다는 경영진의 과감성과 결단력에 있다는 평가가 많다.

3. MS가 OpenAI를 경영하게 될 수도?

챗GPT의 높은 인기에 고무된 MS는 기존 투자에 이어 100억달러를 추가 투자하는 협상에 돌입했다고 한다. 이렇게 되면 OpenAI LP 지분 구조는 MS가 49%, OpenAI Inc.가 2%, 기타 주주들이 49%를 가지게 된다. 기타 주주들에는 페이팔 공동창업자 피터 틸과 링크드인 공동창업자 리드 호프만도 있다. 페이팔 및 테슬라의 공동창업자 일론 머스크는 Inc.에는 투자했지만 LP에는 참여하지 않았다.

4. 챗GPT는 양날의 검이 될까?

챗GPT는 생산성 도구이자 보완제가 될 수 있다. 그래서 MS는 자사의 유명 제품군들에 챗GPT를 결합할 계획이다. 협업도구인 팀즈 프리미엄, 자동 프로그래밍 도구인 파워앱스, 검색엔진 빙, 웹브라우저 엣지, 클라우드 서비스 애저 등이 그 대상이다.

하지만 챗GPT는 기존의 어설픈 이메일 메시지와는 차원이 다르게 일반인들에게 사기를 칠 수 있는 피싱 메시지 생성 도구가 될 수도 있다. 그리고 이를 이용한 해킹에도 깊게 사용될 소지가 있으며, 학생들의 부정행위 도구, 저작권 표절 도구, 가짜 여론조작 도구로 사용될 수 있는 강력한 능력을 가졌다.

이에 대해서 챗GPT에게 물어 보았더니 자신을 다음과 같은 생산적인 용도로만 사용해주기를 부탁했다고 한다. 챗봇으로 사용, 자동으로 뉴스-설명문-기사 작문 용도, 특정 양식이나 어조의 텍스트 생성, 입력받은 긴 글을 짧은 글로 요약 변경, 쓰다만 글의 마무리 완성, 번역 등등.

5. '프롬프트 엔지니어링'이 뜰까?

챗GPT와 LaMDA와 같은 대규모 언어모델(LLM, Large Language Model) 기반의 챗봇은 원하는 질문에 대해서 아직까지는 사람 수준의 눈치 빠른 답변을 곧바로 하지는 못한다. 사용자가 자신이 원하는 질문에 잘 부합하는 답을 얻어내기 위해서는 챗봇과의 대화기술이 아주 중요하다. 이를 프롬프트 엔지니어링이라고 부른다.

이는 마치 검색엔진 시대에 각 회사들이 검색엔진의 좋은 자리에 노출되기 위해서 벌이던 검색엔진최적화(SEO, Search Engine Optimization) 경쟁과 비슷하다고 볼 수 있다. 그리고 챗GPT나 이를 채용한 빙(Bing)에 완전히 동일한 질문을 하더라도 답변이 다르게 나오곤 한다는 점도 프롬프트 엔지니어링의 중요성을 다시 한번 상기시킨다.

6. 챗GPT를 활용하고 있는 산업은?

미국의 부동산 업계다. 이들은 매물로 나온 집의 기본적인 사양을 챗GPT에 입력한 다음 해당 매물에 대한 매력적인 소개 문구를 자동 작성받는 식으로 이미 널리 사용하고 있다고 한다. 이런 방식의 산업계 응용은 아마도 지금 이 순간에도 여러 분야로 확장되고 있을 것 같다.

7. 챗GPT와 이전 챗봇의 차이점은?

애플의 시리, 구글 어시스턴트, MS 코타나, 삼성 빅스비 등 LLM 이전의 챗봇들은 사실상 단답형 문답만 가능했고, 연속된 대화가 불가능했다. 즉 사람들 사이의 대화에서 자주 나오는 대명사를 이들 챗봇은 이해하기 힘들었다. 그래서 이들 챗봇과 여러 대화를 지속하더라도 그 내용을 들여다보면 서로 관련없는 단답형 대화의 연속일 뿐이었다. 하지만 LLM 기반의 챗봇에서는 마치 사람과 하는 듯한 연속된 대화가 가능하다. 대명사를 어느 정도 이해하기 시작한 것이다. 대화라는 관점에서 보면 진정한 의미의 챗봇 기능이 드디어 시발점을 통과했다고 할 수도 있다.

8. 챗GPT가 거짓말을 한다고?

챗GPT를 전문적인 영역에서 사용할 때는 반드시 전문가의 자문을 받아야 할 것 같다. 필자는 챗GPT에게 함수해석학(Functional Analysis)의 기본 개념인 '바나흐 공간과 힐베르트 공간의 차이점'을 질문해 보았고, 노벨물리학상 수상자이자 옥스퍼드 라우스볼 석좌교수인 로저 펜로즈가 AI에 대해 쓴 '황제의 새 마음'이라는 책의 결론을 물어본 후 그 답변을 보고 깜짝 놀랐다. 챗GPT는 진짜 최고 전문가로 느껴질 만큼 정중하고 품격있는 답변을 했다. 그런데 더 놀라운 것은 그 답변이 완전히 엉터리였다는 점이다. 전문적인 영역에서 챗GPT의 답변을 그대로 믿다가는 큰 재앙에 빠질 것 같다는 느낌을 받았다.

그 외에도 특정한 주제에 대한 설문조사 결과를 요청한 다음 너무나도 훌륭하게 분석된 결과를 받고 감동했는데 따로 검색엔진으로 진위를 파악했더니 출처가 없고, 각 데이터의 작성 날짜들이 다르고, 설문 주제도 다르고, 심지어 설문대상 모집단도 다른 갖가지 데이터들을 모아서 분석 답변을 했다는 놀라운 사실도 알려졌다. 챗GPT가 서로 관련 없는 통계 데이터들을 모아서 알고보면 신뢰도 0%의 거짓말을 마치 진실인 양 답변했다는 것이다.

9. 구글의 대응과 소송은?

구글도 자신의 검색엔진에 바드(Bard)라는 이름의 챗봇 서비스를 융합하기로 결정했다고 한다. 그리고 이보다 더 중요한 점은 2022년 11월 매튜 버터릭과 조셉 세이버리 로펌이 공동으로 MS와 OpenAI를 샌프란시스코 법원에 제소했다는 사실이다. 인터넷에 널리 퍼진 데이터를 챗GPT 학습에 무단으로 사용했고 이는 합법적인 공정이용에 해당되지 않는다는 것이 골자다. 이 소송 결과는 앞으로 인공지능 산업 전반에 큰 영향을 줄 것으로 판단된다.