>RE::VISION CRM

인공지능

거대비언어모델 주장에 대한 중립적 비평

YONG_X 2024. 7. 24. 18:15

 

[인공지능] 거대비언어모델 주장에 대한 중립적 비평

 

 

 

https://www.chosun.com/opinion/specialist_column/2024/07/22/FXWJNMB67RBWFA57BMLP7D37NY/?utm_source=naver&utm_medium=referral&utm_campaign=naver-news

 

[김대식의 미래 사피엔스] [60] 거대비언어모델(LTM)

김대식의 미래 사피엔스 60 거대비언어모델LTM

www.chosun.com

 

 

기사 요약 (ChatGPT)

 

1957년 처음 '인공지능'이라는 개념이 등장했을 때, 연구자들은 크게 두 가지 문제를 해결하고자 했다. 첫째는 물체 인식이 가능한 기계를 만드는 것이었고, 둘째는 사람과 대화할 수 있는 기계를 만드는 것이었다. 초기에는 이 두 문제가 몇 달간의 노력으로 해결될 것처럼 보였지만, AI 연구의 첫 50년은 반복적인 실패로 점철되었다.

2012년, 캐나다 토론토 대학교의 제프리 힌튼 교수 연구팀이 '딥러닝'이라는 학습 기반 인공지능 방법을 제안하면서 물체 인식 문제는 서서히 해결되기 시작했다. 그러나 자연어 처리 문제는 여전히 어려운 과제로 남아 있었다. 당시의 '인공지능 스피커'들은 인간의 말을 제대로 이해하지 못했다.

그러나 2022년 말 등장한 챗GPT 덕분에 자연어 처리 문제는 크게 진전되었고, 이제 우리는 사람과 대화할 수 있는 기계를 가진 생성형 인공지능 시대에 살고 있다. 생성형 인공지능의 핵심은 '거대언어모델'(LLM)이다. 이는 단어를 쪼갠 '토큰'들 사이의 조건적 확률 관계를 '트랜스포머' 알고리즘으로 미리 학습한 덕분에 가능해졌다. 챗GPT는 사용자가 입력한 문장 다음에 나올 토큰과 단어를 예측할 수 있다.

하지만 '거대언어모델'이라는 이름에는 오해의 소지가 있다. 트랜스포머 알고리즘을 사용하면 언어뿐만 아니라 이미지, 영상, 소리, 3차원 단백질 구조 등 모든 데이터의 학습이 가능하다. 따라서 '거대언어모델'보다는 '거대비언어모델'(LTM: Large Token Model·LTM)이라는 명칭이 더 정확하다는 주장이다.

 

 

 

왜 이글에 대해 비평을 해야 했는가

 

이 칼럼은 인공지능(AI) 기술의 발전사를 이해하기 쉽게 소개하며 AI의 발전 과정을 일목요연하게 정리하고 있고 AI의 역사적 맥락을 잘 제시하고 있다. 물체 인식과 자연어 처리라는 두 가지 핵심 문제를 중심으로 AI의 발전 과정을 설명하는 방식은 독자들이 기술의 발전을 쉽게 이해할 수 있게 한다. 또한 딥러닝과 트랜스포머 알고리즘의 역할을 설명하면서 기술적 개념을 비교적 명확하게 전달하고 있다. 비전문가인 독자들은 AI의 작동 원리와 현재의 성과를 이해하는 데 크게 도움을 받을 수 있다.
그러나 이 칼럼은 몇 가지 중요한 측면에서 한계를 드러낸다. 첫째, AI의 초기 실패와 성공 과정을 지나치게 단순화하여 설명하고 있다. 예를 들어, 물체 인식과 자연어 처리 문제의 해결을 단순히 시간과 노력의 문제로 묘사하는 것은 AI 연구의 복잡성과 기술적 도전을 충분히 반영하지 못한다. 또한 '거대언어모델'(LLM) 대신 '거대비언어모델'(LTM)이라는 용어를 제안하는 부분은 논리적 일관성을 가지고 있으나, 실제로 이러한 용어 변경이 실질적인 혼란을 초래할 수 있다는 점을 심각하게 간과하고 있다.
이 칼럼은 AI 기술의 현재 상태와 한계를 충분히 설명하지 못하고 있다. 예를 들어, 챗GPT가 자연어 처리 문제를 해결한 것처럼 서술하고 있으나, 실제로는 많은 한계와 도전 과제가 여전히 존재한다.지나치게 낙관적인 인상을 주고 그러한 방향의 전망을 유도할 수 있다. 또한, 트랜스포머 알고리즘이 모든 데이터 유형을 학습할 수 있다고 주장하지만, 실제로는 데이터 유형과 학습 방법에 따라 많은 제약이 있다는 점도 무시하지 말아야 한다.
비록 유용한 정보를 제공하지만, 기술적 복잡성과 현실적인 한계를 충분히 설명하지 못한 점에서 아쉬움이 있다. AI 연구의 진정한 도전과 성과를 균형 있게 전달함으로써 독자들이 보다 깊이 있는 이해를 할 수 있도록 하는 전문가들의 의견이 더 많이 필요한 시기로 보인다.

 

 

 

ChatGPT :: 

논리적인 측면

  1. 역사적 맥락의 정확성:
    • 글은 인공지능(AI)의 발전사를 간략하게 설명하며, 1957년부터 2012년, 그리고 2022년에 이르기까지의 주요 사건들을 논리적으로 나열합니다. 이는 독자가 AI 기술의 발전 과정을 이해하는 데 도움을 줍니다.
    • 제프리 힌튼 교수의 딥러닝 연구와 2012년의 돌파구, 그리고 2022년 챗GPT의 등장은 역사적으로 정확한 사건입니다​ (Website Rating)​.
  2. 기술적 설명의 명확성:
    • 트랜스포머 알고리즘과 토큰화를 설명하여 LLM(거대언어모델)의 작동 원리를 이해하기 쉽게 설명하고 있습니다. 이는 독자가 AI의 기본 원리를 파악하는 데 도움을 줍니다.

현실적인 측면

  1. 현실적 문제 제시:
    • 물체 인식과 자연어 처리의 초기 실패 사례를 통해 AI 연구의 현실적 어려움을 강조합니다. 이는 AI 기술이 단기간에 해결되지 않았음을 보여줍니다.
    • 챗GPT의 등장 전까지 인공지능 스피커가 인간의 말을 제대로 이해하지 못했다는 점은 AI 기술의 한계를 현실적으로 제시하고 있습니다.
  2. 미래 기술의 잠재력:
    • LLM이 언어 외에도 다양한 데이터를 학습할 수 있다는 점을 강조함으로써 AI의 잠재적 확장 가능성을 설명합니다. 이는 AI 기술의 발전 방향에 대한 긍정적인 전망을 제공합니다​ (FNGuide)​.

약점

논리적인 측면

  1. 과도한 단순화:
    • AI의 발전 과정을 지나치게 단순화하여 기술적 복잡성을 간과할 수 있습니다. 예를 들어, 물체 인식과 자연어 처리가 단순히 노력으로 해결될 수 있는 문제로 표현되는데, 이는 다양한 기술적 도전과 복잡한 문제를 충분히 설명하지 못합니다.
  2. 용어의 혼란:
    • '거대언어모델'과 '거대비언어모델' 용어의 혼란을 지적하는 부분은 논리적으로 일관성을 가지지만, 실제로 LLM이란 용어가 이미 널리 사용되고 있어 새로운 용어를 제안하는 것이 실질적인 혼란을 초래할 수 있습니다.

현실적인 측면

  1. 현실적 한계 과소평가:
    • 챗GPT와 같은 생성형 AI의 등장이 자연어 처리 문제를 완전히 해결한 것처럼 서술되어 있으나, 실제로는 여전히 많은 한계와 과제가 존재합니다. 이는 독자에게 과도하게 낙관적인 전망을 줄 수 있습니다​ (MarketCast)​.
  2. 기술적 적용 범위 과장:
    • 트랜스포머 알고리즘이 모든 종류의 데이터를 학습할 수 있다고 주장하지만, 실제로는 데이터의 종류와 학습 방법에 따라 많은 제약이 있을 수 있습니다. 예를 들어, 이미지나 3차원 단백질 구조 학습은 여전히 많은 기술적 도전이 남아 있습니다​ (FNGuide)​.

결론

이 글은 AI의 발전사와 기술적 성과를 효과적으로 설명하며, 독자가 AI의 역사와 현재 상태를 이해하는 데 도움을 줍니다. 그러나 AI의 기술적 복잡성과 현실적인 한계를 충분히 설명하지 못한 점은 아쉽습니다. 또한, 새로운 용어를 제안하는 것이 실제로 얼마나 유용할지에 대한 논의도 필요합니다. 현실적인 측면에서의 한계와 과제를 보다 명확하게 제시함으로써, 독자들이 AI 기술의 현재 상태와 미래 전망을 보다 균형 있게 이해할 수 있도록 할 필요가 있습니다.

 

 

 

 

#전용준 #리비젼 #리비젼컨설팅 #생성형AI #인공지능

 

 

 

관련 영상 :: 

기술과 학술이 아닌 실전적 관점에서의 생성형 AI 활용에 관하여 

 

https://www.youtube.com/watch?v=v2nRSU4tm50&t=762s

 

 

엔터프라이즈 AI의 기회와 과제

https://www.youtube.com/watch?v=R4r4ozyk4Us&t=664s