AI란 무엇인가: 매일 쓰면서도 설명 못 하는 그것

우리는 왜 갑자기 AI를 매일 말하게 됐을까

2024년까지만 해도 “AI”는 뉴스에서나 보는 단어였다. 그런데 어느 순간부터, 일상 대화에서 자연스럽게 등장하기 시작했다.

“ChatGPT한테 물어봤더니…”

“이거 AI로 번역한 거야.”

“Gemini가 이메일 초안 써줬어.”

그런데 막상 누군가 “AI가 정확히 뭔데?”라고 물으면, 대답하기가 의외로 어렵다. ChatGPT 같은 건 알겠는데, 그게 AI의 전부인지, AI와 머신러닝은 뭐가 다른지, 딥러닝은 또 뭔지. 용어가 뒤섞여서 혼란스럽다.

이전 글에서 GPT, Gemini, Claude 같은 AI 코딩 도구들을 살펴봤다. 그 도구들이 ‘어떻게’ 코드를 이해하고 생성하는지 궁금해졌다면, 이 시리즈가 그 답을 하나씩 풀어가는 여정이다.

이 글에서는 AI의 정의부터 종류, 그리고 왜 LLM이 특별히 주목받는지까지 한 번에 정리한다.

우리가 이미 쓰고 있는 AI

AI를 정의하기 전에, 먼저 우리가 이미 AI를 얼마나 많이 쓰고 있는지 보자. 대부분은 “AI를 쓰고 있다”는 의식조차 없이 쓰고 있다.

상황	뒤에서 작동하는 AI
넷플릭스에서 “이 영화 어때요?” 추천	추천 알고리즘
네이버/구글에서 검색 결과 정렬	검색 랭킹 AI
스마트폰으로 사진 찍으면 자동 보정	이미지 처리 AI
“시리야” / “OK 구글”로 음성 명령	음성 인식 AI
파파고, DeepL로 번역	자연어 처리 AI
이메일 스팸 필터	분류 AI
ChatGPT에 코딩 질문	대형 언어 모델(LLM)

마지막 줄의 ChatGPT는 우리가 “AI”라고 부르는 것의 가장 최신 형태다. 하지만 위 목록을 보면 알 수 있듯, AI는 ChatGPT보다 훨씬 넓은 개념이다.

AI란 무엇인가

AI(Artificial Intelligence, 인공지능)를 한 줄로 정의하면 이렇다.

‘인간의 지능적 작업을 기계가 수행하도록 만드는 기술의 총칭.’

여기서 ‘지능적 작업’이란, 판단하고, 학습하고, 이해하고, 예측하는 것을 말한다. 사람이 하면 “당연한” 것들이지만, 기계에게 시키면 매우 어려운 일이다.

중요한 점은, AI는 ‘하나의 기술’이 아니라 ‘여러 접근법의 묶음’이라는 것이다. 시대에 따라 AI를 만드는 방법이 달라져 왔다.

접근법 1: 규칙 기반 — “사람이 규칙을 정해준다”

초기의 AI는 사람이 직접 규칙을 만들어 넣는 방식이었다. “만약 체온이 38도 이상이면 열이 있다고 판단해라” 같은 if-else 로직의 집합이다.

IF 체온 >= 38 THEN 진단 = "발열"
IF 기침 == true AND 발열 == true THEN 진단 = "감기 의심"

단순한 문제에는 잘 작동하지만, 규칙이 수천 개로 늘어나면 관리가 불가능해지고, 사람이 미리 생각하지 못한 상황에는 대응할 수 없다.

접근법 2: 머신러닝 — “데이터를 주면 기계가 규칙을 찾는다”

규칙을 사람이 정하는 대신, 데이터를 대량으로 주고 기계가 스스로 패턴을 찾게 하는 방법이다.

[입력] 고양이 사진 10,000장 + "이건 고양이야" 라벨
  ↓
[학습] 기계가 고양이의 특징(귀, 눈, 수염 등)을 스스로 발견
  ↓
[결과] 새로운 사진을 보고 "이건 고양이" 판단

사람은 “고양이란 이런 것이다”라고 규칙을 정하지 않는다. 데이터를 주면 기계가 알아서 규칙을 학습한다. 넷플릭스 추천, 스팸 필터, 검색 랭킹이 이 방식이다.

접근법 3: 딥러닝 — “인간 뇌를 흉내 낸 신경망으로 학습한다”

머신러닝의 한 방법이지만, 가장 강력해서 따로 이름이 붙었다. 인간 뇌의 뉴런(신경 세포) 구조를 흉내 낸 ‘인공 신경망’을 사용한다.

일반 머신러닝과 뭐가 다를까? 핵심은 ‘깊이(Deep)’다. 신경망의 층이 많아질수록(깊어질수록) 더 복잡한 패턴을 학습할 수 있다. 사진 속 고양이를 인식하는 것부터, 자연어를 이해하고 생성하는 것까지.

ChatGPT, Gemini, Claude는 모두 딥러닝 기반이다.

AI, 머신러닝, 딥러닝: 헷갈리는 용어 정리

이 세 용어의 관계는 간단하다. 큰 원 안에 작은 원이 들어 있는 구조다.

┌─────────────────────────────────┐
│           AI (인공지능)            │
│  인간의 지능적 작업을 수행하려는     │
│  모든 기술의 총칭                  │
│                                  │
│   ┌─────────────────────────┐   │
│   │    머신러닝 (ML)          │   │
│   │  데이터에서 패턴을 학습     │   │
│   │                          │   │
│   │   ┌─────────────────┐   │   │
│   │   │   딥러닝 (DL)     │   │   │
│   │   │  신경망 기반 학습   │   │   │
│   │   │                  │   │   │
│   │   │  ChatGPT, Claude │   │   │
│   │   │  Gemini 등       │   │   │
│   │   └─────────────────┘   │   │
│   └─────────────────────────┘   │
└─────────────────────────────────┘

AI는 가장 넓은 개념이다. 규칙 기반도 AI, 머신러닝도 AI, 딥러닝도 AI다.
머신러닝은 AI의 한 방법이다. 데이터에서 규칙을 학습한다.
딥러닝은 머신러닝의 한 방법이다. 신경망을 사용한다.
우리가 2024~2026년에 “AI”라고 부르는 것은 대부분 딥러닝, 특히 대형 언어 모델(LLM)이다.

왜 지금 AI가 이렇게 강력해졌나

AI라는 개념 자체는 1950년대부터 있었다. 그런데 왜 70년이 지나서야 갑자기 이렇게 강력해졌을까?

세 가지가 동시에 갖춰졌기 때문이다.

조건	과거	현재
데이터	적었다	인터넷으로 폭증 (텍스트, 이미지, 코드…)
컴퓨팅 파워	느렸다	GPU의 발전으로 대규모 연산 가능
알고리즘	단순했다	Transformer 등 혁신적 신경망 구조 등장

특히 2017년에 등장한 ‘Transformer’ 구조가 결정적이었다. 이 구조 덕분에 텍스트를 대량으로 학습시켜 “언어를 이해하고 생성하는 AI”를 만들 수 있게 되었다. GPT(Generative Pre-trained Transformer)라는 이름 자체에 Transformer가 들어 있다.

그리고 2022년, OpenAI가 이 기술을 누구나 쓸 수 있는 대화 인터페이스로 감싸서 공개한 것이 ChatGPT다. 기술 자체는 갑자기 나온 게 아니었지만, ‘누구나 쓸 수 있게 된 순간’이 혁명이었다.

AI가 다 같은 AI가 아니다

여기까지 읽으면 AI가 무엇인지, AI/ML/DL의 관계는 이해가 됐을 것이다. 그런데 한 가지 더 알아야 할 것이 있다. AI가 ‘다루는 대상’도 제각각이라는 것이다.

넷플릭스가 영화를 추천하는 AI와, ChatGPT가 코드를 짜주는 AI와, 스마트폰이 사진을 보정하는 AI는 전혀 다른 일을 한다. 같은 “AI”라는 이름을 쓰지만, 먹는 데이터도 다르고, 하는 일도 다르다.

AI를 분류하는 가장 직관적인 기준은 ‘AI가 다루는 데이터의 종류’다.

텍스트 AI — 읽고, 쓰고, 이해하고, 답한다

사람이 쓰는 ‘언어(텍스트)’를 다루는 AI다. 전문 용어로는 ‘자연어 처리(NLP)’라고 한다.

하는 일	예시
번역	파파고, DeepL, Google 번역
요약	긴 문서를 핵심만 뽑아주는 기능
질의응답	ChatGPT에 질문하고 답변 받기
분류	이메일 스팸 필터, 감성 분석
글쓰기	AI가 보고서/이메일/코드 초안 작성

ChatGPT, Gemini, Claude가 바로 이 텍스트 AI의 최신 형태다.

이미지/영상 AI — 보고, 인식하고, 만든다

사진이나 영상을 다루는 AI다. 전문 용어로는 ‘컴퓨터 비전(CV)’이라고 한다.

하는 일	예시
이미지 인식	사진 속 고양이/개 구분, 얼굴 인식
물체 감지	자율주행차가 보행자/신호등 감지
이미지 생성	DALL-E, Midjourney, Stable Diffusion
영상 분석	CCTV 이상 행동 감지, 의료 영상 판독

음성 AI — 듣고, 말한다

사람의 음성을 다루는 AI다.

하는 일	예시
음성 인식 (듣기)	“시리야”, “OK 구글”, 회의 녹음 자동 변환
음성 합성 (말하기)	AI 성우, 네비게이션 안내 음성, TTS
음성 복제	특정 사람의 목소리를 학습해서 재현

*텍스트, 이미지, 음성. AI가 다루는 데이터에 따라 하는 일이 완전히 다르다.*

또 다른 분류: 분석형 vs 생성형

데이터 종류 외에, ‘무엇을 하느냐’로도 AI를 나눌 수 있다.

‘분석형 AI’는 기존 데이터를 보고 판단하거나 예측한다. 스팸인지 분류하고, 주가를 예측하고, 사진 속 고양이를 인식하는 것이다.

‘생성형 AI’는 기존에 없던 것을 새로 만들어낸다. 2022년 이후 AI 붐의 중심이 바로 이것이다.

생성 대상	예시
텍스트	ChatGPT, Claude가 글/코드를 작성
이미지	DALL-E, Midjourney가 그림을 그림
음성	AI 성우, 음성 복제
영상	Sora, Runway가 영상을 생성
음악	Suno, Udio가 음악을 작곡

생성형 AI는 특정 데이터 종류에 묶이지 않는다. 텍스트든, 이미지든, 음성이든, ‘새로 만들어내는’ 모든 AI가 여기에 해당한다.

              분석형          생성형
             (이해/예측)      (새로 만들기)
  ─────────────────────────────────────
  텍스트 │  스팸 분류       │  ChatGPT, Claude
  이미지 │  얼굴 인식       │  DALL-E, Midjourney
  음성   │  음성 인식       │  AI 성우, TTS
  영상   │  CCTV 분석      │  Sora, Runway

왜 요즘은 LLM이 특히 주목받는가

이렇게 다양한 AI가 있는데, 왜 2024~2026년의 AI 이야기는 거의 다 LLM(대형 언어 모델) 중심일까?

이유는 단순하다. ‘언어’가 인간에게 가장 자연스러운 인터페이스이기 때문이다.

이미지 AI에게는 이미지를 줘야 하고, 음성 AI에게는 음성을 줘야 한다. 하지만 텍스트 AI에게는 그냥 말하면 된다. “이거 요약해줘”, “코드 짜줘”, “번역해줘”. 누구나 할 수 있다.

그리고 LLM의 또 다른 특별한 점은, ‘하나의 모델이 여러 가지 일을 한다’는 것이다.

과거의 AI	지금의 LLM
번역 AI는 번역만	번역도 하고
요약 AI는 요약만	요약도 하고
Q&A AI는 답변만	코딩도 하고
각각 별도의 모델 필요	하나의 모델로 다 가능

예전에는 번역을 위한 AI, 요약을 위한 AI, 챗봇 AI를 각각 따로 만들어야 했다. 하지만 ChatGPT 같은 LLM은 하나의 모델로 번역, 요약, 질의응답, 글쓰기, 코딩을 모두 할 수 있다. 이것이 LLM이 “범용 AI”에 가장 가까운 존재로 주목받는 이유다.

게다가 최근에는 LLM이 텍스트만 다루는 것이 아니라, 이미지도 이해하고, 음성도 처리하는 ‘멀티모달(Multimodal)’ 방향으로 진화하고 있다. GPT에 이미지를 보여주면 설명해 주고, Gemini에 영상을 보여주면 분석해 주는 식이다. 텍스트 AI가 다른 영역까지 흡수하기 시작한 것이다.

*LLM은 하나의 모델로 여러 가지 일을 한다. 그리고 점점 눈과 귀까지 갖추고 있다.*

정리: AI 개념 지도

이 글에서 기억해야 할 것을 정리하면 이렇다.

‘AI는 하나의 기술이 아니라 여러 접근법의 묶음이다.’ (규칙 기반 → 머신러닝 → 딥러닝)
‘AI는 다루는 데이터에 따라 종류가 다르다.’ (텍스트, 이미지, 음성)
‘AI가 하는 일에 따라 분석형과 생성형으로 나뉜다.’
‘우리가 요즘 말하는 AI는 대부분 딥러닝 기반 LLM이고, 하나의 모델이 여러 가지 일을 한다.’

구분	다루는 데이터	분석형 (이해/예측)	생성형 (새로 만들기)
텍스트 AI	글, 코드, 대화	분류, 감성 분석, 검색	ChatGPT, Claude, Gemini
이미지 AI	사진, 그림	얼굴 인식, 물체 감지	DALL-E, Midjourney
음성 AI	음성, 소리	음성 인식, 받아쓰기	TTS, AI 성우
영상 AI	동영상	CCTV 분석, 동작 인식	Sora, Runway

이 개념 지도를 갖고 있으면, 앞으로 나올 용어들이 훨씬 편하게 들어온다.

다음 글에서는 이 표의 오른쪽 위, ‘LLM’이 실제로 어떻게 작동하는지 들어가 보겠다. ‘Transformer’라는 구조가 뭔지, ‘토큰’이란 뭔지, 왜 “다음 단어를 예측하는 것”만으로 이렇게 똑똑해질 수 있는지.

AI란 무엇인가: 매일 쓰면서도 설명 못 하는 그것

우리는 왜 갑자기 AI를 매일 말하게 됐을까

우리가 이미 쓰고 있는 AI

AI란 무엇인가

접근법 1: 규칙 기반 — “사람이 규칙을 정해준다”

접근법 2: 머신러닝 — “데이터를 주면 기계가 규칙을 찾는다”

접근법 3: 딥러닝 — “인간 뇌를 흉내 낸 신경망으로 학습한다”

AI, 머신러닝, 딥러닝: 헷갈리는 용어 정리

왜 지금 AI가 이렇게 강력해졌나

AI가 다 같은 AI가 아니다

텍스트 AI — 읽고, 쓰고, 이해하고, 답한다

이미지/영상 AI — 보고, 인식하고, 만든다

음성 AI — 듣고, 말한다

또 다른 분류: 분석형 vs 생성형

왜 요즘은 LLM이 특히 주목받는가

정리: AI 개념 지도

관련

Filed under

More Articles

LLM은 어떻게 동작하나: 토큰, Transformer, 컨텍스트 윈도우

댓글 남기기 응답 취소

우리는 왜 갑자기 AI를 매일 말하게 됐을까

우리가 이미 쓰고 있는 AI

AI란 무엇인가

접근법 1: 규칙 기반 — “사람이 규칙을 정해준다”

접근법 2: 머신러닝 — “데이터를 주면 기계가 규칙을 찾는다”

접근법 3: 딥러닝 — “인간 뇌를 흉내 낸 신경망으로 학습한다”

AI, 머신러닝, 딥러닝: 헷갈리는 용어 정리

왜 지금 AI가 이렇게 강력해졌나

AI가 다 같은 AI가 아니다

텍스트 AI — 읽고, 쓰고, 이해하고, 답한다

이미지/영상 AI — 보고, 인식하고, 만든다

음성 AI — 듣고, 말한다

또 다른 분류: 분석형 vs 생성형

왜 요즘은 LLM이 특히 주목받는가

정리: AI 개념 지도

이 글 공유하기:

관련

Filed under

More Articles

LLM은 어떻게 동작하나: 토큰, Transformer, 컨텍스트 윈도우

댓글 남기기 응답 취소

Categories