Insights·2026-06-11

AI는 왜 규칙이 아니라 확률을 내놓는가

지금의 AI는 사람이 작성한 규칙을 실행하는 기계가 아니라, 데이터에서 스스로 찾아낸 패턴으로 "스팸일 확률 93%" 같은 확률을 출력하는 기계입니다. 계좌 이체처럼 조건이 명확한 문제는 규칙 기반 코드가 완벽하게 풀지만, 이미지 인식처럼 예외가 많고 경계가 흐릿한 문제에서는 규칙이 무너지기 때문입니다. 머신러닝과 딥러닝은 규칙 기반 시스템의 이 실패에서 나왔고, 이 구분은 AX 컨설팅에서 업무를 분해하는 첫 번째 기준이 됩니다.

규칙 기반 시스템은 어디서 무너지는가

계좌 이체와 세금 계산은 같은 입력에 같은 출력이 나오는 결정론적 시스템입니다. 조건이 명확하고 입력 범위가 유한해 코드로 완벽하게 풀립니다. 문제는 고양이 사진을 알아보는 일처럼 규칙이 흐릿한 영역입니다. "귀가 뾰족하면 고양이"라는 규칙은 귀 접힌 스코티시폴드에서 무너지고, 각도·조명·품종·포즈까지 커버하려면 규칙 수가 기하급수적으로 늘어나는 조합 폭발이 일어납니다.

유지보수도 문제입니다. 1990년대 스팸 필터가 대표 사례인데, "무료"라는 단어를 막으면 발송자는 "무료!" 같은 변형으로 우회합니다. 규칙을 더할수록 알려진 패턴에만 강하고 새로운 변형에는 즉시 무너지는, 오히려 취약한 시스템이 됩니다.

머신러닝은 무엇을 뒤집었는가

머신러닝은 발상을 뒤집습니다. 기존 프로그래밍이 데이터에 규칙을 더해 결과를 얻는다면, 머신러닝은 데이터에 정답(레이블)을 더해 규칙, 즉 모델을 얻습니다. 스팸 메일과 정상 메일을 학습시키면 모델이 두 클래스를 가르는 수학적 경계를 스스로 찾아내고, 새 메일이 오면 "스팸일 확률 93%"처럼 확률로 답합니다. 2000년대에 추천 시스템, 신용 평가, 카드 이상 거래 탐지가 이 방식으로 실용화됐습니다.

다만 어떤 특징(피처)을 볼지는 여전히 사람이 정해야 했습니다. 단어 빈도, 발신 도메인, 연체 횟수 같은 피처 엔지니어링의 품질이 모델 성능을 거의 결정했고, 이미지·음성 같은 비정형 데이터에서는 이 수작업이 한계에 부딪혔습니다. 딥러닝은 특징 추출까지 모델에 넘겨 이 문제를 풀었습니다.

딥러닝은 왜 2012년에야 터졌는가

인공신경망 개념은 1980년대에 이미 있었습니다. 2012년에야 폭발한 이유는 세 가지가 그제야 한꺼번에 갖춰졌기 때문입니다. 120만 장을 1천 개 카테고리로 레이블링한 이미지넷(2009), 게임 그래픽용으로 태어났지만 행렬 곱셈 병렬 처리에 정확히 맞아떨어진 GPU(2006년 CUDA 공개), 그리고 텐서플로우·파이토치 같은 오픈소스 프레임워크와 GPU를 시간 단위로 빌려주는 클라우드입니다.

그해 알렉스넷은 이미지넷 대회에서 탑5 오류율 15.3%를 기록해 2위(26.2%)를 10%포인트 넘게 따돌렸습니다. 2015년 레스넷은 152개 층으로 오류율을 3.57%까지 내려 인간 평균(약 5%)을 처음 밑돌았습니다. 음성 인식, 번역, 알파고, 의료 영상까지 같은 방식이 기존 기술을 차례로 넘어섰습니다.

비개발자는 이 역사에서 무엇을 가져가야 하는가

이 역사에서 비개발자가 가져갈 결론은 하나입니다. 지금의 AI는 규칙이 아니라 확률을 내놓는 기계라는 것. SH Consulting이 AX 컨설팅에서 업무를 분해할 때 첫 질문도 그래서 이것입니다. 이 일은 규칙으로 풀리는 문제인가, 패턴으로 풀리는 문제인가. 정산과 이체는 코드로, 판단과 분류는 모델로 보내면 AI에 무엇을 맡길지가 절반은 정리됩니다.

당시 딥러닝 모델은 전부 과제 전용이었습니다. 번역 모델이 의료 영상을 읽지 못했고, 새 작업마다 레이블된 데이터를 처음부터 만들어야 했습니다. 하나의 모델이 언어를 중심으로 여러 일을 할 수 없을까라는 질문이 지금의 LLM으로 이어집니다.