ルールベースシステムはどこで崩れるのか
送金や税金計算は、同じ入力に同じ出力が返る決定論的システムです。条件が明確で入力の範囲が有限なので、コードで完璧に解けます。問題は、写真の猫を見分けるような、ルールが曖昧な領域です。「耳が尖っていれば猫」というルールは耳の折れたスコティッシュフォールドで崩れ、角度・照明・品種・ポーズまでカバーしようとするとルールの数が指数関数的に増える組み合わせ爆発が起きます。
保守も問題です。1990年代のスパムフィルターが典型例で、「無料」という単語をブロックすると、送信者は「無料!」のような変形で回避します。ルールを足すほど、既知のパターンにだけ強く、新しい変形には即座に崩れる、かえって脆弱なシステムになります。
機械学習は何をひっくり返したのか
機械学習は発想を逆転させます。従来のプログラミングがデータにルールを足して結果を得るのに対し、機械学習はデータに正解(ラベル)を足してルール、つまりモデルを得ます。スパムメールと正常メールで学習させると、モデルは2つのクラスを分ける数学的境界を自ら見つけ出し、新しいメールが来ると「スパムである確率93%」のように確率で答えます。2000年代には、推薦システム、信用評価、カードの異常取引検知がこの方式で実用化されました。
ただし、どの特徴(フィーチャー)を見るかは依然として人間が決める必要がありました。単語の頻度、送信ドメイン、延滞回数といったフィーチャーエンジニアリングの品質がモデル性能をほぼ決定し、画像・音声のような非構造化データではこの手作業が限界に突き当たりました。ディープラーニングは特徴抽出までモデルに任せ、この問題を解きました。
ディープラーニングはなぜ2012年になって爆発したのか
人工ニューラルネットワークの概念は1980年代にすでにありました。2012年になって爆発した理由は、3つの条件がそのときようやく一度に揃ったからです。120万枚を1,000カテゴリーにラベリングしたImageNet(2009年)、ゲームグラフィックのために生まれながら行列積の並列処理にぴたりと合ったGPU(2006年CUDA公開)、そしてTensorFlow・PyTorchのようなオープンソースフレームワークと、GPUを時間単位で貸し出すクラウドです。
その年、AlexNetはImageNetコンペでトップ5エラー率15.3%を記録し、2位(26.2%)を10ポイント以上引き離しました。2015年にはResNetが152層でエラー率を3.57%まで下げ、人間の平均(約5%)を初めて下回りました。音声認識、翻訳、AlphaGo、医療画像まで、同じ方式が既存技術を次々に追い越しました。
非開発者はこの歴史から何を持ち帰るべきか
この歴史から非開発者が持ち帰る結論は1つです。今のAIはルールではなく確率を出す機械だということ。だからこそSH ConsultingがAXコンサルティングで業務を分解するときの最初の質問はこれです。この仕事はルールで解ける問題か、パターンで解ける問題か。精算と送金はコードへ、判断と分類はモデルへ振り分ければ、AIに何を任せるかは半分整理できます。
当時のディープラーニングモデルはすべてタスク専用でした。翻訳モデルは医療画像を読めず、新しいタスクのたびにラベル付きデータをゼロから作る必要がありました。「1つのモデルが言語を中心に複数の仕事をこなせないか」という問いが、今のLLMにつながります。