スポティファイは実際に何をしたのか
Anthropicのチャンネルに公開されたインタビューで、スポティファイのエンジニアリングリーダー、ニクラス・グスタフソンはいくつかの数字を明かします。コード変更リクエスト(PR)の73%を今やAIが直接作成し、PRの発生頻度は75%以上増え、1日あたり約4500回の本番デプロイを行いながら品質指標は変わらないというのです。これを支える社内ツールが「Honk」です。
Honkは最初からこの姿だったわけではありません。5、6年前、コードベースがエンジニアの人数より7倍速いペースで増えていることに気づき、バージョンアップやAPI移行といった反復的な保守作業を自動化するために作られたツールでした。当初は決定論的なスクリプトに頼っていましたが、コードのAPI表面はあまりに複雑で、すぐに限界に突き当たりました。その後、LLMを組み込む何十回もの試行錯誤を経て、今の形に落ち着きました。初期のバージョンでは、結果を見直す「審査(judge)」の工程がPRの成功率を約20〜30%から80%まで引き上げましたが、モデルとエージェント自体が十分に賢くなると、この審査工程は完全に取り除かれました。
AIに仕事を任せる前に、なぜ検証が先に必要なのか
スポティファイが人によるレビューなしにPRを自動マージすることに決めたとき、最初に投資したのはテスト自動化でした。以前はコードを所有するチームが全てのPRを自分の目で確認していたため、テストはある程度緩くても構いませんでした。その人によるレビューを外すには、テストがその役割を代わりに果たせるほど堅牢である必要がありました。グスタフソンは、人が介在しないクローズドループにおいて、検証こそがただ一つ最も重要な要素だと表現しています。
この原則はオフィスワークにもそのまま当てはまります。報告書の下書き、顧客へのメール、データの要約などをAIに任せたいなら、まずAIの出力が正しいかどうかを(自動であれ手動であれ)ふるいにかける基準が必要です。検証基準がないまま出力だけが速くなれば、誤りも同じ速さで広がります。
標準化がなぜAIの使い勝手まで左右するのか
グスタフソンは、同じ機能がコードベースの中で10通りの異なる方法で実装されていると、AIさえも混乱すると言います。逆に、コードやツール、フレームワークが一貫しているほど、AIが参照できるパターンは明確になり、出力の質も上がります。こうした標準化はもともと人が働きやすくするための投資でしたが、今ではAIの使い勝手を左右する条件になったと彼は指摘します。
オフィスの組織でも同じです。報告書のフォーマット、フォルダ構成、メールのトーンがチームごとにばらばらだと、AIに任せるたびに違う結果が出ます。逆に、フォーマットや手順がすでに標準化されているチームは、AIを導入した瞬間からすぐに効果が出ます。
AIが生み出した時間は、結局どこへ向かうのか
グスタフソン自身の変化も興味深いものです。以前はAIにコードの70〜80%を書かせ、残りは自分でIDEを使って仕上げていましたが、今ではその仕上げの作業自体がなくなりました。空いた時間は自然とプロトタイピングや顧客との対話、次に何をすべきか考えることへと流れていったと言います。
スポティファイはこの流れを全社的なインフラへと発展させました。エンジニアでない社員でも、アイデアを自然言語で説明すればAIが実際に動くプロトタイプを作ってくれる仕組みを構築し、社内にはそうしたプロトタイプを共有し体験できる「アプリストア」まであります。以前はアイデア一つを検証するのにエンジニアリングチームを説得して何週間も待つ必要がありましたが、今では実データを使って1日で確認できます。共同CEOの一人でさえ、この社内アプリストアに自作のプロトタイプを置いているほどです。
AXコンサルティングの視点で、オフィス組織は今何を備えるべきか
AXコンサルティングの現場で出会う組織に、私がいつも投げかける問いがあります。あなたのチームの業務ノウハウは文書として取り出されていますか、それとも数人の頭の中にしかありませんか。スポティファイの事例が示す通り、AIをどれだけ速く、どれだけ安全に使えるかは、結局のところ検証基準と標準化がどれだけ整っているかにかかっています。
グスタフソンが最後に語った個人的な感想も、かみしめる価値があります。彼はもともと自分の手でコードを書くこと自体を心から楽しんでいた人で、AIがその楽しみを奪うのではないかと心配していたそうです。しかし実際に自分が好きだったのは「問題を解決すること」であって、「手でコードを打つというやり方」ではなかったと気づいたといいます。この区別はオフィスワークにも通じます。今の仕事の中で自分が本当に好きな部分が、道具を扱う過程なのか、それともその結果として得られる問題解決や判断力なのかを見極められれば、AIの時代に何を守り、何を手放すべきかがずっとはっきりします。