AI Workability Leveling
AIが働きやすい組織環境の5段階
How easy is it for AI to actually do work in your organization?
Written by Yeesy — GUILD42 座長
経営者の仕事が変わった
経営者の仕事は「社員が働きがいを持って、働きやすい環境を構築すること」だと、よく言われる。組織戦略の基本であり、人事戦略はその中核に位置する。優れた経営者は、優れた環境を作ることで、優れた成果を引き出す。
この原則は変わらない。ただし、「社員」の定義が変わった。
McKinsey は「The Future of Work is Agentic」において、AIエージェントが新しいクラスの「ワーカー」として組織に参加する未来を描いている。SHRM(米国人材マネジメント協会)の調査では、2025年末までに企業の25%がAgentic AIをタスク遂行に活用し、2027年には50%に達すると予測している。「デジタルワーカー」が2025年時点で組織の中核的な貢献者となる企業は30%に上る。
MicrosoftのSatya Nadella CEOは、AIエージェントを「Chief of Staff(首席補佐官)」と表現し、製品設計の基盤を「per user(ユーザー単位)」から「per agent(エージェント単位)」へ転換すると宣言した。IT部門が「AI版HR」として機能する新しいモデル——Agent 365がその実装だ。
つまり、経営者がこれから構築すべき「働きやすい環境」には、AIが働きやすい環境が含まれる。そしてこの視点の有無が、AI時代の経営成果を決定的に分ける。
なぜ「AIが働きやすい環境」が必要なのか
現実: AI投資の大半は成果を出していない
数字は残酷だ。
引き出せていない企業
本番到達前に放棄した企業
影響を「なし」と回答
1987年にノーベル経済学者Robert Solowが「コンピューターの時代はどこにでも見えるが、生産性統計の中だけには見えない」と述べたソロー・パラドックスが、AIで再現されている。
原因: ワークフローの再設計をしていない
では、成果を出している少数派は何が違うのか。
McKinseyの2025年AI状況調査が明確な答えを出している: AI高業績企業は、ワークフローの根本的再設計を実施している比率が、他社の2.8倍(55% vs 20%)。25の属性を検証した中で、EBIT(営業利益)への影響が最も大きかったのが、この「ワークフロー再設計」だった。
これは「既存のワークフローにAIツールを追加する」ことではない。ワークフロー自体を、AIが参加する前提で再構築することだ。
問いの転換が必要
大半のAIトランスフォーメーション支援は、こう問いかける:
- 人間の仕事を前提に、AIが補助
- 現状の「ステップ」をAIで削減
- 改善幅は既存構造に制約される
- AIエージェントが主体的に動く
- 人間は「承認・判断」にのみ登場
- 構造ごと再設計するため効果が桁違い
前者は、人間のワークフローを前提とし、AIを補助として差し込む。後者は、AIのワークフローを前提とし、人間が必要な箇所だけを定義する。
BCGは「AI-first operating model」の必要性を強調し、「CEOはツールの導入を超えて、仕事の本質そのものを再構想しなければならない」と述べている。既存プロセスにAIを載せるだけでは足りない。プロセス自体を、AIが主体として動ける形に再設計する必要がある。
「AIが補助する」のではなく「人間がAIを補助する」
この考え方の転換は、極端に聞こえるかもしれない。しかし現実を見れば、すでにそうなりつつある。
ナレッジワーカーの役割は、AIを教え、評価し、使いこなす——いわばAIに対するHRのような存在になる。SHRMの研究は、先進的なリーダーがAIを「新しい採用者」のように組織に統合していると報告している——カルチャーフィット、ブランドとの整合性、明確な役割定義を検討した上で導入する。
もちろん、AIが業務の90%を担える業界もあれば、30%程度の業界もある。業務特性や規制環境によって異なる。しかし、どんな業界でもAIが30%以上の業務を担える余地がある。それでも「AIを導入しても生産性が上がらない」というのであれば、それはAIの限界ではなく、経営者がAIにとって働きやすい環境を構築できていないということだ。
人間が仕事をしやすい環境を整えるのが経営者の責務であったように、これからはAIが仕事をしやすい環境を整えることも同等の経営責務になる。そして重要なのは、この2つは二律背反ではないということだ。AIが働きやすい環境——構造化されたデータ、明確な定義、プログラマティックなインターフェース——は、実は人間にとっても透明性が高く、再現性のある環境でもある。
AI Workability Leveling: 5つのレベル
ここからが本題だ。
AI成熟度モデルは数多く存在する。Gartner、MIT CISR、MITRE。しかし、これらは全て人間がAIをどう使うかを測っている。
本当に測るべきは「AIがあなたの組織でどれだけ働きやすいか」だ。
自動運転のレベル(SAE L1-L5)が「車がどれだけ自分で運転できるか」を定義したように、このフレームワークはAIが組織内でどれだけ自分で仕事できるかを定義する。評価軸は2つ:
Data
AIが読めるデータ形式と構造
md, json, csv, yaml / ローカルフォルダ管理
UI / Execution
AIが実行できるインターフェース
CLI, API / Agent Runtime
大半の組織がここにいる。業務は人間向けUIの中で完結している。データはExcelファイル、PDF、プロプライエタリなSaaSの画面の中に閉じ込められている。
一部の個人がChatGPTやClaudeを使い始めている。しかしそれは「AIに聞いてコピペする」レベルであり、組織のシステムとは完全に断絶している。AIはメールの下書きを書いたり、要約したりできるが、業務システムには指一本触れられない。
個人のAI FluencyはLevel 1-2(Casual Consumer〜Prompt Coder)。組織としてはAIの話題は出るが、戦略はない。Gartner AI MaturityのLevel 1: Awarenessに相当する。
特徴
- 業務データがExcel、PDF、SaaS画面内に閉じている
- APIもCLIも存在しない、またはアクセスが封じられている
- 個人がChatGPT/Claudeを「便利ツール」として使う
- AIと業務システムの間に接点がゼロ
- IT部門はAI利用を黙認または禁止
よくある風景
課題
AIの能力はユーザーの個人スキルに完全に依存する。組織としてのAI活用はゼロ。10人がChatGPTを使っていても、10個のバラバラな使い方が存在するだけだ。Fortune誌が報じた調査によれば、経営層のAI利用は平均で週1.5時間に過ぎない。これでは組織的な生産性向上は起こりえない。
組織がAI活用を本格化しようとする最初の段階。しかし既存の人間向けアプリケーションはそのまま。MCP (Model Context Protocol)やRPA、ブラウザ自動化で、AIが人間用アプリにアクセスする「橋」を後付けする。
Anthropicが2024年にMCPを発表して以来、数万のコミュニティMCPサーバーが構築された。Slack MCP、Google Drive MCP、Salesforce MCP。これらはすべて人間向けに設計されたアプリを、AIが操作できるようにするアダプターだ。
動く。しかし脆い。UIが変われば壊れる。認証が切れれば止まる。画面の構造が前提のデータ取得は、本来のAPI呼び出しとは品質が違う。
ここで多くの組織が「AIは使えない」と判断する。S&P Globalのデータによれば、42%の企業がAIイニシアティブを本番到達前に放棄している。しかし問題はAIではなく、AIにとって働きにくい環境のまま使おうとしていることだ。
特徴
- 人間用SaaSアプリ + MCP/RPA/ブラウザ自動化の後付け
- データは取得可能だが、構造がアプリ依存でバラバラ
- AI連携は「動くが壊れやすい」
- 一部の自動化ワークフロー(Zapier、Make、n8n)が稼働
- 個人のAI FluencyがLevel 2-3(Prompt Coder〜Context Developer)
よくある風景
なぜここで止まるのか
人間の環境をそのままにして、AIを「人間の代わりに画面操作するもの」として使おうとしている。これは本質的に自動化ではなく、模倣だ。Madrona が定義するAgent InfrastructureのTools Layerだけが存在し、Data LayerとOrchestration Layerが欠けている。橋はあるが、道路も信号もない。
ここでMcKinseyのデータを思い出してほしい。ワークフローを根本的に再設計した企業は、そうでない企業の2.8倍のEBIT効果を得ている。Level 2は、ワークフローを再設計せずにAIを載せようとしている状態だ。
ここが最も重要な転換点だ。「AIにデータを渡す」から「AIが自分でデータを読み、自分で操作を実行できる環境を構築する」へ発想が根本的に変わる。
Data: AIが読めるデータ形式と構造
データをAIが読みやすい形式で管理する。Markdown、JSON、CSV、YAML。ローカルフォルダに置き、AIがファイルシステム経由で直接アクセスする。
CLAUDE.mdのようなコンテキストファイルが各プロジェクトに存在し、AIは作業開始時に「このプロジェクトは何で、どういうルールがあるか」を自分で読み取れる。データの構造や命名規則が一貫しており、AIが迷わない。
The Agentic WebというDEV Communityの記事が指摘するように、AIエージェントが効果的に機能するためには、データが機械可読であることが前提条件となる。RDFやOWLのような高度なセマンティック技術がなくても、MarkdownやJSON、YAMLで構造化してローカルフォルダに置くだけで、AIのデータアクセス品質は劇的に向上する。
UI: AIが実行できるインターフェース
Google Workspace CLI、GitHub CLI、TerraformのようなAPI-first / CLI-firstのツールで業務を構成する。UIは人間用のフロントエンドに過ぎず、データとアクションはすべてCLI/API経由でアクセス可能。
Gartnerの予測では、2026年に企業アプリの40%がタスク特化型AIエージェントを統合する(2025年は5%未満)。API-nativeなスタックを選定できている組織は、AIエージェント統合のコストが桁違いに低い。
協働: Human + AI Real-time
このレベルでの典型的な作業フローは、人間がAIを呼び出し、リアルタイムで会話しながら成果物をレビューする。AIが書いたコードを人間が横で見ながら修正指示を出す。AIが生成したレポートを人間がその場で確認し、方向性を調整する。
特徴
- データがAI可読形式(md, json, csv, yaml)でローカル管理されている
- CLAUDE.mdなどのコンテキストファイルが整備されている
- CLI/APIベースのツールスタックが選定されている
- 人間がAIを呼び出し、リアルタイムで協働・レビューする
- 組織全体がContext Managementを理解している
よくある風景
claude
を起動し、CLAUDE.mdを読んだAIに「このissueを解決して」と指示する。AIがコードを書き、テストを走らせ、人間がdiffをレビューして承認する。ドキュメントはMarkdownでGit管理され、AIが直接読み書きできる。議事録はJSON構造で保存され、AIが横断検索できる。
Level 2との決定的な違い
Level 2は「人間用アプリにアダプターを噛ませる」。Level 3は「AIが直接読み書き・実行できる環境を構築する」。この違いが、McKinseyが指摘する「ワークフロー再設計」の実態だ。
Level 3まではAIは「呼ばれたら動く」。Level 4ではAIが自分で起動し、定められたワークフローに従って処理を完遂する。
決まったワークフロー——デプロイ、テスト実行、定期レポート生成、異常検知——においてAIが正確に自律実行する。基本的に自分で判断して起動し、例外や判断に迷うケースでのみ、AIの判断でhuman-in-the-loopに入る。人間が「AIを呼ぶ」のではなく、AIが必要な時に人間を呼ぶ。
Knight InstituteのAI Autonomy LevelでいうL3-L4。人間の役割がOperator(操作者)からSupervisor(監督者)、さらにApprover(承認者)へ移行する。
Dextralabsが定義するL3-L4: Orchestration & ComplianceからAutonomous Ecosystemへ。ガバナンスとaudit trailが整備され、AIの行動が追跡可能な状態で自律運用する。
ここで先ほどの問いの転換が現実になる。「人間のワークフローのどこをAIで効率化するか」ではなく、「AIエンジニアならこの業務をどう自動化するか」を起点に設計されたワークフローが稼働している状態だ。
特徴
- Agent Runtime(LangGraph、CrewAI、Claude Agent SDK等)が本番稼働
- 定期実行・イベント駆動でAgentが自律起動
- Agent Team(複数Agentの協働)が定められた業務プロセスを遂行
- AIが自律的にhuman-in-the-loopの要否を判断する
- 監視・ログ・audit trailが整備されている
- 人間は監督・承認・例外処理に集中
よくある風景
なぜLevel 3なしにLevel 4は不可能か
Level 3の「AIが読めるデータ」「AIが叩けるCLI」「コンテキスト管理」がなければ、Level 4のAgentは何もできない。Level 2のDuct Tape環境でAgentを動かすと、MCPの認証切れで深夜3時に止まり、誰にも通知されない。
BCGの調査で74%がAI投資から価値を引き出せていない最大の理由がここにある。Level 2の環境のままLevel 4の成果を求めている。基盤なきAgent化は、砂上の楼閣だ。
Level 3との決定的な違い
Level 4のAIは、人間にもできる仕事を、人間より速く、正確に、24時間休まずにこなす。定められたワークフローの中で、人間が判断できるレベルのタスクを卒なく自律実行する。優秀な作業者だ。
Level 5は質的に異なる。人間にはもはや判断できないレベルの複雑性と規模のデータを扱い、人間をGuideする。
数十のデータソース、数百万のレコード、数千の変数間の相関。部門を横断する因果関係。時系列で変化するパターン。人間の認知能力では、これらを同時に把握し、正しい判断を下すことは物理的に不可能だ。Level 5のAIは、Ontologyを通じてこの複雑性を理解し、人間が判断可能な形に構造化して提示する。AIがデータの意味を理解し、選択肢を構成し、判断材料を提示し、人間の意思決定をGuideする。人間は最終的にYes/Noを言うが、何をYes/Noするかを決めているのはAIだ。
「売上」というカラムが「税込月次売上(JPY)」なのか「税抜年間売上(USD)」なのか。「顧客」と「案件」と「サポートチケット」がどう紐づくのか。Knowledge Graphとセマンティックレイヤーが、データの意味と関係性をAIにとって機械可読にする。
Palantir Ontologyはこの段階の最も先進的な実装だ。Data(情報)・Logic(評価プロセス)・Action(実行)を統合し、AIが実際のビジネスオブジェクトに対してアクションを提案できる。組織のデジタルツインとして機能し、AIと人間が同じモデルを共有する。
Gartnerは2025年、セマンティック技術がAI・メタデータ・意思決定インテリジェンスの中心に来ると予測している。Knowledge Graphの構築は2024-2025年に本番運用レベルに到達し、300-320%のROIを達成した企業が出ている。
AIが人間をGuideするとはどういうことか
人間が問いを立てるのではない。AIが問いを立て、分析し、選択肢を構成し、推奨を提示する。人間はAIが構成した判断フレームの中で意思決定する。経営判断、リソース配分、リスク評価——AIがOntologyから全データを横断的に結合し、人間には見えないパターンを可視化し、「こう判断すべきだ」と提示する。
これは「AIが便利なレポートを出す」とは本質的に違う。AIが組織の意思決定構造そのものに組み込まれている。
特徴
- データカタログ・スキーマにビジネス上の意味が定義されている(Ontology)
- エンティティ間の関係性が機械可読(Knowledge Graph、RDF、OWL等)
- データの鮮度・品質・出所(lineage)がメタデータとして追跡可能
- AIが能動的に問題を検知し、分析し、選択肢と推奨を人間に提示する
- 人間の意思決定をAIがGuideする——何を判断すべきか、どう判断すべきかをAIが構成する
よくある風景
月曜朝、CEOのダッシュボードにAIからの3件のブリーフィングが届いている:
1. 「先週の解約率が前週比8%上昇。主因はオンボーディング完了率の低下(62%→48%)。CS AgentがチケットデータとNPSを分析した結果、UIリニューアル後の導線変更が原因と推定。推奨: オンボーディングフローをロールバックし、段階的にリリース。承認しますか?」
2. 「競合X社が新機能をリリース。Market AgentとProduct Agentの分析では、当社ロードマップの優先度変更を推奨。3つのシナリオを提示: A(対抗開発), B(差別化強化), C(静観)。推奨はB。根拠はこちら。」
3. 「来月のキャッシュフロー予測にリスクあり。請求サイクルと人件費の重なりにより、一時的に安全マージンが15%を下回る。推奨: 請求タイミングの前倒し交渉をFinance Agentが実行。承認しますか?」
CEOは分析をやっていない。AIが分析し、構成し、推奨した。CEOは判断する——しかし、判断の枠組み自体をAIが作っている。
Level 4との決定的な違い
Summary
| Lv | Name | AIを何に例えるか | Data | UI / Execution | AIの動き方 | 人間の役割 |
|---|---|---|---|---|---|---|
| 1 | The Locked Room | 外部業務委託(1:1) | 閉じている(Excel, PDF, SaaS画面内) | 人間用GUIのみ | 組織外で個人利用 | 全作業を実行 |
| 2 | The Duct Tape Bridge | 連携できる業務委託群(1:n) | MCP/RPAで取得可能だが散在 | アダプター経由で間接操作 | 人間用アプリを模倣操作 | 作業者 + AI設定者 |
| 3 | The Context-Ready Workspace | 優秀なインターン(指示待ち) | AI可読形式(md, json, yaml) | CLI / API-first | 人間とリアルタイム協働 | 指示者・レビュワー |
| 4 | The Autonomous Workflow | 優秀な正社員(ホウレンソウ) | 構造化 + コンテキスト管理 | Agent Runtime自律実行 | 定められたWFを自律実行 | 監督者・承認者 |
| 5 | The Ontology Layer | 部長クラス(戦略参謀) | セマンティック・関係性・意味定義 | AI判断でWF構成 | 人間の意思決定をGuide | 承認者(判断枠組みはAI) |
The Critical Threshold: Level 2 → Level 3
Level 2からLevel 3への移行が、このフレームワーク全体で最も重要なステップだ。
ここで必要なのは、高度な技術でもAIの最新モデルでもない。データ形式の選択とツールスタックの選定だ:
- ドキュメントをMarkdownで書く(Wordではなく)
- 設定をYAMLで管理する(GUIの設定画面ではなく)
- データをJSONで受け渡す(コピペではなく)
- ファイルをローカルフォルダで管理する(クラウドUIだけではなく)
- CLIがあるツールを選ぶ(GUIしかないツールではなく)
これらは技術的に難しいことではない。しかし、組織の意思決定として実行するのは簡単ではない。「なぜWordじゃなくてMarkdownなのか」「なぜSlack UIで十分なのにCLIが必要なのか」を説明し、納得させる必要がある。
答えは単純だ: AIが働けるようにするため。そしてAIが働ける環境は、実は人間にとっても透明で再現性が高い。
おわりに: 経営の問いを変える
もう一度、冒頭の問いに戻る。
経営者の仕事は「社員が働きがいを持って、働きやすい環境を構築すること」。これは変わらない。変わったのは、「社員」にAIが含まれるということだ。
AIがちょっとサポートする会社——この記事でいうLevel 3まで——は、既存のAIコンサル支援でも頑張ればたどり着ける。しかし、AI自律型企業(Level 4以上)を構築するためには、問いを根本から変えなければならない。
「今の業務プロセスのどこをAIで効率化できるか」ではなく、「AIエンジニアならこの業務をどう自動化し、どこだけを人間に確認してもらうか」。
この問いの転換ができない限り、組織はLevel 2のDuct Tapeの中で、AIの可能性を浪費し続けることになる。
ほとんどの組織はLevel 1-2にいる。Level 3に到達している組織は少数派だ。Level 5は2026年時点ではごく一部の先端企業のみ。しかし、Level 2→3の壁を意識して超えられるかどうかが、次の5年の競争力を決める。
References
- AI Fluency Leveling - Alex Ewerlöf
- The Future of Work is Agentic - McKinsey
- The State of AI in 2025 - McKinsey / QuantumBlack
- As AI Changes Work, CEOs Must Change How Work Happens - BCG
- AI Adoption in 2024: 74% of Companies Struggle - BCG
- The Org Chart of the Future - SHRM
- AI Agents as 'Chiefs of Staff' - PYMNTS
- Microsoft Agent 365 - GeekWire
- AI Productivity Paradox - Fortune / NBER
- AI Implementation Paradox - S&P Global
- Model Context Protocol - Anthropic
- AI Agent Infrastructure Stack - Madrona
- Agentic Maturity Model - Salesforce
- Agentic AI Maturity Model - Dextralabs
- Levels of Autonomy for AI Agents - Knight Institute
- Knowledge Graphs for Agentic AI - ZBrain
- The Agentic Web - DEV Community
- Palantir Ontology
- Ontology-Oriented Software Development - Palantir
- Semantic Technologies 2025 - Gartner
- Knowledge Graphs Production-Ready 2025
- Gartner AI Maturity Model
- MIT CISR Enterprise AI Maturity