【Claudeが示す落とし穴】AIが賢くなるほど、人間の判断は怪しくなる
本記事は、生成AIコミュニティ「IKIGAI lab.」に所属するメンバーが、生成AIに関するニュースを紹介&深掘りしながら、AIがもたらす「半歩先」の未来に皆さんをご案内します。
5月14日 6:30
はじめに
本連載は、生成AIコミュニティ「IKIGAI lab.」で活動しているメンバーが、それぞれの視点から最新のAIトレンドとビジネスへの示唆を発信しています。
2026年1月の記事「【2026年の新常識】「良い質問」より「良い前提」。生成AIを動かすコンテキスト設計」と2月の記事「【arXiv最前線】自律型AIに潜む「信頼できない思考プロセス」」では、AIをうまく使うためには「良い前提」の設計が重要であること、そして自律型AIの思考プロセスそのものには信頼できない側面があることを整理してきました。こうした流れを踏まえつつ、2026年4月時点ではさらに具体的な動きが出てきています。
OpenAIは2026年4月23日、GPT-5.5を発表しました。コーディング、オンライン調査、データ分析、ドキュメント作成、ソフトウェア操作、複数ツールをまたぐ作業を強みとして公式に説明しており、曖昧な目標を与えても自律的に計画・実行・検証まで進むエージェント型の設計が特徴とされています。
Googleも4月22日にGemini Enterprise Agent Platformを発表し、Vertex AIの後継として、企業内でのエージェント構築・運用・管理を一元化する方向性を強めています。
実際に使い込むと、単なる「便利機能」ではないことが分かります。スキルに入れるべきものは、製品情報や過去資料のような知識よりも、「どの順番で考えるか」「何を見落としてはいけないか」「何をもって良いアウトプットとするか」という判断の構造です。
どのようなスキルが作れるのか、構成の一例を示します。
Claude Codeを使う際に重要になるのが、「.claude/」ディレクトリを中心としたプロジェクト構成の設計です。公式ドキュメントが示す標準的な構成は以下のようになります。
ハーネスとは、もともと馬具を意味する言葉です。そこから転じて「AIという強力だが制御の難しい力を、目的の方向に正しく導くための装置・仕組み一式」を指しています。式で表すと次のようになります。
馬がどれだけ速くても、手綱と鞍がなければ制御できません。モデルとハーネスの関係もこれと同じです。より良い成果をもたらすのは「良いモデル」ではなく、「良いハーネス」であることが多いとされており、CLAUDE.mdや「.claude/」以下の設定群を丁寧に設計することが、まさにハーネスエンジニアリングにあたります。
もちろん、Claude Skillsもハーネスの構成要素として捉えられます。スキルに「いつ使うか」「何をトリガーにするか」の説明を定義すること、SKILL.mdに判断の順序・禁止事項・出力の評価基準を書き込むことは、エージェントが動く環境を設計する行為そのものです。
ハーネスの構造を変えると、何が変わるか
Anthropicが行った「計画・生成・評価」の3エージェント構成の実験では、単一エージェントと比べて出力品質が「技術的には動くが壊れている」状態から、「単一エージェントでは試みもしなかった機能まで含む完全動作」へと大きく改善したと報告されています。まさにモデルを変えたからではなく、ハーネスの構造を変えた結果です。
しかし、ハーネスを丁寧に設計すればするほど、別のリスクが生まれます。
「整った出力」が判断を止める。自動化バイアスという落とし穴
AIの出力が実務に近づくほど、人間は「これでよさそうだ」という感覚を持ちやすくなります。
この現象は「自動化バイアス(Automation Bias)」と呼ばれており、人間がシステムの判断に過度に依存し、矛盾する情報があっても意思決定をシステムに委ねてしまう傾向を指します。AIの出力が整っているほど、人間はその内容を批判的に読む前に「正しそうだ」と判断してしまいます。専門家でも例外ではなく、むしろシステムへの習熟度が高いほど、確認を省略しやすくなる点が厄介です。
実務で起きやすい自動化バイアス
実務で起きやすい自動化バイアスのパターンは3つあります。
①承認の形骸化
AIが作った提案書や分析コメントが整っていると、人間はレビューを省略しやすくなります。形式が正しいことと、内容が実務に即しているかどうかは別の話ですが、見た目に引っ張られてしまいます。
②課題設定のズレの見逃し
AIは与えられた前提の中で最適化します。前提自体が間違っていても指摘しません。どれだけ精緻なハーネスを設計しても、そのハーネスが今回の案件に適切かどうかは人間が判断しなければなりません。
③責任の所在の曖昧化
AIが作業を担う範囲が広がると、最終的な成果物に誰がどこまで責任を持つかが見えにくくなります。「AIが出したので」という説明が、アカウンタビリティを薄める方向に働くリスクがあります。
まとめ:AIが便利になるほど、問われるのは人間側の構造設計
Claude Opus 4.7、GPT-5.5、Gemini Enterprise Agent Platformに共通するのは「AIが作業を担う範囲の拡大」という方向性です。ただし、AIが実務に近い成果物を出せるようになるほど、過信のリスクは大きくなります。自動化バイアスが示すように、整った出力は人間の批判的思考を止めます。
こうした中で、SNSでは「AIの便利な使い方」が毎日流れてきますが、それが実務で本当に機能するかどうかは、環境設計の質で決まります。AIが動く環境を設計できるか。AIが最適化している前提を疑えるか。最終的な判断に誰が責任を持つかを明確にできるか。これらを意識できるかどうかが、AI活用の質を分けます
この問いに答えるのが仕組みを設計し、出力を監査し、判断に責任を持ち続ける構えを示す「ハーネスエンジニアリング」という概念で、本記事で示したClaude Skillsの設計や4つの実践は、その具体的な出発点です。自分の仕事の構造を理解し、どこまでを任せ、どこからを人間が担うかを設計し続けてみてください。
- この記事のキーワード
この記事をシェアしてください
