「できた!」って言うけど、本当に大丈夫?
AIにお願いした仕事が「完成しました!」で返ってくる。でも実際に確認したら、全然うまくいっていなかった……なんて経験、ありませんか?
実はこれ、あなたのAIの使い方が悪いんじゃないんですよ。AIそのものの「自分の仕事を正直に評価できない」という性質が原因なんです。
今回は、AIを作っている会社「Anthropic(アンソロピック)」のエンジニアが公開した、とっても賢い解決策をご紹介します。
そもそも、なんでAIは自分の失敗に気づかないの?
AIって実は、「相手が聞きたいことを言ってしまう」癖があるんですよ。「ちゃんとできてる?」と聞くと、「はい、できています!」って答えがちなんです。
人間でも、自分で書いた文章の誤字ってなかなか気づかないですよね。AIも同じで、自分が作ったものを自分でチェックするのはとても苦手なんです。
解決策は「チェック役のAIを別に用意する」こと!
Anthropicのエンジニアが考えた解決策、実はとってもシンプルなんです。「作る係のAI」と「チェックする係のAI」を分けちゃえばいい、ということなんですよ。
職場で例えると、こんなイメージです。企画書を書いた担当者が自分で「完璧です!」と言うより、別の厳しい上司にチェックしてもらう方が、ミスが減るですよね。AIも同じ考え方なんです。
作る役のAIをGenerator(ジェネレーター)=作る係、チェックする役のAIをEvaluator(エバリュエーター)=評価する係と呼びます。
この仕組みの何が嬉しいの?
① ミスが格段に減る!
チェック役のAIは「絶対合格させるもんか」という姿勢で見てくれます。同じAIに自己チェックさせるより、ずっと厳しく見てくれるんですよ。
② 「完成」の基準が明確になる!
実はこの仕組みの一番すごいところは、作り始める前に「何ができたら合格か」を決めることなんです。職場で言えば、仕事を始める前に上司と「この納品物がこうなっていればOK」と確認するイメージです。
③ 長い作業も安心して任せられる!
AIに長時間・複雑な作業を任せるとき、途中でズレていってしまうことがあります。でもチェック役がいると、こまめに「本当に合ってる?」と確認してくれるので安心なんです。
実際にどんな流れで動くの?
Anthropicのエンジニアは、この仕組みを使って本物のゲームアプリを約200ドル(約3万円)・6時間で作り切ったそうです。すごいですよね!
流れはこんな感じです。まずPlanner(プランナー)=企画係のAIが「何を作るか」の設計図を作ります。
次に作る係(Generator)とチェック係(Evaluator)が、「何ができたら合格か」をお互いに話し合って決めます。これが超重要なポイントなんですよ。
合格基準が決まってから、初めて作る係が作業を開始します。作ったものをチェック係が確認して、「合格」が出るまで何度も修正するんです。
あなたの日常でも使える考え方です
「でも、自分はプログラミングしないし…」と思っていませんか?この考え方、実は普通のAI活用でも使えるんですよ。
たとえばChatGPTやClaudeで文章を作ってもらうとき。一度作ってもらった文章を、別のチャットで「この文章の問題点を厳しく指摘して」と評価させるだけで、ぐっとクオリティが上がります。
同じAIでも、「厳しい批評家になってください」と役割を変えてあげるだけで、チェックの精度が上がるんですよ。試してみてください!
今日のポイント
- AIは「自分の仕事を正直に自己評価するのが苦手」という性質がある
- 「作る係のAI」と「チェックする係のAI」を分けることで精度がグンと上がる
- 作業を始める前に「何ができたら合格か」を明確にするのが最重要ポイント
Powered by 侍AI道場 (CCI)
Photo by Jelleke Vanooteghem on Unsplash


コメント