AIはAIに管理させる時代へ──清水亮×深津貴之が語る「AIエージェント実践活用法」

「AIをAIに管理させる」時代の幕開け

「昔、東大生のインターンに頼んでいた仕事は、ほぼ全部AIができる」——清水氏はそう切り出す。

いまや単体のAIに指示を出すだけでなく、複数のエージェントを連続・並列で走らせ、さらにそのエージェント群を別のエージェントが管理するという構造が現実になりつつある。星をつけるエージェントがいれば、星を外すエージェントもいる。サボっているエージェントを見つけて報告する“中間管理職”までいる。

深津氏も「エージェントを人として数える日が、そろそろ来ているなという感じはしますね」と応じる。本対談は、その最前線で何が起きているのかを二人が具体例とともに明かす内容となった。

そもそもエージェントとは──「2年前から始まっていた」

エージェントという言葉は新しく聞こえるが、深津氏は「流れはもう2年くらい前から始まっていた」と指摘する。ChatGPTはすでに中身がエージェント的に動いており、検索するのもエージェントの仕事。LLM単体が検索しているわけではなく、ChatGPT自体が内部にエージェント的機能を抱えている。

転換点を挙げるなら——

クラウド型：去年の「GenSpark」あたり
ローカル型：今年1月の「Claude Code」で一気に注目が集まった

ただし清水氏は、本当のきっかけは gpt-oss だったと見る。「ものすごく性能が高くて、しかもノートパソコンでそのまま動いてしまう。プログラムを書かせてもサーバー管理をやらせても普通に動く。あれで一気に流れが来た」。

なぜいま“ローカルエージェント”なのか

清水氏が強調するのは、皮肉にもクラウドAIの「手抜き」問題だ。

Claude Codeとかが「1時間考えました、3000トークン返しました」と出てくる。割り算すると秒間0.8トークン。めちゃめちゃ遅い。サーバー側はダラダラ仕事した方がお金を取れるから、僕らが怒り出さない限りはダラダラやるんだろうな、と。
清水亮

一方ローカルで動かせば、Macでも秒間30トークン、気合いの入ったマシンなら100〜200トークン出る。「下手すると200倍速い仕事をしていることになる」というわけだ。

もうひとつの利点がコスト。ローカルのGPU（たとえば80GBのVRAM）をエージェントに使わせれば、「絵を描いて」と頼むだけで、API利用料をまったく使わずに Nano Banana 2 級の高品質な画像や動画を生成してくれる。「ローカルにエージェントを持ってくるのが、いま流行っている。自分好みにどんどん改造していけるのがいい」。

清水亮の自作エージェント群

清水氏は自作のローカルエージェントをいくつも運用している。

朱雀（Suzaku）：Macなどで実行すると gpt-oss を自動インストールし、それをベースに Claude Code で自分好みのエージェントを作れる“キット”。
一行インストーラ（UIなし）：一行をコピー&ペーストして Mac／Linux に貼るだけで、その場で環境をセットアップ。マシンの構成（搭載GPUや名前）に応じて、エージェントが自分で名前を決め、背景デザインまで変える。
SHIKI：普段使いの情報収集専用エージェント。

SHIKIが動くのは、手のひらサイズの小型マシン「GX10」。「昔なら何千万円もしたスパコン級のモデルが、たった60万円・この箱だけで動く」。その仕事ぶりはこうだ——

オープンソース版Twitterである Bluesky を24時間監視
AI関連の最新論文を見つけたら自動で読み込み・評価
「読むべき10本」をまとめ、「これは重要」「これは諦めた方がいい」とレポート化
内容を実際に検証し、「書いてあることは嘘でした」まで報告／同内容をメールでも送信
手が空くと「ユーザーは次に何を言いそうか」を自分で考え、先回りして機能を調べておく

「このユーザーはプログラマーか研究者だから、次はこういうことを言ってきそうだ——と勝手に思考を深めている。地味に便利なんですよ」。

ローカルでニュース番組を自動生成

清水氏のエージェントは、画像・動画・音声・台本のすべてをローカルで生成し、AIニュース番組まで自動で作る。冒頭で「こんにちは、R5です」と挨拶し、マイクロソフトの3D生成手法「TRELLIS」などの最新研究を紹介していく。

「クラウドでやるとAPI料金が死ぬほどかかるけど、ローカルなら電源を入れておくだけで勝手にニュースができる。朝ごはんを食べながら、歯を磨きながら耳で聞いて、面白そうなら自分で試す」。

“Claude Code 中間管理職”

そして象徴的なのが、Claude Code を管理するための Claude Code だ。「作りすぎて、どれが何をやっているか分からなくなった。だから中間管理職エージェントを作った。『今こいつサボってます』『寝てます』『これ終わってますよ』と出してくれる」。ダッシュボードからは Approve・Terminal・Log にワンタッチで飛べる。

「エージェントを人として数える日が、そろそろ来ている」

深津貴之の使い方──モデルはクラウド、土台はローカル

対して深津氏のスタイルは少し異なる。「モデルそのものはローカルではなく、GeminiやClaudeを使う。モデルを呼び出すための土台部分だけ、ローカルにPythonで組んでいる」。

やっていること自体は近い。情報収集をして、深津氏の場合はそれをポッドキャストにする。ほかにも Twitterの自動運用システム、Discordの自動運用システム など、運用業務の自動化ツールを作っている。

ただし——「正直、Claude Codeで足りちゃうことも多い。コストがあまり関係ない分野なら、定期的にClaude Codeを呼び出すバッチファイルが一番ラク。Claude Codeの20倍サブスクに入っていれば、大体のことはできる」と、現実的な“手抜き”も率直に語った。

エージェントの使い分け：長く・複雑で・並列なタスクに

エージェントは、何体かを連続起動したりして、長いタスクや複雑なタスクをやってくれる。「一個の文章を作って」ではなく、「リサーチしてまとめてレポートを書いて、評価してメリット・デメリットを出して、優先順位を決めて、ポッドキャストのシナリオを作って、動画化しておいて」——という複数の異なる作業を連続でやるものを、1日1回とか無限にやらせておく、というときにおすすめ。
深津貴之

業種別の始め方：不動産・株・カレンダー

「自分の業務をどう組めばいいか分からない」という人に向けて、二人は具体的な入口を示す。

不動産営業なら：物件ポータルサイトに毎日つないでデータを蓄積する。ブラウザで見られるものは Playwright をChromeに接続すれば取得できる。ただしTwitterのように、エージェントで叩くとすぐBANされるサービスもあるため、利用規約との関係には注意。
初心者なら：株か、自分のGoogleカレンダーから始めるのがいい。株はAPIがあるのでやりやすい。「APIで全銘柄をバーッと調べて、自分の条件に合うトップランキングのリストを作る。あとはファンダメンタルズと“噂話”をTwitterで集めれば、大体うまくいく」。

清水氏は、Twitter APIに課金するくらいなら「Gemini に払って、自社専用のローカルエージェントを作った方がいい」と助言する。Blueskyを24時間監視し、世界中のマーケットを監視し、台風や地震といった出来事もいち早く拾う——「人間よりはるかにサーベイできるから、次に何が起きるか予測しやすくなる」。

並列の威力：360度カメラ7台を同時編集

エージェント最大の利点は「24時間365日、横方向にいくらでもコピーできる」こと。清水氏は直近のハッカソンの例を挙げた。

「7チームそれぞれのコテージに360度カメラを設置したら、7×24時間ぶんの爆発的に長い動画になった。手で編集するのは大変。だから、カメラの360度データを見て『誰が喋っているか』『盛り上がっているか』を判断して編集するツールを作った」。

自宅のGPU 8基のうち7基で7台分を同時編集し、残り1基で次のスクリプトを書く。「昔はマンパワーが足りなくてカメラもそんなに置けなかった。一度文字に起こして、盛り上がっている箇所を見つけて切り抜く——こういうことに、すごく使える」。AIモデル開発でも同じで、無数のパラメータの組み合わせを「GPUの数だけ並列化できる。数があればあるだけ強い」。

エージェントがエージェントを動かす“組織”

清水氏のSHIKIに「これ面白いからやってよ」とネタを投げると、エージェントが「じゃあこれはあいつにやらせましょう」と、中間管理職として他のエージェントに割り振る。「うまくいかなかったら『こいつが詰まってるから見てやってくれ』と、有機的にエージェント同士を連携させる」。

仕組みとしては、カンバンやタスク管理ソフトのようなものを作り、それを操作させるのが基本だ。

親エージェントが受け取った仕事をタスクとして配る。AIがタスク表にペッと書く、あるいはIssueに書いて、暇なエージェントがそれを見に行って自分で消化する——そういう構造を作ると実現できる。

まさに「ほとんど会社ですよね」と二人。

情報を「捨てる」エージェント

膨大な情報をさばくなかで、清水氏はむしろ危機感を語る。「読まなきゃいけない情報、確認しなきゃいけない情報が増えすぎる問題は、どうしても起きる。だから『これは読まなくていい』『これは諦めた方がいい』と、捨てる担当をエージェントにお願いする」。

ニュースを500本購読していても、「このうち490本は読まなくていいから捨てておいたよ」とやってくれる。「星をつけるエージェントではなく、星を外すエージェント」という発想だ。

さらにTwitterには「ポルノっぽいもの」が多いと清水氏は言う。「派手な動画や、LLMがわーっと速く動いて気持ちよく見えるもの。人間の方が惑わされちゃう。だからTwitterの利用料を払ってでも、出てくるニュースを“クレバーな目”で見て『これはそんなにすごいこと言ってません』と判定させるのに使う」。

Googleカレンダーという最高の入門

清水氏が入門編として一番おすすめするのが、Googleカレンダー連携だ。「予定に入っている客先の会社名から、その会社をちゃんと調べて概要をまとめ、説明欄に入れておく。タクシーで移動中に読めるようにしておいてもらう」。

スケジュール管理は業種を問わず存在する。APIをつないで「来週の空き時間を一覧して」と頼むのは多くの人がやっているだろう。だが本質は、秘書に頼むのと同じだと深津氏は言う。

「月曜は会社に行きたくないから予定を入れないで、オンラインならいい」といった細かい話をしたうえで「空いている日いつ?」と聞けば一覧してくれる。向こうから来たメールも勝手にカレンダーに入れて、「この日ならいけます」と返してほしい。
深津貴之

セキュリティという永遠の課題

ただし、つなげばつなぐほどリスクは増す。「自分の予定を全部相手に送ってしまうとか、競合他社と会っていることがバレるとか。株が買えるエージェントを作って乗っ取られたら、株を全部売られたり、送金されたりする」。

どこまで権限を与えるかは「永遠の課題」。だからこそ「結局、いまのところは秘書を使った方がラク」という場面も残る。「全員の下に、直属の秘書とPMがつくような状態になる」——それが理想形だが、セキュリティインシデント時のダメージもまた大きくなる。

何をAIに任せるべきか

任せやすいもの

毎週・毎月発生するデスクワーク（清水氏は「請求書を代わりに書くエージェント」を作った。「原稿は書くけど、なんで何万円の請求書まで書かなきゃならんのや、と頭にきて」）
何の創造性もない、楽しくない作業。「楽しくないことからやる方が健全。楽しいことをやると大変なので」
2回以上やることは、まず自動化を考える
プログラミング（人間より得意）、根気のいる単純作業（「ひたすら動画を見て問題発言を探す」など）

任せる際の原則

ミスしてもアンドゥ・やり直しができる仕事。ミスしても人が死なない仕事。暴走しても無限に課金されない仕事——これが原則。
清水亮

ちなみに清水氏が大学の授業をエージェントにやらせようとしたら「人間じゃないとダメです」と断られたという。とはいえ「同じことを1日3回、別のクラスで喋るのは、自分の心を殺さないとできない。逆に毎回違う話をすると『3番目の授業が一番出来がいいらしい』と苦情が来る」——そんな反復こそ、AIが最も得意とする領域なのかもしれない。

おわりに

論文を選別し、ニュースを生成し、動画を編集し、請求書を書き、そして他のエージェントを管理する——清水・深津の両氏が描いてみせたのは、AIを「便利なツール」ではなく「数えられる働き手」として組織に組み込む未来だった。

入口はGoogleカレンダー連携のように小さくていい。だが「2回以上やることは自動化できないか」と考える習慣こそが、その先の大きな生産性へとつながっていく。

◆ ◆ ◆