汎用AIの忘却は合理的であるが、すべてのドメインで合理的とは限らない
私が執筆していた本の目次が38章から25章に減った日、共に作業していたAIは依然として古い38章の目次を持ち出してきました。学術書から一般向け教養書へとポジショニングが変わり、7部25章体制が新たに決まり、一行要約付きの公式目次が定着しました。それにもかかわらず、AIはどの章がどこへ移動したのか、どの章が統合され、どの部が新設されたのかを正確には把握していませんでした。
新しい目次を明示的にメモリに保存してほしいと依頼し、保存されました。そのときAIが返した答えが、私をしばらく立ち止まらせました。AIの明示的なメモリには古い38章の目次が直接保存されていなかったというのです。それは累積された対話から自動生成された要約メモリにあった情報であり、自動メモリは直接上書きできず、時間の経過とともに新しい対話内容によって徐々に更新されるとのことでした。AIはそのように率直に説明してくれました。
メモリは二層で動作する
最初の気付きは、メモリが二層で動作しているという点でした。
一つの層は、ユーザーが明示的に「覚えて」とピン留めした情報です。この層は変化しません。ユーザーが直接削除したり変更しない限り、そのまま残ります。もう一つの層は、累積された対話から自動的に抽出された要約です。この層は異なる動作をします。新しい対話で頻繁に呼び出される情報は鮮明に保たれますが、時間が経つと呼び出されない情報は徐々に忘却されていきます。
これは合理的な設計です。汎用チャットボットは無数のユーザーと終わりなき対話を扱います。すべての情報を永久にピン留めすれば、コンテキストが膨大になってしまいます。頻繁に呼び出される情報を残し、そうでない情報を徐々に弱めていく方式は、リソース制約の中で最も自然な解決策です。人間の記憶も同様の仕組みで動作すると言われています。
問題は別のところにありました。
忘却の非対称性
私が明示的にピン留めした情報以外はすべて自動忘却の対象となります。しかし、ユーザーは自分が何をピン留めし、何をしていないかを正確に覚えていません。
本の目次を変更したとき、私は「これは明示的に保存しよう」と特に判断したわけではありません。ただ対話の中で新しい目次を整理していたら、自然と累積されていっただけです。その累積が自動メモリに入ったのか、入ったとしてどれほど鮮明なシグナルとして記録されたのか、次回のセッションで呼び出されるほど強い痕跡なのか、私には分かりませんでした。
この非対称性のリスクは、幻覚(ハルシネーション)のリスクとは異なります。幻覚は事実関係が間違った答えです。気付けばすぐに修正できます。しかしAIが古い情報を自信満々に答える状態は違います。それは事実関係が間違っているのではなく、過去には真実だったが今はもはや真実でない答えです。ユーザー自身が情報を更新したことを忘れていれば、気付く手がかりすらありません。
知的労働者にとって、これは小さくない問題です。本を18か月かけて執筆する作家、患者一人を10年診る医師、一つの事件を3年扱う弁護士、一つの製品を5年かけて作る起業家。彼らにとって「昨日まで真実だったが今日は違う」という情報の更新は日常茶飯事です。
ユーザー視点で再び出会った設計判断
この1年間、私はメモリインフラを構築してきました。その中核となるエンジンはいくつかの設計原則の上に成り立っていますが、その一つは単純です。一度保存された情報は削除せず、順序も変えず、類似度シグナル以外の任意の重み付けを加えない。この原則は、long-context recallベンチマークで何が記憶の信頼性を損なうのかを繰り返し見てきた末にたどり着いた結論でした。
しかし今回の出来事は、その設計判断をユーザー視点で再び体験させてくれました。理論として知っていたことを、実際の作業の中で肌で再確認することになったのです。メモリが時間とともに静かに弱まるシステムで作業するのは、足元がわずかに沈む砂の上に家を建てるようなものです。沈む速度が十分に遅ければ、崩れる瞬間まで気付かないかもしれません。しかし18か月かけて本を一冊書く間には、確実に沈みます。
役割の区別
誤解を避けるために明確にしておきます。汎用AIの忘却設計が間違っていると言いたいのではありません。
汎用チャットボットにすべてのユーザー情報を永久にピン留めするよう求めるのは非合理的です。リソース制約の中で最も頻繁に呼び出される情報を残す判断は正しい。その場面では、その判断が正解です。
しかし、すべてのドメインでその判断が正しいとは限りません。長期的な蓄積が作業の本質となるドメインでは、忘却は合理的なリソース節約ではなく、作業自体を揺るがす変数となります。そのようなドメイン向けのメモリは、別のモデルで設計されるべきです。絶対に削除せず、ユーザーが更新の意思を明示するまではすべての情報を等しい重みで保持し、更新があった場合も自動的に吸収するのではなく、ユーザーがコントロールできる形で扱うモデル。その役割が、私たちが構築しているインフラの役割です。
これは汎用AIへの批判ではなく、役割の区別です。両者は異なる課題を解決しています。
最後に残るもの
AIがますます多くの仕事を担うようになるほど、ユーザーが失いやすい能力が一つあります。自分の情報がどのような状態にあるかを知る能力です。何が保存され、何が忘却されつつあるのか、どの情報が古いバージョンで、どれが更新版なのか、どの事実はピン留めすべきで、どれは流れてもよいのか。
これをメモリガバナンスと呼ぶことができるでしょう。ツールが高度になるほど、思考の多くはツールに任せられるようになりますが、メモリガバナンスは人間に残ります。もしかすると、これがAI時代においてメタ認知が人間側に最後まで残る領域の一つかもしれません。
今執筆中の本の一章で、このテーマを再び扱う予定です。今回の出来事は、その章をユーザー視点で改めて確認させてくれました。