OpenAI、「ChatGPT Atlas」のインジェクション対策について説明 「完全に解決されることはまずない」

OpenAIは、AI統合型ブラウザ「ChatGPT Atlas」におけるプロンプトインジェクション対策を公表した。強化学習を用いた「自動攻撃者」によるレッドチーミングで防御を強化し、発見から修正までのサイクルを高速化する方針。攻撃の完全な排除は困難としつつ、モデルの更新や具体的対策の推奨を通じてリスク低減を図るとしている。