2026年5月26日 (火)
重力の中心はモデルのデモから操作にシフトを保ちます。 注目に値するサービングとメモリーハンドリングは、コストレバーになりますが、新しい信頼性と安全性に関する質問を提起しています。 並行して、エコシステムは、エージェントが実際のアカウントと実質のお金に触れるとすぐに関係するエージェントの認証と登録(auth.md)を標準化しようとしています。
重力の中心はモデルのデモから操作にシフトを保ちます。 注目に値するサービングとメモリーハンドリングは、コストレバーになりますが、新しい信頼性と安全性に関する質問を提起しています。 並行して、エコシステムは、エージェントが実際のアカウントと実質のお金に触れるとすぐに関係するエージェントの認証と登録(auth.md)を標準化しようとしています。
AI のオープンソースの OSCAR を 2 ビットの KV キャッシュの量子化 に 長文サービング
一緒にAIがリリースしたOSCARは、キー/値のキャッシュを1要素あたり約2ビットに、注目を浴び、オフラインで推定された回転を使って定量化する方法です。
KVキャッシュメモリは、長距離のコンテキスト推論のための優勢なコストとレイテンシードライバーです。 量子化が大きい質の損失なしで記憶を切ることができるならば、それはより長いプロンプト、用具の跡および複数のリターンの代理店の経済を変えます。
- 01 Long-context scaling is increasingly a memory problem, not just a compute problem, so KV-cache compression is a first-class optimization target.
- 02 Attention-aware rotations suggest that data-informed transforms can preserve quality better than one-size-fits-all transforms, but they also introduce a new calibration step you must maintain.
- 03 Quantized caches can change failure modes. Small quality drops may concentrate in brittle places like retrieval, tool arguments, or numeric details, so you need targeted evals beyond average benchmark scores.
If you serve long-context models, build an evaluation slice specifically for KV-cache changes: (1) tool-call argument fidelity, (2) multi-step instruction adherence, and (3) numeric/identifier preservation. Roll out quantized KV caches behind a canary with per-request tracing so you can correlate regressions with prompt length and tool usage.
SafeHarbor は LLM の代理店の安全のための階層的、メモリ管理されたガードレールを提案します
新しいペーパーでは、階層的なメモリと構造の重なりを使用して、有害なツールアクションに操作されるエージェントのリスクを減らすためのガードレールのアプローチを紹介します。
ツールを使用してのエージェントはチャットボットとは異なる失敗します。 リスクは悪いテキストではなく、それは悪い行動です:排泄、不正な変更、または不可逆取引。 コンテキストを追跡し、ステップを渡る意図を追跡するガードレールは、コア要件になります。
- 01 Agent safety needs state, not just filters. Defenses must reason over multi-step intent and evolving context, including what the agent has already done.
- 02 Memory cuts both ways: it can help detect repeated patterns and escalation, but it also becomes a target for poisoning or policy bypass.
- 03 Operational success depends on observability. You need audit logs that tie each tool call to the user request, the policy decision, and the evidence used.
Add a “tool-call ledger” to your agent stack: record the user goal, each tool request, the policy decision (allow, deny, require approval), and the minimal evidence excerpt. Then run red-team scripts that try prompt-injection, hidden instructions, and escalation across multiple steps to see where your guardrails lose track of intent.
WorkOS は OAuth 条約上に構築されたエージェント登録プロトコル auth.md を公開しています。
WorkOSは、WebサイトがAIエージェントが登録、リクエストスコープを要求し、ユーザーリンクされた資格情報を取得する方法を説明するために公開できる提案された標準ファイルであるauth.mdをリリースしました。
エージェントは「読み取り専用ブラウジング」からユーザーを代わって行動に移るにつれて、フラグメントオンボーディングはボトルネックとセキュリティリスクになります。 予測可能な登録面は、アドホック認証処理を減らし、ベストプラクティスをデフォルトにプッシュすることができます。
- 01 Standardizing agent onboarding shifts risk left. If apps expose a clear, scoped flow, fewer teams will resort to brittle scraping or shared passwords.
- 02 OAuth-style scopes are only useful if the product enforces them. The hard part is defining least-privilege permissions that map to real actions.
- 03 Expect a long adoption curve. Even good standards fail if they are hard to implement or do not align with business incentives, so plan for hybrid support.
If you operate an API or web app that will be used by agents, prototype an agent-specific OAuth client type: short-lived tokens, explicit tool-action scopes, and mandatory audit metadata (agent name, run id). Even if you do not adopt auth.md immediately, building the primitives now will make later compatibility cheaper.
長いコンテキストベンチマークは、位置のブラインドスポットを持っています
多くの長文推論ベンチマークは、重要なタスクがコンテキスト内で表示される場所を制御しないと主張するペーパーは、脆弱な位置効果と過状態の現実的堅牢性を隠すことができます。
サイバーセキュリティのための垂直基盤モデルが測定可能
デュアルモードのベンチマークは、脆弱性の検出とWebアプリのセキュリティテストの両方でフロンティアモデルを評価し、セキュリティ重視のLLMに対するよりドメイングラウンドの評価を指しています。