2026年3月11日 (水)
OpenAIとGoogleは、よりインタラクティブでワークフローネイティブなAI体験をプッシュし、研究者やビルダーは、エージェントの信頼性(手順階層、コードレビュー)とエージェントインフラストラクチャ(ターミナルエージェント、コンテキスト検索)に焦点を当てた。
OpenAIとGoogleは、よりインタラクティブでワークフローネイティブなAI体験をプッシュし、研究者やビルダーは、エージェントの信頼性(手順階層、コードレビュー)とエージェントインフラストラクチャ(ターミナルエージェント、コンテキスト検索)に焦点を当てた。
OpenAIは指示の階層の挑戦を進水させ、プロンプト注入に対してモデルを硬化させます
OpenAIは、事前のモデルが、信頼されていないか、または競合するものよりも信頼できる指示を正しく優先するかどうかを訓練し、評価することを目的として、指示階層チャレンジ(IH-Challenge)を発表しました。
モデルがツールを使用してエージェントになるように, 指示に従う失敗は、実際のセキュリティインシデントに変わります (プロンプトの注射, データの排出, 不正な行動). よりよい指示階層は企業展開の操作上の危険性を改善し、減らします。
- 01 Instruction hierarchy is shifting from a research topic to a practical security control for agentic systems.
- 02 Teams deploying tool-using LLMs should treat prompt injection like a first-class threat model and test for it continuously.
- 03 Even without new model training, product mitigations (trusted tool routing, allowlists, policy gates) remain essential because evaluation gains do not eliminate adversarial inputs.
If you ship an agent that browses or runs tools, add a regression suite of adversarial prompts (hidden instructions, conflicting system/user content, malicious webpages) and require explicit tool authorization for high-impact actions. Track failures as security bugs, not UX issues.
ChatGPTは数学と科学の説明のためのインタラクティブなビジュアルを追加します
ChatGPTはインタラクティブなビジュアルの説明を生成できるようになりました。学習者は、静的な図に依存する代わりに、変数を操作し、概念を探索することができます。
インタラクティブな表現は、認知負荷を軽減し、概念的な間違いを先に表示させることができます。 AI製品にとって、これはテキストのみの回答から埋め込まれた、拡張可能なUI出力への移行を促し、エンゲージメントと学習成果を高めます。
- 01 Expect more AI outputs to become interactive artifacts (widgets, simulations, manipulatives) rather than paragraphs of text.
- 02 For education and documentation, interactivity can improve comprehension but also increases the need for correctness and guardrails.
- 03 Product teams should plan for evaluation beyond text: UI behavior, numerical fidelity, and edge-case handling matter.
If you build learning or analytics features, prototype a small set of interactive components (sliders, plots, step-by-step state) and set up validation tests for numerical accuracy and boundary conditions. Add clear citations or assumptions for generated visuals.
New ways to learn math and science in ChatGPT
ChatGPT introduces interactive visual explanations for math and science, helping students explore formulas, variables, and concepts in real time.
ChatGPT can now create interactive visuals to help you understand math and science concepts
Users can engage directly with interactive visuals instead of only reading explanations or viewing static diagrams.
GoogleスプレッドシートのGeminiはベータ機能と、最先端のパフォーマンスを主張します
Googleはベータで新しいGemini-in-Sheets機能を発表し、ユーザーがスプレッドシートを作成、整理、編集し、より複雑なデータ分析を自然言語の要求を通じて実行できるようにしました。
スプレッドシートは、ビジネスユーザー向けの高残留面積です。 AI-in-Sheets品質の向上により、既に起こるAIを埋め込むことで採用を加速し、企業分析における精度、透明性、および監査性を向上することができます。
- 01 Workflow-native AI (inside Sheets) is competing with standalone chat tools for daily business usage.
- 02 The biggest risk is silent analytical error; spreadsheet AI needs stronger provenance, explainability, and reproducibility.
- 03 Beta rollouts suggest rapid iteration—teams should watch for admin controls, data-handling policies, and compliance posture.
If you rely on AI-assisted spreadsheet analysis, require a repeatable trail: keep raw data snapshots, save generated formulas/queries, and add peer review for any decision-making dashboards. For vendors, expose a 'show work' mode and deterministic re-run options.
Gemini in Google Sheets just achieved state-of-the-art performance
Google announces new beta features for Gemini in Sheets to help create, organize, and analyze spreadsheets via natural language.
Google rolls out new Gemini capabilities to Docs, Sheets, Slides, and Drive
New features aim to make Workspace apps more personal and capable to help users get things done faster.
NVIDIAは、ターミナルエージェントのデータエンジニアリングパイプラインであるNemotron-Terminalを導入
NVIDIAのNemotron-TerminalによるLLM端末エージェントのトレーニングデータを体系的に生成・キュレーションし、エージェント機能のスケーリングに大きなボトルネックを合わせた書き込みアップ。
Amazonは、アプリやウェブサイトでヘルスケアAIアシスタントを立ち上げました
Amazonは、質問に答えることができる健康アシスタントをロールアウトしました, レコードを説明し, 処方の更新を管理します, そして、介護をスケジュールするのに役立ちます - 消費者に直面する臨床ワークフローヘルパーへのプッシュ.
TildeOpen LLM:34のヨーロッパ言語のためのオープン30Bモデルの訓練
30Bのオープン級モデルを提示するarXiv紙は、アップサンプリングとカリキュラムベースのトレーニングを使用して、公平なヨーロッパ言語のカバレッジに焦点を当てています。