From 6fe2e4077260702ee32d46d5a939a3197f3d2163 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Wed, 11 Mar 2026 15:41:32 -0400
Subject: [PATCH 01/58] feat: expand desktop parity and foundry support

---
 README.md                                     |  58 +-
 agent/__main__.py                             | 101 ++-
 agent/builder.py                              | 117 +++-
 agent/config.py                               | 146 +++-
 agent/credentials.py                          |  29 +
 agent/engine.py                               |  61 +-
 agent/model.py                                | 233 ++++++-
 agent/settings.py                             |   6 +
 agent/tool_defs.py                            |   2 +-
 agent/tools.py                                | 127 ++++
 agent/tui.py                                  |  26 +-
 openplanter-desktop/Cargo.lock                |   1 -
 .../crates/op-core/src/builder.rs             | 201 ++++--
 .../crates/op-core/src/config.rs              | 347 +++++++--
 .../crates/op-core/src/credentials.rs         |  41 +-
 .../crates/op-core/src/engine/curator.rs      |  52 +-
 .../crates/op-core/src/engine/judge.rs        |  12 +-
 .../crates/op-core/src/engine/mod.rs          | 225 ++++--
 .../crates/op-core/src/events.rs              |   4 +
 openplanter-desktop/crates/op-core/src/lib.rs |  10 +-
 .../crates/op-core/src/model/anthropic.rs     | 174 +++--
 .../crates/op-core/src/model/mod.rs           |  29 +-
 .../crates/op-core/src/model/openai.rs        | 657 ++++++++++++++++--
 .../crates/op-core/src/session/mod.rs         |   2 +-
 .../crates/op-core/src/session/replay.rs      |  22 +-
 .../crates/op-core/src/settings.rs            |  67 +-
 .../crates/op-core/src/tools/defs.rs          |  26 +-
 .../crates/op-core/src/tools/filesystem.rs    |  21 +-
 .../crates/op-core/src/tools/mod.rs           |  51 +-
 .../crates/op-core/src/tools/patching.rs      | 122 +---
 .../crates/op-core/src/tools/shell.rs         |  35 +-
 .../crates/op-core/src/tools/web.rs           | 592 +++++++++++++---
 .../crates/op-core/src/wiki/matching.rs       |  11 +-
 .../crates/op-core/src/wiki/mod.rs            |   2 +-
 .../crates/op-core/src/wiki/parser.rs         |   4 +-
 .../crates/op-core/src/wiki/watcher.rs        |  57 +-
 .../op-core/tests/test_model_streaming.rs     | 373 ++++++++--
 .../crates/op-tauri/Cargo.toml                |   1 -
 .../crates/op-tauri/src/bridge.rs             |  64 +-
 .../crates/op-tauri/src/commands/agent.rs     |  11 +-
 .../crates/op-tauri/src/commands/config.rs    | 183 +++--
 .../crates/op-tauri/src/commands/session.rs   |  47 +-
 .../crates/op-tauri/src/commands/wiki.rs      | 314 ++++++---
 .../crates/op-tauri/src/main.rs               |   6 +-
 .../crates/op-tauri/src/state.rs              | 127 +++-
 .../crates/op-tauri/tauri.conf.json           |   2 +-
 .../frontend/package-lock.json                |   3 +
 .../frontend/src/api/invoke.test.ts           |  44 +-
 openplanter-desktop/frontend/src/api/types.ts |   7 +
 .../src/commands/completionRegistry.test.ts   |  23 +
 .../src/commands/completionRegistry.ts        |  21 +
 .../frontend/src/commands/model.test.ts       |  46 +-
 .../frontend/src/commands/model.ts            |  81 ++-
 .../frontend/src/commands/reasoning.test.ts   |   8 +
 .../frontend/src/commands/reasoning.ts        |   6 +-
 .../frontend/src/commands/slash.test.ts       |  28 +
 .../frontend/src/commands/slash.ts            |  16 +
 .../frontend/src/commands/webSearch.test.ts   |  76 ++
 .../frontend/src/commands/webSearch.ts        |  58 ++
 .../frontend/src/commands/zaiPlan.test.ts     |  79 +++
 .../frontend/src/commands/zaiPlan.ts          |  62 ++
 .../frontend/src/components/App.test.ts       |  18 +-
 .../frontend/src/components/App.ts            |   4 +-
 .../frontend/src/components/StatusBar.test.ts |  13 +
 .../frontend/src/components/StatusBar.ts      |   6 +
 openplanter-desktop/frontend/src/main.ts      |   4 +
 .../frontend/src/state/store.ts               |   4 +
 openplanter-desktop/package.json              |  10 +
 tests/test_coverage_gaps.py                   | 116 +++-
 tests/test_credentials.py                     |   6 +
 tests/test_engine_complex.py                  | 113 ++-
 tests/test_model.py                           | 197 +++++-
 tests/test_settings.py                        |  24 +
 tests/test_streaming.py                       |  82 +++
 tests/test_tools.py                           |  59 ++
 tests/test_tools_complex.py                   |  21 +
 76 files changed, 5031 insertions(+), 1003 deletions(-)
 create mode 100644 openplanter-desktop/frontend/src/commands/webSearch.test.ts
 create mode 100644 openplanter-desktop/frontend/src/commands/webSearch.ts
 create mode 100644 openplanter-desktop/frontend/src/commands/zaiPlan.test.ts
 create mode 100644 openplanter-desktop/frontend/src/commands/zaiPlan.ts
 create mode 100644 openplanter-desktop/package.json

diff --git a/README.md b/README.md
index 9fa92c1a..53a01029 100644
--- a/README.md
+++ b/README.md
@@ -36,6 +36,9 @@ cd openplanter-desktop
 # Install frontend dependencies
 cd frontend && npm install && cd ..
 
+# Install the Tauri Cargo subcommand
+cargo install tauri-cli --version "^2"
+
 # Run in development mode
 cargo tauri dev
 
@@ -43,7 +46,7 @@ cargo tauri dev
 cargo tauri build
 ```
 
-Requires: Rust stable, Node.js 20+, and platform-specific Tauri dependencies ([see Tauri prerequisites](https://v2.tauri.app/start/prerequisites/)).
+Requires: Rust stable, Node.js 20+, the Tauri CLI, and platform-specific Tauri dependencies ([see Tauri prerequisites](https://v2.tauri.app/start/prerequisites/)).
 
 ## CLI Agent
 
@@ -81,12 +84,18 @@ The container mounts `./workspace` as the agent's working directory.
 
 | Provider | Default Model | Env Var |
 |----------|---------------|---------|
-| OpenAI | `gpt-5.2` | `OPENAI_API_KEY` |
-| Anthropic | `claude-opus-4-6` | `ANTHROPIC_API_KEY` |
+| OpenAI | `azure-foundry/gpt-5.3-codex` | `OPENAI_API_KEY` |
+| Anthropic | `anthropic-foundry/claude-opus-4-6` | `ANTHROPIC_API_KEY` |
 | OpenRouter | `anthropic/claude-sonnet-4-5` | `OPENROUTER_API_KEY` |
 | Cerebras | `qwen-3-235b-a22b-instruct-2507` | `CEREBRAS_API_KEY` |
+| Z.AI | `glm-5` | `ZAI_API_KEY` |
 | Ollama | `llama3.2` | (none — local) |
 
+OpenAI-compatible requests now default to the Azure Foundry proxy at
+`https://foundry-proxy.cheetah-koi.ts.net/openai/v1`, and Anthropic requests
+default to the Anthropic Foundry proxy at
+`https://foundry-proxy.cheetah-koi.ts.net/anthropic/v1`.
+
 ### Local Models (Ollama)
 
 [Ollama](https://ollama.com) runs models locally with no API key. Install Ollama, pull a model (`ollama pull llama3.2`), then:
@@ -99,6 +108,46 @@ openplanter-agent --provider ollama --list-models
 
 The base URL defaults to `http://localhost:11434/v1` and can be overridden with `OPENPLANTER_OLLAMA_BASE_URL` or `--base-url`. The first request may be slow while Ollama loads the model into memory; a 120-second first-byte timeout is used automatically.
 
+### Z.AI Endpoint Plans
+
+Z.AI has two distinct endpoint plans:
+
+- PAYGO endpoint: `https://api.z.ai/api/paas/v4`
+- Coding plan endpoint: `https://api.z.ai/api/coding/paas/v4`
+
+Choose the plan explicitly:
+
+```bash
+export OPENPLANTER_ZAI_PLAN=paygo   # or coding
+```
+
+Or per run:
+
+```bash
+openplanter-agent --provider zai --model glm-5 --zai-plan coding
+```
+
+Advanced overrides:
+
+```bash
+export OPENPLANTER_ZAI_PAYGO_BASE_URL=https://api.z.ai/api/paas/v4
+export OPENPLANTER_ZAI_CODING_BASE_URL=https://api.z.ai/api/coding/paas/v4
+```
+
+`OPENPLANTER_ZAI_BASE_URL` still overrides both plans when set.
+
+### Z.AI Reliability Tuning
+
+Z.AI rate limits (`HTTP 429`, code `1302`) are retried with capped backoff and jitter. For Z.AI streaming connection issues, OpenPlanter also retries up to `OPENPLANTER_ZAI_STREAM_MAX_RETRIES` times.
+
+```bash
+export OPENPLANTER_RATE_LIMIT_MAX_RETRIES=12
+export OPENPLANTER_RATE_LIMIT_BACKOFF_BASE_SEC=1.0
+export OPENPLANTER_RATE_LIMIT_BACKOFF_MAX_SEC=60.0
+export OPENPLANTER_RATE_LIMIT_RETRY_AFTER_CAP_SEC=120.0
+export OPENPLANTER_ZAI_STREAM_MAX_RETRIES=10
+```
+
 Additional service keys: `EXA_API_KEY` (web search), `VOYAGE_API_KEY` (embeddings).
 
 All keys can also be set with an `OPENPLANTER_` prefix (e.g. `OPENPLANTER_OPENAI_API_KEY`), via `.env` files in the workspace, or via CLI flags.
@@ -136,8 +185,9 @@ openplanter-agent [options]
 
 | Flag | Description |
 |------|-------------|
-| `--provider NAME` | `auto`, `openai`, `anthropic`, `openrouter`, `cerebras`, `ollama` |
+| `--provider NAME` | `auto`, `openai`, `anthropic`, `openrouter`, `cerebras`, `zai`, `ollama` |
 | `--model NAME` | Model name or `newest` to auto-select |
+| `--zai-plan PLAN` | Z.AI endpoint plan: `paygo` or `coding` |
 | `--reasoning-effort LEVEL` | `low`, `medium`, `high`, or `none` |
 | `--list-models` | Fetch available models from the provider API |
 
diff --git a/agent/__main__.py b/agent/__main__.py
index 8ba38df4..f3c29eca 100644
--- a/agent/__main__.py
+++ b/agent/__main__.py
@@ -6,7 +6,13 @@
 from datetime import datetime, timezone
 
 from .builder import _fetch_models_for_provider, build_engine, infer_provider_for_model
-from .config import AgentConfig
+from .config import (
+    AgentConfig,
+    normalize_zai_plan,
+    resolve_anthropic_api_key,
+    resolve_openai_api_key,
+    resolve_zai_base_url,
+)
 from .credentials import (
     CredentialBundle,
     CredentialStore,
@@ -33,7 +39,7 @@ def build_parser() -> argparse.ArgumentParser:
     parser.add_argument(
         "--provider",
         default=None,
-        choices=["auto", "openai", "anthropic", "openrouter", "cerebras", "ollama", "all"],
+        choices=["auto", "openai", "anthropic", "openrouter", "cerebras", "zai", "ollama", "all"],
         help="Model provider. Use 'all' only with --list-models.",
     )
     parser.add_argument("--model", help="Model name (use 'newest' to auto-select latest from API).")
@@ -67,6 +73,10 @@ def build_parser() -> argparse.ArgumentParser:
         "--default-model-cerebras",
         help="Persist workspace default model for Cerebras provider.",
     )
+    parser.add_argument(
+        "--default-model-zai",
+        help="Persist workspace default model for Z.AI provider.",
+    )
     parser.add_argument(
         "--default-model-ollama",
         help="Persist workspace default model for Ollama provider.",
@@ -82,7 +92,19 @@ def build_parser() -> argparse.ArgumentParser:
     parser.add_argument("--anthropic-api-key", help="Anthropic API key override.")
     parser.add_argument("--openrouter-api-key", help="OpenRouter API key override.")
     parser.add_argument("--cerebras-api-key", help="Cerebras API key override.")
+    parser.add_argument("--zai-api-key", help="Z.AI API key override.")
+    parser.add_argument(
+        "--zai-plan",
+        choices=["paygo", "coding"],
+        help="Z.AI endpoint plan: paygo uses /api/paas/v4, coding uses /api/coding/paas/v4.",
+    )
     parser.add_argument("--exa-api-key", help="Exa API key override.")
+    parser.add_argument("--firecrawl-api-key", help="Firecrawl API key override.")
+    parser.add_argument(
+        "--web-search-provider",
+        choices=["exa", "firecrawl"],
+        help="Web search backend provider.",
+    )
     parser.add_argument("--voyage-api-key", help="Voyage API key override.")
     parser.add_argument(
         "--configure-keys",
@@ -112,6 +134,11 @@ def build_parser() -> argparse.ArgumentParser:
         "--session-id",
         help="Session id to use. If omitted, a new id is generated unless --resume is used.",
     )
+    parser.add_argument(
+        "session_id_positional",
+        nargs="?",
+        help=argparse.SUPPRESS,
+    )
     parser.add_argument(
         "--resume",
         action="store_true",
@@ -153,7 +180,7 @@ def _format_ts(ts: int) -> str:
 
 def _resolve_provider(requested: str, creds: CredentialBundle) -> str:
     requested = requested.strip().lower()
-    if requested in {"openai", "anthropic", "openrouter", "cerebras", "ollama"}:
+    if requested in {"openai", "anthropic", "openrouter", "cerebras", "zai", "ollama"}:
         return requested
     if requested == "all":
         return "all"
@@ -165,15 +192,17 @@ def _resolve_provider(requested: str, creds: CredentialBundle) -> str:
         return "openrouter"
     if creds.cerebras_api_key:
         return "cerebras"
-    return "openai"
+    if creds.zai_api_key:
+        return "zai"
+    return "anthropic"
 
 
 def _print_models(cfg: AgentConfig, requested_provider: str) -> int:
     providers: list[str]
     if requested_provider == "all":
-        providers = ["openai", "anthropic", "openrouter", "cerebras", "ollama"]
+        providers = ["openai", "anthropic", "openrouter", "cerebras", "zai", "ollama"]
     elif requested_provider == "auto":
-        providers = ["openai", "anthropic", "openrouter", "cerebras", "ollama"]
+        providers = ["openai", "anthropic", "openrouter", "cerebras", "zai", "ollama"]
     else:
         providers = [requested_provider]
 
@@ -209,7 +238,9 @@ def _load_credentials(
         anthropic_api_key=user_creds.anthropic_api_key,
         openrouter_api_key=user_creds.openrouter_api_key,
         cerebras_api_key=user_creds.cerebras_api_key,
+        zai_api_key=user_creds.zai_api_key,
         exa_api_key=user_creds.exa_api_key,
+        firecrawl_api_key=user_creds.firecrawl_api_key,
         voyage_api_key=user_creds.voyage_api_key,
     )
 
@@ -223,8 +254,12 @@ def _load_credentials(
         creds.openrouter_api_key = stored.openrouter_api_key
     if stored.cerebras_api_key:
         creds.cerebras_api_key = stored.cerebras_api_key
+    if stored.zai_api_key:
+        creds.zai_api_key = stored.zai_api_key
     if stored.exa_api_key:
         creds.exa_api_key = stored.exa_api_key
+    if stored.firecrawl_api_key:
+        creds.firecrawl_api_key = stored.firecrawl_api_key
     if stored.voyage_api_key:
         creds.voyage_api_key = stored.voyage_api_key
 
@@ -237,8 +272,12 @@ def _load_credentials(
         creds.openrouter_api_key = env_creds.openrouter_api_key
     if env_creds.cerebras_api_key:
         creds.cerebras_api_key = env_creds.cerebras_api_key
+    if env_creds.zai_api_key:
+        creds.zai_api_key = env_creds.zai_api_key
     if env_creds.exa_api_key:
         creds.exa_api_key = env_creds.exa_api_key
+    if env_creds.firecrawl_api_key:
+        creds.firecrawl_api_key = env_creds.firecrawl_api_key
     if env_creds.voyage_api_key:
         creds.voyage_api_key = env_creds.voyage_api_key
 
@@ -256,8 +295,12 @@ def _load_credentials(
         creds.openrouter_api_key = args.openrouter_api_key.strip() or creds.openrouter_api_key
     if args.cerebras_api_key:
         creds.cerebras_api_key = args.cerebras_api_key.strip() or creds.cerebras_api_key
+    if args.zai_api_key:
+        creds.zai_api_key = args.zai_api_key.strip() or creds.zai_api_key
     if args.exa_api_key:
         creds.exa_api_key = args.exa_api_key.strip() or creds.exa_api_key
+    if args.firecrawl_api_key:
+        creds.firecrawl_api_key = args.firecrawl_api_key.strip() or creds.firecrawl_api_key
     if args.voyage_api_key:
         creds.voyage_api_key = args.voyage_api_key.strip() or creds.voyage_api_key
 
@@ -296,14 +339,27 @@ def _apply_runtime_overrides(cfg: AgentConfig, args: argparse.Namespace, creds:
         cfg.provider = args.provider
     cfg.provider = _resolve_provider(cfg.provider, creds)
 
-    cfg.openai_api_key = creds.openai_api_key
-    cfg.anthropic_api_key = creds.anthropic_api_key
+    cfg.openai_api_key = resolve_openai_api_key(creds.openai_api_key, cfg.openai_base_url)
+    cfg.anthropic_api_key = resolve_anthropic_api_key(
+        creds.anthropic_api_key,
+        cfg.anthropic_base_url,
+    )
     cfg.openrouter_api_key = creds.openrouter_api_key
     cfg.cerebras_api_key = creds.cerebras_api_key
+    cfg.zai_api_key = creds.zai_api_key
     cfg.exa_api_key = creds.exa_api_key
+    cfg.firecrawl_api_key = creds.firecrawl_api_key
     cfg.voyage_api_key = creds.voyage_api_key
     cfg.api_key = cfg.openai_api_key
 
+    if args.zai_plan:
+        cfg.zai_plan = normalize_zai_plan(args.zai_plan)
+        cfg.zai_base_url = resolve_zai_base_url(
+            cfg.zai_plan,
+            paygo_base_url=cfg.zai_paygo_base_url,
+            coding_base_url=cfg.zai_coding_base_url,
+        )
+
     if args.base_url:
         if cfg.provider == "openai":
             cfg.openai_base_url = args.base_url
@@ -313,12 +369,25 @@ def _apply_runtime_overrides(cfg: AgentConfig, args: argparse.Namespace, creds:
             cfg.openrouter_base_url = args.base_url
         elif cfg.provider == "cerebras":
             cfg.cerebras_base_url = args.base_url
+        elif cfg.provider == "zai":
+            cfg.zai_base_url = args.base_url
         elif cfg.provider == "ollama":
             cfg.ollama_base_url = args.base_url
         cfg.base_url = args.base_url
 
+    cfg.openai_api_key = resolve_openai_api_key(cfg.openai_api_key, cfg.openai_base_url)
+    cfg.anthropic_api_key = resolve_anthropic_api_key(
+        cfg.anthropic_api_key,
+        cfg.anthropic_base_url,
+    )
+    cfg.api_key = resolve_openai_api_key(cfg.api_key, cfg.base_url)
+
     if args.model:
         cfg.model = args.model
+    if args.web_search_provider:
+        cfg.web_search_provider = args.web_search_provider
+    if cfg.web_search_provider not in {"exa", "firecrawl"}:
+        cfg.web_search_provider = "exa"
     if args.reasoning_effort:
         cfg.reasoning_effort = None if args.reasoning_effort == "none" else args.reasoning_effort
     if args.recursive:
@@ -390,6 +459,9 @@ def _apply_persistent_settings(
     if args.default_model_cerebras is not None:
         settings.default_model_cerebras = args.default_model_cerebras.strip() or None
         changed = True
+    if args.default_model_zai is not None:
+        settings.default_model_zai = args.default_model_zai.strip() or None
+        changed = True
     if args.default_model_ollama is not None:
         settings.default_model_ollama = args.default_model_ollama.strip() or None
         changed = True
@@ -423,6 +495,7 @@ def _print_settings(settings: PersistentSettings) -> None:
     print(f"  default_model_anthropic: {settings.default_model_anthropic or '(unset)'}")
     print(f"  default_model_openrouter: {settings.default_model_openrouter or '(unset)'}")
     print(f"  default_model_cerebras: {settings.default_model_cerebras or '(unset)'}")
+    print(f"  default_model_zai: {settings.default_model_zai or '(unset)'}")
     print(f"  default_model_ollama: {settings.default_model_ollama or '(unset)'}")
 
 
@@ -449,6 +522,8 @@ def _has_non_interactive_command(args: argparse.Namespace) -> bool:
         return True
     if args.default_model_cerebras is not None:
         return True
+    if args.default_model_zai is not None:
+        return True
     if args.default_model_ollama is not None:
         return True
     return False
@@ -458,6 +533,11 @@ def main() -> None:
     parser = build_parser()
     args = parser.parse_args()
 
+    if args.resume and args.session_id is None and args.session_id_positional:
+        args.session_id = args.session_id_positional
+    elif args.session_id_positional and not args.resume:
+        parser.error("Positional session-id is only supported with --resume.")
+
     non_tty = not (sys.stdin.isatty() and sys.stdout.isatty())
     if (args.headless or non_tty) and not args.textual:
         args.no_tui = True
@@ -526,6 +606,7 @@ def main() -> None:
                 "anthropic": cfg.anthropic_api_key,
                 "openrouter": cfg.openrouter_api_key,
                 "cerebras": cfg.cerebras_api_key,
+                "zai": cfg.zai_api_key,
                 "ollama": "ollama",
             }.get(inferred)
             if key:
@@ -554,7 +635,11 @@ def main() -> None:
     startup_info: dict[str, str] = {
         "Provider": cfg.provider,
         "Model": model_name,
+        "WebSearch": cfg.web_search_provider,
     }
+    if cfg.provider == "zai":
+        startup_info["ZAIPlan"] = cfg.zai_plan
+        startup_info["ZAIURL"] = cfg.zai_base_url
     if cfg.reasoning_effort:
         startup_info["Reasoning"] = cfg.reasoning_effort
     startup_info["Mode"] = "recursive" if cfg.recursive else "flat"
diff --git a/agent/builder.py b/agent/builder.py
index a47d3e31..1a07bf56 100644
--- a/agent/builder.py
+++ b/agent/builder.py
@@ -9,7 +9,16 @@
 import re
 from pathlib import Path
 
-from .config import PROVIDER_DEFAULT_MODELS, AgentConfig
+from .config import (
+    ANTHROPIC_FOUNDRY_MODEL_PREFIX,
+    AZURE_FOUNDRY_MODEL_PREFIX,
+    PROVIDER_DEFAULT_MODELS,
+    AgentConfig,
+    is_foundry_anthropic_base_url,
+    is_foundry_openai_base_url,
+    resolve_anthropic_api_key,
+    resolve_openai_api_key,
+)
 from .engine import RLMEngine
 from .model import (
     AnthropicModel,
@@ -27,7 +36,8 @@
 # Patterns that unambiguously identify a provider.
 _ANTHROPIC_RE = re.compile(r"^claude", re.IGNORECASE)
 _OPENAI_RE = re.compile(r"^(gpt|o[1-4]-|o[1-4]$|chatgpt|dall-e|tts-|whisper)", re.IGNORECASE)
-_CEREBRAS_RE = re.compile(r"^(llama.*cerebras|qwen-3|gpt-oss|zai-glm)", re.IGNORECASE)
+_CEREBRAS_RE = re.compile(r"^(llama.*cerebras|qwen-3|gpt-oss)", re.IGNORECASE)
+_ZAI_RE = re.compile(r"^(glm|zai-glm)", re.IGNORECASE)
 _OLLAMA_RE = re.compile(
     r"^(llama|mistral|gemma|phi|codellama|deepseek|vicuna|tinyllama|"
     r"neural-chat|dolphin|wizardlm|orca|nous-hermes|command-r|qwen(?!-3))",
@@ -37,12 +47,19 @@
 
 def infer_provider_for_model(model: str) -> str | None:
     """Return the likely provider for *model*, or ``None`` if ambiguous."""
+    lowered = model.strip().lower()
+    if lowered.startswith(ANTHROPIC_FOUNDRY_MODEL_PREFIX):
+        return "anthropic"
+    if lowered.startswith(AZURE_FOUNDRY_MODEL_PREFIX):
+        return "openai"
     if "/" in model:
         return "openrouter"
     if _ANTHROPIC_RE.search(model):
         return "anthropic"
     if _CEREBRAS_RE.search(model):
         return "cerebras"
+    if _ZAI_RE.search(model):
+        return "zai"
     if _OPENAI_RE.search(model):
         return "openai"
     if _OLLAMA_RE.search(model):
@@ -66,13 +83,37 @@ def _validate_model_provider(model_name: str, provider: str) -> None:
 
 def _fetch_models_for_provider(cfg: AgentConfig, provider: str) -> list[dict]:
     if provider == "openai":
-        if not cfg.openai_api_key:
+        api_key = resolve_openai_api_key(cfg.openai_api_key, cfg.openai_base_url)
+        if not api_key:
             raise ModelError("OpenAI key not configured.")
-        return list_openai_models(api_key=cfg.openai_api_key, base_url=cfg.openai_base_url)
+        models = list_openai_models(api_key=api_key, base_url=cfg.openai_base_url)
+        if is_foundry_openai_base_url(cfg.openai_base_url):
+            return [
+                {
+                    **row,
+                    "id": row["id"]
+                    if str(row.get("id", "")).lower().startswith(AZURE_FOUNDRY_MODEL_PREFIX)
+                    else f"{AZURE_FOUNDRY_MODEL_PREFIX}{row['id']}",
+                }
+                for row in models
+            ]
+        return models
     if provider == "anthropic":
-        if not cfg.anthropic_api_key:
+        api_key = resolve_anthropic_api_key(cfg.anthropic_api_key, cfg.anthropic_base_url)
+        if not api_key:
             raise ModelError("Anthropic key not configured.")
-        return list_anthropic_models(api_key=cfg.anthropic_api_key, base_url=cfg.anthropic_base_url)
+        models = list_anthropic_models(api_key=api_key, base_url=cfg.anthropic_base_url)
+        if is_foundry_anthropic_base_url(cfg.anthropic_base_url):
+            return [
+                {
+                    **row,
+                    "id": row["id"]
+                    if str(row.get("id", "")).lower().startswith(ANTHROPIC_FOUNDRY_MODEL_PREFIX)
+                    else f"{ANTHROPIC_FOUNDRY_MODEL_PREFIX}{row['id']}",
+                }
+                for row in models
+            ]
+        return models
     if provider == "openrouter":
         if not cfg.openrouter_api_key:
             raise ModelError("OpenRouter key not configured.")
@@ -81,6 +122,10 @@ def _fetch_models_for_provider(cfg: AgentConfig, provider: str) -> list[dict]:
         if not cfg.cerebras_api_key:
             raise ModelError("Cerebras key not configured.")
         return list_openai_models(api_key=cfg.cerebras_api_key, base_url=cfg.cerebras_base_url)
+    if provider == "zai":
+        if not cfg.zai_api_key:
+            raise ModelError("Z.AI key not configured.")
+        return list_openai_models(api_key=cfg.zai_api_key, base_url=cfg.zai_base_url)
     if provider == "ollama":
         return list_ollama_models(base_url=cfg.ollama_base_url)
     raise ModelError(f"Unknown provider: {provider}")
@@ -98,25 +143,28 @@ def _resolve_model_name(cfg: AgentConfig) -> str:
         if not models:
             raise ModelError(f"No models returned for provider '{cfg.provider}'.")
         return str(models[0]["id"])
-    return PROVIDER_DEFAULT_MODELS.get(cfg.provider, "claude-opus-4-6")
+    return PROVIDER_DEFAULT_MODELS.get(cfg.provider, "anthropic-foundry/claude-opus-4-6")
 
 
 def build_model_factory(cfg: AgentConfig) -> ModelFactory | None:
     """Return a factory that creates models by name + optional reasoning effort."""
+    openai_api_key = resolve_openai_api_key(cfg.openai_api_key, cfg.openai_base_url)
+    anthropic_api_key = resolve_anthropic_api_key(cfg.anthropic_api_key, cfg.anthropic_base_url)
+
     def _factory(model_name: str, reasoning_effort: str | None = None) -> AnthropicModel | OpenAICompatibleModel:
         provider = infer_provider_for_model(model_name)
         effort = reasoning_effort or cfg.reasoning_effort
-        if provider == "anthropic" and cfg.anthropic_api_key:
+        if provider == "anthropic" and anthropic_api_key:
             return AnthropicModel(
                 model=model_name,
-                api_key=cfg.anthropic_api_key,
+                api_key=anthropic_api_key,
                 base_url=cfg.anthropic_base_url,
                 reasoning_effort=effort,
             )
-        if provider in ("openai", None) and cfg.openai_api_key:
+        if provider in ("openai", None) and openai_api_key:
             return OpenAICompatibleModel(
                 model=model_name,
-                api_key=cfg.openai_api_key,
+                api_key=openai_api_key,
                 base_url=cfg.openai_base_url,
                 reasoning_effort=effort,
             )
@@ -138,6 +186,18 @@ def _factory(model_name: str, reasoning_effort: str | None = None) -> AnthropicM
                 base_url=cfg.cerebras_base_url,
                 reasoning_effort=effort,
             )
+        if provider == "zai" and cfg.zai_api_key:
+            thinking_type = "disabled" if effort in (None, "", "none") else "enabled"
+            return OpenAICompatibleModel(
+                model=model_name,
+                api_key=cfg.zai_api_key,
+                base_url=cfg.zai_base_url,
+                reasoning_effort=effort,
+                thinking_type=thinking_type,
+                extra_headers={"Accept-Language": "en-US,en"},
+                provider="zai",
+                stream_max_retries=cfg.zai_stream_max_retries,
+            )
         if provider == "ollama":
             return OpenAICompatibleModel(
                 model=model_name,
@@ -149,7 +209,14 @@ def _factory(model_name: str, reasoning_effort: str | None = None) -> AnthropicM
             )
         raise ModelError(f"No API key available for model '{model_name}' (provider={provider})")
 
-    if cfg.anthropic_api_key or cfg.openai_api_key or cfg.openrouter_api_key or cfg.cerebras_api_key or cfg.ollama_base_url:
+    if (
+        anthropic_api_key
+        or openai_api_key
+        or cfg.openrouter_api_key
+        or cfg.cerebras_api_key
+        or cfg.zai_api_key
+        or cfg.ollama_base_url
+    ):
         return _factory
     return None
 
@@ -163,8 +230,11 @@ def build_engine(cfg: AgentConfig) -> RLMEngine:
         max_file_chars=cfg.max_file_chars,
         max_files_listed=cfg.max_files_listed,
         max_search_hits=cfg.max_search_hits,
+        web_search_provider=cfg.web_search_provider,
         exa_api_key=cfg.exa_api_key,
         exa_base_url=cfg.exa_base_url,
+        firecrawl_api_key=cfg.firecrawl_api_key,
+        firecrawl_base_url=cfg.firecrawl_base_url,
     )
 
     try:
@@ -175,10 +245,13 @@ def build_engine(cfg: AgentConfig) -> RLMEngine:
 
     _validate_model_provider(model_name, cfg.provider)
 
-    if cfg.provider == "openai" and cfg.openai_api_key:
+    openai_api_key = resolve_openai_api_key(cfg.openai_api_key, cfg.openai_base_url)
+    anthropic_api_key = resolve_anthropic_api_key(cfg.anthropic_api_key, cfg.anthropic_base_url)
+
+    if cfg.provider == "openai" and openai_api_key:
         model = OpenAICompatibleModel(
             model=model_name,
-            api_key=cfg.openai_api_key,
+            api_key=openai_api_key,
             base_url=cfg.openai_base_url,
             reasoning_effort=cfg.reasoning_effort,
         )
@@ -200,6 +273,18 @@ def build_engine(cfg: AgentConfig) -> RLMEngine:
             base_url=cfg.cerebras_base_url,
             reasoning_effort=cfg.reasoning_effort,
         )
+    elif cfg.provider == "zai" and cfg.zai_api_key:
+        thinking_type = "disabled" if cfg.reasoning_effort in (None, "", "none") else "enabled"
+        model = OpenAICompatibleModel(
+            model=model_name,
+            api_key=cfg.zai_api_key,
+            base_url=cfg.zai_base_url,
+            reasoning_effort=cfg.reasoning_effort,
+            thinking_type=thinking_type,
+            extra_headers={"Accept-Language": "en-US,en"},
+            provider="zai",
+            stream_max_retries=cfg.zai_stream_max_retries,
+        )
     elif cfg.provider == "ollama":
         model = OpenAICompatibleModel(
             model=model_name,
@@ -209,10 +294,10 @@ def build_engine(cfg: AgentConfig) -> RLMEngine:
             first_byte_timeout=120,
             strict_tools=False,
         )
-    elif cfg.provider == "anthropic" and cfg.anthropic_api_key:
+    elif cfg.provider == "anthropic" and anthropic_api_key:
         model = AnthropicModel(
             model=model_name,
-            api_key=cfg.anthropic_api_key,
+            api_key=anthropic_api_key,
             base_url=cfg.anthropic_base_url,
             reasoning_effort=cfg.reasoning_effort,
         )
diff --git a/agent/config.py b/agent/config.py
index 86d368c4..527c0d2c 100644
--- a/agent/config.py
+++ b/agent/config.py
@@ -4,34 +4,114 @@
 from dataclasses import dataclass
 from pathlib import Path
 
+AZURE_FOUNDRY_MODEL_PREFIX = "azure-foundry/"
+ANTHROPIC_FOUNDRY_MODEL_PREFIX = "anthropic-foundry/"
+FOUNDRY_OPENAI_BASE_URL = "https://foundry-proxy.cheetah-koi.ts.net/openai/v1"
+FOUNDRY_ANTHROPIC_BASE_URL = "https://foundry-proxy.cheetah-koi.ts.net/anthropic/v1"
+FOUNDRY_OPENAI_API_KEY_PLACEHOLDER = "dont-worry-this-key-will-be-auto-injected"
+FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER = "dont-worry-it-will-be-injected"
+ZAI_PAYGO_BASE_URL = "https://api.z.ai/api/paas/v4"
+ZAI_CODING_BASE_URL = "https://api.z.ai/api/coding/paas/v4"
+
 PROVIDER_DEFAULT_MODELS: dict[str, str] = {
-    "openai": "gpt-5.2",
-    "anthropic": "claude-opus-4-6",
+    "openai": "azure-foundry/gpt-5.3-codex",
+    "anthropic": "anthropic-foundry/claude-opus-4-6",
     "openrouter": "anthropic/claude-sonnet-4-5",
     "cerebras": "qwen-3-235b-a22b-instruct-2507",
+    "zai": "glm-5",
     "ollama": "llama3.2",
 }
 
+def normalize_zai_plan(value: str | None) -> str:
+    text = (value or "").strip().lower()
+    if text in {"paygo", "coding"}:
+        return text
+    return "paygo"
+
+
+def resolve_zai_base_url(
+    plan: str,
+    *,
+    paygo_base_url: str = ZAI_PAYGO_BASE_URL,
+    coding_base_url: str = ZAI_CODING_BASE_URL,
+) -> str:
+    return coding_base_url if normalize_zai_plan(plan) == "coding" else paygo_base_url
+
+
+def _normalize_base_url(url: str) -> str:
+    return url.strip().rstrip("/")
+
+
+def is_foundry_openai_base_url(url: str) -> bool:
+    return _normalize_base_url(url) == FOUNDRY_OPENAI_BASE_URL
+
+
+def is_foundry_anthropic_base_url(url: str) -> bool:
+    return _normalize_base_url(url) == FOUNDRY_ANTHROPIC_BASE_URL
+
+
+def resolve_openai_api_key(api_key: str | None, base_url: str) -> str | None:
+    key = (api_key or "").strip() or None
+    if key == FOUNDRY_OPENAI_API_KEY_PLACEHOLDER and not is_foundry_openai_base_url(base_url):
+        return None
+    if key:
+        return key
+    if is_foundry_openai_base_url(base_url):
+        return FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
+    return None
+
+
+def resolve_anthropic_api_key(api_key: str | None, base_url: str) -> str | None:
+    key = (api_key or "").strip() or None
+    if (
+        key == FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER
+        and not is_foundry_anthropic_base_url(base_url)
+    ):
+        return None
+    if key:
+        return key
+    if is_foundry_anthropic_base_url(base_url):
+        return FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER
+    return None
+
+
+def strip_foundry_model_prefix(model: str) -> str:
+    text = model.strip()
+    lower = text.lower()
+    if lower.startswith(AZURE_FOUNDRY_MODEL_PREFIX):
+        return text[len(AZURE_FOUNDRY_MODEL_PREFIX):]
+    if lower.startswith(ANTHROPIC_FOUNDRY_MODEL_PREFIX):
+        return text[len(ANTHROPIC_FOUNDRY_MODEL_PREFIX):]
+    return text
+
 
 @dataclass(slots=True)
 class AgentConfig:
     workspace: Path
     provider: str = "auto"
-    model: str = "claude-opus-4-6"
+    model: str = "anthropic-foundry/claude-opus-4-6"
     reasoning_effort: str | None = "high"
-    base_url: str = "https://api.openai.com/v1"  # Legacy alias for OpenAI-compatible base URL.
+    base_url: str = FOUNDRY_OPENAI_BASE_URL  # Legacy alias for OpenAI-compatible base URL.
     api_key: str | None = None  # Legacy alias for OpenAI key.
-    openai_base_url: str = "https://api.openai.com/v1"
-    anthropic_base_url: str = "https://api.anthropic.com/v1"
+    openai_base_url: str = FOUNDRY_OPENAI_BASE_URL
+    anthropic_base_url: str = FOUNDRY_ANTHROPIC_BASE_URL
     openrouter_base_url: str = "https://openrouter.ai/api/v1"
     cerebras_base_url: str = "https://api.cerebras.ai/v1"
+    zai_plan: str = "paygo"
+    zai_paygo_base_url: str = ZAI_PAYGO_BASE_URL
+    zai_coding_base_url: str = ZAI_CODING_BASE_URL
+    zai_base_url: str = ZAI_PAYGO_BASE_URL
     ollama_base_url: str = "http://localhost:11434/v1"
     exa_base_url: str = "https://api.exa.ai"
+    firecrawl_base_url: str = "https://api.firecrawl.dev/v1"
     openai_api_key: str | None = None
     anthropic_api_key: str | None = None
     openrouter_api_key: str | None = None
     cerebras_api_key: str | None = None
+    zai_api_key: str | None = None
     exa_api_key: str | None = None
+    firecrawl_api_key: str | None = None
+    web_search_provider: str = "exa"
     voyage_api_key: str | None = None
     max_depth: int = 4
     max_steps_per_call: int = 100
@@ -45,6 +125,11 @@ class AgentConfig:
     session_root_dir: str = ".openplanter"
     max_persisted_observations: int = 400
     max_solve_seconds: int = 0
+    rate_limit_max_retries: int = 12
+    zai_stream_max_retries: int = 10
+    rate_limit_backoff_base_sec: float = 1.0
+    rate_limit_backoff_max_sec: float = 60.0
+    rate_limit_retry_after_cap_sec: float = 120.0
     recursive: bool = True
     min_subtask_depth: int = 0
     acceptance_criteria: bool = True
@@ -52,6 +137,13 @@ class AgentConfig:
     max_turn_summaries: int = 50
     demo: bool = False
 
+    def __post_init__(self) -> None:
+        self.openai_api_key = resolve_openai_api_key(self.openai_api_key, self.openai_base_url)
+        self.anthropic_api_key = resolve_anthropic_api_key(
+            self.anthropic_api_key, self.anthropic_base_url
+        )
+        self.api_key = resolve_openai_api_key(self.api_key, self.base_url)
+
     @classmethod
     def from_env(cls, workspace: str | Path) -> "AgentConfig":
         ws = Path(workspace).expanduser().resolve()
@@ -62,30 +154,61 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
         anthropic_api_key = os.getenv("OPENPLANTER_ANTHROPIC_API_KEY") or os.getenv("ANTHROPIC_API_KEY")
         openrouter_api_key = os.getenv("OPENPLANTER_OPENROUTER_API_KEY") or os.getenv("OPENROUTER_API_KEY")
         cerebras_api_key = os.getenv("OPENPLANTER_CEREBRAS_API_KEY") or os.getenv("CEREBRAS_API_KEY")
+        zai_api_key = os.getenv("OPENPLANTER_ZAI_API_KEY") or os.getenv("ZAI_API_KEY")
         exa_api_key = os.getenv("OPENPLANTER_EXA_API_KEY") or os.getenv("EXA_API_KEY")
+        firecrawl_api_key = os.getenv("OPENPLANTER_FIRECRAWL_API_KEY") or os.getenv("FIRECRAWL_API_KEY")
         voyage_api_key = os.getenv("OPENPLANTER_VOYAGE_API_KEY") or os.getenv("VOYAGE_API_KEY")
         openai_base_url = os.getenv("OPENPLANTER_OPENAI_BASE_URL") or os.getenv(
             "OPENPLANTER_BASE_URL",
-            "https://api.openai.com/v1",
+            FOUNDRY_OPENAI_BASE_URL,
+        )
+        anthropic_base_url = os.getenv(
+            "OPENPLANTER_ANTHROPIC_BASE_URL",
+            FOUNDRY_ANTHROPIC_BASE_URL,
+        )
+        openai_api_key = resolve_openai_api_key(openai_api_key, openai_base_url)
+        anthropic_api_key = resolve_anthropic_api_key(anthropic_api_key, anthropic_base_url)
+        zai_plan = normalize_zai_plan(os.getenv("OPENPLANTER_ZAI_PLAN", "paygo"))
+        zai_paygo_base_url = os.getenv("OPENPLANTER_ZAI_PAYGO_BASE_URL", ZAI_PAYGO_BASE_URL)
+        zai_coding_base_url = os.getenv("OPENPLANTER_ZAI_CODING_BASE_URL", ZAI_CODING_BASE_URL)
+        zai_base_url_override = (os.getenv("OPENPLANTER_ZAI_BASE_URL", "") or "").strip()
+        zai_base_url = (
+            zai_base_url_override
+            or resolve_zai_base_url(
+                zai_plan,
+                paygo_base_url=zai_paygo_base_url,
+                coding_base_url=zai_coding_base_url,
+            )
         )
+        web_search_provider = (os.getenv("OPENPLANTER_WEB_SEARCH_PROVIDER", "exa").strip().lower() or "exa")
+        if web_search_provider not in {"exa", "firecrawl"}:
+            web_search_provider = "exa"
         return cls(
             workspace=ws,
             provider=os.getenv("OPENPLANTER_PROVIDER", "auto").strip().lower() or "auto",
-            model=os.getenv("OPENPLANTER_MODEL", "claude-opus-4-6"),
+            model=os.getenv("OPENPLANTER_MODEL", PROVIDER_DEFAULT_MODELS["anthropic"]),
             reasoning_effort=(os.getenv("OPENPLANTER_REASONING_EFFORT", "high").strip().lower() or None),
             base_url=openai_base_url,
             api_key=openai_api_key,
             openai_base_url=openai_base_url,
-            anthropic_base_url=os.getenv("OPENPLANTER_ANTHROPIC_BASE_URL", "https://api.anthropic.com/v1"),
+            anthropic_base_url=anthropic_base_url,
             openrouter_base_url=os.getenv("OPENPLANTER_OPENROUTER_BASE_URL", "https://openrouter.ai/api/v1"),
             cerebras_base_url=os.getenv("OPENPLANTER_CEREBRAS_BASE_URL", "https://api.cerebras.ai/v1"),
+            zai_plan=zai_plan,
+            zai_paygo_base_url=zai_paygo_base_url,
+            zai_coding_base_url=zai_coding_base_url,
+            zai_base_url=zai_base_url,
             ollama_base_url=os.getenv("OPENPLANTER_OLLAMA_BASE_URL", "http://localhost:11434/v1"),
             exa_base_url=os.getenv("OPENPLANTER_EXA_BASE_URL", "https://api.exa.ai"),
+            firecrawl_base_url=os.getenv("OPENPLANTER_FIRECRAWL_BASE_URL", "https://api.firecrawl.dev/v1"),
             openai_api_key=openai_api_key,
             anthropic_api_key=anthropic_api_key,
             openrouter_api_key=openrouter_api_key,
             cerebras_api_key=cerebras_api_key,
+            zai_api_key=zai_api_key,
             exa_api_key=exa_api_key,
+            firecrawl_api_key=firecrawl_api_key,
+            web_search_provider=web_search_provider,
             voyage_api_key=voyage_api_key,
             max_depth=int(os.getenv("OPENPLANTER_MAX_DEPTH", "4")),
             max_steps_per_call=int(os.getenv("OPENPLANTER_MAX_STEPS", "100")),
@@ -99,6 +222,11 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             session_root_dir=os.getenv("OPENPLANTER_SESSION_DIR", ".openplanter"),
             max_persisted_observations=int(os.getenv("OPENPLANTER_MAX_PERSISTED_OBS", "400")),
             max_solve_seconds=int(os.getenv("OPENPLANTER_MAX_SOLVE_SECONDS", "0")),
+            rate_limit_max_retries=int(os.getenv("OPENPLANTER_RATE_LIMIT_MAX_RETRIES", "12")),
+            zai_stream_max_retries=int(os.getenv("OPENPLANTER_ZAI_STREAM_MAX_RETRIES", "10")),
+            rate_limit_backoff_base_sec=float(os.getenv("OPENPLANTER_RATE_LIMIT_BACKOFF_BASE_SEC", "1.0")),
+            rate_limit_backoff_max_sec=float(os.getenv("OPENPLANTER_RATE_LIMIT_BACKOFF_MAX_SEC", "60.0")),
+            rate_limit_retry_after_cap_sec=float(os.getenv("OPENPLANTER_RATE_LIMIT_RETRY_AFTER_CAP_SEC", "120.0")),
             recursive=os.getenv("OPENPLANTER_RECURSIVE", "true").strip().lower() in ("1", "true", "yes"),
             min_subtask_depth=int(os.getenv("OPENPLANTER_MIN_SUBTASK_DEPTH", "0")),
             acceptance_criteria=os.getenv("OPENPLANTER_ACCEPTANCE_CRITERIA", "true").strip().lower() in ("1", "true", "yes"),
diff --git a/agent/credentials.py b/agent/credentials.py
index 3a387a59..275a8106 100644
--- a/agent/credentials.py
+++ b/agent/credentials.py
@@ -15,7 +15,9 @@ class CredentialBundle:
     anthropic_api_key: str | None = None
     openrouter_api_key: str | None = None
     cerebras_api_key: str | None = None
+    zai_api_key: str | None = None
     exa_api_key: str | None = None
+    firecrawl_api_key: str | None = None
     voyage_api_key: str | None = None
 
     def has_any(self) -> bool:
@@ -24,7 +26,9 @@ def has_any(self) -> bool:
             or (self.anthropic_api_key and self.anthropic_api_key.strip())
             or (self.openrouter_api_key and self.openrouter_api_key.strip())
             or (self.cerebras_api_key and self.cerebras_api_key.strip())
+            or (self.zai_api_key and self.zai_api_key.strip())
             or (self.exa_api_key and self.exa_api_key.strip())
+            or (self.firecrawl_api_key and self.firecrawl_api_key.strip())
             or (self.voyage_api_key and self.voyage_api_key.strip())
         )
 
@@ -37,8 +41,12 @@ def merge_missing(self, other: "CredentialBundle") -> None:
             self.openrouter_api_key = other.openrouter_api_key
         if not self.cerebras_api_key and other.cerebras_api_key:
             self.cerebras_api_key = other.cerebras_api_key
+        if not self.zai_api_key and other.zai_api_key:
+            self.zai_api_key = other.zai_api_key
         if not self.exa_api_key and other.exa_api_key:
             self.exa_api_key = other.exa_api_key
+        if not self.firecrawl_api_key and other.firecrawl_api_key:
+            self.firecrawl_api_key = other.firecrawl_api_key
         if not self.voyage_api_key and other.voyage_api_key:
             self.voyage_api_key = other.voyage_api_key
 
@@ -52,8 +60,12 @@ def to_json(self) -> dict[str, str]:
             out["openrouter_api_key"] = self.openrouter_api_key
         if self.cerebras_api_key:
             out["cerebras_api_key"] = self.cerebras_api_key
+        if self.zai_api_key:
+            out["zai_api_key"] = self.zai_api_key
         if self.exa_api_key:
             out["exa_api_key"] = self.exa_api_key
+        if self.firecrawl_api_key:
+            out["firecrawl_api_key"] = self.firecrawl_api_key
         if self.voyage_api_key:
             out["voyage_api_key"] = self.voyage_api_key
         return out
@@ -67,7 +79,9 @@ def from_json(cls, payload: dict[str, str] | None) -> "CredentialBundle":
             anthropic_api_key=(payload.get("anthropic_api_key") or "").strip() or None,
             openrouter_api_key=(payload.get("openrouter_api_key") or "").strip() or None,
             cerebras_api_key=(payload.get("cerebras_api_key") or "").strip() or None,
+            zai_api_key=(payload.get("zai_api_key") or "").strip() or None,
             exa_api_key=(payload.get("exa_api_key") or "").strip() or None,
+            firecrawl_api_key=(payload.get("firecrawl_api_key") or "").strip() or None,
             voyage_api_key=(payload.get("voyage_api_key") or "").strip() or None,
         )
 
@@ -109,7 +123,10 @@ def parse_env_file(path: Path) -> CredentialBundle:
         or None,
         cerebras_api_key=(env.get("CEREBRAS_API_KEY") or env.get("OPENPLANTER_CEREBRAS_API_KEY") or "").strip()
         or None,
+        zai_api_key=(env.get("ZAI_API_KEY") or env.get("OPENPLANTER_ZAI_API_KEY") or "").strip() or None,
         exa_api_key=(env.get("EXA_API_KEY") or env.get("OPENPLANTER_EXA_API_KEY") or "").strip() or None,
+        firecrawl_api_key=(env.get("FIRECRAWL_API_KEY") or env.get("OPENPLANTER_FIRECRAWL_API_KEY") or "").strip()
+        or None,
         voyage_api_key=(env.get("VOYAGE_API_KEY") or env.get("OPENPLANTER_VOYAGE_API_KEY") or "").strip() or None,
     )
 
@@ -134,7 +151,15 @@ def credentials_from_env() -> CredentialBundle:
             os.getenv("OPENPLANTER_CEREBRAS_API_KEY") or os.getenv("CEREBRAS_API_KEY") or ""
         ).strip()
         or None,
+        zai_api_key=(
+            os.getenv("OPENPLANTER_ZAI_API_KEY") or os.getenv("ZAI_API_KEY") or ""
+        ).strip()
+        or None,
         exa_api_key=(os.getenv("OPENPLANTER_EXA_API_KEY") or os.getenv("EXA_API_KEY") or "").strip() or None,
+        firecrawl_api_key=(
+            os.getenv("OPENPLANTER_FIRECRAWL_API_KEY") or os.getenv("FIRECRAWL_API_KEY") or ""
+        ).strip()
+        or None,
         voyage_api_key=(os.getenv("OPENPLANTER_VOYAGE_API_KEY") or os.getenv("VOYAGE_API_KEY") or "").strip() or None,
     )
 
@@ -229,7 +254,9 @@ def prompt_for_credentials(
         anthropic_api_key=existing.anthropic_api_key,
         openrouter_api_key=existing.openrouter_api_key,
         cerebras_api_key=existing.cerebras_api_key,
+        zai_api_key=existing.zai_api_key,
         exa_api_key=existing.exa_api_key,
+        firecrawl_api_key=existing.firecrawl_api_key,
         voyage_api_key=existing.voyage_api_key,
     )
 
@@ -262,7 +289,9 @@ def _ask(label: str, existing_value: str | None) -> str | None:
     current.anthropic_api_key = _ask("Anthropic", current.anthropic_api_key)
     current.openrouter_api_key = _ask("OpenRouter", current.openrouter_api_key)
     current.cerebras_api_key = _ask("Cerebras", current.cerebras_api_key)
+    current.zai_api_key = _ask("Z.AI", current.zai_api_key)
     current.exa_api_key = _ask("Exa", current.exa_api_key)
+    current.firecrawl_api_key = _ask("Firecrawl", current.firecrawl_api_key)
     current.voyage_api_key = _ask("Voyage", current.voyage_api_key)
     if not force and current.has_any() and not existing.has_any():
         changed = True
diff --git a/agent/engine.py b/agent/engine.py
index 06c526ca..422dbf99 100644
--- a/agent/engine.py
+++ b/agent/engine.py
@@ -1,6 +1,7 @@
 from __future__ import annotations
 
 import json
+import random
 import re
 import time
 import threading
@@ -12,7 +13,7 @@
 from typing import Any, Callable
 
 from .config import AgentConfig
-from .model import BaseModel, ImageData, ModelError, ModelTurn, ToolCall, ToolResult
+from .model import BaseModel, ImageData, ModelError, ModelTurn, RateLimitError, ToolCall, ToolResult
 from .prompts import build_system_prompt
 from .replay_log import ReplayLogger
 from .tool_defs import get_tool_definitions
@@ -122,15 +123,16 @@ def summary(self, max_items: int = 12, max_chars: int = 8000) -> str:
 
 @dataclass
 class TurnSummary:
-    """Lightweight summary of a completed agent turn for session continuity."""
+    """Compact, serializable summary for a completed top-level turn."""
+
     turn_number: int
     objective: str
-    result_preview: str   # first ~200 chars
-    timestamp: str        # ISO 8601 UTC
+    result_preview: str
+    timestamp: str
     steps_used: int = 0
     replay_seq_start: int = 0
 
-    def to_dict(self) -> dict[str, Any]:
+    def to_dict(self) -> dict[str, int | str]:
         return {
             "turn_number": self.turn_number,
             "objective": self.objective,
@@ -141,14 +143,14 @@ def to_dict(self) -> dict[str, Any]:
         }
 
     @classmethod
-    def from_dict(cls, d: dict[str, Any]) -> "TurnSummary":
+    def from_dict(cls, payload: dict[str, object]) -> "TurnSummary":
         return cls(
-            turn_number=d["turn_number"],
-            objective=d["objective"],
-            result_preview=d["result_preview"],
-            timestamp=d["timestamp"],
-            steps_used=d.get("steps_used", 0),
-            replay_seq_start=d.get("replay_seq_start", 0),
+            turn_number=int(payload["turn_number"]),
+            objective=str(payload.get("objective", "")),
+            result_preview=str(payload.get("result_preview", "")),
+            timestamp=str(payload.get("timestamp", "")),
+            steps_used=int(payload.get("steps_used", 0) or 0),
+            replay_seq_start=int(payload.get("replay_seq_start", 0) or 0),
         )
 
 
@@ -377,7 +379,40 @@ def _solve_recursive(
             if on_content_delta and depth == 0 and hasattr(model, "on_content_delta"):
                 model.on_content_delta = on_content_delta
             try:
-                turn = model.complete(conversation)
+                rate_limit_retries = 0
+                while True:
+                    if self._cancel.is_set():
+                        self._emit(f"[d{depth}] cancelled by user", on_event)
+                        return "Task cancelled."
+                    try:
+                        turn = model.complete(conversation)
+                        break
+                    except RateLimitError as exc:
+                        if rate_limit_retries >= self.config.rate_limit_max_retries:
+                            self._emit(f"[d{depth}/s{step}] model error: {exc}", on_event)
+                            return f"Model error at depth {depth}, step {step}: {exc}"
+                        rate_limit_retries += 1
+                        delay: float | None = None
+                        if exc.retry_after_sec is not None:
+                            delay = min(
+                                max(exc.retry_after_sec, 0.0),
+                                self.config.rate_limit_retry_after_cap_sec,
+                            )
+                        if delay is None:
+                            delay = self.config.rate_limit_backoff_base_sec * (2 ** (rate_limit_retries - 1))
+                        delay += random.uniform(0.0, 0.25)
+                        delay = min(delay, self.config.rate_limit_backoff_max_sec)
+                        if deadline and (time.monotonic() + delay) > deadline:
+                            self._emit(f"[d{depth}] wall-clock limit reached", on_event)
+                            return "Time limit exceeded. Try a more focused objective."
+                        provider_code = f" ({exc.provider_code})" if exc.provider_code is not None else ""
+                        self._emit(
+                            f"[d{depth}/s{step}] rate limited{provider_code}. "
+                            f"Sleeping {delay:.1f}s before retry {rate_limit_retries}/{self.config.rate_limit_max_retries}...",
+                            on_event,
+                        )
+                        if delay > 0:
+                            time.sleep(delay)
             except ModelError as exc:
                 self._emit(f"[d{depth}/s{step}] model error: {exc}", on_event)
                 return f"Model error at depth {depth}, step {step}: {exc}"
diff --git a/agent/model.py b/agent/model.py
index 30bc3ff7..45fca294 100644
--- a/agent/model.py
+++ b/agent/model.py
@@ -6,8 +6,10 @@
 import urllib.request
 from dataclasses import dataclass, field
 from datetime import datetime, timezone
+from email.utils import parsedate_to_datetime
 from typing import Any, Callable, Protocol
 
+from .config import strip_foundry_model_prefix
 from .tool_defs import TOOL_DEFINITIONS, to_anthropic_tools, to_openai_tools
 
 
@@ -15,6 +17,27 @@ class ModelError(RuntimeError):
     pass
 
 
+class HTTPModelError(ModelError):
+    def __init__(
+        self,
+        message: str,
+        *,
+        status_code: int | None = None,
+        provider_code: str | int | None = None,
+        body: str = "",
+        retry_after_sec: float | None = None,
+    ) -> None:
+        super().__init__(message)
+        self.status_code = status_code
+        self.provider_code = provider_code
+        self.body = body
+        self.retry_after_sec = retry_after_sec
+
+
+class RateLimitError(HTTPModelError):
+    pass
+
+
 # ---------------------------------------------------------------------------
 # Core data types
 # ---------------------------------------------------------------------------
@@ -103,6 +126,130 @@ def _extract_content(content: object) -> str:
     return ""
 
 
+def _parse_json_object(text: str) -> dict[str, Any] | None:
+    try:
+        parsed = json.loads(text)
+    except json.JSONDecodeError:
+        return None
+    if isinstance(parsed, dict):
+        return parsed
+    return None
+
+
+def _parse_retry_after_value(value: object) -> float | None:
+    if value is None:
+        return None
+    if isinstance(value, (int, float)):
+        return max(float(value), 0.0)
+    if isinstance(value, str):
+        text = value.strip()
+        if not text:
+            return None
+        try:
+            return max(float(text), 0.0)
+        except ValueError:
+            pass
+        try:
+            dt = parsedate_to_datetime(text)
+        except (TypeError, ValueError, IndexError):
+            return None
+        if dt.tzinfo is None:
+            dt = dt.replace(tzinfo=timezone.utc)
+        return max((dt - datetime.now(timezone.utc)).total_seconds(), 0.0)
+    return None
+
+
+def _parse_retry_after(headers: Any) -> float | None:
+    if headers is None:
+        return None
+    getter = getattr(headers, "get", None)
+    if not callable(getter):
+        return None
+    return _parse_retry_after_value(getter("Retry-After"))
+
+
+def _extract_openai_style_error(payload: dict[str, Any]) -> tuple[str, str | int | None, float | None]:
+    error = payload.get("error")
+    if isinstance(error, dict):
+        message = str(error.get("message", "")).strip()
+        provider_code = error.get("code")
+        retry_after = _parse_retry_after_value(error.get("retry_after"))
+        if retry_after is None:
+            retry_after = _parse_retry_after_value(payload.get("retry_after"))
+        return message, provider_code, retry_after
+    return "", None, _parse_retry_after_value(payload.get("retry_after"))
+
+
+def _is_rate_limit_error(
+    status_code: int | None,
+    provider_code: str | int | None,
+    message: str,
+) -> bool:
+    if status_code == 429:
+        return True
+    if provider_code is not None:
+        code_text = str(provider_code).strip().lower()
+        if code_text in {"1302", "429", "rate_limit", "rate_limit_exceeded", "too_many_requests"}:
+            return True
+    lower = message.lower()
+    return "rate limit" in lower or "too many requests" in lower
+
+
+def _raise_http_error(url: str, status_code: int, body: str, headers: Any) -> None:
+    parsed = _parse_json_object(body)
+    message = ""
+    provider_code: str | int | None = None
+    body_retry_after: float | None = None
+    if parsed is not None:
+        message, provider_code, body_retry_after = _extract_openai_style_error(parsed)
+    retry_after = _parse_retry_after(headers)
+    if retry_after is None:
+        retry_after = body_retry_after
+    text = message or body
+    exc_cls = RateLimitError if _is_rate_limit_error(status_code, provider_code, text) else HTTPModelError
+    raise exc_cls(
+        f"HTTP {status_code} calling {url}: {body}",
+        status_code=status_code,
+        provider_code=provider_code,
+        body=body,
+        retry_after_sec=retry_after,
+    )
+
+
+def _raise_sse_error(data_dict: dict[str, Any]) -> None:
+    if data_dict.get("type") == "error":
+        err = data_dict.get("error")
+        if isinstance(err, dict):
+            err_msg = str(err.get("message", str(data_dict)))
+            provider_code = err.get("code")
+            retry_after = _parse_retry_after_value(err.get("retry_after"))
+            if _is_rate_limit_error(None, provider_code, err_msg):
+                raise RateLimitError(
+                    f"Stream error: {err_msg}",
+                    status_code=None,
+                    provider_code=provider_code,
+                    body=json.dumps(data_dict, ensure_ascii=True),
+                    retry_after_sec=retry_after,
+                )
+            raise ModelError(f"Stream error: {err_msg}")
+        raise ModelError(f"Stream error: {data_dict}")
+
+    err = data_dict.get("error")
+    if isinstance(err, dict):
+        err_msg = str(err.get("message", str(data_dict)))
+        provider_code = err.get("code")
+        retry_after = _parse_retry_after_value(err.get("retry_after"))
+        if _is_rate_limit_error(None, provider_code, err_msg):
+            raise RateLimitError(
+                f"Stream error: {err_msg}",
+                status_code=None,
+                provider_code=provider_code,
+                body=json.dumps(data_dict, ensure_ascii=True),
+                retry_after_sec=retry_after,
+            )
+        raise ModelError(f"Stream error: {err_msg}")
+
+
 def _http_json(
     url: str,
     method: str,
@@ -121,7 +268,10 @@ def _http_json(
             raw = resp.read().decode("utf-8", errors="replace")
     except urllib.error.HTTPError as exc:  # pragma: no cover - network path
         body = exc.read().decode("utf-8", errors="replace")
-        raise ModelError(f"HTTP {exc.code} calling {url}: {body}") from exc
+        try:
+            _raise_http_error(url, exc.code, body, exc.headers)
+        except ModelError as model_exc:
+            raise model_exc from exc
     except urllib.error.URLError as exc:  # pragma: no cover - network path
         raise ModelError(f"Connection error calling {url}: {exc}") from exc
     except OSError as exc:  # pragma: no cover - bare socket.timeout, etc.
@@ -176,10 +326,7 @@ def _read_sse_events(
                 except json.JSONDecodeError:
                     data_dict = {"_raw": joined}
                 if isinstance(data_dict, dict):
-                    # Check for Anthropic error events
-                    if data_dict.get("type") == "error":
-                        err_msg = data_dict.get("error", {}).get("message", str(data_dict))
-                        raise ModelError(f"Stream error: {err_msg}")
+                    _raise_sse_error(data_dict)
                     events.append((current_event, data_dict))
                     if on_sse_event:
                         try:
@@ -198,9 +345,7 @@ def _read_sse_events(
         except json.JSONDecodeError:
             data_dict = {"_raw": joined}
         if isinstance(data_dict, dict):
-            if data_dict.get("type") == "error":
-                err_msg = data_dict.get("error", {}).get("message", str(data_dict))
-                raise ModelError(f"Stream error: {err_msg}")
+            _raise_sse_error(data_dict)
             events.append((current_event, data_dict))
             if on_sse_event:
                 try:
@@ -231,7 +376,10 @@ def _http_stream_sse(
             resp = urllib.request.urlopen(req, timeout=first_byte_timeout)
         except urllib.error.HTTPError as exc:
             body = exc.read().decode("utf-8", errors="replace")
-            raise ModelError(f"HTTP {exc.code} calling {url}: {body}") from exc
+            try:
+                _raise_http_error(url, exc.code, body, exc.headers)
+            except ModelError as model_exc:
+                raise model_exc from exc
         except (socket.timeout, urllib.error.URLError, OSError) as exc:
             # Timeout or connection error — retry
             last_exc = exc
@@ -254,6 +402,7 @@ def _accumulate_openai_stream(
 ) -> dict[str, Any]:
     """Reconstruct an OpenAI non-streaming response dict from SSE delta chunks."""
     text_parts: list[str] = []
+    reasoning_parts: list[str] = []
     tool_calls_by_index: dict[int, dict[str, Any]] = {}
     finish_reason = ""
     usage: dict[str, Any] = {}
@@ -279,6 +428,9 @@ def _accumulate_openai_stream(
         content = delta.get("content")
         if content:
             text_parts.append(content)
+        reasoning = delta.get("reasoning_content")
+        if isinstance(reasoning, str) and reasoning:
+            reasoning_parts.append(reasoning)
 
         # Tool calls (streamed incrementally)
         tc_deltas = delta.get("tool_calls")
@@ -305,6 +457,8 @@ def _accumulate_openai_stream(
         "role": "assistant",
         "content": "".join(text_parts) if text_parts else None,
     }
+    if reasoning_parts:
+        message["reasoning_content"] = "".join(reasoning_parts)
     if tool_calls_by_index:
         message["tool_calls"] = [
             tool_calls_by_index[i] for i in sorted(tool_calls_by_index)
@@ -633,11 +787,17 @@ class OpenAICompatibleModel:
     first_byte_timeout: float = 10
     strict_tools: bool = True
     tool_defs: list[dict[str, Any]] | None = None
+    thinking_type: str | None = None
     on_content_delta: Callable[[str, str], None] | None = None
+    provider: str | None = None
+    stream_max_retries: int = 3
+
+    def _request_model_name(self) -> str:
+        return strip_foundry_model_prefix(self.model)
 
     def _is_reasoning_model(self) -> bool:
         """OpenAI reasoning models (o-series, gpt-5 series) have different API constraints."""
-        lower = self.model.lower()
+        lower = self._request_model_name().lower()
         if (
             lower.startswith("o1-") or lower == "o1"
             or lower.startswith("o3-") or lower == "o3"
@@ -660,7 +820,7 @@ def complete(self, conversation: Conversation) -> ModelTurn:
         is_reasoning = self._is_reasoning_model()
 
         payload: dict[str, Any] = {
-            "model": self.model,
+            "model": self._request_model_name(),
             "messages": conversation._provider_messages,
             "tools": to_openai_tools(defs=self.tool_defs, strict=self.strict_tools),
             "tool_choice": "auto",
@@ -680,8 +840,10 @@ def complete(self, conversation: Conversation) -> ModelTurn:
         effort = (self.reasoning_effort or "").strip().lower()
         if effort:
             payload["reasoning_effort"] = effort
+        thinking_type = (self.thinking_type or "").strip().lower()
+        if thinking_type in {"enabled", "disabled"}:
+            payload["thinking"] = {"type": thinking_type}
 
-        url = self.base_url.rstrip("/") + "/chat/completions"
         headers = {
             "Authorization": f"Bearer {self.api_key}",
             "Content-Type": "application/json",
@@ -702,6 +864,15 @@ def _forward_delta(_event_type: str, data: dict[str, Any]) -> None:
             content = delta.get("content")
             if content:
                 cb("text", content)
+            reasoning_content = delta.get("reasoning_content")
+            if isinstance(reasoning_content, str) and reasoning_content:
+                cb("thinking", reasoning_content)
+            reasoning = delta.get("reasoning")
+            if isinstance(reasoning, str) and reasoning:
+                cb("thinking", reasoning)
+            thinking = delta.get("thinking")
+            if isinstance(thinking, str) and thinking:
+                cb("thinking", thinking)
             # Forward tool call argument deltas for live preview
             tc_deltas = delta.get("tool_calls")
             if tc_deltas:
@@ -716,17 +887,21 @@ def _forward_delta(_event_type: str, data: dict[str, Any]) -> None:
 
         sse_cb = _forward_delta if self.on_content_delta else None
 
-        try:
+        def _request_stream(active_payload: dict[str, Any], active_base_url: str) -> dict[str, Any]:
             events = _http_stream_sse(
-                url=url,
+                url=active_base_url.rstrip("/") + "/chat/completions",
                 method="POST",
                 headers=headers,
-                payload=payload,
+                payload=active_payload,
                 first_byte_timeout=self.first_byte_timeout,
                 stream_timeout=self.timeout_sec,
+                max_retries=self.stream_max_retries,
                 on_sse_event=sse_cb,
             )
-            parsed = _accumulate_openai_stream(events)
+            return _accumulate_openai_stream(events)
+
+        try:
+            parsed = _request_stream(payload, self.base_url)
         except ModelError as exc:
             text = str(exc).lower()
             unsupported_reasoning = effort and (
@@ -737,16 +912,7 @@ def _forward_delta(_event_type: str, data: dict[str, Any]) -> None:
                 raise
             payload = dict(payload)
             payload.pop("reasoning_effort", None)
-            events = _http_stream_sse(
-                url=url,
-                method="POST",
-                headers=headers,
-                payload=payload,
-                first_byte_timeout=self.first_byte_timeout,
-                stream_timeout=self.timeout_sec,
-                on_sse_event=sse_cb,
-            )
-            parsed = _accumulate_openai_stream(events)
+            parsed = _request_stream(payload, self.base_url)
 
         try:
             message = parsed["choices"][0]["message"]
@@ -754,6 +920,13 @@ def _forward_delta(_event_type: str, data: dict[str, Any]) -> None:
             raise ModelError(f"Model response missing content: {parsed}") from exc
 
         finish_reason = parsed["choices"][0].get("finish_reason", "")
+        if finish_reason == "rate_limit":
+            raise RateLimitError(
+                "Model finish_reason=rate_limit",
+                status_code=429,
+                provider_code="rate_limit",
+                body=json.dumps(parsed, ensure_ascii=True),
+            )
 
         # Parse tool calls
         raw_tool_calls = message.get("tool_calls")
@@ -859,6 +1032,9 @@ class AnthropicModel:
     tool_defs: list[dict[str, Any]] | None = None
     on_content_delta: Callable[[str, str], None] | None = None
 
+    def _request_model_name(self) -> str:
+        return strip_foundry_model_prefix(self.model)
+
     def create_conversation(self, system_prompt: str, initial_user_message: str) -> Conversation:
         messages: list[Any] = [
             {"role": "user", "content": initial_user_message},
@@ -866,14 +1042,15 @@ def create_conversation(self, system_prompt: str, initial_user_message: str) ->
         return Conversation(_provider_messages=messages, system_prompt=system_prompt)
 
     def _is_opus_46(self) -> bool:
-        return "opus-4-6" in self.model.lower() or "opus-4.6" in self.model.lower()
+        lower = self._request_model_name().lower()
+        return "opus-4-6" in lower or "opus-4.6" in lower
 
     def complete(self, conversation: Conversation) -> ModelTurn:
         effort = (self.reasoning_effort or "").strip().lower()
         use_thinking = effort in {"low", "medium", "high"}
 
         payload: dict[str, Any] = {
-            "model": self.model,
+            "model": self._request_model_name(),
             "max_tokens": self.max_tokens,
             "messages": conversation._provider_messages,
             "tools": to_anthropic_tools(defs=self.tool_defs),
diff --git a/agent/settings.py b/agent/settings.py
index ec2835ee..5b3b4f97 100644
--- a/agent/settings.py
+++ b/agent/settings.py
@@ -30,6 +30,7 @@ class PersistentSettings:
     default_model_anthropic: str | None = None
     default_model_openrouter: str | None = None
     default_model_cerebras: str | None = None
+    default_model_zai: str | None = None
     default_model_ollama: str | None = None
 
     def default_model_for_provider(self, provider: str) -> str | None:
@@ -38,6 +39,7 @@ def default_model_for_provider(self, provider: str) -> str | None:
             "anthropic": self.default_model_anthropic,
             "openrouter": self.default_model_openrouter,
             "cerebras": self.default_model_cerebras,
+            "zai": self.default_model_zai,
             "ollama": self.default_model_ollama,
         }
         specific = per_provider.get(provider)
@@ -55,6 +57,7 @@ def normalized(self) -> "PersistentSettings":
             default_model_anthropic=(self.default_model_anthropic or "").strip() or None,
             default_model_openrouter=(self.default_model_openrouter or "").strip() or None,
             default_model_cerebras=(self.default_model_cerebras or "").strip() or None,
+            default_model_zai=(self.default_model_zai or "").strip() or None,
             default_model_ollama=(self.default_model_ollama or "").strip() or None,
         )
 
@@ -72,6 +75,8 @@ def to_json(self) -> dict[str, str]:
             payload["default_model_openrouter"] = self.default_model_openrouter
         if self.default_model_cerebras:
             payload["default_model_cerebras"] = self.default_model_cerebras
+        if self.default_model_zai:
+            payload["default_model_zai"] = self.default_model_zai
         if self.default_model_ollama:
             payload["default_model_ollama"] = self.default_model_ollama
         return payload
@@ -89,6 +94,7 @@ def from_json(cls, payload: dict | None) -> "PersistentSettings":
             default_model_anthropic=(str(payload.get("default_model_anthropic", "")).strip() or None),
             default_model_openrouter=(str(payload.get("default_model_openrouter", "")).strip() or None),
             default_model_cerebras=(str(payload.get("default_model_cerebras", "")).strip() or None),
+            default_model_zai=(str(payload.get("default_model_zai", "")).strip() or None),
             default_model_ollama=(str(payload.get("default_model_ollama", "")).strip() or None),
         ).normalized()
 
diff --git a/agent/tool_defs.py b/agent/tool_defs.py
index 323edbde..79bdb496 100644
--- a/agent/tool_defs.py
+++ b/agent/tool_defs.py
@@ -63,7 +63,7 @@
     },
     {
         "name": "web_search",
-        "description": "Search the web using the Exa API. Returns URLs, titles, and optional page text.",
+        "description": "Search the web using the configured provider (Exa or Firecrawl). Returns URLs, titles, and optional page text.",
         "parameters": {
             "type": "object",
             "properties": {
diff --git a/agent/tools.py b/agent/tools.py
index 86a9e5ce..a9d6d4ef 100644
--- a/agent/tools.py
+++ b/agent/tools.py
@@ -54,8 +54,11 @@ class WorkspaceTools:
     max_file_chars: int = 20000
     max_files_listed: int = 400
     max_search_hits: int = 200
+    web_search_provider: str = "exa"
     exa_api_key: str | None = None
     exa_base_url: str = "https://api.exa.ai"
+    firecrawl_api_key: str | None = None
+    firecrawl_base_url: str = "https://api.firecrawl.dev/v1"
 
     def __post_init__(self) -> None:
         self.root = self.root.expanduser().resolve()
@@ -804,6 +807,38 @@ def _exa_request(self, endpoint: str, payload: dict[str, Any]) -> dict[str, Any]
             raise ToolError(f"Exa API returned non-object response: {type(parsed)!r}")
         return parsed
 
+    def _firecrawl_request(self, endpoint: str, payload: dict[str, Any]) -> dict[str, Any]:
+        if not (self.firecrawl_api_key and self.firecrawl_api_key.strip()):
+            raise ToolError("FIRECRAWL_API_KEY not configured")
+        url = self.firecrawl_base_url.rstrip("/") + endpoint
+        req = urllib.request.Request(
+            url=url,
+            data=json.dumps(payload).encode("utf-8"),
+            headers={
+                "Authorization": f"Bearer {self.firecrawl_api_key}",
+                "Content-Type": "application/json",
+            },
+            method="POST",
+        )
+        try:
+            with urllib.request.urlopen(req, timeout=self.command_timeout_sec) as resp:
+                raw = resp.read().decode("utf-8", errors="replace")
+        except urllib.error.HTTPError as exc:
+            body = exc.read().decode("utf-8", errors="replace")
+            raise ToolError(f"Firecrawl API HTTP {exc.code}: {body}") from exc
+        except urllib.error.URLError as exc:
+            raise ToolError(f"Firecrawl API connection error: {exc}") from exc
+        except OSError as exc:
+            raise ToolError(f"Firecrawl API network error: {exc}") from exc
+
+        try:
+            parsed = json.loads(raw)
+        except json.JSONDecodeError as exc:
+            raise ToolError(f"Firecrawl API returned non-JSON payload: {raw[:500]}") from exc
+        if not isinstance(parsed, dict):
+            raise ToolError(f"Firecrawl API returned non-object response: {type(parsed)!r}")
+        return parsed
+
     def web_search(
         self,
         query: str,
@@ -814,6 +849,59 @@ def web_search(
         if not query:
             return "web_search requires non-empty query"
         clamped_results = max(1, min(int(num_results), 20))
+        provider = (self.web_search_provider or "exa").strip().lower()
+        if provider not in {"exa", "firecrawl"}:
+            provider = "exa"
+
+        if provider == "firecrawl":
+            payload: dict[str, Any] = {
+                "query": query,
+                "limit": clamped_results,
+            }
+            if include_text:
+                payload["scrapeOptions"] = {"formats": ["markdown"]}
+
+            try:
+                parsed = self._firecrawl_request("/search", payload)
+            except Exception as exc:
+                return f"Web search failed: {exc}"
+
+            data = parsed.get("data")
+            rows: list[Any] = []
+            if isinstance(data, list):
+                rows = data
+            elif isinstance(data, dict):
+                web_rows = data.get("web")
+                if isinstance(web_rows, list):
+                    rows = web_rows
+
+            out_results: list[dict[str, Any]] = []
+            for row in rows:
+                if not isinstance(row, dict):
+                    continue
+                metadata = row.get("metadata")
+                meta_title = ""
+                if isinstance(metadata, dict):
+                    meta_title = str(metadata.get("title", ""))
+                item: dict[str, Any] = {
+                    "url": str(row.get("url", "")),
+                    "title": str(row.get("title", "") or meta_title),
+                    "snippet": str(row.get("description", "") or row.get("snippet", "")),
+                }
+                if include_text:
+                    text_value = row.get("markdown") or row.get("text") or ""
+                    if isinstance(text_value, str) and text_value:
+                        item["text"] = self._clip(text_value, 4000)
+                out_results.append(item)
+
+            output = {
+                "query": query,
+                "provider": provider,
+                "results": out_results,
+                "total": len(out_results),
+            }
+            return self._clip(json.dumps(output, indent=2, ensure_ascii=True), self.max_file_chars)
+
         payload: dict[str, Any] = {
             "query": query,
             "numResults": clamped_results,
@@ -841,6 +929,7 @@ def web_search(
 
         output = {
             "query": query,
+            "provider": provider,
             "results": out_results,
             "total": len(out_results),
         }
@@ -859,6 +948,43 @@ def fetch_url(self, urls: list[str]) -> str:
         if not normalized:
             return "fetch_url requires at least one valid URL"
         normalized = normalized[:10]
+        provider = (self.web_search_provider or "exa").strip().lower()
+        if provider not in {"exa", "firecrawl"}:
+            provider = "exa"
+
+        if provider == "firecrawl":
+            pages: list[dict[str, Any]] = []
+            for url in normalized:
+                payload: dict[str, Any] = {
+                    "url": url,
+                    "formats": ["markdown"],
+                }
+                try:
+                    parsed = self._firecrawl_request("/scrape", payload)
+                except Exception as exc:
+                    return f"Fetch URL failed: {exc}"
+                data = parsed.get("data")
+                if not isinstance(data, dict):
+                    continue
+                metadata = data.get("metadata")
+                title = ""
+                if isinstance(metadata, dict):
+                    title = str(metadata.get("title", ""))
+                text = data.get("markdown") or data.get("text") or data.get("html") or ""
+                pages.append(
+                    {
+                        "url": str(data.get("url", "") or url),
+                        "title": title,
+                        "text": self._clip(str(text), 8000),
+                    }
+                )
+            output = {
+                "provider": provider,
+                "pages": pages,
+                "total": len(pages),
+            }
+            return self._clip(json.dumps(output, indent=2, ensure_ascii=True), self.max_file_chars)
+
         payload: dict[str, Any] = {
             "ids": normalized,
             "text": {"maxCharacters": 8000},
@@ -881,6 +1007,7 @@ def fetch_url(self, urls: list[str]) -> str:
             )
 
         output = {
+            "provider": provider,
             "pages": pages,
             "total": len(pages),
         }
diff --git a/agent/tui.py b/agent/tui.py
index 0d7184ec..c1a63be2 100644
--- a/agent/tui.py
+++ b/agent/tui.py
@@ -110,14 +110,15 @@ def _build_splash() -> str:
 ]
 
 MODEL_ALIASES: dict[str, str] = {
-    "opus": "claude-opus-4-6",
-    "opus4.6": "claude-opus-4-6",
-    "sonnet": "claude-sonnet-4-5-20250929",
-    "sonnet4.5": "claude-sonnet-4-5-20250929",
-    "haiku": "claude-haiku-4-5-20251001",
-    "haiku4.5": "claude-haiku-4-5-20251001",
-    "gpt5": "gpt-5.2",
-    "gpt5.2": "gpt-5.2",
+    "opus": "anthropic-foundry/claude-opus-4-6",
+    "opus4.6": "anthropic-foundry/claude-opus-4-6",
+    "sonnet": "anthropic-foundry/claude-sonnet-4-6",
+    "sonnet4.6": "anthropic-foundry/claude-sonnet-4-6",
+    "haiku": "anthropic-foundry/claude-haiku-4-5",
+    "haiku4.5": "anthropic-foundry/claude-haiku-4-5",
+    "gpt5": "azure-foundry/gpt-5.3-codex",
+    "gpt5.3": "azure-foundry/gpt-5.3-codex",
+    "kimi": "azure-foundry/Kimi-K2.5",
     "gpt4": "gpt-4.1",
     "gpt4.1": "gpt-4.1",
     "gpt4o": "gpt-4o",
@@ -128,6 +129,8 @@ def _build_splash() -> str:
     "cerebras": "qwen-3-235b-a22b-instruct-2507",
     "qwen235b": "qwen-3-235b-a22b-instruct-2507",
     "oss120b": "gpt-oss-120b",
+    "glm5": "glm-5",
+    "zai": "glm-5",
     "llama": "llama3.2",
     "llama3": "llama3.2",
     "mistral": "mistral",
@@ -176,6 +179,7 @@ def _api_key_for_provider(cfg: AgentConfig, provider: str) -> str | None:
         "anthropic": cfg.anthropic_api_key,
         "openrouter": cfg.openrouter_api_key,
         "cerebras": cfg.cerebras_api_key,
+        "zai": cfg.zai_api_key,
         "ollama": "ollama",
     }.get(provider)
 
@@ -191,6 +195,8 @@ def _available_providers(cfg: AgentConfig) -> list[str]:
         providers.append("openrouter")
     if cfg.cerebras_api_key:
         providers.append("cerebras")
+    if cfg.zai_api_key:
+        providers.append("zai")
     providers.append("ollama")
     return providers
 
@@ -220,7 +226,7 @@ def handle_model_command(args: str, ctx: ChatContext) -> list[str]:
         list_target = parts[1] if len(parts) > 1 else None
         if list_target == "all":
             providers = _available_providers(ctx.cfg)
-        elif list_target in {"openai", "anthropic", "openrouter", "cerebras", "ollama"}:
+        elif list_target in {"openai", "anthropic", "openrouter", "cerebras", "zai", "ollama"}:
             providers = [list_target]
         else:
             providers = [ctx.cfg.provider]
@@ -280,6 +286,8 @@ def handle_model_command(args: str, ctx: ChatContext) -> list[str]:
             settings.default_model_openrouter = new_model
         elif provider == "cerebras":
             settings.default_model_cerebras = new_model
+        elif provider == "zai":
+            settings.default_model_zai = new_model
         elif provider == "ollama":
             settings.default_model_ollama = new_model
         else:
diff --git a/openplanter-desktop/Cargo.lock b/openplanter-desktop/Cargo.lock
index 39951ed9..503aecf9 100644
--- a/openplanter-desktop/Cargo.lock
+++ b/openplanter-desktop/Cargo.lock
@@ -2469,7 +2469,6 @@ dependencies = [
  "tempfile",
  "tokio",
  "tokio-util",
- "uuid",
 ]
 
 [[package]]
diff --git a/openplanter-desktop/crates/op-core/src/builder.rs b/openplanter-desktop/crates/op-core/src/builder.rs
index a0c4e319..1be274c7 100644
--- a/openplanter-desktop/crates/op-core/src/builder.rs
+++ b/openplanter-desktop/crates/op-core/src/builder.rs
@@ -7,10 +7,13 @@ use std::collections::HashMap;
 use regex::Regex;
 use std::sync::LazyLock;
 
-use crate::config::{AgentConfig, PROVIDER_DEFAULT_MODELS};
+use crate::config::{
+    ANTHROPIC_FOUNDRY_MODEL_PREFIX, AZURE_FOUNDRY_MODEL_PREFIX, AgentConfig,
+    PROVIDER_DEFAULT_MODELS, resolve_anthropic_api_key, resolve_openai_api_key,
+};
 use crate::model::BaseModel;
-use crate::model::openai::OpenAIModel;
 use crate::model::anthropic::AnthropicModel;
+use crate::model::openai::{OpenAIModel, ZaiRuntimeConfig};
 
 /// Error type for model/builder operations.
 #[derive(Debug, thiserror::Error)]
@@ -20,14 +23,16 @@ pub enum ModelError {
 }
 
 // Provider inference regexes — order matters (Cerebras `qwen-3` before Ollama `qwen`).
-static ANTHROPIC_RE: LazyLock<Regex> =
-    LazyLock::new(|| Regex::new(r"(?i)^claude").unwrap());
+static ANTHROPIC_RE: LazyLock<Regex> = LazyLock::new(|| Regex::new(r"(?i)^claude").unwrap());
 
-static OPENAI_RE: LazyLock<Regex> =
-    LazyLock::new(|| Regex::new(r"(?i)^(gpt|o[1-4]-|o[1-4]$|chatgpt|dall-e|tts-|whisper)").unwrap());
+static OPENAI_RE: LazyLock<Regex> = LazyLock::new(|| {
+    Regex::new(r"(?i)^(gpt|o[1-4]-|o[1-4]$|chatgpt|dall-e|tts-|whisper)").unwrap()
+});
 
 static CEREBRAS_RE: LazyLock<Regex> =
-    LazyLock::new(|| Regex::new(r"(?i)^(llama.*cerebras|qwen-3|gpt-oss|zai-glm)").unwrap());
+    LazyLock::new(|| Regex::new(r"(?i)^(llama.*cerebras|qwen-3|gpt-oss)").unwrap());
+
+static ZAI_RE: LazyLock<Regex> = LazyLock::new(|| Regex::new(r"(?i)^(glm|zai-glm)").unwrap());
 
 // Ollama regex: `qwen` without lookahead — Cerebras check runs first, so
 // `qwen-3*` is already caught before we reach this regex.
@@ -40,6 +45,13 @@ static OLLAMA_RE: LazyLock<Regex> = LazyLock::new(|| {
 
 /// Infer the likely provider for a model name, or `None` if ambiguous.
 pub fn infer_provider_for_model(model: &str) -> Option<&'static str> {
+    let lowered = model.trim().to_lowercase();
+    if lowered.starts_with(ANTHROPIC_FOUNDRY_MODEL_PREFIX) {
+        return Some("anthropic");
+    }
+    if lowered.starts_with(AZURE_FOUNDRY_MODEL_PREFIX) {
+        return Some("openai");
+    }
     if model.contains('/') {
         return Some("openrouter");
     }
@@ -49,6 +61,9 @@ pub fn infer_provider_for_model(model: &str) -> Option<&'static str> {
     if CEREBRAS_RE.is_match(model) {
         return Some("cerebras");
     }
+    if ZAI_RE.is_match(model) {
+        return Some("zai");
+    }
     if OPENAI_RE.is_match(model) {
         return Some("openai");
     }
@@ -86,12 +101,12 @@ pub fn resolve_model_name(cfg: &AgentConfig) -> Result<String, ModelError> {
         // For now, fall through to defaults.
         return Ok(PROVIDER_DEFAULT_MODELS
             .get(cfg.provider.as_str())
-            .unwrap_or(&"claude-opus-4-6")
+            .unwrap_or(&"anthropic-foundry/claude-opus-4-6")
             .to_string());
     }
     Ok(PROVIDER_DEFAULT_MODELS
         .get(cfg.provider.as_str())
-        .unwrap_or(&"claude-opus-4-6")
+        .unwrap_or(&"anthropic-foundry/claude-opus-4-6")
         .to_string())
 }
 
@@ -117,6 +132,7 @@ pub fn resolve_provider(cfg: &AgentConfig) -> Result<String, ModelError> {
         ("openai", &cfg.openai_api_key),
         ("openrouter", &cfg.openrouter_api_key),
         ("cerebras", &cfg.cerebras_api_key),
+        ("zai", &cfg.zai_api_key),
         ("ollama", &None), // ollama is always last — no key needed
     ];
 
@@ -131,38 +147,34 @@ pub fn resolve_provider(cfg: &AgentConfig) -> Result<String, ModelError> {
 }
 
 /// Resolve the base URL and API key for the given provider.
-pub fn resolve_endpoint(
-    cfg: &AgentConfig,
-    provider: &str,
-) -> Result<(String, String), ModelError> {
+pub fn resolve_endpoint(cfg: &AgentConfig, provider: &str) -> Result<(String, String), ModelError> {
     match provider {
         "anthropic" => {
-            let key = cfg
-                .anthropic_api_key
-                .as_deref()
-                .or(cfg.api_key.as_deref())
-                .filter(|k| !k.is_empty())
-                .ok_or_else(|| {
+            let key = resolve_anthropic_api_key(
+                cfg.anthropic_api_key.clone().or_else(|| cfg.api_key.clone()),
+                &cfg.anthropic_base_url,
+            )
+            .ok_or_else(|| {
                     ModelError::Message(
                         "No Anthropic API key. Set ANTHROPIC_API_KEY or OPENPLANTER_ANTHROPIC_API_KEY.".into(),
                     )
                 })?;
             // Anthropic base URL does NOT include /v1 suffix for /messages endpoint —
             // the model adapter appends /messages itself. The config stores it with /v1.
-            Ok((cfg.anthropic_base_url.clone(), key.to_string()))
+            Ok((cfg.anthropic_base_url.clone(), key))
         }
         "openai" => {
-            let key = cfg
-                .openai_api_key
-                .as_deref()
-                .or(cfg.api_key.as_deref())
-                .filter(|k| !k.is_empty())
-                .ok_or_else(|| {
+            let key = resolve_openai_api_key(
+                cfg.openai_api_key.clone().or_else(|| cfg.api_key.clone()),
+                &cfg.openai_base_url,
+            )
+            .ok_or_else(|| {
                     ModelError::Message(
-                        "No OpenAI API key. Set OPENAI_API_KEY or OPENPLANTER_OPENAI_API_KEY.".into(),
+                        "No OpenAI API key. Set OPENAI_API_KEY or OPENPLANTER_OPENAI_API_KEY."
+                            .into(),
                     )
                 })?;
-            Ok((cfg.openai_base_url.clone(), key.to_string()))
+            Ok((cfg.openai_base_url.clone(), key))
         }
         "openrouter" => {
             let key = cfg
@@ -190,6 +202,19 @@ pub fn resolve_endpoint(
                 })?;
             Ok((cfg.cerebras_base_url.clone(), key.to_string()))
         }
+        "zai" => {
+            let key = cfg
+                .zai_api_key
+                .as_deref()
+                .or(cfg.api_key.as_deref())
+                .filter(|k| !k.is_empty())
+                .ok_or_else(|| {
+                    ModelError::Message(
+                        "No Z.AI API key. Set ZAI_API_KEY or OPENPLANTER_ZAI_API_KEY.".into(),
+                    )
+                })?;
+            Ok((cfg.zai_base_url.clone(), key.to_string()))
+        }
         "ollama" => {
             // Ollama doesn't need a real key — use a dummy
             Ok((cfg.ollama_base_url.clone(), "ollama".to_string()))
@@ -212,7 +237,7 @@ pub fn build_model(cfg: &AgentConfig) -> Result<Box<dyn BaseModel>, ModelError>
             api_key,
             cfg.reasoning_effort.clone(),
         ))),
-        _ => {
+        "openai" | "openrouter" | "cerebras" | "zai" | "ollama" => {
             // OpenAI-compatible: openai, openrouter, cerebras, ollama
             let mut extra_headers = HashMap::new();
             if provider == "openrouter" {
@@ -222,15 +247,29 @@ pub fn build_model(cfg: &AgentConfig) -> Result<Box<dyn BaseModel>, ModelError>
                 );
                 extra_headers.insert("X-Title".to_string(), "OpenPlanter".to_string());
             }
-            Ok(Box::new(OpenAIModel::new(
+            if provider == "zai" {
+                extra_headers.insert("Accept-Language".to_string(), "en-US,en".to_string());
+            }
+            let model = OpenAIModel::new(
                 model_name,
-                provider,
+                provider.clone(),
                 base_url,
                 api_key,
                 cfg.reasoning_effort.clone(),
                 extra_headers,
-            )))
+            );
+            let model = if provider == "zai" {
+                model.with_zai_runtime(ZaiRuntimeConfig {
+                    paygo_base_url: cfg.zai_paygo_base_url.clone(),
+                    coding_base_url: cfg.zai_coding_base_url.clone(),
+                    stream_max_retries: cfg.zai_stream_max_retries.max(0) as usize,
+                })
+            } else {
+                model
+            };
+            Ok(Box::new(model))
         }
+        _ => Err(ModelError::Message(format!("Unknown provider: {provider}"))),
     }
 }
 
@@ -244,6 +283,10 @@ mod tests {
             infer_provider_for_model("claude-opus-4-6"),
             Some("anthropic")
         );
+        assert_eq!(
+            infer_provider_for_model("anthropic-foundry/claude-opus-4-6"),
+            Some("anthropic")
+        );
         assert_eq!(
             infer_provider_for_model("claude-sonnet-4-5"),
             Some("anthropic")
@@ -257,6 +300,10 @@ mod tests {
     #[test]
     fn test_infer_openai() {
         assert_eq!(infer_provider_for_model("gpt-5.2"), Some("openai"));
+        assert_eq!(
+            infer_provider_for_model("azure-foundry/gpt-5.3-codex"),
+            Some("openai")
+        );
         assert_eq!(infer_provider_for_model("o1-preview"), Some("openai"));
         assert_eq!(infer_provider_for_model("o3"), Some("openai"));
         assert_eq!(infer_provider_for_model("chatgpt-4o"), Some("openai"));
@@ -282,6 +329,12 @@ mod tests {
         );
     }
 
+    #[test]
+    fn test_infer_zai() {
+        assert_eq!(infer_provider_for_model("glm-5"), Some("zai"));
+        assert_eq!(infer_provider_for_model("zai-glm-4.6"), Some("zai"));
+    }
+
     #[test]
     fn test_infer_ollama() {
         assert_eq!(infer_provider_for_model("llama3.2"), Some("ollama"));
@@ -297,6 +350,7 @@ mod tests {
         // qwen-3 → cerebras, qwen (no -3) → ollama
         assert_eq!(infer_provider_for_model("qwen-3"), Some("cerebras"));
         assert_eq!(infer_provider_for_model("qwen2"), Some("ollama"));
+        assert_eq!(infer_provider_for_model("zai-glm"), Some("zai"));
     }
 
     #[test]
@@ -326,11 +380,11 @@ mod tests {
     #[test]
     fn test_resolve_model_name_explicit() {
         let cfg = AgentConfig {
-            model: "gpt-5.2".into(),
+            model: "azure-foundry/gpt-5.3-codex".into(),
             provider: "openai".into(),
             ..Default::default()
         };
-        assert_eq!(resolve_model_name(&cfg).unwrap(), "gpt-5.2");
+        assert_eq!(resolve_model_name(&cfg).unwrap(), "azure-foundry/gpt-5.3-codex");
     }
 
     #[test]
@@ -340,7 +394,7 @@ mod tests {
             provider: "openai".into(),
             ..Default::default()
         };
-        assert_eq!(resolve_model_name(&cfg).unwrap(), "gpt-5.2");
+        assert_eq!(resolve_model_name(&cfg).unwrap(), "azure-foundry/gpt-5.3-codex");
     }
 
     // ── resolve_provider ──
@@ -358,7 +412,7 @@ mod tests {
     fn test_resolve_provider_auto_infers_from_model() {
         let cfg = AgentConfig {
             provider: "auto".into(),
-            model: "claude-opus-4-6".into(),
+            model: "anthropic-foundry/claude-opus-4-6".into(),
             ..Default::default()
         };
         assert_eq!(resolve_provider(&cfg).unwrap(), "anthropic");
@@ -366,24 +420,40 @@ mod tests {
 
     #[test]
     fn test_resolve_provider_auto_falls_back_to_key() {
+        let cfg = AgentConfig {
+            provider: "auto".into(),
+            model: "some-unknown-model".into(),
+            zai_api_key: Some("zai-test".into()),
+            openai_api_key: None,
+            anthropic_api_key: None,
+            openrouter_api_key: None,
+            cerebras_api_key: None,
+            ..Default::default()
+        };
+        assert_eq!(resolve_provider(&cfg).unwrap(), "zai");
+    }
+
+    #[test]
+    fn test_resolve_provider_auto_falls_back_to_openai_before_zai() {
         let cfg = AgentConfig {
             provider: "auto".into(),
             model: "some-unknown-model".into(),
             openai_api_key: Some("sk-test".into()),
+            anthropic_api_key: None,
+            zai_api_key: Some("zai-test".into()),
             ..Default::default()
         };
-        // anthropic checked first but no key, openai has key
         assert_eq!(resolve_provider(&cfg).unwrap(), "openai");
     }
 
     #[test]
-    fn test_resolve_provider_auto_no_keys_defaults_ollama() {
+    fn test_resolve_provider_auto_no_keys_defaults_to_foundry_anthropic() {
         let cfg = AgentConfig {
             provider: "auto".into(),
             model: "some-unknown-model".into(),
             ..Default::default()
         };
-        assert_eq!(resolve_provider(&cfg).unwrap(), "ollama");
+        assert_eq!(resolve_provider(&cfg).unwrap(), "anthropic");
     }
 
     #[test]
@@ -407,7 +477,7 @@ mod tests {
             ..Default::default()
         };
         let (url, key) = resolve_endpoint(&cfg, "anthropic").unwrap();
-        assert_eq!(url, "https://api.anthropic.com/v1");
+        assert_eq!(url, crate::config::FOUNDRY_ANTHROPIC_BASE_URL);
         assert_eq!(key, "sk-ant-key");
     }
 
@@ -415,6 +485,8 @@ mod tests {
     fn test_resolve_endpoint_anthropic_fallback_to_api_key() {
         let cfg = AgentConfig {
             api_key: Some("fallback-key".into()),
+            anthropic_api_key: None,
+            anthropic_base_url: "https://api.anthropic.com/v1".into(),
             ..Default::default()
         };
         let (_, key) = resolve_endpoint(&cfg, "anthropic").unwrap();
@@ -423,10 +495,20 @@ mod tests {
 
     #[test]
     fn test_resolve_endpoint_anthropic_missing_key() {
-        let cfg = AgentConfig::default();
+        let cfg = AgentConfig {
+            anthropic_api_key: None,
+            api_key: None,
+            anthropic_base_url: "https://api.anthropic.com/v1".into(),
+            ..Default::default()
+        };
         let result = resolve_endpoint(&cfg, "anthropic");
         assert!(result.is_err());
-        assert!(result.unwrap_err().to_string().contains("Anthropic API key"));
+        assert!(
+            result
+                .unwrap_err()
+                .to_string()
+                .contains("Anthropic API key")
+        );
     }
 
     #[test]
@@ -436,10 +518,21 @@ mod tests {
             ..Default::default()
         };
         let (url, key) = resolve_endpoint(&cfg, "openai").unwrap();
-        assert_eq!(url, "https://api.openai.com/v1");
+        assert_eq!(url, crate::config::FOUNDRY_OPENAI_BASE_URL);
         assert_eq!(key, "sk-openai");
     }
 
+    #[test]
+    fn test_resolve_endpoint_zai() {
+        let cfg = AgentConfig {
+            zai_api_key: Some("zai-key".into()),
+            ..Default::default()
+        };
+        let (url, key) = resolve_endpoint(&cfg, "zai").unwrap();
+        assert_eq!(url, "https://api.z.ai/api/paas/v4");
+        assert_eq!(key, "zai-key");
+    }
+
     #[test]
     fn test_resolve_endpoint_ollama_dummy_key() {
         let cfg = AgentConfig::default();
@@ -484,6 +577,19 @@ mod tests {
         assert_eq!(model.provider_name(), "openai");
     }
 
+    #[test]
+    fn test_build_model_zai() {
+        let cfg = AgentConfig {
+            provider: "zai".into(),
+            model: "glm-5".into(),
+            zai_api_key: Some("zai-key".into()),
+            ..Default::default()
+        };
+        let model = build_model(&cfg).unwrap();
+        assert_eq!(model.model_name(), "glm-5");
+        assert_eq!(model.provider_name(), "zai");
+    }
+
     #[test]
     fn test_build_model_ollama_no_key_needed() {
         let cfg = AgentConfig {
@@ -514,7 +620,9 @@ mod tests {
         let cfg = AgentConfig {
             provider: "openai".into(),
             model: "gpt-4o".into(),
-            // No key set
+            openai_base_url: "https://api.openai.com/v1".into(),
+            openai_api_key: None,
+            api_key: None,
             ..Default::default()
         };
         let result = build_model(&cfg);
@@ -535,7 +643,10 @@ mod tests {
             Err(e) => e.to_string(),
             Ok(_) => panic!("expected error"),
         };
-        assert!(err_msg.contains("openai"), "error should mention openai: {err_msg}");
+        assert!(
+            err_msg.contains("openai"),
+            "error should mention openai: {err_msg}"
+        );
     }
 
     #[test]
diff --git a/openplanter-desktop/crates/op-core/src/config.rs b/openplanter-desktop/crates/op-core/src/config.rs
index f6ff3039..06ff4c86 100644
--- a/openplanter-desktop/crates/op-core/src/config.rs
+++ b/openplanter-desktop/crates/op-core/src/config.rs
@@ -5,14 +5,28 @@ use std::sync::LazyLock;
 
 use serde::{Deserialize, Serialize};
 
+pub const AZURE_FOUNDRY_MODEL_PREFIX: &str = "azure-foundry/";
+pub const ANTHROPIC_FOUNDRY_MODEL_PREFIX: &str = "anthropic-foundry/";
+pub const FOUNDRY_OPENAI_BASE_URL: &str =
+    "https://foundry-proxy.cheetah-koi.ts.net/openai/v1";
+pub const FOUNDRY_ANTHROPIC_BASE_URL: &str =
+    "https://foundry-proxy.cheetah-koi.ts.net/anthropic/v1";
+pub const FOUNDRY_OPENAI_API_KEY_PLACEHOLDER: &str =
+    "dont-worry-this-key-will-be-auto-injected";
+pub const FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER: &str =
+    "dont-worry-it-will-be-injected";
+pub const ZAI_PAYGO_BASE_URL: &str = "https://api.z.ai/api/paas/v4";
+pub const ZAI_CODING_BASE_URL: &str = "https://api.z.ai/api/coding/paas/v4";
+
 /// Default model for each supported provider.
 pub static PROVIDER_DEFAULT_MODELS: LazyLock<HashMap<&'static str, &'static str>> =
     LazyLock::new(|| {
         HashMap::from([
-            ("openai", "gpt-5.2"),
-            ("anthropic", "claude-opus-4-6"),
+            ("openai", "azure-foundry/gpt-5.3-codex"),
+            ("anthropic", "anthropic-foundry/claude-opus-4-6"),
             ("openrouter", "anthropic/claude-sonnet-4-5"),
             ("cerebras", "qwen-3-235b-a22b-instruct-2507"),
+            ("zai", "glm-5"),
             ("ollama", "llama3.2"),
         ])
     });
@@ -32,6 +46,13 @@ fn env_int(key: &str, default: i64) -> i64 {
         .unwrap_or(default)
 }
 
+fn env_float(key: &str, default: f64) -> f64 {
+    env::var(key)
+        .ok()
+        .and_then(|v| v.parse().ok())
+        .unwrap_or(default)
+}
+
 fn env_bool(key: &str, default: bool) -> bool {
     match env::var(key) {
         Ok(v) => matches!(v.trim().to_lowercase().as_str(), "1" | "true" | "yes"),
@@ -39,6 +60,92 @@ fn env_bool(key: &str, default: bool) -> bool {
     }
 }
 
+pub fn normalize_zai_plan(value: Option<&str>) -> String {
+    match value.unwrap_or_default().trim().to_lowercase().as_str() {
+        "coding" => "coding".to_string(),
+        _ => "paygo".to_string(),
+    }
+}
+
+pub fn resolve_zai_base_url(plan: &str, paygo_base_url: &str, coding_base_url: &str) -> String {
+    if normalize_zai_plan(Some(plan)) == "coding" {
+        coding_base_url.to_string()
+    } else {
+        paygo_base_url.to_string()
+    }
+}
+
+pub fn normalize_web_search_provider(value: Option<&str>) -> String {
+    match value.unwrap_or_default().trim().to_lowercase().as_str() {
+        "firecrawl" => "firecrawl".to_string(),
+        _ => "exa".to_string(),
+    }
+}
+
+fn normalize_base_url(value: &str) -> String {
+    value.trim().trim_end_matches('/').to_string()
+}
+
+pub fn is_foundry_openai_base_url(value: &str) -> bool {
+    normalize_base_url(value) == FOUNDRY_OPENAI_BASE_URL
+}
+
+pub fn is_foundry_anthropic_base_url(value: &str) -> bool {
+    normalize_base_url(value) == FOUNDRY_ANTHROPIC_BASE_URL
+}
+
+pub fn resolve_openai_api_key(api_key: Option<String>, base_url: &str) -> Option<String> {
+    let normalized = api_key
+        .as_deref()
+        .map(str::trim)
+        .filter(|value| !value.is_empty())
+        .map(str::to_string);
+    if normalized.as_deref() == Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER)
+        && !is_foundry_openai_base_url(base_url)
+    {
+        return None;
+    }
+    if normalized.is_some() {
+        return normalized;
+    }
+    if is_foundry_openai_base_url(base_url) {
+        return Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.to_string());
+    }
+    None
+}
+
+pub fn resolve_anthropic_api_key(api_key: Option<String>, base_url: &str) -> Option<String> {
+    let normalized = api_key
+        .as_deref()
+        .map(str::trim)
+        .filter(|value| !value.is_empty())
+        .map(str::to_string);
+    if normalized.as_deref() == Some(FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER)
+        && !is_foundry_anthropic_base_url(base_url)
+    {
+        return None;
+    }
+    if normalized.is_some() {
+        return normalized;
+    }
+    if is_foundry_anthropic_base_url(base_url) {
+        return Some(FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER.to_string());
+    }
+    None
+}
+
+pub fn strip_foundry_model_prefix(model: &str) -> String {
+    let trimmed = model.trim();
+    let lower = trimmed.to_lowercase();
+    if lower.starts_with(AZURE_FOUNDRY_MODEL_PREFIX) {
+        return trimmed[AZURE_FOUNDRY_MODEL_PREFIX.len()..].to_string();
+    }
+    if lower.starts_with(ANTHROPIC_FOUNDRY_MODEL_PREFIX) {
+        return trimmed[ANTHROPIC_FOUNDRY_MODEL_PREFIX.len()..].to_string();
+    }
+    trimmed.to_string()
+}
+
 /// Central configuration for the OpenPlanter agent.
 ///
 /// Mirrors the Python `AgentConfig` dataclass field-for-field.
@@ -55,8 +162,13 @@ pub struct AgentConfig {
     pub anthropic_base_url: String,
     pub openrouter_base_url: String,
     pub cerebras_base_url: String,
+    pub zai_plan: String,
+    pub zai_paygo_base_url: String,
+    pub zai_coding_base_url: String,
+    pub zai_base_url: String,
     pub ollama_base_url: String,
     pub exa_base_url: String,
+    pub firecrawl_base_url: String,
 
     // API keys
     pub api_key: Option<String>,
@@ -64,7 +176,10 @@ pub struct AgentConfig {
     pub anthropic_api_key: Option<String>,
     pub openrouter_api_key: Option<String>,
     pub cerebras_api_key: Option<String>,
+    pub zai_api_key: Option<String>,
     pub exa_api_key: Option<String>,
+    pub firecrawl_api_key: Option<String>,
+    pub web_search_provider: String,
     pub voyage_api_key: Option<String>,
 
     // Limits
@@ -80,6 +195,11 @@ pub struct AgentConfig {
     pub session_root_dir: String,
     pub max_persisted_observations: i64,
     pub max_solve_seconds: i64,
+    pub rate_limit_max_retries: i64,
+    pub rate_limit_backoff_base_sec: f64,
+    pub rate_limit_backoff_max_sec: f64,
+    pub rate_limit_retry_after_cap_sec: f64,
+    pub zai_stream_max_retries: i64,
     pub recursive: bool,
     pub min_subtask_depth: i64,
     pub acceptance_criteria: bool,
@@ -93,21 +213,29 @@ impl Default for AgentConfig {
         Self {
             workspace: PathBuf::from("."),
             provider: "auto".into(),
-            model: "claude-opus-4-6".into(),
+            model: "anthropic-foundry/claude-opus-4-6".into(),
             reasoning_effort: Some("high".into()),
-            base_url: "https://api.openai.com/v1".into(),
-            openai_base_url: "https://api.openai.com/v1".into(),
-            anthropic_base_url: "https://api.anthropic.com/v1".into(),
+            base_url: FOUNDRY_OPENAI_BASE_URL.into(),
+            openai_base_url: FOUNDRY_OPENAI_BASE_URL.into(),
+            anthropic_base_url: FOUNDRY_ANTHROPIC_BASE_URL.into(),
             openrouter_base_url: "https://openrouter.ai/api/v1".into(),
             cerebras_base_url: "https://api.cerebras.ai/v1".into(),
+            zai_plan: "paygo".into(),
+            zai_paygo_base_url: ZAI_PAYGO_BASE_URL.into(),
+            zai_coding_base_url: ZAI_CODING_BASE_URL.into(),
+            zai_base_url: ZAI_PAYGO_BASE_URL.into(),
             ollama_base_url: "http://localhost:11434/v1".into(),
             exa_base_url: "https://api.exa.ai".into(),
-            api_key: None,
-            openai_api_key: None,
-            anthropic_api_key: None,
+            firecrawl_base_url: "https://api.firecrawl.dev/v1".into(),
+            api_key: Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.into()),
+            openai_api_key: Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.into()),
+            anthropic_api_key: Some(FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER.into()),
             openrouter_api_key: None,
             cerebras_api_key: None,
+            zai_api_key: None,
             exa_api_key: None,
+            firecrawl_api_key: None,
+            web_search_provider: "exa".into(),
             voyage_api_key: None,
             max_depth: 4,
             max_steps_per_call: 100,
@@ -121,6 +249,11 @@ impl Default for AgentConfig {
             session_root_dir: ".openplanter".into(),
             max_persisted_observations: 400,
             max_solve_seconds: 0,
+            rate_limit_max_retries: 12,
+            rate_limit_backoff_base_sec: 1.0,
+            rate_limit_backoff_max_sec: 60.0,
+            rate_limit_retry_after_cap_sec: 120.0,
+            zai_stream_max_retries: 10,
             recursive: true,
             min_subtask_depth: 0,
             acceptance_criteria: true,
@@ -136,27 +269,34 @@ impl AgentConfig {
     pub fn from_env(workspace: impl AsRef<Path>) -> Self {
         let ws = dunce_canonicalize(workspace.as_ref());
 
-        let openai_api_key = env_opt("OPENPLANTER_OPENAI_API_KEY")
-            .or_else(|| env_opt("OPENAI_API_KEY"));
+        let openai_api_key =
+            env_opt("OPENPLANTER_OPENAI_API_KEY").or_else(|| env_opt("OPENAI_API_KEY"));
+
+        let anthropic_api_key =
+            env_opt("OPENPLANTER_ANTHROPIC_API_KEY").or_else(|| env_opt("ANTHROPIC_API_KEY"));
+
+        let openrouter_api_key =
+            env_opt("OPENPLANTER_OPENROUTER_API_KEY").or_else(|| env_opt("OPENROUTER_API_KEY"));
 
-        let anthropic_api_key = env_opt("OPENPLANTER_ANTHROPIC_API_KEY")
-            .or_else(|| env_opt("ANTHROPIC_API_KEY"));
+        let cerebras_api_key =
+            env_opt("OPENPLANTER_CEREBRAS_API_KEY").or_else(|| env_opt("CEREBRAS_API_KEY"));
 
-        let openrouter_api_key = env_opt("OPENPLANTER_OPENROUTER_API_KEY")
-            .or_else(|| env_opt("OPENROUTER_API_KEY"));
+        let zai_api_key = env_opt("OPENPLANTER_ZAI_API_KEY").or_else(|| env_opt("ZAI_API_KEY"));
 
-        let cerebras_api_key = env_opt("OPENPLANTER_CEREBRAS_API_KEY")
-            .or_else(|| env_opt("CEREBRAS_API_KEY"));
+        let exa_api_key = env_opt("OPENPLANTER_EXA_API_KEY").or_else(|| env_opt("EXA_API_KEY"));
 
-        let exa_api_key = env_opt("OPENPLANTER_EXA_API_KEY")
-            .or_else(|| env_opt("EXA_API_KEY"));
+        let firecrawl_api_key =
+            env_opt("OPENPLANTER_FIRECRAWL_API_KEY").or_else(|| env_opt("FIRECRAWL_API_KEY"));
 
-        let voyage_api_key = env_opt("OPENPLANTER_VOYAGE_API_KEY")
-            .or_else(|| env_opt("VOYAGE_API_KEY"));
+        let voyage_api_key =
+            env_opt("OPENPLANTER_VOYAGE_API_KEY").or_else(|| env_opt("VOYAGE_API_KEY"));
 
         let openai_base_url = env_opt("OPENPLANTER_OPENAI_BASE_URL")
             .or_else(|| env_opt("OPENPLANTER_BASE_URL"))
-            .unwrap_or_else(|| "https://api.openai.com/v1".into());
+            .unwrap_or_else(|| FOUNDRY_OPENAI_BASE_URL.into());
+        let anthropic_base_url = env_or("OPENPLANTER_ANTHROPIC_BASE_URL", FOUNDRY_ANTHROPIC_BASE_URL);
+        let openai_api_key = resolve_openai_api_key(openai_api_key, &openai_base_url);
+        let anthropic_api_key = resolve_anthropic_api_key(anthropic_api_key, &anthropic_base_url);
 
         let reasoning_effort_raw = env_or("OPENPLANTER_REASONING_EFFORT", "high")
             .trim()
@@ -167,27 +307,31 @@ impl AgentConfig {
             Some(reasoning_effort_raw)
         };
 
-        let provider_raw = env_or("OPENPLANTER_PROVIDER", "auto")
-            .trim()
-            .to_lowercase();
+        let provider_raw = env_or("OPENPLANTER_PROVIDER", "auto").trim().to_lowercase();
         let provider = if provider_raw.is_empty() {
             "auto".into()
         } else {
             provider_raw
         };
 
+        let zai_plan = normalize_zai_plan(env_opt("OPENPLANTER_ZAI_PLAN").as_deref());
+        let zai_paygo_base_url = env_or("OPENPLANTER_ZAI_PAYGO_BASE_URL", ZAI_PAYGO_BASE_URL);
+        let zai_coding_base_url = env_or("OPENPLANTER_ZAI_CODING_BASE_URL", ZAI_CODING_BASE_URL);
+        let zai_base_url = env_opt("OPENPLANTER_ZAI_BASE_URL").unwrap_or_else(|| {
+            resolve_zai_base_url(&zai_plan, &zai_paygo_base_url, &zai_coding_base_url)
+        });
+        let web_search_provider =
+            normalize_web_search_provider(env_opt("OPENPLANTER_WEB_SEARCH_PROVIDER").as_deref());
+
         Self {
             workspace: ws,
             provider,
-            model: env_or("OPENPLANTER_MODEL", "claude-opus-4-6"),
+            model: env_or("OPENPLANTER_MODEL", PROVIDER_DEFAULT_MODELS["anthropic"]),
             reasoning_effort,
             base_url: openai_base_url.clone(),
             api_key: openai_api_key.clone(),
             openai_base_url,
-            anthropic_base_url: env_or(
-                "OPENPLANTER_ANTHROPIC_BASE_URL",
-                "https://api.anthropic.com/v1",
-            ),
+            anthropic_base_url,
             openrouter_base_url: env_or(
                 "OPENPLANTER_OPENROUTER_BASE_URL",
                 "https://openrouter.ai/api/v1",
@@ -196,16 +340,24 @@ impl AgentConfig {
                 "OPENPLANTER_CEREBRAS_BASE_URL",
                 "https://api.cerebras.ai/v1",
             ),
-            ollama_base_url: env_or(
-                "OPENPLANTER_OLLAMA_BASE_URL",
-                "http://localhost:11434/v1",
-            ),
+            zai_plan,
+            zai_paygo_base_url,
+            zai_coding_base_url,
+            zai_base_url,
+            ollama_base_url: env_or("OPENPLANTER_OLLAMA_BASE_URL", "http://localhost:11434/v1"),
             exa_base_url: env_or("OPENPLANTER_EXA_BASE_URL", "https://api.exa.ai"),
+            firecrawl_base_url: env_or(
+                "OPENPLANTER_FIRECRAWL_BASE_URL",
+                "https://api.firecrawl.dev/v1",
+            ),
             openai_api_key,
             anthropic_api_key,
             openrouter_api_key,
             cerebras_api_key,
+            zai_api_key,
             exa_api_key,
+            firecrawl_api_key,
+            web_search_provider,
             voyage_api_key,
             max_depth: env_int("OPENPLANTER_MAX_DEPTH", 4),
             max_steps_per_call: env_int("OPENPLANTER_MAX_STEPS", 100),
@@ -219,6 +371,14 @@ impl AgentConfig {
             session_root_dir: env_or("OPENPLANTER_SESSION_DIR", ".openplanter"),
             max_persisted_observations: env_int("OPENPLANTER_MAX_PERSISTED_OBS", 400),
             max_solve_seconds: env_int("OPENPLANTER_MAX_SOLVE_SECONDS", 0),
+            rate_limit_max_retries: env_int("OPENPLANTER_RATE_LIMIT_MAX_RETRIES", 12),
+            rate_limit_backoff_base_sec: env_float("OPENPLANTER_RATE_LIMIT_BACKOFF_BASE_SEC", 1.0),
+            rate_limit_backoff_max_sec: env_float("OPENPLANTER_RATE_LIMIT_BACKOFF_MAX_SEC", 60.0),
+            rate_limit_retry_after_cap_sec: env_float(
+                "OPENPLANTER_RATE_LIMIT_RETRY_AFTER_CAP_SEC",
+                120.0,
+            ),
+            zai_stream_max_retries: env_int("OPENPLANTER_ZAI_STREAM_MAX_RETRIES", 10),
             recursive: env_bool("OPENPLANTER_RECURSIVE", true),
             min_subtask_depth: env_int("OPENPLANTER_MIN_SUBTASK_DEPTH", 0),
             acceptance_criteria: env_bool("OPENPLANTER_ACCEPTANCE_CRITERIA", true),
@@ -259,10 +419,27 @@ mod tests {
     fn test_default_config() {
         let cfg = AgentConfig::default();
         assert_eq!(cfg.provider, "auto");
-        assert_eq!(cfg.model, "claude-opus-4-6");
+        assert_eq!(cfg.model, "anthropic-foundry/claude-opus-4-6");
         assert_eq!(cfg.reasoning_effort, Some("high".into()));
+        assert_eq!(cfg.openai_base_url, FOUNDRY_OPENAI_BASE_URL);
+        assert_eq!(cfg.anthropic_base_url, FOUNDRY_ANTHROPIC_BASE_URL);
+        assert_eq!(
+            cfg.openai_api_key.as_deref(),
+            Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER)
+        );
+        assert_eq!(
+            cfg.anthropic_api_key.as_deref(),
+            Some(FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER)
+        );
         assert_eq!(cfg.max_depth, 4);
         assert_eq!(cfg.max_steps_per_call, 100);
+        assert_eq!(cfg.zai_plan, "paygo");
+        assert_eq!(cfg.zai_base_url, ZAI_PAYGO_BASE_URL);
+        assert_eq!(cfg.web_search_provider, "exa");
+        assert_eq!(cfg.rate_limit_max_retries, 12);
+        assert_eq!(cfg.rate_limit_backoff_base_sec, 1.0);
+        assert_eq!(cfg.rate_limit_backoff_max_sec, 60.0);
+        assert_eq!(cfg.rate_limit_retry_after_cap_sec, 120.0);
         assert!(cfg.recursive);
         assert!(cfg.acceptance_criteria);
         assert!(!cfg.demo);
@@ -270,10 +447,13 @@ mod tests {
 
     #[test]
     fn test_provider_default_models() {
-        assert_eq!(PROVIDER_DEFAULT_MODELS.get("openai"), Some(&"gpt-5.2"));
+        assert_eq!(
+            PROVIDER_DEFAULT_MODELS.get("openai"),
+            Some(&"azure-foundry/gpt-5.3-codex")
+        );
         assert_eq!(
             PROVIDER_DEFAULT_MODELS.get("anthropic"),
-            Some(&"claude-opus-4-6")
+            Some(&"anthropic-foundry/claude-opus-4-6")
         );
         assert_eq!(
             PROVIDER_DEFAULT_MODELS.get("openrouter"),
@@ -283,6 +463,7 @@ mod tests {
             PROVIDER_DEFAULT_MODELS.get("cerebras"),
             Some(&"qwen-3-235b-a22b-instruct-2507")
         );
+        assert_eq!(PROVIDER_DEFAULT_MODELS.get("zai"), Some(&"glm-5"));
         assert_eq!(PROVIDER_DEFAULT_MODELS.get("ollama"), Some(&"llama3.2"));
     }
 
@@ -296,17 +477,27 @@ mod tests {
             "OPENPLANTER_REASONING_EFFORT",
             "OPENPLANTER_OPENAI_API_KEY",
             "OPENAI_API_KEY",
+            "OPENPLANTER_OPENAI_BASE_URL",
+            "OPENPLANTER_BASE_URL",
             "OPENPLANTER_ANTHROPIC_API_KEY",
             "ANTHROPIC_API_KEY",
+            "OPENPLANTER_ANTHROPIC_BASE_URL",
+            "OPENPLANTER_ZAI_API_KEY",
+            "ZAI_API_KEY",
             "OPENPLANTER_MAX_DEPTH",
             "OPENPLANTER_RECURSIVE",
             "OPENPLANTER_DEMO",
+            "OPENPLANTER_WEB_SEARCH_PROVIDER",
+            "OPENPLANTER_ZAI_PLAN",
+            "OPENPLANTER_ZAI_BASE_URL",
+            "OPENPLANTER_RATE_LIMIT_MAX_RETRIES",
+            "OPENPLANTER_RATE_LIMIT_BACKOFF_BASE_SEC",
+            "OPENPLANTER_RATE_LIMIT_BACKOFF_MAX_SEC",
+            "OPENPLANTER_RATE_LIMIT_RETRY_AFTER_CAP_SEC",
+            "OPENPLANTER_ZAI_STREAM_MAX_RETRIES",
         ];
         // Save original values
-        let saved: Vec<_> = keys
-            .iter()
-            .map(|k| (*k, env::var(k).ok()))
-            .collect();
+        let saved: Vec<_> = keys.iter().map(|k| (*k, env::var(k).ok())).collect();
 
         // SAFETY: test-only; combined into one test to avoid parallel env mutation
         unsafe {
@@ -318,33 +509,64 @@ mod tests {
 
         let cfg = AgentConfig::from_env("/tmp");
         assert_eq!(cfg.provider, "auto");
-        assert_eq!(cfg.model, "claude-opus-4-6");
+        assert_eq!(cfg.model, "anthropic-foundry/claude-opus-4-6");
         assert_eq!(cfg.reasoning_effort, Some("high".into()));
         assert_eq!(cfg.max_depth, 4);
         assert!(cfg.recursive);
         assert!(!cfg.demo);
-        assert!(cfg.openai_api_key.is_none());
-        assert!(cfg.anthropic_api_key.is_none());
+        assert_eq!(
+            cfg.openai_api_key.as_deref(),
+            Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER)
+        );
+        assert_eq!(
+            cfg.anthropic_api_key.as_deref(),
+            Some(FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER)
+        );
+        assert!(cfg.zai_api_key.is_none());
+        assert_eq!(cfg.openai_base_url, FOUNDRY_OPENAI_BASE_URL);
+        assert_eq!(cfg.anthropic_base_url, FOUNDRY_ANTHROPIC_BASE_URL);
+        assert_eq!(cfg.web_search_provider, "exa");
+        assert_eq!(cfg.rate_limit_max_retries, 12);
+        assert_eq!(cfg.rate_limit_backoff_base_sec, 1.0);
+        assert_eq!(cfg.rate_limit_backoff_max_sec, 60.0);
+        assert_eq!(cfg.rate_limit_retry_after_cap_sec, 120.0);
 
         unsafe {
             // --- Phase 2: test custom values ---
             env::set_var("OPENPLANTER_PROVIDER", "openai");
-            env::set_var("OPENPLANTER_MODEL", "gpt-5.2");
+            env::set_var("OPENPLANTER_MODEL", "azure-foundry/gpt-5.3-codex");
             env::set_var("OPENPLANTER_REASONING_EFFORT", "low");
             env::set_var("OPENPLANTER_MAX_DEPTH", "8");
             env::set_var("OPENPLANTER_RECURSIVE", "false");
             env::set_var("OPENPLANTER_DEMO", "true");
             env::set_var("OPENAI_API_KEY", "sk-test123");
+            env::set_var("ZAI_API_KEY", "zai-test123");
+            env::set_var("OPENPLANTER_WEB_SEARCH_PROVIDER", "firecrawl");
+            env::set_var("OPENPLANTER_RATE_LIMIT_MAX_RETRIES", "5");
+            env::set_var("OPENPLANTER_RATE_LIMIT_BACKOFF_BASE_SEC", "2.5");
+            env::set_var("OPENPLANTER_RATE_LIMIT_BACKOFF_MAX_SEC", "30.0");
+            env::set_var("OPENPLANTER_RATE_LIMIT_RETRY_AFTER_CAP_SEC", "90.0");
+            env::set_var("OPENPLANTER_ZAI_PLAN", "coding");
+            env::set_var("OPENPLANTER_ZAI_STREAM_MAX_RETRIES", "7");
         }
 
         let cfg = AgentConfig::from_env("/tmp");
         assert_eq!(cfg.provider, "openai");
-        assert_eq!(cfg.model, "gpt-5.2");
+        assert_eq!(cfg.model, "azure-foundry/gpt-5.3-codex");
         assert_eq!(cfg.reasoning_effort, Some("low".into()));
         assert_eq!(cfg.max_depth, 8);
         assert!(!cfg.recursive);
         assert!(cfg.demo);
         assert_eq!(cfg.openai_api_key, Some("sk-test123".into()));
+        assert_eq!(cfg.zai_api_key, Some("zai-test123".into()));
+        assert_eq!(cfg.zai_plan, "coding");
+        assert_eq!(cfg.zai_base_url, ZAI_CODING_BASE_URL);
+        assert_eq!(cfg.zai_stream_max_retries, 7);
+        assert_eq!(cfg.web_search_provider, "firecrawl");
+        assert_eq!(cfg.rate_limit_max_retries, 5);
+        assert_eq!(cfg.rate_limit_backoff_base_sec, 2.5);
+        assert_eq!(cfg.rate_limit_backoff_max_sec, 30.0);
+        assert_eq!(cfg.rate_limit_retry_after_cap_sec, 90.0);
 
         // Restore original values
         for (k, v) in saved {
@@ -356,4 +578,37 @@ mod tests {
             }
         }
     }
+
+    #[test]
+    fn test_normalizers() {
+        assert_eq!(normalize_zai_plan(Some("coding")), "coding");
+        assert_eq!(normalize_zai_plan(Some("bad-value")), "paygo");
+        assert_eq!(
+            resolve_zai_base_url("coding", "https://paygo.example", "https://coding.example"),
+            "https://coding.example"
+        );
+        assert_eq!(
+            normalize_web_search_provider(Some("firecrawl")),
+            "firecrawl"
+        );
+        assert_eq!(normalize_web_search_provider(Some("other")), "exa");
+        assert!(is_foundry_openai_base_url(FOUNDRY_OPENAI_BASE_URL));
+        assert!(is_foundry_anthropic_base_url(FOUNDRY_ANTHROPIC_BASE_URL));
+        assert_eq!(
+            resolve_openai_api_key(None, FOUNDRY_OPENAI_BASE_URL).as_deref(),
+            Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER)
+        );
+        assert_eq!(
+            resolve_anthropic_api_key(None, FOUNDRY_ANTHROPIC_BASE_URL).as_deref(),
+            Some(FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER)
+        );
+        assert_eq!(
+            strip_foundry_model_prefix("azure-foundry/gpt-5.3-codex"),
+            "gpt-5.3-codex"
+        );
+        assert_eq!(
+            strip_foundry_model_prefix("anthropic-foundry/claude-opus-4-6"),
+            "claude-opus-4-6"
+        );
+    }
 }
diff --git a/openplanter-desktop/crates/op-core/src/credentials.rs b/openplanter-desktop/crates/op-core/src/credentials.rs
index 12e7e914..af746019 100644
--- a/openplanter-desktop/crates/op-core/src/credentials.rs
+++ b/openplanter-desktop/crates/op-core/src/credentials.rs
@@ -16,26 +16,27 @@ pub struct CredentialBundle {
     pub anthropic_api_key: Option<String>,
     pub openrouter_api_key: Option<String>,
     pub cerebras_api_key: Option<String>,
+    pub zai_api_key: Option<String>,
     pub exa_api_key: Option<String>,
+    pub firecrawl_api_key: Option<String>,
     pub voyage_api_key: Option<String>,
 }
 
 impl CredentialBundle {
     /// Returns `true` if any key has a non-empty value.
     pub fn has_any(&self) -> bool {
-        let keys: [&Option<String>; 6] = [
+        let keys: [&Option<String>; 8] = [
             &self.openai_api_key,
             &self.anthropic_api_key,
             &self.openrouter_api_key,
             &self.cerebras_api_key,
+            &self.zai_api_key,
             &self.exa_api_key,
+            &self.firecrawl_api_key,
             &self.voyage_api_key,
         ];
-        keys.iter().any(|k| {
-            k.as_ref()
-                .map(|v| !v.trim().is_empty())
-                .unwrap_or(false)
-        })
+        keys.iter()
+            .any(|k| k.as_ref().map(|v| !v.trim().is_empty()).unwrap_or(false))
     }
 
     /// Fill in missing keys from `other`.
@@ -51,7 +52,9 @@ impl CredentialBundle {
         fill!(anthropic_api_key);
         fill!(openrouter_api_key);
         fill!(cerebras_api_key);
+        fill!(zai_api_key);
         fill!(exa_api_key);
+        fill!(firecrawl_api_key);
         fill!(voyage_api_key);
     }
 
@@ -69,7 +72,9 @@ impl CredentialBundle {
         add!(anthropic_api_key, "anthropic_api_key");
         add!(openrouter_api_key, "openrouter_api_key");
         add!(cerebras_api_key, "cerebras_api_key");
+        add!(zai_api_key, "zai_api_key");
         add!(exa_api_key, "exa_api_key");
+        add!(firecrawl_api_key, "firecrawl_api_key");
         add!(voyage_api_key, "voyage_api_key");
         out
     }
@@ -87,7 +92,9 @@ impl CredentialBundle {
             anthropic_api_key: get_str(payload, "anthropic_api_key"),
             openrouter_api_key: get_str(payload, "openrouter_api_key"),
             cerebras_api_key: get_str(payload, "cerebras_api_key"),
+            zai_api_key: get_str(payload, "zai_api_key"),
             exa_api_key: get_str(payload, "exa_api_key"),
+            firecrawl_api_key: get_str(payload, "firecrawl_api_key"),
             voyage_api_key: get_str(payload, "voyage_api_key"),
         }
     }
@@ -146,12 +153,14 @@ pub fn parse_env_file(path: &Path) -> CredentialBundle {
             "OPENROUTER_API_KEY",
             "OPENPLANTER_OPENROUTER_API_KEY",
         ),
-        cerebras_api_key: get_key(
+        cerebras_api_key: get_key(&env_map, "CEREBRAS_API_KEY", "OPENPLANTER_CEREBRAS_API_KEY"),
+        zai_api_key: get_key(&env_map, "ZAI_API_KEY", "OPENPLANTER_ZAI_API_KEY"),
+        exa_api_key: get_key(&env_map, "EXA_API_KEY", "OPENPLANTER_EXA_API_KEY"),
+        firecrawl_api_key: get_key(
             &env_map,
-            "CEREBRAS_API_KEY",
-            "OPENPLANTER_CEREBRAS_API_KEY",
+            "FIRECRAWL_API_KEY",
+            "OPENPLANTER_FIRECRAWL_API_KEY",
         ),
-        exa_api_key: get_key(&env_map, "EXA_API_KEY", "OPENPLANTER_EXA_API_KEY"),
         voyage_api_key: get_key(&env_map, "VOYAGE_API_KEY", "OPENPLANTER_VOYAGE_API_KEY"),
     }
 }
@@ -171,7 +180,9 @@ pub fn credentials_from_env() -> CredentialBundle {
         anthropic_api_key: env_key("OPENPLANTER_ANTHROPIC_API_KEY", "ANTHROPIC_API_KEY"),
         openrouter_api_key: env_key("OPENPLANTER_OPENROUTER_API_KEY", "OPENROUTER_API_KEY"),
         cerebras_api_key: env_key("OPENPLANTER_CEREBRAS_API_KEY", "CEREBRAS_API_KEY"),
+        zai_api_key: env_key("OPENPLANTER_ZAI_API_KEY", "ZAI_API_KEY"),
         exa_api_key: env_key("OPENPLANTER_EXA_API_KEY", "EXA_API_KEY"),
+        firecrawl_api_key: env_key("OPENPLANTER_FIRECRAWL_API_KEY", "FIRECRAWL_API_KEY"),
         voyage_api_key: env_key("OPENPLANTER_VOYAGE_API_KEY", "VOYAGE_API_KEY"),
     }
 }
@@ -319,11 +330,13 @@ mod tests {
         let b = CredentialBundle {
             openai_api_key: Some("should-not-overwrite".into()),
             anthropic_api_key: Some("new-key".into()),
+            zai_api_key: Some("zai-key".into()),
             ..Default::default()
         };
         a.merge_missing(&b);
         assert_eq!(a.openai_api_key, Some("existing".into()));
         assert_eq!(a.anthropic_api_key, Some("new-key".into()));
+        assert_eq!(a.zai_api_key, Some("zai-key".into()));
     }
 
     #[test]
@@ -332,12 +345,14 @@ mod tests {
             openai_api_key: Some("sk-123".into()),
             anthropic_api_key: None,
             openrouter_api_key: Some("or-456".into()),
+            firecrawl_api_key: Some("fc-789".into()),
             ..Default::default()
         };
         let json = bundle.to_json();
         assert_eq!(json.get("openai_api_key").unwrap(), "sk-123");
         assert!(!json.contains_key("anthropic_api_key"));
         assert_eq!(json.get("openrouter_api_key").unwrap(), "or-456");
+        assert_eq!(json.get("firecrawl_api_key").unwrap(), "fc-789");
     }
 
     #[test]
@@ -351,6 +366,8 @@ mod tests {
 OPENAI_API_KEY=sk-from-env
 export ANTHROPIC_API_KEY='ant-key'
 EXA_API_KEY="exa-quoted"
+ZAI_API_KEY=zai-from-env
+OPENPLANTER_FIRECRAWL_API_KEY="firecrawl-quoted"
 UNRELATED_VAR=foo
 "#,
         )
@@ -360,6 +377,8 @@ UNRELATED_VAR=foo
         assert_eq!(bundle.openai_api_key, Some("sk-from-env".into()));
         assert_eq!(bundle.anthropic_api_key, Some("ant-key".into()));
         assert_eq!(bundle.exa_api_key, Some("exa-quoted".into()));
+        assert_eq!(bundle.zai_api_key, Some("zai-from-env".into()));
+        assert_eq!(bundle.firecrawl_api_key, Some("firecrawl-quoted".into()));
         assert!(bundle.cerebras_api_key.is_none());
     }
 
@@ -370,12 +389,14 @@ UNRELATED_VAR=foo
         let bundle = CredentialBundle {
             openai_api_key: Some("sk-test".into()),
             anthropic_api_key: Some("ant-test".into()),
+            zai_api_key: Some("zai-test".into()),
             ..Default::default()
         };
         store.save(&bundle).unwrap();
         let loaded = store.load();
         assert_eq!(loaded.openai_api_key, Some("sk-test".into()));
         assert_eq!(loaded.anthropic_api_key, Some("ant-test".into()));
+        assert_eq!(loaded.zai_api_key, Some("zai-test".into()));
     }
 
     #[test]
diff --git a/openplanter-desktop/crates/op-core/src/engine/curator.rs b/openplanter-desktop/crates/op-core/src/engine/curator.rs
index e0015567..7d50a61b 100644
--- a/openplanter-desktop/crates/op-core/src/engine/curator.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/curator.rs
@@ -3,14 +3,13 @@
 /// Runs as a non-blocking background task after each main agent step.
 /// Reads the latest step context, decides if wiki updates are needed,
 /// and writes to `.openplanter/wiki/` using a restricted tool set.
-
 use tokio_util::sync::CancellationToken;
 
 use crate::builder::build_model;
 use crate::config::AgentConfig;
 use crate::model::Message;
-use crate::tools::defs::build_curator_tool_defs;
 use crate::tools::WorkspaceTools;
+use crate::tools::defs::build_curator_tool_defs;
 
 /// Result of a curator run.
 #[derive(Debug, Clone)]
@@ -78,7 +77,9 @@ pub fn extract_step_context(messages: &[Message]) -> String {
     let mut context = String::new();
 
     // Find last Assistant message index
-    let assistant_idx = messages.iter().rposition(|m| matches!(m, Message::Assistant { .. }));
+    let assistant_idx = messages
+        .iter()
+        .rposition(|m| matches!(m, Message::Assistant { .. }));
     let start = match assistant_idx {
         Some(idx) => idx,
         None => return context,
@@ -86,7 +87,10 @@ pub fn extract_step_context(messages: &[Message]) -> String {
 
     for msg in &messages[start..] {
         match msg {
-            Message::Assistant { content, tool_calls } => {
+            Message::Assistant {
+                content,
+                tool_calls,
+            } => {
                 context.push_str("=== Assistant ===\n");
                 context.push_str(content);
                 context.push('\n');
@@ -223,8 +227,10 @@ pub async fn run_curator(
             let result = tools.execute(&tc.name, &tc.arguments).await;
 
             // Track file modifications
-            if matches!(tc.name.as_str(), "write_file" | "edit_file" | "apply_patch" | "hashline_edit")
-                && !result.is_error
+            if matches!(
+                tc.name.as_str(),
+                "write_file" | "edit_file" | "apply_patch" | "hashline_edit"
+            ) && !result.is_error
             {
                 files_changed += 1;
                 // Extract path for summary
@@ -270,8 +276,12 @@ mod tests {
     #[test]
     fn test_extract_step_context_no_assistant() {
         let messages = vec![
-            Message::System { content: "sys".into() },
-            Message::User { content: "hello".into() },
+            Message::System {
+                content: "sys".into(),
+            },
+            Message::User {
+                content: "hello".into(),
+            },
         ];
         assert_eq!(extract_step_context(&messages), "");
     }
@@ -279,8 +289,12 @@ mod tests {
     #[test]
     fn test_extract_step_context_with_tool_calls() {
         let messages = vec![
-            Message::System { content: "sys".into() },
-            Message::User { content: "investigate".into() },
+            Message::System {
+                content: "sys".into(),
+            },
+            Message::User {
+                content: "investigate".into(),
+            },
             Message::Assistant {
                 content: "I'll search for data.".into(),
                 tool_calls: Some(vec![ToolCall {
@@ -319,7 +333,9 @@ mod tests {
                 content: "old step".into(),
                 tool_calls: None,
             },
-            Message::User { content: "continue".into() },
+            Message::User {
+                content: "continue".into(),
+            },
             Message::Assistant {
                 content: "new step".into(),
                 tool_calls: Some(vec![ToolCall {
@@ -342,8 +358,18 @@ mod tests {
     #[test]
     fn test_curator_tool_names_no_dangerous_tools() {
         for name in CURATOR_TOOL_NAMES {
-            assert!(!["web_search", "fetch_url", "run_shell", "run_shell_bg", "check_shell_bg", "kill_shell_bg"]
-                .contains(name), "Curator should not have access to {name}");
+            assert!(
+                ![
+                    "web_search",
+                    "fetch_url",
+                    "run_shell",
+                    "run_shell_bg",
+                    "check_shell_bg",
+                    "kill_shell_bg"
+                ]
+                .contains(name),
+                "Curator should not have access to {name}"
+            );
         }
     }
 }
diff --git a/openplanter-desktop/crates/op-core/src/engine/judge.rs b/openplanter-desktop/crates/op-core/src/engine/judge.rs
index 355000cd..0e4be82e 100644
--- a/openplanter-desktop/crates/op-core/src/engine/judge.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/judge.rs
@@ -86,13 +86,11 @@ impl Default for AcceptanceCriteriaJudge {
 /// Extract significant terms from criteria text (words >= 4 chars, excluding stop words).
 fn extract_terms(text: &str) -> Vec<&str> {
     const STOP_WORDS: &[&str] = &[
-        "the", "and", "for", "are", "but", "not", "you", "all",
-        "can", "has", "her", "was", "one", "our", "out", "with",
-        "that", "this", "have", "from", "they", "been", "said",
-        "each", "which", "their", "will", "other", "about", "many",
-        "then", "them", "these", "some", "would", "make", "like",
-        "into", "could", "time", "very", "when", "what", "your",
-        "there", "should", "must", "also",
+        "the", "and", "for", "are", "but", "not", "you", "all", "can", "has", "her", "was", "one",
+        "our", "out", "with", "that", "this", "have", "from", "they", "been", "said", "each",
+        "which", "their", "will", "other", "about", "many", "then", "them", "these", "some",
+        "would", "make", "like", "into", "could", "time", "very", "when", "what", "your", "there",
+        "should", "must", "also",
     ];
 
     text.split_whitespace()
diff --git a/openplanter-desktop/crates/op-core/src/engine/mod.rs b/openplanter-desktop/crates/op-core/src/engine/mod.rs
index cdf2847e..f19e38b1 100644
--- a/openplanter-desktop/crates/op-core/src/engine/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/mod.rs
@@ -7,6 +7,9 @@ pub mod context;
 pub mod curator;
 pub mod judge;
 
+use std::time::Duration;
+
+use anyhow::anyhow;
 use tokio::sync::mpsc;
 use tokio::task::JoinHandle;
 use tokio_util::sync::CancellationToken;
@@ -14,12 +17,12 @@ use tokio_util::sync::CancellationToken;
 use crate::builder::build_model;
 use crate::config::AgentConfig;
 use crate::events::{DeltaEvent, DeltaKind, StepEvent, TokenUsage};
-use crate::model::Message;
+use crate::model::{BaseModel, Message, ModelTurn, RateLimitError};
 use crate::prompts::build_system_prompt;
-use crate::tools::defs::build_tool_defs;
 use crate::tools::WorkspaceTools;
+use crate::tools::defs::build_tool_defs;
 
-use self::curator::{extract_step_context, run_curator, CuratorResult};
+use self::curator::{CuratorResult, extract_step_context, run_curator};
 
 /// Outcome from a background curator task (success or error).
 enum CuratorOutcome {
@@ -114,11 +117,7 @@ pub trait SolveEmitter: Send + Sync {
 // This is a placeholder until the full engine is implemented in Phase 4.
 // It emits the standard event sequence so the frontend can be developed
 // and tested against a working backend.
-pub async fn demo_solve(
-    objective: &str,
-    emitter: &dyn SolveEmitter,
-    cancel: CancellationToken,
-) {
+pub async fn demo_solve(objective: &str, emitter: &dyn SolveEmitter, cancel: CancellationToken) {
     emitter.emit_trace(&format!("Solving: {objective}"));
 
     if cancel.is_cancelled() {
@@ -176,11 +175,18 @@ fn estimate_tokens(messages: &[Message]) -> usize {
         .iter()
         .map(|m| match m {
             Message::System { content } | Message::User { content } => content.len(),
-            Message::Assistant { content, tool_calls } => {
+            Message::Assistant {
+                content,
+                tool_calls,
+            } => {
                 content.len()
                     + tool_calls
                         .as_ref()
-                        .map(|tcs| tcs.iter().map(|tc| tc.arguments.len() + tc.name.len()).sum())
+                        .map(|tcs| {
+                            tcs.iter()
+                                .map(|tc| tc.arguments.len() + tc.name.len())
+                                .sum()
+                        })
                         .unwrap_or(0)
             }
             Message::Tool { content, .. } => content.len(),
@@ -213,6 +219,75 @@ fn compact_messages(messages: &mut Vec<Message>, max_tokens: usize) {
     }
 }
 
+fn compute_rate_limit_delay_sec(
+    config: &AgentConfig,
+    retry_count: usize,
+    err: &RateLimitError,
+) -> f64 {
+    let retry_after_cap = config.rate_limit_retry_after_cap_sec.max(0.0);
+    let backoff_max = config.rate_limit_backoff_max_sec.max(0.0);
+    let delay = err
+        .retry_after_sec
+        .map(|value| value.max(0.0).min(retry_after_cap))
+        .unwrap_or_else(|| {
+            let base = config.rate_limit_backoff_base_sec.max(0.0);
+            base * 2_f64.powi((retry_count.saturating_sub(1)) as i32)
+        });
+    delay.min(backoff_max)
+}
+
+async fn chat_stream_with_rate_limit_retries(
+    model: &dyn BaseModel,
+    messages: &[Message],
+    tool_defs: &[serde_json::Value],
+    on_delta: &(dyn Fn(DeltaEvent) + Send + Sync),
+    cancel: &CancellationToken,
+    config: &AgentConfig,
+    emitter: &dyn SolveEmitter,
+    step: usize,
+) -> anyhow::Result<ModelTurn> {
+    let max_retries = config.rate_limit_max_retries.max(0) as usize;
+    let mut retries = 0usize;
+
+    loop {
+        if cancel.is_cancelled() {
+            return Err(anyhow!("Cancelled"));
+        }
+
+        match model
+            .chat_stream(messages, tool_defs, on_delta, cancel)
+            .await
+        {
+            Ok(turn) => return Ok(turn),
+            Err(err) => {
+                if let Some(rate_limit) = err.downcast_ref::<RateLimitError>() {
+                    if retries >= max_retries {
+                        return Err(err);
+                    }
+                    retries += 1;
+                    let delay_sec = compute_rate_limit_delay_sec(config, retries, rate_limit);
+                    let provider_code = rate_limit
+                        .provider_code
+                        .as_deref()
+                        .map(|code| format!(" ({code})"))
+                        .unwrap_or_default();
+                    emitter.emit_trace(&format!(
+                        "[d0/s{step}] rate limited{provider_code}. Sleeping {delay_sec:.1}s before retry {retries}/{max_retries}..."
+                    ));
+                    if delay_sec > 0.0 {
+                        tokio::select! {
+                            _ = cancel.cancelled() => return Err(anyhow!("Cancelled")),
+                            _ = tokio::time::sleep(Duration::from_secs_f64(delay_sec)) => {}
+                        }
+                    }
+                    continue;
+                }
+                return Err(err);
+            }
+        }
+    }
+}
+
 /// Real solve flow with a multi-step agentic loop.
 ///
 /// Calls the model with tool definitions. If the model returns tool calls,
@@ -240,21 +315,14 @@ pub async fn solve(
     };
 
     let provider = model.provider_name().to_string();
-    emitter.emit_trace(&format!(
-        "Solving with {}/{}",
-        provider,
-        model.model_name()
-    ));
+    emitter.emit_trace(&format!("Solving with {}/{}", provider, model.model_name()));
 
     // 2. Build tools and messages
     let tool_defs = build_tool_defs(&provider);
     let mut tools = WorkspaceTools::new(config);
 
-    let system_prompt = build_system_prompt(
-        config.recursive,
-        config.acceptance_criteria,
-        config.demo,
-    );
+    let system_prompt =
+        build_system_prompt(config.recursive, config.acceptance_criteria, config.demo);
     let mut messages = vec![
         Message::System {
             content: system_prompt,
@@ -288,9 +356,17 @@ pub async fn solve(
         compact_messages(&mut messages, 100_000);
 
         // Call model with streaming
-        let turn = match model
-            .chat_stream(&messages, &tool_defs, &|delta| emitter.emit_delta(delta), &cancel)
-            .await
+        let turn = match chat_stream_with_rate_limit_retries(
+            model.as_ref(),
+            &messages,
+            &tool_defs,
+            &|delta| emitter.emit_delta(delta),
+            &cancel,
+            config,
+            emitter,
+            step,
+        )
+        .await
         {
             Ok(t) => t,
             Err(e) => {
@@ -334,7 +410,13 @@ pub async fn solve(
             emitter.emit_complete(&turn.text);
             tools.cleanup();
             // Wait for in-flight curators before exiting
-            finish_curators(&mut curator_handles, &mut curator_rx, &mut messages, emitter).await;
+            finish_curators(
+                &mut curator_handles,
+                &mut curator_rx,
+                &mut messages,
+                emitter,
+            )
+            .await;
             return;
         }
 
@@ -351,7 +433,11 @@ pub async fn solve(
             let result = tools.execute(&tc.name, &tc.arguments).await;
 
             if result.is_error {
-                emitter.emit_trace(&format!("Tool {} error: {}", tc.name, &result.content[..result.content.len().min(200)]));
+                emitter.emit_trace(&format!(
+                    "Tool {} error: {}",
+                    tc.name,
+                    &result.content[..result.content.len().min(200)]
+                ));
             }
 
             messages.push(Message::Tool {
@@ -406,7 +492,13 @@ pub async fn solve(
 
     // Budget exhausted
     tools.cleanup();
-    finish_curators(&mut curator_handles, &mut curator_rx, &mut messages, emitter).await;
+    finish_curators(
+        &mut curator_handles,
+        &mut curator_rx,
+        &mut messages,
+        emitter,
+    )
+    .await;
     emitter.emit_error(&format!(
         "Step budget exhausted after {max_steps} steps. \
          The model did not produce a final answer within the allowed steps."
@@ -460,10 +552,7 @@ mod tests {
         }
 
         fn emit_step(&self, event: StepEvent) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(RecordedEvent::Step(event));
+            self.events.lock().unwrap().push(RecordedEvent::Step(event));
         }
 
         fn emit_complete(&self, result: &str) {
@@ -489,7 +578,11 @@ mod tests {
         demo_solve("Test objective", &emitter, token).await;
 
         let events = emitter.events();
-        assert!(events.len() >= 4, "expected at least 4 events, got {}", events.len());
+        assert!(
+            events.len() >= 4,
+            "expected at least 4 events, got {}",
+            events.len()
+        );
 
         // First event: trace
         assert!(matches!(&events[0], RecordedEvent::Trace(_)));
@@ -531,8 +624,13 @@ mod tests {
             .any(|e| matches!(e, RecordedEvent::Error(m) if m == "Cancelled"));
         assert!(has_error, "expected a Cancelled error event");
 
-        let has_complete = events.iter().any(|e| matches!(e, RecordedEvent::Complete(_)));
-        assert!(!has_complete, "should not have a Complete event when cancelled");
+        let has_complete = events
+            .iter()
+            .any(|e| matches!(e, RecordedEvent::Complete(_)));
+        assert!(
+            !has_complete,
+            "should not have a Complete event when cancelled"
+        );
     }
 
     #[tokio::test]
@@ -607,7 +705,10 @@ mod tests {
         let has_error = recorded
             .iter()
             .any(|e| matches!(e, RecordedEvent::Error(m) if m == "Cancelled"));
-        assert!(has_error, "expected Cancelled error after mid-flight cancel");
+        assert!(
+            has_error,
+            "expected Cancelled error after mid-flight cancel"
+        );
 
         // Should NOT have a Complete event
         let has_complete = recorded
@@ -661,9 +762,16 @@ mod tests {
     #[test]
     fn test_estimate_tokens() {
         let messages = vec![
-            Message::System { content: "System prompt".into() }, // 13 chars
-            Message::User { content: "Hello".into() },          // 5 chars
-            Message::Tool { tool_call_id: "t1".into(), content: "x".repeat(4000) },
+            Message::System {
+                content: "System prompt".into(),
+            }, // 13 chars
+            Message::User {
+                content: "Hello".into(),
+            }, // 5 chars
+            Message::Tool {
+                tool_call_id: "t1".into(),
+                content: "x".repeat(4000),
+            },
         ];
         let tokens = estimate_tokens(&messages);
         // (13 + 5 + 4000) / 4 = 1004
@@ -673,9 +781,16 @@ mod tests {
     #[test]
     fn test_compact_messages_no_op_when_under_limit() {
         let mut messages = vec![
-            Message::System { content: "System".into() },
-            Message::User { content: "Hello".into() },
-            Message::Tool { tool_call_id: "t1".into(), content: "Short result".into() },
+            Message::System {
+                content: "System".into(),
+            },
+            Message::User {
+                content: "Hello".into(),
+            },
+            Message::Tool {
+                tool_call_id: "t1".into(),
+                content: "Short result".into(),
+            },
         ];
         compact_messages(&mut messages, 100_000);
         // Should be unchanged
@@ -688,14 +803,24 @@ mod tests {
     fn test_compact_messages_truncates_old_tool_results() {
         let big_result = "x".repeat(8000);
         let mut messages = vec![
-            Message::System { content: "System".into() },
-            Message::User { content: "Hello".into() },
+            Message::System {
+                content: "System".into(),
+            },
+            Message::User {
+                content: "Hello".into(),
+            },
         ];
 
         // Add 15 old steps (assistant + tool pairs) to exceed keep_recent
         for i in 0..15 {
-            messages.push(Message::Assistant { content: format!("step{i}"), tool_calls: None });
-            messages.push(Message::Tool { tool_call_id: format!("t{i}"), content: big_result.clone() });
+            messages.push(Message::Assistant {
+                content: format!("step{i}"),
+                tool_calls: None,
+            });
+            messages.push(Message::Tool {
+                tool_call_id: format!("t{i}"),
+                content: big_result.clone(),
+            });
         }
 
         // Total: ~(6 + 5 + 15*(5+8000)) / 4 ≈ 30_000 tokens
@@ -704,12 +829,20 @@ mod tests {
 
         // Old tool result (index 3, early in the list) should be truncated
         if let Message::Tool { content, .. } = &messages[3] {
-            assert!(content.len() < 300, "old tool result should be truncated, got {} chars", content.len());
+            assert!(
+                content.len() < 300,
+                "old tool result should be truncated, got {} chars",
+                content.len()
+            );
             assert!(content.contains("truncated"));
         }
 
         // Recent tool result (last one) should be intact
-        let last_tool = messages.iter().rev().find(|m| matches!(m, Message::Tool { .. })).unwrap();
+        let last_tool = messages
+            .iter()
+            .rev()
+            .find(|m| matches!(m, Message::Tool { .. }))
+            .unwrap();
         if let Message::Tool { content, .. } = last_tool {
             assert_eq!(content.len(), 8000, "recent tool result should be intact");
         }
diff --git a/openplanter-desktop/crates/op-core/src/events.rs b/openplanter-desktop/crates/op-core/src/events.rs
index 70a648a1..156cfce4 100644
--- a/openplanter-desktop/crates/op-core/src/events.rs
+++ b/openplanter-desktop/crates/op-core/src/events.rs
@@ -120,6 +120,8 @@ pub struct ConfigView {
     pub provider: String,
     pub model: String,
     pub reasoning_effort: Option<String>,
+    pub zai_plan: String,
+    pub web_search_provider: String,
     pub workspace: String,
     pub session_id: Option<String>,
     pub recursive: bool,
@@ -134,6 +136,8 @@ pub struct PartialConfig {
     pub provider: Option<String>,
     pub model: Option<String>,
     pub reasoning_effort: Option<String>,
+    pub zai_plan: Option<String>,
+    pub web_search_provider: Option<String>,
 }
 
 /// Model information for the model list.
diff --git a/openplanter-desktop/crates/op-core/src/lib.rs b/openplanter-desktop/crates/op-core/src/lib.rs
index 05b9c49a..62efa5cf 100644
--- a/openplanter-desktop/crates/op-core/src/lib.rs
+++ b/openplanter-desktop/crates/op-core/src/lib.rs
@@ -1,11 +1,11 @@
+pub mod builder;
 pub mod config;
-pub mod prompts;
 pub mod credentials;
-pub mod settings;
-pub mod builder;
+pub mod engine;
 pub mod events;
 pub mod model;
-pub mod engine;
-pub mod tools;
+pub mod prompts;
 pub mod session;
+pub mod settings;
+pub mod tools;
 pub mod wiki;
diff --git a/openplanter-desktop/crates/op-core/src/model/anthropic.rs b/openplanter-desktop/crates/op-core/src/model/anthropic.rs
index a0705724..e760120a 100644
--- a/openplanter-desktop/crates/op-core/src/model/anthropic.rs
+++ b/openplanter-desktop/crates/op-core/src/model/anthropic.rs
@@ -2,12 +2,13 @@
 //
 // Uses the Anthropic Messages API with SSE streaming.
 
-use anyhow::{anyhow, Context};
+use anyhow::{Context, anyhow};
 use reqwest_eventsource::{Event, RequestBuilderExt};
 use tokio_util::sync::CancellationToken;
 
-use crate::events::{DeltaEvent, DeltaKind};
 use super::{BaseModel, Message, ModelTurn, ToolCall};
+use crate::config::strip_foundry_model_prefix;
+use crate::events::{DeltaEvent, DeltaKind};
 
 pub struct AnthropicModel {
     client: reqwest::Client,
@@ -36,10 +37,14 @@ impl AnthropicModel {
     }
 
     fn is_opus_46(&self) -> bool {
-        let lower = self.model.to_lowercase();
+        let lower = self.request_model_name().to_lowercase();
         lower.contains("opus-4-6") || lower.contains("opus-4.6")
     }
 
+    fn request_model_name(&self) -> String {
+        strip_foundry_model_prefix(&self.model)
+    }
+
     /// Extract the system prompt from messages (Anthropic uses a top-level `system` field).
     fn extract_system(messages: &[Message]) -> Option<String> {
         for msg in messages {
@@ -67,7 +72,10 @@ impl AnthropicModel {
                         "content": content,
                     }));
                 }
-                Message::Assistant { content, tool_calls } => {
+                Message::Assistant {
+                    content,
+                    tool_calls,
+                } => {
                     let mut blocks: Vec<serde_json::Value> = Vec::new();
                     if !content.is_empty() {
                         blocks.push(serde_json::json!({
@@ -77,8 +85,8 @@ impl AnthropicModel {
                     }
                     if let Some(tcs) = tool_calls {
                         for tc in tcs {
-                            let input: serde_json::Value =
-                                serde_json::from_str(&tc.arguments).unwrap_or(serde_json::json!({}));
+                            let input: serde_json::Value = serde_json::from_str(&tc.arguments)
+                                .unwrap_or(serde_json::json!({}));
                             blocks.push(serde_json::json!({
                                 "type": "tool_use",
                                 "id": tc.id,
@@ -92,7 +100,10 @@ impl AnthropicModel {
                         "content": blocks,
                     }));
                 }
-                Message::Tool { tool_call_id, content } => {
+                Message::Tool {
+                    tool_call_id,
+                    content,
+                } => {
                     let block = serde_json::json!({
                         "type": "tool_result",
                         "tool_use_id": tool_call_id,
@@ -101,8 +112,12 @@ impl AnthropicModel {
                     // Merge into previous user message if it contains tool_result blocks
                     if let Some(last) = result.last_mut() {
                         if last.get("role").and_then(|r| r.as_str()) == Some("user") {
-                            if let Some(arr) = last.get_mut("content").and_then(|c| c.as_array_mut()) {
-                                if arr.iter().any(|b| b.get("type").and_then(|t| t.as_str()) == Some("tool_result")) {
+                            if let Some(arr) =
+                                last.get_mut("content").and_then(|c| c.as_array_mut())
+                            {
+                                if arr.iter().any(|b| {
+                                    b.get("type").and_then(|t| t.as_str()) == Some("tool_result")
+                                }) {
                                     arr.push(block);
                                     continue;
                                 }
@@ -133,7 +148,7 @@ impl AnthropicModel {
         let use_thinking = matches!(effort.as_str(), "low" | "medium" | "high");
 
         let mut payload = serde_json::json!({
-            "model": self.model,
+            "model": self.request_model_name(),
             "max_tokens": self.max_tokens,
             "messages": Self::convert_messages(messages),
             "stream": true,
@@ -220,7 +235,8 @@ impl BaseModel for AnthropicModel {
             tool_name: String,
             input_json: String,
         }
-        let mut blocks: std::collections::HashMap<u64, BlockState> = std::collections::HashMap::new();
+        let mut blocks: std::collections::HashMap<u64, BlockState> =
+            std::collections::HashMap::new();
         let mut tool_calls: Vec<ToolCall> = Vec::new();
 
         use futures::StreamExt;
@@ -271,7 +287,8 @@ impl BaseModel for AnthropicModel {
                     match msg_type {
                         "message_start" => {
                             if let Some(usage) = data.pointer("/message/usage") {
-                                if let Some(it) = usage.get("input_tokens").and_then(|v| v.as_u64()) {
+                                if let Some(it) = usage.get("input_tokens").and_then(|v| v.as_u64())
+                                {
                                     input_tokens = it;
                                 }
                             }
@@ -279,13 +296,24 @@ impl BaseModel for AnthropicModel {
 
                         "content_block_start" => {
                             let idx = data.get("index").and_then(|i| i.as_u64()).unwrap_or(0);
-                            let block = data.get("content_block").unwrap_or(&serde_json::Value::Null);
-                            let btype = block.get("type").and_then(|t| t.as_str()).unwrap_or("text");
+                            let block = data
+                                .get("content_block")
+                                .unwrap_or(&serde_json::Value::Null);
+                            let btype =
+                                block.get("type").and_then(|t| t.as_str()).unwrap_or("text");
 
                             let state = match btype {
                                 "tool_use" => {
-                                    let name = block.get("name").and_then(|n| n.as_str()).unwrap_or("").to_string();
-                                    let id = block.get("id").and_then(|i| i.as_str()).unwrap_or("").to_string();
+                                    let name = block
+                                        .get("name")
+                                        .and_then(|n| n.as_str())
+                                        .unwrap_or("")
+                                        .to_string();
+                                    let id = block
+                                        .get("id")
+                                        .and_then(|i| i.as_str())
+                                        .unwrap_or("")
+                                        .to_string();
                                     if !name.is_empty() {
                                         on_delta(DeltaEvent {
                                             kind: DeltaKind::ToolCallStart,
@@ -321,7 +349,8 @@ impl BaseModel for AnthropicModel {
                                 Some(d) => d,
                                 None => continue,
                             };
-                            let delta_type = delta.get("type").and_then(|t| t.as_str()).unwrap_or("");
+                            let delta_type =
+                                delta.get("type").and_then(|t| t.as_str()).unwrap_or("");
 
                             match delta_type {
                                 "text_delta" => {
@@ -336,7 +365,8 @@ impl BaseModel for AnthropicModel {
                                     }
                                 }
                                 "thinking_delta" => {
-                                    if let Some(t) = delta.get("thinking").and_then(|t| t.as_str()) {
+                                    if let Some(t) = delta.get("thinking").and_then(|t| t.as_str())
+                                    {
                                         if !t.is_empty() {
                                             thinking.push_str(t);
                                             on_delta(DeltaEvent {
@@ -347,7 +377,9 @@ impl BaseModel for AnthropicModel {
                                     }
                                 }
                                 "input_json_delta" => {
-                                    if let Some(chunk) = delta.get("partial_json").and_then(|j| j.as_str()) {
+                                    if let Some(chunk) =
+                                        delta.get("partial_json").and_then(|j| j.as_str())
+                                    {
                                         if !chunk.is_empty() {
                                             if let Some(block) = blocks.get_mut(&idx) {
                                                 block.input_json.push_str(chunk);
@@ -378,7 +410,9 @@ impl BaseModel for AnthropicModel {
 
                         "message_delta" => {
                             if let Some(usage) = data.get("usage") {
-                                if let Some(ot) = usage.get("output_tokens").and_then(|v| v.as_u64()) {
+                                if let Some(ot) =
+                                    usage.get("output_tokens").and_then(|v| v.as_u64())
+                                {
                                     output_tokens = ot;
                                 }
                             }
@@ -401,7 +435,11 @@ impl BaseModel for AnthropicModel {
 
         Ok(ModelTurn {
             text,
-            thinking: if thinking.is_empty() { None } else { Some(thinking) },
+            thinking: if thinking.is_empty() {
+                None
+            } else {
+                Some(thinking)
+            },
             tool_calls,
             input_tokens,
             output_tokens,
@@ -436,6 +474,7 @@ mod tests {
     fn test_is_opus_46() {
         assert!(make_model("claude-opus-4-6", None).is_opus_46());
         assert!(make_model("claude-opus-4.6-20250610", None).is_opus_46());
+        assert!(make_model("anthropic-foundry/claude-opus-4-6", None).is_opus_46());
         assert!(!make_model("claude-sonnet-4-5", None).is_opus_46());
     }
 
@@ -444,15 +483,24 @@ mod tests {
     #[test]
     fn test_extract_system_present() {
         let msgs = vec![
-            Message::System { content: "Be helpful.".to_string() },
-            Message::User { content: "Hi".to_string() },
+            Message::System {
+                content: "Be helpful.".to_string(),
+            },
+            Message::User {
+                content: "Hi".to_string(),
+            },
         ];
-        assert_eq!(AnthropicModel::extract_system(&msgs), Some("Be helpful.".to_string()));
+        assert_eq!(
+            AnthropicModel::extract_system(&msgs),
+            Some("Be helpful.".to_string())
+        );
     }
 
     #[test]
     fn test_extract_system_absent() {
-        let msgs = vec![Message::User { content: "Hi".to_string() }];
+        let msgs = vec![Message::User {
+            content: "Hi".to_string(),
+        }];
         assert_eq!(AnthropicModel::extract_system(&msgs), None);
     }
 
@@ -461,8 +509,12 @@ mod tests {
     #[test]
     fn test_convert_filters_system() {
         let msgs = vec![
-            Message::System { content: "System prompt".to_string() },
-            Message::User { content: "Hello".to_string() },
+            Message::System {
+                content: "System prompt".to_string(),
+            },
+            Message::User {
+                content: "Hello".to_string(),
+            },
         ];
         let converted = AnthropicModel::convert_messages(&msgs);
         assert_eq!(converted.len(), 1); // System is filtered out
@@ -508,18 +560,40 @@ mod tests {
             Message::Assistant {
                 content: "Using tools.".to_string(),
                 tool_calls: Some(vec![
-                    ToolCall { id: "t1".into(), name: "read_file".into(), arguments: "{}".into() },
-                    ToolCall { id: "t2".into(), name: "list_files".into(), arguments: "{}".into() },
+                    ToolCall {
+                        id: "t1".into(),
+                        name: "read_file".into(),
+                        arguments: "{}".into(),
+                    },
+                    ToolCall {
+                        id: "t2".into(),
+                        name: "list_files".into(),
+                        arguments: "{}".into(),
+                    },
                 ]),
             },
-            Message::Tool { tool_call_id: "t1".into(), content: "file1 contents".into() },
-            Message::Tool { tool_call_id: "t2".into(), content: "file list".into() },
+            Message::Tool {
+                tool_call_id: "t1".into(),
+                content: "file1 contents".into(),
+            },
+            Message::Tool {
+                tool_call_id: "t2".into(),
+                content: "file list".into(),
+            },
         ];
         let converted = AnthropicModel::convert_messages(&msgs);
         // Should be 2 messages: assistant + one merged user
-        assert_eq!(converted.len(), 2, "consecutive Tool messages should merge into one user message");
+        assert_eq!(
+            converted.len(),
+            2,
+            "consecutive Tool messages should merge into one user message"
+        );
         let user_content = converted[1]["content"].as_array().unwrap();
-        assert_eq!(user_content.len(), 2, "merged user message should have 2 tool_result blocks");
+        assert_eq!(
+            user_content.len(),
+            2,
+            "merged user message should have 2 tool_result blocks"
+        );
         assert_eq!(user_content[0]["tool_use_id"], "t1");
         assert_eq!(user_content[1]["tool_use_id"], "t2");
     }
@@ -530,8 +604,12 @@ mod tests {
     fn test_payload_no_thinking_has_temperature() {
         let model = make_model("claude-sonnet-4-5", None);
         let msgs = vec![
-            Message::System { content: "System".to_string() },
-            Message::User { content: "Hi".to_string() },
+            Message::System {
+                content: "System".to_string(),
+            },
+            Message::User {
+                content: "Hi".to_string(),
+            },
         ];
         let payload = model.build_payload(&msgs, &[]);
         assert_eq!(payload["temperature"], 0.0);
@@ -543,17 +621,31 @@ mod tests {
     #[test]
     fn test_payload_opus_46_adaptive_thinking() {
         let model = make_model("claude-opus-4-6", Some("high"));
-        let msgs = vec![Message::User { content: "Hi".to_string() }];
+        let msgs = vec![Message::User {
+            content: "Hi".to_string(),
+        }];
         let payload = model.build_payload(&msgs, &[]);
         assert!(payload.get("temperature").is_none()); // No temperature with thinking
         assert_eq!(payload["thinking"]["type"], "adaptive");
         assert_eq!(payload["output_config"]["effort"], "high");
     }
 
+    #[test]
+    fn test_payload_strips_foundry_prefix() {
+        let model = make_model("anthropic-foundry/claude-opus-4-6", Some("high"));
+        let msgs = vec![Message::User {
+            content: "Hi".to_string(),
+        }];
+        let payload = model.build_payload(&msgs, &[]);
+        assert_eq!(payload["model"], "claude-opus-4-6");
+    }
+
     #[test]
     fn test_payload_older_model_enabled_thinking() {
         let model = make_model("claude-sonnet-4-5", Some("medium"));
-        let msgs = vec![Message::User { content: "Hi".to_string() }];
+        let msgs = vec![Message::User {
+            content: "Hi".to_string(),
+        }];
         let payload = model.build_payload(&msgs, &[]);
         assert_eq!(payload["thinking"]["type"], "enabled");
         assert_eq!(payload["thinking"]["budget_tokens"], 4096);
@@ -563,8 +655,12 @@ mod tests {
     fn test_payload_system_extracted_to_top_level() {
         let model = make_model("claude-sonnet-4-5", None);
         let msgs = vec![
-            Message::System { content: "You are helpful.".to_string() },
-            Message::User { content: "Test".to_string() },
+            Message::System {
+                content: "You are helpful.".to_string(),
+            },
+            Message::User {
+                content: "Test".to_string(),
+            },
         ];
         let payload = model.build_payload(&msgs, &[]);
         // System should be top-level, not in messages array
diff --git a/openplanter-desktop/crates/op-core/src/model/mod.rs b/openplanter-desktop/crates/op-core/src/model/mod.rs
index 4f2781ec..2ec516ce 100644
--- a/openplanter-desktop/crates/op-core/src/model/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/model/mod.rs
@@ -1,6 +1,6 @@
+pub mod anthropic;
 /// Model abstraction layer — trait + provider implementations.
 pub mod openai;
-pub mod anthropic;
 pub mod sse;
 
 use serde::{Deserialize, Serialize};
@@ -8,6 +8,17 @@ use serde::{Deserialize, Serialize};
 use crate::events::DeltaEvent;
 use tokio_util::sync::CancellationToken;
 
+/// Structured model error for provider rate limiting.
+#[derive(Debug, Clone, thiserror::Error)]
+#[error("{message}")]
+pub struct RateLimitError {
+    pub message: String,
+    pub status_code: Option<u16>,
+    pub provider_code: Option<String>,
+    pub body: String,
+    pub retry_after_sec: Option<f64>,
+}
+
 /// A single tool call returned by the model.
 #[derive(Debug, Clone, Serialize, Deserialize)]
 pub struct ToolCall {
@@ -35,16 +46,26 @@ pub enum Message {
     #[serde(rename = "user")]
     User { content: String },
     #[serde(rename = "assistant")]
-    Assistant { content: String, tool_calls: Option<Vec<ToolCall>> },
+    Assistant {
+        content: String,
+        tool_calls: Option<Vec<ToolCall>>,
+    },
     #[serde(rename = "tool")]
-    Tool { tool_call_id: String, content: String },
+    Tool {
+        tool_call_id: String,
+        content: String,
+    },
 }
 
 /// Trait for LLM model implementations.
 #[async_trait::async_trait]
 pub trait BaseModel: Send + Sync {
     /// Send a conversation and return the model's turn.
-    async fn chat(&self, messages: &[Message], tools: &[serde_json::Value]) -> anyhow::Result<ModelTurn>;
+    async fn chat(
+        &self,
+        messages: &[Message],
+        tools: &[serde_json::Value],
+    ) -> anyhow::Result<ModelTurn>;
 
     /// Send a conversation with streaming deltas and cancellation support.
     async fn chat_stream(
diff --git a/openplanter-desktop/crates/op-core/src/model/openai.rs b/openplanter-desktop/crates/op-core/src/model/openai.rs
index 4b1353f6..b3fb5ad4 100644
--- a/openplanter-desktop/crates/op-core/src/model/openai.rs
+++ b/openplanter-desktop/crates/op-core/src/model/openai.rs
@@ -1,15 +1,32 @@
 // OpenAI-compatible model implementation.
 //
-// Handles openai, openrouter, cerebras, and ollama — all use /chat/completions.
+// Handles openai, openrouter, cerebras, zai, and ollama via /chat/completions.
 
 use std::collections::HashMap;
+use std::sync::{Arc, RwLock};
+use std::time::Duration;
 
-use anyhow::{anyhow, Context};
+use anyhow::{Context, anyhow};
+use chrono::{DateTime, Utc};
 use reqwest_eventsource::{Event, RequestBuilderExt};
+use tokio::time::sleep;
 use tokio_util::sync::CancellationToken;
 
+use super::{BaseModel, Message, ModelTurn, RateLimitError, ToolCall};
+use crate::config::strip_foundry_model_prefix;
 use crate::events::{DeltaEvent, DeltaKind};
-use super::{BaseModel, Message, ModelTurn, ToolCall};
+
+#[derive(Debug, Clone, Default)]
+pub struct ZaiRuntimeConfig {
+    pub paygo_base_url: String,
+    pub coding_base_url: String,
+    pub stream_max_retries: usize,
+}
+
+struct StreamAttemptError {
+    error: anyhow::Error,
+    saw_output: bool,
+}
 
 pub struct OpenAIModel {
     client: reqwest::Client,
@@ -19,6 +36,10 @@ pub struct OpenAIModel {
     api_key: String,
     reasoning_effort: Option<String>,
     extra_headers: HashMap<String, String>,
+    thinking_type: Option<String>,
+    stream_max_retries: usize,
+    fallback_base_urls: Vec<String>,
+    active_base_url: Arc<RwLock<String>>,
 }
 
 impl OpenAIModel {
@@ -34,18 +55,53 @@ impl OpenAIModel {
             client: reqwest::Client::new(),
             model,
             provider,
-            base_url,
+            base_url: base_url.clone(),
             api_key,
             reasoning_effort,
             extra_headers,
+            thinking_type: None,
+            stream_max_retries: 1,
+            fallback_base_urls: Vec::new(),
+            active_base_url: Arc::new(RwLock::new(base_url)),
         }
     }
 
+    pub fn with_zai_runtime(mut self, config: ZaiRuntimeConfig) -> Self {
+        let effort = self
+            .reasoning_effort
+            .as_deref()
+            .unwrap_or_default()
+            .trim()
+            .to_lowercase();
+        self.thinking_type = Some(if effort.is_empty() || effort == "none" {
+            "disabled".to_string()
+        } else {
+            "enabled".to_string()
+        });
+        self.stream_max_retries = config.stream_max_retries.max(1);
+
+        let mut fallbacks = Vec::new();
+        for candidate in [config.paygo_base_url, config.coding_base_url] {
+            let trimmed = candidate.trim();
+            if trimmed.is_empty() {
+                continue;
+            }
+            if !fallbacks.iter().any(|url| url == trimmed) {
+                fallbacks.push(trimmed.to_string());
+            }
+        }
+        self.fallback_base_urls = fallbacks;
+        self
+    }
+
     fn is_reasoning_model(&self) -> bool {
-        let lower = self.model.to_lowercase();
-        if lower.starts_with("o1-") || lower == "o1"
-            || lower.starts_with("o3-") || lower == "o3"
-            || lower.starts_with("o4-") || lower == "o4"
+        let lower = self.request_model_name().to_lowercase();
+        if lower.starts_with("o1-")
+            || lower == "o1"
+            || lower.starts_with("o3-")
+            || lower == "o3"
+            || lower.starts_with("o4-")
+            || lower == "o4"
         {
             return true;
         }
@@ -55,6 +111,10 @@ impl OpenAIModel {
         false
     }
 
+    fn request_model_name(&self) -> String {
+        strip_foundry_model_prefix(&self.model)
+    }
+
     fn convert_messages(messages: &[Message]) -> Vec<serde_json::Value> {
         messages
             .iter()
@@ -67,7 +127,10 @@ impl OpenAIModel {
                     "role": "user",
                     "content": content,
                 }),
-                Message::Assistant { content, tool_calls } => {
+                Message::Assistant {
+                    content,
+                    tool_calls,
+                } => {
                     let mut obj = serde_json::json!({
                         "role": "assistant",
                         "content": content,
@@ -75,20 +138,25 @@ impl OpenAIModel {
                     if let Some(tcs) = tool_calls {
                         let tc_arr: Vec<serde_json::Value> = tcs
                             .iter()
-                            .map(|tc| serde_json::json!({
-                                "id": tc.id,
-                                "type": "function",
-                                "function": {
-                                    "name": tc.name,
-                                    "arguments": tc.arguments,
-                                }
-                            }))
+                            .map(|tc| {
+                                serde_json::json!({
+                                    "id": tc.id,
+                                    "type": "function",
+                                    "function": {
+                                        "name": tc.name,
+                                        "arguments": tc.arguments,
+                                    }
+                                })
+                            })
                             .collect();
                         obj["tool_calls"] = serde_json::Value::Array(tc_arr);
                     }
                     obj
                 }
-                Message::Tool { tool_call_id, content } => serde_json::json!({
+                Message::Tool {
+                    tool_call_id,
+                    content,
+                } => serde_json::json!({
                     "role": "tool",
                     "tool_call_id": tool_call_id,
                     "content": content,
@@ -104,13 +172,13 @@ impl OpenAIModel {
         stream: bool,
     ) -> serde_json::Value {
         let mut payload = serde_json::json!({
-            "model": self.model,
+            "model": self.request_model_name(),
             "messages": Self::convert_messages(messages),
         });
 
         if stream {
             payload["stream"] = serde_json::json!(true);
-            payload["stream_options"] = serde_json::json!({"include_usage": true});
+            payload["stream_options"] = serde_json::json!({ "include_usage": true });
         }
 
         if !tools.is_empty() {
@@ -129,36 +197,20 @@ impl OpenAIModel {
             }
         }
 
-        payload
-    }
-}
+        if let Some(ref thinking_type) = self.thinking_type {
+            let value = thinking_type.trim().to_lowercase();
+            if matches!(value.as_str(), "enabled" | "disabled") {
+                payload["thinking"] = serde_json::json!({ "type": value });
+            }
+        }
 
-#[async_trait::async_trait]
-impl BaseModel for OpenAIModel {
-    async fn chat(
-        &self,
-        messages: &[Message],
-        tools: &[serde_json::Value],
-    ) -> anyhow::Result<ModelTurn> {
-        // Default: call chat_stream with a no-op callback
-        let noop = |_: DeltaEvent| {};
-        let cancel = CancellationToken::new();
-        self.chat_stream(messages, tools, &noop, &cancel).await
+        payload
     }
 
-    async fn chat_stream(
-        &self,
-        messages: &[Message],
-        tools: &[serde_json::Value],
-        on_delta: &(dyn Fn(DeltaEvent) + Send + Sync),
-        cancel: &CancellationToken,
-    ) -> anyhow::Result<ModelTurn> {
-        let url = format!("{}/chat/completions", self.base_url.trim_end_matches('/'));
-        let payload = self.build_payload(messages, tools, true);
-
+    fn build_request(&self, url: &str, payload: &serde_json::Value) -> reqwest::RequestBuilder {
         let mut request = self
             .client
-            .post(&url)
+            .post(url)
             .header("Authorization", format!("Bearer {}", self.api_key))
             .header("Content-Type", "application/json");
 
@@ -166,24 +218,301 @@ impl BaseModel for OpenAIModel {
             request = request.header(k.as_str(), v.as_str());
         }
 
-        let mut es = request.json(&payload).eventsource()?;
+        request.json(payload)
+    }
+
+    fn current_base_url(&self) -> String {
+        self.active_base_url
+            .read()
+            .map(|value| value.clone())
+            .unwrap_or_else(|_| self.base_url.clone())
+    }
+
+    fn set_active_base_url(&self, base_url: &str) {
+        if let Ok(mut guard) = self.active_base_url.write() {
+            *guard = base_url.to_string();
+        }
+    }
+
+    fn candidate_base_urls(&self) -> Vec<String> {
+        let mut urls = Vec::new();
+        let current = self.current_base_url();
+        urls.push(current);
+        for candidate in &self.fallback_base_urls {
+            if !urls.iter().any(|url| url == candidate) {
+                urls.push(candidate.clone());
+            }
+        }
+        urls
+    }
+
+    fn should_try_next_zai_base_url(&self, err: &anyhow::Error) -> bool {
+        if self.provider != "zai" {
+            return false;
+        }
+        let text = err.to_string().to_lowercase();
+        text.contains("404") || text.contains("405") || text.contains("not found")
+    }
+
+    fn should_retry_zai_error(&self, err: &StreamAttemptError) -> bool {
+        if self.provider != "zai" || err.saw_output {
+            return false;
+        }
+        if err.error.downcast_ref::<RateLimitError>().is_some() {
+            return true;
+        }
+        let text = err.error.to_string().to_lowercase();
+        text.contains("429")
+            || text.contains("1302")
+            || text.contains("rate limit")
+            || text.contains("too many requests")
+            || text.contains("connection")
+            || text.contains("timed out")
+            || text.contains("timeout")
+            || text.contains("stream ended")
+            || text.contains("broken pipe")
+            || text.contains("500")
+            || text.contains("502")
+            || text.contains("503")
+            || text.contains("504")
+    }
+
+    fn parse_retry_after_value(value: Option<&serde_json::Value>) -> Option<f64> {
+        match value {
+            Some(serde_json::Value::Number(num)) => num.as_f64().map(|v| v.max(0.0)),
+            Some(serde_json::Value::String(text)) => Self::parse_retry_after_text(text),
+            _ => None,
+        }
+    }
+
+    fn parse_retry_after_text(text: &str) -> Option<f64> {
+        let trimmed = text.trim();
+        if trimmed.is_empty() {
+            return None;
+        }
+        if let Ok(seconds) = trimmed.parse::<f64>() {
+            return Some(seconds.max(0.0));
+        }
+        let parsed = DateTime::parse_from_rfc2822(trimmed).ok()?;
+        Some(
+            (parsed.with_timezone(&Utc) - Utc::now())
+                .num_milliseconds()
+                .max(0) as f64
+                / 1000.0,
+        )
+    }
+
+    fn parse_retry_after_header(headers: &reqwest::header::HeaderMap) -> Option<f64> {
+        let value = headers.get(reqwest::header::RETRY_AFTER)?;
+        let text = value.to_str().ok()?;
+        Self::parse_retry_after_text(text)
+    }
+
+    fn extract_provider_code(value: Option<&serde_json::Value>) -> Option<String> {
+        match value {
+            Some(serde_json::Value::String(text)) => {
+                let trimmed = text.trim();
+                (!trimmed.is_empty()).then(|| trimmed.to_string())
+            }
+            Some(serde_json::Value::Number(num)) => Some(num.to_string()),
+            Some(other) => {
+                let rendered = other.to_string();
+                let trimmed = rendered.trim();
+                (!trimmed.is_empty()).then(|| trimmed.to_string())
+            }
+            None => None,
+        }
+    }
+
+    fn extract_openai_style_error(
+        payload: &serde_json::Value,
+    ) -> (String, Option<String>, Option<f64>) {
+        if let Some(error) = payload.get("error").and_then(|value| value.as_object()) {
+            let message = error
+                .get("message")
+                .and_then(|value| value.as_str())
+                .unwrap_or_default()
+                .trim()
+                .to_string();
+            let provider_code = Self::extract_provider_code(error.get("code"));
+            let retry_after = Self::parse_retry_after_value(error.get("retry_after"))
+                .or_else(|| Self::parse_retry_after_value(payload.get("retry_after")));
+            return (message, provider_code, retry_after);
+        }
+        (
+            String::new(),
+            None,
+            Self::parse_retry_after_value(payload.get("retry_after")),
+        )
+    }
+
+    fn is_rate_limit_error(
+        status_code: Option<u16>,
+        provider_code: Option<&str>,
+        message: &str,
+    ) -> bool {
+        if status_code == Some(429) {
+            return true;
+        }
+        if let Some(code) = provider_code {
+            let code = code.trim().to_lowercase();
+            if matches!(
+                code.as_str(),
+                "1302" | "429" | "rate_limit" | "rate_limit_exceeded" | "too_many_requests"
+            ) {
+                return true;
+            }
+        }
+        let text = message.to_lowercase();
+        text.contains("rate limit") || text.contains("too many requests")
+    }
+
+    fn classify_stream_payload_error(payload: &serde_json::Value) -> Option<anyhow::Error> {
+        let is_error_type = payload
+            .get("type")
+            .and_then(|value| value.as_str())
+            .is_some_and(|value| value == "error");
+        let error = payload.get("error")?;
+        let message = error
+            .get("message")
+            .and_then(|value| value.as_str())
+            .map(str::trim)
+            .filter(|value| !value.is_empty())
+            .map(str::to_string)
+            .unwrap_or_else(|| payload.to_string());
+        let provider_code = Self::extract_provider_code(error.get("code"));
+        let retry_after = Self::parse_retry_after_value(error.get("retry_after"));
+        let prefixed_message = format!("Stream error: {message}");
+
+        if Self::is_rate_limit_error(None, provider_code.as_deref(), &message) {
+            return Some(anyhow::Error::new(RateLimitError {
+                message: prefixed_message,
+                status_code: None,
+                provider_code,
+                body: payload.to_string(),
+                retry_after_sec: retry_after,
+            }));
+        }
+
+        if is_error_type || provider_code.is_some() || payload.get("retry_after").is_some() {
+            return Some(anyhow!(prefixed_message));
+        }
+
+        None
+    }
+
+    async fn classify_sse_error(
+        &self,
+        url: &str,
+        error: reqwest_eventsource::Error,
+    ) -> anyhow::Error {
+        match error {
+            reqwest_eventsource::Error::InvalidStatusCode(status, response) => {
+                self.classify_invalid_status(url, status, response).await
+            }
+            other => anyhow!("SSE stream error: {other}"),
+        }
+    }
+
+    async fn classify_invalid_status(
+        &self,
+        url: &str,
+        status: reqwest::StatusCode,
+        response: reqwest::Response,
+    ) -> anyhow::Error {
+        let response_url = response.url().clone();
+        let headers = response.headers().clone();
+        let body = response.text().await.unwrap_or_default();
+        let parsed = serde_json::from_str::<serde_json::Value>(&body).ok();
+        let mut message = String::new();
+        let mut provider_code = None;
+        let mut retry_after = Self::parse_retry_after_header(&headers);
+
+        if let Some(ref payload) = parsed {
+            let (body_message, body_code, body_retry_after) =
+                Self::extract_openai_style_error(payload);
+            message = body_message;
+            provider_code = body_code;
+            if retry_after.is_none() {
+                retry_after = body_retry_after;
+            }
+        }
+
+        let detail = if !message.is_empty() {
+            message.clone()
+        } else if !body.trim().is_empty() {
+            body.clone()
+        } else {
+            status.to_string()
+        };
+
+        if Self::is_rate_limit_error(Some(status.as_u16()), provider_code.as_deref(), &detail) {
+            return anyhow::Error::new(RateLimitError {
+                message: format!(
+                    "HTTP {} calling {}: {}",
+                    status.as_u16(),
+                    response_url,
+                    detail
+                ),
+                status_code: Some(status.as_u16()),
+                provider_code,
+                body,
+                retry_after_sec: retry_after,
+            });
+        }
+
+        anyhow!(
+            "HTTP {} calling {}: {}",
+            status.as_u16(),
+            if response_url.as_str().is_empty() {
+                url
+            } else {
+                response_url.as_str()
+            },
+            detail
+        )
+    }
+
+    async fn chat_stream_once(
+        &self,
+        base_url: &str,
+        messages: &[Message],
+        tools: &[serde_json::Value],
+        on_delta: &(dyn Fn(DeltaEvent) + Send + Sync),
+        cancel: &CancellationToken,
+    ) -> Result<ModelTurn, StreamAttemptError> {
+        let url = format!("{}/chat/completions", base_url.trim_end_matches('/'));
+        let payload = self.build_payload(messages, tools, true);
+        let request = self.build_request(&url, &payload);
+        let mut es = request.eventsource().map_err(|e| StreamAttemptError {
+            error: anyhow!("Failed to open SSE stream: {e}"),
+            saw_output: false,
+        })?;
 
         let mut text = String::new();
-        let mut tool_calls_by_index: HashMap<usize, (String, String, String)> = HashMap::new(); // (id, name, args)
+        let mut thinking = String::new();
+        let mut tool_calls_by_index: HashMap<usize, (String, String, String)> = HashMap::new();
         let mut input_tokens: u64 = 0;
         let mut output_tokens: u64 = 0;
+        let mut saw_output = false;
 
         use futures::StreamExt;
         loop {
             if cancel.is_cancelled() {
                 es.close();
-                return Err(anyhow!("Cancelled"));
+                return Err(StreamAttemptError {
+                    error: anyhow!("Cancelled"),
+                    saw_output,
+                });
             }
 
             let event = tokio::select! {
                 _ = cancel.cancelled() => {
                     es.close();
-                    return Err(anyhow!("Cancelled"));
+                    return Err(StreamAttemptError {
+                        error: anyhow!("Cancelled"),
+                        saw_output,
+                    });
                 }
                 ev = es.next() => ev,
             };
@@ -193,7 +522,8 @@ impl BaseModel for OpenAIModel {
                 Some(Err(reqwest_eventsource::Error::StreamEnded)) => break,
                 Some(Err(e)) => {
                     es.close();
-                    return Err(anyhow!("SSE stream error: {e}"));
+                    let error = self.classify_sse_error(&url, e).await;
+                    return Err(StreamAttemptError { error, saw_output });
                 }
                 None => break,
             };
@@ -206,9 +536,13 @@ impl BaseModel for OpenAIModel {
                     }
 
                     let chunk: serde_json::Value = serde_json::from_str(&msg.data)
-                        .with_context(|| format!("Failed to parse SSE chunk: {}", &msg.data))?;
+                        .with_context(|| format!("Failed to parse SSE chunk: {}", &msg.data))
+                        .map_err(|error| StreamAttemptError { error, saw_output })?;
+
+                    if let Some(error) = Self::classify_stream_payload_error(&chunk) {
+                        return Err(StreamAttemptError { error, saw_output });
+                    }
 
-                    // Extract usage from any chunk that has it
                     if let Some(usage) = chunk.get("usage") {
                         if let Some(pt) = usage.get("prompt_tokens").and_then(|v| v.as_u64()) {
                             input_tokens = pt;
@@ -222,7 +556,6 @@ impl BaseModel for OpenAIModel {
                         Some(c) => c,
                         None => continue,
                     };
-
                     if choices.is_empty() {
                         continue;
                     }
@@ -232,9 +565,9 @@ impl BaseModel for OpenAIModel {
                         None => continue,
                     };
 
-                    // Text content delta
                     if let Some(content) = delta.get("content").and_then(|c| c.as_str()) {
                         if !content.is_empty() {
+                            saw_output = true;
                             text.push_str(content);
                             on_delta(DeltaEvent {
                                 kind: DeltaKind::Text,
@@ -243,13 +576,26 @@ impl BaseModel for OpenAIModel {
                         }
                     }
 
-                    // Tool call deltas
+                    for field in ["reasoning_content", "reasoning", "thinking"] {
+                        if let Some(value) = delta.get(field).and_then(|c| c.as_str()) {
+                            if !value.is_empty() {
+                                saw_output = true;
+                                thinking.push_str(value);
+                                on_delta(DeltaEvent {
+                                    kind: DeltaKind::Thinking,
+                                    text: value.to_string(),
+                                });
+                            }
+                        }
+                    }
+
                     if let Some(tc_deltas) = delta.get("tool_calls").and_then(|t| t.as_array()) {
                         for tc_delta in tc_deltas {
-                            let idx = tc_delta.get("index").and_then(|i| i.as_u64()).unwrap_or(0) as usize;
-                            let entry = tool_calls_by_index.entry(idx).or_insert_with(|| {
-                                (String::new(), String::new(), String::new())
-                            });
+                            let idx = tc_delta.get("index").and_then(|i| i.as_u64()).unwrap_or(0)
+                                as usize;
+                            let entry = tool_calls_by_index
+                                .entry(idx)
+                                .or_insert_with(|| (String::new(), String::new(), String::new()));
 
                             if let Some(id) = tc_delta.get("id").and_then(|i| i.as_str()) {
                                 if !id.is_empty() {
@@ -260,6 +606,7 @@ impl BaseModel for OpenAIModel {
                             if let Some(func) = tc_delta.get("function") {
                                 if let Some(name) = func.get("name").and_then(|n| n.as_str()) {
                                     if !name.is_empty() {
+                                        saw_output = true;
                                         entry.1 = name.to_string();
                                         on_delta(DeltaEvent {
                                             kind: DeltaKind::ToolCallStart,
@@ -269,6 +616,7 @@ impl BaseModel for OpenAIModel {
                                 }
                                 if let Some(args) = func.get("arguments").and_then(|a| a.as_str()) {
                                     if !args.is_empty() {
+                                        saw_output = true;
                                         entry.2.push_str(args);
                                         on_delta(DeltaEvent {
                                             kind: DeltaKind::ToolCallArgs,
@@ -283,23 +631,96 @@ impl BaseModel for OpenAIModel {
             }
         }
 
-        // Build tool calls from accumulated data
         let mut tool_calls: Vec<ToolCall> = Vec::new();
         let mut indices: Vec<usize> = tool_calls_by_index.keys().copied().collect();
         indices.sort();
         for idx in indices {
             let (id, name, arguments) = tool_calls_by_index.remove(&idx).unwrap();
-            tool_calls.push(ToolCall { id, name, arguments });
+            tool_calls.push(ToolCall {
+                id,
+                name,
+                arguments,
+            });
         }
 
         Ok(ModelTurn {
             text,
-            thinking: None,
+            thinking: if thinking.is_empty() {
+                None
+            } else {
+                Some(thinking)
+            },
             tool_calls,
             input_tokens,
             output_tokens,
         })
     }
+}
+
+#[async_trait::async_trait]
+impl BaseModel for OpenAIModel {
+    async fn chat(
+        &self,
+        messages: &[Message],
+        tools: &[serde_json::Value],
+    ) -> anyhow::Result<ModelTurn> {
+        let noop = |_: DeltaEvent| {};
+        let cancel = CancellationToken::new();
+        self.chat_stream(messages, tools, &noop, &cancel).await
+    }
+
+    async fn chat_stream(
+        &self,
+        messages: &[Message],
+        tools: &[serde_json::Value],
+        on_delta: &(dyn Fn(DeltaEvent) + Send + Sync),
+        cancel: &CancellationToken,
+    ) -> anyhow::Result<ModelTurn> {
+        let max_attempts = if self.provider == "zai" {
+            self.stream_max_retries.max(1)
+        } else {
+            1
+        };
+        let mut last_error: Option<anyhow::Error> = None;
+
+        for attempt in 0..max_attempts {
+            for base_url in self.candidate_base_urls() {
+                match self
+                    .chat_stream_once(&base_url, messages, tools, on_delta, cancel)
+                    .await
+                {
+                    Ok(turn) => {
+                        self.set_active_base_url(&base_url);
+                        return Ok(turn);
+                    }
+                    Err(err) => {
+                        let should_try_next = self.should_try_next_zai_base_url(&err.error);
+                        let should_retry = self.should_retry_zai_error(&err);
+                        last_error = Some(err.error);
+
+                        if should_try_next {
+                            continue;
+                        }
+
+                        if should_retry && attempt + 1 < max_attempts {
+                            break;
+                        }
+
+                        return Err(last_error
+                            .take()
+                            .unwrap_or_else(|| anyhow!("OpenAI-compatible request failed")));
+                    }
+                }
+            }
+
+            if attempt + 1 < max_attempts {
+                let backoff_ms = (250_u64 << attempt.min(3)).min(2_000);
+                sleep(Duration::from_millis(backoff_ms)).await;
+            }
+        }
+
+        Err(last_error.unwrap_or_else(|| anyhow!("OpenAI-compatible request failed")))
+    }
 
     fn model_name(&self) -> &str {
         &self.model
@@ -325,8 +746,6 @@ mod tests {
         )
     }
 
-    // ── is_reasoning_model ──
-
     #[test]
     fn test_reasoning_model_o1() {
         assert!(make_model("o1", None).is_reasoning_model());
@@ -343,6 +762,7 @@ mod tests {
     fn test_reasoning_model_gpt5() {
         assert!(make_model("gpt-5.2", None).is_reasoning_model());
         assert!(make_model("gpt-5", None).is_reasoning_model());
+        assert!(make_model("azure-foundry/gpt-5.3-codex", None).is_reasoning_model());
     }
 
     #[test]
@@ -351,8 +771,6 @@ mod tests {
         assert!(!make_model("claude-opus-4-6", None).is_reasoning_model());
     }
 
-    // ── convert_messages ──
-
     #[test]
     fn test_convert_system_message() {
         let msgs = vec![Message::System {
@@ -405,8 +823,6 @@ mod tests {
         assert_eq!(converted[0]["content"], "file contents");
     }
 
-    // ── build_payload ──
-
     #[test]
     fn test_payload_non_reasoning_has_temperature() {
         let model = make_model("gpt-4o", None);
@@ -430,6 +846,16 @@ mod tests {
         assert_eq!(payload["reasoning_effort"], "high");
     }
 
+    #[test]
+    fn test_payload_strips_foundry_prefix() {
+        let model = make_model("azure-foundry/gpt-5.3-codex", Some("high"));
+        let msgs = vec![Message::User {
+            content: "Hi".to_string(),
+        }];
+        let payload = model.build_payload(&msgs, &[], true);
+        assert_eq!(payload["model"], "gpt-5.3-codex");
+    }
+
     #[test]
     fn test_payload_with_tools() {
         let model = make_model("gpt-4o", None);
@@ -453,7 +879,100 @@ mod tests {
         assert!(payload.get("tool_choice").is_none());
     }
 
-    // ── model_name / provider_name ──
+    #[test]
+    fn test_payload_zai_includes_thinking() {
+        let model = OpenAIModel::new(
+            "glm-5".to_string(),
+            "zai".to_string(),
+            "https://api.z.ai/api/paas/v4".to_string(),
+            "zai-key".to_string(),
+            Some("high".to_string()),
+            HashMap::new(),
+        )
+        .with_zai_runtime(ZaiRuntimeConfig {
+            paygo_base_url: "https://api.z.ai/api/paas/v4".to_string(),
+            coding_base_url: "https://api.z.ai/api/coding/paas/v4".to_string(),
+            stream_max_retries: 4,
+        });
+        let msgs = vec![Message::User {
+            content: "Hi".to_string(),
+        }];
+        let payload = model.build_payload(&msgs, &[], true);
+        assert_eq!(payload["thinking"]["type"], "enabled");
+    }
+
+    #[test]
+    fn test_zai_runtime_switches_to_disabled_when_no_effort() {
+        let model = OpenAIModel::new(
+            "glm-5".to_string(),
+            "zai".to_string(),
+            "https://api.z.ai/api/paas/v4".to_string(),
+            "zai-key".to_string(),
+            None,
+            HashMap::new(),
+        )
+        .with_zai_runtime(ZaiRuntimeConfig {
+            paygo_base_url: "https://api.z.ai/api/paas/v4".to_string(),
+            coding_base_url: "https://api.z.ai/api/coding/paas/v4".to_string(),
+            stream_max_retries: 4,
+        });
+        let msgs = vec![Message::User {
+            content: "Hi".to_string(),
+        }];
+        let payload = model.build_payload(&msgs, &[], true);
+        assert_eq!(payload["thinking"]["type"], "disabled");
+    }
+
+    #[test]
+    fn test_zai_candidate_base_urls_prefers_active() {
+        let model = OpenAIModel::new(
+            "glm-5".to_string(),
+            "zai".to_string(),
+            "https://api.z.ai/api/paas/v4".to_string(),
+            "zai-key".to_string(),
+            Some("medium".to_string()),
+            HashMap::new(),
+        )
+        .with_zai_runtime(ZaiRuntimeConfig {
+            paygo_base_url: "https://api.z.ai/api/paas/v4".to_string(),
+            coding_base_url: "https://api.z.ai/api/coding/paas/v4".to_string(),
+            stream_max_retries: 4,
+        });
+        model.set_active_base_url("https://api.z.ai/api/coding/paas/v4");
+        assert_eq!(
+            model.candidate_base_urls(),
+            vec![
+                "https://api.z.ai/api/coding/paas/v4".to_string(),
+                "https://api.z.ai/api/paas/v4".to_string(),
+            ]
+        );
+    }
+
+    #[test]
+    fn test_retry_after_parses_seconds_and_http_dates() {
+        assert_eq!(OpenAIModel::parse_retry_after_text("3"), Some(3.0));
+        assert!(OpenAIModel::parse_retry_after_text("Wed, 21 Oct 2015 07:28:00 GMT").is_some());
+        assert_eq!(OpenAIModel::parse_retry_after_text(""), None);
+    }
+
+    #[test]
+    fn test_classify_stream_payload_rate_limit_error() {
+        let payload = serde_json::json!({
+            "type": "error",
+            "error": {
+                "message": "Too many requests",
+                "code": "1302",
+                "retry_after": 4
+            }
+        });
+        let error = OpenAIModel::classify_stream_payload_error(&payload)
+            .expect("payload should classify as an error");
+        let rate_limit = error
+            .downcast_ref::<RateLimitError>()
+            .expect("expected a structured rate-limit error");
+        assert_eq!(rate_limit.provider_code.as_deref(), Some("1302"));
+        assert_eq!(rate_limit.retry_after_sec, Some(4.0));
+    }
 
     #[test]
     fn test_model_name_and_provider() {
diff --git a/openplanter-desktop/crates/op-core/src/session/mod.rs b/openplanter-desktop/crates/op-core/src/session/mod.rs
index 83085b45..3ef1e89c 100644
--- a/openplanter-desktop/crates/op-core/src/session/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/session/mod.rs
@@ -1,6 +1,6 @@
+pub mod credentials;
 /// Session store and runtime.
 ///
 /// Full implementation in Phase 5.
 pub mod replay;
 pub mod settings;
-pub mod credentials;
diff --git a/openplanter-desktop/crates/op-core/src/session/replay.rs b/openplanter-desktop/crates/op-core/src/session/replay.rs
index 367c27cc..d347874a 100644
--- a/openplanter-desktop/crates/op-core/src/session/replay.rs
+++ b/openplanter-desktop/crates/op-core/src/session/replay.rs
@@ -179,13 +179,11 @@ mod tests {
             step_tokens_out: Some(2100),
             step_elapsed: Some(5000),
             step_model_preview: Some("The analysis shows...".into()),
-            step_tool_calls: Some(vec![
-                StepToolCallEntry {
-                    name: "read_file".into(),
-                    key_arg: "/src/main.ts".into(),
-                    elapsed: 1200,
-                },
-            ]),
+            step_tool_calls: Some(vec![StepToolCallEntry {
+                name: "read_file".into(),
+                key_arg: "/src/main.ts".into(),
+                elapsed: 1200,
+            }]),
         };
         logger.append(entry).await.unwrap();
 
@@ -218,7 +216,8 @@ mod tests {
                 step_elapsed: None,
                 step_model_preview: None,
                 step_tool_calls: None,
-            }).unwrap(),
+            })
+            .unwrap(),
             serde_json::to_string(&ReplayEntry {
                 seq: 2,
                 timestamp: "2026-01-01T00:01:00Z".into(),
@@ -232,7 +231,8 @@ mod tests {
                 step_elapsed: None,
                 step_model_preview: None,
                 step_tool_calls: None,
-            }).unwrap(),
+            })
+            .unwrap(),
         );
         fs::write(&path, content).await.unwrap();
 
@@ -285,7 +285,9 @@ mod tests {
         };
         logger.append(entry).await.unwrap();
 
-        let content = fs::read_to_string(tmp.path().join("replay.jsonl")).await.unwrap();
+        let content = fs::read_to_string(tmp.path().join("replay.jsonl"))
+            .await
+            .unwrap();
         assert!(!content.contains("tool_name"));
         assert!(!content.contains("step_number"));
         assert!(!content.contains("step_tool_calls"));
diff --git a/openplanter-desktop/crates/op-core/src/settings.rs b/openplanter-desktop/crates/op-core/src/settings.rs
index 69fcd320..de0688f6 100644
--- a/openplanter-desktop/crates/op-core/src/settings.rs
+++ b/openplanter-desktop/crates/op-core/src/settings.rs
@@ -4,6 +4,8 @@ use std::path::{Path, PathBuf};
 
 use serde::{Deserialize, Serialize};
 
+use crate::config::{normalize_web_search_provider, normalize_zai_plan};
+
 const VALID_REASONING_EFFORTS: &[&str] = &["low", "medium", "high"];
 
 /// Normalize and validate a reasoning effort value.
@@ -38,7 +40,10 @@ pub struct PersistentSettings {
     pub default_model_anthropic: Option<String>,
     pub default_model_openrouter: Option<String>,
     pub default_model_cerebras: Option<String>,
+    pub default_model_zai: Option<String>,
     pub default_model_ollama: Option<String>,
+    pub zai_plan: Option<String>,
+    pub web_search_provider: Option<String>,
 }
 
 impl PersistentSettings {
@@ -49,6 +54,7 @@ impl PersistentSettings {
             "anthropic" => self.default_model_anthropic.as_deref(),
             "openrouter" => self.default_model_openrouter.as_deref(),
             "cerebras" => self.default_model_cerebras.as_deref(),
+            "zai" => self.default_model_zai.as_deref(),
             "ollama" => self.default_model_ollama.as_deref(),
             _ => None,
         };
@@ -67,8 +73,16 @@ impl PersistentSettings {
             .filter(|s| !s.is_empty())
             .map(String::from);
 
-        let effort =
-            normalize_reasoning_effort(self.default_reasoning_effort.as_deref())?;
+        let effort = normalize_reasoning_effort(self.default_reasoning_effort.as_deref())?;
+
+        let web_search_provider = self
+            .web_search_provider
+            .as_deref()
+            .map(|value| normalize_web_search_provider(Some(value)));
+        let zai_plan = self
+            .zai_plan
+            .as_deref()
+            .map(|value| normalize_zai_plan(Some(value)));
 
         fn trim_opt(v: &Option<String>) -> Option<String> {
             v.as_deref()
@@ -84,7 +98,10 @@ impl PersistentSettings {
             default_model_anthropic: trim_opt(&self.default_model_anthropic),
             default_model_openrouter: trim_opt(&self.default_model_openrouter),
             default_model_cerebras: trim_opt(&self.default_model_cerebras),
+            default_model_zai: trim_opt(&self.default_model_zai),
             default_model_ollama: trim_opt(&self.default_model_ollama),
+            zai_plan,
+            web_search_provider,
         })
     }
 
@@ -104,7 +121,10 @@ impl PersistentSettings {
         add!(default_model_anthropic, "default_model_anthropic");
         add!(default_model_openrouter, "default_model_openrouter");
         add!(default_model_cerebras, "default_model_cerebras");
+        add!(default_model_zai, "default_model_zai");
         add!(default_model_ollama, "default_model_ollama");
+        add!(zai_plan, "zai_plan");
+        add!(web_search_provider, "web_search_provider");
         payload
     }
 
@@ -129,7 +149,10 @@ impl PersistentSettings {
             default_model_anthropic: get_str(obj, "default_model_anthropic"),
             default_model_openrouter: get_str(obj, "default_model_openrouter"),
             default_model_cerebras: get_str(obj, "default_model_cerebras"),
+            default_model_zai: get_str(obj, "default_model_zai"),
             default_model_ollama: get_str(obj, "default_model_ollama"),
+            zai_plan: get_str(obj, "zai_plan"),
+            web_search_provider: get_str(obj, "web_search_provider"),
         };
         settings.normalized()
     }
@@ -165,9 +188,9 @@ impl SettingsStore {
     }
 
     pub fn save(&self, settings: &PersistentSettings) -> std::io::Result<()> {
-        let normalized = settings.normalized().map_err(|e| {
-            std::io::Error::new(std::io::ErrorKind::InvalidInput, e)
-        })?;
+        let normalized = settings
+            .normalized()
+            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidInput, e))?;
         let json = serde_json::to_string_pretty(&normalized.to_json())
             .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
         fs::write(&self.settings_path, json)
@@ -213,6 +236,7 @@ mod tests {
         let settings = PersistentSettings {
             default_model: Some("global-model".into()),
             default_model_openai: Some("gpt-5.2".into()),
+            default_model_zai: Some("glm-5".into()),
             ..Default::default()
         };
         assert_eq!(
@@ -223,6 +247,7 @@ mod tests {
             settings.default_model_for_provider("anthropic"),
             Some("global-model")
         );
+        assert_eq!(settings.default_model_for_provider("zai"), Some("glm-5"));
         assert_eq!(
             settings.default_model_for_provider("unknown"),
             Some("global-model")
@@ -236,12 +261,18 @@ mod tests {
         let settings = PersistentSettings {
             default_model: Some("gpt-5.2".into()),
             default_reasoning_effort: Some("high".into()),
+            default_model_zai: Some("glm-5".into()),
+            zai_plan: Some("coding".into()),
+            web_search_provider: Some("firecrawl".into()),
             ..Default::default()
         };
         store.save(&settings).unwrap();
         let loaded = store.load();
         assert_eq!(loaded.default_model, Some("gpt-5.2".into()));
         assert_eq!(loaded.default_reasoning_effort, Some("high".into()));
+        assert_eq!(loaded.default_model_zai, Some("glm-5".into()));
+        assert_eq!(loaded.zai_plan, Some("coding".into()));
+        assert_eq!(loaded.web_search_provider, Some("firecrawl".into()));
     }
 
     #[test]
@@ -270,6 +301,9 @@ mod tests {
             default_model: Some("gpt-5.2".into()),
             default_reasoning_effort: Some("high".into()),
             default_model_openai: Some("gpt-5.2".into()),
+            default_model_zai: Some("glm-5".into()),
+            zai_plan: Some("coding".into()),
+            web_search_provider: Some("firecrawl".into()),
             ..Default::default()
         };
         let json_val = serde_json::to_value(settings.to_json()).unwrap();
@@ -277,5 +311,28 @@ mod tests {
         assert_eq!(loaded.default_model, Some("gpt-5.2".into()));
         assert_eq!(loaded.default_reasoning_effort, Some("high".into()));
         assert_eq!(loaded.default_model_openai, Some("gpt-5.2".into()));
+        assert_eq!(loaded.default_model_zai, Some("glm-5".into()));
+        assert_eq!(loaded.zai_plan, Some("coding".into()));
+        assert_eq!(loaded.web_search_provider, Some("firecrawl".into()));
+    }
+
+    #[test]
+    fn test_web_search_provider_normalized() {
+        let settings = PersistentSettings {
+            web_search_provider: Some("unexpected".into()),
+            ..Default::default()
+        };
+        let normalized = settings.normalized().unwrap();
+        assert_eq!(normalized.web_search_provider, Some("exa".into()));
+    }
+
+    #[test]
+    fn test_zai_plan_normalized() {
+        let settings = PersistentSettings {
+            zai_plan: Some("unexpected".into()),
+            ..Default::default()
+        };
+        let normalized = settings.normalized().unwrap();
+        assert_eq!(normalized.zai_plan, Some("paygo".into()));
     }
 }
diff --git a/openplanter-desktop/crates/op-core/src/tools/defs.rs b/openplanter-desktop/crates/op-core/src/tools/defs.rs
index 9f630fcb..e0fe40cf 100644
--- a/openplanter-desktop/crates/op-core/src/tools/defs.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/defs.rs
@@ -2,8 +2,7 @@
 ///
 /// Single source of truth for tool schemas. Converter helpers produce the
 /// provider-specific shapes expected by OpenAI and Anthropic APIs.
-
-use serde_json::{json, Value};
+use serde_json::{Value, json};
 
 struct ToolDef {
     name: &'static str,
@@ -177,7 +176,7 @@ fn mvp_tool_defs() -> Vec<ToolDef> {
         // ── Web ──
         ToolDef {
             name: "web_search",
-            description: "Search the web using the Exa API. Returns URLs, titles, and optional page text.",
+            description: "Search the web using the configured Exa or Firecrawl backend. Returns URLs, titles, snippets, and optional page text.",
             parameters: json!({
                 "type": "object",
                 "properties": {
@@ -200,7 +199,7 @@ fn mvp_tool_defs() -> Vec<ToolDef> {
         },
         ToolDef {
             name: "fetch_url",
-            description: "Fetch and return the text content of one or more URLs.",
+            description: "Fetch and return the text content of one or more URLs using the configured Exa or Firecrawl backend.",
             parameters: json!({
                 "type": "object",
                 "properties": {
@@ -297,7 +296,11 @@ fn mvp_tool_defs() -> Vec<ToolDef> {
 /// For OpenAI strict mode: make all properties required, wrapping optional ones
 /// with `anyOf [original, null]`. Recurse into nested objects and array items.
 fn strict_fixup(schema: &mut Value) {
-    let Some(schema_type) = schema.get("type").and_then(|t| t.as_str()).map(String::from) else {
+    let Some(schema_type) = schema
+        .get("type")
+        .and_then(|t| t.as_str())
+        .map(String::from)
+    else {
         return;
     };
 
@@ -524,9 +527,15 @@ mod tests {
     fn test_strict_fixup_wraps_optional_with_anyof() {
         // list_files has only optional "glob" parameter
         let tools = to_openai_tools();
-        let list_files = tools.iter().find(|t| t["function"]["name"] == "list_files").unwrap();
+        let list_files = tools
+            .iter()
+            .find(|t| t["function"]["name"] == "list_files")
+            .unwrap();
         let glob_prop = &list_files["function"]["parameters"]["properties"]["glob"];
-        assert!(glob_prop.get("anyOf").is_some(), "Optional 'glob' should be wrapped with anyOf");
+        assert!(
+            glob_prop.get("anyOf").is_some(),
+            "Optional 'glob' should be wrapped with anyOf"
+        );
     }
 
     #[test]
@@ -534,7 +543,8 @@ mod tests {
         let tools = build_curator_tool_defs("openai");
         assert_eq!(tools.len(), 8, "curator should have exactly 8 tools");
 
-        let names: Vec<String> = tools.iter()
+        let names: Vec<String> = tools
+            .iter()
             .map(|t| t["function"]["name"].as_str().unwrap().to_string())
             .collect();
 
diff --git a/openplanter-desktop/crates/op-core/src/tools/filesystem.rs b/openplanter-desktop/crates/op-core/src/tools/filesystem.rs
index bee02d2f..2c67d62b 100644
--- a/openplanter-desktop/crates/op-core/src/tools/filesystem.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/filesystem.rs
@@ -1,5 +1,4 @@
 /// Filesystem tools: read, write, edit, list, search.
-
 use std::collections::HashSet;
 use std::path::{Path, PathBuf};
 use std::process::Command;
@@ -20,10 +19,7 @@ pub(crate) fn clip(text: &str, max_chars: usize) -> String {
     }
     let end = text.floor_char_boundary(max_chars);
     let omitted = text.len() - end;
-    format!(
-        "{}\n\n...[truncated {omitted} chars]...",
-        &text[..end]
-    )
+    format!("{}\n\n...[truncated {omitted} chars]...", &text[..end])
 }
 
 pub(crate) fn resolve_path(root: &Path, raw_path: &str) -> Result<PathBuf, String> {
@@ -374,12 +370,7 @@ pub fn search_files(
         let rel = entry.path().strip_prefix(root).unwrap_or(entry.path());
         for (idx, line) in text.lines().enumerate() {
             if line.to_lowercase().contains(&lower_query) {
-                matches.push(format!(
-                    "{}:{}:{}",
-                    rel.to_string_lossy(),
-                    idx + 1,
-                    line
-                ));
+                matches.push(format!("{}:{}:{}", rel.to_string_lossy(), idx + 1, line));
                 if matches.len() >= max_hits {
                     let mut result = matches.join("\n");
                     result.push_str("\n...[match limit reached]...");
@@ -467,13 +458,7 @@ mod tests {
         let dir = TempDir::new().unwrap();
         std::fs::write(dir.path().join("test.txt"), "hello world").unwrap();
         let mut files_read = HashSet::new();
-        let result = edit_file(
-            dir.path(),
-            "test.txt",
-            "hello",
-            "goodbye",
-            &mut files_read,
-        );
+        let result = edit_file(dir.path(), "test.txt", "hello", "goodbye", &mut files_read);
         assert!(!result.is_error);
         assert_eq!(
             std::fs::read_to_string(dir.path().join("test.txt")).unwrap(),
diff --git a/openplanter-desktop/crates/op-core/src/tools/mod.rs b/openplanter-desktop/crates/op-core/src/tools/mod.rs
index 6781f4e2..a5e4589b 100644
--- a/openplanter-desktop/crates/op-core/src/tools/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/mod.rs
@@ -2,17 +2,16 @@
 ///
 /// The `WorkspaceTools` struct is the central dispatcher that owns tool state
 /// (files-read set, background jobs) and routes tool calls to the appropriate module.
-
 pub mod defs;
 pub mod filesystem;
+pub mod patching;
 pub mod shell;
 pub mod web;
-pub mod patching;
 
 use std::collections::HashSet;
 use std::path::PathBuf;
 
-use crate::config::AgentConfig;
+use crate::config::{AgentConfig, normalize_web_search_provider};
 
 /// Result of executing a tool call.
 #[derive(Debug, Clone)]
@@ -47,8 +46,11 @@ pub struct WorkspaceTools {
     max_files_listed: usize,
     max_search_hits: usize,
     max_observation_chars: usize,
+    web_search_provider: String,
     exa_api_key: Option<String>,
     exa_base_url: String,
+    firecrawl_api_key: Option<String>,
+    firecrawl_base_url: String,
     files_read: HashSet<PathBuf>,
     bg_jobs: shell::BgJobs,
 }
@@ -64,8 +66,11 @@ impl WorkspaceTools {
             max_files_listed: config.max_files_listed as usize,
             max_search_hits: config.max_search_hits as usize,
             max_observation_chars: config.max_observation_chars as usize,
+            web_search_provider: normalize_web_search_provider(Some(&config.web_search_provider)),
             exa_api_key: config.exa_api_key.clone(),
             exa_base_url: config.exa_base_url.clone(),
+            firecrawl_api_key: config.firecrawl_api_key.clone(),
+            firecrawl_base_url: config.firecrawl_base_url.clone(),
             files_read: HashSet::new(),
             bg_jobs: shell::BgJobs::new(),
         }
@@ -74,14 +79,17 @@ impl WorkspaceTools {
     /// Execute a tool by name with JSON arguments string.
     /// Returns the tool result, clipped to max_observation_chars.
     pub async fn execute(&mut self, name: &str, args_json: &str) -> ToolResult {
-        let args: serde_json::Value =
-            serde_json::from_str(args_json).unwrap_or(serde_json::Value::Object(Default::default()));
+        let args: serde_json::Value = serde_json::from_str(args_json)
+            .unwrap_or(serde_json::Value::Object(Default::default()));
 
         let result = match name {
             // Filesystem
             "read_file" => {
                 let path = args.get("path").and_then(|v| v.as_str()).unwrap_or("");
-                let hashline = args.get("hashline").and_then(|v| v.as_bool()).unwrap_or(true);
+                let hashline = args
+                    .get("hashline")
+                    .and_then(|v| v.as_bool())
+                    .unwrap_or(true);
                 filesystem::read_file(
                     &self.root,
                     path,
@@ -99,13 +107,7 @@ impl WorkspaceTools {
                 let path = args.get("path").and_then(|v| v.as_str()).unwrap_or("");
                 let old_text = args.get("old_text").and_then(|v| v.as_str()).unwrap_or("");
                 let new_text = args.get("new_text").and_then(|v| v.as_str()).unwrap_or("");
-                filesystem::edit_file(
-                    &self.root,
-                    path,
-                    old_text,
-                    new_text,
-                    &mut self.files_read,
-                )
+                filesystem::edit_file(&self.root, path, old_text, new_text, &mut self.files_read)
             }
             "list_files" => {
                 let glob = args.get("glob").and_then(|v| v.as_str());
@@ -145,12 +147,7 @@ impl WorkspaceTools {
             }
             "run_shell_bg" => {
                 let command = args.get("command").and_then(|v| v.as_str()).unwrap_or("");
-                shell::run_shell_bg(
-                    &self.root,
-                    &self.shell_path,
-                    command,
-                    &mut self.bg_jobs,
-                )
+                shell::run_shell_bg(&self.root, &self.shell_path, command, &mut self.bg_jobs)
             }
             "check_shell_bg" => {
                 let job_id = args.get("job_id").and_then(|v| v.as_u64()).unwrap_or(0) as u32;
@@ -164,11 +161,20 @@ impl WorkspaceTools {
             // Web
             "web_search" => {
                 let query = args.get("query").and_then(|v| v.as_str()).unwrap_or("");
-                let num_results = args.get("num_results").and_then(|v| v.as_i64()).unwrap_or(10);
-                let include_text = args.get("include_text").and_then(|v| v.as_bool()).unwrap_or(false);
+                let num_results = args
+                    .get("num_results")
+                    .and_then(|v| v.as_i64())
+                    .unwrap_or(10);
+                let include_text = args
+                    .get("include_text")
+                    .and_then(|v| v.as_bool())
+                    .unwrap_or(false);
                 web::web_search(
+                    &self.web_search_provider,
                     self.exa_api_key.as_deref(),
                     &self.exa_base_url,
+                    self.firecrawl_api_key.as_deref(),
+                    &self.firecrawl_base_url,
                     query,
                     num_results,
                     include_text,
@@ -188,8 +194,11 @@ impl WorkspaceTools {
                     })
                     .unwrap_or_default();
                 web::fetch_url(
+                    &self.web_search_provider,
                     self.exa_api_key.as_deref(),
                     &self.exa_base_url,
+                    self.firecrawl_api_key.as_deref(),
+                    &self.firecrawl_base_url,
                     &urls,
                     self.max_file_chars,
                     self.command_timeout_sec,
diff --git a/openplanter-desktop/crates/op-core/src/tools/patching.rs b/openplanter-desktop/crates/op-core/src/tools/patching.rs
index 8a136b09..2db9d1d6 100644
--- a/openplanter-desktop/crates/op-core/src/tools/patching.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/patching.rs
@@ -1,5 +1,4 @@
 /// Codex-style patch application and hashline editing.
-
 use std::collections::HashSet;
 use std::path::{Path, PathBuf};
 
@@ -24,8 +23,13 @@ fn resolve_path(root: &Path, raw_path: &str) -> Result<PathBuf, String> {
 // ── Codex-style patch format ──
 
 enum PatchOp {
-    Add { path: String, content: String },
-    Delete { path: String },
+    Add {
+        path: String,
+        content: String,
+    },
+    Delete {
+        path: String,
+    },
     Update {
         path: String,
         move_to: Option<String>,
@@ -66,10 +70,7 @@ fn parse_agent_patch(text: &str) -> Result<Vec<PatchOp>, String> {
         let line = body[i].trim();
 
         if line.starts_with("*** Add File:") {
-            let path = line
-                .trim_start_matches("*** Add File:")
-                .trim()
-                .to_string();
+            let path = line.trim_start_matches("*** Add File:").trim().to_string();
             i += 1;
             let mut content_lines: Vec<String> = Vec::new();
             while i < body.len() && !body[i].trim().starts_with("***") {
@@ -174,11 +175,7 @@ fn parse_chunks(raw_lines: &[&str]) -> Vec<PatchChunk> {
     }
 }
 
-fn find_subsequence(
-    haystack: &[String],
-    needle: &[String],
-    start_idx: usize,
-) -> Option<usize> {
+fn find_subsequence(haystack: &[String], needle: &[String], start_idx: usize) -> Option<usize> {
     if needle.is_empty() {
         return Some(start_idx.min(haystack.len()));
     }
@@ -202,8 +199,7 @@ fn find_subsequence(
     }
 
     // Pass 2: whitespace-normalized match
-    let normalize =
-        |s: &str| -> String { s.split_whitespace().collect::<Vec<_>>().join(" ") };
+    let normalize = |s: &str| -> String { s.split_whitespace().collect::<Vec<_>>().join(" ") };
     let norm_needle: Vec<String> = needle.iter().map(|s| normalize(s)).collect();
 
     for i in 0..=max_start {
@@ -219,11 +215,7 @@ fn find_subsequence(
     None
 }
 
-pub fn apply_patch(
-    root: &Path,
-    patch_text: &str,
-    files_read: &mut HashSet<PathBuf>,
-) -> ToolResult {
+pub fn apply_patch(root: &Path, patch_text: &str, files_read: &mut HashSet<PathBuf>) -> ToolResult {
     if patch_text.trim().is_empty() {
         return ToolResult::error("apply_patch requires non-empty patch text".into());
     }
@@ -248,9 +240,7 @@ pub fn apply_patch(
                     let _ = std::fs::create_dir_all(parent);
                 }
                 if let Err(e) = std::fs::write(&resolved, &content) {
-                    return ToolResult::error(format!(
-                        "Patch failed: could not write {path}: {e}"
-                    ));
+                    return ToolResult::error(format!("Patch failed: could not write {path}: {e}"));
                 }
                 files_read.insert(resolved);
                 added.push(path);
@@ -261,9 +251,7 @@ pub fn apply_patch(
                     Err(e) => return ToolResult::error(format!("Patch failed: {e}")),
                 };
                 if !resolved.exists() {
-                    return ToolResult::error(format!(
-                        "Patch failed: file not found: {path}"
-                    ));
+                    return ToolResult::error(format!("Patch failed: file not found: {path}"));
                 }
                 if let Err(e) = std::fs::remove_file(&resolved) {
                     return ToolResult::error(format!(
@@ -286,14 +274,13 @@ pub fn apply_patch(
                     Err(e) => {
                         return ToolResult::error(format!(
                             "Patch failed: could not read {path}: {e}"
-                        ))
+                        ));
                     }
                 };
                 files_read.insert(resolved.clone());
 
                 let had_trailing_newline = content.ends_with('\n');
-                let mut lines: Vec<String> =
-                    content.lines().map(|l| l.to_string()).collect();
+                let mut lines: Vec<String> = content.lines().map(|l| l.to_string()).collect();
                 let mut cursor = 0usize;
 
                 for chunk in &chunks {
@@ -333,9 +320,7 @@ pub fn apply_patch(
                     let _ = std::fs::create_dir_all(parent);
                 }
                 if let Err(e) = std::fs::write(&target, &result) {
-                    return ToolResult::error(format!(
-                        "Patch failed: could not write {path}: {e}"
-                    ));
+                    return ToolResult::error(format!("Patch failed: could not write {path}: {e}"));
                 }
                 files_read.insert(target);
                 updated.push(path);
@@ -414,10 +399,8 @@ pub fn hashline_edit(
                 new_lines: vec![new_line],
             });
         } else if let Some(range) = edit.get("replace_lines") {
-            let start_anchor =
-                range.get("start").and_then(|v| v.as_str()).unwrap_or("");
-            let end_anchor =
-                range.get("end").and_then(|v| v.as_str()).unwrap_or("");
+            let start_anchor = range.get("start").and_then(|v| v.as_str()).unwrap_or("");
+            let end_anchor = range.get("end").and_then(|v| v.as_str()).unwrap_or("");
             let (start, err) = validate_anchor(start_anchor, &line_hashes, &lines);
             if let Some(e) = err {
                 return ToolResult::error(e);
@@ -427,12 +410,9 @@ pub fn hashline_edit(
                 return ToolResult::error(e);
             }
             if end < start {
-                return ToolResult::error(format!(
-                    "End line {end} is before start line {start}"
-                ));
+                return ToolResult::error(format!("End line {end} is before start line {start}"));
             }
-            let raw_content =
-                edit.get("content").and_then(|v| v.as_str()).unwrap_or("");
+            let raw_content = edit.get("content").and_then(|v| v.as_str()).unwrap_or("");
             let new_lines: Vec<String> = raw_content
                 .lines()
                 .map(|l| HASHLINE_PREFIX_RE.replace(l, "").to_string())
@@ -443,15 +423,12 @@ pub fn hashline_edit(
                 end,
                 new_lines,
             });
-        } else if let Some(anchor) =
-            edit.get("insert_after").and_then(|v| v.as_str())
-        {
+        } else if let Some(anchor) = edit.get("insert_after").and_then(|v| v.as_str()) {
             let (lineno, err) = validate_anchor(anchor, &line_hashes, &lines);
             if let Some(e) = err {
                 return ToolResult::error(e);
             }
-            let raw_content =
-                edit.get("content").and_then(|v| v.as_str()).unwrap_or("");
+            let raw_content = edit.get("content").and_then(|v| v.as_str()).unwrap_or("");
             let new_lines: Vec<String> = raw_content
                 .lines()
                 .map(|l| HASHLINE_PREFIX_RE.replace(l, "").to_string())
@@ -483,13 +460,9 @@ pub fn hashline_edit(
                 }
             }
             "replace" => {
-                let old_slice: Vec<String> =
-                    lines[edit.start - 1..edit.end].to_vec();
+                let old_slice: Vec<String> = lines[edit.start - 1..edit.end].to_vec();
                 if old_slice != edit.new_lines {
-                    lines.splice(
-                        edit.start - 1..edit.end,
-                        edit.new_lines.iter().cloned(),
-                    );
+                    lines.splice(edit.start - 1..edit.end, edit.new_lines.iter().cloned());
                     changed += 1;
                 }
             }
@@ -527,9 +500,7 @@ fn validate_anchor(
     if parts.len() != 2 || parts[1].len() != 2 {
         return (
             0,
-            Some(format!(
-                "Invalid anchor format: {anchor:?} (expected N:HH)"
-            )),
+            Some(format!("Invalid anchor format: {anchor:?} (expected N:HH)")),
         );
     }
     let lineno: usize = match parts[0].parse() {
@@ -537,10 +508,8 @@ fn validate_anchor(
         Err(_) => {
             return (
                 0,
-                Some(format!(
-                    "Invalid anchor format: {anchor:?} (expected N:HH)"
-                )),
-            )
+                Some(format!("Invalid anchor format: {anchor:?} (expected N:HH)")),
+            );
         }
     };
     let expected_hash = parts[1];
@@ -553,10 +522,7 @@ fn validate_anchor(
             )),
         );
     }
-    let actual_hash = line_hashes
-        .get(&lineno)
-        .map(|s| s.as_str())
-        .unwrap_or("");
+    let actual_hash = line_hashes.get(&lineno).map(|s| s.as_str()).unwrap_or("");
     if actual_hash != expected_hash {
         let ctx_start = lineno.saturating_sub(2).max(1);
         let ctx_end = (lineno + 2).min(lines.len());
@@ -565,10 +531,7 @@ fn validate_anchor(
                 format!(
                     "  {}:{}|{}",
                     i,
-                    line_hashes
-                        .get(&i)
-                        .map(|s| s.as_str())
-                        .unwrap_or("??"),
+                    line_hashes.get(&i).map(|s| s.as_str()).unwrap_or("??"),
                     lines[i - 1]
                 )
             })
@@ -603,8 +566,7 @@ mod tests {
         let result = apply_patch(dir.path(), patch, &mut files_read);
         assert!(!result.is_error, "error: {}", result.content);
         assert!(result.content.contains("Added"));
-        let content =
-            std::fs::read_to_string(dir.path().join("new_file.txt")).unwrap();
+        let content = std::fs::read_to_string(dir.path().join("new_file.txt")).unwrap();
         assert_eq!(content, "hello\nworld\n");
     }
 
@@ -625,8 +587,7 @@ mod tests {
     #[test]
     fn test_apply_patch_update_file() {
         let dir = TempDir::new().unwrap();
-        std::fs::write(dir.path().join("test.txt"), "line1\nline2\nline3\n")
-            .unwrap();
+        std::fs::write(dir.path().join("test.txt"), "line1\nline2\nline3\n").unwrap();
         let mut files_read = HashSet::new();
         let patch = "\
 *** Begin Patch
@@ -639,8 +600,7 @@ mod tests {
 *** End Patch";
         let result = apply_patch(dir.path(), patch, &mut files_read);
         assert!(!result.is_error, "error: {}", result.content);
-        let content =
-            std::fs::read_to_string(dir.path().join("test.txt")).unwrap();
+        let content = std::fs::read_to_string(dir.path().join("test.txt")).unwrap();
         assert!(content.contains("line2_modified"));
         assert!(!content.contains("\nline2\n"));
     }
@@ -656,11 +616,9 @@ mod tests {
             "set_line": format!("2:{hash}"),
             "content": "BBB"
         })];
-        let result =
-            hashline_edit(dir.path(), "test.txt", &edits, &mut files_read);
+        let result = hashline_edit(dir.path(), "test.txt", &edits, &mut files_read);
         assert!(!result.is_error, "error: {}", result.content);
-        let content =
-            std::fs::read_to_string(dir.path().join("test.txt")).unwrap();
+        let content = std::fs::read_to_string(dir.path().join("test.txt")).unwrap();
         assert!(content.contains("BBB"));
         assert!(!content.contains("\nbbb\n"));
     }
@@ -676,11 +634,9 @@ mod tests {
             "insert_after": format!("2:{hash}"),
             "content": "inserted_line"
         })];
-        let result =
-            hashline_edit(dir.path(), "test.txt", &edits, &mut files_read);
+        let result = hashline_edit(dir.path(), "test.txt", &edits, &mut files_read);
         assert!(!result.is_error, "error: {}", result.content);
-        let content =
-            std::fs::read_to_string(dir.path().join("test.txt")).unwrap();
+        let content = std::fs::read_to_string(dir.path().join("test.txt")).unwrap();
         let lines: Vec<&str> = content.lines().collect();
         assert_eq!(lines[2], "inserted_line");
     }
@@ -693,16 +649,14 @@ mod tests {
 
     #[test]
     fn test_find_subsequence_exact() {
-        let haystack: Vec<String> =
-            vec!["a".into(), "b".into(), "c".into()];
+        let haystack: Vec<String> = vec!["a".into(), "b".into(), "c".into()];
         let needle: Vec<String> = vec!["b".into(), "c".into()];
         assert_eq!(find_subsequence(&haystack, &needle, 0), Some(1));
     }
 
     #[test]
     fn test_find_subsequence_whitespace() {
-        let haystack: Vec<String> =
-            vec!["a".into(), "  b  ".into(), "c".into()];
+        let haystack: Vec<String> = vec!["a".into(), "  b  ".into(), "c".into()];
         let needle: Vec<String> = vec!["b".into(), "c".into()];
         assert_eq!(find_subsequence(&haystack, &needle, 0), Some(1));
     }
diff --git a/openplanter-desktop/crates/op-core/src/tools/shell.rs b/openplanter-desktop/crates/op-core/src/tools/shell.rs
index f1023b37..5f032f75 100644
--- a/openplanter-desktop/crates/op-core/src/tools/shell.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/shell.rs
@@ -1,5 +1,4 @@
 /// Shell execution tools: run_shell, run_shell_bg, check_shell_bg, kill_shell_bg.
-
 use std::collections::HashMap;
 use std::path::Path;
 use std::process::{Child, Command, Stdio};
@@ -22,10 +21,7 @@ fn clip(text: &str, max_chars: usize) -> String {
     }
     let end = text.floor_char_boundary(max_chars);
     let omitted = text.len() - end;
-    format!(
-        "{}\n\n...[truncated {omitted} chars]...",
-        &text[..end]
-    )
+    format!("{}\n\n...[truncated {omitted} chars]...", &text[..end])
 }
 
 fn check_shell_policy(command: &str) -> Option<String> {
@@ -134,18 +130,11 @@ pub fn run_shell(
     let stderr = String::from_utf8_lossy(&output.stderr);
     let code = output.status.code().unwrap_or(-1);
 
-    let merged = format!(
-        "$ {command}\n[exit_code={code}]\n[stdout]\n{stdout}\n[stderr]\n{stderr}"
-    );
+    let merged = format!("$ {command}\n[exit_code={code}]\n[stdout]\n{stdout}\n[stderr]\n{stderr}");
     ToolResult::ok(clip(&merged, max_output_chars))
 }
 
-pub fn run_shell_bg(
-    root: &Path,
-    shell: &str,
-    command: &str,
-    bg_jobs: &mut BgJobs,
-) -> ToolResult {
+pub fn run_shell_bg(root: &Path, shell: &str, command: &str, bg_jobs: &mut BgJobs) -> ToolResult {
     if let Some(err) = check_shell_policy(command) {
         return ToolResult::error(err);
     }
@@ -195,11 +184,7 @@ pub fn run_shell_bg(
     ))
 }
 
-pub fn check_shell_bg(
-    job_id: u32,
-    bg_jobs: &mut BgJobs,
-    max_output_chars: usize,
-) -> ToolResult {
+pub fn check_shell_bg(job_id: u32, bg_jobs: &mut BgJobs, max_output_chars: usize) -> ToolResult {
     let job = match bg_jobs.jobs.get_mut(&job_id) {
         Some(j) => j,
         None => return ToolResult::error(format!("No background job with id {job_id}")),
@@ -220,9 +205,7 @@ pub fn check_shell_bg(
         }
         Ok(None) => {
             let pid = job.child.id();
-            ToolResult::ok(format!(
-                "[job {job_id} still running, pid={pid}]\n{output}"
-            ))
+            ToolResult::ok(format!("[job {job_id} still running, pid={pid}]\n{output}"))
         }
         Err(e) => ToolResult::error(format!("Error checking job {job_id}: {e}")),
     }
@@ -258,13 +241,7 @@ mod tests {
     #[test]
     fn test_run_shell_heredoc_blocked() {
         let dir = TempDir::new().unwrap();
-        let result = run_shell(
-            dir.path(),
-            "/bin/sh",
-            "cat << EOF\nhello\nEOF",
-            10,
-            16000,
-        );
+        let result = run_shell(dir.path(), "/bin/sh", "cat << EOF\nhello\nEOF", 10, 16000);
         assert!(result.is_error);
         assert!(result.content.contains("BLOCKED"));
     }
diff --git a/openplanter-desktop/crates/op-core/src/tools/web.rs b/openplanter-desktop/crates/op-core/src/tools/web.rs
index c9629e89..fb67a633 100644
--- a/openplanter-desktop/crates/op-core/src/tools/web.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/web.rs
@@ -1,7 +1,10 @@
-/// Web tools: Exa search, fetch_url.
+/// Web tools: Exa / Firecrawl search and fetch_url.
+use std::time::Duration;
 
 use serde_json::json;
 
+use crate::config::normalize_web_search_provider;
+
 use super::ToolResult;
 
 fn clip(text: &str, max_chars: usize) -> String {
@@ -10,15 +13,84 @@ fn clip(text: &str, max_chars: usize) -> String {
     }
     let end = text.floor_char_boundary(max_chars);
     let omitted = text.len() - end;
-    format!(
-        "{}\n\n...[truncated {omitted} chars]...",
-        &text[..end]
-    )
+    format!("{}\n\n...[truncated {omitted} chars]...", &text[..end])
+}
+
+async fn exa_request(
+    api_key: Option<&str>,
+    exa_base_url: &str,
+    endpoint: &str,
+    payload: &serde_json::Value,
+    timeout_sec: u64,
+) -> Result<serde_json::Value, String> {
+    let api_key = match api_key {
+        Some(value) if !value.trim().is_empty() => value,
+        _ => return Err("EXA_API_KEY not configured".into()),
+    };
+
+    let url = format!("{}{}", exa_base_url.trim_end_matches('/'), endpoint);
+    let client = reqwest::Client::new();
+    let response = client
+        .post(&url)
+        .header("x-api-key", api_key)
+        .header("Content-Type", "application/json")
+        .header("User-Agent", "exa-py 1.0.18")
+        .timeout(Duration::from_secs(timeout_sec))
+        .json(payload)
+        .send()
+        .await
+        .map_err(|e| format!("Exa API request failed: {e}"))?;
+
+    let response = response
+        .error_for_status()
+        .map_err(|e| format!("Exa API request failed: {e}"))?;
+
+    response
+        .json::<serde_json::Value>()
+        .await
+        .map_err(|e| format!("Exa API returned non-JSON payload: {e}"))
+}
+
+async fn firecrawl_request(
+    api_key: Option<&str>,
+    firecrawl_base_url: &str,
+    endpoint: &str,
+    payload: &serde_json::Value,
+    timeout_sec: u64,
+) -> Result<serde_json::Value, String> {
+    let api_key = match api_key {
+        Some(value) if !value.trim().is_empty() => value,
+        _ => return Err("FIRECRAWL_API_KEY not configured".into()),
+    };
+
+    let url = format!("{}{}", firecrawl_base_url.trim_end_matches('/'), endpoint);
+    let client = reqwest::Client::new();
+    let response = client
+        .post(&url)
+        .header("Authorization", format!("Bearer {api_key}"))
+        .header("Content-Type", "application/json")
+        .timeout(Duration::from_secs(timeout_sec))
+        .json(payload)
+        .send()
+        .await
+        .map_err(|e| format!("Firecrawl API request failed: {e}"))?;
+
+    let response = response
+        .error_for_status()
+        .map_err(|e| format!("Firecrawl API request failed: {e}"))?;
+
+    response
+        .json::<serde_json::Value>()
+        .await
+        .map_err(|e| format!("Firecrawl API returned non-JSON payload: {e}"))
 }
 
 pub async fn web_search(
+    provider: &str,
     exa_api_key: Option<&str>,
     exa_base_url: &str,
+    firecrawl_api_key: Option<&str>,
+    firecrawl_base_url: &str,
     query: &str,
     num_results: i64,
     include_text: bool,
@@ -30,66 +102,132 @@ pub async fn web_search(
         return ToolResult::error("web_search requires non-empty query".into());
     }
 
-    let api_key = match exa_api_key {
-        Some(k) if !k.trim().is_empty() => k,
-        _ => return ToolResult::error("EXA_API_KEY not configured".into()),
-    };
+    let provider = normalize_web_search_provider(Some(provider));
+    let clamped = num_results.clamp(1, 20);
 
-    let clamped = num_results.max(1).min(20);
-    let mut payload = json!({
-        "query": query,
-        "numResults": clamped,
-    });
-    if include_text {
-        payload["contents"] = json!({"text": {"maxCharacters": 4000}});
-    }
+    let output = if provider == "firecrawl" {
+        let mut payload = json!({
+            "query": query,
+            "limit": clamped,
+        });
+        if include_text {
+            payload["scrapeOptions"] = json!({ "formats": ["markdown"] });
+        }
 
-    let url = format!("{}/search", exa_base_url.trim_end_matches('/'));
-    let client = reqwest::Client::new();
-    let response = client
-        .post(&url)
-        .header("x-api-key", api_key)
-        .header("Content-Type", "application/json")
-        .header("User-Agent", "exa-py 1.0.18")
-        .timeout(std::time::Duration::from_secs(timeout_sec))
-        .json(&payload)
-        .send()
-        .await;
+        match firecrawl_request(
+            firecrawl_api_key,
+            firecrawl_base_url,
+            "/search",
+            &payload,
+            timeout_sec,
+        )
+        .await
+        {
+            Ok(body) => {
+                let mut rows: Vec<serde_json::Value> = Vec::new();
+                if let Some(items) = body.get("data").and_then(|value| value.as_array()) {
+                    rows.extend(items.iter().cloned());
+                } else if let Some(items) = body
+                    .get("data")
+                    .and_then(|value| value.get("web"))
+                    .and_then(|value| value.as_array())
+                {
+                    rows.extend(items.iter().cloned());
+                }
 
-    let resp = match response {
-        Ok(r) => r,
-        Err(e) => return ToolResult::error(format!("Web search failed: {e}")),
-    };
+                let mut results: Vec<serde_json::Value> = Vec::new();
+                for row in rows {
+                    let metadata = row.get("metadata").and_then(|value| value.as_object());
+                    let title = row
+                        .get("title")
+                        .and_then(|value| value.as_str())
+                        .filter(|value| !value.is_empty())
+                        .or_else(|| {
+                            metadata
+                                .and_then(|meta| meta.get("title"))
+                                .and_then(|value| value.as_str())
+                        })
+                        .unwrap_or("");
 
-    let body: serde_json::Value = match resp.json().await {
-        Ok(b) => b,
-        Err(e) => return ToolResult::error(format!("Web search response parse error: {e}")),
-    };
+                    let mut item = json!({
+                        "url": row.get("url").and_then(|value| value.as_str()).unwrap_or(""),
+                        "title": title,
+                        "snippet": row
+                            .get("description")
+                            .and_then(|value| value.as_str())
+                            .or_else(|| row.get("snippet").and_then(|value| value.as_str()))
+                            .unwrap_or(""),
+                    });
 
-    let mut out_results: Vec<serde_json::Value> = Vec::new();
-    if let Some(results) = body.get("results").and_then(|r| r.as_array()) {
-        for row in results {
-            let mut item = json!({
-                "url": row.get("url").and_then(|u| u.as_str()).unwrap_or(""),
-                "title": row.get("title").and_then(|t| t.as_str()).unwrap_or(""),
-                "snippet": row.get("highlight").and_then(|h| h.as_str())
-                    .or_else(|| row.get("snippet").and_then(|s| s.as_str()))
-                    .unwrap_or(""),
-            });
-            if include_text {
-                if let Some(text) = row.get("text").and_then(|t| t.as_str()) {
-                    item["text"] = json!(clip(text, 4000));
+                    if include_text {
+                        if let Some(text) = row
+                            .get("markdown")
+                            .and_then(|value| value.as_str())
+                            .or_else(|| row.get("text").and_then(|value| value.as_str()))
+                        {
+                            if !text.is_empty() {
+                                item["text"] = json!(clip(text, 4_000));
+                            }
+                        }
+                    }
+
+                    results.push(item);
                 }
+
+                json!({
+                    "query": query,
+                    "provider": provider,
+                    "results": results,
+                    "total": results.len(),
+                })
             }
-            out_results.push(item);
+            Err(error) => return ToolResult::error(format!("Web search failed: {error}")),
         }
-    }
+    } else {
+        let mut payload = json!({
+            "query": query,
+            "numResults": clamped,
+        });
+        if include_text {
+            payload["contents"] = json!({ "text": { "maxCharacters": 4_000 } });
+        }
+
+        match exa_request(exa_api_key, exa_base_url, "/search", &payload, timeout_sec).await {
+            Ok(body) => {
+                let mut results: Vec<serde_json::Value> = Vec::new();
+                if let Some(rows) = body.get("results").and_then(|value| value.as_array()) {
+                    for row in rows {
+                        let mut item = json!({
+                            "url": row.get("url").and_then(|value| value.as_str()).unwrap_or(""),
+                            "title": row.get("title").and_then(|value| value.as_str()).unwrap_or(""),
+                            "snippet": row
+                                .get("highlight")
+                                .and_then(|value| value.as_str())
+                                .or_else(|| row.get("snippet").and_then(|value| value.as_str()))
+                                .unwrap_or(""),
+                        });
+                        if include_text {
+                            if let Some(text) = row.get("text").and_then(|value| value.as_str()) {
+                                if !text.is_empty() {
+                                    item["text"] = json!(clip(text, 4_000));
+                                }
+                            }
+                        }
+                        results.push(item);
+                    }
+                }
+
+                json!({
+                    "query": query,
+                    "provider": provider,
+                    "results": results,
+                    "total": results.len(),
+                })
+            }
+            Err(error) => return ToolResult::error(format!("Web search failed: {error}")),
+        }
+    };
 
-    let output = json!({
-        "query": query,
-        "results": out_results,
-        "total": out_results.len(),
-    });
     ToolResult::ok(clip(
         &serde_json::to_string_pretty(&output).unwrap_or_default(),
         max_file_chars,
@@ -97,79 +235,319 @@ pub async fn web_search(
 }
 
 pub async fn fetch_url(
+    provider: &str,
     exa_api_key: Option<&str>,
     exa_base_url: &str,
+    firecrawl_api_key: Option<&str>,
+    firecrawl_base_url: &str,
     urls: &[String],
     max_file_chars: usize,
     timeout_sec: u64,
 ) -> ToolResult {
-    if urls.is_empty() {
-        return ToolResult::error("fetch_url requires at least one valid URL".into());
-    }
-
-    let api_key = match exa_api_key {
-        Some(k) if !k.trim().is_empty() => k,
-        _ => return ToolResult::error("EXA_API_KEY not configured".into()),
-    };
-
-    let normalized: Vec<&str> = urls
+    let normalized: Vec<String> = urls
         .iter()
-        .map(|u| u.trim())
-        .filter(|u| !u.is_empty())
+        .map(|value| value.trim())
+        .filter(|value| !value.is_empty())
         .take(10)
+        .map(String::from)
         .collect();
 
     if normalized.is_empty() {
         return ToolResult::error("fetch_url requires at least one valid URL".into());
     }
 
-    let payload = json!({
-        "ids": normalized,
-        "text": { "maxCharacters": 8000 },
-    });
+    let provider = normalize_web_search_provider(Some(provider));
 
-    let url = format!("{}/contents", exa_base_url.trim_end_matches('/'));
-    let client = reqwest::Client::new();
-    let response = client
-        .post(&url)
-        .header("x-api-key", api_key)
-        .header("Content-Type", "application/json")
-        .header("User-Agent", "exa-py 1.0.18")
-        .timeout(std::time::Duration::from_secs(timeout_sec))
-        .json(&payload)
-        .send()
-        .await;
+    let output = if provider == "firecrawl" {
+        let mut pages: Vec<serde_json::Value> = Vec::new();
+        for url in &normalized {
+            let payload = json!({
+                "url": url,
+                "formats": ["markdown"],
+            });
+            let body = match firecrawl_request(
+                firecrawl_api_key,
+                firecrawl_base_url,
+                "/scrape",
+                &payload,
+                timeout_sec,
+            )
+            .await
+            {
+                Ok(body) => body,
+                Err(error) => return ToolResult::error(format!("Fetch URL failed: {error}")),
+            };
 
-    let resp = match response {
-        Ok(r) => r,
-        Err(e) => return ToolResult::error(format!("Fetch URL failed: {e}")),
-    };
+            if let Some(data) = body.get("data").and_then(|value| value.as_object()) {
+                let title = data
+                    .get("metadata")
+                    .and_then(|value| value.as_object())
+                    .and_then(|meta| meta.get("title"))
+                    .and_then(|value| value.as_str())
+                    .unwrap_or("");
+                let text = data
+                    .get("markdown")
+                    .and_then(|value| value.as_str())
+                    .or_else(|| data.get("text").and_then(|value| value.as_str()))
+                    .or_else(|| data.get("html").and_then(|value| value.as_str()))
+                    .unwrap_or("");
 
-    let body: serde_json::Value = match resp.json().await {
-        Ok(b) => b,
-        Err(e) => return ToolResult::error(format!("Fetch URL response parse error: {e}")),
-    };
+                pages.push(json!({
+                    "url": data.get("url").and_then(|value| value.as_str()).unwrap_or(url),
+                    "title": title,
+                    "text": clip(text, 8_000),
+                }));
+            }
+        }
+
+        json!({
+            "provider": provider,
+            "pages": pages,
+            "total": pages.len(),
+        })
+    } else {
+        let payload = json!({
+            "ids": normalized,
+            "text": { "maxCharacters": 8_000 },
+        });
+
+        match exa_request(
+            exa_api_key,
+            exa_base_url,
+            "/contents",
+            &payload,
+            timeout_sec,
+        )
+        .await
+        {
+            Ok(body) => {
+                let mut pages: Vec<serde_json::Value> = Vec::new();
+                if let Some(rows) = body.get("results").and_then(|value| value.as_array()) {
+                    for row in rows {
+                        pages.push(json!({
+                            "url": row.get("url").and_then(|value| value.as_str()).unwrap_or(""),
+                            "title": row.get("title").and_then(|value| value.as_str()).unwrap_or(""),
+                            "text": clip(
+                                row.get("text").and_then(|value| value.as_str()).unwrap_or(""),
+                                8_000,
+                            ),
+                        }));
+                    }
+                }
 
-    let mut pages: Vec<serde_json::Value> = Vec::new();
-    if let Some(results) = body.get("results").and_then(|r| r.as_array()) {
-        for row in results {
-            pages.push(json!({
-                "url": row.get("url").and_then(|u| u.as_str()).unwrap_or(""),
-                "title": row.get("title").and_then(|t| t.as_str()).unwrap_or(""),
-                "text": clip(
-                    row.get("text").and_then(|t| t.as_str()).unwrap_or(""),
-                    8000,
-                ),
-            }));
+                json!({
+                    "provider": provider,
+                    "pages": pages,
+                    "total": pages.len(),
+                })
+            }
+            Err(error) => return ToolResult::error(format!("Fetch URL failed: {error}")),
         }
-    }
+    };
 
-    let output = json!({
-        "pages": pages,
-        "total": pages.len(),
-    });
     ToolResult::ok(clip(
         &serde_json::to_string_pretty(&output).unwrap_or_default(),
         max_file_chars,
     ))
 }
+
+#[cfg(test)]
+mod tests {
+    use axum::body::Body;
+    use axum::http::StatusCode;
+    use axum::response::Response;
+    use axum::routing::post;
+    use axum::{Json, Router};
+    use serde_json::{Value, json};
+
+    use super::*;
+
+    async fn start_json_server(
+        path: &'static str,
+        response_payload: Value,
+    ) -> std::net::SocketAddr {
+        let app = Router::new().route(
+            path,
+            post(move || {
+                let response_payload = response_payload.clone();
+                async move { Json(response_payload) }
+            }),
+        );
+        let listener = tokio::net::TcpListener::bind("127.0.0.1:0").await.unwrap();
+        let addr = listener.local_addr().unwrap();
+        tokio::spawn(async move {
+            axum::serve(listener, app).await.unwrap();
+        });
+        addr
+    }
+
+    async fn start_status_server(path: &'static str, status: StatusCode) -> std::net::SocketAddr {
+        let app = Router::new().route(
+            path,
+            post(move || async move {
+                Response::builder()
+                    .status(status)
+                    .body(Body::from("{\"error\":\"boom\"}"))
+                    .unwrap()
+            }),
+        );
+        let listener = tokio::net::TcpListener::bind("127.0.0.1:0").await.unwrap();
+        let addr = listener.local_addr().unwrap();
+        tokio::spawn(async move {
+            axum::serve(listener, app).await.unwrap();
+        });
+        addr
+    }
+
+    #[tokio::test]
+    async fn test_web_search_exa_output_shape() {
+        let addr = start_json_server(
+            "/search",
+            json!({
+                "results": [
+                    {
+                        "url": "https://example.com",
+                        "title": "Example",
+                        "highlight": "Snippet",
+                        "text": "Long page body"
+                    }
+                ]
+            }),
+        )
+        .await;
+
+        let result = web_search(
+            "exa",
+            Some("exa-key"),
+            &format!("http://{addr}"),
+            None,
+            "https://api.firecrawl.dev/v1",
+            "example query",
+            5,
+            true,
+            20_000,
+            5,
+        )
+        .await;
+
+        assert!(!result.is_error);
+        let parsed: Value = serde_json::from_str(&result.content).unwrap();
+        assert_eq!(parsed["provider"], "exa");
+        assert_eq!(parsed["query"], "example query");
+        assert_eq!(parsed["results"][0]["url"], "https://example.com");
+        assert_eq!(parsed["results"][0]["text"], "Long page body");
+    }
+
+    #[tokio::test]
+    async fn test_web_search_firecrawl_output_shape() {
+        let addr = start_json_server(
+            "/search",
+            json!({
+                "data": [
+                    {
+                        "url": "https://example.com/firecrawl",
+                        "description": "Firecrawl snippet",
+                        "markdown": "# Hello",
+                        "metadata": { "title": "Firecrawl Title" }
+                    }
+                ]
+            }),
+        )
+        .await;
+
+        let result = web_search(
+            "firecrawl",
+            None,
+            "https://api.exa.ai",
+            Some("fc-key"),
+            &format!("http://{addr}"),
+            "example query",
+            5,
+            true,
+            20_000,
+            5,
+        )
+        .await;
+
+        assert!(!result.is_error);
+        let parsed: Value = serde_json::from_str(&result.content).unwrap();
+        assert_eq!(parsed["provider"], "firecrawl");
+        assert_eq!(parsed["results"][0]["title"], "Firecrawl Title");
+        assert_eq!(parsed["results"][0]["text"], "# Hello");
+    }
+
+    #[tokio::test]
+    async fn test_fetch_url_firecrawl_output_shape() {
+        let addr = start_json_server(
+            "/scrape",
+            json!({
+                "data": {
+                    "url": "https://example.com/article",
+                    "markdown": "Article body",
+                    "metadata": { "title": "Article Title" }
+                }
+            }),
+        )
+        .await;
+
+        let result = fetch_url(
+            "firecrawl",
+            None,
+            "https://api.exa.ai",
+            Some("fc-key"),
+            &format!("http://{addr}"),
+            &[String::from("https://example.com/article")],
+            20_000,
+            5,
+        )
+        .await;
+
+        assert!(!result.is_error);
+        let parsed: Value = serde_json::from_str(&result.content).unwrap();
+        assert_eq!(parsed["provider"], "firecrawl");
+        assert_eq!(parsed["pages"][0]["title"], "Article Title");
+        assert_eq!(parsed["pages"][0]["text"], "Article body");
+    }
+
+    #[tokio::test]
+    async fn test_missing_firecrawl_key_errors() {
+        let result = web_search(
+            "firecrawl",
+            None,
+            "https://api.exa.ai",
+            None,
+            "https://api.firecrawl.dev/v1",
+            "example query",
+            5,
+            false,
+            20_000,
+            5,
+        )
+        .await;
+
+        assert!(result.is_error);
+        assert!(result.content.contains("FIRECRAWL_API_KEY"));
+    }
+
+    #[tokio::test]
+    async fn test_exa_http_error_bubbles_up() {
+        let addr = start_status_server("/search", StatusCode::BAD_GATEWAY).await;
+
+        let result = web_search(
+            "exa",
+            Some("exa-key"),
+            &format!("http://{addr}"),
+            None,
+            "https://api.firecrawl.dev/v1",
+            "example query",
+            5,
+            false,
+            20_000,
+            5,
+        )
+        .await;
+
+        assert!(result.is_error);
+        assert!(result.content.contains("Web search failed"));
+    }
+}
diff --git a/openplanter-desktop/crates/op-core/src/wiki/matching.rs b/openplanter-desktop/crates/op-core/src/wiki/matching.rs
index 4955b0ac..48620b1d 100644
--- a/openplanter-desktop/crates/op-core/src/wiki/matching.rs
+++ b/openplanter-desktop/crates/op-core/src/wiki/matching.rs
@@ -18,15 +18,13 @@ impl NameRegistry {
 
     /// Register a canonical name for an entity.
     pub fn register(&mut self, name: &str, entity_id: &str) {
-        self.entries
-            .push((name.to_string(), entity_id.to_string()));
+        self.entries.push((name.to_string(), entity_id.to_string()));
     }
 
     /// Register multiple aliases for the same entity.
     pub fn register_aliases(&mut self, aliases: &[String], entity_id: &str) {
         for alias in aliases {
-            self.entries
-                .push((alias.clone(), entity_id.to_string()));
+            self.entries.push((alias.clone(), entity_id.to_string()));
         }
     }
 
@@ -123,10 +121,7 @@ mod tests {
     fn test_aliases() {
         let mut reg = NameRegistry::new();
         reg.register("Acme Corp", "acme-corp");
-        reg.register_aliases(
-            &["AC".to_string(), "Acme".to_string()],
-            "acme-corp",
-        );
+        reg.register_aliases(&["AC".to_string(), "Acme".to_string()], "acme-corp");
         assert_eq!(reg.len(), 3);
 
         let result = reg.find_best("Acme");
diff --git a/openplanter-desktop/crates/op-core/src/wiki/mod.rs b/openplanter-desktop/crates/op-core/src/wiki/mod.rs
index 149037b4..02051a6d 100644
--- a/openplanter-desktop/crates/op-core/src/wiki/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/wiki/mod.rs
@@ -1,6 +1,6 @@
+pub mod matching;
 /// Wiki knowledge graph model (petgraph).
 ///
 /// Full implementation in Phase 5.
 pub mod parser;
-pub mod matching;
 pub mod watcher;
diff --git a/openplanter-desktop/crates/op-core/src/wiki/parser.rs b/openplanter-desktop/crates/op-core/src/wiki/parser.rs
index 638222e3..f24746b5 100644
--- a/openplanter-desktop/crates/op-core/src/wiki/parser.rs
+++ b/openplanter-desktop/crates/op-core/src/wiki/parser.rs
@@ -37,9 +37,7 @@ pub fn parse_index(content: &str) -> Vec<WikiEntry> {
         if trimmed.starts_with("### ") {
             current_category = trimmed[4..].trim().to_lowercase();
             // Normalize common category names
-            current_category = current_category
-                .replace(' ', "-")
-                .replace('_', "-");
+            current_category = current_category.replace(' ', "-").replace('_', "-");
             continue;
         }
 
diff --git a/openplanter-desktop/crates/op-core/src/wiki/watcher.rs b/openplanter-desktop/crates/op-core/src/wiki/watcher.rs
index a9d4ca86..19abf89d 100644
--- a/openplanter-desktop/crates/op-core/src/wiki/watcher.rs
+++ b/openplanter-desktop/crates/op-core/src/wiki/watcher.rs
@@ -37,34 +37,35 @@ impl WikiWatcher {
     ) -> std::io::Result<(Self, mpsc::UnboundedReceiver<WikiChangeEvent>)> {
         let (tx, rx) = mpsc::unbounded_channel();
 
-        let mut watcher = notify::recommended_watcher(move |result: Result<Event, notify::Error>| {
-            let event = match result {
-                Ok(e) => e,
-                Err(err) => {
-                    eprintln!("[wiki-watcher] error: {err}");
-                    return;
-                }
-            };
-
-            let kind = match event.kind {
-                EventKind::Create(_) => WikiChangeKind::Created,
-                EventKind::Modify(_) => WikiChangeKind::Modified,
-                EventKind::Remove(_) => WikiChangeKind::Deleted,
-                _ => return,
-            };
-
-            for path in event.paths {
-                // Only watch .md files
-                if path.extension().and_then(|e| e.to_str()) != Some("md") {
-                    continue;
+        let mut watcher =
+            notify::recommended_watcher(move |result: Result<Event, notify::Error>| {
+                let event = match result {
+                    Ok(e) => e,
+                    Err(err) => {
+                        eprintln!("[wiki-watcher] error: {err}");
+                        return;
+                    }
+                };
+
+                let kind = match event.kind {
+                    EventKind::Create(_) => WikiChangeKind::Created,
+                    EventKind::Modify(_) => WikiChangeKind::Modified,
+                    EventKind::Remove(_) => WikiChangeKind::Deleted,
+                    _ => return,
+                };
+
+                for path in event.paths {
+                    // Only watch .md files
+                    if path.extension().and_then(|e| e.to_str()) != Some("md") {
+                        continue;
+                    }
+                    let _ = tx.send(WikiChangeEvent {
+                        path,
+                        kind: kind.clone(),
+                    });
                 }
-                let _ = tx.send(WikiChangeEvent {
-                    path,
-                    kind: kind.clone(),
-                });
-            }
-        })
-        .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
+            })
+            .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
 
         watcher
             .watch(&wiki_dir, RecursiveMode::Recursive)
@@ -83,7 +84,7 @@ impl WikiWatcher {
 mod tests {
     use super::*;
     use tempfile::tempdir;
-    use tokio::time::{sleep, Duration};
+    use tokio::time::{Duration, sleep};
 
     #[tokio::test]
     async fn test_watcher_detects_create() {
diff --git a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
index 5e792de0..c2ce34c6 100644
--- a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
+++ b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
@@ -6,17 +6,17 @@ use std::collections::HashMap;
 use std::net::SocketAddr;
 use std::sync::{Arc, Mutex};
 
+use axum::Router;
 use axum::body::Body;
 use axum::http::StatusCode;
 use axum::response::Response;
 use axum::routing::post;
-use axum::Router;
 use tokio_util::sync::CancellationToken;
 
 use op_core::events::{DeltaEvent, DeltaKind};
-use op_core::model::openai::OpenAIModel;
 use op_core::model::anthropic::AnthropicModel;
-use op_core::model::{BaseModel, Message};
+use op_core::model::openai::OpenAIModel;
+use op_core::model::{BaseModel, Message, RateLimitError};
 
 // ─── Helpers ───
 
@@ -81,10 +81,62 @@ async fn start_error_server(status: u16, body: &'static str) -> SocketAddr {
     addr
 }
 
+#[derive(Clone)]
+struct MockHttpResponse {
+    status: u16,
+    content_type: &'static str,
+    body: &'static str,
+    headers: Vec<(&'static str, &'static str)>,
+}
+
+async fn start_stateful_http_server(responses: Vec<MockHttpResponse>) -> SocketAddr {
+    let counter = Arc::new(Mutex::new(0usize));
+    let responses = Arc::new(responses);
+
+    let app = Router::new().route(
+        "/{*path}",
+        post(move || {
+            let counter = counter.clone();
+            let responses = responses.clone();
+            async move {
+                let mut idx = counter.lock().unwrap();
+                let response = if *idx < responses.len() {
+                    responses[*idx].clone()
+                } else {
+                    responses
+                        .last()
+                        .expect("expected at least one HTTP response")
+                        .clone()
+                };
+                *idx += 1;
+
+                let mut builder = Response::builder()
+                    .status(StatusCode::from_u16(response.status).unwrap())
+                    .header("content-type", response.content_type);
+                for (name, value) in &response.headers {
+                    builder = builder.header(*name, *value);
+                }
+                builder.body(Body::from(response.body)).unwrap()
+            }
+        }),
+    );
+
+    let listener = tokio::net::TcpListener::bind("127.0.0.1:0").await.unwrap();
+    let addr = listener.local_addr().unwrap();
+    tokio::spawn(async move {
+        axum::serve(listener, app).await.unwrap();
+    });
+    addr
+}
+
 fn simple_messages() -> Vec<Message> {
     vec![
-        Message::System { content: "You are helpful.".to_string() },
-        Message::User { content: "Say hello".to_string() },
+        Message::System {
+            content: "You are helpful.".to_string(),
+        },
+        Message::User {
+            content: "Say hello".to_string(),
+        },
     ]
 }
 
@@ -350,7 +402,10 @@ async fn test_openai_chat_non_streaming() {
     );
 
     // chat() should internally call chat_stream with no-op callback
-    let turn = model.chat(&simple_messages(), &[]).await.expect("chat should succeed");
+    let turn = model
+        .chat(&simple_messages(), &[])
+        .await
+        .expect("chat should succeed");
     assert_eq!(turn.text, "Hello world");
     assert_eq!(turn.input_tokens, 10);
 }
@@ -365,7 +420,10 @@ async fn test_anthropic_chat_non_streaming() {
         None,
     );
 
-    let turn = model.chat(&simple_messages(), &[]).await.expect("chat should succeed");
+    let turn = model
+        .chat(&simple_messages(), &[])
+        .await
+        .expect("chat should succeed");
     assert_eq!(turn.text, "Hello from Claude");
     assert_eq!(turn.input_tokens, 25);
 }
@@ -377,7 +435,8 @@ async fn test_openai_http_error() {
     let addr = start_error_server(
         401,
         r#"{"error":{"message":"Invalid API key","type":"invalid_request_error"}}"#,
-    ).await;
+    )
+    .await;
     let model = OpenAIModel::new(
         "gpt-4o".to_string(),
         "openai".to_string(),
@@ -395,12 +454,50 @@ async fn test_openai_http_error() {
     assert!(result.is_err(), "should fail with HTTP error");
 }
 
+#[tokio::test]
+async fn test_openai_rate_limit_error_includes_retry_after() {
+    let addr = start_stateful_http_server(vec![MockHttpResponse {
+        status: 429,
+        content_type: "application/json",
+        body: r#"{"error":{"message":"Too many requests","code":"1302"}}"#,
+        headers: vec![("retry-after", "3")],
+    }])
+    .await;
+    let model = OpenAIModel::new(
+        "glm-5".to_string(),
+        "zai".to_string(),
+        format!("http://{addr}"),
+        "zai-key".to_string(),
+        Some("high".to_string()),
+        HashMap::new(),
+    )
+    .with_zai_runtime(op_core::model::openai::ZaiRuntimeConfig {
+        paygo_base_url: format!("http://{addr}"),
+        coding_base_url: format!("http://{addr}"),
+        stream_max_retries: 1,
+    });
+
+    let cancel = CancellationToken::new();
+    let error = model
+        .chat_stream(&simple_messages(), &[], &|_| {}, &cancel)
+        .await
+        .expect_err("should fail with a structured rate-limit error");
+
+    let rate_limit = error
+        .downcast_ref::<RateLimitError>()
+        .expect("expected a structured rate-limit error");
+    assert_eq!(rate_limit.status_code, Some(429));
+    assert_eq!(rate_limit.provider_code.as_deref(), Some("1302"));
+    assert_eq!(rate_limit.retry_after_sec, Some(3.0));
+}
+
 #[tokio::test]
 async fn test_anthropic_http_error() {
     let addr = start_error_server(
         401,
         r#"{"type":"error","error":{"type":"authentication_error","message":"invalid x-api-key"}}"#,
-    ).await;
+    )
+    .await;
     let model = AnthropicModel::new(
         "claude-sonnet-4-5".to_string(),
         format!("http://{addr}"),
@@ -421,12 +518,13 @@ async fn test_anthropic_http_error() {
 #[tokio::test]
 async fn test_solve_with_mock_anthropic() {
     use op_core::config::AgentConfig;
-    use op_core::engine::{solve, SolveEmitter};
+    use op_core::engine::{SolveEmitter, solve};
     use op_core::events::StepEvent;
 
     let addr = start_mock_sse_server(ANTHROPIC_SSE_SIMPLE).await;
 
     #[derive(Debug, Clone)]
+    #[allow(dead_code)]
     enum Ev {
         Trace(String),
         Delta(DeltaEvent),
@@ -440,7 +538,10 @@ async fn test_solve_with_mock_anthropic() {
     }
     impl SolveEmitter for TestEmitter {
         fn emit_trace(&self, message: &str) {
-            self.events.lock().unwrap().push(Ev::Trace(message.to_string()));
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev::Trace(message.to_string()));
         }
         fn emit_delta(&self, event: DeltaEvent) {
             self.events.lock().unwrap().push(Ev::Delta(event));
@@ -449,15 +550,23 @@ async fn test_solve_with_mock_anthropic() {
             self.events.lock().unwrap().push(Ev::Step(event));
         }
         fn emit_complete(&self, result: &str) {
-            self.events.lock().unwrap().push(Ev::Complete(result.to_string()));
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev::Complete(result.to_string()));
         }
         fn emit_error(&self, message: &str) {
-            self.events.lock().unwrap().push(Ev::Error(message.to_string()));
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev::Error(message.to_string()));
         }
     }
 
     let events = Arc::new(Mutex::new(Vec::new()));
-    let emitter = TestEmitter { events: events.clone() };
+    let emitter = TestEmitter {
+        events: events.clone(),
+    };
 
     let cfg = AgentConfig {
         provider: "anthropic".into(),
@@ -475,7 +584,9 @@ async fn test_solve_with_mock_anthropic() {
 
     // Should have a trace
     assert!(
-        recorded.iter().any(|e| matches!(e, Ev::Trace(m) if m.contains("anthropic"))),
+        recorded
+            .iter()
+            .any(|e| matches!(e, Ev::Trace(m) if m.contains("anthropic"))),
         "should have a trace mentioning anthropic"
     );
 
@@ -491,13 +602,17 @@ async fn test_solve_with_mock_anthropic() {
 
     // Should have a step
     assert!(
-        recorded.iter().any(|e| matches!(e, Ev::Step(s) if s.is_final && s.tokens.input_tokens == 25)),
+        recorded
+            .iter()
+            .any(|e| matches!(e, Ev::Step(s) if s.is_final && s.tokens.input_tokens == 25)),
         "should have a final step with correct token count"
     );
 
     // Should have complete with the full text
     assert!(
-        recorded.iter().any(|e| matches!(e, Ev::Complete(t) if t == "Hello from Claude")),
+        recorded
+            .iter()
+            .any(|e| matches!(e, Ev::Complete(t) if t == "Hello from Claude")),
         "should complete with full text"
     );
 
@@ -511,7 +626,7 @@ async fn test_solve_with_mock_anthropic() {
 #[tokio::test]
 async fn test_solve_with_mock_openai() {
     use op_core::config::AgentConfig;
-    use op_core::engine::{solve, SolveEmitter};
+    use op_core::engine::{SolveEmitter, solve};
     use op_core::events::StepEvent;
 
     let addr = start_mock_sse_server(OPENAI_SSE_SIMPLE).await;
@@ -531,7 +646,10 @@ async fn test_solve_with_mock_openai() {
     }
     impl SolveEmitter for TestEmitter2 {
         fn emit_trace(&self, message: &str) {
-            self.events.lock().unwrap().push(Ev2::Trace(message.to_string()));
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev2::Trace(message.to_string()));
         }
         fn emit_delta(&self, event: DeltaEvent) {
             self.events.lock().unwrap().push(Ev2::Delta(event));
@@ -540,15 +658,23 @@ async fn test_solve_with_mock_openai() {
             self.events.lock().unwrap().push(Ev2::Step(event));
         }
         fn emit_complete(&self, result: &str) {
-            self.events.lock().unwrap().push(Ev2::Complete(result.to_string()));
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev2::Complete(result.to_string()));
         }
         fn emit_error(&self, message: &str) {
-            self.events.lock().unwrap().push(Ev2::Error(message.to_string()));
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev2::Error(message.to_string()));
         }
     }
 
     let events = Arc::new(Mutex::new(Vec::new()));
-    let emitter = TestEmitter2 { events: events.clone() };
+    let emitter = TestEmitter2 {
+        events: events.clone(),
+    };
 
     let cfg = AgentConfig {
         provider: "openai".into(),
@@ -567,9 +693,17 @@ async fn test_solve_with_mock_openai() {
 
     // Should have a trace mentioning openai
     assert!(
-        recorded.iter().any(|e| matches!(e, Ev2::Trace(m) if m.contains("openai"))),
+        recorded
+            .iter()
+            .any(|e| matches!(e, Ev2::Trace(m) if m.contains("openai"))),
         "should have a trace mentioning openai, got: {:?}",
-        recorded.iter().filter_map(|e| match e { Ev2::Trace(m) => Some(m.clone()), _ => None }).collect::<Vec<_>>()
+        recorded
+            .iter()
+            .filter_map(|e| match e {
+                Ev2::Trace(m) => Some(m.clone()),
+                _ => None,
+            })
+            .collect::<Vec<_>>()
     );
 
     // Should have text deltas that spell "Hello world"
@@ -584,13 +718,17 @@ async fn test_solve_with_mock_openai() {
 
     // Should have a step with correct tokens
     assert!(
-        recorded.iter().any(|e| matches!(e, Ev2::Step(s) if s.is_final && s.tokens.input_tokens == 10)),
+        recorded
+            .iter()
+            .any(|e| matches!(e, Ev2::Step(s) if s.is_final && s.tokens.input_tokens == 10)),
         "should have a final step with 10 input tokens"
     );
 
     // Should complete with the full text
     assert!(
-        recorded.iter().any(|e| matches!(e, Ev2::Complete(t) if t == "Hello world")),
+        recorded
+            .iter()
+            .any(|e| matches!(e, Ev2::Complete(t) if t == "Hello world")),
         "should complete with 'Hello world'"
     );
 
@@ -604,13 +742,10 @@ async fn test_solve_with_mock_openai() {
 #[tokio::test]
 async fn test_solve_http_error_emits_error() {
     use op_core::config::AgentConfig;
-    use op_core::engine::{solve, SolveEmitter};
+    use op_core::engine::{SolveEmitter, solve};
     use op_core::events::StepEvent;
 
-    let addr = start_error_server(
-        401,
-        r#"{"error":{"message":"Invalid API key"}}"#,
-    ).await;
+    let addr = start_error_server(401, r#"{"error":{"message":"Invalid API key"}}"#).await;
 
     struct ErrorEmitter {
         errors: Arc<Mutex<Vec<String>>>,
@@ -626,7 +761,9 @@ async fn test_solve_http_error_emits_error() {
     }
 
     let errors = Arc::new(Mutex::new(Vec::new()));
-    let emitter = ErrorEmitter { errors: errors.clone() };
+    let emitter = ErrorEmitter {
+        errors: errors.clone(),
+    };
 
     let cfg = AgentConfig {
         provider: "openai".into(),
@@ -642,16 +779,117 @@ async fn test_solve_http_error_emits_error() {
     solve("Test", &cfg, &emitter, cancel).await;
 
     let recorded = errors.lock().unwrap().clone();
+    assert!(!recorded.is_empty(), "should emit an error for HTTP 401");
+}
+
+#[tokio::test]
+async fn test_solve_rate_limit_retry_eventually_completes() {
+    use op_core::config::AgentConfig;
+    use op_core::engine::{SolveEmitter, solve};
+    use op_core::events::StepEvent;
+
+    #[derive(Debug, Clone)]
+    #[allow(dead_code)]
+    enum Ev {
+        Trace(String),
+        Complete(String),
+        Error(String),
+    }
+
+    struct RetryEmitter {
+        events: Arc<Mutex<Vec<Ev>>>,
+    }
+
+    impl SolveEmitter for RetryEmitter {
+        fn emit_trace(&self, message: &str) {
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev::Trace(message.to_string()));
+        }
+
+        fn emit_delta(&self, _: DeltaEvent) {}
+
+        fn emit_step(&self, _: StepEvent) {}
+
+        fn emit_complete(&self, result: &str) {
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev::Complete(result.to_string()));
+        }
+
+        fn emit_error(&self, message: &str) {
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev::Error(message.to_string()));
+        }
+    }
+
+    let addr = start_stateful_http_server(vec![
+        MockHttpResponse {
+            status: 429,
+            content_type: "application/json",
+            body: r#"{"error":{"message":"Too many requests","code":"1302"}}"#,
+            headers: vec![("retry-after", "0")],
+        },
+        MockHttpResponse {
+            status: 200,
+            content_type: "text/event-stream",
+            body: OPENAI_SSE_SIMPLE,
+            headers: vec![("cache-control", "no-cache")],
+        },
+    ])
+    .await;
+
+    let events = Arc::new(Mutex::new(Vec::new()));
+    let emitter = RetryEmitter {
+        events: events.clone(),
+    };
+
+    let cfg = AgentConfig {
+        provider: "zai".into(),
+        model: "glm-5".into(),
+        zai_api_key: Some("zai-key".into()),
+        zai_base_url: format!("http://{addr}"),
+        zai_paygo_base_url: format!("http://{addr}"),
+        zai_coding_base_url: format!("http://{addr}"),
+        rate_limit_max_retries: 1,
+        rate_limit_backoff_base_sec: 0.0,
+        rate_limit_backoff_max_sec: 0.0,
+        rate_limit_retry_after_cap_sec: 0.0,
+        zai_stream_max_retries: 1,
+        demo: false,
+        ..Default::default()
+    };
+
+    let cancel = CancellationToken::new();
+    solve("Test", &cfg, &emitter, cancel).await;
+
+    let recorded = events.lock().unwrap().clone();
     assert!(
-        !recorded.is_empty(),
-        "should emit an error for HTTP 401"
+        recorded.iter().any(|event| {
+            matches!(event, Ev::Trace(message) if message.contains("rate limited (1302)"))
+        }),
+        "expected a retry trace after the 429, got: {recorded:?}"
+    );
+    assert!(
+        recorded
+            .iter()
+            .any(|event| matches!(event, Ev::Complete(text) if text == "Hello world")),
+        "expected the solve to complete after retry, got: {recorded:?}"
+    );
+    assert!(
+        !recorded.iter().any(|event| matches!(event, Ev::Error(_))),
+        "did not expect an error after retry success, got: {recorded:?}"
     );
 }
 
 #[tokio::test]
 async fn test_solve_cancel_emits_cancelled() {
     use op_core::config::AgentConfig;
-    use op_core::engine::{solve, SolveEmitter};
+    use op_core::engine::{SolveEmitter, solve};
     use op_core::events::StepEvent;
 
     // Use a server that returns data but we cancel before processing
@@ -671,7 +909,9 @@ async fn test_solve_cancel_emits_cancelled() {
     }
 
     let events = Arc::new(Mutex::new(Vec::new()));
-    let emitter = CancelEmitter { events: events.clone() };
+    let emitter = CancelEmitter {
+        events: events.clone(),
+    };
 
     let cfg = AgentConfig {
         provider: "anthropic".into(),
@@ -697,7 +937,7 @@ async fn test_solve_cancel_emits_cancelled() {
 #[tokio::test]
 async fn test_solve_demo_mode_bypasses_llm() {
     use op_core::config::AgentConfig;
-    use op_core::engine::{solve, SolveEmitter};
+    use op_core::engine::{SolveEmitter, solve};
     use op_core::events::StepEvent;
 
     struct TestEmitter {
@@ -716,7 +956,9 @@ async fn test_solve_demo_mode_bypasses_llm() {
     }
 
     let events = Arc::new(Mutex::new(Vec::new()));
-    let emitter = TestEmitter { events: events.clone() };
+    let emitter = TestEmitter {
+        events: events.clone(),
+    };
 
     let cfg = AgentConfig {
         demo: true,
@@ -736,7 +978,7 @@ async fn test_solve_demo_mode_bypasses_llm() {
 #[tokio::test]
 async fn test_solve_missing_key_emits_error() {
     use op_core::config::AgentConfig;
-    use op_core::engine::{solve, SolveEmitter};
+    use op_core::engine::{SolveEmitter, solve};
     use op_core::events::StepEvent;
 
     struct TestEmitter {
@@ -753,11 +995,17 @@ async fn test_solve_missing_key_emits_error() {
     }
 
     let errors = Arc::new(Mutex::new(Vec::new()));
-    let emitter = TestEmitter { errors: errors.clone() };
+    let emitter = TestEmitter {
+        errors: errors.clone(),
+    };
 
     let cfg = AgentConfig {
         provider: "openai".into(),
         model: "gpt-4o".into(),
+        base_url: "https://api.openai.com/v1".into(),
+        openai_base_url: "https://api.openai.com/v1".into(),
+        api_key: None,
+        openai_api_key: None,
         demo: false,
         // No API key set
         ..Default::default()
@@ -840,14 +1088,12 @@ async fn start_stateful_mock_server(responses: Vec<&'static str>) -> SocketAddr
 #[tokio::test]
 async fn test_solve_multi_step_agentic_loop() {
     use op_core::config::AgentConfig;
-    use op_core::engine::{solve, SolveEmitter};
+    use op_core::engine::{SolveEmitter, solve};
     use op_core::events::StepEvent;
 
     // Mock server: first call → tool call, second call → final answer
-    let addr = start_stateful_mock_server(vec![
-        ANTHROPIC_SSE_TOOL_LIST,
-        ANTHROPIC_SSE_FINAL_ANSWER,
-    ]).await;
+    let addr =
+        start_stateful_mock_server(vec![ANTHROPIC_SSE_TOOL_LIST, ANTHROPIC_SSE_FINAL_ANSWER]).await;
 
     #[derive(Debug, Clone)]
     #[allow(dead_code)]
@@ -864,7 +1110,10 @@ async fn test_solve_multi_step_agentic_loop() {
     }
     impl SolveEmitter for TestEmitter3 {
         fn emit_trace(&self, message: &str) {
-            self.events.lock().unwrap().push(Ev3::Trace(message.to_string()));
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev3::Trace(message.to_string()));
         }
         fn emit_delta(&self, event: DeltaEvent) {
             self.events.lock().unwrap().push(Ev3::Delta(event));
@@ -873,15 +1122,23 @@ async fn test_solve_multi_step_agentic_loop() {
             self.events.lock().unwrap().push(Ev3::Step(event));
         }
         fn emit_complete(&self, result: &str) {
-            self.events.lock().unwrap().push(Ev3::Complete(result.to_string()));
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev3::Complete(result.to_string()));
         }
         fn emit_error(&self, message: &str) {
-            self.events.lock().unwrap().push(Ev3::Error(message.to_string()));
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev3::Error(message.to_string()));
         }
     }
 
     let events = Arc::new(Mutex::new(Vec::new()));
-    let emitter = TestEmitter3 { events: events.clone() };
+    let emitter = TestEmitter3 {
+        events: events.clone(),
+    };
 
     // Use a temp dir as workspace so list_files has something to work with
     let tmp = tempfile::TempDir::new().unwrap();
@@ -930,14 +1187,16 @@ async fn test_solve_multi_step_agentic_loop() {
     );
 
     // Last step should be final
-    assert!(
-        steps.last().unwrap().is_final,
-        "last step should be final"
-    );
+    assert!(steps.last().unwrap().is_final, "last step should be final");
 
     // Should have tool execution trace
-    let has_tool_trace = recorded.iter().any(|e| matches!(e, Ev3::Trace(m) if m.contains("list_files")));
-    assert!(has_tool_trace, "should have a trace mentioning list_files tool execution");
+    let has_tool_trace = recorded
+        .iter()
+        .any(|e| matches!(e, Ev3::Trace(m) if m.contains("list_files")));
+    assert!(
+        has_tool_trace,
+        "should have a trace mentioning list_files tool execution"
+    );
 
     // Should have text deltas from both steps
     let text_content: String = recorded
@@ -958,7 +1217,9 @@ async fn test_solve_multi_step_agentic_loop() {
 
     // Should complete with the final answer text
     assert!(
-        recorded.iter().any(|e| matches!(e, Ev3::Complete(t) if t.contains("Here is the answer"))),
+        recorded
+            .iter()
+            .any(|e| matches!(e, Ev3::Complete(t) if t.contains("Here is the answer"))),
         "should complete with the final answer"
     );
 
diff --git a/openplanter-desktop/crates/op-tauri/Cargo.toml b/openplanter-desktop/crates/op-tauri/Cargo.toml
index 8b7200bb..a70210ef 100644
--- a/openplanter-desktop/crates/op-tauri/Cargo.toml
+++ b/openplanter-desktop/crates/op-tauri/Cargo.toml
@@ -11,7 +11,6 @@ tauri-plugin-shell = "2"
 tokio = { workspace = true }
 serde = { workspace = true }
 serde_json = { workspace = true }
-uuid = { workspace = true }
 chrono = { workspace = true }
 tokio-util = { workspace = true }
 regex = { workspace = true }
diff --git a/openplanter-desktop/crates/op-tauri/src/bridge.rs b/openplanter-desktop/crates/op-tauri/src/bridge.rs
index 8904bd1d..bc8aa326 100644
--- a/openplanter-desktop/crates/op-tauri/src/bridge.rs
+++ b/openplanter-desktop/crates/op-tauri/src/bridge.rs
@@ -10,7 +10,9 @@ use std::sync::{Arc, Mutex};
 use tauri::{AppHandle, Emitter};
 
 use op_core::engine::SolveEmitter;
-use op_core::events::{CompleteEvent, CuratorUpdateEvent, DeltaEvent, DeltaKind, ErrorEvent, StepEvent, TraceEvent};
+use op_core::events::{
+    CompleteEvent, CuratorUpdateEvent, DeltaEvent, DeltaKind, ErrorEvent, StepEvent, TraceEvent,
+};
 use op_core::session::replay::{ReplayEntry, ReplayLogger, StepToolCallEntry};
 
 pub struct TauriEmitter {
@@ -35,12 +37,18 @@ impl SolveEmitter for TauriEmitter {
     }
 
     fn emit_delta(&self, event: DeltaEvent) {
-        eprintln!("[bridge] delta: kind={:?} text={:?}", event.kind, event.text);
+        eprintln!(
+            "[bridge] delta: kind={:?} text={:?}",
+            event.kind, event.text
+        );
         let _ = self.handle.emit("agent:delta", event);
     }
 
     fn emit_step(&self, event: StepEvent) {
-        eprintln!("[bridge] step: depth={} step={} is_final={}", event.depth, event.step, event.is_final);
+        eprintln!(
+            "[bridge] step: depth={} step={} is_final={}",
+            event.depth, event.step, event.is_final
+        );
         let _ = self.handle.emit("agent:step", event);
     }
 
@@ -172,7 +180,11 @@ impl<E: SolveEmitter> SolveEmitter for LoggingEmitter<E> {
         let model_preview = {
             let buf = self.streaming_buf.lock().unwrap();
             let trimmed = buf.trim().to_string();
-            if trimmed.is_empty() { None } else { Some(trimmed) }
+            if trimmed.is_empty() {
+                None
+            } else {
+                Some(trimmed)
+            }
         };
 
         let step_tools: Vec<StepToolCallEntry> = {
@@ -327,7 +339,12 @@ mod tests {
         assert_eq!(step.step_number, Some(1));
         assert!(step.step_tokens_in.is_some());
         assert!(step.step_model_preview.is_some());
-        assert!(step.step_model_preview.as_ref().unwrap().contains("Test persistence"));
+        assert!(
+            step.step_model_preview
+                .as_ref()
+                .unwrap()
+                .contains("Test persistence")
+        );
 
         let assistant = entries.iter().find(|e| e.role == "assistant");
         assert!(assistant.is_some(), "expected an assistant entry");
@@ -355,20 +372,23 @@ mod tests {
 
         // 1. Log user message
         let mut replay = ReplayLogger::new(tmp.path());
-        replay.append(ReplayEntry {
-            seq: 0,
-            timestamp: String::new(),
-            role: "user".into(),
-            content: "Roundtrip test".into(),
-            tool_name: None,
-            is_rendered: None,
-            step_number: None,
-            step_tokens_in: None,
-            step_tokens_out: None,
-            step_elapsed: None,
-            step_model_preview: None,
-            step_tool_calls: None,
-        }).await.unwrap();
+        replay
+            .append(ReplayEntry {
+                seq: 0,
+                timestamp: String::new(),
+                role: "user".into(),
+                content: "Roundtrip test".into(),
+                tool_name: None,
+                is_rendered: None,
+                step_number: None,
+                step_tokens_in: None,
+                step_tokens_out: None,
+                step_elapsed: None,
+                step_model_preview: None,
+                step_tool_calls: None,
+            })
+            .await
+            .unwrap();
 
         // 2. Run demo_solve through LoggingEmitter
         let emitter = LoggingEmitter::new(NullEmitter, replay);
@@ -377,7 +397,11 @@ mod tests {
 
         // 3. Read back full conversation
         let entries = ReplayLogger::read_all(tmp.path()).await.unwrap();
-        assert!(entries.len() >= 3, "expected user + step-summary + assistant, got {}", entries.len());
+        assert!(
+            entries.len() >= 3,
+            "expected user + step-summary + assistant, got {}",
+            entries.len()
+        );
 
         assert_eq!(entries[0].role, "user");
         assert_eq!(entries[0].content, "Roundtrip test");
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
index 2144ab50..fc40649b 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
@@ -67,12 +67,7 @@ pub async fn solve(
         if let Err(e) = result {
             let msg = format!("Internal error: {e}");
             eprintln!("[bridge] panic: {msg}");
-            let _ = error_handle.emit(
-                "agent:error",
-                op_core::events::ErrorEvent {
-                    message: msg,
-                },
-            );
+            let _ = error_handle.emit("agent:error", op_core::events::ErrorEvent { message: msg });
         }
     });
 
@@ -81,9 +76,7 @@ pub async fn solve(
 
 /// Cancel a running solve.
 #[tauri::command]
-pub async fn cancel(
-    state: State<'_, AppState>,
-) -> Result<(), String> {
+pub async fn cancel(state: State<'_, AppState>) -> Result<(), String> {
     let token = state.cancel_token.lock().await;
     token.cancel();
     Ok(())
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/config.rs b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
index 2015140c..7bfecbc6 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/config.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
@@ -1,28 +1,65 @@
-use std::collections::HashMap;
-use tauri::State;
 use crate::state::AppState;
+use op_core::config::{normalize_web_search_provider, normalize_zai_plan, resolve_zai_base_url};
+use op_core::credentials::credentials_from_env;
 use op_core::events::{ConfigView, ModelInfo, PartialConfig};
 use op_core::settings::{PersistentSettings, SettingsStore};
-use op_core::credentials::credentials_from_env;
+use std::collections::HashMap;
+use tauri::State;
 
-/// Get the current configuration.
-#[tauri::command]
-pub async fn get_config(
-    state: State<'_, AppState>,
-) -> Result<ConfigView, String> {
-    let cfg = state.config.lock().await;
-    let session_id = state.session_id.lock().await;
-    Ok(ConfigView {
+fn make_config_view(cfg: &op_core::config::AgentConfig, session_id: Option<String>) -> ConfigView {
+    ConfigView {
         provider: cfg.provider.clone(),
         model: cfg.model.clone(),
         reasoning_effort: cfg.reasoning_effort.clone(),
+        zai_plan: cfg.zai_plan.clone(),
+        web_search_provider: cfg.web_search_provider.clone(),
         workspace: cfg.workspace.display().to_string(),
-        session_id: session_id.clone(),
+        session_id,
         recursive: cfg.recursive,
         max_depth: cfg.max_depth,
         max_steps_per_call: cfg.max_steps_per_call,
         demo: cfg.demo,
-    })
+    }
+}
+
+fn merge_settings(
+    existing: PersistentSettings,
+    incoming: PersistentSettings,
+) -> PersistentSettings {
+    PersistentSettings {
+        default_model: incoming.default_model.or(existing.default_model),
+        default_reasoning_effort: incoming
+            .default_reasoning_effort
+            .or(existing.default_reasoning_effort),
+        default_model_openai: incoming
+            .default_model_openai
+            .or(existing.default_model_openai),
+        default_model_anthropic: incoming
+            .default_model_anthropic
+            .or(existing.default_model_anthropic),
+        default_model_openrouter: incoming
+            .default_model_openrouter
+            .or(existing.default_model_openrouter),
+        default_model_cerebras: incoming
+            .default_model_cerebras
+            .or(existing.default_model_cerebras),
+        default_model_zai: incoming.default_model_zai.or(existing.default_model_zai),
+        default_model_ollama: incoming
+            .default_model_ollama
+            .or(existing.default_model_ollama),
+        zai_plan: incoming.zai_plan.or(existing.zai_plan),
+        web_search_provider: incoming
+            .web_search_provider
+            .or(existing.web_search_provider),
+    }
+}
+
+/// Get the current configuration.
+#[tauri::command]
+pub async fn get_config(state: State<'_, AppState>) -> Result<ConfigView, String> {
+    let cfg = state.config.lock().await;
+    let session_id = state.session_id.lock().await;
+    Ok(make_config_view(&cfg, session_id.clone()))
 }
 
 /// Update configuration fields.
@@ -45,35 +82,35 @@ pub async fn update_config(
             Some(effort)
         };
     }
+    if let Some(plan) = partial.zai_plan {
+        cfg.zai_plan = normalize_zai_plan(Some(&plan));
+        cfg.zai_base_url = resolve_zai_base_url(
+            &cfg.zai_plan,
+            &cfg.zai_paygo_base_url,
+            &cfg.zai_coding_base_url,
+        );
+    }
+    if let Some(provider) = partial.web_search_provider {
+        cfg.web_search_provider = normalize_web_search_provider(Some(&provider));
+    }
     let session_id = state.session_id.lock().await;
-    Ok(ConfigView {
-        provider: cfg.provider.clone(),
-        model: cfg.model.clone(),
-        reasoning_effort: cfg.reasoning_effort.clone(),
-        workspace: cfg.workspace.display().to_string(),
-        session_id: session_id.clone(),
-        recursive: cfg.recursive,
-        max_depth: cfg.max_depth,
-        max_steps_per_call: cfg.max_steps_per_call,
-        demo: cfg.demo,
-    })
+    Ok(make_config_view(&cfg, session_id.clone()))
 }
 
 /// Known models per provider for listing.
 fn known_models_for_provider(provider: &str) -> Vec<ModelInfo> {
     let models: Vec<(&str, &str)> = match provider {
         "openai" => vec![
-            ("gpt-5.2", "GPT-5.2"),
-            ("gpt-4o", "GPT-4o"),
-            ("gpt-4o-mini", "GPT-4o Mini"),
-            ("o1", "o1"),
-            ("o3", "o3"),
-            ("o4-mini", "o4-mini"),
+            ("azure-foundry/gpt-5.3-codex", "GPT-5.3 Codex (Foundry)"),
+            ("azure-foundry/Kimi-K2.5", "Kimi K2.5 (Foundry)"),
         ],
         "anthropic" => vec![
-            ("claude-opus-4-6", "Claude Opus 4.6"),
-            ("claude-sonnet-4-5", "Claude Sonnet 4.5"),
-            ("claude-haiku-4-5", "Claude Haiku 4.5"),
+            ("anthropic-foundry/claude-opus-4-6", "Claude Opus 4.6 (Foundry)"),
+            (
+                "anthropic-foundry/claude-sonnet-4-6",
+                "Claude Sonnet 4.6 (Foundry)",
+            ),
+            ("anthropic-foundry/claude-haiku-4-5", "Claude Haiku 4.5 (Foundry)"),
         ],
         "openrouter" => vec![
             ("anthropic/claude-sonnet-4-5", "Claude Sonnet 4.5 (OR)"),
@@ -84,6 +121,11 @@ fn known_models_for_provider(provider: &str) -> Vec<ModelInfo> {
             ("qwen-3-235b-a22b-instruct-2507", "Qwen-3 235B"),
             ("llama-4-scout-17b-16e-instruct", "Llama-4 Scout"),
         ],
+        "zai" => vec![
+            ("glm-5", "GLM-5"),
+            ("glm-4.6", "GLM-4.6"),
+            ("zai-glm-4.6", "Z.AI GLM 4.6"),
+        ],
         "ollama" => vec![
             ("llama3.2", "Llama 3.2"),
             ("mistral", "Mistral"),
@@ -113,7 +155,14 @@ pub async fn list_models(
 ) -> Result<Vec<ModelInfo>, String> {
     if provider == "all" {
         let mut all = Vec::new();
-        for p in &["openai", "anthropic", "openrouter", "cerebras", "ollama"] {
+        for p in &[
+            "openai",
+            "anthropic",
+            "openrouter",
+            "cerebras",
+            "zai",
+            "ollama",
+        ] {
             all.extend(known_models_for_provider(p));
         }
         Ok(all)
@@ -130,7 +179,8 @@ pub async fn save_settings(
 ) -> Result<(), String> {
     let cfg = state.config.lock().await;
     let store = SettingsStore::new(&cfg.workspace, &cfg.session_root_dir);
-    store.save(&settings).map_err(|e| e.to_string())
+    let merged = merge_settings(store.load(), settings);
+    store.save(&merged).map_err(|e| e.to_string())
 }
 
 /// Build credential status from config: which providers/services have API keys configured.
@@ -140,8 +190,10 @@ pub fn build_credential_status(cfg: &op_core::config::AgentConfig) -> HashMap<St
     status.insert("anthropic".to_string(), cfg.anthropic_api_key.is_some());
     status.insert("openrouter".to_string(), cfg.openrouter_api_key.is_some());
     status.insert("cerebras".to_string(), cfg.cerebras_api_key.is_some());
+    status.insert("zai".to_string(), cfg.zai_api_key.is_some());
     status.insert("ollama".to_string(), true); // Ollama never needs a key
     status.insert("exa".to_string(), cfg.exa_api_key.is_some());
+    status.insert("firecrawl".to_string(), cfg.firecrawl_api_key.is_some());
     status
 }
 
@@ -170,11 +222,19 @@ pub async fn get_credentials_status(
         "cerebras".to_string(),
         cfg.cerebras_api_key.is_some() || env_creds.cerebras_api_key.is_some(),
     );
+    status.insert(
+        "zai".to_string(),
+        cfg.zai_api_key.is_some() || env_creds.zai_api_key.is_some(),
+    );
     status.insert("ollama".to_string(), true); // Ollama never needs a key
     status.insert(
         "exa".to_string(),
         cfg.exa_api_key.is_some() || env_creds.exa_api_key.is_some(),
     );
+    status.insert(
+        "firecrawl".to_string(),
+        cfg.firecrawl_api_key.is_some() || env_creds.firecrawl_api_key.is_some(),
+    );
     Ok(status)
 }
 
@@ -215,29 +275,48 @@ mod tests {
         assert!(!models.is_empty(), "ollama should have known models");
     }
 
+    #[test]
+    fn test_zai_models_nonempty() {
+        let models = known_models_for_provider("zai");
+        assert!(!models.is_empty(), "zai should have known models");
+    }
+
     #[test]
     fn test_unknown_provider_empty() {
         let models = known_models_for_provider("foo");
-        assert!(models.is_empty(), "unknown provider should return empty vec");
+        assert!(
+            models.is_empty(),
+            "unknown provider should return empty vec"
+        );
     }
 
     #[test]
     fn test_all_providers_model_ids_unique() {
         let mut all_ids = HashSet::new();
-        for p in &["openai", "anthropic", "openrouter", "cerebras", "ollama"] {
+        for p in &[
+            "openai",
+            "anthropic",
+            "openrouter",
+            "cerebras",
+            "zai",
+            "ollama",
+        ] {
             for m in known_models_for_provider(p) {
-                assert!(
-                    all_ids.insert(m.id.clone()),
-                    "duplicate model ID: {}",
-                    m.id
-                );
+                assert!(all_ids.insert(m.id.clone()), "duplicate model ID: {}", m.id);
             }
         }
     }
 
     #[test]
     fn test_model_info_fields() {
-        for provider in &["openai", "anthropic", "openrouter", "cerebras", "ollama"] {
+        for provider in &[
+            "openai",
+            "anthropic",
+            "openrouter",
+            "cerebras",
+            "zai",
+            "ollama",
+        ] {
             for m in known_models_for_provider(provider) {
                 assert!(!m.id.is_empty(), "model id should not be empty");
                 assert!(m.name.is_some(), "model name should be Some for {}", m.id);
@@ -257,11 +336,15 @@ mod tests {
         cfg.anthropic_api_key = None;
         cfg.openrouter_api_key = None;
         cfg.cerebras_api_key = None;
+        cfg.zai_api_key = None;
+        cfg.exa_api_key = None;
+        cfg.firecrawl_api_key = None;
         let status = build_credential_status(&cfg);
         assert_eq!(status["openai"], false);
         assert_eq!(status["anthropic"], false);
         assert_eq!(status["openrouter"], false);
         assert_eq!(status["cerebras"], false);
+        assert_eq!(status["zai"], false);
         assert_eq!(status["ollama"], true, "ollama always true");
     }
 
@@ -272,6 +355,7 @@ mod tests {
         cfg.anthropic_api_key = None;
         cfg.openrouter_api_key = None;
         cfg.cerebras_api_key = None;
+        cfg.zai_api_key = None;
         let status = build_credential_status(&cfg);
         assert_eq!(status["openai"], true);
         assert_eq!(status["anthropic"], false);
@@ -296,6 +380,7 @@ mod tests {
         cfg.anthropic_api_key = None;
         cfg.openrouter_api_key = None;
         cfg.cerebras_api_key = None;
+        cfg.zai_api_key = None;
         let status = build_credential_status(&cfg);
         assert_eq!(status["ollama"], true);
     }
@@ -307,7 +392,9 @@ mod tests {
         cfg.anthropic_api_key = Some("k2".to_string());
         cfg.openrouter_api_key = Some("k3".to_string());
         cfg.cerebras_api_key = Some("k4".to_string());
-        cfg.exa_api_key = Some("k5".to_string());
+        cfg.zai_api_key = Some("k5".to_string());
+        cfg.exa_api_key = Some("k6".to_string());
+        cfg.firecrawl_api_key = Some("k7".to_string());
         let status = build_credential_status(&cfg);
         for (provider, has_key) in &status {
             assert!(has_key, "{} should be true when key is set", provider);
@@ -315,9 +402,13 @@ mod tests {
     }
 
     #[test]
-    fn test_cred_status_has_six_entries() {
+    fn test_cred_status_has_eight_entries() {
         let cfg = op_core::config::AgentConfig::from_env("/nonexistent");
         let status = build_credential_status(&cfg);
-        assert_eq!(status.len(), 6, "should have 6 entries (5 providers + exa)");
+        assert_eq!(
+            status.len(),
+            8,
+            "should have 8 entries (6 providers + 2 web services)"
+        );
     }
 }
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/session.rs b/openplanter-desktop/crates/op-tauri/src/commands/session.rs
index cc975958..5cc8348c 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/session.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/session.rs
@@ -1,9 +1,9 @@
-use std::fs;
-use std::path::{Path, PathBuf};
-use tauri::State;
 use crate::state::AppState;
 use op_core::events::SessionInfo;
 use op_core::session::replay::{ReplayEntry, ReplayLogger};
+use std::fs;
+use std::path::{Path, PathBuf};
+use tauri::State;
 
 /// Get the sessions directory path from config.
 pub async fn sessions_dir(state: &State<'_, AppState>) -> PathBuf {
@@ -54,11 +54,7 @@ pub fn create_session(dir: &Path) -> Result<SessionInfo, std::io::Error> {
     fs::create_dir_all(dir)?;
 
     let now = chrono::Utc::now();
-    let new_id = format!(
-        "{}-{:08x}",
-        now.format("%Y%m%d-%H%M%S"),
-        rand_hex()
-    );
+    let new_id = format!("{}-{:08x}", now.format("%Y%m%d-%H%M%S"), rand_hex());
 
     let session_dir = dir.join(&new_id);
     fs::create_dir_all(&session_dir)?;
@@ -120,10 +116,7 @@ pub async fn open_session(
 
 /// Delete a session by removing its directory.
 #[tauri::command]
-pub async fn delete_session(
-    id: String,
-    state: State<'_, AppState>,
-) -> Result<(), String> {
+pub async fn delete_session(id: String, state: State<'_, AppState>) -> Result<(), String> {
     let dir = sessions_dir(&state).await;
     let session_dir = dir.join(&id);
 
@@ -135,7 +128,9 @@ pub async fn delete_session(
     }
     // Ensure it's actually a session directory (has metadata.json)
     if !session_dir.join("metadata.json").exists() {
-        return Err(format!("Session '{id}' has no metadata — refusing to delete"));
+        return Err(format!(
+            "Session '{id}' has no metadata — refusing to delete"
+        ));
     }
 
     fs::remove_dir_all(&session_dir).map_err(|e| format!("Failed to delete session: {e}"))?;
@@ -156,7 +151,9 @@ pub async fn get_session_history(
     state: State<'_, AppState>,
 ) -> Result<Vec<ReplayEntry>, String> {
     let dir = sessions_dir(&state).await.join(&session_id);
-    ReplayLogger::read_all(&dir).await.map_err(|e| e.to_string())
+    ReplayLogger::read_all(&dir)
+        .await
+        .map_err(|e| e.to_string())
 }
 
 /// Update session metadata: increment turn_count, set last_objective.
@@ -172,13 +169,11 @@ pub async fn update_session_metadata(
     let mut info: SessionInfo = serde_json::from_str(&content)
         .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
     info.turn_count += 1;
-    info.last_objective = Some(
-        if objective.len() > 100 {
-            format!("{}...", &objective[..97])
-        } else {
-            objective.to_string()
-        },
-    );
+    info.last_objective = Some(if objective.len() > 100 {
+        format!("{}...", &objective[..97])
+    } else {
+        objective.to_string()
+    });
     let json = serde_json::to_string_pretty(&info)
         .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
     tokio::fs::write(&meta_path, json).await
@@ -317,8 +312,14 @@ mod tests {
         let info = create_session(&dir).unwrap();
         let session_dir = dir.join(&info.id);
         assert!(session_dir.exists(), "session dir should exist");
-        assert!(session_dir.join("artifacts").exists(), "artifacts/ should exist");
-        assert!(session_dir.join("metadata.json").exists(), "metadata.json should exist");
+        assert!(
+            session_dir.join("artifacts").exists(),
+            "artifacts/ should exist"
+        );
+        assert!(
+            session_dir.join("metadata.json").exists(),
+            "metadata.json should exist"
+        );
     }
 
     #[test]
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/wiki.rs b/openplanter-desktop/crates/op-tauri/src/commands/wiki.rs
index de84697e..53df0a6e 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/wiki.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/wiki.rs
@@ -1,16 +1,15 @@
+use crate::state::AppState;
+use op_core::events::{GraphData, GraphEdge, GraphNode, NodeType};
+use regex::Regex;
 use std::collections::{HashMap, HashSet};
 use std::fs;
 use std::path::{Path, PathBuf};
 use std::sync::LazyLock;
-use regex::Regex;
 use tauri::State;
-use crate::state::AppState;
-use op_core::events::{GraphData, GraphEdge, GraphNode, NodeType};
 
 static LINK_RE: LazyLock<Regex> =
     LazyLock::new(|| Regex::new(r"\[([^\]]+)\]\(([^)]+\.md)\)").unwrap());
-static CATEGORY_RE: LazyLock<Regex> =
-    LazyLock::new(|| Regex::new(r"^#{2,3}\s+(.+)").unwrap());
+static CATEGORY_RE: LazyLock<Regex> = LazyLock::new(|| Regex::new(r"^#{2,3}\s+(.+)").unwrap());
 
 /// Walk up from `start` to find a directory containing `wiki/index.md`.
 /// Checks both `.openplanter/wiki/` (preferred) and `wiki/` at each level.
@@ -117,27 +116,47 @@ pub fn parse_index_nodes(content: &str) -> Vec<GraphNode> {
 /// Extract distinctive search terms from a node's label for text-based matching.
 fn search_terms_for_node(node: &GraphNode) -> Vec<String> {
     let stopwords: HashSet<&str> = [
-        "a", "an", "the", "of", "and", "or", "in", "to", "for", "by",
-        "on", "at", "is", "it", "its", "us", "gov", "list",
-    ].into_iter().collect();
+        "a", "an", "the", "of", "and", "or", "in", "to", "for", "by", "on", "at", "is", "it",
+        "its", "us", "gov", "list",
+    ]
+    .into_iter()
+    .collect();
 
     let generic: HashSet<&str> = [
-        "federal", "state", "united", "states", "government", "bureau",
-        "department", "database", "national", "public",
-    ].into_iter().collect();
+        "federal",
+        "state",
+        "united",
+        "states",
+        "government",
+        "bureau",
+        "department",
+        "database",
+        "national",
+        "public",
+    ]
+    .into_iter()
+    .collect();
 
     let mut terms = Vec::new();
 
     // Full label (lowercased)
     terms.push(node.label.to_lowercase());
 
-    for word in node.label.split(|c: char| c.is_whitespace() || c == '/' || c == '(' || c == ')') {
-        let clean: String = word.chars()
+    for word in node
+        .label
+        .split(|c: char| c.is_whitespace() || c == '/' || c == '(' || c == ')')
+    {
+        let clean: String = word
+            .chars()
             .filter(|c| c.is_alphanumeric() || *c == '.' || *c == '-')
             .collect();
-        if clean.is_empty() { continue; }
+        if clean.is_empty() {
+            continue;
+        }
         let lower = clean.to_lowercase();
-        if stopwords.contains(lower.as_str()) { continue; }
+        if stopwords.contains(lower.as_str()) {
+            continue;
+        }
 
         // Acronyms: all uppercase, >= 2 chars (OCPF, FEC, EDGAR, FDIC, etc.)
         let alpha_chars: String = clean.chars().filter(|c| c.is_alphabetic()).collect();
@@ -165,15 +184,16 @@ pub fn find_cross_references(nodes: &[GraphNode], wiki_dir: &Path) -> Vec<GraphE
     let mut seen: HashSet<(String, String)> = HashSet::new();
 
     // Pre-compute search terms for all nodes
-    let node_terms: Vec<Vec<String>> = nodes.iter()
-        .map(|n| search_terms_for_node(n))
-        .collect();
+    let node_terms: Vec<Vec<String>> = nodes.iter().map(|n| search_terms_for_node(n)).collect();
 
     // Read all file contents upfront
-    let file_contents: HashMap<String, String> = nodes.iter()
+    let file_contents: HashMap<String, String> = nodes
+        .iter()
         .filter_map(|node| {
             let file_path = wiki_dir.join(&node.path);
-            fs::read_to_string(&file_path).ok().map(|c| (node.id.clone(), c))
+            fs::read_to_string(&file_path)
+                .ok()
+                .map(|c| (node.id.clone(), c))
         })
         .collect();
 
@@ -207,11 +227,17 @@ pub fn find_cross_references(nodes: &[GraphNode], wiki_dir: &Path) -> Vec<GraphE
         // 2. Text-based mention edges
         let content_lower = file_content.to_lowercase();
         for (j, other) in nodes.iter().enumerate() {
-            if i == j { continue; }
+            if i == j {
+                continue;
+            }
             let key = (node.id.clone(), other.id.clone());
-            if seen.contains(&key) { continue; }
+            if seen.contains(&key) {
+                continue;
+            }
 
-            let matched = node_terms[j].iter().any(|term| content_lower.contains(term.as_str()));
+            let matched = node_terms[j]
+                .iter()
+                .any(|term| content_lower.contains(term.as_str()));
             if matched {
                 seen.insert(key);
                 edges.push(GraphEdge {
@@ -490,7 +516,8 @@ pub fn parse_source_file(
     // Post-process: remove childless sections and empty-content facts
     let node_ids: HashSet<String> = nodes.iter().map(|n| n.id.clone()).collect();
     // Find section IDs that are the source of at least one structural child edge
-    let parent_section_ids: HashSet<&str> = edges.iter()
+    let parent_section_ids: HashSet<&str> = edges
+        .iter()
         .filter(|e| {
             let label = e.label.as_deref().unwrap_or("");
             (label == "has-section" || label == "contains") && node_ids.contains(&e.target)
@@ -499,7 +526,8 @@ pub fn parse_source_file(
         .collect();
 
     // IDs to remove: childless sections + empty-content facts
-    let remove_ids: HashSet<String> = nodes.iter()
+    let remove_ids: HashSet<String> = nodes
+        .iter()
         .filter(|n| {
             match n.node_type.as_ref() {
                 Some(NodeType::Section) => !parent_section_ids.contains(n.id.as_str()),
@@ -554,9 +582,10 @@ pub fn extract_cross_ref_edges(
             continue;
         }
         // Check if this fact is under a cross-reference section
-        let in_cross_ref = node.parent_id.as_ref().map_or(false, |pid| {
-            pid.contains("cross-reference")
-        });
+        let in_cross_ref = node
+            .parent_id
+            .as_ref()
+            .map_or(false, |pid| pid.contains("cross-reference"));
         if !in_cross_ref {
             continue;
         }
@@ -604,15 +633,21 @@ pub fn find_shared_field_edges(all_nodes: &[GraphNode]) -> Vec<GraphEdge> {
             continue;
         }
         // Check if this fact is under a data-schema section
-        let in_data_schema = node.parent_id.as_ref().map_or(false, |pid| {
-            pid.contains("data-schema")
-        });
+        let in_data_schema = node
+            .parent_id
+            .as_ref()
+            .map_or(false, |pid| pid.contains("data-schema"));
         if !in_data_schema {
             continue;
         }
 
         // Normalize field name: lowercase, strip backticks
-        let normalized = node.label.to_lowercase().replace('`', "").trim().to_string();
+        let normalized = node
+            .label
+            .to_lowercase()
+            .replace('`', "")
+            .trim()
+            .to_string();
         if !normalized.is_empty() {
             field_map.entry(normalized).or_default().push(node);
         }
@@ -651,13 +686,16 @@ pub fn find_shared_field_edges(all_nodes: &[GraphNode]) -> Vec<GraphEdge> {
 
 /// Get the wiki knowledge graph data by parsing wiki/index.md and all source files.
 #[tauri::command]
-pub async fn get_graph_data(
-    state: State<'_, AppState>,
-) -> Result<GraphData, String> {
+pub async fn get_graph_data(state: State<'_, AppState>) -> Result<GraphData, String> {
     let cfg = state.config.lock().await;
     let wiki_dir = match find_wiki_dir(&cfg.workspace) {
         Some(d) => d,
-        None => return Ok(GraphData { nodes: vec![], edges: vec![] }),
+        None => {
+            return Ok(GraphData {
+                nodes: vec![],
+                edges: vec![],
+            });
+        }
     };
 
     let index_path = wiki_dir.join("index.md");
@@ -690,15 +728,15 @@ pub async fn get_graph_data(
     let shared_field_edges = find_shared_field_edges(&all_nodes);
     all_edges.extend(shared_field_edges);
 
-    Ok(GraphData { nodes: all_nodes, edges: all_edges })
+    Ok(GraphData {
+        nodes: all_nodes,
+        edges: all_edges,
+    })
 }
 
 /// Read a wiki markdown file's contents, given a relative path like "wiki/fec.md".
 #[tauri::command]
-pub async fn read_wiki_file(
-    path: String,
-    state: State<'_, AppState>,
-) -> Result<String, String> {
+pub async fn read_wiki_file(path: String, state: State<'_, AppState>) -> Result<String, String> {
     // Validate: must end in .md
     if !path.ends_with(".md") {
         return Err("Path must end in .md".into());
@@ -713,14 +751,16 @@ pub async fn read_wiki_file(
     }
 
     let cfg = state.config.lock().await;
-    let wiki_dir = find_wiki_dir(&cfg.workspace)
-        .ok_or_else(|| "Wiki directory not found".to_string())?;
+    let wiki_dir =
+        find_wiki_dir(&cfg.workspace).ok_or_else(|| "Wiki directory not found".to_string())?;
 
     let project_root = wiki_dir.parent().unwrap_or(&cfg.workspace);
     let resolved = project_root.join(&path);
 
     // Canonicalize and verify it's under the wiki dir
-    let canonical = resolved.canonicalize().map_err(|e| format!("File not found: {e}"))?;
+    let canonical = resolved
+        .canonicalize()
+        .map_err(|e| format!("File not found: {e}"))?;
     let canon_wiki = wiki_dir.canonicalize().map_err(|e| e.to_string())?;
     if !canonical.starts_with(&canon_wiki) {
         return Err("Path is outside wiki directory".into());
@@ -862,7 +902,9 @@ mod tests {
             label: "A".to_string(),
             category: "test".to_string(),
             path: "wiki/a.md".to_string(),
-            node_type: None, parent_id: None, content: None,
+            node_type: None,
+            parent_id: None,
+            content: None,
         }];
         let edges = find_cross_references(&nodes, tmp.path());
         assert!(edges.is_empty());
@@ -883,14 +925,18 @@ mod tests {
                 label: "A".to_string(),
                 category: "test".to_string(),
                 path: "wiki/a.md".to_string(),
-                node_type: None, parent_id: None, content: None,
+                node_type: None,
+                parent_id: None,
+                content: None,
             },
             GraphNode {
                 id: "b".to_string(),
                 label: "B".to_string(),
                 category: "test".to_string(),
                 path: "wiki/b.md".to_string(),
-                node_type: None, parent_id: None, content: None,
+                node_type: None,
+                parent_id: None,
+                content: None,
             },
         ];
         let edges = find_cross_references(&nodes, tmp.path());
@@ -996,7 +1042,10 @@ mod tests {
         // project_root should be .openplanter/ so joining with wiki/fec.md works
         let project_root = found.parent().unwrap();
         let file_path = project_root.join(&nodes[0].path);
-        assert!(file_path.exists(), "should resolve to .openplanter/wiki/fec.md");
+        assert!(
+            file_path.exists(),
+            "should resolve to .openplanter/wiki/fec.md"
+        );
     }
 
     #[test]
@@ -1046,7 +1095,11 @@ mod tests {
         let wiki_dir = tmp.path().join("wiki");
         fs::create_dir_all(&wiki_dir).unwrap();
         // File A mentions EDGAR (from B's label "SEC EDGAR") but doesn't link to it
-        fs::write(wiki_dir.join("a.md"), "Cross-reference with EDGAR filings for details.").unwrap();
+        fs::write(
+            wiki_dir.join("a.md"),
+            "Cross-reference with EDGAR filings for details.",
+        )
+        .unwrap();
         fs::write(wiki_dir.join("b.md"), "# SEC EDGAR\nContent.").unwrap();
 
         let nodes = vec![
@@ -1055,14 +1108,18 @@ mod tests {
                 label: "FEC Data".to_string(),
                 category: "campaign-finance".to_string(),
                 path: "wiki/a.md".to_string(),
-                node_type: None, parent_id: None, content: None,
+                node_type: None,
+                parent_id: None,
+                content: None,
             },
             GraphNode {
                 id: "b".to_string(),
                 label: "SEC EDGAR".to_string(),
                 category: "corporate".to_string(),
                 path: "wiki/b.md".to_string(),
-                node_type: None, parent_id: None, content: None,
+                node_type: None,
+                parent_id: None,
+                content: None,
             },
         ];
         let edges = find_cross_references(&nodes, tmp.path());
@@ -1080,17 +1137,20 @@ mod tests {
         // File A mentions its own label — should not create edge
         fs::write(wiki_dir.join("a.md"), "# EDGAR\nThis is SEC EDGAR data.").unwrap();
 
-        let nodes = vec![
-            GraphNode {
-                id: "a".to_string(),
-                label: "SEC EDGAR".to_string(),
-                category: "corporate".to_string(),
-                path: "wiki/a.md".to_string(),
-                node_type: None, parent_id: None, content: None,
-            },
-        ];
+        let nodes = vec![GraphNode {
+            id: "a".to_string(),
+            label: "SEC EDGAR".to_string(),
+            category: "corporate".to_string(),
+            path: "wiki/a.md".to_string(),
+            node_type: None,
+            parent_id: None,
+            content: None,
+        }];
         let edges = find_cross_references(&nodes, tmp.path());
-        assert!(edges.is_empty(), "should not create self-referencing edge from text mention");
+        assert!(
+            edges.is_empty(),
+            "should not create self-referencing edge from text mention"
+        );
     }
 
     #[test]
@@ -1107,14 +1167,18 @@ mod tests {
                 label: "EPA Data".to_string(),
                 category: "regulatory".to_string(),
                 path: "wiki/a.md".to_string(),
-                node_type: None, parent_id: None, content: None,
+                node_type: None,
+                parent_id: None,
+                content: None,
             },
             GraphNode {
                 id: "b".to_string(),
                 label: "OSHA Inspections".to_string(),
                 category: "regulatory".to_string(),
                 path: "wiki/b.md".to_string(),
-                node_type: None, parent_id: None, content: None,
+                node_type: None,
+                parent_id: None,
+                content: None,
             },
         ];
         let edges = find_cross_references(&nodes, tmp.path());
@@ -1136,14 +1200,18 @@ mod tests {
                 label: "A Data".to_string(),
                 category: "test".to_string(),
                 path: "wiki/a.md".to_string(),
-                node_type: None, parent_id: None, content: None,
+                node_type: None,
+                parent_id: None,
+                content: None,
             },
             GraphNode {
                 id: "b".to_string(),
                 label: "SEC EDGAR".to_string(),
                 category: "corporate".to_string(),
                 path: "wiki/b.md".to_string(),
-                node_type: None, parent_id: None, content: None,
+                node_type: None,
+                parent_id: None,
+                content: None,
             },
         ];
         let edges = find_cross_references(&nodes, tmp.path());
@@ -1163,7 +1231,9 @@ mod tests {
             label: "A".to_string(),
             category: "test".to_string(),
             path: "wiki/a.md".to_string(),
-            node_type: None, parent_id: None, content: None,
+            node_type: None,
+            parent_id: None,
+            content: None,
         }];
         let edges = find_cross_references(&nodes, tmp.path());
         assert!(edges.is_empty(), "self-references should be excluded");
@@ -1174,7 +1244,10 @@ mod tests {
     #[test]
     fn test_slugify_basic() {
         assert_eq!(slugify("Data Schema"), "data-schema");
-        assert_eq!(slugify("Cross-Reference Potential"), "cross-reference-potential");
+        assert_eq!(
+            slugify("Cross-Reference Potential"),
+            "cross-reference-potential"
+        );
         assert_eq!(slugify("Legal & Licensing"), "legal-licensing");
         assert_eq!(slugify("  multiple   spaces  "), "multiple-spaces");
     }
@@ -1258,13 +1331,19 @@ mod tests {
         let (nodes, edges) = parse_source_file(&source, content);
         // Data Schema + 2 subsections + 2 facts = 5
         assert_eq!(nodes.len(), 5);
-        let sections: Vec<_> = nodes.iter().filter(|n| n.node_type == Some(NodeType::Section)).collect();
+        let sections: Vec<_> = nodes
+            .iter()
+            .filter(|n| n.node_type == Some(NodeType::Section))
+            .collect();
         assert_eq!(sections.len(), 3);
         // Subsections are children of the h2
         assert_eq!(sections[1].parent_id.as_deref(), Some("fec::data-schema"));
         assert_eq!(sections[2].parent_id.as_deref(), Some("fec::data-schema"));
         // has-section edges
-        let has_section: Vec<_> = edges.iter().filter(|e| e.label.as_deref() == Some("has-section")).collect();
+        let has_section: Vec<_> = edges
+            .iter()
+            .filter(|e| e.label.as_deref() == Some("has-section"))
+            .collect();
         assert_eq!(has_section.len(), 3);
     }
 
@@ -1275,16 +1354,26 @@ mod tests {
         let (nodes, edges) = parse_source_file(&source, content);
         // 1 section + 2 facts
         assert_eq!(nodes.len(), 3);
-        let facts: Vec<_> = nodes.iter().filter(|n| n.node_type == Some(NodeType::Fact)).collect();
+        let facts: Vec<_> = nodes
+            .iter()
+            .filter(|n| n.node_type == Some(NodeType::Fact))
+            .collect();
         assert_eq!(facts.len(), 2);
         assert_eq!(facts[0].label, "Jurisdiction");
         assert_eq!(facts[1].label, "Time range");
         // Facts should have content
         assert!(facts[0].content.as_ref().unwrap().contains("Federal"));
         // Facts parented to section
-        assert!(facts.iter().all(|f| f.parent_id.as_deref() == Some("fec::coverage")));
+        assert!(
+            facts
+                .iter()
+                .all(|f| f.parent_id.as_deref() == Some("fec::coverage"))
+        );
         // Contains edges
-        let contains: Vec<_> = edges.iter().filter(|e| e.label.as_deref() == Some("contains")).collect();
+        let contains: Vec<_> = edges
+            .iter()
+            .filter(|e| e.label.as_deref() == Some("contains"))
+            .collect();
         assert_eq!(contains.len(), 2);
     }
 
@@ -1293,13 +1382,22 @@ mod tests {
         let source = make_source("fec");
         let content = "## Coverage\n\n- **Time range**:\n  - Records: 1979-present\n  - Contributions: 1979-present\n- **Jurisdiction**: Federal";
         let (nodes, _) = parse_source_file(&source, content);
-        let facts: Vec<_> = nodes.iter().filter(|n| n.node_type == Some(NodeType::Fact)).collect();
+        let facts: Vec<_> = nodes
+            .iter()
+            .filter(|n| n.node_type == Some(NodeType::Fact))
+            .collect();
         assert_eq!(facts.len(), 2);
         // Time range should have accumulated sub-bullets
         let time_range = facts.iter().find(|f| f.label == "Time range").unwrap();
         let content = time_range.content.as_ref().unwrap();
-        assert!(content.contains("Records: 1979-present"), "should contain sub-bullet");
-        assert!(content.contains("Contributions: 1979-present"), "should contain second sub-bullet");
+        assert!(
+            content.contains("Records: 1979-present"),
+            "should contain sub-bullet"
+        );
+        assert!(
+            content.contains("Contributions: 1979-present"),
+            "should contain second sub-bullet"
+        );
     }
 
     #[test]
@@ -1308,7 +1406,10 @@ mod tests {
         // Bold bullet with NO sub-bullets and NO value after colon → should be pruned
         let content = "## Coverage\n\n- **Empty**:\n- **Jurisdiction**: Federal";
         let (nodes, _) = parse_source_file(&source, content);
-        let facts: Vec<_> = nodes.iter().filter(|n| n.node_type == Some(NodeType::Fact)).collect();
+        let facts: Vec<_> = nodes
+            .iter()
+            .filter(|n| n.node_type == Some(NodeType::Fact))
+            .collect();
         // "Empty" should be pruned, only "Jurisdiction" remains
         assert_eq!(facts.len(), 1);
         assert_eq!(facts[0].label, "Jurisdiction");
@@ -1320,7 +1421,10 @@ mod tests {
         let content = "## Data Schema\n\n| Field | Description |\n|-------|-------------|\n| `candidate_id` | Unique ID |\n| `name` | Full name |";
         let (nodes, edges) = parse_source_file(&source, content);
         // 1 section + 2 fact rows (header + separator skipped)
-        let facts: Vec<_> = nodes.iter().filter(|n| n.node_type == Some(NodeType::Fact)).collect();
+        let facts: Vec<_> = nodes
+            .iter()
+            .filter(|n| n.node_type == Some(NodeType::Fact))
+            .collect();
         assert_eq!(facts.len(), 2);
         assert_eq!(facts[0].label, "candidate_id"); // backticks stripped
         assert_eq!(facts[1].label, "name");
@@ -1331,7 +1435,10 @@ mod tests {
         let source = make_source("fec");
         let content = "## Schema\n\n| Header1 | Header2 |\n| --- | --- |\n| value1 | desc1 |";
         let (nodes, _edges) = parse_source_file(&source, content);
-        let facts: Vec<_> = nodes.iter().filter(|n| n.node_type == Some(NodeType::Fact)).collect();
+        let facts: Vec<_> = nodes
+            .iter()
+            .filter(|n| n.node_type == Some(NodeType::Fact))
+            .collect();
         assert_eq!(facts.len(), 1);
         assert_eq!(facts[0].label, "value1");
     }
@@ -1339,11 +1446,17 @@ mod tests {
     #[test]
     fn test_parse_fact_parents_correct() {
         let source = make_source("fec");
-        let content = "## Data Schema\n\n### Candidate Records\n\n| Field | Desc |\n|---|---|\n| cid | ID |";
+        let content =
+            "## Data Schema\n\n### Candidate Records\n\n| Field | Desc |\n|---|---|\n| cid | ID |";
         let (nodes, _) = parse_source_file(&source, content);
         let fact = nodes.iter().find(|n| n.label == "cid").unwrap();
         // Fact should be parented to the h3 section, not the h2
-        assert!(fact.parent_id.as_ref().unwrap().contains("candidate-records"));
+        assert!(
+            fact.parent_id
+                .as_ref()
+                .unwrap()
+                .contains("candidate-records")
+        );
     }
 
     #[test]
@@ -1352,7 +1465,10 @@ mod tests {
         // Two sections with same name, each with a fact so they survive pruning
         let content = "## Summary\n\n- **A**: 1\n\n## Summary\n\n- **B**: 2";
         let (nodes, _) = parse_source_file(&source, content);
-        let sections: Vec<_> = nodes.iter().filter(|n| n.node_type == Some(NodeType::Section)).collect();
+        let sections: Vec<_> = nodes
+            .iter()
+            .filter(|n| n.node_type == Some(NodeType::Section))
+            .collect();
         assert_eq!(sections.len(), 2);
         assert_eq!(sections[0].id, "fec::summary");
         assert_eq!(sections[1].id, "fec::summary-2"); // deduplicated
@@ -1393,15 +1509,27 @@ Overview paragraph.
 
 Links here.";
         let (nodes, edges) = parse_source_file(&source, content);
-        let sections: Vec<_> = nodes.iter().filter(|n| n.node_type == Some(NodeType::Section)).collect();
-        let facts: Vec<_> = nodes.iter().filter(|n| n.node_type == Some(NodeType::Fact)).collect();
+        let sections: Vec<_> = nodes
+            .iter()
+            .filter(|n| n.node_type == Some(NodeType::Section))
+            .collect();
+        let facts: Vec<_> = nodes
+            .iter()
+            .filter(|n| n.node_type == Some(NodeType::Fact))
+            .collect();
         // Summary and References pruned (no children), Coverage + Data Schema + Records remain = 3
         assert_eq!(sections.len(), 3);
         // 2 bullets + 2 table rows = 4 facts
         assert_eq!(facts.len(), 4);
         // Structural edges: 2 has-section (Coverage→source, Data Schema→source) + 1 has-section (Records→Data Schema) + 4 contains
-        let has_section_count = edges.iter().filter(|e| e.label.as_deref() == Some("has-section")).count();
-        let contains_count = edges.iter().filter(|e| e.label.as_deref() == Some("contains")).count();
+        let has_section_count = edges
+            .iter()
+            .filter(|e| e.label.as_deref() == Some("has-section"))
+            .count();
+        let contains_count = edges
+            .iter()
+            .filter(|e| e.label.as_deref() == Some("contains"))
+            .count();
         assert_eq!(has_section_count, 3);
         assert_eq!(contains_count, 4);
     }
@@ -1481,7 +1609,10 @@ Links here.";
         let all_nodes = vec![source_a.clone(), source_b.clone(), fact];
         let source_nodes = vec![source_a, source_b];
         let edges = extract_cross_ref_edges(&all_nodes, &source_nodes);
-        assert!(edges.is_empty(), "should only match facts under cross-reference sections");
+        assert!(
+            edges.is_empty(),
+            "should only match facts under cross-reference sections"
+        );
     }
 
     // ── find_shared_field_edges ──
@@ -1532,7 +1663,10 @@ Links here.";
             content: None,
         };
         let edges = find_shared_field_edges(&vec![fact_a, fact_b]);
-        assert!(edges.is_empty(), "should not create edge between same-source facts");
+        assert!(
+            edges.is_empty(),
+            "should not create edge between same-source facts"
+        );
     }
 
     #[test]
@@ -1601,7 +1735,9 @@ Links here.";
             content: None,
         };
         let edges = find_shared_field_edges(&vec![fact_a, fact_b]);
-        assert!(edges.is_empty(), "should only match facts under data-schema sections");
+        assert!(
+            edges.is_empty(),
+            "should only match facts under data-schema sections"
+        );
     }
-
 }
diff --git a/openplanter-desktop/crates/op-tauri/src/main.rs b/openplanter-desktop/crates/op-tauri/src/main.rs
index e5b80c36..20088713 100644
--- a/openplanter-desktop/crates/op-tauri/src/main.rs
+++ b/openplanter-desktop/crates/op-tauri/src/main.rs
@@ -1,9 +1,9 @@
 // Prevents additional console window on Windows in release.
 #![cfg_attr(not(debug_assertions), windows_subsystem = "windows")]
 
-mod state;
 mod bridge;
 mod commands;
+mod state;
 
 use state::AppState;
 
@@ -27,8 +27,6 @@ fn main() {
             commands::wiki::get_graph_data,
             commands::wiki::read_wiki_file,
         ])
-        .run(tauri::generate_context!(
-            "tauri.conf.json"
-        ))
+        .run(tauri::generate_context!("tauri.conf.json"))
         .expect("error while running tauri application");
 }
diff --git a/openplanter-desktop/crates/op-tauri/src/state.rs b/openplanter-desktop/crates/op-tauri/src/state.rs
index f4b831bb..3109c5c0 100644
--- a/openplanter-desktop/crates/op-tauri/src/state.rs
+++ b/openplanter-desktop/crates/op-tauri/src/state.rs
@@ -1,8 +1,14 @@
+use op_core::config::{
+    AgentConfig, normalize_web_search_provider, normalize_zai_plan, resolve_zai_base_url,
+};
+use op_core::credentials::{
+    CredentialBundle, credentials_from_env, discover_env_candidates, parse_env_file,
+};
+use op_core::settings::{PersistentSettings, SettingsStore};
+use std::env;
 use std::sync::Arc;
 use tokio::sync::Mutex;
 use tokio_util::sync::CancellationToken;
-use op_core::config::AgentConfig;
-use op_core::credentials::{credentials_from_env, discover_env_candidates, parse_env_file, CredentialBundle};
 
 /// Merge credentials into an AgentConfig.
 /// Priority: existing config value > env_creds > file_creds.
@@ -14,7 +20,9 @@ pub fn merge_credentials_into_config(
     macro_rules! merge {
         ($field:ident) => {
             if cfg.$field.is_none() {
-                cfg.$field = env_creds.$field.clone()
+                cfg.$field = env_creds
+                    .$field
+                    .clone()
                     .or_else(|| file_creds.$field.clone());
             }
         };
@@ -23,10 +31,62 @@ pub fn merge_credentials_into_config(
     merge!(anthropic_api_key);
     merge!(openrouter_api_key);
     merge!(cerebras_api_key);
+    merge!(zai_api_key);
     merge!(exa_api_key);
+    merge!(firecrawl_api_key);
     merge!(voyage_api_key);
 }
 
+fn has_env_value(keys: &[&str]) -> bool {
+    keys.iter().any(|key| {
+        env::var(key)
+            .ok()
+            .map(|value| !value.trim().is_empty())
+            .unwrap_or(false)
+    })
+}
+
+fn apply_settings_to_config(cfg: &mut AgentConfig, settings: &PersistentSettings) {
+    if !has_env_value(&["OPENPLANTER_REASONING_EFFORT"]) {
+        if let Some(reasoning_effort) = settings.default_reasoning_effort.clone() {
+            cfg.reasoning_effort = Some(reasoning_effort);
+        }
+    }
+
+    if !has_env_value(&["OPENPLANTER_ZAI_PLAN"]) {
+        if let Some(plan) = settings.zai_plan.as_deref() {
+            cfg.zai_plan = normalize_zai_plan(Some(plan));
+        }
+    }
+
+    if !has_env_value(&["OPENPLANTER_ZAI_BASE_URL"]) {
+        cfg.zai_base_url = resolve_zai_base_url(
+            &cfg.zai_plan,
+            &cfg.zai_paygo_base_url,
+            &cfg.zai_coding_base_url,
+        );
+    }
+
+    if !has_env_value(&["OPENPLANTER_WEB_SEARCH_PROVIDER"]) {
+        if let Some(provider) = settings.web_search_provider.as_deref() {
+            cfg.web_search_provider = normalize_web_search_provider(Some(provider));
+        }
+    }
+
+    if !has_env_value(&["OPENPLANTER_MODEL"]) {
+        let saved_model = if cfg.provider == "auto" {
+            settings.default_model.as_deref()
+        } else {
+            settings
+                .default_model_for_provider(cfg.provider.as_str())
+                .or(settings.default_model.as_deref())
+        };
+        if let Some(model) = saved_model {
+            cfg.model = model.to_string();
+        }
+    }
+}
+
 /// Application state shared across Tauri commands.
 pub struct AppState {
     pub config: Arc<Mutex<AgentConfig>>,
@@ -52,6 +112,9 @@ impl AppState {
             merge_credentials_into_config(&mut cfg, &env_creds, &empty);
         }
 
+        let settings = SettingsStore::new(&cfg.workspace, &cfg.session_root_dir).load();
+        apply_settings_to_config(&mut cfg, &settings);
+
         Self {
             config: Arc::new(Mutex::new(cfg)),
             session_id: Arc::new(Mutex::new(None)),
@@ -63,6 +126,7 @@ impl AppState {
 #[cfg(test)]
 mod tests {
     use super::*;
+    use std::env;
 
     fn empty_cfg() -> AgentConfig {
         let mut cfg = AgentConfig::from_env("/nonexistent");
@@ -70,7 +134,9 @@ mod tests {
         cfg.anthropic_api_key = None;
         cfg.openrouter_api_key = None;
         cfg.cerebras_api_key = None;
+        cfg.zai_api_key = None;
         cfg.exa_api_key = None;
+        cfg.firecrawl_api_key = None;
         cfg.voyage_api_key = None;
         cfg
     }
@@ -126,4 +192,59 @@ mod tests {
         merge_credentials_into_config(&mut cfg, &env_creds, &file_creds);
         assert_eq!(cfg.cerebras_api_key, Some("file-cer".to_string()));
     }
+
+    #[test]
+    fn test_merge_includes_zai_and_firecrawl() {
+        let mut cfg = empty_cfg();
+        let env_creds = CredentialBundle {
+            zai_api_key: Some("zai-env".to_string()),
+            firecrawl_api_key: Some("fc-env".to_string()),
+            ..Default::default()
+        };
+        merge_credentials_into_config(&mut cfg, &env_creds, &CredentialBundle::default());
+        assert_eq!(cfg.zai_api_key, Some("zai-env".to_string()));
+        assert_eq!(cfg.firecrawl_api_key, Some("fc-env".to_string()));
+    }
+
+    #[test]
+    fn test_apply_settings_to_config_sets_model_and_web_search() {
+        let keys = [
+            "OPENPLANTER_MODEL",
+            "OPENPLANTER_REASONING_EFFORT",
+            "OPENPLANTER_ZAI_PLAN",
+            "OPENPLANTER_ZAI_BASE_URL",
+            "OPENPLANTER_WEB_SEARCH_PROVIDER",
+        ];
+        let saved: Vec<_> = keys.iter().map(|key| (*key, env::var(key).ok())).collect();
+        unsafe {
+            for key in &keys {
+                env::remove_var(key);
+            }
+        }
+
+        let mut cfg = empty_cfg();
+        cfg.provider = "zai".to_string();
+        let settings = PersistentSettings {
+            default_model_zai: Some("glm-5".to_string()),
+            default_reasoning_effort: Some("medium".to_string()),
+            zai_plan: Some("coding".to_string()),
+            web_search_provider: Some("firecrawl".to_string()),
+            ..Default::default()
+        };
+        apply_settings_to_config(&mut cfg, &settings);
+        assert_eq!(cfg.model, "glm-5");
+        assert_eq!(cfg.reasoning_effort, Some("medium".to_string()));
+        assert_eq!(cfg.zai_plan, "coding");
+        assert_eq!(cfg.zai_base_url, op_core::config::ZAI_CODING_BASE_URL);
+        assert_eq!(cfg.web_search_provider, "firecrawl");
+
+        for (key, value) in saved {
+            unsafe {
+                match value {
+                    Some(value) => env::set_var(key, value),
+                    None => env::remove_var(key),
+                }
+            }
+        }
+    }
 }
diff --git a/openplanter-desktop/crates/op-tauri/tauri.conf.json b/openplanter-desktop/crates/op-tauri/tauri.conf.json
index d5d88bda..3d46600b 100644
--- a/openplanter-desktop/crates/op-tauri/tauri.conf.json
+++ b/openplanter-desktop/crates/op-tauri/tauri.conf.json
@@ -5,7 +5,7 @@
   "build": {
     "frontendDist": "../../frontend/dist",
     "devUrl": "http://localhost:5173",
-    "beforeDevCommand": "",
+    "beforeDevCommand": "npm run dev",
     "beforeBuildCommand": "npm run build"
   },
   "app": {
diff --git a/openplanter-desktop/frontend/package-lock.json b/openplanter-desktop/frontend/package-lock.json
index 841a0662..387190b3 100644
--- a/openplanter-desktop/frontend/package-lock.json
+++ b/openplanter-desktop/frontend/package-lock.json
@@ -1092,6 +1092,7 @@
       "resolved": "https://registry.npmjs.org/cytoscape/-/cytoscape-3.33.1.tgz",
       "integrity": "sha512-iJc4TwyANnOGR1OmWhsS9ayRS3s+XQ185FmuHObThD+5AeJCakAAbWv8KimMTt08xCCLNgneQwFp+JRJOr9qGQ==",
       "license": "MIT",
+      "peer": true,
       "engines": {
         "node": ">=0.10"
       }
@@ -1397,6 +1398,7 @@
       "integrity": "sha512-5gTmgEY/sqK6gFXLIsQNH19lWb4ebPDLA4SdLP7dsWkIXHWlG66oPuVvXSGFPppYZz8ZDZq0dYYrbHfBCVUb1Q==",
       "dev": true,
       "license": "MIT",
+      "peer": true,
       "engines": {
         "node": ">=12"
       },
@@ -1642,6 +1644,7 @@
       "integrity": "sha512-+Oxm7q9hDoLMyJOYfUYBuHQo+dkAloi33apOPP56pzj+vsdJDzr+j1NISE5pyaAuKL4A3UD34qd0lx5+kfKp2g==",
       "dev": true,
       "license": "MIT",
+      "peer": true,
       "dependencies": {
         "esbuild": "^0.25.0",
         "fdir": "^6.4.4",
diff --git a/openplanter-desktop/frontend/src/api/invoke.test.ts b/openplanter-desktop/frontend/src/api/invoke.test.ts
index 7a8318d2..00d2da0a 100644
--- a/openplanter-desktop/frontend/src/api/invoke.test.ts
+++ b/openplanter-desktop/frontend/src/api/invoke.test.ts
@@ -46,54 +46,74 @@ describe("invoke wrappers", () => {
   it("getConfig returns config", async () => {
     __setHandler("get_config", () => ({
       provider: "anthropic",
-      model: "claude-opus-4-6",
+      model: "anthropic-foundry/claude-opus-4-6",
+      zai_plan: "paygo",
       workspace: ".",
       session_id: null,
       recursive: true,
       max_depth: 4,
       max_steps_per_call: 100,
       reasoning_effort: "high",
+      web_search_provider: "exa",
       demo: false,
     }));
     const config = await getConfig();
     expect(config.provider).toBe("anthropic");
-    expect(config.model).toBe("claude-opus-4-6");
+    expect(config.model).toBe("anthropic-foundry/claude-opus-4-6");
+    expect(config.zai_plan).toBe("paygo");
+    expect(config.web_search_provider).toBe("exa");
   });
 
   it("updateConfig sends partial and returns config", async () => {
     __setHandler("update_config", ({ partial }: any) => {
-      expect(partial.model).toBe("gpt-5.2");
+      expect(partial.model).toBe("azure-foundry/gpt-5.3-codex");
       return {
         provider: "openai",
-        model: "gpt-5.2",
+        model: "azure-foundry/gpt-5.3-codex",
+        zai_plan: "coding",
         workspace: ".",
         session_id: null,
         recursive: true,
         max_depth: 4,
         max_steps_per_call: 100,
         reasoning_effort: null,
+        web_search_provider: "firecrawl",
         demo: false,
       };
     });
-    const config = await updateConfig({ model: "gpt-5.2" });
-    expect(config.model).toBe("gpt-5.2");
+    const config = await updateConfig({ model: "azure-foundry/gpt-5.3-codex" });
+    expect(config.model).toBe("azure-foundry/gpt-5.3-codex");
+    expect(config.zai_plan).toBe("coding");
+    expect(config.web_search_provider).toBe("firecrawl");
   });
 
   it("listModels sends provider filter", async () => {
     __setHandler("list_models", ({ provider }: any) => {
       expect(provider).toBe("openai");
-      return [{ id: "gpt-5.2", name: "GPT-5.2", provider: "openai" }];
+      return [
+        {
+          id: "azure-foundry/gpt-5.3-codex",
+          name: "GPT-5.3 Codex (Foundry)",
+          provider: "openai",
+        },
+      ];
     });
     const models = await listModels("openai");
     expect(models).toHaveLength(1);
-    expect(models[0].id).toBe("gpt-5.2");
+    expect(models[0].id).toBe("azure-foundry/gpt-5.3-codex");
   });
 
   it("saveSettings sends settings object", async () => {
     __setHandler("save_settings", ({ settings }: any) => {
-      expect(settings.model).toBe("claude-opus-4-6");
+      expect(settings.default_model_zai).toBe("glm-5");
+      expect(settings.zai_plan).toBe("coding");
+      expect(settings.web_search_provider).toBe("firecrawl");
+    });
+    await saveSettings({
+      default_model_zai: "glm-5",
+      zai_plan: "coding",
+      web_search_provider: "firecrawl",
     });
-    await saveSettings({ model: "claude-opus-4-6" } as any);
   });
 
   it("getCredentialsStatus returns provider map", async () => {
@@ -102,12 +122,16 @@ describe("invoke wrappers", () => {
       anthropic: true,
       openrouter: false,
       cerebras: false,
+      zai: true,
       ollama: true,
       exa: false,
+      firecrawl: true,
     }));
     const status = await getCredentialsStatus();
     expect(status.openai).toBe(true);
     expect(status.openrouter).toBe(false);
+    expect(status.zai).toBe(true);
+    expect(status.firecrawl).toBe(true);
   });
 
   it("listSessions sends limit", async () => {
diff --git a/openplanter-desktop/frontend/src/api/types.ts b/openplanter-desktop/frontend/src/api/types.ts
index a47e1fb4..9bc29eb7 100644
--- a/openplanter-desktop/frontend/src/api/types.ts
+++ b/openplanter-desktop/frontend/src/api/types.ts
@@ -65,6 +65,8 @@ export interface ConfigView {
   provider: string;
   model: string;
   reasoning_effort: string | null;
+  zai_plan: string;
+  web_search_provider: string;
   workspace: string;
   session_id: string | null;
   recursive: boolean;
@@ -77,6 +79,8 @@ export interface PartialConfig {
   provider?: string;
   model?: string;
   reasoning_effort?: string;
+  zai_plan?: string;
+  web_search_provider?: string;
 }
 
 export interface ModelInfo {
@@ -99,7 +103,10 @@ export interface PersistentSettings {
   default_model_anthropic?: string | null;
   default_model_openrouter?: string | null;
   default_model_cerebras?: string | null;
+  default_model_zai?: string | null;
   default_model_ollama?: string | null;
+  zai_plan?: string | null;
+  web_search_provider?: string | null;
 }
 
 export interface SlashResult {
diff --git a/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts b/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
index cd1e5a1d..ef51eed2 100644
--- a/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
+++ b/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
@@ -23,6 +23,8 @@ describe("completionRegistry", () => {
     expect(values).toContain("/exit");
     expect(values).toContain("/status");
     expect(values).toContain("/model");
+    expect(values).toContain("/zai-plan");
+    expect(values).toContain("/web-search");
     expect(values).toContain("/reasoning");
   });
 
@@ -60,6 +62,7 @@ describe("completionRegistry", () => {
     expect(providerValues).toContain("openai");
     expect(providerValues).toContain("anthropic");
     expect(providerValues).toContain("ollama");
+    expect(providerValues).toContain("zai");
   });
 
   it("model alias children have --save flag", () => {
@@ -78,6 +81,26 @@ describe("completionRegistry", () => {
     expect(childValues).toEqual(["low", "medium", "high", "off"]);
   });
 
+  it("/web-search has exa and firecrawl children", () => {
+    const webSearchCmd = COMMAND_COMPLETIONS.find((c) => c.value === "/web-search");
+    expect(webSearchCmd).toBeDefined();
+    expect(webSearchCmd!.children).toBeDefined();
+
+    const childValues = webSearchCmd!.children!.map((c) => c.value);
+    expect(childValues).toEqual(["exa", "firecrawl"]);
+    expect(webSearchCmd!.children![0].children?.[0].value).toBe("--save");
+  });
+
+  it("/zai-plan has paygo and coding children", () => {
+    const zaiPlanCmd = COMMAND_COMPLETIONS.find((c) => c.value === "/zai-plan");
+    expect(zaiPlanCmd).toBeDefined();
+    expect(zaiPlanCmd!.children).toBeDefined();
+
+    const childValues = zaiPlanCmd!.children!.map((c) => c.value);
+    expect(childValues).toEqual(["paygo", "coding"]);
+    expect(zaiPlanCmd!.children![0].children?.[0].value).toBe("--save");
+  });
+
   it("reasoning level children have --save flag", () => {
     const reasoningCmd = COMMAND_COMPLETIONS.find((c) => c.value === "/reasoning")!;
     for (const level of reasoningCmd.children!) {
diff --git a/openplanter-desktop/frontend/src/commands/completionRegistry.ts b/openplanter-desktop/frontend/src/commands/completionRegistry.ts
index 6318f4c1..2bb2b166 100644
--- a/openplanter-desktop/frontend/src/commands/completionRegistry.ts
+++ b/openplanter-desktop/frontend/src/commands/completionRegistry.ts
@@ -13,6 +13,7 @@ const PROVIDER_FILTERS: CompletionItem[] = [
   { value: "anthropic", description: "Anthropic models" },
   { value: "ollama", description: "Local Ollama models" },
   { value: "cerebras", description: "Cerebras models" },
+  { value: "zai", description: "Z.AI models" },
   { value: "openrouter", description: "OpenRouter models" },
 ];
 
@@ -35,6 +36,16 @@ const REASONING_LEVELS: CompletionItem[] = [
   { value: "off", description: "Disable reasoning", children: SAVE_FLAG },
 ];
 
+const WEB_SEARCH_PROVIDERS: CompletionItem[] = [
+  { value: "exa", description: "Use Exa for web search", children: SAVE_FLAG },
+  { value: "firecrawl", description: "Use Firecrawl for web search", children: SAVE_FLAG },
+];
+
+const ZAI_PLANS: CompletionItem[] = [
+  { value: "paygo", description: "Use the Z.AI PAYGO endpoint", children: SAVE_FLAG },
+  { value: "coding", description: "Use the Z.AI Coding Plan endpoint", children: SAVE_FLAG },
+];
+
 export const COMMAND_COMPLETIONS: CompletionItem[] = [
   { value: "/help", description: "Show available commands" },
   { value: "/new", description: "Start a new session" },
@@ -50,6 +61,16 @@ export const COMMAND_COMPLETIONS: CompletionItem[] = [
       ...MODEL_ALIAS_ITEMS,
     ],
   },
+  {
+    value: "/zai-plan",
+    description: "Show or switch the Z.AI endpoint family",
+    children: ZAI_PLANS,
+  },
+  {
+    value: "/web-search",
+    description: "Show or switch the web search provider",
+    children: WEB_SEARCH_PROVIDERS,
+  },
   {
     value: "/reasoning",
     description: "Set reasoning effort",
diff --git a/openplanter-desktop/frontend/src/commands/model.test.ts b/openplanter-desktop/frontend/src/commands/model.test.ts
index 1e8bc2bd..f98dfb86 100644
--- a/openplanter-desktop/frontend/src/commands/model.test.ts
+++ b/openplanter-desktop/frontend/src/commands/model.test.ts
@@ -12,10 +12,12 @@ import { appState } from "../state/store";
 describe("inferProvider", () => {
   it("claude returns anthropic", () => {
     expect(inferProvider("claude-opus-4-6")).toBe("anthropic");
+    expect(inferProvider("anthropic-foundry/claude-opus-4-6")).toBe("anthropic");
   });
 
   it("gpt returns openai", () => {
     expect(inferProvider("gpt-5.2")).toBe("openai");
+    expect(inferProvider("azure-foundry/gpt-5.3-codex")).toBe("openai");
   });
 
   it("o1 returns openai", () => {
@@ -34,6 +36,11 @@ describe("inferProvider", () => {
     expect(inferProvider("qwen-3-235b-a22b-instruct-2507")).toBe("cerebras");
   });
 
+  it("glm returns zai", () => {
+    expect(inferProvider("glm-5")).toBe("zai");
+    expect(inferProvider("zai-glm-4.6")).toBe("zai");
+  });
+
   it("qwen without 3 returns ollama", () => {
     expect(inferProvider("qwen2")).toBe("ollama");
   });
@@ -52,11 +59,15 @@ describe("MODEL_ALIASES", () => {
   });
 
   it("opus alias", () => {
-    expect(MODEL_ALIASES["opus"]).toBe("claude-opus-4-6");
+    expect(MODEL_ALIASES["opus"]).toBe("anthropic-foundry/claude-opus-4-6");
   });
 
   it("gpt5 alias", () => {
-    expect(MODEL_ALIASES["gpt5"]).toBe("gpt-5.2");
+    expect(MODEL_ALIASES["gpt5"]).toBe("azure-foundry/gpt-5.3-codex");
+  });
+
+  it("zai alias", () => {
+    expect(MODEL_ALIASES["zai"]).toBe("glm-5");
   });
 });
 
@@ -68,6 +79,7 @@ describe("handleModelCommand", () => {
       ...originalState,
       provider: "anthropic",
       model: "claude-opus-4-6",
+      webSearchProvider: "exa",
     });
   });
 
@@ -95,4 +107,34 @@ describe("handleModelCommand", () => {
     expect(result.action).toBe("handled");
     expect(result.lines.some((l) => l.includes("gpt-5.2"))).toBe(true);
   });
+
+  it("save persists provider-specific model default", async () => {
+    __setHandler("update_config", ({ partial }: { partial: Record<string, string> }) => {
+      expect(partial.model).toBe("glm-5");
+      expect(partial.provider).toBe("zai");
+      return {
+        provider: "zai",
+        model: "glm-5",
+        zai_plan: "coding",
+        workspace: ".",
+        session_id: null,
+        recursive: true,
+        max_depth: 4,
+        max_steps_per_call: 100,
+        reasoning_effort: "high",
+        web_search_provider: "exa",
+        demo: false,
+      };
+    });
+    __setHandler("save_settings", ({ settings }: { settings: Record<string, string> }) => {
+      expect(settings.default_model).toBe("glm-5");
+      expect(settings.default_model_zai).toBe("glm-5");
+    });
+
+    const result = await handleModelCommand("zai --save");
+    expect(result.lines).toContain("(Settings saved)");
+    expect(appState.get().provider).toBe("zai");
+    expect(appState.get().model).toBe("glm-5");
+    expect(appState.get().zaiPlan).toBe("coding");
+  });
 });
diff --git a/openplanter-desktop/frontend/src/commands/model.ts b/openplanter-desktop/frontend/src/commands/model.ts
index 0fa9e9c2..45f7016d 100644
--- a/openplanter-desktop/frontend/src/commands/model.ts
+++ b/openplanter-desktop/frontend/src/commands/model.ts
@@ -1,22 +1,30 @@
 /** /model slash command handler. */
-import { updateConfig, listModels } from "../api/invoke";
+import { listModels, saveSettings, updateConfig } from "../api/invoke";
+import type { PersistentSettings } from "../api/types";
 import { appState } from "../state/store";
 
 /** Aliases mapping short names to full model identifiers. */
 export const MODEL_ALIASES: Record<string, string> = {
-  opus: "claude-opus-4-6",
-  sonnet: "claude-sonnet-4-5",
-  haiku: "claude-haiku-4-5",
-  "sonnet-4": "claude-sonnet-4-5",
-  "haiku-4": "claude-haiku-4-5",
-  "opus-4": "claude-opus-4-6",
-  gpt5: "gpt-5.2",
-  "gpt-5": "gpt-5.2",
+  opus: "anthropic-foundry/claude-opus-4-6",
+  sonnet: "anthropic-foundry/claude-sonnet-4-6",
+  haiku: "anthropic-foundry/claude-haiku-4-5",
+  "sonnet-4": "anthropic-foundry/claude-sonnet-4-6",
+  "haiku-4": "anthropic-foundry/claude-haiku-4-5",
+  "opus-4": "anthropic-foundry/claude-opus-4-6",
+  gpt5: "azure-foundry/gpt-5.3-codex",
+  "gpt-5": "azure-foundry/gpt-5.3-codex",
+  "gpt-5.3": "azure-foundry/gpt-5.3-codex",
+  kimi: "azure-foundry/Kimi-K2.5",
   gpt4o: "gpt-4o",
   "gpt-4o": "gpt-4o",
-  "o1": "o1",
-  "o3": "o3",
+  o1: "o1",
+  o3: "o3",
   "o4-mini": "o4-mini",
+  glm: "glm-5",
+  glm5: "glm-5",
+  "glm-5": "glm-5",
+  zai: "glm-5",
+  "zai-glm": "zai-glm-4.6",
   llama: "llama3.2",
   mistral: "mistral",
   gemma: "gemma",
@@ -28,14 +36,40 @@ export const MODEL_ALIASES: Record<string, string> = {
 
 /** Infer provider from a model name, matching builder.rs patterns. */
 export function inferProvider(model: string): string | null {
+  if (/^anthropic-foundry\//i.test(model)) return "anthropic";
+  if (/^azure-foundry\//i.test(model)) return "openai";
   if (model.includes("/")) return "openrouter";
   if (/^claude/i.test(model)) return "anthropic";
-  if (/^(llama.*cerebras|qwen-3|gpt-oss|zai-glm)/i.test(model)) return "cerebras";
+  if (/^(llama.*cerebras|qwen-3|gpt-oss)/i.test(model)) return "cerebras";
+  if (/^(glm|zai-glm)/i.test(model)) return "zai";
   if (/^(gpt|o[1-4]-|o[1-4]$|chatgpt|dall-e|tts-|whisper)/i.test(model)) return "openai";
-  if (/^(llama|mistral|gemma|phi|codellama|deepseek|vicuna|tinyllama|neural-chat|dolphin|wizardlm|orca|nous-hermes|command-r|qwen)/i.test(model)) return "ollama";
+  if (/^(llama|mistral|gemma|phi|codellama|deepseek|vicuna|tinyllama|neural-chat|dolphin|wizardlm|orca|nous-hermes|command-r|qwen(?!-3))/i.test(model)) return "ollama";
   return null;
 }
 
+function buildProviderDefaultModelSettings(
+  provider: string,
+  model: string,
+): PersistentSettings {
+  const base: PersistentSettings = { default_model: model };
+  switch (provider) {
+    case "openai":
+      return { ...base, default_model_openai: model };
+    case "anthropic":
+      return { ...base, default_model_anthropic: model };
+    case "openrouter":
+      return { ...base, default_model_openrouter: model };
+    case "cerebras":
+      return { ...base, default_model_cerebras: model };
+    case "zai":
+      return { ...base, default_model_zai: model };
+    case "ollama":
+      return { ...base, default_model_ollama: model };
+    default:
+      return base;
+  }
+}
+
 export interface CommandResult {
   action: "handled" | "clear" | "quit";
   lines: string[];
@@ -43,10 +77,9 @@ export interface CommandResult {
 
 /** Handle /model [args]. */
 export async function handleModelCommand(args: string): Promise<CommandResult> {
-  const parts = args.trim().split(/\s+/);
+  const parts = args.trim().split(/\s+/).filter(Boolean);
   const subcommand = parts[0] || "";
 
-  // /model (no args) — show current info
   if (!subcommand) {
     const s = appState.get();
     const aliasEntries = Object.entries(MODEL_ALIASES)
@@ -57,6 +90,7 @@ export async function handleModelCommand(args: string): Promise<CommandResult> {
       lines: [
         `Provider: ${s.provider}`,
         `Model:    ${s.model}`,
+        `Z.AI plan: ${s.zaiPlan || "paygo"}`,
         "",
         "Aliases:",
         aliasEntries,
@@ -64,7 +98,6 @@ export async function handleModelCommand(args: string): Promise<CommandResult> {
     };
   }
 
-  // /model list [all|<provider>]
   if (subcommand === "list") {
     const filter = parts[1] || "all";
     try {
@@ -76,7 +109,7 @@ export async function handleModelCommand(args: string): Promise<CommandResult> {
         };
       }
       const lines = models.map(
-        (m) => `  ${m.id}${m.name ? ` (${m.name})` : ""} [${m.provider}]`
+        (m) => `  ${m.id}${m.name ? ` (${m.name})` : ""} [${m.provider}]`,
       );
       return {
         action: "handled",
@@ -90,36 +123,38 @@ export async function handleModelCommand(args: string): Promise<CommandResult> {
     }
   }
 
-  // /model <name> [--save]
   const modelName = subcommand;
   const save = parts.includes("--save");
-
-  // Resolve alias
   const resolved = MODEL_ALIASES[modelName.toLowerCase()] ?? modelName;
   const provider = inferProvider(resolved);
 
   if (!provider) {
     return {
       action: "handled",
-      lines: [`Cannot infer provider for "${resolved}". Specify full model name or use a known alias.`],
+      lines: [
+        `Cannot infer provider for "${resolved}". Specify full model name or use a known alias.`,
+      ],
     };
   }
 
   try {
     const config = await updateConfig({
       model: resolved,
-      provider: provider,
+      provider,
     });
 
     appState.update((s) => ({
       ...s,
       provider: config.provider,
       model: config.model,
+      zaiPlan: config.zai_plan,
     }));
 
     const lines = [`Switched to ${config.provider}/${config.model}`];
     if (save) {
-      // save_settings would be called here when backend supports it
+      await saveSettings(
+        buildProviderDefaultModelSettings(config.provider, config.model),
+      );
       lines.push("(Settings saved)");
     }
 
diff --git a/openplanter-desktop/frontend/src/commands/reasoning.test.ts b/openplanter-desktop/frontend/src/commands/reasoning.test.ts
index cfd5743f..6df705f1 100644
--- a/openplanter-desktop/frontend/src/commands/reasoning.test.ts
+++ b/openplanter-desktop/frontend/src/commands/reasoning.test.ts
@@ -38,6 +38,7 @@ describe("handleReasoningCommand", () => {
       return {
         provider: "anthropic",
         model: "claude-opus-4-6",
+        zai_plan: "paygo",
         reasoning_effort: "low",
         workspace: ".",
         session_id: null,
@@ -57,6 +58,7 @@ describe("handleReasoningCommand", () => {
     __setHandler("update_config", ({ partial }: any) => ({
       provider: "anthropic",
       model: "claude-opus-4-6",
+      zai_plan: "coding",
       reasoning_effort: "high",
       workspace: ".",
       session_id: null,
@@ -77,6 +79,7 @@ describe("handleReasoningCommand", () => {
       return {
         provider: "anthropic",
         model: "claude-opus-4-6",
+        zai_plan: "paygo",
         reasoning_effort: null,
         workspace: ".",
         session_id: null,
@@ -103,6 +106,7 @@ describe("handleReasoningCommand", () => {
       return {
         provider: "anthropic",
         model: "claude-opus-4-6",
+        zai_plan: "coding",
         reasoning_effort: "high",
         workspace: ".",
         session_id: null,
@@ -122,6 +126,7 @@ describe("handleReasoningCommand", () => {
     __setHandler("update_config", ({ partial }: any) => ({
       provider: "anthropic",
       model: "claude-opus-4-6",
+      zai_plan: "coding",
       reasoning_effort: "high",
       workspace: ".",
       session_id: null,
@@ -130,6 +135,9 @@ describe("handleReasoningCommand", () => {
       max_steps_per_call: 100,
       demo: false,
     }));
+    __setHandler("save_settings", ({ settings }: any) => {
+      expect(settings.default_reasoning_effort).toBe("high");
+    });
 
     const result = await handleReasoningCommand("high --save");
     expect(result.action).toBe("handled");
diff --git a/openplanter-desktop/frontend/src/commands/reasoning.ts b/openplanter-desktop/frontend/src/commands/reasoning.ts
index 1e2c1ad6..22b568f9 100644
--- a/openplanter-desktop/frontend/src/commands/reasoning.ts
+++ b/openplanter-desktop/frontend/src/commands/reasoning.ts
@@ -1,5 +1,5 @@
 /** /reasoning slash command handler. */
-import { updateConfig } from "../api/invoke";
+import { saveSettings, updateConfig } from "../api/invoke";
 import { appState } from "../state/store";
 import type { CommandResult } from "./model";
 
@@ -41,10 +41,14 @@ export async function handleReasoningCommand(args: string): Promise<CommandResul
     appState.update((s) => ({
       ...s,
       reasoningEffort: config.reasoning_effort,
+      zaiPlan: config.zai_plan,
     }));
 
     const lines = [`Reasoning effort set to: ${config.reasoning_effort ?? "off"}`];
     if (save) {
+      await saveSettings({
+        default_reasoning_effort: config.reasoning_effort,
+      });
       lines.push("(Settings saved)");
     }
 
diff --git a/openplanter-desktop/frontend/src/commands/slash.test.ts b/openplanter-desktop/frontend/src/commands/slash.test.ts
index 495d0974..e95062f4 100644
--- a/openplanter-desktop/frontend/src/commands/slash.test.ts
+++ b/openplanter-desktop/frontend/src/commands/slash.test.ts
@@ -17,6 +17,8 @@ describe("dispatchSlashCommand", () => {
       ...originalState,
       provider: "anthropic",
       model: "claude-opus-4-6",
+      zaiPlan: "paygo",
+      webSearchProvider: "exa",
       sessionId: "20260101-120000-deadbeef",
       reasoningEffort: "medium",
     });
@@ -70,6 +72,18 @@ describe("dispatchSlashCommand", () => {
     expect(result!.lines.some((l) => l.includes("Session:"))).toBe(true);
   });
 
+  it("status shows web search provider", async () => {
+    const result = await dispatchSlashCommand("/status");
+    expect(result).not.toBeNull();
+    expect(result!.lines.some((l) => l.includes("Web search:"))).toBe(true);
+  });
+
+  it("status shows zai plan", async () => {
+    const result = await dispatchSlashCommand("/status");
+    expect(result).not.toBeNull();
+    expect(result!.lines.some((l) => l.includes("Z.AI plan:"))).toBe(true);
+  });
+
   it("unknown command", async () => {
     const result = await dispatchSlashCommand("/foobar");
     expect(result).not.toBeNull();
@@ -112,6 +126,20 @@ describe("dispatchSlashCommand", () => {
     ).toBe(true);
   });
 
+  it("web search dispatches", async () => {
+    const result = await dispatchSlashCommand("/web-search");
+    expect(result).not.toBeNull();
+    expect(result!.action).toBe("handled");
+    expect(result!.lines.some((l) => l.includes("Web search provider:"))).toBe(true);
+  });
+
+  it("zai plan dispatches", async () => {
+    const result = await dispatchSlashCommand("/zai-plan");
+    expect(result).not.toBeNull();
+    expect(result!.action).toBe("handled");
+    expect(result!.lines.some((l) => l.includes("Z.AI plan:"))).toBe(true);
+  });
+
   it("new creates session", async () => {
     __setHandler(
       "open_session",
diff --git a/openplanter-desktop/frontend/src/commands/slash.ts b/openplanter-desktop/frontend/src/commands/slash.ts
index 1da7cb66..d46675dd 100644
--- a/openplanter-desktop/frontend/src/commands/slash.ts
+++ b/openplanter-desktop/frontend/src/commands/slash.ts
@@ -3,6 +3,8 @@ import { appState } from "../state/store";
 import { openSession } from "../api/invoke";
 import { handleModelCommand, type CommandResult } from "./model";
 import { handleReasoningCommand } from "./reasoning";
+import { handleWebSearchCommand } from "./webSearch";
+import { handleZaiPlanCommand } from "./zaiPlan";
 
 /** Dispatch a slash command. Returns null if not a slash command. */
 export async function dispatchSlashCommand(input: string): Promise<CommandResult | null> {
@@ -28,6 +30,12 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
           "  /model <name>       Switch model (auto-detects provider)",
           "  /model <name> --save  Switch and persist",
           "  /model list [provider]  List available models",
+          "  /zai-plan          Show current Z.AI endpoint family",
+          "  /zai-plan <plan>   Set Z.AI endpoint family (paygo, coding)",
+          "  /zai-plan <plan> --save  Set and persist",
+          "  /web-search        Show current web search provider",
+          "  /web-search <provider>  Set web search provider (exa, firecrawl)",
+          "  /web-search <provider> --save  Set and persist",
           "  /reasoning          Show/set reasoning effort",
           "  /reasoning <level>  Set level (low, medium, high, off)",
         ],
@@ -75,6 +83,8 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
         lines: [
           `Provider:    ${s.provider || "auto"}`,
           `Model:       ${s.model || "—"}`,
+          `Z.AI plan:   ${s.zaiPlan || "paygo"}`,
+          `Web search:  ${s.webSearchProvider || "exa"}`,
           `Reasoning:   ${s.reasoningEffort ?? "off"}`,
           `Mode:        ${s.recursive ? "recursive" : "flat"}`,
           `Max depth:   ${s.maxDepth}`,
@@ -91,6 +101,12 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
     case "/model":
       return handleModelCommand(args);
 
+    case "/zai-plan":
+      return handleZaiPlanCommand(args);
+
+    case "/web-search":
+      return handleWebSearchCommand(args);
+
     case "/reasoning":
       return handleReasoningCommand(args);
 
diff --git a/openplanter-desktop/frontend/src/commands/webSearch.test.ts b/openplanter-desktop/frontend/src/commands/webSearch.test.ts
new file mode 100644
index 00000000..358cbed6
--- /dev/null
+++ b/openplanter-desktop/frontend/src/commands/webSearch.test.ts
@@ -0,0 +1,76 @@
+import { vi, describe, it, expect, beforeEach, afterEach } from "vitest";
+import { __setHandler, __clearHandlers } from "../__mocks__/tauri";
+
+vi.mock("@tauri-apps/api/core", async () => {
+  const mock = await import("../__mocks__/tauri");
+  return { invoke: mock.invoke };
+});
+
+import { appState } from "../state/store";
+import { handleWebSearchCommand } from "./webSearch";
+
+describe("handleWebSearchCommand", () => {
+  const originalState = appState.get();
+
+  beforeEach(() => {
+    appState.set({
+      ...originalState,
+      webSearchProvider: "exa",
+    });
+  });
+
+  afterEach(() => {
+    __clearHandlers();
+    appState.set(originalState);
+  });
+
+  it("no args shows current provider", async () => {
+    const result = await handleWebSearchCommand("");
+    expect(result.lines).toContain("Web search provider: exa");
+  });
+
+  it("switches provider for the current session", async () => {
+    __setHandler("update_config", ({ partial }: { partial: Record<string, string> }) => {
+      expect(partial.web_search_provider).toBe("firecrawl");
+      return {
+        provider: "anthropic",
+        model: "claude-opus-4-6",
+        zai_plan: "paygo",
+        workspace: ".",
+        session_id: null,
+        recursive: true,
+        max_depth: 4,
+        max_steps_per_call: 100,
+        reasoning_effort: "high",
+        web_search_provider: "firecrawl",
+        demo: false,
+      };
+    });
+
+    const result = await handleWebSearchCommand("firecrawl");
+    expect(result.lines).toContain("Web search provider set to: firecrawl");
+    expect(appState.get().webSearchProvider).toBe("firecrawl");
+  });
+
+  it("save persists the selected provider", async () => {
+    __setHandler("update_config", () => ({
+      provider: "anthropic",
+      model: "claude-opus-4-6",
+      zai_plan: "coding",
+      workspace: ".",
+      session_id: null,
+      recursive: true,
+      max_depth: 4,
+      max_steps_per_call: 100,
+      reasoning_effort: "high",
+      web_search_provider: "firecrawl",
+      demo: false,
+    }));
+    __setHandler("save_settings", ({ settings }: { settings: Record<string, string> }) => {
+      expect(settings.web_search_provider).toBe("firecrawl");
+    });
+
+    const result = await handleWebSearchCommand("firecrawl --save");
+    expect(result.lines).toContain("(Settings saved)");
+  });
+});
diff --git a/openplanter-desktop/frontend/src/commands/webSearch.ts b/openplanter-desktop/frontend/src/commands/webSearch.ts
new file mode 100644
index 00000000..5a475eb0
--- /dev/null
+++ b/openplanter-desktop/frontend/src/commands/webSearch.ts
@@ -0,0 +1,58 @@
+/** /web-search slash command handler. */
+import { saveSettings, updateConfig } from "../api/invoke";
+import { appState } from "../state/store";
+import type { CommandResult } from "./model";
+
+const VALID_WEB_SEARCH_PROVIDERS = ["exa", "firecrawl"];
+
+/** Handle /web-search [provider] [--save]. */
+export async function handleWebSearchCommand(args: string): Promise<CommandResult> {
+  const parts = args.trim().split(/\s+/).filter(Boolean);
+  const requestedProvider = parts[0]?.toLowerCase() ?? "";
+  const save = parts.includes("--save");
+
+  if (!requestedProvider) {
+    const current = appState.get().webSearchProvider || "exa";
+    return {
+      action: "handled",
+      lines: [
+        `Web search provider: ${current}`,
+        `Valid providers: ${VALID_WEB_SEARCH_PROVIDERS.join(", ")}`,
+      ],
+    };
+  }
+
+  if (!VALID_WEB_SEARCH_PROVIDERS.includes(requestedProvider)) {
+    return {
+      action: "handled",
+      lines: [
+        `Invalid web search provider "${requestedProvider}". Expected: ${VALID_WEB_SEARCH_PROVIDERS.join(", ")}`,
+      ],
+    };
+  }
+
+  try {
+    const config = await updateConfig({
+      web_search_provider: requestedProvider,
+    });
+
+    appState.update((s) => ({
+      ...s,
+      zaiPlan: config.zai_plan,
+      webSearchProvider: config.web_search_provider,
+    }));
+
+    const lines = [`Web search provider set to: ${config.web_search_provider}`];
+    if (save) {
+      await saveSettings({ web_search_provider: config.web_search_provider });
+      lines.push("(Settings saved)");
+    }
+
+    return { action: "handled", lines };
+  } catch (e) {
+    return {
+      action: "handled",
+      lines: [`Failed to set web search provider: ${e}`],
+    };
+  }
+}
diff --git a/openplanter-desktop/frontend/src/commands/zaiPlan.test.ts b/openplanter-desktop/frontend/src/commands/zaiPlan.test.ts
new file mode 100644
index 00000000..2021900f
--- /dev/null
+++ b/openplanter-desktop/frontend/src/commands/zaiPlan.test.ts
@@ -0,0 +1,79 @@
+import { vi, describe, it, expect, beforeEach, afterEach } from "vitest";
+import { __setHandler, __clearHandlers } from "../__mocks__/tauri";
+
+vi.mock("@tauri-apps/api/core", async () => {
+  const mock = await import("../__mocks__/tauri");
+  return { invoke: mock.invoke };
+});
+
+import { appState } from "../state/store";
+import { handleZaiPlanCommand } from "./zaiPlan";
+
+describe("handleZaiPlanCommand", () => {
+  const originalState = appState.get();
+
+  beforeEach(() => {
+    appState.set({
+      ...originalState,
+      provider: "zai",
+      model: "glm-5",
+      zaiPlan: "paygo",
+    });
+  });
+
+  afterEach(() => {
+    __clearHandlers();
+    appState.set(originalState);
+  });
+
+  it("no args shows current plan", async () => {
+    const result = await handleZaiPlanCommand("");
+    expect(result.lines).toContain("Z.AI plan: paygo");
+  });
+
+  it("switches plan for the current session", async () => {
+    __setHandler("update_config", ({ partial }: { partial: Record<string, string> }) => {
+      expect(partial.zai_plan).toBe("coding");
+      return {
+        provider: "zai",
+        model: "glm-5",
+        zai_plan: "coding",
+        workspace: ".",
+        session_id: null,
+        recursive: true,
+        max_depth: 4,
+        max_steps_per_call: 100,
+        reasoning_effort: "high",
+        web_search_provider: "firecrawl",
+        demo: false,
+      };
+    });
+
+    const result = await handleZaiPlanCommand("coding");
+    expect(result.lines).toContain("Z.AI plan set to: coding");
+    expect(result.lines).toContain("Endpoint family: https://api.z.ai/api/coding/paas/v4");
+    expect(appState.get().zaiPlan).toBe("coding");
+  });
+
+  it("save persists the selected plan", async () => {
+    __setHandler("update_config", () => ({
+      provider: "zai",
+      model: "glm-5",
+      zai_plan: "paygo",
+      workspace: ".",
+      session_id: null,
+      recursive: true,
+      max_depth: 4,
+      max_steps_per_call: 100,
+      reasoning_effort: "high",
+      web_search_provider: "firecrawl",
+      demo: false,
+    }));
+    __setHandler("save_settings", ({ settings }: { settings: Record<string, string> }) => {
+      expect(settings.zai_plan).toBe("paygo");
+    });
+
+    const result = await handleZaiPlanCommand("paygo --save");
+    expect(result.lines).toContain("(Settings saved)");
+  });
+});
diff --git a/openplanter-desktop/frontend/src/commands/zaiPlan.ts b/openplanter-desktop/frontend/src/commands/zaiPlan.ts
new file mode 100644
index 00000000..c29006c6
--- /dev/null
+++ b/openplanter-desktop/frontend/src/commands/zaiPlan.ts
@@ -0,0 +1,62 @@
+/** /zai-plan slash command handler. */
+import { saveSettings, updateConfig } from "../api/invoke";
+import { appState } from "../state/store";
+import type { CommandResult } from "./model";
+
+const VALID_ZAI_PLANS = ["paygo", "coding"];
+
+/** Handle /zai-plan [plan] [--save]. */
+export async function handleZaiPlanCommand(args: string): Promise<CommandResult> {
+  const parts = args.trim().split(/\s+/).filter(Boolean);
+  const requestedPlan = parts[0]?.toLowerCase() ?? "";
+  const save = parts.includes("--save");
+
+  if (!requestedPlan) {
+    const current = appState.get().zaiPlan || "paygo";
+    return {
+      action: "handled",
+      lines: [
+        `Z.AI plan: ${current}`,
+        `Valid plans: ${VALID_ZAI_PLANS.join(", ")}`,
+      ],
+    };
+  }
+
+  if (!VALID_ZAI_PLANS.includes(requestedPlan)) {
+    return {
+      action: "handled",
+      lines: [
+        `Invalid Z.AI plan "${requestedPlan}". Expected: ${VALID_ZAI_PLANS.join(", ")}`,
+      ],
+    };
+  }
+
+  try {
+    const config = await updateConfig({
+      zai_plan: requestedPlan,
+    });
+
+    appState.update((s) => ({
+      ...s,
+      zaiPlan: config.zai_plan,
+      provider: config.provider,
+      model: config.model,
+    }));
+
+    const lines = [
+      `Z.AI plan set to: ${config.zai_plan}`,
+      `Endpoint family: ${config.zai_plan === "coding" ? "https://api.z.ai/api/coding/paas/v4" : "https://api.z.ai/api/paas/v4"}`,
+    ];
+    if (save) {
+      await saveSettings({ zai_plan: config.zai_plan });
+      lines.push("(Settings saved)");
+    }
+
+    return { action: "handled", lines };
+  } catch (e) {
+    return {
+      action: "handled",
+      lines: [`Failed to set Z.AI plan: ${e}`],
+    };
+  }
+}
diff --git a/openplanter-desktop/frontend/src/components/App.test.ts b/openplanter-desktop/frontend/src/components/App.test.ts
index 5e5e399c..d641b919 100644
--- a/openplanter-desktop/frontend/src/components/App.test.ts
+++ b/openplanter-desktop/frontend/src/components/App.test.ts
@@ -48,7 +48,7 @@ describe("createApp", () => {
     __setHandler("list_sessions", () => [SESSION_B, SESSION_A]);
     __setHandler("get_credentials_status", () => ({
       openai: true, anthropic: true, openrouter: false,
-      cerebras: false, ollama: true, exa: false,
+      cerebras: false, zai: true, ollama: true, exa: false, firecrawl: true,
     }));
     __setHandler("open_session", () => ({
       id: "20260227-120000-cccc3333",
@@ -79,13 +79,21 @@ describe("createApp", () => {
   });
 
   it("renders settings display", () => {
-    appState.update((s) => ({ ...s, provider: "anthropic", model: "claude-opus-4-6" }));
+    appState.update((s) => ({
+      ...s,
+      provider: "zai",
+      model: "glm-5",
+      zaiPlan: "coding",
+      webSearchProvider: "firecrawl",
+    }));
     const root = document.createElement("div");
     createApp(root);
     const settings = root.querySelector(".settings-display");
     expect(settings).not.toBeNull();
-    expect(settings!.textContent).toContain("anthropic");
-    expect(settings!.textContent).toContain("claude-opus-4-6");
+    expect(settings!.textContent).toContain("zai");
+    expect(settings!.textContent).toContain("glm-5");
+    expect(settings!.textContent).toContain("coding");
+    expect(settings!.textContent).toContain("firecrawl");
   });
 
   it("renders credential status", async () => {
@@ -95,7 +103,7 @@ describe("createApp", () => {
 
     await vi.waitFor(() => {
       const creds = root.querySelector(".cred-status");
-      expect(creds!.children.length).toBe(6);
+      expect(creds!.children.length).toBe(8);
       expect(creds!.querySelector(".cred-ok")!.textContent).toContain("openai");
       expect(creds!.querySelector(".cred-missing")!.textContent).toContain("openrouter");
     });
diff --git a/openplanter-desktop/frontend/src/components/App.ts b/openplanter-desktop/frontend/src/components/App.ts
index 22047445..9f5ef663 100644
--- a/openplanter-desktop/frontend/src/components/App.ts
+++ b/openplanter-desktop/frontend/src/components/App.ts
@@ -67,6 +67,8 @@ export function createApp(root: HTMLElement): void {
     settingsDisplay.innerHTML = [
       `<div><span class="label">provider:</span> <span class="value">${s.provider || "auto"}</span></div>`,
       `<div><span class="label">model:</span> <span class="value">${s.model || "\u2014"}</span></div>`,
+      `<div><span class="label">z.ai plan:</span> <span class="value">${s.zaiPlan || "paygo"}</span></div>`,
+      `<div><span class="label">web search:</span> <span class="value">${s.webSearchProvider || "exa"}</span></div>`,
       `<div><span class="label">reasoning:</span> <span class="value">${s.reasoningEffort ?? "off"}</span></div>`,
       `<div><span class="label">mode:</span> <span class="value">${s.recursive ? "recursive" : "flat"}</span></div>`,
     ].join("");
@@ -300,7 +302,7 @@ async function loadCredentials(container: HTMLElement): Promise<void> {
   try {
     const status = await getCredentialsStatus();
     container.innerHTML = "";
-    const providers = ["openai", "anthropic", "openrouter", "cerebras", "ollama", "exa"];
+    const providers = ["openai", "anthropic", "openrouter", "cerebras", "zai", "ollama", "exa", "firecrawl"];
     for (const p of providers) {
       const row = document.createElement("div");
       const hasKey = status[p] ?? false;
diff --git a/openplanter-desktop/frontend/src/components/StatusBar.test.ts b/openplanter-desktop/frontend/src/components/StatusBar.test.ts
index 507ea6cd..34aba5ca 100644
--- a/openplanter-desktop/frontend/src/components/StatusBar.test.ts
+++ b/openplanter-desktop/frontend/src/components/StatusBar.test.ts
@@ -24,6 +24,7 @@ describe("createStatusBar", () => {
     expect(bar.querySelector(".provider")).not.toBeNull();
     expect(bar.querySelector(".model")).not.toBeNull();
     expect(bar.querySelector(".reasoning")).not.toBeNull();
+    expect(bar.querySelector(".zai-plan")).not.toBeNull();
     expect(bar.querySelector(".mode")).not.toBeNull();
     expect(bar.querySelector(".session")).not.toBeNull();
     expect(bar.querySelector(".tokens")).not.toBeNull();
@@ -54,6 +55,18 @@ describe("createStatusBar", () => {
     expect(bar.querySelector(".reasoning")!.textContent).toBe("");
   });
 
+  it("renders Z.AI plan when provider is zai", () => {
+    appState.update((s) => ({ ...s, provider: "zai", zaiPlan: "coding" }));
+    const bar = createStatusBar();
+    expect(bar.querySelector(".zai-plan")!.textContent).toBe("zai:coding");
+  });
+
+  it("hides Z.AI plan when provider is not zai", () => {
+    appState.update((s) => ({ ...s, provider: "anthropic", zaiPlan: "coding" }));
+    const bar = createStatusBar();
+    expect(bar.querySelector(".zai-plan")!.textContent).toBe("");
+  });
+
   it("renders recursive mode", () => {
     appState.update((s) => ({ ...s, recursive: true }));
     const bar = createStatusBar();
diff --git a/openplanter-desktop/frontend/src/components/StatusBar.ts b/openplanter-desktop/frontend/src/components/StatusBar.ts
index c45963e0..f2f119ad 100644
--- a/openplanter-desktop/frontend/src/components/StatusBar.ts
+++ b/openplanter-desktop/frontend/src/components/StatusBar.ts
@@ -14,6 +14,9 @@ export function createStatusBar(): HTMLElement {
   const reasoningEl = document.createElement("span");
   reasoningEl.className = "reasoning";
 
+  const zaiPlanEl = document.createElement("span");
+  zaiPlanEl.className = "zai-plan";
+
   const modeEl = document.createElement("span");
   modeEl.className = "mode";
 
@@ -26,6 +29,7 @@ export function createStatusBar(): HTMLElement {
   bar.appendChild(providerEl);
   bar.appendChild(modelEl);
   bar.appendChild(reasoningEl);
+  bar.appendChild(zaiPlanEl);
   bar.appendChild(modeEl);
   bar.appendChild(sessionEl);
   bar.appendChild(tokensEl);
@@ -37,6 +41,8 @@ export function createStatusBar(): HTMLElement {
     reasoningEl.textContent = s.reasoningEffort
       ? `reasoning:${s.reasoningEffort}`
       : "";
+    zaiPlanEl.textContent =
+      s.provider === "zai" ? `zai:${s.zaiPlan || "paygo"}` : "";
     modeEl.textContent = s.recursive ? "recursive" : "flat";
     sessionEl.textContent = s.sessionId ? `session ${s.sessionId.slice(0, 8)}` : "";
 
diff --git a/openplanter-desktop/frontend/src/main.ts b/openplanter-desktop/frontend/src/main.ts
index c797da10..ad9ac303 100644
--- a/openplanter-desktop/frontend/src/main.ts
+++ b/openplanter-desktop/frontend/src/main.ts
@@ -35,6 +35,8 @@ async function init() {
       ...s,
       provider: config.provider,
       model: config.model,
+      zaiPlan: config.zai_plan,
+      webSearchProvider: config.web_search_provider,
       sessionId: config.session_id,
       reasoningEffort: config.reasoning_effort,
       recursive: config.recursive,
@@ -66,6 +68,8 @@ async function init() {
         content: [
           `provider: ${provider || "auto"}`,
           `model: ${model || "—"}`,
+          `z.ai plan: ${state.zaiPlan || "paygo"}`,
+          `web search: ${state.webSearchProvider || "exa"}`,
           `reasoning: ${reasoningLabel}`,
           `mode: ${modeLabel}`,
           `workspace: ${state.workspace || "."}`,
diff --git a/openplanter-desktop/frontend/src/state/store.ts b/openplanter-desktop/frontend/src/state/store.ts
index 1cd3d3fb..eafa4c8a 100644
--- a/openplanter-desktop/frontend/src/state/store.ts
+++ b/openplanter-desktop/frontend/src/state/store.ts
@@ -61,6 +61,8 @@ export interface ChatMessage {
 export interface AppState {
   provider: string;
   model: string;
+  zaiPlan: string;
+  webSearchProvider: string;
   sessionId: string | null;
   inputTokens: number;
   outputTokens: number;
@@ -80,6 +82,8 @@ export interface AppState {
 export const appState = new Store<AppState>({
   provider: "",
   model: "",
+  zaiPlan: "paygo",
+  webSearchProvider: "exa",
   sessionId: null,
   inputTokens: 0,
   outputTokens: 0,
diff --git a/openplanter-desktop/package.json b/openplanter-desktop/package.json
new file mode 100644
index 00000000..36278c4a
--- /dev/null
+++ b/openplanter-desktop/package.json
@@ -0,0 +1,10 @@
+{
+  "name": "openplanter-desktop",
+  "private": true,
+  "scripts": {
+    "dev": "npm --prefix frontend run dev",
+    "build": "npm --prefix frontend run build",
+    "test": "npm --prefix frontend run test",
+    "test:e2e": "npm --prefix frontend run test:e2e"
+  }
+}
diff --git a/tests/test_coverage_gaps.py b/tests/test_coverage_gaps.py
index 22e4dfe7..23c49947 100644
--- a/tests/test_coverage_gaps.py
+++ b/tests/test_coverage_gaps.py
@@ -162,16 +162,26 @@ def test_defaults_from_clean_env(self) -> None:
         with patch.dict(os.environ, {}, clear=True):
             cfg = AgentConfig.from_env("/tmp/test-ws")
         self.assertEqual(cfg.provider, "auto")
-        self.assertEqual(cfg.model, "claude-opus-4-6")
+        self.assertEqual(cfg.model, "anthropic-foundry/claude-opus-4-6")
         self.assertEqual(cfg.reasoning_effort, "high")
         self.assertEqual(cfg.max_depth, 4)
         self.assertEqual(cfg.max_steps_per_call, 100)
         self.assertEqual(cfg.shell, "/bin/sh")
+        self.assertEqual(
+            cfg.openai_base_url,
+            "https://foundry-proxy.cheetah-koi.ts.net/openai/v1",
+        )
+        self.assertEqual(
+            cfg.anthropic_base_url,
+            "https://foundry-proxy.cheetah-koi.ts.net/anthropic/v1",
+        )
+        self.assertEqual(cfg.openai_api_key, "dont-worry-this-key-will-be-auto-injected")
+        self.assertEqual(cfg.anthropic_api_key, "dont-worry-it-will-be-injected")
 
     def test_custom_env_overrides(self) -> None:
         env = {
             "OPENPLANTER_PROVIDER": "anthropic",
-            "OPENPLANTER_MODEL": "claude-opus-4-6",
+            "OPENPLANTER_MODEL": "anthropic-foundry/claude-opus-4-6",
             "OPENPLANTER_REASONING_EFFORT": "low",
             "OPENPLANTER_MAX_DEPTH": "5",
             "OPENPLANTER_MAX_STEPS": "20",
@@ -180,12 +190,51 @@ def test_custom_env_overrides(self) -> None:
         with patch.dict(os.environ, env, clear=True):
             cfg = AgentConfig.from_env("/tmp/test-ws")
         self.assertEqual(cfg.provider, "anthropic")
-        self.assertEqual(cfg.model, "claude-opus-4-6")
+        self.assertEqual(cfg.model, "anthropic-foundry/claude-opus-4-6")
         self.assertEqual(cfg.reasoning_effort, "low")
         self.assertEqual(cfg.max_depth, 5)
         self.assertEqual(cfg.max_steps_per_call, 20)
         self.assertEqual(cfg.shell, "/bin/bash")
 
+    def test_rate_limit_and_zai_stream_retries_from_env(self) -> None:
+        env = {
+            "OPENPLANTER_RATE_LIMIT_MAX_RETRIES": "7",
+            "OPENPLANTER_RATE_LIMIT_BACKOFF_BASE_SEC": "0.5",
+            "OPENPLANTER_RATE_LIMIT_BACKOFF_MAX_SEC": "10.0",
+            "OPENPLANTER_RATE_LIMIT_RETRY_AFTER_CAP_SEC": "30.0",
+            "OPENPLANTER_ZAI_STREAM_MAX_RETRIES": "8",
+        }
+        with patch.dict(os.environ, env, clear=True):
+            cfg = AgentConfig.from_env("/tmp/test-ws")
+        self.assertEqual(cfg.rate_limit_max_retries, 7)
+        self.assertEqual(cfg.rate_limit_backoff_base_sec, 0.5)
+        self.assertEqual(cfg.rate_limit_backoff_max_sec, 10.0)
+        self.assertEqual(cfg.rate_limit_retry_after_cap_sec, 30.0)
+        self.assertEqual(cfg.zai_stream_max_retries, 8)
+
+    def test_zai_plan_selects_endpoint(self) -> None:
+        env = {
+            "OPENPLANTER_ZAI_PLAN": "coding",
+            "OPENPLANTER_ZAI_PAYGO_BASE_URL": "https://paygo.example/v4",
+            "OPENPLANTER_ZAI_CODING_BASE_URL": "https://coding.example/v4",
+        }
+        with patch.dict(os.environ, env, clear=True):
+            cfg = AgentConfig.from_env("/tmp/test-ws")
+        self.assertEqual(cfg.zai_plan, "coding")
+        self.assertEqual(cfg.zai_base_url, "https://coding.example/v4")
+
+    def test_zai_base_url_override_wins_over_plan(self) -> None:
+        env = {
+            "OPENPLANTER_ZAI_PLAN": "paygo",
+            "OPENPLANTER_ZAI_BASE_URL": "https://override.example/v4",
+            "OPENPLANTER_ZAI_PAYGO_BASE_URL": "https://paygo.example/v4",
+            "OPENPLANTER_ZAI_CODING_BASE_URL": "https://coding.example/v4",
+        }
+        with patch.dict(os.environ, env, clear=True):
+            cfg = AgentConfig.from_env("/tmp/test-ws")
+        self.assertEqual(cfg.zai_plan, "paygo")
+        self.assertEqual(cfg.zai_base_url, "https://override.example/v4")
+
     def test_api_keys_from_env(self) -> None:
         env = {
             "OPENAI_API_KEY": "oa",
@@ -200,6 +249,16 @@ def test_api_keys_from_env(self) -> None:
         self.assertEqual(cfg.openrouter_api_key, "or")
         self.assertEqual(cfg.exa_api_key, "exa")
 
+    def test_foundry_placeholder_keys_disabled_for_public_endpoints(self) -> None:
+        env = {
+            "OPENPLANTER_OPENAI_BASE_URL": "https://api.openai.com/v1",
+            "OPENPLANTER_ANTHROPIC_BASE_URL": "https://api.anthropic.com/v1",
+        }
+        with patch.dict(os.environ, env, clear=True):
+            cfg = AgentConfig.from_env("/tmp/test-ws")
+        self.assertIsNone(cfg.openai_api_key)
+        self.assertIsNone(cfg.anthropic_api_key)
+
     def test_workspace_resolved(self) -> None:
         with patch.dict(os.environ, {}, clear=True):
             cfg = AgentConfig.from_env("/tmp/test-ws")
@@ -274,19 +333,25 @@ def test_explicit_model_returned(self) -> None:
 
     def test_empty_model_uses_provider_default(self) -> None:
         cfg = AgentConfig(workspace=Path("/tmp"), provider="openai", model="")
-        self.assertEqual(_resolve_model_name(cfg), "gpt-5.2")
+        self.assertEqual(_resolve_model_name(cfg), "azure-foundry/gpt-5.3-codex")
 
     def test_empty_model_anthropic_default(self) -> None:
         cfg = AgentConfig(workspace=Path("/tmp"), provider="anthropic", model="")
-        self.assertEqual(_resolve_model_name(cfg), "claude-opus-4-6")
+        self.assertEqual(_resolve_model_name(cfg), "anthropic-foundry/claude-opus-4-6")
 
     def test_unknown_provider_fallback(self) -> None:
         cfg = AgentConfig(workspace=Path("/tmp"), provider="custom", model="")
         result = _resolve_model_name(cfg)
-        self.assertEqual(result, "claude-opus-4-6")
+        self.assertEqual(result, "anthropic-foundry/claude-opus-4-6")
 
     def test_newest_without_key_raises(self) -> None:
-        cfg = AgentConfig(workspace=Path("/tmp"), provider="openai", model="newest")
+        cfg = AgentConfig(
+            workspace=Path("/tmp"),
+            provider="openai",
+            model="newest",
+            openai_base_url="https://api.openai.com/v1",
+            openai_api_key=None,
+        )
         with self.assertRaises(ModelError):
             _resolve_model_name(cfg)
 
@@ -302,7 +367,7 @@ def test_openai_provider_with_key(self) -> None:
             cfg = AgentConfig(
                 workspace=Path(tmpdir),
                 provider="openai",
-                model="gpt-5.2",
+                model="azure-foundry/gpt-5.3-codex",
                 openai_api_key="test-key",
             )
             engine = build_engine(cfg)
@@ -313,7 +378,7 @@ def test_anthropic_provider_with_key(self) -> None:
             cfg = AgentConfig(
                 workspace=Path(tmpdir),
                 provider="anthropic",
-                model="claude-opus-4-6",
+                model="anthropic-foundry/claude-opus-4-6",
                 anthropic_api_key="test-key",
             )
             engine = build_engine(cfg)
@@ -324,8 +389,10 @@ def test_no_key_fallback_to_echo(self) -> None:
             cfg = AgentConfig(
                 workspace=Path(tmpdir),
                 provider="openai",
-                model="gpt-5.2",
-            )
+                model="azure-foundry/gpt-5.3-codex",
+                openai_base_url="https://api.openai.com/v1",
+                openai_api_key=None,
+                )
             engine = build_engine(cfg)
             self.assertIsInstance(engine.model, EchoFallbackModel)
 
@@ -340,6 +407,33 @@ def test_openrouter_provider_with_key(self) -> None:
             engine = build_engine(cfg)
             self.assertIsInstance(engine.model, OpenAICompatibleModel)
 
+    def test_zai_stream_retries_propagated(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            cfg = AgentConfig(
+                workspace=Path(tmpdir),
+                provider="zai",
+                model="glm-5",
+                zai_api_key="test-key",
+                zai_stream_max_retries=10,
+            )
+            engine = build_engine(cfg)
+            self.assertIsInstance(engine.model, OpenAICompatibleModel)
+            self.assertEqual(engine.model.stream_max_retries, 10)
+
+    def test_zai_coding_plan_sets_coding_endpoint(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            env = {
+                "OPENPLANTER_PROVIDER": "zai",
+                "OPENPLANTER_MODEL": "glm-5",
+                "OPENPLANTER_ZAI_PLAN": "coding",
+            }
+            with patch.dict(os.environ, env, clear=True):
+                cfg = AgentConfig.from_env(Path(tmpdir))
+            cfg.zai_api_key = "test-key"
+            engine = build_engine(cfg)
+            self.assertIsInstance(engine.model, OpenAICompatibleModel)
+            self.assertEqual(engine.model.base_url, cfg.zai_coding_base_url)
+
     def test_model_provider_mismatch_raises(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             cfg = AgentConfig(
diff --git a/tests/test_credentials.py b/tests/test_credentials.py
index 79886207..29538747 100644
--- a/tests/test_credentials.py
+++ b/tests/test_credentials.py
@@ -22,7 +22,9 @@ def test_parse_env_file_extracts_supported_keys(self) -> None:
                         "OPENAI_API_KEY=oa-key",
                         "ANTHROPIC_API_KEY=an-key",
                         "OPENROUTER_API_KEY=or-key",
+                        "ZAI_API_KEY=zai-key",
                         "EXA_API_KEY=exa-key",
+                        "FIRECRAWL_API_KEY=fc-key",
                     ]
                 ),
                 encoding="utf-8",
@@ -31,7 +33,9 @@ def test_parse_env_file_extracts_supported_keys(self) -> None:
             self.assertEqual(creds.openai_api_key, "oa-key")
             self.assertEqual(creds.anthropic_api_key, "an-key")
             self.assertEqual(creds.openrouter_api_key, "or-key")
+            self.assertEqual(creds.zai_api_key, "zai-key")
             self.assertEqual(creds.exa_api_key, "exa-key")
+            self.assertEqual(creds.firecrawl_api_key, "fc-key")
 
     def test_store_roundtrip(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
@@ -41,7 +45,9 @@ def test_store_roundtrip(self) -> None:
                 openai_api_key="oa",
                 anthropic_api_key="an",
                 openrouter_api_key="or",
+                zai_api_key="zai",
                 exa_api_key="exa",
+                firecrawl_api_key="fc",
             )
             store.save(creds)
             loaded = store.load()
diff --git a/tests/test_engine_complex.py b/tests/test_engine_complex.py
index e5bb29b7..a2e0f2de 100644
--- a/tests/test_engine_complex.py
+++ b/tests/test_engine_complex.py
@@ -8,7 +8,7 @@
 from conftest import _tc
 from agent.config import AgentConfig
 from agent.engine import RLMEngine, ExternalContext
-from agent.model import ModelTurn, ScriptedModel
+from agent.model import Conversation, ModelTurn, RateLimitError, ScriptedModel, ToolResult
 from agent.tools import WorkspaceTools
 
 
@@ -640,6 +640,117 @@ def test_think_tool_observation(self) -> None:
             self.assertEqual(result, "done")
             self.assertIn("Thought noted: my thought", returned_ctx.observations[0])
 
+    # ------------------------------------------------------------------
+    # 30. Rate-limit retries succeed without consuming extra step budget
+    # ------------------------------------------------------------------
+    def test_rate_limit_retries_then_succeeds(self) -> None:
+        class RetryThenSuccessModel:
+            def __init__(self) -> None:
+                self.calls = 0
+
+            def create_conversation(self, system_prompt: str, initial_user_message: str) -> Conversation:
+                return Conversation(_provider_messages=[{"role": "user", "content": initial_user_message}])
+
+            def complete(self, conversation: Conversation) -> ModelTurn:
+                self.calls += 1
+                if self.calls == 1:
+                    raise RateLimitError(
+                        "rate limit",
+                        status_code=429,
+                        provider_code="1302",
+                    )
+                return ModelTurn(text="done", stop_reason="end_turn")
+
+            def append_assistant_turn(self, conversation: Conversation, turn: ModelTurn) -> None:
+                pass
+
+            def append_tool_results(self, conversation: Conversation, results: list[ToolResult]) -> None:
+                pass
+
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(
+                workspace=root,
+                max_depth=1,
+                max_steps_per_call=1,
+                rate_limit_max_retries=3,
+                rate_limit_backoff_base_sec=0.0,
+                rate_limit_backoff_max_sec=0.0,
+                rate_limit_retry_after_cap_sec=0.0,
+            )
+            tools = WorkspaceTools(root=root)
+            model = RetryThenSuccessModel()
+            engine = RLMEngine(model=model, tools=tools, config=cfg)
+            with patch("agent.engine.random.uniform", return_value=0.0):
+                result = engine.solve("retry test")
+            self.assertEqual(result, "done")
+            self.assertEqual(model.calls, 2)
+
+    # ------------------------------------------------------------------
+    # 31. Exhausted rate-limit retries surfaces model error
+    # ------------------------------------------------------------------
+    def test_rate_limit_retries_exhausted_returns_model_error(self) -> None:
+        class AlwaysRateLimitModel:
+            def create_conversation(self, system_prompt: str, initial_user_message: str) -> Conversation:
+                return Conversation(_provider_messages=[{"role": "user", "content": initial_user_message}])
+
+            def complete(self, conversation: Conversation) -> ModelTurn:
+                raise RateLimitError("still rate limited", status_code=429, provider_code="1302")
+
+            def append_assistant_turn(self, conversation: Conversation, turn: ModelTurn) -> None:
+                pass
+
+            def append_tool_results(self, conversation: Conversation, results: list[ToolResult]) -> None:
+                pass
+
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(
+                workspace=root,
+                max_depth=1,
+                max_steps_per_call=1,
+                rate_limit_max_retries=2,
+                rate_limit_backoff_base_sec=0.0,
+                rate_limit_backoff_max_sec=0.0,
+                rate_limit_retry_after_cap_sec=0.0,
+            )
+            tools = WorkspaceTools(root=root)
+            engine = RLMEngine(model=AlwaysRateLimitModel(), tools=tools, config=cfg)
+            with patch("agent.engine.random.uniform", return_value=0.0):
+                result = engine.solve("retry test")
+            self.assertIn("Model error at depth 0, step 1", result)
+
+    # ------------------------------------------------------------------
+    # 32. Deadline exits gracefully during rate-limit wait
+    # ------------------------------------------------------------------
+    def test_rate_limit_wait_respects_deadline(self) -> None:
+        class SlowRateLimitModel:
+            def create_conversation(self, system_prompt: str, initial_user_message: str) -> Conversation:
+                return Conversation(_provider_messages=[{"role": "user", "content": initial_user_message}])
+
+            def complete(self, conversation: Conversation) -> ModelTurn:
+                raise RateLimitError("wait", status_code=429, retry_after_sec=10.0)
+
+            def append_assistant_turn(self, conversation: Conversation, turn: ModelTurn) -> None:
+                pass
+
+            def append_tool_results(self, conversation: Conversation, results: list[ToolResult]) -> None:
+                pass
+
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(
+                workspace=root,
+                max_depth=1,
+                max_steps_per_call=1,
+                max_solve_seconds=1,
+                rate_limit_max_retries=3,
+            )
+            tools = WorkspaceTools(root=root)
+            engine = RLMEngine(model=SlowRateLimitModel(), tools=tools, config=cfg)
+            result = engine.solve("deadline retry test")
+            self.assertIn("Time limit exceeded", result)
+
 
 if __name__ == "__main__":
     unittest.main()
diff --git a/tests/test_model.py b/tests/test_model.py
index 19b1540e..0631eb19 100644
--- a/tests/test_model.py
+++ b/tests/test_model.py
@@ -4,7 +4,7 @@
 from unittest.mock import patch
 
 from conftest import mock_anthropic_stream, mock_openai_stream
-from agent.model import AnthropicModel, ModelError, OpenAICompatibleModel
+from agent.model import AnthropicModel, HTTPModelError, ModelError, OpenAICompatibleModel, RateLimitError
 
 
 class ModelPayloadTests(unittest.TestCase):
@@ -36,6 +36,62 @@ def fake_http_json(url, method, headers, payload=None, timeout_sec=90):  # type:
             self.assertEqual(turn.text, "ok")
             self.assertEqual(captured["payload"]["reasoning_effort"], "high")
 
+    def test_openai_payload_strips_foundry_prefix(self) -> None:
+        captured: dict = {}
+
+        def fake_http_json(url, method, headers, payload=None, timeout_sec=90):  # type: ignore[no-untyped-def]
+            captured["payload"] = payload
+            return {
+                "choices": [
+                    {
+                        "message": {
+                            "content": "ok",
+                            "tool_calls": None,
+                        },
+                        "finish_reason": "stop",
+                    }
+                ]
+            }
+
+        with patch("agent.model._http_stream_sse", mock_openai_stream(fake_http_json)):
+            model = OpenAICompatibleModel(
+                model="azure-foundry/gpt-5.3-codex",
+                api_key="k",
+                reasoning_effort="high",
+            )
+            conv = model.create_conversation("system", "user msg")
+            turn = model.complete(conv)
+            self.assertEqual(turn.text, "ok")
+            self.assertEqual(captured["payload"]["model"], "gpt-5.3-codex")
+
+    def test_openai_payload_includes_thinking_type(self) -> None:
+        captured: dict = {}
+
+        def fake_http_json(url, method, headers, payload=None, timeout_sec=90):  # type: ignore[no-untyped-def]
+            captured["payload"] = payload
+            return {
+                "choices": [
+                    {
+                        "message": {
+                            "content": "ok",
+                            "tool_calls": None,
+                        },
+                        "finish_reason": "stop",
+                    }
+                ]
+            }
+
+        with patch("agent.model._http_stream_sse", mock_openai_stream(fake_http_json)):
+            model = OpenAICompatibleModel(
+                model="glm-5",
+                api_key="k",
+                thinking_type="enabled",
+            )
+            conv = model.create_conversation("system", "user msg")
+            turn = model.complete(conv)
+            self.assertEqual(turn.text, "ok")
+            self.assertEqual(captured["payload"]["thinking"], {"type": "enabled"})
+
     def test_anthropic_payload_includes_thinking_budget(self) -> None:
         """Non-Opus-4.6 models use manual thinking with budget_tokens."""
         captured: dict = {}
@@ -58,6 +114,27 @@ def fake_http_json(url, method, headers, payload=None, timeout_sec=90):  # type:
             self.assertEqual(turn.text, "ok")
             self.assertEqual(captured["payload"]["thinking"]["budget_tokens"], 4096)
 
+    def test_anthropic_payload_strips_foundry_prefix(self) -> None:
+        captured: dict = {}
+
+        def fake_http_json(url, method, headers, payload=None, timeout_sec=90):  # type: ignore[no-untyped-def]
+            captured["payload"] = payload
+            return {
+                "content": [{"type": "text", "text": "ok"}],
+                "stop_reason": "end_turn",
+            }
+
+        with patch("agent.model._http_stream_sse", mock_anthropic_stream(fake_http_json)):
+            model = AnthropicModel(
+                model="anthropic-foundry/claude-opus-4-6",
+                api_key="k",
+                reasoning_effort="high",
+            )
+            conv = model.create_conversation("system", "user msg")
+            turn = model.complete(conv)
+            self.assertEqual(turn.text, "ok")
+            self.assertEqual(captured["payload"]["model"], "claude-opus-4-6")
+
     def test_anthropic_opus46_uses_adaptive_thinking(self) -> None:
         """Opus 4.6 uses adaptive thinking with output_config effort."""
         captured: dict = {}
@@ -142,6 +219,124 @@ def fake_http_json(url, method, headers, payload=None, timeout_sec=90):  # type:
             self.assertIn("thinking", calls[0])
             self.assertNotIn("thinking", calls[1])
 
+    def test_openai_reasoning_content_forwards_as_thinking(self) -> None:
+        deltas: list[tuple[str, str]] = []
+
+        def fake_stream_sse(url, method, headers, payload, first_byte_timeout=10, stream_timeout=120, max_retries=3, on_sse_event=None):  # type: ignore[no-untyped-def]
+            events = [
+                ("", {"choices": [{"delta": {"reasoning_content": "thinking text"}, "finish_reason": None}]}),
+                ("", {"choices": [{"delta": {"content": "final text"}, "finish_reason": None}]}),
+                ("", {"choices": [{"delta": {}, "finish_reason": "stop"}]}),
+            ]
+            if on_sse_event:
+                for event_type, data in events:
+                    on_sse_event(event_type, data)
+            return events
+
+        with patch("agent.model._http_stream_sse", fake_stream_sse):
+            model = OpenAICompatibleModel(
+                model="glm-5",
+                api_key="k",
+                on_content_delta=lambda delta_type, text: deltas.append((delta_type, text)),
+            )
+            conv = model.create_conversation("system", "user msg")
+            turn = model.complete(conv)
+            self.assertEqual(turn.text, "final text")
+            self.assertIn(("thinking", "thinking text"), deltas)
+            self.assertIn(("text", "final text"), deltas)
+
+    def test_openai_finish_reason_rate_limit_raises_rate_limit_error(self) -> None:
+        def fake_http_json(url, method, headers, payload=None, timeout_sec=90):  # type: ignore[no-untyped-def]
+            return {
+                "choices": [
+                    {
+                        "message": {"content": "partial", "tool_calls": None},
+                        "finish_reason": "rate_limit",
+                    }
+                ]
+            }
+
+        with patch("agent.model._http_stream_sse", mock_openai_stream(fake_http_json)):
+            model = OpenAICompatibleModel(model="glm-5", api_key="k")
+            conv = model.create_conversation("system", "user msg")
+            with self.assertRaises(RateLimitError):
+                model.complete(conv)
+
+    def test_zai_uses_configured_endpoint_without_auto_switch(self) -> None:
+        calls: list[str] = []
+
+        def fake_stream_sse(url, method, headers, payload, first_byte_timeout=10, stream_timeout=120, max_retries=3, on_sse_event=None):  # type: ignore[no-untyped-def]
+            calls.append(url)
+            if "/api/paas/v4/" in url:
+                raise HTTPModelError(
+                    f"HTTP 404 calling {url}: not found",
+                    status_code=404,
+                    body='{"error":{"message":"not found"}}',
+                )
+            return []
+
+        with patch("agent.model._http_stream_sse", fake_stream_sse):
+            model = OpenAICompatibleModel(
+                model="glm-5",
+                api_key="k",
+                base_url="https://api.z.ai/api/paas/v4",
+                provider="zai",
+            )
+            conv = model.create_conversation("system", "user msg")
+            with self.assertRaises(HTTPModelError):
+                model.complete(conv)
+            self.assertEqual(model.base_url, "https://api.z.ai/api/paas/v4")
+            self.assertEqual(len(calls), 1)
+
+    def test_openai_stream_retries_respected(self) -> None:
+        captured: dict[str, int] = {}
+
+        def fake_stream_sse(url, method, headers, payload, first_byte_timeout=10, stream_timeout=120, max_retries=3, on_sse_event=None):  # type: ignore[no-untyped-def]
+            captured["max_retries"] = max_retries
+            events = [
+                ("", {"choices": [{"delta": {"content": "ok"}, "finish_reason": None}]}),
+                ("", {"choices": [{"delta": {}, "finish_reason": "stop"}]}),
+            ]
+            if on_sse_event:
+                for event_type, data in events:
+                    on_sse_event(event_type, data)
+            return events
+
+        with patch("agent.model._http_stream_sse", fake_stream_sse):
+            model = OpenAICompatibleModel(
+                model="gpt-4.1-mini",
+                api_key="k",
+                stream_max_retries=7,
+            )
+            conv = model.create_conversation("system", "user msg")
+            model.complete(conv)
+        self.assertEqual(captured.get("max_retries"), 7)
+
+    def test_zai_stream_retries_respected(self) -> None:
+        captured: dict[str, int] = {}
+
+        def fake_stream_sse(url, method, headers, payload, first_byte_timeout=10, stream_timeout=120, max_retries=3, on_sse_event=None):  # type: ignore[no-untyped-def]
+            captured["max_retries"] = max_retries
+            events = [
+                ("", {"choices": [{"delta": {"content": "ok"}, "finish_reason": None}]}),
+                ("", {"choices": [{"delta": {}, "finish_reason": "stop"}]}),
+            ]
+            if on_sse_event:
+                for event_type, data in events:
+                    on_sse_event(event_type, data)
+            return events
+
+        with patch("agent.model._http_stream_sse", fake_stream_sse):
+            model = OpenAICompatibleModel(
+                model="glm-5",
+                api_key="k",
+                provider="zai",
+                stream_max_retries=10,
+            )
+            conv = model.create_conversation("system", "user msg")
+            model.complete(conv)
+        self.assertEqual(captured.get("max_retries"), 10)
+
 
 class OllamaPayloadTests(unittest.TestCase):
     def test_ollama_uses_openai_compatible_format(self) -> None:
diff --git a/tests/test_settings.py b/tests/test_settings.py
index 2f85fa12..d39c08ea 100644
--- a/tests/test_settings.py
+++ b/tests/test_settings.py
@@ -40,6 +40,7 @@ def test_per_provider_model_roundtrip(self) -> None:
                 default_model_openai="gpt-4.1-mini",
                 default_model_anthropic="claude-opus-4-6",
                 default_model_openrouter="anthropic/claude-sonnet-4-5",
+                default_model_zai="glm-5",
             )
             store.save(settings)
             loaded = store.load()
@@ -47,6 +48,7 @@ def test_per_provider_model_roundtrip(self) -> None:
             self.assertEqual(loaded.default_model_openai, "gpt-4.1-mini")
             self.assertEqual(loaded.default_model_anthropic, "claude-opus-4-6")
             self.assertEqual(loaded.default_model_openrouter, "anthropic/claude-sonnet-4-5")
+            self.assertEqual(loaded.default_model_zai, "glm-5")
 
     def test_default_model_for_provider_specific(self) -> None:
         settings = PersistentSettings(
@@ -66,6 +68,7 @@ def test_default_model_for_provider_none(self) -> None:
         self.assertIsNone(settings.default_model_for_provider("anthropic"))
         self.assertIsNone(settings.default_model_for_provider("openrouter"))
         self.assertIsNone(settings.default_model_for_provider("cerebras"))
+        self.assertIsNone(settings.default_model_for_provider("zai"))
 
     def test_per_provider_model_ollama(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
@@ -85,6 +88,13 @@ def test_default_model_for_provider_ollama(self) -> None:
         )
         self.assertEqual(settings.default_model_for_provider("ollama"), "llama3.2")
 
+    def test_default_model_for_provider_zai(self) -> None:
+        settings = PersistentSettings(
+            default_model="global-model",
+            default_model_zai="glm-5",
+        )
+        self.assertEqual(settings.default_model_for_provider("zai"), "glm-5")
+
     def test_backward_compat_old_settings(self) -> None:
         """Old settings.json without per-provider keys still loads fine."""
         import json
@@ -100,6 +110,7 @@ def test_backward_compat_old_settings(self) -> None:
             self.assertIsNone(loaded.default_model_openai)
             self.assertIsNone(loaded.default_model_anthropic)
             self.assertIsNone(loaded.default_model_openrouter)
+            self.assertIsNone(loaded.default_model_zai)
 
 
 class ComputeSuggestionsTests(unittest.TestCase):
@@ -155,11 +166,19 @@ def test_claude_is_anthropic(self) -> None:
         self.assertEqual(infer_provider_for_model("claude-opus-4-6"), "anthropic")
         self.assertEqual(infer_provider_for_model("claude-sonnet-4-5-20250929"), "anthropic")
         self.assertEqual(infer_provider_for_model("Claude-3-Haiku"), "anthropic")
+        self.assertEqual(
+            infer_provider_for_model("anthropic-foundry/claude-opus-4-6"),
+            "anthropic",
+        )
 
     def test_gpt_is_openai(self) -> None:
         self.assertEqual(infer_provider_for_model("gpt-5.2"), "openai")
         self.assertEqual(infer_provider_for_model("gpt-4.1-mini"), "openai")
         self.assertEqual(infer_provider_for_model("GPT-4o"), "openai")
+        self.assertEqual(
+            infer_provider_for_model("azure-foundry/gpt-5.3-codex"),
+            "openai",
+        )
 
     def test_o_series_is_openai(self) -> None:
         self.assertEqual(infer_provider_for_model("o1-mini"), "openai")
@@ -190,6 +209,10 @@ def test_cerebras_qwen3_not_ollama(self) -> None:
         """qwen-3 models go to Cerebras, not Ollama."""
         self.assertEqual(infer_provider_for_model("qwen-3-235b-a22b-instruct-2507"), "cerebras")
 
+    def test_zai_models(self) -> None:
+        self.assertEqual(infer_provider_for_model("glm-5"), "zai")
+        self.assertEqual(infer_provider_for_model("GLM-4.5"), "zai")
+
     def test_unknown_returns_none(self) -> None:
         self.assertIsNone(infer_provider_for_model("my-custom-model"))
         self.assertIsNone(infer_provider_for_model("some-random-model"))
@@ -200,6 +223,7 @@ def test_matching_provider_passes(self) -> None:
         _validate_model_provider("gpt-5.2", "openai")
         _validate_model_provider("claude-opus-4-6", "anthropic")
         _validate_model_provider("anthropic/claude-sonnet-4-5", "openrouter")
+        _validate_model_provider("glm-5", "zai")
 
     def test_mismatch_raises(self) -> None:
         with self.assertRaises(ModelError):
diff --git a/tests/test_streaming.py b/tests/test_streaming.py
index ac031f85..293f6e5d 100644
--- a/tests/test_streaming.py
+++ b/tests/test_streaming.py
@@ -8,7 +8,9 @@
 from unittest.mock import MagicMock, patch
 
 from agent.model import (
+    HTTPModelError,
     ModelError,
+    RateLimitError,
     _accumulate_anthropic_stream,
     _accumulate_openai_stream,
     _http_stream_sse,
@@ -77,6 +79,15 @@ def test_anthropic_error_event_raises(self) -> None:
             _read_sse_events(resp)
         self.assertIn("Overloaded", str(ctx.exception))
 
+    def test_openai_style_rate_limit_error_event_raises(self) -> None:
+        resp = self._make_resp([
+            'data: {"error":{"code":"1302","message":"Rate limit reached for requests"}}',
+            '',
+        ])
+        with self.assertRaises(RateLimitError) as ctx:
+            _read_sse_events(resp)
+        self.assertIn("Rate limit", str(ctx.exception))
+
     def test_done_terminates_early(self) -> None:
         resp = self._make_resp([
             'data: {"choices":[{"delta":{"content":"a"}}]}',
@@ -270,6 +281,77 @@ def fake_urlopen(req, timeout=None):
         # Should only be called once — no retries on HTTP errors
         self.assertEqual(call_count, 1)
 
+    def test_http_429_raises_rate_limit_error(self) -> None:
+        call_count = 0
+
+        def fake_urlopen(req, timeout=None):
+            nonlocal call_count
+            call_count += 1
+            import urllib.error
+            raise urllib.error.HTTPError(
+                url="http://test",
+                code=429,
+                msg="Too Many Requests",
+                hdrs={"Retry-After": "2"},
+                fp=io.BytesIO(b'{"error":{"message":"Too many requests","code":"rate_limit_exceeded"}}'),
+            )
+
+        with patch("agent.model.urllib.request.urlopen", fake_urlopen):
+            with self.assertRaises(RateLimitError) as ctx:
+                _http_stream_sse(
+                    url="http://test/v1/chat/completions",
+                    method="POST",
+                    headers={},
+                    payload={"model": "test"},
+                    max_retries=3,
+                )
+            self.assertEqual(ctx.exception.status_code, 429)
+        self.assertEqual(call_count, 1)
+
+    def test_http_400_with_code_1302_raises_rate_limit_error(self) -> None:
+        def fake_urlopen(req, timeout=None):
+            import urllib.error
+            raise urllib.error.HTTPError(
+                url="http://test",
+                code=400,
+                msg="Bad Request",
+                hdrs={},
+                fp=io.BytesIO(b'{"error":{"message":"Rate limit reached for requests","code":"1302"}}'),
+            )
+
+        with patch("agent.model.urllib.request.urlopen", fake_urlopen):
+            with self.assertRaises(RateLimitError) as ctx:
+                _http_stream_sse(
+                    url="http://test/v1/chat/completions",
+                    method="POST",
+                    headers={},
+                    payload={"model": "test"},
+                    max_retries=3,
+                )
+            self.assertEqual(ctx.exception.provider_code, "1302")
+
+    def test_http_400_non_rate_limit_raises_http_model_error(self) -> None:
+        def fake_urlopen(req, timeout=None):
+            import urllib.error
+            raise urllib.error.HTTPError(
+                url="http://test",
+                code=400,
+                msg="Bad Request",
+                hdrs={},
+                fp=io.BytesIO(b'{"error":{"message":"bad request","code":"invalid_request"}}'),
+            )
+
+        with patch("agent.model.urllib.request.urlopen", fake_urlopen):
+            with self.assertRaises(HTTPModelError) as ctx:
+                _http_stream_sse(
+                    url="http://test/v1/chat/completions",
+                    method="POST",
+                    headers={},
+                    payload={"model": "test"},
+                    max_retries=3,
+                )
+            self.assertEqual(ctx.exception.status_code, 400)
+
 
 if __name__ == "__main__":
     unittest.main()
diff --git a/tests/test_tools.py b/tests/test_tools.py
index 844722e0..a5590a56 100644
--- a/tests/test_tools.py
+++ b/tests/test_tools.py
@@ -77,6 +77,7 @@ def test_web_search_with_mocked_exa_response(self) -> None:
             with patch.object(WorkspaceTools, "_exa_request", return_value=mocked):
                 raw = tools.web_search("test query", num_results=3, include_text=True)
             parsed = json.loads(raw)
+            self.assertEqual(parsed["provider"], "exa")
             self.assertEqual(parsed["query"], "test query")
             self.assertEqual(parsed["total"], 1)
             self.assertEqual(parsed["results"][0]["url"], "https://example.com")
@@ -98,6 +99,57 @@ def test_fetch_url_with_mocked_exa_response(self) -> None:
             with patch.object(WorkspaceTools, "_exa_request", return_value=mocked):
                 raw = tools.fetch_url(["https://example.com"])
             parsed = json.loads(raw)
+            self.assertEqual(parsed["provider"], "exa")
+            self.assertEqual(parsed["total"], 1)
+            self.assertEqual(parsed["pages"][0]["url"], "https://example.com")
+            self.assertEqual(parsed["pages"][0]["text"], "Page body")
+
+    def test_web_search_with_mocked_firecrawl_response(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            tools = WorkspaceTools(
+                root=root,
+                web_search_provider="firecrawl",
+                firecrawl_api_key="fc-key",
+            )
+            mocked = {
+                "data": [
+                    {
+                        "url": "https://example.com",
+                        "title": "Example",
+                        "description": "Snippet",
+                        "markdown": "Long text body",
+                    }
+                ]
+            }
+            with patch.object(WorkspaceTools, "_firecrawl_request", return_value=mocked):
+                raw = tools.web_search("test query", num_results=3, include_text=True)
+            parsed = json.loads(raw)
+            self.assertEqual(parsed["provider"], "firecrawl")
+            self.assertEqual(parsed["query"], "test query")
+            self.assertEqual(parsed["total"], 1)
+            self.assertEqual(parsed["results"][0]["url"], "https://example.com")
+            self.assertIn("text", parsed["results"][0])
+
+    def test_fetch_url_with_mocked_firecrawl_response(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            tools = WorkspaceTools(
+                root=root,
+                web_search_provider="firecrawl",
+                firecrawl_api_key="fc-key",
+            )
+            mocked = {
+                "data": {
+                    "url": "https://example.com",
+                    "metadata": {"title": "Example"},
+                    "markdown": "Page body",
+                }
+            }
+            with patch.object(WorkspaceTools, "_firecrawl_request", return_value=mocked):
+                raw = tools.fetch_url(["https://example.com"])
+            parsed = json.loads(raw)
+            self.assertEqual(parsed["provider"], "firecrawl")
             self.assertEqual(parsed["total"], 1)
             self.assertEqual(parsed["pages"][0]["url"], "https://example.com")
             self.assertEqual(parsed["pages"][0]["text"], "Page body")
@@ -109,6 +161,13 @@ def test_web_search_without_exa_key(self) -> None:
             out = tools.web_search("test")
             self.assertIn("EXA_API_KEY not configured", out)
 
+    def test_web_search_without_firecrawl_key(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            tools = WorkspaceTools(root=root, web_search_provider="firecrawl", firecrawl_api_key=None)
+            out = tools.web_search("test")
+            self.assertIn("FIRECRAWL_API_KEY not configured", out)
+
     def test_repo_map_python_symbols(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)
diff --git a/tests/test_tools_complex.py b/tests/test_tools_complex.py
index bfd85ddf..edb258a5 100644
--- a/tests/test_tools_complex.py
+++ b/tests/test_tools_complex.py
@@ -126,6 +126,20 @@ def test_web_search_clamps_num_results(self) -> None:
                 payload = mock_exa.call_args[0][1]
                 self.assertEqual(payload["numResults"], 20)
 
+    def test_web_search_clamps_num_results_firecrawl(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            tools = WorkspaceTools(
+                root=Path(tmpdir), web_search_provider="firecrawl", firecrawl_api_key="test-key"
+            )
+            mock_response = {"data": []}
+            with patch.object(
+                WorkspaceTools, "_firecrawl_request", return_value=mock_response
+            ) as mock_fc:
+                tools.web_search("test query", num_results=50)
+                mock_fc.assert_called_once()
+                payload = mock_fc.call_args[0][1]
+                self.assertEqual(payload["limit"], 20)
+
     # 12
     def test_fetch_url_non_list_returns_error(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
@@ -164,6 +178,13 @@ def test_exa_request_no_key_raises(self) -> None:
                 tools._exa_request("/search", {"query": "test"})
             self.assertIn("EXA_API_KEY not configured", str(ctx.exception))
 
+    def test_firecrawl_request_no_key_raises(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            tools = WorkspaceTools(root=Path(tmpdir), firecrawl_api_key=None)
+            with self.assertRaises(ToolError) as ctx:
+                tools._firecrawl_request("/search", {"query": "test"})
+            self.assertIn("FIRECRAWL_API_KEY not configured", str(ctx.exception))
+
     # 16
     def test_write_file_creates_nested_dirs(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:

From 8b85e770ec03f8f90a9ab0158f6716661ad6a1fb Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Wed, 11 Mar 2026 16:15:22 -0400
Subject: [PATCH 02/58] chore: add codex fork sync workflow

---
 .github/prompts/codex-fork-sync.prompt.md |  30 +++++
 .github/workflows/codex-fork-sync.yml     | 139 ++++++++++++++++++++++
 2 files changed, 169 insertions(+)
 create mode 100644 .github/prompts/codex-fork-sync.prompt.md
 create mode 100644 .github/workflows/codex-fork-sync.yml

diff --git a/.github/prompts/codex-fork-sync.prompt.md b/.github/prompts/codex-fork-sync.prompt.md
new file mode 100644
index 00000000..105e84d6
--- /dev/null
+++ b/.github/prompts/codex-fork-sync.prompt.md
@@ -0,0 +1,30 @@
+You are running inside GitHub Actions for the fork of the `OpenPlanter` repository.
+
+Your job is to sync the fork with upstream and rebase active fork branches on top of the latest upstream main branch.
+
+Repository layout:
+- `origin` is the fork: `ThomsenDrake/OpenPlanter`
+- `upstream` is the source repo: `ShinMegamiBoson/OpenPlanter`
+
+Constraints:
+- Operate only on refs that have already been fetched locally.
+- Do not run network commands.
+- Do not edit product code, docs, or workflow files.
+- Do not add untracked files.
+- Only manipulate git branches and commits.
+- Leave the repository on the local `main` branch with a clean working tree and no staged changes.
+
+Required outcome:
+1. If `origin/main` already matches `upstream/main`, make no changes and say so.
+2. Otherwise, move local `main` to exactly `upstream/main`.
+3. For every fork branch that exists as `origin/chore/*`:
+   - Create or refresh a matching local `chore/*` branch from the remote branch.
+   - Determine whether it has commits not already contained in `upstream/main`.
+   - If it has unique commits, rebase those commits onto `upstream/main`.
+   - If it is already fully contained in `upstream/main`, leave it alone.
+4. If any rebase hits conflicts, stop immediately and report the branch name plus the conflicting files.
+
+Guidance:
+- Because this is a clean CI checkout, it is acceptable to force local branch pointers when needed.
+- Favor deterministic git commands over exploratory edits.
+- Keep a short summary of what you changed, including branch names and resulting commit SHAs.
diff --git a/.github/workflows/codex-fork-sync.yml b/.github/workflows/codex-fork-sync.yml
new file mode 100644
index 00000000..a9e1f602
--- /dev/null
+++ b/.github/workflows/codex-fork-sync.yml
@@ -0,0 +1,139 @@
+name: Codex Fork Sync
+
+on:
+  schedule:
+    - cron: "17 * * * *"
+  workflow_dispatch:
+    inputs:
+      force:
+        description: Run even if upstream/main has not moved
+        required: false
+        default: false
+        type: boolean
+
+permissions:
+  contents: write
+
+concurrency:
+  group: codex-fork-sync
+  cancel-in-progress: false
+
+jobs:
+  sync:
+    runs-on: ubuntu-latest
+
+    steps:
+      - name: Check out fork
+        uses: actions/checkout@v5
+        with:
+          fetch-depth: 0
+          ref: main
+
+      - name: Ensure Codex secret exists
+        if: ${{ secrets.OPENAI_API_KEY == '' }}
+        run: |
+          echo "Set the OPENAI_API_KEY repository secret to enable Codex fork sync." >> "$GITHUB_STEP_SUMMARY"
+          echo "Missing OPENAI_API_KEY secret." >&2
+          exit 1
+
+      - name: Prepare git state
+        id: prepare
+        run: |
+          set -euo pipefail
+
+          git remote add upstream https://github.com/ShinMegamiBoson/OpenPlanter.git 2>/dev/null || \
+            git remote set-url upstream https://github.com/ShinMegamiBoson/OpenPlanter.git
+
+          git fetch --prune --no-tags origin '+refs/heads/*:refs/remotes/origin/*'
+          git fetch --prune --no-tags upstream '+refs/heads/*:refs/remotes/upstream/*'
+
+          git config user.name "github-actions[bot]"
+          git config user.email "41898282+github-actions[bot]@users.noreply.github.com"
+
+          upstream_sha="$(git rev-parse upstream/main)"
+          fork_sha="$(git rev-parse origin/main)"
+          changed=false
+
+          if [ "$upstream_sha" != "$fork_sha" ]; then
+            changed=true
+          fi
+
+          if [ "${{ github.event_name }}" = "workflow_dispatch" ] && [ "${{ inputs.force }}" = "true" ]; then
+            changed=true
+          fi
+
+          echo "upstream_sha=$upstream_sha" >> "$GITHUB_OUTPUT"
+          echo "fork_sha=$fork_sha" >> "$GITHUB_OUTPUT"
+          echo "changed=$changed" >> "$GITHUB_OUTPUT"
+
+      - name: Report no-op
+        if: steps.prepare.outputs.changed != 'true'
+        run: |
+          {
+            echo "### Codex Fork Sync"
+            echo
+            echo "No sync needed."
+            echo
+            echo "- upstream/main: \`${{ steps.prepare.outputs.upstream_sha }}\`"
+            echo "- fork/main: \`${{ steps.prepare.outputs.fork_sha }}\`"
+          } >> "$GITHUB_STEP_SUMMARY"
+
+      - name: Run Codex in GitHub Actions
+        if: steps.prepare.outputs.changed == 'true'
+        id: codex
+        uses: openai/codex-action@v1
+        with:
+          openai-api-key: ${{ secrets.OPENAI_API_KEY }}
+          prompt-file: .github/prompts/codex-fork-sync.prompt.md
+          output-file: .codex-fork-sync-summary.md
+          working-directory: .
+          sandbox: danger-full-access
+          safety-strategy: drop-sudo
+          allow-bots: true
+
+      - name: Require clean worktree after Codex
+        if: steps.prepare.outputs.changed == 'true' && success()
+        run: |
+          set -euo pipefail
+          git diff --quiet
+          git diff --cached --quiet
+
+      - name: Push synced branches
+        if: steps.prepare.outputs.changed == 'true' && success()
+        run: |
+          set -euo pipefail
+
+          git push origin main:main
+
+          while IFS= read -r branch; do
+            remote_ref="refs/remotes/origin/${branch}"
+            if ! git show-ref --verify --quiet "$remote_ref"; then
+              continue
+            fi
+
+            local_sha="$(git rev-parse "$branch")"
+            remote_sha="$(git rev-parse "origin/${branch}")"
+
+            if [ "$local_sha" != "$remote_sha" ]; then
+              git push --force-with-lease origin "${branch}:${branch}"
+            fi
+          done < <(git for-each-ref --format='%(refname:short)' refs/heads/chore/)
+
+      - name: Publish Codex summary
+        if: steps.prepare.outputs.changed == 'true' && always()
+        run: |
+          {
+            echo "### Codex Fork Sync"
+            echo
+            echo "- upstream/main before sync: \`${{ steps.prepare.outputs.upstream_sha }}\`"
+            echo "- fork/main before sync: \`${{ steps.prepare.outputs.fork_sha }}\`"
+            echo
+          } >> "$GITHUB_STEP_SUMMARY"
+
+          if [ -f .codex-fork-sync-summary.md ]; then
+            cat .codex-fork-sync-summary.md >> "$GITHUB_STEP_SUMMARY"
+          elif [ "${{ steps.codex.outcome }}" = "success" ]; then
+            echo "Codex completed without a written summary." >> "$GITHUB_STEP_SUMMARY"
+          else
+            echo "Codex did not complete successfully." >> "$GITHUB_STEP_SUMMARY"
+          fi

From ec2fe8d73d454f0bf253f317b88bd3a8b2f6849a Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Thu, 12 Mar 2026 10:17:25 -0400
Subject: [PATCH 03/58] chore: checkpoint current docs and code changes

---
 .../crates/op-core/src/builder.rs             |  32 +-
 .../crates/op-core/src/config.rs              |  12 +-
 .../crates/op-core/src/engine/curator.rs      |  19 +-
 .../crates/op-core/src/engine/mod.rs          | 237 +++++++++--
 .../crates/op-core/src/tools/defs.rs          |   6 +-
 .../crates/op-core/src/tools/mod.rs           | 171 +++++++-
 .../crates/op-tauri/src/bridge.rs             | 195 ++++++++-
 .../crates/op-tauri/src/commands/agent.rs     |  12 +
 .../crates/op-tauri/src/commands/config.rs    |  10 +-
 .../crates/op-tauri/src/commands/session.rs   |   3 +-
 .../crates/op-tauri/src/main.rs               |   5 +-
 .../crates/op-tauri/src/state.rs              | 387 +++++++++++++++++-
 .../frontend/e2e/streaming.spec.ts            |  52 +++
 .../frontend/src/styles/main.css              |  29 +-
 uv.lock                                       | 204 +++++++++
 15 files changed, 1286 insertions(+), 88 deletions(-)
 create mode 100644 uv.lock

diff --git a/openplanter-desktop/crates/op-core/src/builder.rs b/openplanter-desktop/crates/op-core/src/builder.rs
index 1be274c7..786e4c10 100644
--- a/openplanter-desktop/crates/op-core/src/builder.rs
+++ b/openplanter-desktop/crates/op-core/src/builder.rs
@@ -151,14 +151,17 @@ pub fn resolve_endpoint(cfg: &AgentConfig, provider: &str) -> Result<(String, St
     match provider {
         "anthropic" => {
             let key = resolve_anthropic_api_key(
-                cfg.anthropic_api_key.clone().or_else(|| cfg.api_key.clone()),
+                cfg.anthropic_api_key
+                    .clone()
+                    .or_else(|| cfg.api_key.clone()),
                 &cfg.anthropic_base_url,
             )
             .ok_or_else(|| {
-                    ModelError::Message(
-                        "No Anthropic API key. Set ANTHROPIC_API_KEY or OPENPLANTER_ANTHROPIC_API_KEY.".into(),
-                    )
-                })?;
+                ModelError::Message(
+                    "No Anthropic API key. Set ANTHROPIC_API_KEY or OPENPLANTER_ANTHROPIC_API_KEY."
+                        .into(),
+                )
+            })?;
             // Anthropic base URL does NOT include /v1 suffix for /messages endpoint —
             // the model adapter appends /messages itself. The config stores it with /v1.
             Ok((cfg.anthropic_base_url.clone(), key))
@@ -169,11 +172,10 @@ pub fn resolve_endpoint(cfg: &AgentConfig, provider: &str) -> Result<(String, St
                 &cfg.openai_base_url,
             )
             .ok_or_else(|| {
-                    ModelError::Message(
-                        "No OpenAI API key. Set OPENAI_API_KEY or OPENPLANTER_OPENAI_API_KEY."
-                            .into(),
-                    )
-                })?;
+                ModelError::Message(
+                    "No OpenAI API key. Set OPENAI_API_KEY or OPENPLANTER_OPENAI_API_KEY.".into(),
+                )
+            })?;
             Ok((cfg.openai_base_url.clone(), key))
         }
         "openrouter" => {
@@ -384,7 +386,10 @@ mod tests {
             provider: "openai".into(),
             ..Default::default()
         };
-        assert_eq!(resolve_model_name(&cfg).unwrap(), "azure-foundry/gpt-5.3-codex");
+        assert_eq!(
+            resolve_model_name(&cfg).unwrap(),
+            "azure-foundry/gpt-5.3-codex"
+        );
     }
 
     #[test]
@@ -394,7 +399,10 @@ mod tests {
             provider: "openai".into(),
             ..Default::default()
         };
-        assert_eq!(resolve_model_name(&cfg).unwrap(), "azure-foundry/gpt-5.3-codex");
+        assert_eq!(
+            resolve_model_name(&cfg).unwrap(),
+            "azure-foundry/gpt-5.3-codex"
+        );
     }
 
     // ── resolve_provider ──
diff --git a/openplanter-desktop/crates/op-core/src/config.rs b/openplanter-desktop/crates/op-core/src/config.rs
index 06ff4c86..b25abbe0 100644
--- a/openplanter-desktop/crates/op-core/src/config.rs
+++ b/openplanter-desktop/crates/op-core/src/config.rs
@@ -7,14 +7,11 @@ use serde::{Deserialize, Serialize};
 
 pub const AZURE_FOUNDRY_MODEL_PREFIX: &str = "azure-foundry/";
 pub const ANTHROPIC_FOUNDRY_MODEL_PREFIX: &str = "anthropic-foundry/";
-pub const FOUNDRY_OPENAI_BASE_URL: &str =
-    "https://foundry-proxy.cheetah-koi.ts.net/openai/v1";
+pub const FOUNDRY_OPENAI_BASE_URL: &str = "https://foundry-proxy.cheetah-koi.ts.net/openai/v1";
 pub const FOUNDRY_ANTHROPIC_BASE_URL: &str =
     "https://foundry-proxy.cheetah-koi.ts.net/anthropic/v1";
-pub const FOUNDRY_OPENAI_API_KEY_PLACEHOLDER: &str =
-    "dont-worry-this-key-will-be-auto-injected";
-pub const FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER: &str =
-    "dont-worry-it-will-be-injected";
+pub const FOUNDRY_OPENAI_API_KEY_PLACEHOLDER: &str = "dont-worry-this-key-will-be-auto-injected";
+pub const FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER: &str = "dont-worry-it-will-be-injected";
 pub const ZAI_PAYGO_BASE_URL: &str = "https://api.z.ai/api/paas/v4";
 pub const ZAI_CODING_BASE_URL: &str = "https://api.z.ai/api/coding/paas/v4";
 
@@ -294,7 +291,8 @@ impl AgentConfig {
         let openai_base_url = env_opt("OPENPLANTER_OPENAI_BASE_URL")
             .or_else(|| env_opt("OPENPLANTER_BASE_URL"))
             .unwrap_or_else(|| FOUNDRY_OPENAI_BASE_URL.into());
-        let anthropic_base_url = env_or("OPENPLANTER_ANTHROPIC_BASE_URL", FOUNDRY_ANTHROPIC_BASE_URL);
+        let anthropic_base_url =
+            env_or("OPENPLANTER_ANTHROPIC_BASE_URL", FOUNDRY_ANTHROPIC_BASE_URL);
         let openai_api_key = resolve_openai_api_key(openai_api_key, &openai_base_url);
         let anthropic_api_key = resolve_anthropic_api_key(anthropic_api_key, &anthropic_base_url);
 
diff --git a/openplanter-desktop/crates/op-core/src/engine/curator.rs b/openplanter-desktop/crates/op-core/src/engine/curator.rs
index 7d50a61b..ea683acd 100644
--- a/openplanter-desktop/crates/op-core/src/engine/curator.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/curator.rs
@@ -31,8 +31,9 @@ Your ONLY job is to update the wiki at .openplanter/wiki/ based on the main agen
 6. Use EXACT source names in Cross-Reference sections to power the knowledge graph
 7. If nothing in the step context is wiki-relevant, respond with ONLY: "No wiki updates needed"
 8. Keep entries factual and concise — document what was found, not speculation
-9. Never modify files outside .openplanter/wiki/
-10. Maximum 8 tool calls — be efficient
+9. Never modify files outside .openplanter/wiki/ — this is enforced at runtime
+10. Only use write_file or edit_file for mutations
+11. Maximum 8 tool calls — be efficient
 
 == WIKI ENTRY TEMPLATE ==
 When creating a new entry, use this format:
@@ -126,8 +127,6 @@ pub const CURATOR_TOOL_NAMES: &[&str] = &[
     "read_file",
     "write_file",
     "edit_file",
-    "apply_patch",
-    "hashline_edit",
     "think",
 ];
 
@@ -152,7 +151,7 @@ pub async fn run_curator(
 
     let provider = model.provider_name().to_string();
     let tool_defs = build_curator_tool_defs(&provider);
-    let mut tools = WorkspaceTools::new(config);
+    let mut tools = WorkspaceTools::new_curator(config);
 
     let mut messages = vec![
         Message::System {
@@ -227,11 +226,7 @@ pub async fn run_curator(
             let result = tools.execute(&tc.name, &tc.arguments).await;
 
             // Track file modifications
-            if matches!(
-                tc.name.as_str(),
-                "write_file" | "edit_file" | "apply_patch" | "hashline_edit"
-            ) && !result.is_error
-            {
+            if matches!(tc.name.as_str(), "write_file" | "edit_file") && !result.is_error {
                 files_changed += 1;
                 // Extract path for summary
                 if let Ok(args) = serde_json::from_str::<serde_json::Value>(&tc.arguments) {
@@ -365,7 +360,9 @@ mod tests {
                     "run_shell",
                     "run_shell_bg",
                     "check_shell_bg",
-                    "kill_shell_bg"
+                    "kill_shell_bg",
+                    "apply_patch",
+                    "hashline_edit"
                 ]
                 .contains(name),
                 "Curator should not have access to {name}"
diff --git a/openplanter-desktop/crates/op-core/src/engine/mod.rs b/openplanter-desktop/crates/op-core/src/engine/mod.rs
index f19e38b1..0df7fe9d 100644
--- a/openplanter-desktop/crates/op-core/src/engine/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/mod.rs
@@ -30,10 +30,50 @@ enum CuratorOutcome {
     Error(String),
 }
 
-/// Abort all in-flight curator tasks.
-fn abort_curators(handles: &mut Vec<JoinHandle<()>>) {
-    for h in handles.drain(..) {
-        h.abort();
+fn spawn_curator_task(
+    context: String,
+    tx: mpsc::UnboundedSender<CuratorOutcome>,
+    config: AgentConfig,
+    cancel: CancellationToken,
+) -> JoinHandle<()> {
+    tokio::spawn(async move {
+        let outcome = match run_curator(&context, &config, cancel).await {
+            Ok(result) => CuratorOutcome::Done(result),
+            Err(err) => CuratorOutcome::Error(err),
+        };
+        let _ = tx.send(outcome);
+    })
+}
+
+fn schedule_curator_context(
+    has_running_curator: bool,
+    queued_context: &mut Option<String>,
+    context: String,
+) -> Option<String> {
+    if has_running_curator {
+        *queued_context = Some(context);
+        None
+    } else {
+        Some(context)
+    }
+}
+
+fn take_queued_context_if_idle(
+    has_running_curator: bool,
+    queued_context: &mut Option<String>,
+) -> Option<String> {
+    if has_running_curator {
+        None
+    } else {
+        queued_context.take()
+    }
+}
+
+/// Abort any active curator and clear pending work.
+fn abort_curators(running: &mut Option<JoinHandle<()>>, queued_context: &mut Option<String>) {
+    queued_context.take();
+    if let Some(handle) = running.take() {
+        handle.abort();
     }
 }
 
@@ -67,34 +107,97 @@ fn drain_curator_results(
 
 /// Wait for in-flight curators (up to timeout), drain final results, abort rest.
 async fn finish_curators(
-    handles: &mut Vec<JoinHandle<()>>,
+    running: &mut Option<JoinHandle<()>>,
+    queued_context: &mut Option<String>,
+    tx: &mpsc::UnboundedSender<CuratorOutcome>,
+    config: &AgentConfig,
+    cancel: &CancellationToken,
     rx: &mut mpsc::UnboundedReceiver<CuratorOutcome>,
     messages: &mut Vec<Message>,
     emitter: &dyn SolveEmitter,
 ) {
-    if handles.is_empty() {
+    if running.is_none() && queued_context.is_none() {
         return;
     }
     emitter.emit_trace(&format!(
-        "[curator] waiting for {} in-flight curator(s)...",
-        handles.len()
+        "[curator] waiting for {} pending curator task(s)...",
+        usize::from(running.is_some()) + usize::from(queued_context.is_some())
     ));
 
     // Wait up to 30 seconds total for all curators to finish
     let deadline = tokio::time::Instant::now() + std::time::Duration::from_secs(30);
-    for h in handles.iter_mut() {
-        let remaining = deadline - tokio::time::Instant::now();
+    loop {
+        if running.is_none() {
+            if let Some(context) = take_queued_context_if_idle(false, queued_context) {
+                emitter.emit_trace("[curator] spawning queued update");
+                *running = Some(spawn_curator_task(
+                    context,
+                    tx.clone(),
+                    config.clone(),
+                    cancel.clone(),
+                ));
+            } else {
+                break;
+            }
+        }
+
+        let remaining = deadline.saturating_duration_since(tokio::time::Instant::now());
         if remaining.is_zero() {
             break;
         }
-        let _ = tokio::time::timeout(remaining, h).await;
+
+        if let Some(mut handle) = running.take() {
+            match tokio::time::timeout(remaining, &mut handle).await {
+                Ok(_) => {
+                    drain_curator_results(rx, messages, emitter);
+                }
+                Err(_) => {
+                    *running = Some(handle);
+                    break;
+                }
+            }
+        }
     }
 
     // Final drain
     drain_curator_results(rx, messages, emitter);
 
     // Abort any still running
-    abort_curators(handles);
+    abort_curators(running, queued_context);
+}
+
+async fn poll_curator_state(
+    running: &mut Option<JoinHandle<()>>,
+    queued_context: &mut Option<String>,
+    tx: &mpsc::UnboundedSender<CuratorOutcome>,
+    config: &AgentConfig,
+    cancel: &CancellationToken,
+    rx: &mut mpsc::UnboundedReceiver<CuratorOutcome>,
+    messages: &mut Vec<Message>,
+    emitter: &dyn SolveEmitter,
+) {
+    drain_curator_results(rx, messages, emitter);
+
+    let should_join = running
+        .as_ref()
+        .map(|handle| handle.is_finished())
+        .unwrap_or(false);
+    if should_join {
+        if let Some(mut handle) = running.take() {
+            let _ = (&mut handle).await;
+        }
+        drain_curator_results(rx, messages, emitter);
+    }
+
+    if let Some(context) = take_queued_context_if_idle(running.is_some(), queued_context) {
+        emitter.emit_trace("[curator] spawning queued update");
+        *running = Some(spawn_curator_task(
+            context,
+            tx.clone(),
+            config.clone(),
+            cancel.clone(),
+        ));
+    }
 }
 
 // Abstraction for emitting solve events.
@@ -195,6 +298,11 @@ fn estimate_tokens(messages: &[Message]) -> usize {
         / 4
 }
 
+fn safe_prefix(text: &str, max_chars: usize) -> &str {
+    let end = text.floor_char_boundary(text.len().min(max_chars));
+    &text[..end]
+}
+
 /// Compact conversation context when it grows too large.
 ///
 /// Keeps the system prompt, user objective, and the most recent messages
@@ -212,7 +320,7 @@ fn compact_messages(messages: &mut Vec<Message>, max_tokens: usize) {
     for i in 2..protected_tail {
         if let Message::Tool { content, .. } = &mut messages[i] {
             if content.len() > 200 {
-                let preview = &content[..content.len().min(150)];
+                let preview = safe_prefix(content, 150);
                 *content = format!("{preview}\n...[truncated — older tool result]");
             }
         }
@@ -336,19 +444,29 @@ pub async fn solve(
 
     // 3. Background curator channel
     let (curator_tx, mut curator_rx) = mpsc::unbounded_channel::<CuratorOutcome>();
-    let mut curator_handles: Vec<JoinHandle<()>> = Vec::new();
+    let mut running_curator: Option<JoinHandle<()>> = None;
+    let mut queued_curator_context: Option<String> = None;
 
     // 4. Agentic loop
     for step in 1..=max_steps {
         if cancel.is_cancelled() {
             emitter.emit_error("Cancelled");
             tools.cleanup();
-            abort_curators(&mut curator_handles);
+            abort_curators(&mut running_curator, &mut queued_curator_context);
             return;
         }
 
-        // Drain completed curator results and inject as system messages
-        drain_curator_results(&mut curator_rx, &mut messages, emitter);
+        poll_curator_state(
+            &mut running_curator,
+            &mut queued_curator_context,
+            &curator_tx,
+            config,
+            &cancel,
+            &mut curator_rx,
+            &mut messages,
+            emitter,
+        )
+        .await;
 
         let step_start = std::time::Instant::now();
 
@@ -372,7 +490,7 @@ pub async fn solve(
             Err(e) => {
                 let msg = e.to_string();
                 tools.cleanup();
-                abort_curators(&mut curator_handles);
+                abort_curators(&mut running_curator, &mut queued_curator_context);
                 if msg == "Cancelled" {
                     emitter.emit_error("Cancelled");
                 } else {
@@ -411,7 +529,11 @@ pub async fn solve(
             tools.cleanup();
             // Wait for in-flight curators before exiting
             finish_curators(
-                &mut curator_handles,
+                &mut running_curator,
+                &mut queued_curator_context,
+                &curator_tx,
+                config,
+                &cancel,
                 &mut curator_rx,
                 &mut messages,
                 emitter,
@@ -425,7 +547,7 @@ pub async fn solve(
             if cancel.is_cancelled() {
                 emitter.emit_error("Cancelled");
                 tools.cleanup();
-                abort_curators(&mut curator_handles);
+                abort_curators(&mut running_curator, &mut queued_curator_context);
                 return;
             }
 
@@ -436,7 +558,7 @@ pub async fn solve(
                 emitter.emit_trace(&format!(
                     "Tool {} error: {}",
                     tc.name,
-                    &result.content[..result.content.len().min(200)]
+                    safe_prefix(&result.content, 200)
                 ));
             }
 
@@ -464,17 +586,21 @@ pub async fn solve(
         // Spawn background curator after each non-final step
         let context = extract_step_context(&messages);
         if !context.is_empty() {
-            let tx = curator_tx.clone();
-            let curator_cfg = config.clone();
-            let curator_cancel = cancel.clone();
-            emitter.emit_trace(&format!("[curator] spawning for step {step}"));
-            curator_handles.push(tokio::spawn(async move {
-                let outcome = match run_curator(&context, &curator_cfg, curator_cancel).await {
-                    Ok(result) => CuratorOutcome::Done(result),
-                    Err(e) => CuratorOutcome::Error(e),
-                };
-                let _ = tx.send(outcome);
-            }));
+            if let Some(context_to_spawn) = schedule_curator_context(
+                running_curator.is_some(),
+                &mut queued_curator_context,
+                context,
+            ) {
+                emitter.emit_trace(&format!("[curator] spawning for step {step}"));
+                running_curator = Some(spawn_curator_task(
+                    context_to_spawn,
+                    curator_tx.clone(),
+                    config.clone(),
+                    cancel.clone(),
+                ));
+            } else {
+                emitter.emit_trace(&format!("[curator] queued latest refresh from step {step}"));
+            }
         }
 
         // Budget warnings
@@ -493,7 +619,11 @@ pub async fn solve(
     // Budget exhausted
     tools.cleanup();
     finish_curators(
-        &mut curator_handles,
+        &mut running_curator,
+        &mut queued_curator_context,
+        &curator_tx,
+        config,
+        &cancel,
         &mut curator_rx,
         &mut messages,
         emitter,
@@ -759,6 +889,47 @@ mod tests {
         assert!(complete_text.contains("Spawned test"));
     }
 
+    #[test]
+    fn test_schedule_curator_context_spawns_when_idle() {
+        let mut queued = None;
+        let spawn = schedule_curator_context(false, &mut queued, "ctx-1".to_string());
+        assert_eq!(spawn, Some("ctx-1".to_string()));
+        assert!(queued.is_none());
+    }
+
+    #[test]
+    fn test_schedule_curator_context_keeps_latest_when_busy() {
+        let mut queued = Some("older".to_string());
+        let spawn = schedule_curator_context(true, &mut queued, "newer".to_string());
+        assert!(spawn.is_none());
+        assert_eq!(queued, Some("newer".to_string()));
+    }
+
+    #[test]
+    fn test_take_queued_context_if_idle_only_releases_when_idle() {
+        let mut queued = Some("latest".to_string());
+        assert_eq!(take_queued_context_if_idle(true, &mut queued), None);
+        assert_eq!(queued, Some("latest".to_string()));
+        assert_eq!(
+            take_queued_context_if_idle(false, &mut queued),
+            Some("latest".to_string())
+        );
+        assert!(queued.is_none());
+    }
+
+    #[tokio::test]
+    async fn test_abort_curators_clears_running_and_queue() {
+        let mut running = Some(tokio::spawn(async {
+            tokio::time::sleep(std::time::Duration::from_secs(30)).await;
+        }));
+        let mut queued = Some("queued".to_string());
+
+        abort_curators(&mut running, &mut queued);
+
+        assert!(running.is_none());
+        assert!(queued.is_none());
+    }
+
     #[test]
     fn test_estimate_tokens() {
         let messages = vec![
diff --git a/openplanter-desktop/crates/op-core/src/tools/defs.rs b/openplanter-desktop/crates/op-core/src/tools/defs.rs
index e0fe40cf..a29ceabe 100644
--- a/openplanter-desktop/crates/op-core/src/tools/defs.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/defs.rs
@@ -541,7 +541,7 @@ mod tests {
     #[test]
     fn test_curator_tool_defs_openai() {
         let tools = build_curator_tool_defs("openai");
-        assert_eq!(tools.len(), 8, "curator should have exactly 8 tools");
+        assert_eq!(tools.len(), 6, "curator should have exactly 6 tools");
 
         let names: Vec<String> = tools
             .iter()
@@ -555,6 +555,8 @@ mod tests {
         assert!(names.contains(&"list_files".to_string()));
         assert!(names.contains(&"search_files".to_string()));
         assert!(names.contains(&"think".to_string()));
+        assert!(!names.contains(&"apply_patch".to_string()));
+        assert!(!names.contains(&"hashline_edit".to_string()));
 
         // Should NOT include web, shell, or bg job tools
         assert!(!names.contains(&"web_search".to_string()));
@@ -568,7 +570,7 @@ mod tests {
     #[test]
     fn test_curator_tool_defs_anthropic() {
         let tools = build_curator_tool_defs("anthropic");
-        assert_eq!(tools.len(), 8);
+        assert_eq!(tools.len(), 6);
 
         // Anthropic format: flat with input_schema
         assert!(tools[0].get("input_schema").is_some());
diff --git a/openplanter-desktop/crates/op-core/src/tools/mod.rs b/openplanter-desktop/crates/op-core/src/tools/mod.rs
index a5e4589b..a44fc2e5 100644
--- a/openplanter-desktop/crates/op-core/src/tools/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/mod.rs
@@ -36,9 +36,16 @@ impl ToolResult {
     }
 }
 
+#[derive(Debug, Clone)]
+enum ToolScope {
+    FullWorkspace,
+    CuratorWikiOnly { allowed_root: PathBuf },
+}
+
 /// Central dispatcher for workspace tools.
 pub struct WorkspaceTools {
     root: PathBuf,
+    scope: ToolScope,
     shell_path: String,
     command_timeout_sec: u64,
     max_shell_output_chars: usize,
@@ -55,10 +62,20 @@ pub struct WorkspaceTools {
     bg_jobs: shell::BgJobs,
 }
 
+fn clip(text: &str, max_chars: usize) -> String {
+    if text.len() <= max_chars {
+        return text.to_string();
+    }
+    let end = text.floor_char_boundary(max_chars);
+    let omitted = text.len() - end;
+    format!("{}\n\n...[truncated {omitted} chars]...", &text[..end])
+}
+
 impl WorkspaceTools {
     pub fn new(config: &AgentConfig) -> Self {
         Self {
             root: config.workspace.clone(),
+            scope: ToolScope::FullWorkspace,
             shell_path: config.shell.clone(),
             command_timeout_sec: config.command_timeout_sec as u64,
             max_shell_output_chars: config.max_shell_output_chars as usize,
@@ -76,6 +93,49 @@ impl WorkspaceTools {
         }
     }
 
+    pub fn new_curator(config: &AgentConfig) -> Self {
+        let allowed_root = filesystem::resolve_path(
+            &config.workspace,
+            &format!("{}/wiki", config.session_root_dir),
+        )
+        .unwrap_or_else(|_| config.workspace.join(&config.session_root_dir).join("wiki"));
+        Self {
+            root: config.workspace.clone(),
+            scope: ToolScope::CuratorWikiOnly { allowed_root },
+            shell_path: config.shell.clone(),
+            command_timeout_sec: config.command_timeout_sec as u64,
+            max_shell_output_chars: config.max_shell_output_chars as usize,
+            max_file_chars: config.max_file_chars as usize,
+            max_files_listed: config.max_files_listed as usize,
+            max_search_hits: config.max_search_hits as usize,
+            max_observation_chars: config.max_observation_chars as usize,
+            web_search_provider: normalize_web_search_provider(Some(&config.web_search_provider)),
+            exa_api_key: config.exa_api_key.clone(),
+            exa_base_url: config.exa_base_url.clone(),
+            firecrawl_api_key: config.firecrawl_api_key.clone(),
+            firecrawl_base_url: config.firecrawl_base_url.clone(),
+            files_read: HashSet::new(),
+            bg_jobs: shell::BgJobs::new(),
+        }
+    }
+
+    fn enforce_write_scope(&self, raw_path: &str) -> Result<(), ToolResult> {
+        match &self.scope {
+            ToolScope::FullWorkspace => Ok(()),
+            ToolScope::CuratorWikiOnly { allowed_root } => {
+                let resolved =
+                    filesystem::resolve_path(&self.root, raw_path).map_err(ToolResult::error)?;
+                if resolved == *allowed_root || resolved.starts_with(allowed_root) {
+                    Ok(())
+                } else {
+                    Err(ToolResult::error(
+                        "Curator writes are restricted to .openplanter/wiki/**".to_string(),
+                    ))
+                }
+            }
+        }
+    }
+
     /// Execute a tool by name with JSON arguments string.
     /// Returns the tool result, clipped to max_observation_chars.
     pub async fn execute(&mut self, name: &str, args_json: &str) -> ToolResult {
@@ -101,12 +161,18 @@ impl WorkspaceTools {
             "write_file" => {
                 let path = args.get("path").and_then(|v| v.as_str()).unwrap_or("");
                 let content = args.get("content").and_then(|v| v.as_str()).unwrap_or("");
+                if let Err(result) = self.enforce_write_scope(path) {
+                    return result;
+                }
                 filesystem::write_file(&self.root, path, content, &mut self.files_read)
             }
             "edit_file" => {
                 let path = args.get("path").and_then(|v| v.as_str()).unwrap_or("");
                 let old_text = args.get("old_text").and_then(|v| v.as_str()).unwrap_or("");
                 let new_text = args.get("new_text").and_then(|v| v.as_str()).unwrap_or("");
+                if let Err(result) = self.enforce_write_scope(path) {
+                    return result;
+                }
                 filesystem::edit_file(&self.root, path, old_text, new_text, &mut self.files_read)
             }
             "list_files" => {
@@ -232,12 +298,8 @@ impl WorkspaceTools {
 
         // Clip observation to max_observation_chars
         if result.content.len() > self.max_observation_chars {
-            let omitted = result.content.len() - self.max_observation_chars;
             ToolResult {
-                content: format!(
-                    "{}\n\n...[truncated {omitted} chars]...",
-                    &result.content[..self.max_observation_chars]
-                ),
+                content: clip(&result.content, self.max_observation_chars),
                 is_error: result.is_error,
             }
         } else {
@@ -250,3 +312,102 @@ impl WorkspaceTools {
         self.bg_jobs.cleanup();
     }
 }
+
+#[cfg(test)]
+mod tests {
+    use super::*;
+    use tempfile::tempdir;
+
+    fn test_config(root: &std::path::Path) -> AgentConfig {
+        AgentConfig::from_env(root)
+    }
+
+    #[tokio::test]
+    async fn test_curator_scope_allows_wiki_writes() {
+        let tmp = tempdir().unwrap();
+        let cfg = test_config(tmp.path());
+        let mut tools = WorkspaceTools::new_curator(&cfg);
+
+        let result = tools
+            .execute(
+                "write_file",
+                r#"{"path":".openplanter/wiki/source.md","content":"hello"}"#,
+            )
+            .await;
+
+        assert!(!result.is_error, "unexpected error: {}", result.content);
+        assert_eq!(
+            std::fs::read_to_string(tmp.path().join(".openplanter/wiki/source.md")).unwrap(),
+            "hello"
+        );
+    }
+
+    #[tokio::test]
+    async fn test_curator_scope_rejects_non_wiki_writes() {
+        let tmp = tempdir().unwrap();
+        let cfg = test_config(tmp.path());
+        let mut tools = WorkspaceTools::new_curator(&cfg);
+
+        let result = tools
+            .execute("write_file", r#"{"path":"notes.md","content":"nope"}"#)
+            .await;
+
+        assert!(result.is_error);
+        assert!(result.content.contains(".openplanter/wiki"));
+        assert!(!tmp.path().join("notes.md").exists());
+    }
+
+    #[tokio::test]
+    async fn test_curator_scope_rejects_traversal() {
+        let tmp = tempdir().unwrap();
+        let cfg = test_config(tmp.path());
+        let mut tools = WorkspaceTools::new_curator(&cfg);
+
+        let result = tools
+            .execute(
+                "write_file",
+                r#"{"path":".openplanter/wiki/../../escape.md","content":"nope"}"#,
+            )
+            .await;
+
+        assert!(result.is_error);
+        assert!(!tmp.path().join("escape.md").exists());
+    }
+
+    #[tokio::test]
+    async fn test_full_workspace_scope_unchanged() {
+        let tmp = tempdir().unwrap();
+        let cfg = test_config(tmp.path());
+        let mut tools = WorkspaceTools::new(&cfg);
+
+        let result = tools
+            .execute("write_file", r#"{"path":"notes.md","content":"allowed"}"#)
+            .await;
+
+        assert!(!result.is_error, "unexpected error: {}", result.content);
+        assert_eq!(
+            std::fs::read_to_string(tmp.path().join("notes.md")).unwrap(),
+            "allowed"
+        );
+    }
+
+    #[tokio::test]
+    async fn test_execute_clips_observations_on_char_boundary() {
+        let tmp = tempdir().unwrap();
+        let mut cfg = test_config(tmp.path());
+        cfg.max_observation_chars = 6000;
+        let mut tools = WorkspaceTools::new(&cfg);
+
+        let mut content = "a".repeat(5999);
+        content.push('─');
+        std::fs::write(tmp.path().join("unicode.txt"), content).unwrap();
+
+        let result = tools
+            .execute("read_file", r#"{"path":"unicode.txt","hashline":false}"#)
+            .await;
+
+        assert!(!result.is_error, "unexpected error: {}", result.content);
+        assert!(result.content.contains("[truncated"));
+        assert!(std::str::from_utf8(result.content.as_bytes()).is_ok());
+    }
+}
diff --git a/openplanter-desktop/crates/op-tauri/src/bridge.rs b/openplanter-desktop/crates/op-tauri/src/bridge.rs
index bc8aa326..e522dbdc 100644
--- a/openplanter-desktop/crates/op-tauri/src/bridge.rs
+++ b/openplanter-desktop/crates/op-tauri/src/bridge.rs
@@ -15,6 +15,47 @@ use op_core::events::{
 };
 use op_core::session::replay::{ReplayEntry, ReplayLogger, StepToolCallEntry};
 
+const MAX_STEP_MODEL_PREVIEW_CHARS: usize = 4 * 1024;
+const MAX_TOOL_ARGS_CAPTURE_CHARS: usize = 16 * 1024;
+const MAX_DELTA_LOG_CHARS: usize = 120;
+
+fn preview_text(text: &str, max_chars: usize) -> String {
+    if text.len() <= max_chars {
+        return text.to_string();
+    }
+
+    let end = text.floor_char_boundary(max_chars);
+    format!("{}...[truncated {} chars]", &text[..end], text.len() - end)
+}
+
+fn append_with_cap(buffer: &mut String, text: &str, max_chars: usize, truncated: &mut bool) {
+    if *truncated {
+        return;
+    }
+    if buffer.len() >= max_chars {
+        *truncated = true;
+        return;
+    }
+
+    let remaining = max_chars - buffer.len();
+    let end = text.floor_char_boundary(text.len().min(remaining));
+    buffer.push_str(&text[..end]);
+    if end < text.len() {
+        *truncated = true;
+    }
+}
+
+fn format_model_preview(buffer: &str, truncated: bool) -> Option<String> {
+    let trimmed = buffer.trim();
+    if trimmed.is_empty() {
+        None
+    } else if truncated {
+        Some(format!("{trimmed}\n...[truncated]"))
+    } else {
+        Some(trimmed.to_string())
+    }
+}
+
 pub struct TauriEmitter {
     handle: AppHandle,
 }
@@ -37,10 +78,24 @@ impl SolveEmitter for TauriEmitter {
     }
 
     fn emit_delta(&self, event: DeltaEvent) {
-        eprintln!(
-            "[bridge] delta: kind={:?} text={:?}",
-            event.kind, event.text
-        );
+        match event.kind {
+            DeltaKind::ToolCallArgs => eprintln!(
+                "[bridge] delta: kind={:?} len={} preview={:?}",
+                event.kind,
+                event.text.len(),
+                preview_text(&event.text, MAX_DELTA_LOG_CHARS)
+            ),
+            _ if event.text.len() > MAX_DELTA_LOG_CHARS => eprintln!(
+                "[bridge] delta: kind={:?} len={} preview={:?}",
+                event.kind,
+                event.text.len(),
+                preview_text(&event.text, MAX_DELTA_LOG_CHARS)
+            ),
+            _ => eprintln!(
+                "[bridge] delta: kind={:?} text={:?}",
+                event.kind, event.text
+            ),
+        }
         let _ = self.handle.emit("agent:delta", event);
     }
 
@@ -93,12 +148,16 @@ pub struct LoggingEmitter<E: SolveEmitter> {
     replay: Arc<tokio::sync::Mutex<ReplayLogger>>,
     /// Accumulated streaming text for the current step (std::sync for non-async ops).
     streaming_buf: Mutex<String>,
+    /// Whether the current step preview was truncated.
+    streaming_truncated: Mutex<bool>,
     /// Tool calls accumulated during the current step.
     step_tool_calls: Mutex<Vec<PendingToolCall>>,
     /// Name of the tool currently being generated.
     current_tool: Mutex<String>,
     /// Accumulated args JSON for the current tool.
     current_args_buf: Mutex<String>,
+    /// Whether the current tool args buffer was truncated.
+    current_args_truncated: Mutex<bool>,
 }
 
 /// A tool call being accumulated during streaming.
@@ -130,9 +189,11 @@ impl<E: SolveEmitter> LoggingEmitter<E> {
             inner,
             replay: Arc::new(tokio::sync::Mutex::new(replay)),
             streaming_buf: Mutex::new(String::new()),
+            streaming_truncated: Mutex::new(false),
             step_tool_calls: Mutex::new(Vec::new()),
             current_tool: Mutex::new(String::new()),
             current_args_buf: Mutex::new(String::new()),
+            current_args_truncated: Mutex::new(false),
         }
     }
 }
@@ -146,12 +207,19 @@ impl<E: SolveEmitter> SolveEmitter for LoggingEmitter<E> {
         // Accumulate streaming data for step summary logging (sync — no I/O)
         match event.kind {
             DeltaKind::Text => {
-                self.streaming_buf.lock().unwrap().push_str(&event.text);
+                let mut truncated = self.streaming_truncated.lock().unwrap();
+                append_with_cap(
+                    &mut self.streaming_buf.lock().unwrap(),
+                    &event.text,
+                    MAX_STEP_MODEL_PREVIEW_CHARS,
+                    &mut truncated,
+                );
             }
             DeltaKind::ToolCallStart => {
                 let tool_name = event.text.clone();
                 *self.current_tool.lock().unwrap() = tool_name.clone();
                 *self.current_args_buf.lock().unwrap() = String::new();
+                *self.current_args_truncated.lock().unwrap() = false;
                 self.step_tool_calls.lock().unwrap().push(PendingToolCall {
                     name: tool_name,
                     key_arg: String::new(),
@@ -160,7 +228,13 @@ impl<E: SolveEmitter> SolveEmitter for LoggingEmitter<E> {
             }
             DeltaKind::ToolCallArgs => {
                 let mut buf = self.current_args_buf.lock().unwrap();
-                buf.push_str(&event.text);
+                let mut truncated = self.current_args_truncated.lock().unwrap();
+                append_with_cap(
+                    &mut buf,
+                    &event.text,
+                    MAX_TOOL_ARGS_CAPTURE_CHARS,
+                    &mut truncated,
+                );
                 let tool_name = self.current_tool.lock().unwrap().clone();
                 if let Some(key_arg) = extract_key_arg(&tool_name, &buf) {
                     let mut calls = self.step_tool_calls.lock().unwrap();
@@ -179,12 +253,7 @@ impl<E: SolveEmitter> SolveEmitter for LoggingEmitter<E> {
         // Collect accumulated data (sync)
         let model_preview = {
             let buf = self.streaming_buf.lock().unwrap();
-            let trimmed = buf.trim().to_string();
-            if trimmed.is_empty() {
-                None
-            } else {
-                Some(trimmed)
-            }
+            format_model_preview(&buf, *self.streaming_truncated.lock().unwrap())
         };
 
         let step_tools: Vec<StepToolCallEntry> = {
@@ -230,7 +299,11 @@ impl<E: SolveEmitter> SolveEmitter for LoggingEmitter<E> {
 
         // Reset buffers for next step
         self.streaming_buf.lock().unwrap().clear();
+        *self.streaming_truncated.lock().unwrap() = false;
         self.step_tool_calls.lock().unwrap().clear();
+        self.current_tool.lock().unwrap().clear();
+        self.current_args_buf.lock().unwrap().clear();
+        *self.current_args_truncated.lock().unwrap() = false;
 
         self.inner.emit_step(event);
     }
@@ -418,4 +491,102 @@ mod tests {
             assert_eq!(entry.seq, (i + 1) as u64);
         }
     }
+
+    #[derive(Default)]
+    struct CapturingEmitter {
+        deltas: Arc<Mutex<Vec<DeltaEvent>>>,
+    }
+
+    impl SolveEmitter for CapturingEmitter {
+        fn emit_trace(&self, _: &str) {}
+        fn emit_delta(&self, event: DeltaEvent) {
+            self.deltas.lock().unwrap().push(event);
+        }
+        fn emit_step(&self, _: StepEvent) {}
+        fn emit_complete(&self, _: &str) {}
+        fn emit_error(&self, _: &str) {}
+    }
+
+    #[tokio::test(flavor = "multi_thread")]
+    async fn test_logging_emitter_caps_model_preview_and_preserves_deltas() {
+        let tmp = tempdir().unwrap();
+        let replay = ReplayLogger::new(tmp.path());
+        let inner = CapturingEmitter::default();
+        let deltas = inner.deltas.clone();
+        let emitter = LoggingEmitter::new(inner, replay);
+        let big_text = "x".repeat(MAX_STEP_MODEL_PREVIEW_CHARS + 256);
+
+        emitter.emit_delta(DeltaEvent {
+            kind: DeltaKind::Text,
+            text: big_text.clone(),
+        });
+        emitter.emit_step(StepEvent {
+            depth: 0,
+            step: 1,
+            tool_name: None,
+            tokens: Default::default(),
+            elapsed_ms: 1,
+            is_final: false,
+        });
+
+        let entries = ReplayLogger::read_all(tmp.path()).await.unwrap();
+        let step = entries
+            .iter()
+            .find(|entry| entry.role == "step-summary")
+            .unwrap();
+        let preview = step.step_model_preview.as_ref().unwrap();
+        assert!(preview.contains("[truncated]"));
+        assert!(preview.len() < big_text.len());
+
+        let captured = deltas.lock().unwrap();
+        assert_eq!(captured.len(), 1);
+        assert_eq!(captured[0].text, big_text);
+    }
+
+    #[tokio::test(flavor = "multi_thread")]
+    async fn test_logging_emitter_caps_tool_args_buffer_and_keeps_key_arg() {
+        let tmp = tempdir().unwrap();
+        let replay = ReplayLogger::new(tmp.path());
+        let inner = CapturingEmitter::default();
+        let deltas = inner.deltas.clone();
+        let emitter = LoggingEmitter::new(inner, replay);
+        let filler = "x".repeat(MAX_TOOL_ARGS_CAPTURE_CHARS + 512);
+
+        emitter.emit_delta(DeltaEvent {
+            kind: DeltaKind::ToolCallStart,
+            text: "read_file".to_string(),
+        });
+        emitter.emit_delta(DeltaEvent {
+            kind: DeltaKind::ToolCallArgs,
+            text: "{\"path\":\"foo.md\",\"other\":\"".to_string(),
+        });
+        emitter.emit_delta(DeltaEvent {
+            kind: DeltaKind::ToolCallArgs,
+            text: filler.clone(),
+        });
+
+        assert!(emitter.current_args_buf.lock().unwrap().len() <= MAX_TOOL_ARGS_CAPTURE_CHARS);
+        assert!(*emitter.current_args_truncated.lock().unwrap());
+
+        emitter.emit_step(StepEvent {
+            depth: 0,
+            step: 1,
+            tool_name: Some("read_file".into()),
+            tokens: Default::default(),
+            elapsed_ms: 1,
+            is_final: false,
+        });
+
+        let entries = ReplayLogger::read_all(tmp.path()).await.unwrap();
+        let step = entries
+            .iter()
+            .find(|entry| entry.role == "step-summary")
+            .unwrap();
+        let tool_calls = step.step_tool_calls.as_ref().unwrap();
+        assert_eq!(tool_calls[0].key_arg, "foo.md");
+
+        let captured = deltas.lock().unwrap();
+        assert_eq!(captured.len(), 3);
+        assert_eq!(captured[2].text, filler);
+    }
 }
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
index fc40649b..201ab9df 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
@@ -4,6 +4,7 @@ use tokio_util::sync::CancellationToken;
 use crate::bridge::{LoggingEmitter, TauriEmitter};
 use crate::commands::session::sessions_dir;
 use crate::state::AppState;
+use op_core::engine::SolveEmitter;
 use op_core::session::replay::{ReplayEntry, ReplayLogger};
 
 /// Start solving an objective. Result streamed via events.
@@ -55,6 +56,17 @@ pub async fn solve(
     }
 
     let emitter = LoggingEmitter::new(TauriEmitter::new(app), replay);
+    let cwd = std::env::current_dir()
+        .map(|dir| dir.display().to_string())
+        .unwrap_or_else(|_| "<unavailable>".to_string());
+    emitter.emit_trace(&format!(
+        "[solve] pid={} cwd={} workspace={} session={}",
+        std::process::id(),
+        cwd,
+        cfg.workspace.display(),
+        session_id
+    ));
+    emitter.emit_trace(&format!("[startup:info] {}", state.startup_trace()));
 
     tokio::spawn(async move {
         let result = tokio::spawn(async move {
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/config.rs b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
index 7bfecbc6..cf3f0edb 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/config.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
@@ -105,12 +105,18 @@ fn known_models_for_provider(provider: &str) -> Vec<ModelInfo> {
             ("azure-foundry/Kimi-K2.5", "Kimi K2.5 (Foundry)"),
         ],
         "anthropic" => vec![
-            ("anthropic-foundry/claude-opus-4-6", "Claude Opus 4.6 (Foundry)"),
+            (
+                "anthropic-foundry/claude-opus-4-6",
+                "Claude Opus 4.6 (Foundry)",
+            ),
             (
                 "anthropic-foundry/claude-sonnet-4-6",
                 "Claude Sonnet 4.6 (Foundry)",
             ),
-            ("anthropic-foundry/claude-haiku-4-5", "Claude Haiku 4.5 (Foundry)"),
+            (
+                "anthropic-foundry/claude-haiku-4-5",
+                "Claude Haiku 4.5 (Foundry)",
+            ),
         ],
         "openrouter" => vec![
             ("anthropic/claude-sonnet-4-5", "Claude Sonnet 4.5 (OR)"),
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/session.rs b/openplanter-desktop/crates/op-tauri/src/commands/session.rs
index 5cc8348c..d504afbc 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/session.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/session.rs
@@ -170,7 +170,8 @@ pub async fn update_session_metadata(
         .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
     info.turn_count += 1;
     info.last_objective = Some(if objective.len() > 100 {
-        format!("{}...", &objective[..97])
+        let end = objective.floor_char_boundary(97);
+        format!("{}...", &objective[..end])
     } else {
         objective.to_string()
     });
diff --git a/openplanter-desktop/crates/op-tauri/src/main.rs b/openplanter-desktop/crates/op-tauri/src/main.rs
index 20088713..edf948cf 100644
--- a/openplanter-desktop/crates/op-tauri/src/main.rs
+++ b/openplanter-desktop/crates/op-tauri/src/main.rs
@@ -8,9 +8,12 @@ mod state;
 use state::AppState;
 
 fn main() {
+    let state = AppState::new();
+    eprintln!("[startup:info] {}", state.startup_trace());
+
     tauri::Builder::default()
         .plugin(tauri_plugin_shell::init())
-        .manage(AppState::new())
+        .manage(state)
         .invoke_handler(tauri::generate_handler![
             commands::agent::solve,
             commands::agent::cancel,
diff --git a/openplanter-desktop/crates/op-tauri/src/state.rs b/openplanter-desktop/crates/op-tauri/src/state.rs
index 3109c5c0..6c9fc8ff 100644
--- a/openplanter-desktop/crates/op-tauri/src/state.rs
+++ b/openplanter-desktop/crates/op-tauri/src/state.rs
@@ -6,10 +6,36 @@ use op_core::credentials::{
 };
 use op_core::settings::{PersistentSettings, SettingsStore};
 use std::env;
+use std::fs;
+use std::path::{Path, PathBuf};
 use std::sync::Arc;
 use tokio::sync::Mutex;
 use tokio_util::sync::CancellationToken;
 
+const WORKSPACE_ENV_KEY: &str = "OPENPLANTER_WORKSPACE";
+
+#[derive(Debug, Clone, PartialEq, Eq)]
+enum WorkspaceSource {
+    EnvOverride,
+    GitRoot,
+    CurrentDir,
+}
+
+#[derive(Debug, Clone, PartialEq, Eq)]
+struct ResolvedWorkspace {
+    path: PathBuf,
+    source: WorkspaceSource,
+    invalid_override: Option<String>,
+}
+
+#[derive(Debug, Clone, Default, PartialEq, Eq)]
+struct LegacyMigrationReport {
+    source: Option<PathBuf>,
+    copied_files: u64,
+    skipped_existing: u64,
+    errors: Vec<String>,
+}
+
 /// Merge credentials into an AgentConfig.
 /// Priority: existing config value > env_creds > file_creds.
 pub fn merge_credentials_into_config(
@@ -87,16 +113,232 @@ fn apply_settings_to_config(cfg: &mut AgentConfig, settings: &PersistentSettings
     }
 }
 
+fn canonicalize_or_self(path: &Path) -> PathBuf {
+    path.canonicalize().unwrap_or_else(|_| path.to_path_buf())
+}
+
+fn find_git_root(start: &Path) -> Option<PathBuf> {
+    let mut current = Some(canonicalize_or_self(start));
+    while let Some(dir) = current {
+        if dir.join(".git").exists() {
+            return Some(dir);
+        }
+        current = dir.parent().map(|parent| parent.to_path_buf());
+    }
+    None
+}
+
+fn resolve_startup_workspace_from(
+    current_dir: &Path,
+    env_override: Option<&str>,
+) -> ResolvedWorkspace {
+    let mut invalid_override = None;
+
+    if let Some(raw_override) = env_override
+        .map(str::trim)
+        .filter(|value| !value.is_empty())
+    {
+        let candidate = PathBuf::from(raw_override);
+        if candidate.exists() {
+            return ResolvedWorkspace {
+                path: canonicalize_or_self(&candidate),
+                source: WorkspaceSource::EnvOverride,
+                invalid_override: None,
+            };
+        }
+        invalid_override = Some(raw_override.to_string());
+    }
+
+    if let Some(git_root) = find_git_root(current_dir) {
+        return ResolvedWorkspace {
+            path: git_root,
+            source: WorkspaceSource::GitRoot,
+            invalid_override,
+        };
+    }
+
+    ResolvedWorkspace {
+        path: canonicalize_or_self(current_dir),
+        source: WorkspaceSource::CurrentDir,
+        invalid_override,
+    }
+}
+
+fn resolve_desktop_workspace() -> ResolvedWorkspace {
+    let current_dir = env::current_dir().unwrap_or_else(|_| PathBuf::from("."));
+    let env_override = env::var(WORKSPACE_ENV_KEY).ok();
+    resolve_startup_workspace_from(&current_dir, env_override.as_deref())
+}
+
+fn legacy_state_candidates(workspace: &Path, session_root_dir: &str) -> Vec<PathBuf> {
+    vec![
+        workspace
+            .join("openplanter-desktop")
+            .join("crates")
+            .join("op-tauri")
+            .join(session_root_dir),
+        workspace
+            .join("crates")
+            .join("op-tauri")
+            .join(session_root_dir),
+    ]
+}
+
+fn copy_missing_file(src: &Path, dst: &Path, report: &mut LegacyMigrationReport) {
+    if !src.exists() || !src.is_file() {
+        return;
+    }
+
+    if dst.exists() {
+        report.skipped_existing += 1;
+        return;
+    }
+
+    if let Some(parent) = dst.parent() {
+        if let Err(err) = fs::create_dir_all(parent) {
+            report
+                .errors
+                .push(format!("failed to create {}: {err}", parent.display()));
+            return;
+        }
+    }
+
+    match fs::copy(src, dst) {
+        Ok(_) => report.copied_files += 1,
+        Err(err) => report.errors.push(format!(
+            "failed to copy {} -> {}: {err}",
+            src.display(),
+            dst.display()
+        )),
+    }
+}
+
+fn copy_missing_tree(src: &Path, dst: &Path, report: &mut LegacyMigrationReport) {
+    if !src.exists() {
+        return;
+    }
+    if src.is_file() {
+        copy_missing_file(src, dst, report);
+        return;
+    }
+    if !src.is_dir() {
+        return;
+    }
+
+    if let Err(err) = fs::create_dir_all(dst) {
+        report
+            .errors
+            .push(format!("failed to create {}: {err}", dst.display()));
+        return;
+    }
+
+    let entries = match fs::read_dir(src) {
+        Ok(entries) => entries,
+        Err(err) => {
+            report
+                .errors
+                .push(format!("failed to read {}: {err}", src.display()));
+            return;
+        }
+    };
+
+    for entry in entries {
+        let entry = match entry {
+            Ok(entry) => entry,
+            Err(err) => {
+                report.errors.push(format!(
+                    "failed to read entry under {}: {err}",
+                    src.display()
+                ));
+                continue;
+            }
+        };
+        let src_path = entry.path();
+        let dst_path = dst.join(entry.file_name());
+        if src_path.is_dir() {
+            copy_missing_tree(&src_path, &dst_path, report);
+        } else {
+            copy_missing_file(&src_path, &dst_path, report);
+        }
+    }
+}
+
+fn migrate_legacy_desktop_state(workspace: &Path, session_root_dir: &str) -> LegacyMigrationReport {
+    let mut report = LegacyMigrationReport::default();
+    let destination_root = workspace.join(session_root_dir);
+
+    for candidate in legacy_state_candidates(workspace, session_root_dir) {
+        if !candidate.exists() {
+            continue;
+        }
+
+        report.source = Some(candidate.clone());
+        copy_missing_file(
+            &candidate.join("settings.json"),
+            &destination_root.join("settings.json"),
+            &mut report,
+        );
+        copy_missing_file(
+            &candidate.join("credentials.json"),
+            &destination_root.join("credentials.json"),
+            &mut report,
+        );
+        copy_missing_tree(
+            &candidate.join("sessions"),
+            &destination_root.join("sessions"),
+            &mut report,
+        );
+        break;
+    }
+
+    report
+}
+
+fn format_startup_trace(
+    current_dir: &Path,
+    resolved: &ResolvedWorkspace,
+    migration: &LegacyMigrationReport,
+) -> String {
+    let source = match resolved.source {
+        WorkspaceSource::EnvOverride => "env_override",
+        WorkspaceSource::GitRoot => "git_root",
+        WorkspaceSource::CurrentDir => "current_dir",
+    };
+    let invalid_override = resolved.invalid_override.as_deref().unwrap_or("<none>");
+    let migration_source = migration
+        .source
+        .as_ref()
+        .map(|path| path.display().to_string())
+        .unwrap_or_else(|| "<none>".to_string());
+
+    format!(
+        "pid={} cwd={} workspace={} source={} invalid_override={} migration_source={} migration_copied={} migration_skipped={} migration_errors={}",
+        std::process::id(),
+        current_dir.display(),
+        resolved.path.display(),
+        source,
+        invalid_override,
+        migration_source,
+        migration.copied_files,
+        migration.skipped_existing,
+        migration.errors.len()
+    )
+}
+
 /// Application state shared across Tauri commands.
 pub struct AppState {
     pub config: Arc<Mutex<AgentConfig>>,
     pub session_id: Arc<Mutex<Option<String>>>,
     pub cancel_token: Arc<Mutex<CancellationToken>>,
+    startup_trace: String,
 }
 
 impl AppState {
     pub fn new() -> Self {
-        let mut cfg = AgentConfig::from_env(".");
+        let current_dir = env::current_dir().unwrap_or_else(|_| PathBuf::from("."));
+        let resolved_workspace = resolve_desktop_workspace();
+        let mut cfg = AgentConfig::from_env(&resolved_workspace.path);
+        let migration = migrate_legacy_desktop_state(&cfg.workspace, &cfg.session_root_dir);
 
         // Load .env files and merge credentials into config
         let env_creds = credentials_from_env();
@@ -119,14 +361,20 @@ impl AppState {
             config: Arc::new(Mutex::new(cfg)),
             session_id: Arc::new(Mutex::new(None)),
             cancel_token: Arc::new(Mutex::new(CancellationToken::new())),
+            startup_trace: format_startup_trace(&current_dir, &resolved_workspace, &migration),
         }
     }
+
+    pub fn startup_trace(&self) -> &str {
+        &self.startup_trace
+    }
 }
 
 #[cfg(test)]
 mod tests {
     use super::*;
     use std::env;
+    use tempfile::tempdir;
 
     fn empty_cfg() -> AgentConfig {
         let mut cfg = AgentConfig::from_env("/nonexistent");
@@ -247,4 +495,141 @@ mod tests {
             }
         }
     }
+
+    #[test]
+    fn test_resolve_startup_workspace_prefers_env_override() {
+        let temp = tempdir().unwrap();
+        let repo = temp.path().join("repo");
+        fs::create_dir_all(repo.join(".git")).unwrap();
+        let override_dir = temp.path().join("override");
+        fs::create_dir_all(&override_dir).unwrap();
+
+        let resolved = resolve_startup_workspace_from(&repo, Some(override_dir.to_str().unwrap()));
+
+        assert_eq!(resolved.source, WorkspaceSource::EnvOverride);
+        assert_eq!(resolved.path, canonicalize_or_self(&override_dir));
+        assert!(resolved.invalid_override.is_none());
+    }
+
+    #[test]
+    fn test_resolve_startup_workspace_finds_git_root_from_nested_dir() {
+        let temp = tempdir().unwrap();
+        let repo = temp.path().join("repo");
+        fs::create_dir_all(repo.join(".git")).unwrap();
+        let nested = repo
+            .join("openplanter-desktop")
+            .join("crates")
+            .join("op-tauri");
+        fs::create_dir_all(&nested).unwrap();
+
+        let resolved = resolve_startup_workspace_from(&nested, None);
+
+        assert_eq!(resolved.source, WorkspaceSource::GitRoot);
+        assert_eq!(resolved.path, canonicalize_or_self(&repo));
+    }
+
+    #[test]
+    fn test_resolve_startup_workspace_falls_back_to_current_dir() {
+        let temp = tempdir().unwrap();
+
+        let resolved =
+            resolve_startup_workspace_from(temp.path(), Some("/definitely/missing/path"));
+
+        assert_eq!(resolved.source, WorkspaceSource::CurrentDir);
+        assert_eq!(resolved.path, canonicalize_or_self(temp.path()));
+        assert_eq!(
+            resolved.invalid_override,
+            Some("/definitely/missing/path".to_string())
+        );
+    }
+
+    #[test]
+    fn test_migrate_legacy_desktop_state_copies_missing_and_preserves_existing() {
+        let temp = tempdir().unwrap();
+        let workspace = temp.path().join("repo");
+        let legacy = workspace
+            .join("openplanter-desktop")
+            .join("crates")
+            .join("op-tauri")
+            .join(".openplanter");
+        let destination = workspace.join(".openplanter");
+
+        fs::create_dir_all(legacy.join("sessions").join("session-a")).unwrap();
+        fs::write(legacy.join("settings.json"), "{\"legacy\":true}").unwrap();
+        fs::write(legacy.join("credentials.json"), "{\"key\":\"legacy\"}").unwrap();
+        fs::write(
+            legacy
+                .join("sessions")
+                .join("session-a")
+                .join("replay.jsonl"),
+            "legacy-session",
+        )
+        .unwrap();
+
+        fs::create_dir_all(&destination).unwrap();
+        fs::write(destination.join("settings.json"), "{\"keep\":true}").unwrap();
+
+        let report = migrate_legacy_desktop_state(&workspace, ".openplanter");
+
+        assert_eq!(report.source, Some(legacy));
+        assert_eq!(
+            fs::read_to_string(destination.join("settings.json")).unwrap(),
+            "{\"keep\":true}"
+        );
+        assert_eq!(
+            fs::read_to_string(destination.join("credentials.json")).unwrap(),
+            "{\"key\":\"legacy\"}"
+        );
+        assert_eq!(
+            fs::read_to_string(
+                destination
+                    .join("sessions")
+                    .join("session-a")
+                    .join("replay.jsonl")
+            )
+            .unwrap(),
+            "legacy-session"
+        );
+        assert_eq!(report.copied_files, 2);
+        assert_eq!(report.skipped_existing, 1);
+        assert!(report.errors.is_empty());
+    }
+
+    #[test]
+    fn test_startup_trace_uses_informational_migration_labels() {
+        let temp = tempdir().unwrap();
+        let workspace = temp.path().join("repo");
+        let current_dir = workspace
+            .join("openplanter-desktop")
+            .join("crates")
+            .join("op-tauri");
+        fs::create_dir_all(workspace.join(".git")).unwrap();
+        fs::create_dir_all(&current_dir).unwrap();
+
+        let resolved = resolve_startup_workspace_from(&current_dir, None);
+        let migration = LegacyMigrationReport {
+            source: Some(workspace.join("legacy-state")),
+            copied_files: 2,
+            skipped_existing: 3,
+            errors: vec!["copy failed".to_string()],
+        };
+
+        let trace = format_startup_trace(&current_dir, &resolved, &migration);
+
+        assert!(trace.contains("pid="));
+        assert!(trace.contains(&format!("cwd={}", current_dir.display())));
+        assert!(trace.contains(&format!("workspace={}", resolved.path.display())));
+        assert!(trace.contains("source=git_root"));
+        assert!(trace.contains("invalid_override=<none>"));
+        assert!(trace.contains(&format!(
+            "migration_source={}",
+            workspace.join("legacy-state").display()
+        )));
+        assert!(trace.contains("migration_copied=2"));
+        assert!(trace.contains("migration_skipped=3"));
+        assert!(trace.contains("migration_errors=1"));
+        assert!(!trace.contains(" copied="));
+        assert!(!trace.contains(" skipped="));
+        assert!(!trace.contains(" errors="));
+    }
 }
diff --git a/openplanter-desktop/frontend/e2e/streaming.spec.ts b/openplanter-desktop/frontend/e2e/streaming.spec.ts
index 9afe59a4..e328249f 100644
--- a/openplanter-desktop/frontend/e2e/streaming.spec.ts
+++ b/openplanter-desktop/frontend/e2e/streaming.spec.ts
@@ -113,6 +113,27 @@ async function sendStep(
   );
 }
 
+async function expectGraphPaneVisibleAndStable(page: Page) {
+  const graphPane = page.locator(".graph-pane");
+  await expect(graphPane).toBeVisible();
+
+  const box = await graphPane.boundingBox();
+  expect(box).not.toBeNull();
+
+  const viewport = page.viewportSize();
+  expect(viewport).not.toBeNull();
+
+  expect(box!.width).toBeGreaterThan(150);
+  expect(box!.x).toBeGreaterThanOrEqual(0);
+  expect(box!.x + box!.width).toBeLessThanOrEqual(viewport!.width + 1);
+
+  const appMetrics = await page.locator("#app").evaluate((el) => ({
+    clientWidth: el.clientWidth,
+    scrollWidth: el.scrollWidth,
+  }));
+  expect(appMetrics.scrollWidth).toBeLessThanOrEqual(appMetrics.clientWidth + 1);
+}
+
 test.describe("Streaming Display", () => {
   test.beforeEach(async ({ page }) => {
     await injectTauriMocks(page);
@@ -293,4 +314,35 @@ test.describe("Streaming Display", () => {
       path: "e2e/screenshots/35-activity-elapsed.png",
     });
   });
+
+  test("long streamed preview text does not push graph pane off-screen", async ({
+    page,
+  }) => {
+    const longPreview = `Investigating_${"CentralFlorida".repeat(120)}`;
+
+    await sendDelta(page, "thinking", longPreview);
+    await expect(page.locator(".activity-preview")).toContainText("Investigating_");
+
+    await expectGraphPaneVisibleAndStable(page);
+  });
+
+  test("long tool call rows do not push graph pane off-screen", async ({
+    page,
+  }) => {
+    const longCommand = `find_${"central_florida_workspace".repeat(80)}`;
+
+    await sendDelta(page, "tool_call_start", "run_shell");
+    await sendDelta(
+      page,
+      "tool_call_args",
+      JSON.stringify({ command: longCommand })
+    );
+    await sendStep(page, 1, 6400, 1200);
+
+    const toolLine = page.locator(".step-tool-line").first();
+    await expect(toolLine).toBeVisible();
+    await expect(toolLine).toContainText("run_shell");
+
+    await expectGraphPaneVisibleAndStable(page);
+  });
 });
diff --git a/openplanter-desktop/frontend/src/styles/main.css b/openplanter-desktop/frontend/src/styles/main.css
index 8f3fa2b6..eae58ebc 100644
--- a/openplanter-desktop/frontend/src/styles/main.css
+++ b/openplanter-desktop/frontend/src/styles/main.css
@@ -19,7 +19,7 @@ html, body {
 #app {
   display: grid;
   grid-template-rows: var(--statusbar-height) 1fr;
-  grid-template-columns: var(--sidebar-width) 3fr 2fr;
+  grid-template-columns: var(--sidebar-width) minmax(0, 3fr) minmax(0, 2fr);
   height: 100vh;
   gap: 1px;
   background: var(--border);
@@ -151,11 +151,13 @@ html, body {
   font-family: var(--font-mono);
   font-size: 13px;
   line-height: 1.5;
+  min-width: 0;
   min-height: 0;
 }
 
 .chat-messages {
   flex: 1;
+  min-width: 0;
   min-height: 0;
   overflow-y: auto;
   padding: 12px 16px;
@@ -166,9 +168,11 @@ html, body {
 
 .message {
   width: 100%;
+  min-width: 0;
   padding: 2px 0;
   white-space: pre-wrap;
   word-break: break-word;
+  overflow-wrap: anywhere;
 }
 
 .message.user {
@@ -271,6 +275,8 @@ html, body {
   border-radius: var(--radius);
   padding: 8px 12px;
   margin: 6px 0;
+  max-width: 100%;
+  min-width: 0;
   overflow-x: auto;
 }
 
@@ -332,6 +338,7 @@ html, body {
   font-size: 12px;
   color: var(--text-secondary);
   white-space: nowrap;
+  min-width: 0;
   overflow: hidden;
   text-overflow: ellipsis;
 }
@@ -339,10 +346,15 @@ html, body {
 .tool-call-block .tool-fn {
   color: var(--warning);
   font-weight: 600;
+  flex-shrink: 0;
 }
 
 .tool-call-block .tool-arg {
+  flex: 1 1 auto;
+  min-width: 0;
   color: var(--text-muted);
+  overflow: hidden;
+  text-overflow: ellipsis;
 }
 
 .tool-result-wrapper {
@@ -357,6 +369,7 @@ html, body {
   color: var(--text-muted);
   white-space: pre-wrap;
   word-break: break-word;
+  overflow-wrap: anywhere;
   max-height: 6em;
   overflow: hidden;
 }
@@ -401,6 +414,7 @@ html, body {
 .activity-indicator {
   padding: 4px 0;
   margin: 2px 0;
+  min-width: 0;
 }
 
 .activity-row {
@@ -408,6 +422,7 @@ html, body {
   align-items: center;
   gap: 8px;
   font-size: 12px;
+  min-width: 0;
 }
 
 .activity-icon {
@@ -473,6 +488,7 @@ html, body {
   padding-left: 20px;
   white-space: pre-wrap;
   word-break: break-word;
+  overflow-wrap: anywhere;
   max-height: 3.6em;
   overflow: hidden;
   line-height: 1.2;
@@ -501,6 +517,7 @@ html, body {
   padding: 2px 0;
   white-space: pre-wrap;
   word-break: break-word;
+  overflow-wrap: anywhere;
   max-height: 3em;
   overflow: hidden;
 }
@@ -512,8 +529,11 @@ html, body {
 }
 
 .step-tool-line {
+  display: flex;
+  align-items: baseline;
   color: var(--text-secondary);
   white-space: nowrap;
+  min-width: 0;
   overflow: hidden;
   text-overflow: ellipsis;
   line-height: 1.7;
@@ -522,15 +542,21 @@ html, body {
 .step-tool-line .tool-fn {
   color: var(--warning);
   font-weight: 600;
+  flex-shrink: 0;
 }
 
 .step-tool-line .tool-arg {
+  flex: 1 1 auto;
+  min-width: 0;
   color: var(--text-muted);
+  overflow: hidden;
+  text-overflow: ellipsis;
 }
 
 .step-tool-line .tool-elapsed {
   color: var(--text-muted);
   font-size: 11px;
+  flex-shrink: 0;
 }
 
 /* Graph pane */
@@ -542,6 +568,7 @@ html, body {
   overflow: hidden;
   display: flex;
   flex-direction: column;
+  min-width: 0;
 }
 
 /* Graph toolbar */
diff --git a/uv.lock b/uv.lock
new file mode 100644
index 00000000..b8aac500
--- /dev/null
+++ b/uv.lock
@@ -0,0 +1,204 @@
+version = 1
+revision = 3
+requires-python = ">=3.10"
+resolution-markers = [
+    "python_full_version >= '3.11'",
+    "python_full_version < '3.11'",
+]
+
+[[package]]
+name = "linkify-it-py"
+version = "2.1.0"
+source = { registry = "https://pypi.org/simple" }
+dependencies = [
+    { name = "uc-micro-py" },
+]
+sdist = { url = "https://files.pythonhosted.org/packages/2e/c9/06ea13676ef354f0af6169587ae292d3e2406e212876a413bf9eece4eb23/linkify_it_py-2.1.0.tar.gz", hash = "sha256:43360231720999c10e9328dc3691160e27a718e280673d444c38d7d3aaa3b98b", size = 29158, upload-time = "2026-03-01T07:48:47.683Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/b4/de/88b3be5c31b22333b3ca2f6ff1de4e863d8fe45aaea7485f591970ec1d3e/linkify_it_py-2.1.0-py3-none-any.whl", hash = "sha256:0d252c1594ecba2ecedc444053db5d3a9b7ec1b0dd929c8f1d74dce89f86c05e", size = 19878, upload-time = "2026-03-01T07:48:46.098Z" },
+]
+
+[[package]]
+name = "markdown-it-py"
+version = "4.0.0"
+source = { registry = "https://pypi.org/simple" }
+dependencies = [
+    { name = "mdurl" },
+]
+sdist = { url = "https://files.pythonhosted.org/packages/5b/f5/4ec618ed16cc4f8fb3b701563655a69816155e79e24a17b651541804721d/markdown_it_py-4.0.0.tar.gz", hash = "sha256:cb0a2b4aa34f932c007117b194e945bd74e0ec24133ceb5bac59009cda1cb9f3", size = 73070, upload-time = "2025-08-11T12:57:52.854Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/94/54/e7d793b573f298e1c9013b8c4dade17d481164aa517d1d7148619c2cedbf/markdown_it_py-4.0.0-py3-none-any.whl", hash = "sha256:87327c59b172c5011896038353a81343b6754500a08cd7a4973bb48c6d578147", size = 87321, upload-time = "2025-08-11T12:57:51.923Z" },
+]
+
+[package.optional-dependencies]
+linkify = [
+    { name = "linkify-it-py" },
+]
+
+[[package]]
+name = "mdit-py-plugins"
+version = "0.5.0"
+source = { registry = "https://pypi.org/simple" }
+dependencies = [
+    { name = "markdown-it-py" },
+]
+sdist = { url = "https://files.pythonhosted.org/packages/b2/fd/a756d36c0bfba5f6e39a1cdbdbfdd448dc02692467d83816dff4592a1ebc/mdit_py_plugins-0.5.0.tar.gz", hash = "sha256:f4918cb50119f50446560513a8e311d574ff6aaed72606ddae6d35716fe809c6", size = 44655, upload-time = "2025-08-11T07:25:49.083Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/fb/86/dd6e5db36df29e76c7a7699123569a4a18c1623ce68d826ed96c62643cae/mdit_py_plugins-0.5.0-py3-none-any.whl", hash = "sha256:07a08422fc1936a5d26d146759e9155ea466e842f5ab2f7d2266dd084c8dab1f", size = 57205, upload-time = "2025-08-11T07:25:47.597Z" },
+]
+
+[[package]]
+name = "mdurl"
+version = "0.1.2"
+source = { registry = "https://pypi.org/simple" }
+sdist = { url = "https://files.pythonhosted.org/packages/d6/54/cfe61301667036ec958cb99bd3efefba235e65cdeb9c84d24a8293ba1d90/mdurl-0.1.2.tar.gz", hash = "sha256:bb413d29f5eea38f31dd4754dd7377d4465116fb207585f97bf925588687c1ba", size = 8729, upload-time = "2022-08-14T12:40:10.846Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/b3/38/89ba8ad64ae25be8de66a6d463314cf1eb366222074cfda9ee839c56a4b4/mdurl-0.1.2-py3-none-any.whl", hash = "sha256:84008a41e51615a49fc9966191ff91509e3c40b939176e643fd50a5c2196b8f8", size = 9979, upload-time = "2022-08-14T12:40:09.779Z" },
+]
+
+[[package]]
+name = "networkx"
+version = "3.4.2"
+source = { registry = "https://pypi.org/simple" }
+resolution-markers = [
+    "python_full_version < '3.11'",
+]
+sdist = { url = "https://files.pythonhosted.org/packages/fd/1d/06475e1cd5264c0b870ea2cc6fdb3e37177c1e565c43f56ff17a10e3937f/networkx-3.4.2.tar.gz", hash = "sha256:307c3669428c5362aab27c8a1260aa8f47c4e91d3891f48be0141738d8d053e1", size = 2151368, upload-time = "2024-10-21T12:39:38.695Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/b9/54/dd730b32ea14ea797530a4479b2ed46a6fb250f682a9cfb997e968bf0261/networkx-3.4.2-py3-none-any.whl", hash = "sha256:df5d4365b724cf81b8c6a7312509d0c22386097011ad1abe274afd5e9d3bbc5f", size = 1723263, upload-time = "2024-10-21T12:39:36.247Z" },
+]
+
+[[package]]
+name = "networkx"
+version = "3.6.1"
+source = { registry = "https://pypi.org/simple" }
+resolution-markers = [
+    "python_full_version >= '3.11'",
+]
+sdist = { url = "https://files.pythonhosted.org/packages/6a/51/63fe664f3908c97be9d2e4f1158eb633317598cfa6e1fc14af5383f17512/networkx-3.6.1.tar.gz", hash = "sha256:26b7c357accc0c8cde558ad486283728b65b6a95d85ee1cd66bafab4c8168509", size = 2517025, upload-time = "2025-12-08T17:02:39.908Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/9e/c9/b2622292ea83fbb4ec318f5b9ab867d0a28ab43c5717bb85b0a5f6b3b0a4/networkx-3.6.1-py3-none-any.whl", hash = "sha256:d47fbf302e7d9cbbb9e2555a0d267983d2aa476bac30e90dfbe5669bd57f3762", size = 2068504, upload-time = "2025-12-08T17:02:38.159Z" },
+]
+
+[[package]]
+name = "openplanter-agent"
+version = "0.1.0"
+source = { editable = "." }
+dependencies = [
+    { name = "prompt-toolkit" },
+    { name = "pyfiglet" },
+    { name = "rich" },
+]
+
+[package.optional-dependencies]
+textual = [
+    { name = "networkx", version = "3.4.2", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version < '3.11'" },
+    { name = "networkx", version = "3.6.1", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version >= '3.11'" },
+    { name = "textual" },
+]
+
+[package.metadata]
+requires-dist = [
+    { name = "networkx", marker = "extra == 'textual'", specifier = ">=3.2" },
+    { name = "prompt-toolkit", specifier = ">=3.0" },
+    { name = "pyfiglet", specifier = ">=1.0" },
+    { name = "rich", specifier = ">=13.0" },
+    { name = "textual", marker = "extra == 'textual'", specifier = ">=0.89" },
+]
+provides-extras = ["textual"]
+
+[[package]]
+name = "platformdirs"
+version = "4.9.2"
+source = { registry = "https://pypi.org/simple" }
+sdist = { url = "https://files.pythonhosted.org/packages/1b/04/fea538adf7dbbd6d186f551d595961e564a3b6715bdf276b477460858672/platformdirs-4.9.2.tar.gz", hash = "sha256:9a33809944b9db043ad67ca0db94b14bf452cc6aeaac46a88ea55b26e2e9d291", size = 28394, upload-time = "2026-02-16T03:56:10.574Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/48/31/05e764397056194206169869b50cf2fee4dbbbc71b344705b9c0d878d4d8/platformdirs-4.9.2-py3-none-any.whl", hash = "sha256:9170634f126f8efdae22fb58ae8a0eaa86f38365bc57897a6c4f781d1f5875bd", size = 21168, upload-time = "2026-02-16T03:56:08.891Z" },
+]
+
+[[package]]
+name = "prompt-toolkit"
+version = "3.0.52"
+source = { registry = "https://pypi.org/simple" }
+dependencies = [
+    { name = "wcwidth" },
+]
+sdist = { url = "https://files.pythonhosted.org/packages/a1/96/06e01a7b38dce6fe1db213e061a4602dd6032a8a97ef6c1a862537732421/prompt_toolkit-3.0.52.tar.gz", hash = "sha256:28cde192929c8e7321de85de1ddbe736f1375148b02f2e17edd840042b1be855", size = 434198, upload-time = "2025-08-27T15:24:02.057Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/84/03/0d3ce49e2505ae70cf43bc5bb3033955d2fc9f932163e84dc0779cc47f48/prompt_toolkit-3.0.52-py3-none-any.whl", hash = "sha256:9aac639a3bbd33284347de5ad8d68ecc044b91a762dc39b7c21095fcd6a19955", size = 391431, upload-time = "2025-08-27T15:23:59.498Z" },
+]
+
+[[package]]
+name = "pyfiglet"
+version = "1.0.4"
+source = { registry = "https://pypi.org/simple" }
+sdist = { url = "https://files.pythonhosted.org/packages/c8/e3/0a86276ad2c383ce08d76110a8eec2fe22e7051c4b8ba3fa163a0b08c428/pyfiglet-1.0.4.tar.gz", hash = "sha256:db9c9940ed1bf3048deff534ed52ff2dafbbc2cd7610b17bb5eca1df6d4278ef", size = 1560615, upload-time = "2025-08-15T18:32:47.302Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/9f/5c/fe9f95abd5eaedfa69f31e450f7e2768bef121dbdf25bcddee2cd3087a16/pyfiglet-1.0.4-py3-none-any.whl", hash = "sha256:65b57b7a8e1dff8a67dc8e940a117238661d5e14c3e49121032bd404d9b2b39f", size = 1806118, upload-time = "2025-08-15T18:32:45.556Z" },
+]
+
+[[package]]
+name = "pygments"
+version = "2.19.2"
+source = { registry = "https://pypi.org/simple" }
+sdist = { url = "https://files.pythonhosted.org/packages/b0/77/a5b8c569bf593b0140bde72ea885a803b82086995367bf2037de0159d924/pygments-2.19.2.tar.gz", hash = "sha256:636cb2477cec7f8952536970bc533bc43743542f70392ae026374600add5b887", size = 4968631, upload-time = "2025-06-21T13:39:12.283Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/c7/21/705964c7812476f378728bdf590ca4b771ec72385c533964653c68e86bdc/pygments-2.19.2-py3-none-any.whl", hash = "sha256:86540386c03d588bb81d44bc3928634ff26449851e99741617ecb9037ee5ec0b", size = 1225217, upload-time = "2025-06-21T13:39:07.939Z" },
+]
+
+[[package]]
+name = "rich"
+version = "14.3.3"
+source = { registry = "https://pypi.org/simple" }
+dependencies = [
+    { name = "markdown-it-py" },
+    { name = "pygments" },
+]
+sdist = { url = "https://files.pythonhosted.org/packages/b3/c6/f3b320c27991c46f43ee9d856302c70dc2d0fb2dba4842ff739d5f46b393/rich-14.3.3.tar.gz", hash = "sha256:b8daa0b9e4eef54dd8cf7c86c03713f53241884e814f4e2f5fb342fe520f639b", size = 230582, upload-time = "2026-02-19T17:23:12.474Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/14/25/b208c5683343959b670dc001595f2f3737e051da617f66c31f7c4fa93abc/rich-14.3.3-py3-none-any.whl", hash = "sha256:793431c1f8619afa7d3b52b2cdec859562b950ea0d4b6b505397612db8d5362d", size = 310458, upload-time = "2026-02-19T17:23:13.732Z" },
+]
+
+[[package]]
+name = "textual"
+version = "8.0.2"
+source = { registry = "https://pypi.org/simple" }
+dependencies = [
+    { name = "markdown-it-py", extra = ["linkify"] },
+    { name = "mdit-py-plugins" },
+    { name = "platformdirs" },
+    { name = "pygments" },
+    { name = "rich" },
+    { name = "typing-extensions" },
+]
+sdist = { url = "https://files.pythonhosted.org/packages/be/08/c6bcb1e3c4c9528ec9049f4ac685afdafc72866664270f0deb416ccbba2a/textual-8.0.2.tar.gz", hash = "sha256:7b342f3ee9a5f2f1bd42d7b598cae00ff1275da68536769510db4b7fe8cabf5d", size = 6099270, upload-time = "2026-03-03T20:23:46.858Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/77/bc/0cd17f96f00b6e8bfbca64c574088c85f3c614912b3030f313752e30a099/textual-8.0.2-py3-none-any.whl", hash = "sha256:4ceadbe0e8a30eb80f9995000f4d031f711420a31b02da38f3482957b7c50ce4", size = 719174, upload-time = "2026-03-03T20:23:50.46Z" },
+]
+
+[[package]]
+name = "typing-extensions"
+version = "4.15.0"
+source = { registry = "https://pypi.org/simple" }
+sdist = { url = "https://files.pythonhosted.org/packages/72/94/1a15dd82efb362ac84269196e94cf00f187f7ed21c242792a923cdb1c61f/typing_extensions-4.15.0.tar.gz", hash = "sha256:0cea48d173cc12fa28ecabc3b837ea3cf6f38c6d1136f85cbaaf598984861466", size = 109391, upload-time = "2025-08-25T13:49:26.313Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/18/67/36e9267722cc04a6b9f15c7f3441c2363321a3ea07da7ae0c0707beb2a9c/typing_extensions-4.15.0-py3-none-any.whl", hash = "sha256:f0fa19c6845758ab08074a0cfa8b7aecb71c999ca73d62883bc25cc018c4e548", size = 44614, upload-time = "2025-08-25T13:49:24.86Z" },
+]
+
+[[package]]
+name = "uc-micro-py"
+version = "2.0.0"
+source = { registry = "https://pypi.org/simple" }
+sdist = { url = "https://files.pythonhosted.org/packages/78/67/9a363818028526e2d4579334460df777115bdec1bb77c08f9db88f6389f2/uc_micro_py-2.0.0.tar.gz", hash = "sha256:c53691e495c8db60e16ffc4861a35469b0ba0821fe409a8a7a0a71864d33a811", size = 6611, upload-time = "2026-03-01T06:31:27.526Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/61/73/d21edf5b204d1467e06500080a50f79d49ef2b997c79123a536d4a17d97c/uc_micro_py-2.0.0-py3-none-any.whl", hash = "sha256:3603a3859af53e5a39bc7677713c78ea6589ff188d70f4fee165db88e22b242c", size = 6383, upload-time = "2026-03-01T06:31:26.257Z" },
+]
+
+[[package]]
+name = "wcwidth"
+version = "0.6.0"
+source = { registry = "https://pypi.org/simple" }
+sdist = { url = "https://files.pythonhosted.org/packages/35/a2/8e3becb46433538a38726c948d3399905a4c7cabd0df578ede5dc51f0ec2/wcwidth-0.6.0.tar.gz", hash = "sha256:cdc4e4262d6ef9a1a57e018384cbeb1208d8abbc64176027e2c2455c81313159", size = 159684, upload-time = "2026-02-06T19:19:40.919Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/68/5a/199c59e0a824a3db2b89c5d2dade7ab5f9624dbf6448dc291b46d5ec94d3/wcwidth-0.6.0-py3-none-any.whl", hash = "sha256:1a3a1e510b553315f8e146c54764f4fb6264ffad731b3d78088cdb1478ffbdad", size = 94189, upload-time = "2026-02-06T19:19:39.646Z" },
+]

From 6e25209ddc47da7e9b7b31e39c6108f3aad8e16b Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Thu, 12 Mar 2026 10:53:31 -0400
Subject: [PATCH 04/58] Add Brave search option

---
 README.md                                     |   4 +-
 agent/__main__.py                             |  13 +-
 agent/builder.py                              |   2 +
 agent/config.py                               |   7 +-
 agent/credentials.py                          |  11 +
 agent/tool_defs.py                            |   2 +-
 agent/tools.py                                | 208 +++++++++-
 .../crates/op-core/src/config.rs              |  23 +-
 .../crates/op-core/src/credentials.rs         |  15 +-
 .../crates/op-core/src/tools/defs.rs          |   4 +-
 .../crates/op-core/src/tools/mod.rs           |   8 +
 .../crates/op-core/src/tools/web.rs           | 385 +++++++++++++++++-
 .../crates/op-tauri/src/commands/config.rs    |  14 +-
 .../crates/op-tauri/src/state.rs              |  10 +-
 .../frontend/src/api/invoke.test.ts           |   2 +
 .../src/commands/completionRegistry.test.ts   |   4 +-
 .../src/commands/completionRegistry.ts        |   1 +
 .../frontend/src/commands/slash.ts            |   2 +-
 .../frontend/src/commands/webSearch.test.ts   |  16 +-
 .../frontend/src/commands/webSearch.ts        |   2 +-
 .../frontend/src/components/App.test.ts       |   4 +-
 .../frontend/src/components/App.ts            |   2 +-
 tests/test_coverage_gaps.py                   |   9 +-
 tests/test_credentials.py                     |   3 +
 tests/test_tools.py                           |  56 +++
 tests/test_tools_complex.py                   |  21 +
 26 files changed, 791 insertions(+), 37 deletions(-)

diff --git a/README.md b/README.md
index 53a01029..bfede85c 100644
--- a/README.md
+++ b/README.md
@@ -148,7 +148,7 @@ export OPENPLANTER_RATE_LIMIT_RETRY_AFTER_CAP_SEC=120.0
 export OPENPLANTER_ZAI_STREAM_MAX_RETRIES=10
 ```
 
-Additional service keys: `EXA_API_KEY` (web search), `VOYAGE_API_KEY` (embeddings).
+Additional service keys: `EXA_API_KEY`, `FIRECRAWL_API_KEY`, `BRAVE_API_KEY` (web search), `VOYAGE_API_KEY` (embeddings).
 
 All keys can also be set with an `OPENPLANTER_` prefix (e.g. `OPENPLANTER_OPENAI_API_KEY`), via `.env` files in the workspace, or via CLI flags.
 
@@ -160,7 +160,7 @@ The agent has access to 19 tools, organized around its investigation workflow:
 
 **Shell execution** — `run_shell`, `run_shell_bg`, `check_shell_bg`, `kill_shell_bg` — run analysis scripts, data pipelines, and validation checks.
 
-**Web** — `web_search` (Exa), `fetch_url` — pull public records, verify entities, and retrieve supplementary data.
+**Web** — `web_search` (Exa, Firecrawl, or Brave), `fetch_url` — pull public records, verify entities, and retrieve supplementary data.
 
 **Planning & delegation** — `think`, `subtask`, `execute`, `list_artifacts`, `read_artifact` — decompose investigations into focused sub-tasks, each with acceptance criteria and independent verification.
 
diff --git a/agent/__main__.py b/agent/__main__.py
index f3c29eca..728397a5 100644
--- a/agent/__main__.py
+++ b/agent/__main__.py
@@ -100,9 +100,10 @@ def build_parser() -> argparse.ArgumentParser:
     )
     parser.add_argument("--exa-api-key", help="Exa API key override.")
     parser.add_argument("--firecrawl-api-key", help="Firecrawl API key override.")
+    parser.add_argument("--brave-api-key", help="Brave Search API key override.")
     parser.add_argument(
         "--web-search-provider",
-        choices=["exa", "firecrawl"],
+        choices=["exa", "firecrawl", "brave"],
         help="Web search backend provider.",
     )
     parser.add_argument("--voyage-api-key", help="Voyage API key override.")
@@ -241,6 +242,7 @@ def _load_credentials(
         zai_api_key=user_creds.zai_api_key,
         exa_api_key=user_creds.exa_api_key,
         firecrawl_api_key=user_creds.firecrawl_api_key,
+        brave_api_key=user_creds.brave_api_key,
         voyage_api_key=user_creds.voyage_api_key,
     )
 
@@ -260,6 +262,8 @@ def _load_credentials(
         creds.exa_api_key = stored.exa_api_key
     if stored.firecrawl_api_key:
         creds.firecrawl_api_key = stored.firecrawl_api_key
+    if stored.brave_api_key:
+        creds.brave_api_key = stored.brave_api_key
     if stored.voyage_api_key:
         creds.voyage_api_key = stored.voyage_api_key
 
@@ -278,6 +282,8 @@ def _load_credentials(
         creds.exa_api_key = env_creds.exa_api_key
     if env_creds.firecrawl_api_key:
         creds.firecrawl_api_key = env_creds.firecrawl_api_key
+    if env_creds.brave_api_key:
+        creds.brave_api_key = env_creds.brave_api_key
     if env_creds.voyage_api_key:
         creds.voyage_api_key = env_creds.voyage_api_key
 
@@ -301,6 +307,8 @@ def _load_credentials(
         creds.exa_api_key = args.exa_api_key.strip() or creds.exa_api_key
     if args.firecrawl_api_key:
         creds.firecrawl_api_key = args.firecrawl_api_key.strip() or creds.firecrawl_api_key
+    if args.brave_api_key:
+        creds.brave_api_key = args.brave_api_key.strip() or creds.brave_api_key
     if args.voyage_api_key:
         creds.voyage_api_key = args.voyage_api_key.strip() or creds.voyage_api_key
 
@@ -349,6 +357,7 @@ def _apply_runtime_overrides(cfg: AgentConfig, args: argparse.Namespace, creds:
     cfg.zai_api_key = creds.zai_api_key
     cfg.exa_api_key = creds.exa_api_key
     cfg.firecrawl_api_key = creds.firecrawl_api_key
+    cfg.brave_api_key = creds.brave_api_key
     cfg.voyage_api_key = creds.voyage_api_key
     cfg.api_key = cfg.openai_api_key
 
@@ -386,7 +395,7 @@ def _apply_runtime_overrides(cfg: AgentConfig, args: argparse.Namespace, creds:
         cfg.model = args.model
     if args.web_search_provider:
         cfg.web_search_provider = args.web_search_provider
-    if cfg.web_search_provider not in {"exa", "firecrawl"}:
+    if cfg.web_search_provider not in {"exa", "firecrawl", "brave"}:
         cfg.web_search_provider = "exa"
     if args.reasoning_effort:
         cfg.reasoning_effort = None if args.reasoning_effort == "none" else args.reasoning_effort
diff --git a/agent/builder.py b/agent/builder.py
index 1a07bf56..89671221 100644
--- a/agent/builder.py
+++ b/agent/builder.py
@@ -235,6 +235,8 @@ def build_engine(cfg: AgentConfig) -> RLMEngine:
         exa_base_url=cfg.exa_base_url,
         firecrawl_api_key=cfg.firecrawl_api_key,
         firecrawl_base_url=cfg.firecrawl_base_url,
+        brave_api_key=cfg.brave_api_key,
+        brave_base_url=cfg.brave_base_url,
     )
 
     try:
diff --git a/agent/config.py b/agent/config.py
index 527c0d2c..50290176 100644
--- a/agent/config.py
+++ b/agent/config.py
@@ -104,6 +104,7 @@ class AgentConfig:
     ollama_base_url: str = "http://localhost:11434/v1"
     exa_base_url: str = "https://api.exa.ai"
     firecrawl_base_url: str = "https://api.firecrawl.dev/v1"
+    brave_base_url: str = "https://api.search.brave.com/res/v1"
     openai_api_key: str | None = None
     anthropic_api_key: str | None = None
     openrouter_api_key: str | None = None
@@ -111,6 +112,7 @@ class AgentConfig:
     zai_api_key: str | None = None
     exa_api_key: str | None = None
     firecrawl_api_key: str | None = None
+    brave_api_key: str | None = None
     web_search_provider: str = "exa"
     voyage_api_key: str | None = None
     max_depth: int = 4
@@ -157,6 +159,7 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
         zai_api_key = os.getenv("OPENPLANTER_ZAI_API_KEY") or os.getenv("ZAI_API_KEY")
         exa_api_key = os.getenv("OPENPLANTER_EXA_API_KEY") or os.getenv("EXA_API_KEY")
         firecrawl_api_key = os.getenv("OPENPLANTER_FIRECRAWL_API_KEY") or os.getenv("FIRECRAWL_API_KEY")
+        brave_api_key = os.getenv("OPENPLANTER_BRAVE_API_KEY") or os.getenv("BRAVE_API_KEY")
         voyage_api_key = os.getenv("OPENPLANTER_VOYAGE_API_KEY") or os.getenv("VOYAGE_API_KEY")
         openai_base_url = os.getenv("OPENPLANTER_OPENAI_BASE_URL") or os.getenv(
             "OPENPLANTER_BASE_URL",
@@ -181,7 +184,7 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             )
         )
         web_search_provider = (os.getenv("OPENPLANTER_WEB_SEARCH_PROVIDER", "exa").strip().lower() or "exa")
-        if web_search_provider not in {"exa", "firecrawl"}:
+        if web_search_provider not in {"exa", "firecrawl", "brave"}:
             web_search_provider = "exa"
         return cls(
             workspace=ws,
@@ -201,6 +204,7 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             ollama_base_url=os.getenv("OPENPLANTER_OLLAMA_BASE_URL", "http://localhost:11434/v1"),
             exa_base_url=os.getenv("OPENPLANTER_EXA_BASE_URL", "https://api.exa.ai"),
             firecrawl_base_url=os.getenv("OPENPLANTER_FIRECRAWL_BASE_URL", "https://api.firecrawl.dev/v1"),
+            brave_base_url=os.getenv("OPENPLANTER_BRAVE_BASE_URL", "https://api.search.brave.com/res/v1"),
             openai_api_key=openai_api_key,
             anthropic_api_key=anthropic_api_key,
             openrouter_api_key=openrouter_api_key,
@@ -208,6 +212,7 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             zai_api_key=zai_api_key,
             exa_api_key=exa_api_key,
             firecrawl_api_key=firecrawl_api_key,
+            brave_api_key=brave_api_key,
             web_search_provider=web_search_provider,
             voyage_api_key=voyage_api_key,
             max_depth=int(os.getenv("OPENPLANTER_MAX_DEPTH", "4")),
diff --git a/agent/credentials.py b/agent/credentials.py
index 275a8106..a714f82d 100644
--- a/agent/credentials.py
+++ b/agent/credentials.py
@@ -18,6 +18,7 @@ class CredentialBundle:
     zai_api_key: str | None = None
     exa_api_key: str | None = None
     firecrawl_api_key: str | None = None
+    brave_api_key: str | None = None
     voyage_api_key: str | None = None
 
     def has_any(self) -> bool:
@@ -29,6 +30,7 @@ def has_any(self) -> bool:
             or (self.zai_api_key and self.zai_api_key.strip())
             or (self.exa_api_key and self.exa_api_key.strip())
             or (self.firecrawl_api_key and self.firecrawl_api_key.strip())
+            or (self.brave_api_key and self.brave_api_key.strip())
             or (self.voyage_api_key and self.voyage_api_key.strip())
         )
 
@@ -47,6 +49,8 @@ def merge_missing(self, other: "CredentialBundle") -> None:
             self.exa_api_key = other.exa_api_key
         if not self.firecrawl_api_key and other.firecrawl_api_key:
             self.firecrawl_api_key = other.firecrawl_api_key
+        if not self.brave_api_key and other.brave_api_key:
+            self.brave_api_key = other.brave_api_key
         if not self.voyage_api_key and other.voyage_api_key:
             self.voyage_api_key = other.voyage_api_key
 
@@ -66,6 +70,8 @@ def to_json(self) -> dict[str, str]:
             out["exa_api_key"] = self.exa_api_key
         if self.firecrawl_api_key:
             out["firecrawl_api_key"] = self.firecrawl_api_key
+        if self.brave_api_key:
+            out["brave_api_key"] = self.brave_api_key
         if self.voyage_api_key:
             out["voyage_api_key"] = self.voyage_api_key
         return out
@@ -82,6 +88,7 @@ def from_json(cls, payload: dict[str, str] | None) -> "CredentialBundle":
             zai_api_key=(payload.get("zai_api_key") or "").strip() or None,
             exa_api_key=(payload.get("exa_api_key") or "").strip() or None,
             firecrawl_api_key=(payload.get("firecrawl_api_key") or "").strip() or None,
+            brave_api_key=(payload.get("brave_api_key") or "").strip() or None,
             voyage_api_key=(payload.get("voyage_api_key") or "").strip() or None,
         )
 
@@ -127,6 +134,7 @@ def parse_env_file(path: Path) -> CredentialBundle:
         exa_api_key=(env.get("EXA_API_KEY") or env.get("OPENPLANTER_EXA_API_KEY") or "").strip() or None,
         firecrawl_api_key=(env.get("FIRECRAWL_API_KEY") or env.get("OPENPLANTER_FIRECRAWL_API_KEY") or "").strip()
         or None,
+        brave_api_key=(env.get("BRAVE_API_KEY") or env.get("OPENPLANTER_BRAVE_API_KEY") or "").strip() or None,
         voyage_api_key=(env.get("VOYAGE_API_KEY") or env.get("OPENPLANTER_VOYAGE_API_KEY") or "").strip() or None,
     )
 
@@ -160,6 +168,7 @@ def credentials_from_env() -> CredentialBundle:
             os.getenv("OPENPLANTER_FIRECRAWL_API_KEY") or os.getenv("FIRECRAWL_API_KEY") or ""
         ).strip()
         or None,
+        brave_api_key=(os.getenv("OPENPLANTER_BRAVE_API_KEY") or os.getenv("BRAVE_API_KEY") or "").strip() or None,
         voyage_api_key=(os.getenv("OPENPLANTER_VOYAGE_API_KEY") or os.getenv("VOYAGE_API_KEY") or "").strip() or None,
     )
 
@@ -257,6 +266,7 @@ def prompt_for_credentials(
         zai_api_key=existing.zai_api_key,
         exa_api_key=existing.exa_api_key,
         firecrawl_api_key=existing.firecrawl_api_key,
+        brave_api_key=existing.brave_api_key,
         voyage_api_key=existing.voyage_api_key,
     )
 
@@ -292,6 +302,7 @@ def _ask(label: str, existing_value: str | None) -> str | None:
     current.zai_api_key = _ask("Z.AI", current.zai_api_key)
     current.exa_api_key = _ask("Exa", current.exa_api_key)
     current.firecrawl_api_key = _ask("Firecrawl", current.firecrawl_api_key)
+    current.brave_api_key = _ask("Brave", current.brave_api_key)
     current.voyage_api_key = _ask("Voyage", current.voyage_api_key)
     if not force and current.has_any() and not existing.has_any():
         changed = True
diff --git a/agent/tool_defs.py b/agent/tool_defs.py
index 79bdb496..63d4765f 100644
--- a/agent/tool_defs.py
+++ b/agent/tool_defs.py
@@ -63,7 +63,7 @@
     },
     {
         "name": "web_search",
-        "description": "Search the web using the configured provider (Exa or Firecrawl). Returns URLs, titles, and optional page text.",
+        "description": "Search the web using the configured provider (Exa, Firecrawl, or Brave). Returns URLs, titles, and optional page text.",
         "parameters": {
             "type": "object",
             "properties": {
diff --git a/agent/tools.py b/agent/tools.py
index a9d6d4ef..102d4863 100644
--- a/agent/tools.py
+++ b/agent/tools.py
@@ -3,6 +3,7 @@
 import ast
 import base64
 import fnmatch
+import html as _html
 import json
 import os
 import signal
@@ -11,11 +12,13 @@
 import tempfile
 import threading
 import urllib.error
+import urllib.parse
 import urllib.request
 import re as _re
 import zlib
 from contextlib import contextmanager
 from dataclasses import dataclass, field
+from html.parser import HTMLParser
 from pathlib import Path
 from typing import Any
 
@@ -36,6 +39,66 @@
 _INTERACTIVE_RE = _re.compile(r"(^|[;&|]\s*)(vim|nano|less|more|top|htop|man)\b")
 
 
+class _HTMLTextExtractor(HTMLParser):
+    def __init__(self) -> None:
+        super().__init__(convert_charrefs=False)
+        self._title_parts: list[str] = []
+        self._text_parts: list[str] = []
+        self._skip_depth = 0
+        self._in_title = False
+
+    def handle_starttag(self, tag: str, attrs: list[tuple[str, str | None]]) -> None:
+        lowered = tag.lower()
+        if lowered in {"script", "style"}:
+            self._skip_depth += 1
+            return
+        if self._skip_depth:
+            return
+        if lowered == "title":
+            self._in_title = True
+            return
+        if lowered in {"article", "br", "div", "footer", "h1", "h2", "h3", "h4", "h5", "h6", "header", "li", "main", "p", "section", "td", "th", "tr"}:
+            self._text_parts.append("\n")
+
+    def handle_endtag(self, tag: str) -> None:
+        lowered = tag.lower()
+        if lowered in {"script", "style"}:
+            if self._skip_depth:
+                self._skip_depth -= 1
+            return
+        if self._skip_depth:
+            return
+        if lowered == "title":
+            self._in_title = False
+            return
+        if lowered in {"article", "div", "footer", "h1", "h2", "h3", "h4", "h5", "h6", "header", "li", "main", "p", "section", "td", "th", "tr"}:
+            self._text_parts.append("\n")
+
+    def handle_data(self, data: str) -> None:
+        if self._skip_depth or not data:
+            return
+        if self._in_title:
+            self._title_parts.append(data)
+        self._text_parts.append(data)
+
+    def title(self) -> str:
+        return _WS_RE.sub(" ", _html.unescape("".join(self._title_parts))).strip()
+
+    def text(self) -> str:
+        return _WS_RE.sub(" ", _html.unescape(" ".join(self._text_parts))).strip()
+
+
+def _extract_html_text(raw_html: str) -> tuple[str, str]:
+    parser = _HTMLTextExtractor()
+    try:
+        parser.feed(raw_html)
+        parser.close()
+        return parser.title(), parser.text()
+    except Exception:
+        stripped = _WS_RE.sub(" ", _re.sub(r"(?is)<[^>]+>", " ", raw_html)).strip()
+        return "", _html.unescape(stripped)
+
+
 def _line_hash(line: str) -> str:
     """2-char hex hash, whitespace-invariant."""
     return format(zlib.crc32(_WS_RE.sub("", line).encode("utf-8")) & 0xFF, "02x")
@@ -59,6 +122,8 @@ class WorkspaceTools:
     exa_base_url: str = "https://api.exa.ai"
     firecrawl_api_key: str | None = None
     firecrawl_base_url: str = "https://api.firecrawl.dev/v1"
+    brave_api_key: str | None = None
+    brave_base_url: str = "https://api.search.brave.com/res/v1"
 
     def __post_init__(self) -> None:
         self.root = self.root.expanduser().resolve()
@@ -839,6 +904,84 @@ def _firecrawl_request(self, endpoint: str, payload: dict[str, Any]) -> dict[str
             raise ToolError(f"Firecrawl API returned non-object response: {type(parsed)!r}")
         return parsed
 
+    def _brave_request(self, endpoint: str, params: dict[str, Any]) -> dict[str, Any]:
+        if not (self.brave_api_key and self.brave_api_key.strip()):
+            raise ToolError("BRAVE_API_KEY not configured")
+        query = urllib.parse.urlencode(params, doseq=True)
+        url = self.brave_base_url.rstrip("/") + endpoint
+        if query:
+            url = f"{url}?{query}"
+        req = urllib.request.Request(
+            url=url,
+            headers={
+                "Accept": "application/json",
+                "X-Subscription-Token": self.brave_api_key,
+            },
+            method="GET",
+        )
+        try:
+            with urllib.request.urlopen(req, timeout=self.command_timeout_sec) as resp:
+                raw = resp.read().decode("utf-8", errors="replace")
+        except urllib.error.HTTPError as exc:
+            body = exc.read().decode("utf-8", errors="replace")
+            raise ToolError(f"Brave API HTTP {exc.code}: {body}") from exc
+        except urllib.error.URLError as exc:
+            raise ToolError(f"Brave API connection error: {exc}") from exc
+        except OSError as exc:
+            raise ToolError(f"Brave API network error: {exc}") from exc
+
+        try:
+            parsed = json.loads(raw)
+        except json.JSONDecodeError as exc:
+            raise ToolError(f"Brave API returned non-JSON payload: {raw[:500]}") from exc
+        if not isinstance(parsed, dict):
+            raise ToolError(f"Brave API returned non-object response: {type(parsed)!r}")
+        return parsed
+
+    def _fetch_url_direct(self, url: str) -> dict[str, str]:
+        req = urllib.request.Request(
+            url=url,
+            headers={
+                "Accept": "text/html,application/xhtml+xml,application/json,text/plain;q=0.9,*/*;q=0.8",
+                "User-Agent": "OpenPlanter/1.0",
+            },
+            method="GET",
+        )
+        try:
+            with urllib.request.urlopen(req, timeout=self.command_timeout_sec) as resp:
+                resolved_url = resp.geturl()
+                charset = resp.headers.get_content_charset() or "utf-8"
+                raw = resp.read().decode(charset, errors="replace")
+                content_type = (resp.headers.get("Content-Type") or "").lower()
+        except urllib.error.HTTPError as exc:
+            return {
+                "url": url,
+                "title": "",
+                "text": f"Direct fetch failed: HTTP {exc.code}",
+            }
+        except urllib.error.URLError as exc:
+            return {
+                "url": url,
+                "title": "",
+                "text": f"Direct fetch failed: {exc}",
+            }
+        except OSError as exc:
+            return {
+                "url": url,
+                "title": "",
+                "text": f"Direct fetch failed: {exc}",
+            }
+
+        if "html" in content_type:
+            title, text = _extract_html_text(raw)
+        else:
+            title, text = "", raw
+        return {
+            "url": resolved_url,
+            "title": title,
+            "text": self._clip(text or raw, 8000),
+        }
+
     def web_search(
         self,
         query: str,
@@ -850,7 +993,7 @@ def web_search(
             return "web_search requires non-empty query"
         clamped_results = max(1, min(int(num_results), 20))
         provider = (self.web_search_provider or "exa").strip().lower()
-        if provider not in {"exa", "firecrawl"}:
+        if provider not in {"exa", "firecrawl", "brave"}:
             provider = "exa"
 
         if provider == "firecrawl":
@@ -902,6 +1045,58 @@ def web_search(
             }
             return self._clip(json.dumps(output, indent=2, ensure_ascii=True), self.max_file_chars)
 
+        if provider == "brave":
+            params: dict[str, Any] = {
+                "q": query,
+                "count": clamped_results,
+            }
+            if include_text:
+                params["extra_snippets"] = "true"
+
+            try:
+                parsed = self._brave_request("/web/search", params)
+            except Exception as exc:
+                return f"Web search failed: {exc}"
+
+            rows: list[Any] = []
+            web = parsed.get("web")
+            if isinstance(web, dict):
+                web_rows = web.get("results")
+                if isinstance(web_rows, list):
+                    rows = web_rows
+            elif isinstance(parsed.get("results"), list):
+                rows = parsed["results"]
+
+            out_results: list[dict[str, Any]] = []
+            for row in rows:
+                if not isinstance(row, dict):
+                    continue
+                description = str(row.get("description", "") or row.get("snippet", ""))
+                extra_snippets = row.get("extra_snippets")
+                extra_texts = [
+                    snippet
+                    for snippet in extra_snippets
+                    if isinstance(snippet, str) and snippet
+                ] if isinstance(extra_snippets, list) else []
+                item: dict[str, Any] = {
+                    "url": str(row.get("url", "")),
+                    "title": str(row.get("title", "")),
+                    "snippet": description or (extra_texts[0] if extra_texts else ""),
+                }
+                if include_text:
+                    text_parts = [part for part in [description, *extra_texts] if part]
+                    if text_parts:
+                        item["text"] = self._clip("\n\n".join(text_parts), 4000)
+                out_results.append(item)
+
+            output = {
+                "query": query,
+                "provider": provider,
+                "results": out_results,
+                "total": len(out_results),
+            }
+            return self._clip(json.dumps(output, indent=2, ensure_ascii=True), self.max_file_chars)
+
         payload: dict[str, Any] = {
             "query": query,
             "numResults": clamped_results,
@@ -949,7 +1144,7 @@ def fetch_url(self, urls: list[str]) -> str:
             return "fetch_url requires at least one valid URL"
         normalized = normalized[:10]
         provider = (self.web_search_provider or "exa").strip().lower()
-        if provider not in {"exa", "firecrawl"}:
+        if provider not in {"exa", "firecrawl", "brave"}:
             provider = "exa"
 
         if provider == "firecrawl":
@@ -985,6 +1180,15 @@ def fetch_url(self, urls: list[str]) -> str:
             }
             return self._clip(json.dumps(output, indent=2, ensure_ascii=True), self.max_file_chars)
 
+        if provider == "brave":
+            pages = [self._fetch_url_direct(url) for url in normalized]
+            output = {
+                "provider": provider,
+                "pages": pages,
+                "total": len(pages),
+            }
+            return self._clip(json.dumps(output, indent=2, ensure_ascii=True), self.max_file_chars)
+
         payload: dict[str, Any] = {
             "ids": normalized,
             "text": {"maxCharacters": 8000},
diff --git a/openplanter-desktop/crates/op-core/src/config.rs b/openplanter-desktop/crates/op-core/src/config.rs
index b25abbe0..e75b21a1 100644
--- a/openplanter-desktop/crates/op-core/src/config.rs
+++ b/openplanter-desktop/crates/op-core/src/config.rs
@@ -14,6 +14,7 @@ pub const FOUNDRY_OPENAI_API_KEY_PLACEHOLDER: &str = "dont-worry-this-key-will-b
 pub const FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER: &str = "dont-worry-it-will-be-injected";
 pub const ZAI_PAYGO_BASE_URL: &str = "https://api.z.ai/api/paas/v4";
 pub const ZAI_CODING_BASE_URL: &str = "https://api.z.ai/api/coding/paas/v4";
+pub const BRAVE_BASE_URL: &str = "https://api.search.brave.com/res/v1";
 
 /// Default model for each supported provider.
 pub static PROVIDER_DEFAULT_MODELS: LazyLock<HashMap<&'static str, &'static str>> =
@@ -75,6 +76,7 @@ pub fn resolve_zai_base_url(plan: &str, paygo_base_url: &str, coding_base_url: &
 pub fn normalize_web_search_provider(value: Option<&str>) -> String {
     match value.unwrap_or_default().trim().to_lowercase().as_str() {
         "firecrawl" => "firecrawl".to_string(),
+        "brave" => "brave".to_string(),
         _ => "exa".to_string(),
     }
 }
@@ -166,6 +168,7 @@ pub struct AgentConfig {
     pub ollama_base_url: String,
     pub exa_base_url: String,
     pub firecrawl_base_url: String,
+    pub brave_base_url: String,
 
     // API keys
     pub api_key: Option<String>,
@@ -176,6 +179,7 @@ pub struct AgentConfig {
     pub zai_api_key: Option<String>,
     pub exa_api_key: Option<String>,
     pub firecrawl_api_key: Option<String>,
+    pub brave_api_key: Option<String>,
     pub web_search_provider: String,
     pub voyage_api_key: Option<String>,
 
@@ -224,6 +228,7 @@ impl Default for AgentConfig {
             ollama_base_url: "http://localhost:11434/v1".into(),
             exa_base_url: "https://api.exa.ai".into(),
             firecrawl_base_url: "https://api.firecrawl.dev/v1".into(),
+            brave_base_url: BRAVE_BASE_URL.into(),
             api_key: Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.into()),
             openai_api_key: Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.into()),
             anthropic_api_key: Some(FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER.into()),
@@ -232,6 +237,7 @@ impl Default for AgentConfig {
             zai_api_key: None,
             exa_api_key: None,
             firecrawl_api_key: None,
+            brave_api_key: None,
             web_search_provider: "exa".into(),
             voyage_api_key: None,
             max_depth: 4,
@@ -284,6 +290,8 @@ impl AgentConfig {
 
         let firecrawl_api_key =
             env_opt("OPENPLANTER_FIRECRAWL_API_KEY").or_else(|| env_opt("FIRECRAWL_API_KEY"));
+        let brave_api_key =
+            env_opt("OPENPLANTER_BRAVE_API_KEY").or_else(|| env_opt("BRAVE_API_KEY"));
 
         let voyage_api_key =
             env_opt("OPENPLANTER_VOYAGE_API_KEY").or_else(|| env_opt("VOYAGE_API_KEY"));
@@ -348,6 +356,7 @@ impl AgentConfig {
                 "OPENPLANTER_FIRECRAWL_BASE_URL",
                 "https://api.firecrawl.dev/v1",
             ),
+            brave_base_url: env_or("OPENPLANTER_BRAVE_BASE_URL", BRAVE_BASE_URL),
             openai_api_key,
             anthropic_api_key,
             openrouter_api_key,
@@ -355,6 +364,7 @@ impl AgentConfig {
             zai_api_key,
             exa_api_key,
             firecrawl_api_key,
+            brave_api_key,
             web_search_provider,
             voyage_api_key,
             max_depth: env_int("OPENPLANTER_MAX_DEPTH", 4),
@@ -434,6 +444,8 @@ mod tests {
         assert_eq!(cfg.zai_plan, "paygo");
         assert_eq!(cfg.zai_base_url, ZAI_PAYGO_BASE_URL);
         assert_eq!(cfg.web_search_provider, "exa");
+        assert_eq!(cfg.brave_base_url, BRAVE_BASE_URL);
+        assert!(cfg.brave_api_key.is_none());
         assert_eq!(cfg.rate_limit_max_retries, 12);
         assert_eq!(cfg.rate_limit_backoff_base_sec, 1.0);
         assert_eq!(cfg.rate_limit_backoff_max_sec, 60.0);
@@ -486,6 +498,9 @@ mod tests {
             "OPENPLANTER_RECURSIVE",
             "OPENPLANTER_DEMO",
             "OPENPLANTER_WEB_SEARCH_PROVIDER",
+            "OPENPLANTER_BRAVE_API_KEY",
+            "BRAVE_API_KEY",
+            "OPENPLANTER_BRAVE_BASE_URL",
             "OPENPLANTER_ZAI_PLAN",
             "OPENPLANTER_ZAI_BASE_URL",
             "OPENPLANTER_RATE_LIMIT_MAX_RETRIES",
@@ -521,6 +536,7 @@ mod tests {
             Some(FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER)
         );
         assert!(cfg.zai_api_key.is_none());
+        assert!(cfg.brave_api_key.is_none());
         assert_eq!(cfg.openai_base_url, FOUNDRY_OPENAI_BASE_URL);
         assert_eq!(cfg.anthropic_base_url, FOUNDRY_ANTHROPIC_BASE_URL);
         assert_eq!(cfg.web_search_provider, "exa");
@@ -539,7 +555,8 @@ mod tests {
             env::set_var("OPENPLANTER_DEMO", "true");
             env::set_var("OPENAI_API_KEY", "sk-test123");
             env::set_var("ZAI_API_KEY", "zai-test123");
-            env::set_var("OPENPLANTER_WEB_SEARCH_PROVIDER", "firecrawl");
+            env::set_var("BRAVE_API_KEY", "brave-test123");
+            env::set_var("OPENPLANTER_WEB_SEARCH_PROVIDER", "brave");
             env::set_var("OPENPLANTER_RATE_LIMIT_MAX_RETRIES", "5");
             env::set_var("OPENPLANTER_RATE_LIMIT_BACKOFF_BASE_SEC", "2.5");
             env::set_var("OPENPLANTER_RATE_LIMIT_BACKOFF_MAX_SEC", "30.0");
@@ -557,10 +574,11 @@ mod tests {
         assert!(cfg.demo);
         assert_eq!(cfg.openai_api_key, Some("sk-test123".into()));
         assert_eq!(cfg.zai_api_key, Some("zai-test123".into()));
+        assert_eq!(cfg.brave_api_key, Some("brave-test123".into()));
         assert_eq!(cfg.zai_plan, "coding");
         assert_eq!(cfg.zai_base_url, ZAI_CODING_BASE_URL);
         assert_eq!(cfg.zai_stream_max_retries, 7);
-        assert_eq!(cfg.web_search_provider, "firecrawl");
+        assert_eq!(cfg.web_search_provider, "brave");
         assert_eq!(cfg.rate_limit_max_retries, 5);
         assert_eq!(cfg.rate_limit_backoff_base_sec, 2.5);
         assert_eq!(cfg.rate_limit_backoff_max_sec, 30.0);
@@ -589,6 +607,7 @@ mod tests {
             normalize_web_search_provider(Some("firecrawl")),
             "firecrawl"
         );
+        assert_eq!(normalize_web_search_provider(Some("brave")), "brave");
         assert_eq!(normalize_web_search_provider(Some("other")), "exa");
         assert!(is_foundry_openai_base_url(FOUNDRY_OPENAI_BASE_URL));
         assert!(is_foundry_anthropic_base_url(FOUNDRY_ANTHROPIC_BASE_URL));
diff --git a/openplanter-desktop/crates/op-core/src/credentials.rs b/openplanter-desktop/crates/op-core/src/credentials.rs
index af746019..d7ce3e52 100644
--- a/openplanter-desktop/crates/op-core/src/credentials.rs
+++ b/openplanter-desktop/crates/op-core/src/credentials.rs
@@ -19,13 +19,14 @@ pub struct CredentialBundle {
     pub zai_api_key: Option<String>,
     pub exa_api_key: Option<String>,
     pub firecrawl_api_key: Option<String>,
+    pub brave_api_key: Option<String>,
     pub voyage_api_key: Option<String>,
 }
 
 impl CredentialBundle {
     /// Returns `true` if any key has a non-empty value.
     pub fn has_any(&self) -> bool {
-        let keys: [&Option<String>; 8] = [
+        let keys: [&Option<String>; 9] = [
             &self.openai_api_key,
             &self.anthropic_api_key,
             &self.openrouter_api_key,
@@ -33,6 +34,7 @@ impl CredentialBundle {
             &self.zai_api_key,
             &self.exa_api_key,
             &self.firecrawl_api_key,
+            &self.brave_api_key,
             &self.voyage_api_key,
         ];
         keys.iter()
@@ -55,6 +57,7 @@ impl CredentialBundle {
         fill!(zai_api_key);
         fill!(exa_api_key);
         fill!(firecrawl_api_key);
+        fill!(brave_api_key);
         fill!(voyage_api_key);
     }
 
@@ -75,6 +78,7 @@ impl CredentialBundle {
         add!(zai_api_key, "zai_api_key");
         add!(exa_api_key, "exa_api_key");
         add!(firecrawl_api_key, "firecrawl_api_key");
+        add!(brave_api_key, "brave_api_key");
         add!(voyage_api_key, "voyage_api_key");
         out
     }
@@ -95,6 +99,7 @@ impl CredentialBundle {
             zai_api_key: get_str(payload, "zai_api_key"),
             exa_api_key: get_str(payload, "exa_api_key"),
             firecrawl_api_key: get_str(payload, "firecrawl_api_key"),
+            brave_api_key: get_str(payload, "brave_api_key"),
             voyage_api_key: get_str(payload, "voyage_api_key"),
         }
     }
@@ -161,6 +166,7 @@ pub fn parse_env_file(path: &Path) -> CredentialBundle {
             "FIRECRAWL_API_KEY",
             "OPENPLANTER_FIRECRAWL_API_KEY",
         ),
+        brave_api_key: get_key(&env_map, "BRAVE_API_KEY", "OPENPLANTER_BRAVE_API_KEY"),
         voyage_api_key: get_key(&env_map, "VOYAGE_API_KEY", "OPENPLANTER_VOYAGE_API_KEY"),
     }
 }
@@ -183,6 +189,7 @@ pub fn credentials_from_env() -> CredentialBundle {
         zai_api_key: env_key("OPENPLANTER_ZAI_API_KEY", "ZAI_API_KEY"),
         exa_api_key: env_key("OPENPLANTER_EXA_API_KEY", "EXA_API_KEY"),
         firecrawl_api_key: env_key("OPENPLANTER_FIRECRAWL_API_KEY", "FIRECRAWL_API_KEY"),
+        brave_api_key: env_key("OPENPLANTER_BRAVE_API_KEY", "BRAVE_API_KEY"),
         voyage_api_key: env_key("OPENPLANTER_VOYAGE_API_KEY", "VOYAGE_API_KEY"),
     }
 }
@@ -346,6 +353,7 @@ mod tests {
             anthropic_api_key: None,
             openrouter_api_key: Some("or-456".into()),
             firecrawl_api_key: Some("fc-789".into()),
+            brave_api_key: Some("brave-101".into()),
             ..Default::default()
         };
         let json = bundle.to_json();
@@ -353,6 +361,7 @@ mod tests {
         assert!(!json.contains_key("anthropic_api_key"));
         assert_eq!(json.get("openrouter_api_key").unwrap(), "or-456");
         assert_eq!(json.get("firecrawl_api_key").unwrap(), "fc-789");
+        assert_eq!(json.get("brave_api_key").unwrap(), "brave-101");
     }
 
     #[test]
@@ -368,6 +377,7 @@ export ANTHROPIC_API_KEY='ant-key'
 EXA_API_KEY="exa-quoted"
 ZAI_API_KEY=zai-from-env
 OPENPLANTER_FIRECRAWL_API_KEY="firecrawl-quoted"
+BRAVE_API_KEY=brave-from-env
 UNRELATED_VAR=foo
 "#,
         )
@@ -379,6 +389,7 @@ UNRELATED_VAR=foo
         assert_eq!(bundle.exa_api_key, Some("exa-quoted".into()));
         assert_eq!(bundle.zai_api_key, Some("zai-from-env".into()));
         assert_eq!(bundle.firecrawl_api_key, Some("firecrawl-quoted".into()));
+        assert_eq!(bundle.brave_api_key, Some("brave-from-env".into()));
         assert!(bundle.cerebras_api_key.is_none());
     }
 
@@ -390,6 +401,7 @@ UNRELATED_VAR=foo
             openai_api_key: Some("sk-test".into()),
             anthropic_api_key: Some("ant-test".into()),
             zai_api_key: Some("zai-test".into()),
+            brave_api_key: Some("brave-test".into()),
             ..Default::default()
         };
         store.save(&bundle).unwrap();
@@ -397,6 +409,7 @@ UNRELATED_VAR=foo
         assert_eq!(loaded.openai_api_key, Some("sk-test".into()));
         assert_eq!(loaded.anthropic_api_key, Some("ant-test".into()));
         assert_eq!(loaded.zai_api_key, Some("zai-test".into()));
+        assert_eq!(loaded.brave_api_key, Some("brave-test".into()));
     }
 
     #[test]
diff --git a/openplanter-desktop/crates/op-core/src/tools/defs.rs b/openplanter-desktop/crates/op-core/src/tools/defs.rs
index a29ceabe..7b1d5835 100644
--- a/openplanter-desktop/crates/op-core/src/tools/defs.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/defs.rs
@@ -176,7 +176,7 @@ fn mvp_tool_defs() -> Vec<ToolDef> {
         // ── Web ──
         ToolDef {
             name: "web_search",
-            description: "Search the web using the configured Exa or Firecrawl backend. Returns URLs, titles, snippets, and optional page text.",
+            description: "Search the web using the configured Exa, Firecrawl, or Brave backend. Returns URLs, titles, snippets, and optional page text.",
             parameters: json!({
                 "type": "object",
                 "properties": {
@@ -199,7 +199,7 @@ fn mvp_tool_defs() -> Vec<ToolDef> {
         },
         ToolDef {
             name: "fetch_url",
-            description: "Fetch and return the text content of one or more URLs using the configured Exa or Firecrawl backend.",
+            description: "Fetch and return the text content of one or more URLs using the configured Exa, Firecrawl, or Brave backend.",
             parameters: json!({
                 "type": "object",
                 "properties": {
diff --git a/openplanter-desktop/crates/op-core/src/tools/mod.rs b/openplanter-desktop/crates/op-core/src/tools/mod.rs
index a44fc2e5..f6220a92 100644
--- a/openplanter-desktop/crates/op-core/src/tools/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/mod.rs
@@ -58,6 +58,8 @@ pub struct WorkspaceTools {
     exa_base_url: String,
     firecrawl_api_key: Option<String>,
     firecrawl_base_url: String,
+    brave_api_key: Option<String>,
+    brave_base_url: String,
     files_read: HashSet<PathBuf>,
     bg_jobs: shell::BgJobs,
 }
@@ -88,6 +90,8 @@ impl WorkspaceTools {
             exa_base_url: config.exa_base_url.clone(),
             firecrawl_api_key: config.firecrawl_api_key.clone(),
             firecrawl_base_url: config.firecrawl_base_url.clone(),
+            brave_api_key: config.brave_api_key.clone(),
+            brave_base_url: config.brave_base_url.clone(),
             files_read: HashSet::new(),
             bg_jobs: shell::BgJobs::new(),
         }
@@ -114,6 +118,8 @@ impl WorkspaceTools {
             exa_base_url: config.exa_base_url.clone(),
             firecrawl_api_key: config.firecrawl_api_key.clone(),
             firecrawl_base_url: config.firecrawl_base_url.clone(),
+            brave_api_key: config.brave_api_key.clone(),
+            brave_base_url: config.brave_base_url.clone(),
             files_read: HashSet::new(),
             bg_jobs: shell::BgJobs::new(),
         }
@@ -241,6 +247,8 @@ impl WorkspaceTools {
                     &self.exa_base_url,
                     self.firecrawl_api_key.as_deref(),
                     &self.firecrawl_base_url,
+                    self.brave_api_key.as_deref(),
+                    &self.brave_base_url,
                     query,
                     num_results,
                     include_text,
diff --git a/openplanter-desktop/crates/op-core/src/tools/web.rs b/openplanter-desktop/crates/op-core/src/tools/web.rs
index fb67a633..2b36060e 100644
--- a/openplanter-desktop/crates/op-core/src/tools/web.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/web.rs
@@ -1,12 +1,26 @@
-/// Web tools: Exa / Firecrawl search and fetch_url.
+/// Web tools: Exa / Firecrawl / Brave search and fetch_url.
 use std::time::Duration;
+use std::sync::LazyLock;
 
+use regex::Regex;
 use serde_json::json;
 
 use crate::config::normalize_web_search_provider;
 
 use super::ToolResult;
 
+static SCRIPT_RE: LazyLock<Regex> =
+    LazyLock::new(|| Regex::new(r"(?is)<script[^>]*>.*?</script>").unwrap());
+static STYLE_RE: LazyLock<Regex> =
+    LazyLock::new(|| Regex::new(r"(?is)<style[^>]*>.*?</style>").unwrap());
+static TITLE_RE: LazyLock<Regex> =
+    LazyLock::new(|| Regex::new(r"(?is)<title[^>]*>(.*?)</title>").unwrap());
+static BLOCK_TAG_RE: LazyLock<Regex> = LazyLock::new(|| {
+    Regex::new(r"(?is)</?(article|br|div|footer|h[1-6]|header|li|main|p|section|td|th|tr)[^>]*>")
+        .unwrap()
+});
+static TAG_RE: LazyLock<Regex> = LazyLock::new(|| Regex::new(r"(?is)<[^>]+>").unwrap());
+
 fn clip(text: &str, max_chars: usize) -> String {
     if text.len() <= max_chars {
         return text.to_string();
@@ -16,6 +30,34 @@ fn clip(text: &str, max_chars: usize) -> String {
     format!("{}\n\n...[truncated {omitted} chars]...", &text[..end])
 }
 
+fn collapse_ws(text: &str) -> String {
+    text.split_whitespace().collect::<Vec<_>>().join(" ")
+}
+
+fn decode_html_entities(text: &str) -> String {
+    text.replace("&nbsp;", " ")
+        .replace("&quot;", "\"")
+        .replace("&#39;", "'")
+        .replace("&#x27;", "'")
+        .replace("&lt;", "<")
+        .replace("&gt;", ">")
+        .replace("&amp;", "&")
+}
+
+fn extract_html_text(html: &str) -> (String, String) {
+    let title = TITLE_RE
+        .captures(html)
+        .and_then(|caps| caps.get(1))
+        .map(|m| collapse_ws(&decode_html_entities(m.as_str())))
+        .unwrap_or_default();
+    let without_scripts = SCRIPT_RE.replace_all(html, " ");
+    let without_styles = STYLE_RE.replace_all(&without_scripts, " ");
+    let with_breaks = BLOCK_TAG_RE.replace_all(&without_styles, "\n");
+    let plain = TAG_RE.replace_all(&with_breaks, " ");
+    let text = collapse_ws(&decode_html_entities(&plain));
+    (title, text)
+}
+
 async fn exa_request(
     api_key: Option<&str>,
     exa_base_url: &str,
@@ -85,12 +127,119 @@ async fn firecrawl_request(
         .map_err(|e| format!("Firecrawl API returned non-JSON payload: {e}"))
 }
 
+async fn brave_request(
+    api_key: Option<&str>,
+    brave_base_url: &str,
+    endpoint: &str,
+    params: &[(&str, String)],
+    timeout_sec: u64,
+) -> Result<serde_json::Value, String> {
+    let api_key = match api_key {
+        Some(value) if !value.trim().is_empty() => value,
+        _ => return Err("BRAVE_API_KEY not configured".into()),
+    };
+
+    let url = format!("{}{}", brave_base_url.trim_end_matches('/'), endpoint);
+    let client = reqwest::Client::new();
+    let response = client
+        .get(&url)
+        .header("Accept", "application/json")
+        .header("X-Subscription-Token", api_key)
+        .query(params)
+        .timeout(Duration::from_secs(timeout_sec))
+        .send()
+        .await
+        .map_err(|e| format!("Brave API request failed: {e}"))?;
+
+    let response = response
+        .error_for_status()
+        .map_err(|e| format!("Brave API request failed: {e}"))?;
+
+    response
+        .json::<serde_json::Value>()
+        .await
+        .map_err(|e| format!("Brave API returned non-JSON payload: {e}"))
+}
+
+async fn fetch_direct_page(url: &str, timeout_sec: u64) -> serde_json::Value {
+    let client = reqwest::Client::new();
+    let response = match client
+        .get(url)
+        .header(
+            "Accept",
+            "text/html,application/xhtml+xml,application/json,text/plain;q=0.9,*/*;q=0.8",
+        )
+        .header("User-Agent", "OpenPlanter/1.0")
+        .timeout(Duration::from_secs(timeout_sec))
+        .send()
+        .await
+    {
+        Ok(response) => response,
+        Err(error) => {
+            return json!({
+                "url": url,
+                "title": "",
+                "text": format!("Direct fetch failed: {error}"),
+            });
+        }
+    };
+
+    let final_url = response.url().to_string();
+    let content_type = response
+        .headers()
+        .get(reqwest::header::CONTENT_TYPE)
+        .and_then(|value| value.to_str().ok())
+        .unwrap_or("")
+        .to_lowercase();
+
+    let response = match response.error_for_status() {
+        Ok(response) => response,
+        Err(error) => {
+            return json!({
+                "url": url,
+                "title": "",
+                "text": format!("Direct fetch failed: {error}"),
+            });
+        }
+    };
+
+    let body = match response.text().await {
+        Ok(body) => body,
+        Err(error) => {
+            return json!({
+                "url": final_url,
+                "title": "",
+                "text": format!("Direct fetch failed: {error}"),
+            });
+        }
+    };
+
+    let (title, extracted_text) = if content_type.contains("html") {
+        extract_html_text(&body)
+    } else {
+        (String::new(), body.clone())
+    };
+    let text = if extracted_text.is_empty() {
+        body
+    } else {
+        extracted_text
+    };
+
+    json!({
+        "url": final_url,
+        "title": title,
+        "text": clip(&text, 8_000),
+    })
+}
+
 pub async fn web_search(
     provider: &str,
     exa_api_key: Option<&str>,
     exa_base_url: &str,
     firecrawl_api_key: Option<&str>,
     firecrawl_base_url: &str,
+    brave_api_key: Option<&str>,
+    brave_base_url: &str,
     query: &str,
     num_results: i64,
     include_text: bool,
@@ -183,6 +332,85 @@ pub async fn web_search(
             }
             Err(error) => return ToolResult::error(format!("Web search failed: {error}")),
         }
+    } else if provider == "brave" {
+        let mut params = vec![
+            ("q", query.to_string()),
+            ("count", clamped.to_string()),
+        ];
+        if include_text {
+            params.push(("extra_snippets", "true".to_string()));
+        }
+
+        match brave_request(
+            brave_api_key,
+            brave_base_url,
+            "/web/search",
+            &params,
+            timeout_sec,
+        )
+        .await
+        {
+            Ok(body) => {
+                let rows = body
+                    .get("web")
+                    .and_then(|value| value.get("results"))
+                    .and_then(|value| value.as_array())
+                    .or_else(|| body.get("results").and_then(|value| value.as_array()));
+                let mut results: Vec<serde_json::Value> = Vec::new();
+                if let Some(rows) = rows {
+                    for row in rows {
+                        let description = row
+                            .get("description")
+                            .and_then(|value| value.as_str())
+                            .or_else(|| row.get("snippet").and_then(|value| value.as_str()))
+                            .unwrap_or("")
+                            .to_string();
+                        let extra_texts = row
+                            .get("extra_snippets")
+                            .and_then(|value| value.as_array())
+                            .map(|items| {
+                                items
+                                    .iter()
+                                    .filter_map(|value| value.as_str())
+                                    .filter(|value| !value.is_empty())
+                                    .map(str::to_string)
+                                    .collect::<Vec<_>>()
+                            })
+                            .unwrap_or_default();
+                        let snippet = if !description.is_empty() {
+                            description.clone()
+                        } else {
+                            extra_texts.first().cloned().unwrap_or_default()
+                        };
+
+                        let mut item = json!({
+                            "url": row.get("url").and_then(|value| value.as_str()).unwrap_or(""),
+                            "title": row.get("title").and_then(|value| value.as_str()).unwrap_or(""),
+                            "snippet": snippet,
+                        });
+                        if include_text {
+                            let mut text_parts = Vec::new();
+                            if !description.is_empty() {
+                                text_parts.push(description.clone());
+                            }
+                            text_parts.extend(extra_texts.clone());
+                            if !text_parts.is_empty() {
+                                item["text"] = json!(clip(&text_parts.join("\n\n"), 4_000));
+                            }
+                        }
+                        results.push(item);
+                    }
+                }
+
+                json!({
+                    "query": query,
+                    "provider": provider,
+                    "results": results,
+                    "total": results.len(),
+                })
+            }
+            Err(error) => return ToolResult::error(format!("Web search failed: {error}")),
+        }
     } else {
         let mut payload = json!({
             "query": query,
@@ -300,6 +528,17 @@ pub async fn fetch_url(
             }
         }
 
+        json!({
+            "provider": provider,
+            "pages": pages,
+            "total": pages.len(),
+        })
+    } else if provider == "brave" {
+        let mut pages: Vec<serde_json::Value> = Vec::new();
+        for url in &normalized {
+            pages.push(fetch_direct_page(url, timeout_sec).await);
+        }
+
         json!({
             "provider": provider,
             "pages": pages,
@@ -356,7 +595,7 @@ mod tests {
     use axum::body::Body;
     use axum::http::StatusCode;
     use axum::response::Response;
-    use axum::routing::post;
+    use axum::routing::{get, post};
     use axum::{Json, Router};
     use serde_json::{Value, json};
 
@@ -381,6 +620,48 @@ mod tests {
         addr
     }
 
+    async fn start_json_get_server(
+        path: &'static str,
+        response_payload: Value,
+    ) -> std::net::SocketAddr {
+        let app = Router::new().route(
+            path,
+            get(move || {
+                let response_payload = response_payload.clone();
+                async move { Json(response_payload) }
+            }),
+        );
+        let listener = tokio::net::TcpListener::bind("127.0.0.1:0").await.unwrap();
+        let addr = listener.local_addr().unwrap();
+        tokio::spawn(async move {
+            axum::serve(listener, app).await.unwrap();
+        });
+        addr
+    }
+
+    async fn start_text_get_server(
+        path: &'static str,
+        body: &'static str,
+        content_type: &'static str,
+    ) -> std::net::SocketAddr {
+        let app = Router::new().route(
+            path,
+            get(move || async move {
+                Response::builder()
+                    .status(StatusCode::OK)
+                    .header("Content-Type", content_type)
+                    .body(Body::from(body))
+                    .unwrap()
+            }),
+        );
+        let listener = tokio::net::TcpListener::bind("127.0.0.1:0").await.unwrap();
+        let addr = listener.local_addr().unwrap();
+        tokio::spawn(async move {
+            axum::serve(listener, app).await.unwrap();
+        });
+        addr
+    }
+
     async fn start_status_server(path: &'static str, status: StatusCode) -> std::net::SocketAddr {
         let app = Router::new().route(
             path,
@@ -422,6 +703,8 @@ mod tests {
             &format!("http://{addr}"),
             None,
             "https://api.firecrawl.dev/v1",
+            None,
+            "https://api.search.brave.com/res/v1",
             "example query",
             5,
             true,
@@ -461,6 +744,8 @@ mod tests {
             "https://api.exa.ai",
             Some("fc-key"),
             &format!("http://{addr}"),
+            None,
+            "https://api.search.brave.com/res/v1",
             "example query",
             5,
             true,
@@ -509,6 +794,76 @@ mod tests {
         assert_eq!(parsed["pages"][0]["text"], "Article body");
     }
 
+    #[tokio::test]
+    async fn test_web_search_brave_output_shape() {
+        let addr = start_json_get_server(
+            "/web/search",
+            json!({
+                "web": {
+                    "results": [
+                        {
+                            "url": "https://example.com/brave",
+                            "title": "Brave Title",
+                            "description": "Brave snippet",
+                            "extra_snippets": ["Extra context"]
+                        }
+                    ]
+                }
+            }),
+        )
+        .await;
+
+        let result = web_search(
+            "brave",
+            None,
+            "https://api.exa.ai",
+            None,
+            "https://api.firecrawl.dev/v1",
+            Some("brave-key"),
+            &format!("http://{addr}"),
+            "example query",
+            5,
+            true,
+            20_000,
+            5,
+        )
+        .await;
+
+        assert!(!result.is_error);
+        let parsed: Value = serde_json::from_str(&result.content).unwrap();
+        assert_eq!(parsed["provider"], "brave");
+        assert_eq!(parsed["results"][0]["title"], "Brave Title");
+        assert!(parsed["results"][0]["text"].as_str().unwrap().contains("Extra context"));
+    }
+
+    #[tokio::test]
+    async fn test_fetch_url_brave_output_shape() {
+        let addr = start_text_get_server(
+            "/page",
+            "<html><head><title>Brave Page</title></head><body><h1>Hello Brave</h1><p>Readable text.</p></body></html>",
+            "text/html; charset=utf-8",
+        )
+        .await;
+
+        let result = fetch_url(
+            "brave",
+            None,
+            "https://api.exa.ai",
+            None,
+            "https://api.firecrawl.dev/v1",
+            &[format!("http://{addr}/page")],
+            20_000,
+            5,
+        )
+        .await;
+
+        assert!(!result.is_error);
+        let parsed: Value = serde_json::from_str(&result.content).unwrap();
+        assert_eq!(parsed["provider"], "brave");
+        assert_eq!(parsed["pages"][0]["title"], "Brave Page");
+        assert!(parsed["pages"][0]["text"].as_str().unwrap().contains("Hello Brave"));
+    }
+
     #[tokio::test]
     async fn test_missing_firecrawl_key_errors() {
         let result = web_search(
@@ -517,6 +872,8 @@ mod tests {
             "https://api.exa.ai",
             None,
             "https://api.firecrawl.dev/v1",
+            None,
+            "https://api.search.brave.com/res/v1",
             "example query",
             5,
             false,
@@ -529,6 +886,28 @@ mod tests {
         assert!(result.content.contains("FIRECRAWL_API_KEY"));
     }
 
+    #[tokio::test]
+    async fn test_missing_brave_key_errors() {
+        let result = web_search(
+            "brave",
+            None,
+            "https://api.exa.ai",
+            None,
+            "https://api.firecrawl.dev/v1",
+            None,
+            "https://api.search.brave.com/res/v1",
+            "example query",
+            5,
+            false,
+            20_000,
+            5,
+        )
+        .await;
+
+        assert!(result.is_error);
+        assert!(result.content.contains("BRAVE_API_KEY"));
+    }
+
     #[tokio::test]
     async fn test_exa_http_error_bubbles_up() {
         let addr = start_status_server("/search", StatusCode::BAD_GATEWAY).await;
@@ -539,6 +918,8 @@ mod tests {
             &format!("http://{addr}"),
             None,
             "https://api.firecrawl.dev/v1",
+            None,
+            "https://api.search.brave.com/res/v1",
             "example query",
             5,
             false,
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/config.rs b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
index cf3f0edb..7224456c 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/config.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
@@ -200,6 +200,7 @@ pub fn build_credential_status(cfg: &op_core::config::AgentConfig) -> HashMap<St
     status.insert("ollama".to_string(), true); // Ollama never needs a key
     status.insert("exa".to_string(), cfg.exa_api_key.is_some());
     status.insert("firecrawl".to_string(), cfg.firecrawl_api_key.is_some());
+    status.insert("brave".to_string(), cfg.brave_api_key.is_some());
     status
 }
 
@@ -241,6 +242,10 @@ pub async fn get_credentials_status(
         "firecrawl".to_string(),
         cfg.firecrawl_api_key.is_some() || env_creds.firecrawl_api_key.is_some(),
     );
+    status.insert(
+        "brave".to_string(),
+        cfg.brave_api_key.is_some() || env_creds.brave_api_key.is_some(),
+    );
     Ok(status)
 }
 
@@ -345,6 +350,7 @@ mod tests {
         cfg.zai_api_key = None;
         cfg.exa_api_key = None;
         cfg.firecrawl_api_key = None;
+        cfg.brave_api_key = None;
         let status = build_credential_status(&cfg);
         assert_eq!(status["openai"], false);
         assert_eq!(status["anthropic"], false);
@@ -352,6 +358,7 @@ mod tests {
         assert_eq!(status["cerebras"], false);
         assert_eq!(status["zai"], false);
         assert_eq!(status["ollama"], true, "ollama always true");
+        assert_eq!(status["brave"], false);
     }
 
     #[test]
@@ -401,6 +408,7 @@ mod tests {
         cfg.zai_api_key = Some("k5".to_string());
         cfg.exa_api_key = Some("k6".to_string());
         cfg.firecrawl_api_key = Some("k7".to_string());
+        cfg.brave_api_key = Some("k8".to_string());
         let status = build_credential_status(&cfg);
         for (provider, has_key) in &status {
             assert!(has_key, "{} should be true when key is set", provider);
@@ -408,13 +416,13 @@ mod tests {
     }
 
     #[test]
-    fn test_cred_status_has_eight_entries() {
+    fn test_cred_status_has_nine_entries() {
         let cfg = op_core::config::AgentConfig::from_env("/nonexistent");
         let status = build_credential_status(&cfg);
         assert_eq!(
             status.len(),
-            8,
-            "should have 8 entries (6 providers + 2 web services)"
+            9,
+            "should have 9 entries (6 providers + 3 web services)"
         );
     }
 }
diff --git a/openplanter-desktop/crates/op-tauri/src/state.rs b/openplanter-desktop/crates/op-tauri/src/state.rs
index 6c9fc8ff..387bb719 100644
--- a/openplanter-desktop/crates/op-tauri/src/state.rs
+++ b/openplanter-desktop/crates/op-tauri/src/state.rs
@@ -60,6 +60,7 @@ pub fn merge_credentials_into_config(
     merge!(zai_api_key);
     merge!(exa_api_key);
     merge!(firecrawl_api_key);
+    merge!(brave_api_key);
     merge!(voyage_api_key);
 }
 
@@ -385,6 +386,7 @@ mod tests {
         cfg.zai_api_key = None;
         cfg.exa_api_key = None;
         cfg.firecrawl_api_key = None;
+        cfg.brave_api_key = None;
         cfg.voyage_api_key = None;
         cfg
     }
@@ -442,16 +444,18 @@ mod tests {
     }
 
     #[test]
-    fn test_merge_includes_zai_and_firecrawl() {
+    fn test_merge_includes_zai_firecrawl_and_brave() {
         let mut cfg = empty_cfg();
         let env_creds = CredentialBundle {
             zai_api_key: Some("zai-env".to_string()),
             firecrawl_api_key: Some("fc-env".to_string()),
+            brave_api_key: Some("brave-env".to_string()),
             ..Default::default()
         };
         merge_credentials_into_config(&mut cfg, &env_creds, &CredentialBundle::default());
         assert_eq!(cfg.zai_api_key, Some("zai-env".to_string()));
         assert_eq!(cfg.firecrawl_api_key, Some("fc-env".to_string()));
+        assert_eq!(cfg.brave_api_key, Some("brave-env".to_string()));
     }
 
     #[test]
@@ -476,7 +480,7 @@ mod tests {
             default_model_zai: Some("glm-5".to_string()),
             default_reasoning_effort: Some("medium".to_string()),
             zai_plan: Some("coding".to_string()),
-            web_search_provider: Some("firecrawl".to_string()),
+            web_search_provider: Some("brave".to_string()),
             ..Default::default()
         };
         apply_settings_to_config(&mut cfg, &settings);
@@ -484,7 +488,7 @@ mod tests {
         assert_eq!(cfg.reasoning_effort, Some("medium".to_string()));
         assert_eq!(cfg.zai_plan, "coding");
         assert_eq!(cfg.zai_base_url, op_core::config::ZAI_CODING_BASE_URL);
-        assert_eq!(cfg.web_search_provider, "firecrawl");
+        assert_eq!(cfg.web_search_provider, "brave");
 
         for (key, value) in saved {
             unsafe {
diff --git a/openplanter-desktop/frontend/src/api/invoke.test.ts b/openplanter-desktop/frontend/src/api/invoke.test.ts
index 00d2da0a..35fecc66 100644
--- a/openplanter-desktop/frontend/src/api/invoke.test.ts
+++ b/openplanter-desktop/frontend/src/api/invoke.test.ts
@@ -126,12 +126,14 @@ describe("invoke wrappers", () => {
       ollama: true,
       exa: false,
       firecrawl: true,
+      brave: false,
     }));
     const status = await getCredentialsStatus();
     expect(status.openai).toBe(true);
     expect(status.openrouter).toBe(false);
     expect(status.zai).toBe(true);
     expect(status.firecrawl).toBe(true);
+    expect(status.brave).toBe(false);
   });
 
   it("listSessions sends limit", async () => {
diff --git a/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts b/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
index ef51eed2..e019d03a 100644
--- a/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
+++ b/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
@@ -81,13 +81,13 @@ describe("completionRegistry", () => {
     expect(childValues).toEqual(["low", "medium", "high", "off"]);
   });
 
-  it("/web-search has exa and firecrawl children", () => {
+  it("/web-search has exa, firecrawl, and brave children", () => {
     const webSearchCmd = COMMAND_COMPLETIONS.find((c) => c.value === "/web-search");
     expect(webSearchCmd).toBeDefined();
     expect(webSearchCmd!.children).toBeDefined();
 
     const childValues = webSearchCmd!.children!.map((c) => c.value);
-    expect(childValues).toEqual(["exa", "firecrawl"]);
+    expect(childValues).toEqual(["exa", "firecrawl", "brave"]);
     expect(webSearchCmd!.children![0].children?.[0].value).toBe("--save");
   });
 
diff --git a/openplanter-desktop/frontend/src/commands/completionRegistry.ts b/openplanter-desktop/frontend/src/commands/completionRegistry.ts
index 2bb2b166..2133f2d3 100644
--- a/openplanter-desktop/frontend/src/commands/completionRegistry.ts
+++ b/openplanter-desktop/frontend/src/commands/completionRegistry.ts
@@ -39,6 +39,7 @@ const REASONING_LEVELS: CompletionItem[] = [
 const WEB_SEARCH_PROVIDERS: CompletionItem[] = [
   { value: "exa", description: "Use Exa for web search", children: SAVE_FLAG },
   { value: "firecrawl", description: "Use Firecrawl for web search", children: SAVE_FLAG },
+  { value: "brave", description: "Use Brave Search for web search", children: SAVE_FLAG },
 ];
 
 const ZAI_PLANS: CompletionItem[] = [
diff --git a/openplanter-desktop/frontend/src/commands/slash.ts b/openplanter-desktop/frontend/src/commands/slash.ts
index d46675dd..34df61f1 100644
--- a/openplanter-desktop/frontend/src/commands/slash.ts
+++ b/openplanter-desktop/frontend/src/commands/slash.ts
@@ -34,7 +34,7 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
           "  /zai-plan <plan>   Set Z.AI endpoint family (paygo, coding)",
           "  /zai-plan <plan> --save  Set and persist",
           "  /web-search        Show current web search provider",
-          "  /web-search <provider>  Set web search provider (exa, firecrawl)",
+          "  /web-search <provider>  Set web search provider (exa, firecrawl, brave)",
           "  /web-search <provider> --save  Set and persist",
           "  /reasoning          Show/set reasoning effort",
           "  /reasoning <level>  Set level (low, medium, high, off)",
diff --git a/openplanter-desktop/frontend/src/commands/webSearch.test.ts b/openplanter-desktop/frontend/src/commands/webSearch.test.ts
index 358cbed6..cb5ed492 100644
--- a/openplanter-desktop/frontend/src/commands/webSearch.test.ts
+++ b/openplanter-desktop/frontend/src/commands/webSearch.test.ts
@@ -31,7 +31,7 @@ describe("handleWebSearchCommand", () => {
 
   it("switches provider for the current session", async () => {
     __setHandler("update_config", ({ partial }: { partial: Record<string, string> }) => {
-      expect(partial.web_search_provider).toBe("firecrawl");
+      expect(partial.web_search_provider).toBe("brave");
       return {
         provider: "anthropic",
         model: "claude-opus-4-6",
@@ -42,14 +42,14 @@ describe("handleWebSearchCommand", () => {
         max_depth: 4,
         max_steps_per_call: 100,
         reasoning_effort: "high",
-        web_search_provider: "firecrawl",
+        web_search_provider: "brave",
         demo: false,
       };
     });
 
-    const result = await handleWebSearchCommand("firecrawl");
-    expect(result.lines).toContain("Web search provider set to: firecrawl");
-    expect(appState.get().webSearchProvider).toBe("firecrawl");
+    const result = await handleWebSearchCommand("brave");
+    expect(result.lines).toContain("Web search provider set to: brave");
+    expect(appState.get().webSearchProvider).toBe("brave");
   });
 
   it("save persists the selected provider", async () => {
@@ -63,14 +63,14 @@ describe("handleWebSearchCommand", () => {
       max_depth: 4,
       max_steps_per_call: 100,
       reasoning_effort: "high",
-      web_search_provider: "firecrawl",
+      web_search_provider: "brave",
       demo: false,
     }));
     __setHandler("save_settings", ({ settings }: { settings: Record<string, string> }) => {
-      expect(settings.web_search_provider).toBe("firecrawl");
+      expect(settings.web_search_provider).toBe("brave");
     });
 
-    const result = await handleWebSearchCommand("firecrawl --save");
+    const result = await handleWebSearchCommand("brave --save");
     expect(result.lines).toContain("(Settings saved)");
   });
 });
diff --git a/openplanter-desktop/frontend/src/commands/webSearch.ts b/openplanter-desktop/frontend/src/commands/webSearch.ts
index 5a475eb0..c18ed806 100644
--- a/openplanter-desktop/frontend/src/commands/webSearch.ts
+++ b/openplanter-desktop/frontend/src/commands/webSearch.ts
@@ -3,7 +3,7 @@ import { saveSettings, updateConfig } from "../api/invoke";
 import { appState } from "../state/store";
 import type { CommandResult } from "./model";
 
-const VALID_WEB_SEARCH_PROVIDERS = ["exa", "firecrawl"];
+const VALID_WEB_SEARCH_PROVIDERS = ["exa", "firecrawl", "brave"];
 
 /** Handle /web-search [provider] [--save]. */
 export async function handleWebSearchCommand(args: string): Promise<CommandResult> {
diff --git a/openplanter-desktop/frontend/src/components/App.test.ts b/openplanter-desktop/frontend/src/components/App.test.ts
index d641b919..f0323542 100644
--- a/openplanter-desktop/frontend/src/components/App.test.ts
+++ b/openplanter-desktop/frontend/src/components/App.test.ts
@@ -48,7 +48,7 @@ describe("createApp", () => {
     __setHandler("list_sessions", () => [SESSION_B, SESSION_A]);
     __setHandler("get_credentials_status", () => ({
       openai: true, anthropic: true, openrouter: false,
-      cerebras: false, zai: true, ollama: true, exa: false, firecrawl: true,
+      cerebras: false, zai: true, ollama: true, exa: false, firecrawl: true, brave: false,
     }));
     __setHandler("open_session", () => ({
       id: "20260227-120000-cccc3333",
@@ -103,7 +103,7 @@ describe("createApp", () => {
 
     await vi.waitFor(() => {
       const creds = root.querySelector(".cred-status");
-      expect(creds!.children.length).toBe(8);
+      expect(creds!.children.length).toBe(9);
       expect(creds!.querySelector(".cred-ok")!.textContent).toContain("openai");
       expect(creds!.querySelector(".cred-missing")!.textContent).toContain("openrouter");
     });
diff --git a/openplanter-desktop/frontend/src/components/App.ts b/openplanter-desktop/frontend/src/components/App.ts
index 9f5ef663..9e08f564 100644
--- a/openplanter-desktop/frontend/src/components/App.ts
+++ b/openplanter-desktop/frontend/src/components/App.ts
@@ -302,7 +302,7 @@ async function loadCredentials(container: HTMLElement): Promise<void> {
   try {
     const status = await getCredentialsStatus();
     container.innerHTML = "";
-    const providers = ["openai", "anthropic", "openrouter", "cerebras", "zai", "ollama", "exa", "firecrawl"];
+    const providers = ["openai", "anthropic", "openrouter", "cerebras", "zai", "ollama", "exa", "firecrawl", "brave"];
     for (const p of providers) {
       const row = document.createElement("div");
       const hasKey = status[p] ?? false;
diff --git a/tests/test_coverage_gaps.py b/tests/test_coverage_gaps.py
index 23c49947..15d36b62 100644
--- a/tests/test_coverage_gaps.py
+++ b/tests/test_coverage_gaps.py
@@ -69,11 +69,12 @@ def test_inner_quotes_preserved(self) -> None:
 class MergeMissingTests(unittest.TestCase):
     def test_fills_missing_keys(self) -> None:
         a = CredentialBundle(openai_api_key="oa")
-        b = CredentialBundle(anthropic_api_key="an", exa_api_key="exa")
+        b = CredentialBundle(anthropic_api_key="an", exa_api_key="exa", brave_api_key="brave")
         a.merge_missing(b)
         self.assertEqual(a.openai_api_key, "oa")
         self.assertEqual(a.anthropic_api_key, "an")
         self.assertEqual(a.exa_api_key, "exa")
+        self.assertEqual(a.brave_api_key, "brave")
 
     def test_does_not_overwrite_existing(self) -> None:
         a = CredentialBundle(openai_api_key="mine")
@@ -95,6 +96,7 @@ def test_merge_all_fields(self) -> None:
             openrouter_api_key="or",
             cerebras_api_key="cb",
             exa_api_key="exa",
+            brave_api_key="brave",
         )
         a.merge_missing(b)
         self.assertEqual(a.openai_api_key, "oa")
@@ -102,6 +104,7 @@ def test_merge_all_fields(self) -> None:
         self.assertEqual(a.openrouter_api_key, "or")
         self.assertEqual(a.cerebras_api_key, "cb")
         self.assertEqual(a.exa_api_key, "exa")
+        self.assertEqual(a.brave_api_key, "brave")
 
 
 # ---------------------------------------------------------------------------
@@ -116,6 +119,7 @@ def test_reads_standard_env_vars(self) -> None:
             "ANTHROPIC_API_KEY": "an-key",
             "OPENROUTER_API_KEY": "or-key",
             "EXA_API_KEY": "exa-key",
+            "BRAVE_API_KEY": "brave-key",
         }
         with patch.dict(os.environ, env, clear=True):
             creds = credentials_from_env()
@@ -123,6 +127,7 @@ def test_reads_standard_env_vars(self) -> None:
         self.assertEqual(creds.anthropic_api_key, "an-key")
         self.assertEqual(creds.openrouter_api_key, "or-key")
         self.assertEqual(creds.exa_api_key, "exa-key")
+        self.assertEqual(creds.brave_api_key, "brave-key")
 
     def test_rlm_prefix_takes_priority(self) -> None:
         env = {
@@ -241,6 +246,7 @@ def test_api_keys_from_env(self) -> None:
             "ANTHROPIC_API_KEY": "an",
             "OPENROUTER_API_KEY": "or",
             "EXA_API_KEY": "exa",
+            "BRAVE_API_KEY": "brave",
         }
         with patch.dict(os.environ, env, clear=True):
             cfg = AgentConfig.from_env("/tmp/test-ws")
@@ -248,6 +254,7 @@ def test_api_keys_from_env(self) -> None:
         self.assertEqual(cfg.anthropic_api_key, "an")
         self.assertEqual(cfg.openrouter_api_key, "or")
         self.assertEqual(cfg.exa_api_key, "exa")
+        self.assertEqual(cfg.brave_api_key, "brave")
 
     def test_foundry_placeholder_keys_disabled_for_public_endpoints(self) -> None:
         env = {
diff --git a/tests/test_credentials.py b/tests/test_credentials.py
index 29538747..005acf47 100644
--- a/tests/test_credentials.py
+++ b/tests/test_credentials.py
@@ -25,6 +25,7 @@ def test_parse_env_file_extracts_supported_keys(self) -> None:
                         "ZAI_API_KEY=zai-key",
                         "EXA_API_KEY=exa-key",
                         "FIRECRAWL_API_KEY=fc-key",
+                        "BRAVE_API_KEY=brave-key",
                     ]
                 ),
                 encoding="utf-8",
@@ -36,6 +37,7 @@ def test_parse_env_file_extracts_supported_keys(self) -> None:
             self.assertEqual(creds.zai_api_key, "zai-key")
             self.assertEqual(creds.exa_api_key, "exa-key")
             self.assertEqual(creds.firecrawl_api_key, "fc-key")
+            self.assertEqual(creds.brave_api_key, "brave-key")
 
     def test_store_roundtrip(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
@@ -48,6 +50,7 @@ def test_store_roundtrip(self) -> None:
                 zai_api_key="zai",
                 exa_api_key="exa",
                 firecrawl_api_key="fc",
+                brave_api_key="brave",
             )
             store.save(creds)
             loaded = store.load()
diff --git a/tests/test_tools.py b/tests/test_tools.py
index a5590a56..6a5f9887 100644
--- a/tests/test_tools.py
+++ b/tests/test_tools.py
@@ -154,6 +154,55 @@ def test_fetch_url_with_mocked_firecrawl_response(self) -> None:
             self.assertEqual(parsed["pages"][0]["url"], "https://example.com")
             self.assertEqual(parsed["pages"][0]["text"], "Page body")
 
+    def test_web_search_with_mocked_brave_response(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            tools = WorkspaceTools(
+                root=root,
+                web_search_provider="brave",
+                brave_api_key="brave-key",
+            )
+            mocked = {
+                "web": {
+                    "results": [
+                        {
+                            "url": "https://example.com/brave",
+                            "title": "Brave Result",
+                            "description": "Snippet",
+                            "extra_snippets": ["Extra context"],
+                        }
+                    ]
+                }
+            }
+            with patch.object(WorkspaceTools, "_brave_request", return_value=mocked):
+                raw = tools.web_search("test query", num_results=3, include_text=True)
+            parsed = json.loads(raw)
+            self.assertEqual(parsed["provider"], "brave")
+            self.assertEqual(parsed["query"], "test query")
+            self.assertEqual(parsed["total"], 1)
+            self.assertEqual(parsed["results"][0]["url"], "https://example.com/brave")
+            self.assertIn("Extra context", parsed["results"][0]["text"])
+
+    def test_fetch_url_with_mocked_brave_response(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            tools = WorkspaceTools(
+                root=root,
+                web_search_provider="brave",
+            )
+            mocked = {
+                "url": "https://example.com/brave",
+                "title": "Brave Example",
+                "text": "Page body",
+            }
+            with patch.object(WorkspaceTools, "_fetch_url_direct", return_value=mocked):
+                raw = tools.fetch_url(["https://example.com/brave"])
+            parsed = json.loads(raw)
+            self.assertEqual(parsed["provider"], "brave")
+            self.assertEqual(parsed["total"], 1)
+            self.assertEqual(parsed["pages"][0]["title"], "Brave Example")
+            self.assertEqual(parsed["pages"][0]["text"], "Page body")
+
     def test_web_search_without_exa_key(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)
@@ -168,6 +217,13 @@ def test_web_search_without_firecrawl_key(self) -> None:
             out = tools.web_search("test")
             self.assertIn("FIRECRAWL_API_KEY not configured", out)
 
+    def test_web_search_without_brave_key(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            tools = WorkspaceTools(root=root, web_search_provider="brave", brave_api_key=None)
+            out = tools.web_search("test")
+            self.assertIn("BRAVE_API_KEY not configured", out)
+
     def test_repo_map_python_symbols(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)
diff --git a/tests/test_tools_complex.py b/tests/test_tools_complex.py
index edb258a5..bf1352ff 100644
--- a/tests/test_tools_complex.py
+++ b/tests/test_tools_complex.py
@@ -140,6 +140,20 @@ def test_web_search_clamps_num_results_firecrawl(self) -> None:
                 payload = mock_fc.call_args[0][1]
                 self.assertEqual(payload["limit"], 20)
 
+    def test_web_search_clamps_num_results_brave(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            tools = WorkspaceTools(
+                root=Path(tmpdir), web_search_provider="brave", brave_api_key="test-key"
+            )
+            mock_response = {"web": {"results": []}}
+            with patch.object(
+                WorkspaceTools, "_brave_request", return_value=mock_response
+            ) as mock_brave:
+                tools.web_search("test query", num_results=50)
+                mock_brave.assert_called_once()
+                payload = mock_brave.call_args[0][1]
+                self.assertEqual(payload["count"], 20)
+
     # 12
     def test_fetch_url_non_list_returns_error(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
@@ -185,6 +199,13 @@ def test_firecrawl_request_no_key_raises(self) -> None:
                 tools._firecrawl_request("/search", {"query": "test"})
             self.assertIn("FIRECRAWL_API_KEY not configured", str(ctx.exception))
 
+    def test_brave_request_no_key_raises(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            tools = WorkspaceTools(root=Path(tmpdir), brave_api_key=None)
+            with self.assertRaises(ToolError) as ctx:
+                tools._brave_request("/web/search", {"q": "test"})
+            self.assertIn("BRAVE_API_KEY not configured", str(ctx.exception))
+
     # 16
     def test_write_file_creates_nested_dirs(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:

From a384928a7c4fe9ac7f892308549664cb1161eb7e Mon Sep 17 00:00:00 2001
From: Drake Thomsen <120344051+ThomsenDrake@users.noreply.github.com>
Date: Thu, 12 Mar 2026 11:11:38 -0400
Subject: [PATCH 05/58] Add GPT-5.4 alias and ChatGPT OAuth support for OpenAI
 auth

---
 README.md                                       |  4 +++-
 agent/__main__.py                               | 16 ++++++++++++++--
 agent/credentials.py                            | 17 +++++++++++++++++
 agent/tui.py                                    |  1 +
 .../crates/op-core/src/config.rs                |  6 ++++--
 .../crates/op-core/src/credentials.rs           |  7 +++++++
 .../crates/op-tauri/src/commands/config.rs      |  5 ++++-
 .../crates/op-tauri/src/state.rs                | 10 +++++++++-
 .../frontend/src/commands/model.test.ts         |  4 ++++
 .../frontend/src/commands/model.ts              |  2 ++
 tests/test_credentials.py                       |  3 +++
 11 files changed, 68 insertions(+), 7 deletions(-)

diff --git a/README.md b/README.md
index bfede85c..68fbffc3 100644
--- a/README.md
+++ b/README.md
@@ -84,7 +84,7 @@ The container mounts `./workspace` as the agent's working directory.
 
 | Provider | Default Model | Env Var |
 |----------|---------------|---------|
-| OpenAI | `azure-foundry/gpt-5.3-codex` | `OPENAI_API_KEY` |
+| OpenAI | `azure-foundry/gpt-5.3-codex` | `OPENAI_API_KEY` or `OPENAI_OAUTH_TOKEN` |
 | Anthropic | `anthropic-foundry/claude-opus-4-6` | `ANTHROPIC_API_KEY` |
 | OpenRouter | `anthropic/claude-sonnet-4-5` | `OPENROUTER_API_KEY` |
 | Cerebras | `qwen-3-235b-a22b-instruct-2507` | `CEREBRAS_API_KEY` |
@@ -96,6 +96,8 @@ OpenAI-compatible requests now default to the Azure Foundry proxy at
 default to the Anthropic Foundry proxy at
 `https://foundry-proxy.cheetah-koi.ts.net/anthropic/v1`.
 
+For OpenAI-compatible access, you can authenticate with either a standard API key or a ChatGPT OAuth token (Plus/Pro/Teams): `OPENAI_OAUTH_TOKEN` (or `OPENPLANTER_OPENAI_OAUTH_TOKEN`).
+
 ### Local Models (Ollama)
 
 [Ollama](https://ollama.com) runs models locally with no API key. Install Ollama, pull a model (`ollama pull llama3.2`), then:
diff --git a/agent/__main__.py b/agent/__main__.py
index 728397a5..bf07fd29 100644
--- a/agent/__main__.py
+++ b/agent/__main__.py
@@ -89,6 +89,10 @@ def build_parser() -> argparse.ArgumentParser:
     parser.add_argument("--base-url", help="Provider base URL override for this run.")
     parser.add_argument("--api-key", help="Legacy API key alias (maps to OpenAI).")
     parser.add_argument("--openai-api-key", help="OpenAI API key override.")
+    parser.add_argument(
+        "--openai-oauth-token",
+        help="ChatGPT OAuth token (Plus/Pro/Teams) override for OpenAI-compatible endpoints.",
+    )
     parser.add_argument("--anthropic-api-key", help="Anthropic API key override.")
     parser.add_argument("--openrouter-api-key", help="OpenRouter API key override.")
     parser.add_argument("--cerebras-api-key", help="Cerebras API key override.")
@@ -185,7 +189,7 @@ def _resolve_provider(requested: str, creds: CredentialBundle) -> str:
         return requested
     if requested == "all":
         return "all"
-    if creds.openai_api_key:
+    if creds.openai_api_key or creds.openai_oauth_token:
         return "openai"
     if creds.anthropic_api_key:
         return "anthropic"
@@ -236,6 +240,7 @@ def _load_credentials(
 
     creds = CredentialBundle(
         openai_api_key=user_creds.openai_api_key,
+        openai_oauth_token=user_creds.openai_oauth_token,
         anthropic_api_key=user_creds.anthropic_api_key,
         openrouter_api_key=user_creds.openrouter_api_key,
         cerebras_api_key=user_creds.cerebras_api_key,
@@ -250,6 +255,8 @@ def _load_credentials(
     stored = store.load()
     if stored.openai_api_key:
         creds.openai_api_key = stored.openai_api_key
+    if stored.openai_oauth_token:
+        creds.openai_oauth_token = stored.openai_oauth_token
     if stored.anthropic_api_key:
         creds.anthropic_api_key = stored.anthropic_api_key
     if stored.openrouter_api_key:
@@ -270,6 +277,8 @@ def _load_credentials(
     env_creds = credentials_from_env()
     if env_creds.openai_api_key:
         creds.openai_api_key = env_creds.openai_api_key
+    if env_creds.openai_oauth_token:
+        creds.openai_oauth_token = env_creds.openai_oauth_token
     if env_creds.anthropic_api_key:
         creds.anthropic_api_key = env_creds.anthropic_api_key
     if env_creds.openrouter_api_key:
@@ -295,6 +304,8 @@ def _load_credentials(
         creds.openai_api_key = args.api_key.strip() or creds.openai_api_key
     if args.openai_api_key:
         creds.openai_api_key = args.openai_api_key.strip() or creds.openai_api_key
+    if args.openai_oauth_token:
+        creds.openai_oauth_token = args.openai_oauth_token.strip() or creds.openai_oauth_token
     if args.anthropic_api_key:
         creds.anthropic_api_key = args.anthropic_api_key.strip() or creds.anthropic_api_key
     if args.openrouter_api_key:
@@ -347,7 +358,8 @@ def _apply_runtime_overrides(cfg: AgentConfig, args: argparse.Namespace, creds:
         cfg.provider = args.provider
     cfg.provider = _resolve_provider(cfg.provider, creds)
 
-    cfg.openai_api_key = resolve_openai_api_key(creds.openai_api_key, cfg.openai_base_url)
+    effective_openai_key = creds.openai_api_key or creds.openai_oauth_token
+    cfg.openai_api_key = resolve_openai_api_key(effective_openai_key, cfg.openai_base_url)
     cfg.anthropic_api_key = resolve_anthropic_api_key(
         creds.anthropic_api_key,
         cfg.anthropic_base_url,
diff --git a/agent/credentials.py b/agent/credentials.py
index a714f82d..2e4d8a40 100644
--- a/agent/credentials.py
+++ b/agent/credentials.py
@@ -12,6 +12,7 @@
 @dataclass(slots=True)
 class CredentialBundle:
     openai_api_key: str | None = None
+    openai_oauth_token: str | None = None
     anthropic_api_key: str | None = None
     openrouter_api_key: str | None = None
     cerebras_api_key: str | None = None
@@ -24,6 +25,7 @@ class CredentialBundle:
     def has_any(self) -> bool:
         return bool(
             (self.openai_api_key and self.openai_api_key.strip())
+            or (self.openai_oauth_token and self.openai_oauth_token.strip())
             or (self.anthropic_api_key and self.anthropic_api_key.strip())
             or (self.openrouter_api_key and self.openrouter_api_key.strip())
             or (self.cerebras_api_key and self.cerebras_api_key.strip())
@@ -37,6 +39,8 @@ def has_any(self) -> bool:
     def merge_missing(self, other: "CredentialBundle") -> None:
         if not self.openai_api_key and other.openai_api_key:
             self.openai_api_key = other.openai_api_key
+        if not self.openai_oauth_token and other.openai_oauth_token:
+            self.openai_oauth_token = other.openai_oauth_token
         if not self.anthropic_api_key and other.anthropic_api_key:
             self.anthropic_api_key = other.anthropic_api_key
         if not self.openrouter_api_key and other.openrouter_api_key:
@@ -58,6 +62,8 @@ def to_json(self) -> dict[str, str]:
         out: dict[str, str] = {}
         if self.openai_api_key:
             out["openai_api_key"] = self.openai_api_key
+        if self.openai_oauth_token:
+            out["openai_oauth_token"] = self.openai_oauth_token
         if self.anthropic_api_key:
             out["anthropic_api_key"] = self.anthropic_api_key
         if self.openrouter_api_key:
@@ -82,6 +88,7 @@ def from_json(cls, payload: dict[str, str] | None) -> "CredentialBundle":
             return cls()
         return cls(
             openai_api_key=(payload.get("openai_api_key") or "").strip() or None,
+            openai_oauth_token=(payload.get("openai_oauth_token") or "").strip() or None,
             anthropic_api_key=(payload.get("anthropic_api_key") or "").strip() or None,
             openrouter_api_key=(payload.get("openrouter_api_key") or "").strip() or None,
             cerebras_api_key=(payload.get("cerebras_api_key") or "").strip() or None,
@@ -124,6 +131,10 @@ def parse_env_file(path: Path) -> CredentialBundle:
 
     return CredentialBundle(
         openai_api_key=(env.get("OPENAI_API_KEY") or env.get("OPENPLANTER_OPENAI_API_KEY") or "").strip() or None,
+        openai_oauth_token=(
+            env.get("OPENAI_OAUTH_TOKEN") or env.get("OPENPLANTER_OPENAI_OAUTH_TOKEN") or ""
+        ).strip()
+        or None,
         anthropic_api_key=(env.get("ANTHROPIC_API_KEY") or env.get("OPENPLANTER_ANTHROPIC_API_KEY") or "").strip()
         or None,
         openrouter_api_key=(env.get("OPENROUTER_API_KEY") or env.get("OPENPLANTER_OPENROUTER_API_KEY") or "").strip()
@@ -147,6 +158,10 @@ def credentials_from_env() -> CredentialBundle:
             or ""
         ).strip()
         or None,
+        openai_oauth_token=(
+            os.getenv("OPENPLANTER_OPENAI_OAUTH_TOKEN") or os.getenv("OPENAI_OAUTH_TOKEN") or ""
+        ).strip()
+        or None,
         anthropic_api_key=(
             os.getenv("OPENPLANTER_ANTHROPIC_API_KEY") or os.getenv("ANTHROPIC_API_KEY") or ""
         ).strip()
@@ -260,6 +275,7 @@ def prompt_for_credentials(
     """
     current = CredentialBundle(
         openai_api_key=existing.openai_api_key,
+        openai_oauth_token=existing.openai_oauth_token,
         anthropic_api_key=existing.anthropic_api_key,
         openrouter_api_key=existing.openrouter_api_key,
         cerebras_api_key=existing.cerebras_api_key,
@@ -296,6 +312,7 @@ def _ask(label: str, existing_value: str | None) -> str | None:
         return value
 
     current.openai_api_key = _ask("OpenAI", current.openai_api_key)
+    current.openai_oauth_token = _ask("ChatGPT OAuth (Plus/Pro/Teams)", current.openai_oauth_token)
     current.anthropic_api_key = _ask("Anthropic", current.anthropic_api_key)
     current.openrouter_api_key = _ask("OpenRouter", current.openrouter_api_key)
     current.cerebras_api_key = _ask("Cerebras", current.cerebras_api_key)
diff --git a/agent/tui.py b/agent/tui.py
index c1a63be2..05a64740 100644
--- a/agent/tui.py
+++ b/agent/tui.py
@@ -118,6 +118,7 @@ def _build_splash() -> str:
     "haiku4.5": "anthropic-foundry/claude-haiku-4-5",
     "gpt5": "azure-foundry/gpt-5.3-codex",
     "gpt5.3": "azure-foundry/gpt-5.3-codex",
+    "gpt5.4": "azure-foundry/gpt-5.4",
     "kimi": "azure-foundry/Kimi-K2.5",
     "gpt4": "gpt-4.1",
     "gpt4.1": "gpt-4.1",
diff --git a/openplanter-desktop/crates/op-core/src/config.rs b/openplanter-desktop/crates/op-core/src/config.rs
index e75b21a1..0d09b42f 100644
--- a/openplanter-desktop/crates/op-core/src/config.rs
+++ b/openplanter-desktop/crates/op-core/src/config.rs
@@ -272,8 +272,10 @@ impl AgentConfig {
     pub fn from_env(workspace: impl AsRef<Path>) -> Self {
         let ws = dunce_canonicalize(workspace.as_ref());
 
-        let openai_api_key =
-            env_opt("OPENPLANTER_OPENAI_API_KEY").or_else(|| env_opt("OPENAI_API_KEY"));
+        let openai_api_key = env_opt("OPENPLANTER_OPENAI_API_KEY")
+            .or_else(|| env_opt("OPENAI_API_KEY"))
+            .or_else(|| env_opt("OPENPLANTER_OPENAI_OAUTH_TOKEN"))
+            .or_else(|| env_opt("OPENAI_OAUTH_TOKEN"));
 
         let anthropic_api_key =
             env_opt("OPENPLANTER_ANTHROPIC_API_KEY").or_else(|| env_opt("ANTHROPIC_API_KEY"));
diff --git a/openplanter-desktop/crates/op-core/src/credentials.rs b/openplanter-desktop/crates/op-core/src/credentials.rs
index d7ce3e52..32ef2d53 100644
--- a/openplanter-desktop/crates/op-core/src/credentials.rs
+++ b/openplanter-desktop/crates/op-core/src/credentials.rs
@@ -13,6 +13,7 @@ use serde::{Deserialize, Serialize};
 #[derive(Debug, Clone, Default, Serialize, Deserialize)]
 pub struct CredentialBundle {
     pub openai_api_key: Option<String>,
+    pub openai_oauth_token: Option<String>,
     pub anthropic_api_key: Option<String>,
     pub openrouter_api_key: Option<String>,
     pub cerebras_api_key: Option<String>,
@@ -28,6 +29,7 @@ impl CredentialBundle {
     pub fn has_any(&self) -> bool {
         let keys: [&Option<String>; 9] = [
             &self.openai_api_key,
+            &self.openai_oauth_token,
             &self.anthropic_api_key,
             &self.openrouter_api_key,
             &self.cerebras_api_key,
@@ -51,6 +53,7 @@ impl CredentialBundle {
             };
         }
         fill!(openai_api_key);
+        fill!(openai_oauth_token);
         fill!(anthropic_api_key);
         fill!(openrouter_api_key);
         fill!(cerebras_api_key);
@@ -72,6 +75,7 @@ impl CredentialBundle {
             };
         }
         add!(openai_api_key, "openai_api_key");
+        add!(openai_oauth_token, "openai_oauth_token");
         add!(anthropic_api_key, "anthropic_api_key");
         add!(openrouter_api_key, "openrouter_api_key");
         add!(cerebras_api_key, "cerebras_api_key");
@@ -93,6 +97,7 @@ impl CredentialBundle {
         }
         Self {
             openai_api_key: get_str(payload, "openai_api_key"),
+            openai_oauth_token: get_str(payload, "openai_oauth_token"),
             anthropic_api_key: get_str(payload, "anthropic_api_key"),
             openrouter_api_key: get_str(payload, "openrouter_api_key"),
             cerebras_api_key: get_str(payload, "cerebras_api_key"),
@@ -148,6 +153,7 @@ pub fn parse_env_file(path: &Path) -> CredentialBundle {
 
     CredentialBundle {
         openai_api_key: get_key(&env_map, "OPENAI_API_KEY", "OPENPLANTER_OPENAI_API_KEY"),
+        openai_oauth_token: get_key(&env_map, "OPENAI_OAUTH_TOKEN", "OPENPLANTER_OPENAI_OAUTH_TOKEN"),
         anthropic_api_key: get_key(
             &env_map,
             "ANTHROPIC_API_KEY",
@@ -183,6 +189,7 @@ pub fn credentials_from_env() -> CredentialBundle {
 
     CredentialBundle {
         openai_api_key: env_key("OPENPLANTER_OPENAI_API_KEY", "OPENAI_API_KEY"),
+        openai_oauth_token: env_key("OPENPLANTER_OPENAI_OAUTH_TOKEN", "OPENAI_OAUTH_TOKEN"),
         anthropic_api_key: env_key("OPENPLANTER_ANTHROPIC_API_KEY", "ANTHROPIC_API_KEY"),
         openrouter_api_key: env_key("OPENPLANTER_OPENROUTER_API_KEY", "OPENROUTER_API_KEY"),
         cerebras_api_key: env_key("OPENPLANTER_CEREBRAS_API_KEY", "CEREBRAS_API_KEY"),
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/config.rs b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
index 7224456c..93d0a009 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/config.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
@@ -102,6 +102,7 @@ fn known_models_for_provider(provider: &str) -> Vec<ModelInfo> {
     let models: Vec<(&str, &str)> = match provider {
         "openai" => vec![
             ("azure-foundry/gpt-5.3-codex", "GPT-5.3 Codex (Foundry)"),
+            ("azure-foundry/gpt-5.4", "GPT-5.4 (Foundry)"),
             ("azure-foundry/Kimi-K2.5", "Kimi K2.5 (Foundry)"),
         ],
         "anthropic" => vec![
@@ -215,7 +216,9 @@ pub async fn get_credentials_status(
     let mut status = HashMap::new();
     status.insert(
         "openai".to_string(),
-        cfg.openai_api_key.is_some() || env_creds.openai_api_key.is_some(),
+        cfg.openai_api_key.is_some()
+            || env_creds.openai_api_key.is_some()
+            || env_creds.openai_oauth_token.is_some(),
     );
     status.insert(
         "anthropic".to_string(),
diff --git a/openplanter-desktop/crates/op-tauri/src/state.rs b/openplanter-desktop/crates/op-tauri/src/state.rs
index 387bb719..f8869196 100644
--- a/openplanter-desktop/crates/op-tauri/src/state.rs
+++ b/openplanter-desktop/crates/op-tauri/src/state.rs
@@ -43,6 +43,15 @@ pub fn merge_credentials_into_config(
     env_creds: &CredentialBundle,
     file_creds: &CredentialBundle,
 ) {
+    if cfg.openai_api_key.is_none() {
+        cfg.openai_api_key = env_creds
+            .openai_api_key
+            .clone()
+            .or_else(|| env_creds.openai_oauth_token.clone())
+            .or_else(|| file_creds.openai_api_key.clone())
+            .or_else(|| file_creds.openai_oauth_token.clone());
+    }
+
     macro_rules! merge {
         ($field:ident) => {
             if cfg.$field.is_none() {
@@ -53,7 +62,6 @@ pub fn merge_credentials_into_config(
             }
         };
     }
-    merge!(openai_api_key);
     merge!(anthropic_api_key);
     merge!(openrouter_api_key);
     merge!(cerebras_api_key);
diff --git a/openplanter-desktop/frontend/src/commands/model.test.ts b/openplanter-desktop/frontend/src/commands/model.test.ts
index f98dfb86..31eacdd6 100644
--- a/openplanter-desktop/frontend/src/commands/model.test.ts
+++ b/openplanter-desktop/frontend/src/commands/model.test.ts
@@ -66,6 +66,10 @@ describe("MODEL_ALIASES", () => {
     expect(MODEL_ALIASES["gpt5"]).toBe("azure-foundry/gpt-5.3-codex");
   });
 
+  it("gpt-5.4 alias", () => {
+    expect(MODEL_ALIASES["gpt-5.4"]).toBe("azure-foundry/gpt-5.4");
+  });
+
   it("zai alias", () => {
     expect(MODEL_ALIASES["zai"]).toBe("glm-5");
   });
diff --git a/openplanter-desktop/frontend/src/commands/model.ts b/openplanter-desktop/frontend/src/commands/model.ts
index 45f7016d..68b45bab 100644
--- a/openplanter-desktop/frontend/src/commands/model.ts
+++ b/openplanter-desktop/frontend/src/commands/model.ts
@@ -14,6 +14,8 @@ export const MODEL_ALIASES: Record<string, string> = {
   gpt5: "azure-foundry/gpt-5.3-codex",
   "gpt-5": "azure-foundry/gpt-5.3-codex",
   "gpt-5.3": "azure-foundry/gpt-5.3-codex",
+  gpt54: "azure-foundry/gpt-5.4",
+  "gpt-5.4": "azure-foundry/gpt-5.4",
   kimi: "azure-foundry/Kimi-K2.5",
   gpt4o: "gpt-4o",
   "gpt-4o": "gpt-4o",
diff --git a/tests/test_credentials.py b/tests/test_credentials.py
index 005acf47..6d729824 100644
--- a/tests/test_credentials.py
+++ b/tests/test_credentials.py
@@ -20,6 +20,7 @@ def test_parse_env_file_extracts_supported_keys(self) -> None:
                 "\n".join(
                     [
                         "OPENAI_API_KEY=oa-key",
+                        "OPENAI_OAUTH_TOKEN=oauth-token",
                         "ANTHROPIC_API_KEY=an-key",
                         "OPENROUTER_API_KEY=or-key",
                         "ZAI_API_KEY=zai-key",
@@ -32,6 +33,7 @@ def test_parse_env_file_extracts_supported_keys(self) -> None:
             )
             creds = parse_env_file(env_path)
             self.assertEqual(creds.openai_api_key, "oa-key")
+            self.assertEqual(creds.openai_oauth_token, "oauth-token")
             self.assertEqual(creds.anthropic_api_key, "an-key")
             self.assertEqual(creds.openrouter_api_key, "or-key")
             self.assertEqual(creds.zai_api_key, "zai-key")
@@ -45,6 +47,7 @@ def test_store_roundtrip(self) -> None:
             store = CredentialStore(workspace=root, session_root_dir=".openplanter")
             creds = CredentialBundle(
                 openai_api_key="oa",
+                openai_oauth_token="oauth",
                 anthropic_api_key="an",
                 openrouter_api_key="or",
                 zai_api_key="zai",

From bfd94e2a4ec65d40aea54795376ff9bf948c1cb3 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Thu, 12 Mar 2026 12:00:58 -0400
Subject: [PATCH 06/58] Add GPT-5.4 defaults and OAuth parity

---
 README.md                                     |   3 +-
 agent/__main__.py                             |  20 +++-
 agent/builder.py                              |  24 +++-
 agent/config.py                               |  39 +++++--
 agent/tui.py                                  |   5 +-
 .../crates/op-core/src/builder.rs             |  28 +++--
 .../crates/op-core/src/config.rs              | 104 ++++++++++++++----
 .../crates/op-core/src/credentials.rs         |   6 +-
 .../crates/op-core/src/model/openai.rs        |   6 +-
 .../op-core/tests/test_model_streaming.rs     |   6 +-
 .../crates/op-tauri/src/commands/config.rs    |  47 +++++++-
 .../crates/op-tauri/src/state.rs              |  72 +++++++++++-
 .../frontend/src/api/invoke.test.ts           |  14 +--
 .../frontend/src/commands/model.test.ts       |  41 ++++++-
 .../frontend/src/commands/model.ts            |   7 +-
 tests/test_coverage_gaps.py                   |  23 +++-
 tests/test_model.py                           |   4 +-
 tests/test_settings.py                        |   2 +-
 18 files changed, 367 insertions(+), 84 deletions(-)

diff --git a/README.md b/README.md
index 68fbffc3..e2fef280 100644
--- a/README.md
+++ b/README.md
@@ -84,7 +84,7 @@ The container mounts `./workspace` as the agent's working directory.
 
 | Provider | Default Model | Env Var |
 |----------|---------------|---------|
-| OpenAI | `azure-foundry/gpt-5.3-codex` | `OPENAI_API_KEY` or `OPENAI_OAUTH_TOKEN` |
+| OpenAI | `azure-foundry/gpt-5.4` | `OPENAI_API_KEY` or `OPENAI_OAUTH_TOKEN` |
 | Anthropic | `anthropic-foundry/claude-opus-4-6` | `ANTHROPIC_API_KEY` |
 | OpenRouter | `anthropic/claude-sonnet-4-5` | `OPENROUTER_API_KEY` |
 | Cerebras | `qwen-3-235b-a22b-instruct-2507` | `CEREBRAS_API_KEY` |
@@ -189,6 +189,7 @@ openplanter-agent [options]
 |------|-------------|
 | `--provider NAME` | `auto`, `openai`, `anthropic`, `openrouter`, `cerebras`, `zai`, `ollama` |
 | `--model NAME` | Model name or `newest` to auto-select |
+| `--openai-oauth-token TOKEN` | ChatGPT Plus/Teams/Pro OAuth bearer token for OpenAI-compatible models |
 | `--zai-plan PLAN` | Z.AI endpoint plan: `paygo` or `coding` |
 | `--reasoning-effort LEVEL` | `low`, `medium`, `high`, or `none` |
 | `--list-models` | Fetch available models from the provider API |
diff --git a/agent/__main__.py b/agent/__main__.py
index bf07fd29..07d5b3d2 100644
--- a/agent/__main__.py
+++ b/agent/__main__.py
@@ -358,8 +358,12 @@ def _apply_runtime_overrides(cfg: AgentConfig, args: argparse.Namespace, creds:
         cfg.provider = args.provider
     cfg.provider = _resolve_provider(cfg.provider, creds)
 
-    effective_openai_key = creds.openai_api_key or creds.openai_oauth_token
-    cfg.openai_api_key = resolve_openai_api_key(effective_openai_key, cfg.openai_base_url)
+    cfg.openai_oauth_token = (creds.openai_oauth_token or "").strip() or None
+    cfg.openai_api_key = resolve_openai_api_key(
+        creds.openai_api_key,
+        cfg.openai_base_url,
+        cfg.openai_oauth_token,
+    )
     cfg.anthropic_api_key = resolve_anthropic_api_key(
         creds.anthropic_api_key,
         cfg.anthropic_base_url,
@@ -396,12 +400,20 @@ def _apply_runtime_overrides(cfg: AgentConfig, args: argparse.Namespace, creds:
             cfg.ollama_base_url = args.base_url
         cfg.base_url = args.base_url
 
-    cfg.openai_api_key = resolve_openai_api_key(cfg.openai_api_key, cfg.openai_base_url)
+    cfg.openai_api_key = resolve_openai_api_key(
+        cfg.openai_api_key,
+        cfg.openai_base_url,
+        cfg.openai_oauth_token,
+    )
     cfg.anthropic_api_key = resolve_anthropic_api_key(
         cfg.anthropic_api_key,
         cfg.anthropic_base_url,
     )
-    cfg.api_key = resolve_openai_api_key(cfg.api_key, cfg.base_url)
+    cfg.api_key = resolve_openai_api_key(
+        cfg.api_key,
+        cfg.base_url,
+        cfg.openai_oauth_token,
+    )
 
     if args.model:
         cfg.model = args.model
diff --git a/agent/builder.py b/agent/builder.py
index 89671221..7d7044ac 100644
--- a/agent/builder.py
+++ b/agent/builder.py
@@ -83,9 +83,17 @@ def _validate_model_provider(model_name: str, provider: str) -> None:
 
 def _fetch_models_for_provider(cfg: AgentConfig, provider: str) -> list[dict]:
     if provider == "openai":
-        api_key = resolve_openai_api_key(cfg.openai_api_key, cfg.openai_base_url)
+        api_key = resolve_openai_api_key(
+            cfg.openai_api_key,
+            cfg.openai_base_url,
+            cfg.openai_oauth_token,
+        )
         if not api_key:
-            raise ModelError("OpenAI key not configured.")
+            raise ModelError(
+                "OpenAI auth not configured. Set OPENAI_API_KEY, "
+                "OPENPLANTER_OPENAI_API_KEY, OPENAI_OAUTH_TOKEN, "
+                "or OPENPLANTER_OPENAI_OAUTH_TOKEN."
+            )
         models = list_openai_models(api_key=api_key, base_url=cfg.openai_base_url)
         if is_foundry_openai_base_url(cfg.openai_base_url):
             return [
@@ -148,7 +156,11 @@ def _resolve_model_name(cfg: AgentConfig) -> str:
 
 def build_model_factory(cfg: AgentConfig) -> ModelFactory | None:
     """Return a factory that creates models by name + optional reasoning effort."""
-    openai_api_key = resolve_openai_api_key(cfg.openai_api_key, cfg.openai_base_url)
+    openai_api_key = resolve_openai_api_key(
+        cfg.openai_api_key,
+        cfg.openai_base_url,
+        cfg.openai_oauth_token,
+    )
     anthropic_api_key = resolve_anthropic_api_key(cfg.anthropic_api_key, cfg.anthropic_base_url)
 
     def _factory(model_name: str, reasoning_effort: str | None = None) -> AnthropicModel | OpenAICompatibleModel:
@@ -247,7 +259,11 @@ def build_engine(cfg: AgentConfig) -> RLMEngine:
 
     _validate_model_provider(model_name, cfg.provider)
 
-    openai_api_key = resolve_openai_api_key(cfg.openai_api_key, cfg.openai_base_url)
+    openai_api_key = resolve_openai_api_key(
+        cfg.openai_api_key,
+        cfg.openai_base_url,
+        cfg.openai_oauth_token,
+    )
     anthropic_api_key = resolve_anthropic_api_key(cfg.anthropic_api_key, cfg.anthropic_base_url)
 
     if cfg.provider == "openai" and openai_api_key:
diff --git a/agent/config.py b/agent/config.py
index 50290176..6a0e0f9c 100644
--- a/agent/config.py
+++ b/agent/config.py
@@ -14,7 +14,7 @@
 ZAI_CODING_BASE_URL = "https://api.z.ai/api/coding/paas/v4"
 
 PROVIDER_DEFAULT_MODELS: dict[str, str] = {
-    "openai": "azure-foundry/gpt-5.3-codex",
+    "openai": "azure-foundry/gpt-5.4",
     "anthropic": "anthropic-foundry/claude-opus-4-6",
     "openrouter": "anthropic/claude-sonnet-4-5",
     "cerebras": "qwen-3-235b-a22b-instruct-2507",
@@ -50,12 +50,19 @@ def is_foundry_anthropic_base_url(url: str) -> bool:
     return _normalize_base_url(url) == FOUNDRY_ANTHROPIC_BASE_URL
 
 
-def resolve_openai_api_key(api_key: str | None, base_url: str) -> str | None:
+def resolve_openai_api_key(
+    api_key: str | None,
+    base_url: str,
+    openai_oauth_token: str | None = None,
+) -> str | None:
     key = (api_key or "").strip() or None
-    if key == FOUNDRY_OPENAI_API_KEY_PLACEHOLDER and not is_foundry_openai_base_url(base_url):
-        return None
+    if key == FOUNDRY_OPENAI_API_KEY_PLACEHOLDER:
+        key = None
     if key:
         return key
+    token = (openai_oauth_token or "").strip() or None
+    if token:
+        return token
     if is_foundry_openai_base_url(base_url):
         return FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
     return None
@@ -106,6 +113,7 @@ class AgentConfig:
     firecrawl_base_url: str = "https://api.firecrawl.dev/v1"
     brave_base_url: str = "https://api.search.brave.com/res/v1"
     openai_api_key: str | None = None
+    openai_oauth_token: str | None = None
     anthropic_api_key: str | None = None
     openrouter_api_key: str | None = None
     cerebras_api_key: str | None = None
@@ -140,11 +148,19 @@ class AgentConfig:
     demo: bool = False
 
     def __post_init__(self) -> None:
-        self.openai_api_key = resolve_openai_api_key(self.openai_api_key, self.openai_base_url)
+        self.openai_api_key = resolve_openai_api_key(
+            self.openai_api_key,
+            self.openai_base_url,
+            self.openai_oauth_token,
+        )
         self.anthropic_api_key = resolve_anthropic_api_key(
             self.anthropic_api_key, self.anthropic_base_url
         )
-        self.api_key = resolve_openai_api_key(self.api_key, self.base_url)
+        self.api_key = resolve_openai_api_key(
+            self.api_key,
+            self.base_url,
+            self.openai_oauth_token,
+        )
 
     @classmethod
     def from_env(cls, workspace: str | Path) -> "AgentConfig":
@@ -153,6 +169,10 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             os.getenv("OPENPLANTER_OPENAI_API_KEY")
             or os.getenv("OPENAI_API_KEY")
         )
+        openai_oauth_token = (
+            os.getenv("OPENPLANTER_OPENAI_OAUTH_TOKEN")
+            or os.getenv("OPENAI_OAUTH_TOKEN")
+        )
         anthropic_api_key = os.getenv("OPENPLANTER_ANTHROPIC_API_KEY") or os.getenv("ANTHROPIC_API_KEY")
         openrouter_api_key = os.getenv("OPENPLANTER_OPENROUTER_API_KEY") or os.getenv("OPENROUTER_API_KEY")
         cerebras_api_key = os.getenv("OPENPLANTER_CEREBRAS_API_KEY") or os.getenv("CEREBRAS_API_KEY")
@@ -169,7 +189,11 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             "OPENPLANTER_ANTHROPIC_BASE_URL",
             FOUNDRY_ANTHROPIC_BASE_URL,
         )
-        openai_api_key = resolve_openai_api_key(openai_api_key, openai_base_url)
+        openai_api_key = resolve_openai_api_key(
+            openai_api_key,
+            openai_base_url,
+            openai_oauth_token,
+        )
         anthropic_api_key = resolve_anthropic_api_key(anthropic_api_key, anthropic_base_url)
         zai_plan = normalize_zai_plan(os.getenv("OPENPLANTER_ZAI_PLAN", "paygo"))
         zai_paygo_base_url = os.getenv("OPENPLANTER_ZAI_PAYGO_BASE_URL", ZAI_PAYGO_BASE_URL)
@@ -206,6 +230,7 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             firecrawl_base_url=os.getenv("OPENPLANTER_FIRECRAWL_BASE_URL", "https://api.firecrawl.dev/v1"),
             brave_base_url=os.getenv("OPENPLANTER_BRAVE_BASE_URL", "https://api.search.brave.com/res/v1"),
             openai_api_key=openai_api_key,
+            openai_oauth_token=(openai_oauth_token or "").strip() or None,
             anthropic_api_key=anthropic_api_key,
             openrouter_api_key=openrouter_api_key,
             cerebras_api_key=cerebras_api_key,
diff --git a/agent/tui.py b/agent/tui.py
index 05a64740..e5f37152 100644
--- a/agent/tui.py
+++ b/agent/tui.py
@@ -116,9 +116,12 @@ def _build_splash() -> str:
     "sonnet4.6": "anthropic-foundry/claude-sonnet-4-6",
     "haiku": "anthropic-foundry/claude-haiku-4-5",
     "haiku4.5": "anthropic-foundry/claude-haiku-4-5",
-    "gpt5": "azure-foundry/gpt-5.3-codex",
+    "gpt5": "azure-foundry/gpt-5.4",
+    "gpt-5": "azure-foundry/gpt-5.4",
     "gpt5.3": "azure-foundry/gpt-5.3-codex",
+    "gpt-5.3": "azure-foundry/gpt-5.3-codex",
     "gpt5.4": "azure-foundry/gpt-5.4",
+    "gpt-5.4": "azure-foundry/gpt-5.4",
     "kimi": "azure-foundry/Kimi-K2.5",
     "gpt4": "gpt-4.1",
     "gpt4.1": "gpt-4.1",
diff --git a/openplanter-desktop/crates/op-core/src/builder.rs b/openplanter-desktop/crates/op-core/src/builder.rs
index 786e4c10..6bfab8a1 100644
--- a/openplanter-desktop/crates/op-core/src/builder.rs
+++ b/openplanter-desktop/crates/op-core/src/builder.rs
@@ -170,10 +170,11 @@ pub fn resolve_endpoint(cfg: &AgentConfig, provider: &str) -> Result<(String, St
             let key = resolve_openai_api_key(
                 cfg.openai_api_key.clone().or_else(|| cfg.api_key.clone()),
                 &cfg.openai_base_url,
+                cfg.openai_oauth_token.clone(),
             )
             .ok_or_else(|| {
                 ModelError::Message(
-                    "No OpenAI API key. Set OPENAI_API_KEY or OPENPLANTER_OPENAI_API_KEY.".into(),
+                    "No OpenAI auth configured. Set OPENAI_API_KEY, OPENPLANTER_OPENAI_API_KEY, OPENAI_OAUTH_TOKEN, or OPENPLANTER_OPENAI_OAUTH_TOKEN.".into(),
                 )
             })?;
             Ok((cfg.openai_base_url.clone(), key))
@@ -303,7 +304,7 @@ mod tests {
     fn test_infer_openai() {
         assert_eq!(infer_provider_for_model("gpt-5.2"), Some("openai"));
         assert_eq!(
-            infer_provider_for_model("azure-foundry/gpt-5.3-codex"),
+            infer_provider_for_model("azure-foundry/gpt-5.4"),
             Some("openai")
         );
         assert_eq!(infer_provider_for_model("o1-preview"), Some("openai"));
@@ -382,14 +383,11 @@ mod tests {
     #[test]
     fn test_resolve_model_name_explicit() {
         let cfg = AgentConfig {
-            model: "azure-foundry/gpt-5.3-codex".into(),
+            model: "azure-foundry/gpt-5.4".into(),
             provider: "openai".into(),
             ..Default::default()
         };
-        assert_eq!(
-            resolve_model_name(&cfg).unwrap(),
-            "azure-foundry/gpt-5.3-codex"
-        );
+        assert_eq!(resolve_model_name(&cfg).unwrap(), "azure-foundry/gpt-5.4");
     }
 
     #[test]
@@ -399,10 +397,7 @@ mod tests {
             provider: "openai".into(),
             ..Default::default()
         };
-        assert_eq!(
-            resolve_model_name(&cfg).unwrap(),
-            "azure-foundry/gpt-5.3-codex"
-        );
+        assert_eq!(resolve_model_name(&cfg).unwrap(), "azure-foundry/gpt-5.4");
     }
 
     // ── resolve_provider ──
@@ -530,6 +525,17 @@ mod tests {
         assert_eq!(key, "sk-openai");
     }
 
+    #[test]
+    fn test_resolve_endpoint_openai_uses_oauth_token_when_api_key_missing() {
+        let cfg = AgentConfig {
+            openai_api_key: Some(crate::config::FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.into()),
+            openai_oauth_token: Some("oauth-token".into()),
+            ..Default::default()
+        };
+        let (_, key) = resolve_endpoint(&cfg, "openai").unwrap();
+        assert_eq!(key, "oauth-token");
+    }
+
     #[test]
     fn test_resolve_endpoint_zai() {
         let cfg = AgentConfig {
diff --git a/openplanter-desktop/crates/op-core/src/config.rs b/openplanter-desktop/crates/op-core/src/config.rs
index 0d09b42f..015acca8 100644
--- a/openplanter-desktop/crates/op-core/src/config.rs
+++ b/openplanter-desktop/crates/op-core/src/config.rs
@@ -20,7 +20,7 @@ pub const BRAVE_BASE_URL: &str = "https://api.search.brave.com/res/v1";
 pub static PROVIDER_DEFAULT_MODELS: LazyLock<HashMap<&'static str, &'static str>> =
     LazyLock::new(|| {
         HashMap::from([
-            ("openai", "azure-foundry/gpt-5.3-codex"),
+            ("openai", "azure-foundry/gpt-5.4"),
             ("anthropic", "anthropic-foundry/claude-opus-4-6"),
             ("openrouter", "anthropic/claude-sonnet-4-5"),
             ("cerebras", "qwen-3-235b-a22b-instruct-2507"),
@@ -93,19 +93,42 @@ pub fn is_foundry_anthropic_base_url(value: &str) -> bool {
     normalize_base_url(value) == FOUNDRY_ANTHROPIC_BASE_URL
 }
 
-pub fn resolve_openai_api_key(api_key: Option<String>, base_url: &str) -> Option<String> {
+pub fn has_real_openai_api_key(api_key: Option<&str>) -> bool {
+    api_key
+        .map(str::trim)
+        .filter(|value| !value.is_empty())
+        .is_some_and(|value| value != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER)
+}
+
+pub fn has_openai_auth(api_key: Option<&str>, openai_oauth_token: Option<&str>) -> bool {
+    has_real_openai_api_key(api_key)
+        || openai_oauth_token
+            .map(str::trim)
+            .filter(|value| !value.is_empty())
+            .is_some()
+}
+
+pub fn resolve_openai_api_key(
+    api_key: Option<String>,
+    base_url: &str,
+    openai_oauth_token: Option<String>,
+) -> Option<String> {
     let normalized = api_key
         .as_deref()
         .map(str::trim)
         .filter(|value| !value.is_empty())
         .map(str::to_string);
-    if normalized.as_deref() == Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER)
-        && !is_foundry_openai_base_url(base_url)
-    {
-        return None;
+    let real_key = normalized.filter(|value| value != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER);
+    if real_key.is_some() {
+        return real_key;
     }
-    if normalized.is_some() {
-        return normalized;
+    let token = openai_oauth_token
+        .as_deref()
+        .map(str::trim)
+        .filter(|value| !value.is_empty())
+        .map(str::to_string);
+    if token.is_some() {
+        return token;
     }
     if is_foundry_openai_base_url(base_url) {
         return Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.to_string());
@@ -173,6 +196,7 @@ pub struct AgentConfig {
     // API keys
     pub api_key: Option<String>,
     pub openai_api_key: Option<String>,
+    pub openai_oauth_token: Option<String>,
     pub anthropic_api_key: Option<String>,
     pub openrouter_api_key: Option<String>,
     pub cerebras_api_key: Option<String>,
@@ -231,6 +255,7 @@ impl Default for AgentConfig {
             brave_base_url: BRAVE_BASE_URL.into(),
             api_key: Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.into()),
             openai_api_key: Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.into()),
+            openai_oauth_token: None,
             anthropic_api_key: Some(FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER.into()),
             openrouter_api_key: None,
             cerebras_api_key: None,
@@ -272,10 +297,10 @@ impl AgentConfig {
     pub fn from_env(workspace: impl AsRef<Path>) -> Self {
         let ws = dunce_canonicalize(workspace.as_ref());
 
-        let openai_api_key = env_opt("OPENPLANTER_OPENAI_API_KEY")
-            .or_else(|| env_opt("OPENAI_API_KEY"))
-            .or_else(|| env_opt("OPENPLANTER_OPENAI_OAUTH_TOKEN"))
-            .or_else(|| env_opt("OPENAI_OAUTH_TOKEN"));
+        let openai_api_key =
+            env_opt("OPENPLANTER_OPENAI_API_KEY").or_else(|| env_opt("OPENAI_API_KEY"));
+        let openai_oauth_token =
+            env_opt("OPENPLANTER_OPENAI_OAUTH_TOKEN").or_else(|| env_opt("OPENAI_OAUTH_TOKEN"));
 
         let anthropic_api_key =
             env_opt("OPENPLANTER_ANTHROPIC_API_KEY").or_else(|| env_opt("ANTHROPIC_API_KEY"));
@@ -303,7 +328,8 @@ impl AgentConfig {
             .unwrap_or_else(|| FOUNDRY_OPENAI_BASE_URL.into());
         let anthropic_base_url =
             env_or("OPENPLANTER_ANTHROPIC_BASE_URL", FOUNDRY_ANTHROPIC_BASE_URL);
-        let openai_api_key = resolve_openai_api_key(openai_api_key, &openai_base_url);
+        let openai_api_key =
+            resolve_openai_api_key(openai_api_key, &openai_base_url, openai_oauth_token.clone());
         let anthropic_api_key = resolve_anthropic_api_key(anthropic_api_key, &anthropic_base_url);
 
         let reasoning_effort_raw = env_or("OPENPLANTER_REASONING_EFFORT", "high")
@@ -360,6 +386,7 @@ impl AgentConfig {
             ),
             brave_base_url: env_or("OPENPLANTER_BRAVE_BASE_URL", BRAVE_BASE_URL),
             openai_api_key,
+            openai_oauth_token,
             anthropic_api_key,
             openrouter_api_key,
             cerebras_api_key,
@@ -461,7 +488,7 @@ mod tests {
     fn test_provider_default_models() {
         assert_eq!(
             PROVIDER_DEFAULT_MODELS.get("openai"),
-            Some(&"azure-foundry/gpt-5.3-codex")
+            Some(&"azure-foundry/gpt-5.4")
         );
         assert_eq!(
             PROVIDER_DEFAULT_MODELS.get("anthropic"),
@@ -489,6 +516,8 @@ mod tests {
             "OPENPLANTER_REASONING_EFFORT",
             "OPENPLANTER_OPENAI_API_KEY",
             "OPENAI_API_KEY",
+            "OPENPLANTER_OPENAI_OAUTH_TOKEN",
+            "OPENAI_OAUTH_TOKEN",
             "OPENPLANTER_OPENAI_BASE_URL",
             "OPENPLANTER_BASE_URL",
             "OPENPLANTER_ANTHROPIC_API_KEY",
@@ -550,7 +579,7 @@ mod tests {
         unsafe {
             // --- Phase 2: test custom values ---
             env::set_var("OPENPLANTER_PROVIDER", "openai");
-            env::set_var("OPENPLANTER_MODEL", "azure-foundry/gpt-5.3-codex");
+            env::set_var("OPENPLANTER_MODEL", "azure-foundry/gpt-5.4");
             env::set_var("OPENPLANTER_REASONING_EFFORT", "low");
             env::set_var("OPENPLANTER_MAX_DEPTH", "8");
             env::set_var("OPENPLANTER_RECURSIVE", "false");
@@ -569,7 +598,7 @@ mod tests {
 
         let cfg = AgentConfig::from_env("/tmp");
         assert_eq!(cfg.provider, "openai");
-        assert_eq!(cfg.model, "azure-foundry/gpt-5.3-codex");
+        assert_eq!(cfg.model, "azure-foundry/gpt-5.4");
         assert_eq!(cfg.reasoning_effort, Some("low".into()));
         assert_eq!(cfg.max_depth, 8);
         assert!(!cfg.recursive);
@@ -587,6 +616,25 @@ mod tests {
         assert_eq!(cfg.rate_limit_retry_after_cap_sec, 90.0);
 
         // Restore original values
+        unsafe {
+            env::remove_var("OPENAI_API_KEY");
+            env::set_var("OPENAI_OAUTH_TOKEN", "oauth-token");
+        }
+
+        let cfg = AgentConfig::from_env("/tmp");
+        assert_eq!(cfg.openai_oauth_token.as_deref(), Some("oauth-token"));
+        assert_eq!(cfg.openai_api_key.as_deref(), Some("oauth-token"));
+        assert_eq!(cfg.api_key.as_deref(), Some("oauth-token"));
+
+        unsafe {
+            env::set_var("OPENAI_API_KEY", "sk-test456");
+        }
+
+        let cfg = AgentConfig::from_env("/tmp");
+        assert_eq!(cfg.openai_oauth_token.as_deref(), Some("oauth-token"));
+        assert_eq!(cfg.openai_api_key.as_deref(), Some("sk-test456"));
+        assert_eq!(cfg.api_key.as_deref(), Some("sk-test456"));
+
         for (k, v) in saved {
             unsafe {
                 match v {
@@ -614,16 +662,34 @@ mod tests {
         assert!(is_foundry_openai_base_url(FOUNDRY_OPENAI_BASE_URL));
         assert!(is_foundry_anthropic_base_url(FOUNDRY_ANTHROPIC_BASE_URL));
         assert_eq!(
-            resolve_openai_api_key(None, FOUNDRY_OPENAI_BASE_URL).as_deref(),
+            resolve_openai_api_key(None, FOUNDRY_OPENAI_BASE_URL, None).as_deref(),
             Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER)
         );
+        assert_eq!(
+            resolve_openai_api_key(
+                Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.to_string()),
+                FOUNDRY_OPENAI_BASE_URL,
+                Some("oauth-token".to_string()),
+            )
+            .as_deref(),
+            Some("oauth-token")
+        );
+        assert_eq!(
+            resolve_openai_api_key(
+                Some("sk-openai".to_string()),
+                FOUNDRY_OPENAI_BASE_URL,
+                Some("oauth-token".to_string()),
+            )
+            .as_deref(),
+            Some("sk-openai")
+        );
         assert_eq!(
             resolve_anthropic_api_key(None, FOUNDRY_ANTHROPIC_BASE_URL).as_deref(),
             Some(FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER)
         );
         assert_eq!(
-            strip_foundry_model_prefix("azure-foundry/gpt-5.3-codex"),
-            "gpt-5.3-codex"
+            strip_foundry_model_prefix("azure-foundry/gpt-5.4"),
+            "gpt-5.4"
         );
         assert_eq!(
             strip_foundry_model_prefix("anthropic-foundry/claude-opus-4-6"),
diff --git a/openplanter-desktop/crates/op-core/src/credentials.rs b/openplanter-desktop/crates/op-core/src/credentials.rs
index 32ef2d53..44174c5b 100644
--- a/openplanter-desktop/crates/op-core/src/credentials.rs
+++ b/openplanter-desktop/crates/op-core/src/credentials.rs
@@ -153,7 +153,11 @@ pub fn parse_env_file(path: &Path) -> CredentialBundle {
 
     CredentialBundle {
         openai_api_key: get_key(&env_map, "OPENAI_API_KEY", "OPENPLANTER_OPENAI_API_KEY"),
-        openai_oauth_token: get_key(&env_map, "OPENAI_OAUTH_TOKEN", "OPENPLANTER_OPENAI_OAUTH_TOKEN"),
+        openai_oauth_token: get_key(
+            &env_map,
+            "OPENAI_OAUTH_TOKEN",
+            "OPENPLANTER_OPENAI_OAUTH_TOKEN",
+        ),
         anthropic_api_key: get_key(
             &env_map,
             "ANTHROPIC_API_KEY",
diff --git a/openplanter-desktop/crates/op-core/src/model/openai.rs b/openplanter-desktop/crates/op-core/src/model/openai.rs
index b3fb5ad4..b8b5c20e 100644
--- a/openplanter-desktop/crates/op-core/src/model/openai.rs
+++ b/openplanter-desktop/crates/op-core/src/model/openai.rs
@@ -762,7 +762,7 @@ mod tests {
     fn test_reasoning_model_gpt5() {
         assert!(make_model("gpt-5.2", None).is_reasoning_model());
         assert!(make_model("gpt-5", None).is_reasoning_model());
-        assert!(make_model("azure-foundry/gpt-5.3-codex", None).is_reasoning_model());
+        assert!(make_model("azure-foundry/gpt-5.4", None).is_reasoning_model());
     }
 
     #[test]
@@ -848,12 +848,12 @@ mod tests {
 
     #[test]
     fn test_payload_strips_foundry_prefix() {
-        let model = make_model("azure-foundry/gpt-5.3-codex", Some("high"));
+        let model = make_model("azure-foundry/gpt-5.4", Some("high"));
         let msgs = vec![Message::User {
             content: "Hi".to_string(),
         }];
         let payload = model.build_payload(&msgs, &[], true);
-        assert_eq!(payload["model"], "gpt-5.3-codex");
+        assert_eq!(payload["model"], "gpt-5.4");
     }
 
     #[test]
diff --git a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
index c2ce34c6..ae880264 100644
--- a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
+++ b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
@@ -1007,7 +1007,7 @@ async fn test_solve_missing_key_emits_error() {
         api_key: None,
         openai_api_key: None,
         demo: false,
-        // No API key set
+        // No OpenAI auth set
         ..Default::default()
     };
 
@@ -1016,8 +1016,8 @@ async fn test_solve_missing_key_emits_error() {
 
     let recorded = errors.lock().unwrap().clone();
     assert!(
-        recorded.iter().any(|e| e.contains("API key")),
-        "should emit error about missing API key, got: {:?}",
+        recorded.iter().any(|e| e.contains("OpenAI auth")),
+        "should emit error about missing OpenAI auth, got: {:?}",
         recorded
     );
 }
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/config.rs b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
index 93d0a009..31980a2c 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/config.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
@@ -1,5 +1,7 @@
 use crate::state::AppState;
-use op_core::config::{normalize_web_search_provider, normalize_zai_plan, resolve_zai_base_url};
+use op_core::config::{
+    has_openai_auth, normalize_web_search_provider, normalize_zai_plan, resolve_zai_base_url,
+};
 use op_core::credentials::credentials_from_env;
 use op_core::events::{ConfigView, ModelInfo, PartialConfig};
 use op_core::settings::{PersistentSettings, SettingsStore};
@@ -101,8 +103,8 @@ pub async fn update_config(
 fn known_models_for_provider(provider: &str) -> Vec<ModelInfo> {
     let models: Vec<(&str, &str)> = match provider {
         "openai" => vec![
-            ("azure-foundry/gpt-5.3-codex", "GPT-5.3 Codex (Foundry)"),
             ("azure-foundry/gpt-5.4", "GPT-5.4 (Foundry)"),
+            ("azure-foundry/gpt-5.3-codex", "GPT-5.3 Codex (Foundry)"),
             ("azure-foundry/Kimi-K2.5", "Kimi K2.5 (Foundry)"),
         ],
         "anthropic" => vec![
@@ -193,7 +195,13 @@ pub async fn save_settings(
 /// Build credential status from config: which providers/services have API keys configured.
 pub fn build_credential_status(cfg: &op_core::config::AgentConfig) -> HashMap<String, bool> {
     let mut status = HashMap::new();
-    status.insert("openai".to_string(), cfg.openai_api_key.is_some());
+    status.insert(
+        "openai".to_string(),
+        has_openai_auth(
+            cfg.openai_api_key.as_deref(),
+            cfg.openai_oauth_token.as_deref(),
+        ),
+    );
     status.insert("anthropic".to_string(), cfg.anthropic_api_key.is_some());
     status.insert("openrouter".to_string(), cfg.openrouter_api_key.is_some());
     status.insert("cerebras".to_string(), cfg.cerebras_api_key.is_some());
@@ -216,9 +224,13 @@ pub async fn get_credentials_status(
     let mut status = HashMap::new();
     status.insert(
         "openai".to_string(),
-        cfg.openai_api_key.is_some()
-            || env_creds.openai_api_key.is_some()
-            || env_creds.openai_oauth_token.is_some(),
+        has_openai_auth(
+            cfg.openai_api_key.as_deref(),
+            cfg.openai_oauth_token.as_deref(),
+        ) || has_openai_auth(
+            env_creds.openai_api_key.as_deref(),
+            env_creds.openai_oauth_token.as_deref(),
+        ),
     );
     status.insert(
         "anthropic".to_string(),
@@ -347,6 +359,7 @@ mod tests {
         // Force all keys to None
         let mut cfg = cfg;
         cfg.openai_api_key = None;
+        cfg.openai_oauth_token = None;
         cfg.anthropic_api_key = None;
         cfg.openrouter_api_key = None;
         cfg.cerebras_api_key = None;
@@ -368,6 +381,7 @@ mod tests {
     fn test_cred_status_openai_set() {
         let mut cfg = op_core::config::AgentConfig::from_env("/nonexistent");
         cfg.openai_api_key = Some("sk-test".to_string());
+        cfg.openai_oauth_token = None;
         cfg.anthropic_api_key = None;
         cfg.openrouter_api_key = None;
         cfg.cerebras_api_key = None;
@@ -381,6 +395,7 @@ mod tests {
     fn test_cred_status_anthropic_set() {
         let mut cfg = op_core::config::AgentConfig::from_env("/nonexistent");
         cfg.openai_api_key = None;
+        cfg.openai_oauth_token = None;
         cfg.anthropic_api_key = Some("sk-ant-test".to_string());
         cfg.openrouter_api_key = None;
         cfg.cerebras_api_key = None;
@@ -393,6 +408,7 @@ mod tests {
     fn test_cred_status_ollama_always_true() {
         let mut cfg = op_core::config::AgentConfig::from_env("/nonexistent");
         cfg.openai_api_key = None;
+        cfg.openai_oauth_token = None;
         cfg.anthropic_api_key = None;
         cfg.openrouter_api_key = None;
         cfg.cerebras_api_key = None;
@@ -405,6 +421,7 @@ mod tests {
     fn test_cred_status_all_set() {
         let mut cfg = op_core::config::AgentConfig::from_env("/nonexistent");
         cfg.openai_api_key = Some("k1".to_string());
+        cfg.openai_oauth_token = Some("oauth-token".to_string());
         cfg.anthropic_api_key = Some("k2".to_string());
         cfg.openrouter_api_key = Some("k3".to_string());
         cfg.cerebras_api_key = Some("k4".to_string());
@@ -428,4 +445,22 @@ mod tests {
             "should have 9 entries (6 providers + 3 web services)"
         );
     }
+
+    #[test]
+    fn test_cred_status_openai_oauth_counts_as_configured() {
+        let mut cfg = op_core::config::AgentConfig::from_env("/nonexistent");
+        cfg.openai_api_key = None;
+        cfg.openai_oauth_token = Some("oauth-token".to_string());
+        let status = build_credential_status(&cfg);
+        assert_eq!(status["openai"], true);
+    }
+
+    #[test]
+    fn test_cred_status_openai_placeholder_does_not_count() {
+        let mut cfg = op_core::config::AgentConfig::from_env("/nonexistent");
+        cfg.openai_api_key = Some(op_core::config::FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.to_string());
+        cfg.openai_oauth_token = None;
+        let status = build_credential_status(&cfg);
+        assert_eq!(status["openai"], false);
+    }
 }
diff --git a/openplanter-desktop/crates/op-tauri/src/state.rs b/openplanter-desktop/crates/op-tauri/src/state.rs
index f8869196..7038e7b3 100644
--- a/openplanter-desktop/crates/op-tauri/src/state.rs
+++ b/openplanter-desktop/crates/op-tauri/src/state.rs
@@ -1,5 +1,6 @@
 use op_core::config::{
-    AgentConfig, normalize_web_search_provider, normalize_zai_plan, resolve_zai_base_url,
+    AgentConfig, FOUNDRY_OPENAI_API_KEY_PLACEHOLDER, normalize_web_search_provider,
+    normalize_zai_plan, resolve_openai_api_key, resolve_zai_base_url,
 };
 use op_core::credentials::{
     CredentialBundle, credentials_from_env, discover_env_candidates, parse_env_file,
@@ -43,14 +44,45 @@ pub fn merge_credentials_into_config(
     env_creds: &CredentialBundle,
     file_creds: &CredentialBundle,
 ) {
-    if cfg.openai_api_key.is_none() {
-        cfg.openai_api_key = env_creds
-            .openai_api_key
+    if cfg.openai_oauth_token.is_none() {
+        cfg.openai_oauth_token = env_creds
+            .openai_oauth_token
             .clone()
-            .or_else(|| env_creds.openai_oauth_token.clone())
-            .or_else(|| file_creds.openai_api_key.clone())
             .or_else(|| file_creds.openai_oauth_token.clone());
     }
+    cfg.openai_api_key = cfg
+        .openai_api_key
+        .clone()
+        .filter(|value| {
+            let trimmed = value.trim();
+            !trimmed.is_empty() && trimmed != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
+        })
+        .or_else(|| env_creds.openai_api_key.clone())
+        .or_else(|| file_creds.openai_api_key.clone())
+        .or_else(|| cfg.openai_api_key.clone());
+    cfg.openai_api_key = resolve_openai_api_key(
+        cfg.openai_api_key.clone(),
+        &cfg.openai_base_url,
+        cfg.openai_oauth_token.clone(),
+    );
+    cfg.api_key = resolve_openai_api_key(
+        cfg.openai_api_key
+            .clone()
+            .filter(|value| {
+                let trimmed = value.trim();
+                !trimmed.is_empty() && trimmed != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
+            })
+            .or_else(|| {
+                cfg.api_key.clone().filter(|value| {
+                    let trimmed = value.trim();
+                    !trimmed.is_empty() && trimmed != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
+                })
+            })
+            .or_else(|| cfg.openai_api_key.clone())
+            .or_else(|| cfg.api_key.clone()),
+        &cfg.base_url,
+        cfg.openai_oauth_token.clone(),
+    );
 
     macro_rules! merge {
         ($field:ident) => {
@@ -388,6 +420,7 @@ mod tests {
     fn empty_cfg() -> AgentConfig {
         let mut cfg = AgentConfig::from_env("/nonexistent");
         cfg.openai_api_key = None;
+        cfg.openai_oauth_token = None;
         cfg.anthropic_api_key = None;
         cfg.openrouter_api_key = None;
         cfg.cerebras_api_key = None;
@@ -424,6 +457,33 @@ mod tests {
         assert_eq!(cfg.openai_api_key, Some("existing".to_string()));
     }
 
+    #[test]
+    fn test_merge_prefers_real_openai_key_over_oauth() {
+        let mut cfg = empty_cfg();
+        let env_creds = CredentialBundle {
+            openai_api_key: Some("env-key".to_string()),
+            openai_oauth_token: Some("oauth-token".to_string()),
+            ..Default::default()
+        };
+        merge_credentials_into_config(&mut cfg, &env_creds, &CredentialBundle::default());
+        assert_eq!(cfg.openai_oauth_token, Some("oauth-token".to_string()));
+        assert_eq!(cfg.openai_api_key, Some("env-key".to_string()));
+        assert_eq!(cfg.api_key, Some("env-key".to_string()));
+    }
+
+    #[test]
+    fn test_merge_uses_oauth_when_only_placeholder_exists() {
+        let mut cfg = AgentConfig::default();
+        let env_creds = CredentialBundle {
+            openai_oauth_token: Some("oauth-token".to_string()),
+            ..Default::default()
+        };
+        merge_credentials_into_config(&mut cfg, &env_creds, &CredentialBundle::default());
+        assert_eq!(cfg.openai_oauth_token, Some("oauth-token".to_string()));
+        assert_eq!(cfg.openai_api_key, Some("oauth-token".to_string()));
+        assert_eq!(cfg.api_key, Some("oauth-token".to_string()));
+    }
+
     #[test]
     fn test_merge_env_over_file() {
         let mut cfg = empty_cfg();
diff --git a/openplanter-desktop/frontend/src/api/invoke.test.ts b/openplanter-desktop/frontend/src/api/invoke.test.ts
index 35fecc66..02da105a 100644
--- a/openplanter-desktop/frontend/src/api/invoke.test.ts
+++ b/openplanter-desktop/frontend/src/api/invoke.test.ts
@@ -66,10 +66,10 @@ describe("invoke wrappers", () => {
 
   it("updateConfig sends partial and returns config", async () => {
     __setHandler("update_config", ({ partial }: any) => {
-      expect(partial.model).toBe("azure-foundry/gpt-5.3-codex");
+      expect(partial.model).toBe("azure-foundry/gpt-5.4");
       return {
         provider: "openai",
-        model: "azure-foundry/gpt-5.3-codex",
+        model: "azure-foundry/gpt-5.4",
         zai_plan: "coding",
         workspace: ".",
         session_id: null,
@@ -81,8 +81,8 @@ describe("invoke wrappers", () => {
         demo: false,
       };
     });
-    const config = await updateConfig({ model: "azure-foundry/gpt-5.3-codex" });
-    expect(config.model).toBe("azure-foundry/gpt-5.3-codex");
+    const config = await updateConfig({ model: "azure-foundry/gpt-5.4" });
+    expect(config.model).toBe("azure-foundry/gpt-5.4");
     expect(config.zai_plan).toBe("coding");
     expect(config.web_search_provider).toBe("firecrawl");
   });
@@ -92,15 +92,15 @@ describe("invoke wrappers", () => {
       expect(provider).toBe("openai");
       return [
         {
-          id: "azure-foundry/gpt-5.3-codex",
-          name: "GPT-5.3 Codex (Foundry)",
+          id: "azure-foundry/gpt-5.4",
+          name: "GPT-5.4 (Foundry)",
           provider: "openai",
         },
       ];
     });
     const models = await listModels("openai");
     expect(models).toHaveLength(1);
-    expect(models[0].id).toBe("azure-foundry/gpt-5.3-codex");
+    expect(models[0].id).toBe("azure-foundry/gpt-5.4");
   });
 
   it("saveSettings sends settings object", async () => {
diff --git a/openplanter-desktop/frontend/src/commands/model.test.ts b/openplanter-desktop/frontend/src/commands/model.test.ts
index 31eacdd6..c8aa27c9 100644
--- a/openplanter-desktop/frontend/src/commands/model.test.ts
+++ b/openplanter-desktop/frontend/src/commands/model.test.ts
@@ -17,7 +17,7 @@ describe("inferProvider", () => {
 
   it("gpt returns openai", () => {
     expect(inferProvider("gpt-5.2")).toBe("openai");
-    expect(inferProvider("azure-foundry/gpt-5.3-codex")).toBe("openai");
+    expect(inferProvider("azure-foundry/gpt-5.4")).toBe("openai");
   });
 
   it("o1 returns openai", () => {
@@ -63,13 +63,25 @@ describe("MODEL_ALIASES", () => {
   });
 
   it("gpt5 alias", () => {
-    expect(MODEL_ALIASES["gpt5"]).toBe("azure-foundry/gpt-5.3-codex");
+    expect(MODEL_ALIASES["gpt5"]).toBe("azure-foundry/gpt-5.4");
+  });
+
+  it("gpt-5 alias", () => {
+    expect(MODEL_ALIASES["gpt-5"]).toBe("azure-foundry/gpt-5.4");
+  });
+
+  it("gpt-5.3 alias", () => {
+    expect(MODEL_ALIASES["gpt-5.3"]).toBe("azure-foundry/gpt-5.3-codex");
   });
 
   it("gpt-5.4 alias", () => {
     expect(MODEL_ALIASES["gpt-5.4"]).toBe("azure-foundry/gpt-5.4");
   });
 
+  it("gpt5.4 alias", () => {
+    expect(MODEL_ALIASES["gpt5.4"]).toBe("azure-foundry/gpt-5.4");
+  });
+
   it("zai alias", () => {
     expect(MODEL_ALIASES["zai"]).toBe("glm-5");
   });
@@ -141,4 +153,29 @@ describe("handleModelCommand", () => {
     expect(appState.get().model).toBe("glm-5");
     expect(appState.get().zaiPlan).toBe("coding");
   });
+
+  it("gpt5 alias switches to gpt-5.4", async () => {
+    __setHandler("update_config", ({ partial }: { partial: Record<string, string> }) => {
+      expect(partial.model).toBe("azure-foundry/gpt-5.4");
+      expect(partial.provider).toBe("openai");
+      return {
+        provider: "openai",
+        model: "azure-foundry/gpt-5.4",
+        zai_plan: "paygo",
+        workspace: ".",
+        session_id: null,
+        recursive: true,
+        max_depth: 4,
+        max_steps_per_call: 100,
+        reasoning_effort: "high",
+        web_search_provider: "exa",
+        demo: false,
+      };
+    });
+
+    const result = await handleModelCommand("gpt5");
+    expect(result.lines).toContain("Switched to openai/azure-foundry/gpt-5.4");
+    expect(appState.get().provider).toBe("openai");
+    expect(appState.get().model).toBe("azure-foundry/gpt-5.4");
+  });
 });
diff --git a/openplanter-desktop/frontend/src/commands/model.ts b/openplanter-desktop/frontend/src/commands/model.ts
index 68b45bab..91900662 100644
--- a/openplanter-desktop/frontend/src/commands/model.ts
+++ b/openplanter-desktop/frontend/src/commands/model.ts
@@ -11,10 +11,11 @@ export const MODEL_ALIASES: Record<string, string> = {
   "sonnet-4": "anthropic-foundry/claude-sonnet-4-6",
   "haiku-4": "anthropic-foundry/claude-haiku-4-5",
   "opus-4": "anthropic-foundry/claude-opus-4-6",
-  gpt5: "azure-foundry/gpt-5.3-codex",
-  "gpt-5": "azure-foundry/gpt-5.3-codex",
+  gpt5: "azure-foundry/gpt-5.4",
+  "gpt-5": "azure-foundry/gpt-5.4",
+  "gpt5.3": "azure-foundry/gpt-5.3-codex",
   "gpt-5.3": "azure-foundry/gpt-5.3-codex",
-  gpt54: "azure-foundry/gpt-5.4",
+  "gpt5.4": "azure-foundry/gpt-5.4",
   "gpt-5.4": "azure-foundry/gpt-5.4",
   kimi: "azure-foundry/Kimi-K2.5",
   gpt4o: "gpt-4o",
diff --git a/tests/test_coverage_gaps.py b/tests/test_coverage_gaps.py
index 15d36b62..067e255e 100644
--- a/tests/test_coverage_gaps.py
+++ b/tests/test_coverage_gaps.py
@@ -256,6 +256,23 @@ def test_api_keys_from_env(self) -> None:
         self.assertEqual(cfg.exa_api_key, "exa")
         self.assertEqual(cfg.brave_api_key, "brave")
 
+    def test_openai_oauth_token_from_env_without_api_key(self) -> None:
+        env = {"OPENAI_OAUTH_TOKEN": "oauth-token"}
+        with patch.dict(os.environ, env, clear=True):
+            cfg = AgentConfig.from_env("/tmp/test-ws")
+        self.assertEqual(cfg.openai_oauth_token, "oauth-token")
+        self.assertEqual(cfg.openai_api_key, "oauth-token")
+
+    def test_openai_api_key_beats_oauth_token(self) -> None:
+        env = {
+            "OPENAI_API_KEY": "oa",
+            "OPENAI_OAUTH_TOKEN": "oauth-token",
+        }
+        with patch.dict(os.environ, env, clear=True):
+            cfg = AgentConfig.from_env("/tmp/test-ws")
+        self.assertEqual(cfg.openai_oauth_token, "oauth-token")
+        self.assertEqual(cfg.openai_api_key, "oa")
+
     def test_foundry_placeholder_keys_disabled_for_public_endpoints(self) -> None:
         env = {
             "OPENPLANTER_OPENAI_BASE_URL": "https://api.openai.com/v1",
@@ -340,7 +357,7 @@ def test_explicit_model_returned(self) -> None:
 
     def test_empty_model_uses_provider_default(self) -> None:
         cfg = AgentConfig(workspace=Path("/tmp"), provider="openai", model="")
-        self.assertEqual(_resolve_model_name(cfg), "azure-foundry/gpt-5.3-codex")
+        self.assertEqual(_resolve_model_name(cfg), "azure-foundry/gpt-5.4")
 
     def test_empty_model_anthropic_default(self) -> None:
         cfg = AgentConfig(workspace=Path("/tmp"), provider="anthropic", model="")
@@ -374,7 +391,7 @@ def test_openai_provider_with_key(self) -> None:
             cfg = AgentConfig(
                 workspace=Path(tmpdir),
                 provider="openai",
-                model="azure-foundry/gpt-5.3-codex",
+                model="azure-foundry/gpt-5.4",
                 openai_api_key="test-key",
             )
             engine = build_engine(cfg)
@@ -396,7 +413,7 @@ def test_no_key_fallback_to_echo(self) -> None:
             cfg = AgentConfig(
                 workspace=Path(tmpdir),
                 provider="openai",
-                model="azure-foundry/gpt-5.3-codex",
+                model="azure-foundry/gpt-5.4",
                 openai_base_url="https://api.openai.com/v1",
                 openai_api_key=None,
                 )
diff --git a/tests/test_model.py b/tests/test_model.py
index 0631eb19..db5c97cb 100644
--- a/tests/test_model.py
+++ b/tests/test_model.py
@@ -55,14 +55,14 @@ def fake_http_json(url, method, headers, payload=None, timeout_sec=90):  # type:
 
         with patch("agent.model._http_stream_sse", mock_openai_stream(fake_http_json)):
             model = OpenAICompatibleModel(
-                model="azure-foundry/gpt-5.3-codex",
+                model="azure-foundry/gpt-5.4",
                 api_key="k",
                 reasoning_effort="high",
             )
             conv = model.create_conversation("system", "user msg")
             turn = model.complete(conv)
             self.assertEqual(turn.text, "ok")
-            self.assertEqual(captured["payload"]["model"], "gpt-5.3-codex")
+            self.assertEqual(captured["payload"]["model"], "gpt-5.4")
 
     def test_openai_payload_includes_thinking_type(self) -> None:
         captured: dict = {}
diff --git a/tests/test_settings.py b/tests/test_settings.py
index d39c08ea..c01e1a41 100644
--- a/tests/test_settings.py
+++ b/tests/test_settings.py
@@ -176,7 +176,7 @@ def test_gpt_is_openai(self) -> None:
         self.assertEqual(infer_provider_for_model("gpt-4.1-mini"), "openai")
         self.assertEqual(infer_provider_for_model("GPT-4o"), "openai")
         self.assertEqual(
-            infer_provider_for_model("azure-foundry/gpt-5.3-codex"),
+            infer_provider_for_model("azure-foundry/gpt-5.4"),
             "openai",
         )
 

From ba663dfdb6b003161a3b56ee29133739873aeb91 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Thu, 12 Mar 2026 13:02:48 -0400
Subject: [PATCH 07/58] Add voyage credential status to desktop

---
 .../crates/op-core/src/credentials.rs         | 20 ++++++++++++++++++-
 .../crates/op-tauri/src/commands/config.rs    | 14 ++++++++++---
 .../crates/op-tauri/src/state.rs              |  4 +++-
 .../frontend/src/api/invoke.test.ts           |  2 ++
 .../frontend/src/components/App.test.ts       |  4 ++--
 .../frontend/src/components/App.ts            |  2 +-
 6 files changed, 38 insertions(+), 8 deletions(-)

diff --git a/openplanter-desktop/crates/op-core/src/credentials.rs b/openplanter-desktop/crates/op-core/src/credentials.rs
index 44174c5b..44817768 100644
--- a/openplanter-desktop/crates/op-core/src/credentials.rs
+++ b/openplanter-desktop/crates/op-core/src/credentials.rs
@@ -27,7 +27,7 @@ pub struct CredentialBundle {
 impl CredentialBundle {
     /// Returns `true` if any key has a non-empty value.
     pub fn has_any(&self) -> bool {
-        let keys: [&Option<String>; 9] = [
+        let keys = [
             &self.openai_api_key,
             &self.openai_oauth_token,
             &self.anthropic_api_key,
@@ -339,6 +339,24 @@ mod tests {
         assert!(bundle.has_any());
     }
 
+    #[test]
+    fn test_credential_bundle_has_any_with_voyage_key() {
+        let bundle = CredentialBundle {
+            voyage_api_key: Some("voyage-test".into()),
+            ..Default::default()
+        };
+        assert!(bundle.has_any());
+    }
+
+    #[test]
+    fn test_credential_bundle_whitespace_only_values_do_not_count() {
+        let bundle = CredentialBundle {
+            voyage_api_key: Some("   ".into()),
+            ..Default::default()
+        };
+        assert!(!bundle.has_any());
+    }
+
     #[test]
     fn test_credential_bundle_merge_missing() {
         let mut a = CredentialBundle {
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/config.rs b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
index 31980a2c..9e624b3e 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/config.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
@@ -210,6 +210,7 @@ pub fn build_credential_status(cfg: &op_core::config::AgentConfig) -> HashMap<St
     status.insert("exa".to_string(), cfg.exa_api_key.is_some());
     status.insert("firecrawl".to_string(), cfg.firecrawl_api_key.is_some());
     status.insert("brave".to_string(), cfg.brave_api_key.is_some());
+    status.insert("voyage".to_string(), cfg.voyage_api_key.is_some());
     status
 }
 
@@ -261,6 +262,10 @@ pub async fn get_credentials_status(
         "brave".to_string(),
         cfg.brave_api_key.is_some() || env_creds.brave_api_key.is_some(),
     );
+    status.insert(
+        "voyage".to_string(),
+        cfg.voyage_api_key.is_some() || env_creds.voyage_api_key.is_some(),
+    );
     Ok(status)
 }
 
@@ -367,6 +372,7 @@ mod tests {
         cfg.exa_api_key = None;
         cfg.firecrawl_api_key = None;
         cfg.brave_api_key = None;
+        cfg.voyage_api_key = None;
         let status = build_credential_status(&cfg);
         assert_eq!(status["openai"], false);
         assert_eq!(status["anthropic"], false);
@@ -375,6 +381,7 @@ mod tests {
         assert_eq!(status["zai"], false);
         assert_eq!(status["ollama"], true, "ollama always true");
         assert_eq!(status["brave"], false);
+        assert_eq!(status["voyage"], false);
     }
 
     #[test]
@@ -429,6 +436,7 @@ mod tests {
         cfg.exa_api_key = Some("k6".to_string());
         cfg.firecrawl_api_key = Some("k7".to_string());
         cfg.brave_api_key = Some("k8".to_string());
+        cfg.voyage_api_key = Some("k9".to_string());
         let status = build_credential_status(&cfg);
         for (provider, has_key) in &status {
             assert!(has_key, "{} should be true when key is set", provider);
@@ -436,13 +444,13 @@ mod tests {
     }
 
     #[test]
-    fn test_cred_status_has_nine_entries() {
+    fn test_cred_status_has_ten_entries() {
         let cfg = op_core::config::AgentConfig::from_env("/nonexistent");
         let status = build_credential_status(&cfg);
         assert_eq!(
             status.len(),
-            9,
-            "should have 9 entries (6 providers + 3 web services)"
+            10,
+            "should have 10 entries (6 providers + 4 services)"
         );
     }
 
diff --git a/openplanter-desktop/crates/op-tauri/src/state.rs b/openplanter-desktop/crates/op-tauri/src/state.rs
index 7038e7b3..9cc0d01d 100644
--- a/openplanter-desktop/crates/op-tauri/src/state.rs
+++ b/openplanter-desktop/crates/op-tauri/src/state.rs
@@ -512,18 +512,20 @@ mod tests {
     }
 
     #[test]
-    fn test_merge_includes_zai_firecrawl_and_brave() {
+    fn test_merge_includes_zai_firecrawl_brave_and_voyage() {
         let mut cfg = empty_cfg();
         let env_creds = CredentialBundle {
             zai_api_key: Some("zai-env".to_string()),
             firecrawl_api_key: Some("fc-env".to_string()),
             brave_api_key: Some("brave-env".to_string()),
+            voyage_api_key: Some("voyage-env".to_string()),
             ..Default::default()
         };
         merge_credentials_into_config(&mut cfg, &env_creds, &CredentialBundle::default());
         assert_eq!(cfg.zai_api_key, Some("zai-env".to_string()));
         assert_eq!(cfg.firecrawl_api_key, Some("fc-env".to_string()));
         assert_eq!(cfg.brave_api_key, Some("brave-env".to_string()));
+        assert_eq!(cfg.voyage_api_key, Some("voyage-env".to_string()));
     }
 
     #[test]
diff --git a/openplanter-desktop/frontend/src/api/invoke.test.ts b/openplanter-desktop/frontend/src/api/invoke.test.ts
index 02da105a..f5ab7de8 100644
--- a/openplanter-desktop/frontend/src/api/invoke.test.ts
+++ b/openplanter-desktop/frontend/src/api/invoke.test.ts
@@ -127,6 +127,7 @@ describe("invoke wrappers", () => {
       exa: false,
       firecrawl: true,
       brave: false,
+      voyage: true,
     }));
     const status = await getCredentialsStatus();
     expect(status.openai).toBe(true);
@@ -134,6 +135,7 @@ describe("invoke wrappers", () => {
     expect(status.zai).toBe(true);
     expect(status.firecrawl).toBe(true);
     expect(status.brave).toBe(false);
+    expect(status.voyage).toBe(true);
   });
 
   it("listSessions sends limit", async () => {
diff --git a/openplanter-desktop/frontend/src/components/App.test.ts b/openplanter-desktop/frontend/src/components/App.test.ts
index f0323542..30037232 100644
--- a/openplanter-desktop/frontend/src/components/App.test.ts
+++ b/openplanter-desktop/frontend/src/components/App.test.ts
@@ -48,7 +48,7 @@ describe("createApp", () => {
     __setHandler("list_sessions", () => [SESSION_B, SESSION_A]);
     __setHandler("get_credentials_status", () => ({
       openai: true, anthropic: true, openrouter: false,
-      cerebras: false, zai: true, ollama: true, exa: false, firecrawl: true, brave: false,
+      cerebras: false, zai: true, ollama: true, exa: false, firecrawl: true, brave: false, voyage: true,
     }));
     __setHandler("open_session", () => ({
       id: "20260227-120000-cccc3333",
@@ -103,7 +103,7 @@ describe("createApp", () => {
 
     await vi.waitFor(() => {
       const creds = root.querySelector(".cred-status");
-      expect(creds!.children.length).toBe(9);
+      expect(creds!.children.length).toBe(10);
       expect(creds!.querySelector(".cred-ok")!.textContent).toContain("openai");
       expect(creds!.querySelector(".cred-missing")!.textContent).toContain("openrouter");
     });
diff --git a/openplanter-desktop/frontend/src/components/App.ts b/openplanter-desktop/frontend/src/components/App.ts
index 9e08f564..9b162fdf 100644
--- a/openplanter-desktop/frontend/src/components/App.ts
+++ b/openplanter-desktop/frontend/src/components/App.ts
@@ -302,7 +302,7 @@ async function loadCredentials(container: HTMLElement): Promise<void> {
   try {
     const status = await getCredentialsStatus();
     container.innerHTML = "";
-    const providers = ["openai", "anthropic", "openrouter", "cerebras", "zai", "ollama", "exa", "firecrawl", "brave"];
+    const providers = ["openai", "anthropic", "openrouter", "cerebras", "zai", "ollama", "exa", "firecrawl", "brave", "voyage"];
     for (const p of providers) {
       const row = document.createElement("div");
       const hasKey = status[p] ?? false;

From 05f5c56f72d1e6460628e33cfb036075879fdcb7 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Thu, 12 Mar 2026 13:47:29 -0400
Subject: [PATCH 08/58] Add Tavily web search provider parity

---
 README.md                                     |   5 +-
 agent/__main__.py                             |  13 +-
 agent/builder.py                              |   2 +
 agent/config.py                               |   7 +-
 agent/credentials.py                          |  11 +
 agent/tool_defs.py                            |   4 +-
 agent/tools.py                                | 106 ++++++-
 .../crates/op-core/src/config.rs              |  25 +-
 .../crates/op-core/src/credentials.rs         |  13 +
 .../crates/op-core/src/tools/defs.rs          |   4 +-
 .../crates/op-core/src/tools/mod.rs           |  12 +
 .../crates/op-core/src/tools/web.rs           | 289 +++++++++++++++++-
 .../crates/op-tauri/src/commands/config.rs    |  16 +-
 .../crates/op-tauri/src/state.rs              |   6 +-
 .../frontend/src/api/invoke.test.ts           |   2 +
 .../src/commands/completionRegistry.test.ts   |   4 +-
 .../src/commands/completionRegistry.ts        |   1 +
 .../frontend/src/commands/slash.ts            |   2 +-
 .../frontend/src/commands/webSearch.test.ts   |  16 +-
 .../frontend/src/commands/webSearch.ts        |   2 +-
 .../frontend/src/components/App.test.ts       |   4 +-
 .../frontend/src/components/App.ts            |   2 +-
 tests/test_coverage_gaps.py                   |  18 +-
 tests/test_credentials.py                     |   3 +
 tests/test_tools.py                           |  60 ++++
 25 files changed, 585 insertions(+), 42 deletions(-)

diff --git a/README.md b/README.md
index e2fef280..618f6b43 100644
--- a/README.md
+++ b/README.md
@@ -150,9 +150,10 @@ export OPENPLANTER_RATE_LIMIT_RETRY_AFTER_CAP_SEC=120.0
 export OPENPLANTER_ZAI_STREAM_MAX_RETRIES=10
 ```
 
-Additional service keys: `EXA_API_KEY`, `FIRECRAWL_API_KEY`, `BRAVE_API_KEY` (web search), `VOYAGE_API_KEY` (embeddings).
+Additional service keys: `EXA_API_KEY`, `FIRECRAWL_API_KEY`, `BRAVE_API_KEY`, `TAVILY_API_KEY` (web search), `VOYAGE_API_KEY` (embeddings).
 
 All keys can also be set with an `OPENPLANTER_` prefix (e.g. `OPENPLANTER_OPENAI_API_KEY`), via `.env` files in the workspace, or via CLI flags.
+Provider base URLs can also be overridden with `OPENPLANTER_*_BASE_URL`, including `OPENPLANTER_TAVILY_BASE_URL`.
 
 ## Agent Tools
 
@@ -162,7 +163,7 @@ The agent has access to 19 tools, organized around its investigation workflow:
 
 **Shell execution** — `run_shell`, `run_shell_bg`, `check_shell_bg`, `kill_shell_bg` — run analysis scripts, data pipelines, and validation checks.
 
-**Web** — `web_search` (Exa, Firecrawl, or Brave), `fetch_url` — pull public records, verify entities, and retrieve supplementary data.
+**Web** — `web_search` (Exa, Firecrawl, Brave, or Tavily), `fetch_url` — pull public records, verify entities, and retrieve supplementary data.
 
 **Planning & delegation** — `think`, `subtask`, `execute`, `list_artifacts`, `read_artifact` — decompose investigations into focused sub-tasks, each with acceptance criteria and independent verification.
 
diff --git a/agent/__main__.py b/agent/__main__.py
index 07d5b3d2..41678c0b 100644
--- a/agent/__main__.py
+++ b/agent/__main__.py
@@ -105,9 +105,10 @@ def build_parser() -> argparse.ArgumentParser:
     parser.add_argument("--exa-api-key", help="Exa API key override.")
     parser.add_argument("--firecrawl-api-key", help="Firecrawl API key override.")
     parser.add_argument("--brave-api-key", help="Brave Search API key override.")
+    parser.add_argument("--tavily-api-key", help="Tavily API key override.")
     parser.add_argument(
         "--web-search-provider",
-        choices=["exa", "firecrawl", "brave"],
+        choices=["exa", "firecrawl", "brave", "tavily"],
         help="Web search backend provider.",
     )
     parser.add_argument("--voyage-api-key", help="Voyage API key override.")
@@ -248,6 +249,7 @@ def _load_credentials(
         exa_api_key=user_creds.exa_api_key,
         firecrawl_api_key=user_creds.firecrawl_api_key,
         brave_api_key=user_creds.brave_api_key,
+        tavily_api_key=user_creds.tavily_api_key,
         voyage_api_key=user_creds.voyage_api_key,
     )
 
@@ -271,6 +273,8 @@ def _load_credentials(
         creds.firecrawl_api_key = stored.firecrawl_api_key
     if stored.brave_api_key:
         creds.brave_api_key = stored.brave_api_key
+    if stored.tavily_api_key:
+        creds.tavily_api_key = stored.tavily_api_key
     if stored.voyage_api_key:
         creds.voyage_api_key = stored.voyage_api_key
 
@@ -293,6 +297,8 @@ def _load_credentials(
         creds.firecrawl_api_key = env_creds.firecrawl_api_key
     if env_creds.brave_api_key:
         creds.brave_api_key = env_creds.brave_api_key
+    if env_creds.tavily_api_key:
+        creds.tavily_api_key = env_creds.tavily_api_key
     if env_creds.voyage_api_key:
         creds.voyage_api_key = env_creds.voyage_api_key
 
@@ -320,6 +326,8 @@ def _load_credentials(
         creds.firecrawl_api_key = args.firecrawl_api_key.strip() or creds.firecrawl_api_key
     if args.brave_api_key:
         creds.brave_api_key = args.brave_api_key.strip() or creds.brave_api_key
+    if args.tavily_api_key:
+        creds.tavily_api_key = args.tavily_api_key.strip() or creds.tavily_api_key
     if args.voyage_api_key:
         creds.voyage_api_key = args.voyage_api_key.strip() or creds.voyage_api_key
 
@@ -374,6 +382,7 @@ def _apply_runtime_overrides(cfg: AgentConfig, args: argparse.Namespace, creds:
     cfg.exa_api_key = creds.exa_api_key
     cfg.firecrawl_api_key = creds.firecrawl_api_key
     cfg.brave_api_key = creds.brave_api_key
+    cfg.tavily_api_key = creds.tavily_api_key
     cfg.voyage_api_key = creds.voyage_api_key
     cfg.api_key = cfg.openai_api_key
 
@@ -419,7 +428,7 @@ def _apply_runtime_overrides(cfg: AgentConfig, args: argparse.Namespace, creds:
         cfg.model = args.model
     if args.web_search_provider:
         cfg.web_search_provider = args.web_search_provider
-    if cfg.web_search_provider not in {"exa", "firecrawl", "brave"}:
+    if cfg.web_search_provider not in {"exa", "firecrawl", "brave", "tavily"}:
         cfg.web_search_provider = "exa"
     if args.reasoning_effort:
         cfg.reasoning_effort = None if args.reasoning_effort == "none" else args.reasoning_effort
diff --git a/agent/builder.py b/agent/builder.py
index 7d7044ac..146d53f9 100644
--- a/agent/builder.py
+++ b/agent/builder.py
@@ -249,6 +249,8 @@ def build_engine(cfg: AgentConfig) -> RLMEngine:
         firecrawl_base_url=cfg.firecrawl_base_url,
         brave_api_key=cfg.brave_api_key,
         brave_base_url=cfg.brave_base_url,
+        tavily_api_key=cfg.tavily_api_key,
+        tavily_base_url=cfg.tavily_base_url,
     )
 
     try:
diff --git a/agent/config.py b/agent/config.py
index 6a0e0f9c..fc00d408 100644
--- a/agent/config.py
+++ b/agent/config.py
@@ -112,6 +112,7 @@ class AgentConfig:
     exa_base_url: str = "https://api.exa.ai"
     firecrawl_base_url: str = "https://api.firecrawl.dev/v1"
     brave_base_url: str = "https://api.search.brave.com/res/v1"
+    tavily_base_url: str = "https://api.tavily.com"
     openai_api_key: str | None = None
     openai_oauth_token: str | None = None
     anthropic_api_key: str | None = None
@@ -121,6 +122,7 @@ class AgentConfig:
     exa_api_key: str | None = None
     firecrawl_api_key: str | None = None
     brave_api_key: str | None = None
+    tavily_api_key: str | None = None
     web_search_provider: str = "exa"
     voyage_api_key: str | None = None
     max_depth: int = 4
@@ -180,6 +182,7 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
         exa_api_key = os.getenv("OPENPLANTER_EXA_API_KEY") or os.getenv("EXA_API_KEY")
         firecrawl_api_key = os.getenv("OPENPLANTER_FIRECRAWL_API_KEY") or os.getenv("FIRECRAWL_API_KEY")
         brave_api_key = os.getenv("OPENPLANTER_BRAVE_API_KEY") or os.getenv("BRAVE_API_KEY")
+        tavily_api_key = os.getenv("OPENPLANTER_TAVILY_API_KEY") or os.getenv("TAVILY_API_KEY")
         voyage_api_key = os.getenv("OPENPLANTER_VOYAGE_API_KEY") or os.getenv("VOYAGE_API_KEY")
         openai_base_url = os.getenv("OPENPLANTER_OPENAI_BASE_URL") or os.getenv(
             "OPENPLANTER_BASE_URL",
@@ -208,7 +211,7 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             )
         )
         web_search_provider = (os.getenv("OPENPLANTER_WEB_SEARCH_PROVIDER", "exa").strip().lower() or "exa")
-        if web_search_provider not in {"exa", "firecrawl", "brave"}:
+        if web_search_provider not in {"exa", "firecrawl", "brave", "tavily"}:
             web_search_provider = "exa"
         return cls(
             workspace=ws,
@@ -229,6 +232,7 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             exa_base_url=os.getenv("OPENPLANTER_EXA_BASE_URL", "https://api.exa.ai"),
             firecrawl_base_url=os.getenv("OPENPLANTER_FIRECRAWL_BASE_URL", "https://api.firecrawl.dev/v1"),
             brave_base_url=os.getenv("OPENPLANTER_BRAVE_BASE_URL", "https://api.search.brave.com/res/v1"),
+            tavily_base_url=os.getenv("OPENPLANTER_TAVILY_BASE_URL", "https://api.tavily.com"),
             openai_api_key=openai_api_key,
             openai_oauth_token=(openai_oauth_token or "").strip() or None,
             anthropic_api_key=anthropic_api_key,
@@ -238,6 +242,7 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             exa_api_key=exa_api_key,
             firecrawl_api_key=firecrawl_api_key,
             brave_api_key=brave_api_key,
+            tavily_api_key=tavily_api_key,
             web_search_provider=web_search_provider,
             voyage_api_key=voyage_api_key,
             max_depth=int(os.getenv("OPENPLANTER_MAX_DEPTH", "4")),
diff --git a/agent/credentials.py b/agent/credentials.py
index 2e4d8a40..a79e428e 100644
--- a/agent/credentials.py
+++ b/agent/credentials.py
@@ -20,6 +20,7 @@ class CredentialBundle:
     exa_api_key: str | None = None
     firecrawl_api_key: str | None = None
     brave_api_key: str | None = None
+    tavily_api_key: str | None = None
     voyage_api_key: str | None = None
 
     def has_any(self) -> bool:
@@ -33,6 +34,7 @@ def has_any(self) -> bool:
             or (self.exa_api_key and self.exa_api_key.strip())
             or (self.firecrawl_api_key and self.firecrawl_api_key.strip())
             or (self.brave_api_key and self.brave_api_key.strip())
+            or (self.tavily_api_key and self.tavily_api_key.strip())
             or (self.voyage_api_key and self.voyage_api_key.strip())
         )
 
@@ -55,6 +57,8 @@ def merge_missing(self, other: "CredentialBundle") -> None:
             self.firecrawl_api_key = other.firecrawl_api_key
         if not self.brave_api_key and other.brave_api_key:
             self.brave_api_key = other.brave_api_key
+        if not self.tavily_api_key and other.tavily_api_key:
+            self.tavily_api_key = other.tavily_api_key
         if not self.voyage_api_key and other.voyage_api_key:
             self.voyage_api_key = other.voyage_api_key
 
@@ -78,6 +82,8 @@ def to_json(self) -> dict[str, str]:
             out["firecrawl_api_key"] = self.firecrawl_api_key
         if self.brave_api_key:
             out["brave_api_key"] = self.brave_api_key
+        if self.tavily_api_key:
+            out["tavily_api_key"] = self.tavily_api_key
         if self.voyage_api_key:
             out["voyage_api_key"] = self.voyage_api_key
         return out
@@ -96,6 +102,7 @@ def from_json(cls, payload: dict[str, str] | None) -> "CredentialBundle":
             exa_api_key=(payload.get("exa_api_key") or "").strip() or None,
             firecrawl_api_key=(payload.get("firecrawl_api_key") or "").strip() or None,
             brave_api_key=(payload.get("brave_api_key") or "").strip() or None,
+            tavily_api_key=(payload.get("tavily_api_key") or "").strip() or None,
             voyage_api_key=(payload.get("voyage_api_key") or "").strip() or None,
         )
 
@@ -146,6 +153,7 @@ def parse_env_file(path: Path) -> CredentialBundle:
         firecrawl_api_key=(env.get("FIRECRAWL_API_KEY") or env.get("OPENPLANTER_FIRECRAWL_API_KEY") or "").strip()
         or None,
         brave_api_key=(env.get("BRAVE_API_KEY") or env.get("OPENPLANTER_BRAVE_API_KEY") or "").strip() or None,
+        tavily_api_key=(env.get("TAVILY_API_KEY") or env.get("OPENPLANTER_TAVILY_API_KEY") or "").strip() or None,
         voyage_api_key=(env.get("VOYAGE_API_KEY") or env.get("OPENPLANTER_VOYAGE_API_KEY") or "").strip() or None,
     )
 
@@ -184,6 +192,7 @@ def credentials_from_env() -> CredentialBundle:
         ).strip()
         or None,
         brave_api_key=(os.getenv("OPENPLANTER_BRAVE_API_KEY") or os.getenv("BRAVE_API_KEY") or "").strip() or None,
+        tavily_api_key=(os.getenv("OPENPLANTER_TAVILY_API_KEY") or os.getenv("TAVILY_API_KEY") or "").strip() or None,
         voyage_api_key=(os.getenv("OPENPLANTER_VOYAGE_API_KEY") or os.getenv("VOYAGE_API_KEY") or "").strip() or None,
     )
 
@@ -283,6 +292,7 @@ def prompt_for_credentials(
         exa_api_key=existing.exa_api_key,
         firecrawl_api_key=existing.firecrawl_api_key,
         brave_api_key=existing.brave_api_key,
+        tavily_api_key=existing.tavily_api_key,
         voyage_api_key=existing.voyage_api_key,
     )
 
@@ -320,6 +330,7 @@ def _ask(label: str, existing_value: str | None) -> str | None:
     current.exa_api_key = _ask("Exa", current.exa_api_key)
     current.firecrawl_api_key = _ask("Firecrawl", current.firecrawl_api_key)
     current.brave_api_key = _ask("Brave", current.brave_api_key)
+    current.tavily_api_key = _ask("Tavily", current.tavily_api_key)
     current.voyage_api_key = _ask("Voyage", current.voyage_api_key)
     if not force and current.has_any() and not existing.has_any():
         changed = True
diff --git a/agent/tool_defs.py b/agent/tool_defs.py
index 63d4765f..73ef01ed 100644
--- a/agent/tool_defs.py
+++ b/agent/tool_defs.py
@@ -63,7 +63,7 @@
     },
     {
         "name": "web_search",
-        "description": "Search the web using the configured provider (Exa, Firecrawl, or Brave). Returns URLs, titles, and optional page text.",
+        "description": "Search the web using the configured provider (Exa, Firecrawl, Brave, or Tavily). Returns URLs, titles, and optional page text.",
         "parameters": {
             "type": "object",
             "properties": {
@@ -86,7 +86,7 @@
     },
     {
         "name": "fetch_url",
-        "description": "Fetch and return the text content of one or more URLs.",
+        "description": "Fetch and return the text content of one or more URLs using the configured provider backend (Exa, Firecrawl, Brave, or Tavily).",
         "parameters": {
             "type": "object",
             "properties": {
diff --git a/agent/tools.py b/agent/tools.py
index 102d4863..e626d140 100644
--- a/agent/tools.py
+++ b/agent/tools.py
@@ -124,6 +124,8 @@ class WorkspaceTools:
     firecrawl_base_url: str = "https://api.firecrawl.dev/v1"
     brave_api_key: str | None = None
     brave_base_url: str = "https://api.search.brave.com/res/v1"
+    tavily_api_key: str | None = None
+    tavily_base_url: str = "https://api.tavily.com"
 
     def __post_init__(self) -> None:
         self.root = self.root.expanduser().resolve()
@@ -938,6 +940,38 @@ def _brave_request(self, endpoint: str, params: dict[str, Any]) -> dict[str, Any
             raise ToolError(f"Brave API returned non-object response: {type(parsed)!r}")
         return parsed
 
+    def _tavily_request(self, endpoint: str, payload: dict[str, Any]) -> dict[str, Any]:
+        if not (self.tavily_api_key and self.tavily_api_key.strip()):
+            raise ToolError("TAVILY_API_KEY not configured")
+        url = self.tavily_base_url.rstrip("/") + endpoint
+        req = urllib.request.Request(
+            url=url,
+            data=json.dumps(payload).encode("utf-8"),
+            headers={
+                "Authorization": f"Bearer {self.tavily_api_key}",
+                "Content-Type": "application/json",
+            },
+            method="POST",
+        )
+        try:
+            with urllib.request.urlopen(req, timeout=self.command_timeout_sec) as resp:
+                raw = resp.read().decode("utf-8", errors="replace")
+        except urllib.error.HTTPError as exc:
+            body = exc.read().decode("utf-8", errors="replace")
+            raise ToolError(f"Tavily API HTTP {exc.code}: {body}") from exc
+        except urllib.error.URLError as exc:
+            raise ToolError(f"Tavily API connection error: {exc}") from exc
+        except OSError as exc:
+            raise ToolError(f"Tavily API network error: {exc}") from exc
+
+        try:
+            parsed = json.loads(raw)
+        except json.JSONDecodeError as exc:
+            raise ToolError(f"Tavily API returned non-JSON payload: {raw[:500]}") from exc
+        if not isinstance(parsed, dict):
+            raise ToolError(f"Tavily API returned non-object response: {type(parsed)!r}")
+        return parsed
+
     def _fetch_url_direct(self, url: str) -> dict[str, str]:
         req = urllib.request.Request(
             url=url,
@@ -993,7 +1027,7 @@ def web_search(
             return "web_search requires non-empty query"
         clamped_results = max(1, min(int(num_results), 20))
         provider = (self.web_search_provider or "exa").strip().lower()
-        if provider not in {"exa", "firecrawl", "brave"}:
+        if provider not in {"exa", "firecrawl", "brave", "tavily"}:
             provider = "exa"
 
         if provider == "firecrawl":
@@ -1097,6 +1131,43 @@ def web_search(
             }
             return self._clip(json.dumps(output, indent=2, ensure_ascii=True), self.max_file_chars)
 
+        if provider == "tavily":
+            payload = {
+                "query": query,
+                "max_results": clamped_results,
+            }
+            if include_text:
+                payload["include_raw_content"] = "markdown"
+
+            try:
+                parsed = self._tavily_request("/search", payload)
+            except Exception as exc:
+                return f"Web search failed: {exc}"
+
+            rows = parsed.get("results")
+            out_results: list[dict[str, Any]] = []
+            for row in rows if isinstance(rows, list) else []:
+                if not isinstance(row, dict):
+                    continue
+                snippet = str(row.get("content", "") or row.get("snippet", ""))
+                text_value = row.get("raw_content") or row.get("content") or ""
+                item: dict[str, Any] = {
+                    "url": str(row.get("url", "")),
+                    "title": str(row.get("title", "")),
+                    "snippet": snippet,
+                }
+                if include_text and isinstance(text_value, str) and text_value:
+                    item["text"] = self._clip(text_value, 4000)
+                out_results.append(item)
+
+            output = {
+                "query": query,
+                "provider": provider,
+                "results": out_results,
+                "total": len(out_results),
+            }
+            return self._clip(json.dumps(output, indent=2, ensure_ascii=True), self.max_file_chars)
+
         payload: dict[str, Any] = {
             "query": query,
             "numResults": clamped_results,
@@ -1144,7 +1215,7 @@ def fetch_url(self, urls: list[str]) -> str:
             return "fetch_url requires at least one valid URL"
         normalized = normalized[:10]
         provider = (self.web_search_provider or "exa").strip().lower()
-        if provider not in {"exa", "firecrawl", "brave"}:
+        if provider not in {"exa", "firecrawl", "brave", "tavily"}:
             provider = "exa"
 
         if provider == "firecrawl":
@@ -1189,6 +1260,37 @@ def fetch_url(self, urls: list[str]) -> str:
             }
             return self._clip(json.dumps(output, indent=2, ensure_ascii=True), self.max_file_chars)
 
+        if provider == "tavily":
+            payload = {
+                "urls": normalized,
+                "extract_depth": "basic",
+                "include_images": False,
+            }
+            try:
+                parsed = self._tavily_request("/extract", payload)
+            except Exception as exc:
+                return f"Fetch URL failed: {exc}"
+
+            pages: list[dict[str, Any]] = []
+            rows = parsed.get("results")
+            for row in rows if isinstance(rows, list) else []:
+                if not isinstance(row, dict):
+                    continue
+                text = row.get("raw_content") or row.get("content") or ""
+                pages.append(
+                    {
+                        "url": str(row.get("url", "")),
+                        "title": str(row.get("title", "") or ""),
+                        "text": self._clip(str(text), 8000),
+                    }
+                )
+            output = {
+                "provider": provider,
+                "pages": pages,
+                "total": len(pages),
+            }
+            return self._clip(json.dumps(output, indent=2, ensure_ascii=True), self.max_file_chars)
+
         payload: dict[str, Any] = {
             "ids": normalized,
             "text": {"maxCharacters": 8000},
diff --git a/openplanter-desktop/crates/op-core/src/config.rs b/openplanter-desktop/crates/op-core/src/config.rs
index 015acca8..b2a0a847 100644
--- a/openplanter-desktop/crates/op-core/src/config.rs
+++ b/openplanter-desktop/crates/op-core/src/config.rs
@@ -15,6 +15,7 @@ pub const FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER: &str = "dont-worry-it-will-be-i
 pub const ZAI_PAYGO_BASE_URL: &str = "https://api.z.ai/api/paas/v4";
 pub const ZAI_CODING_BASE_URL: &str = "https://api.z.ai/api/coding/paas/v4";
 pub const BRAVE_BASE_URL: &str = "https://api.search.brave.com/res/v1";
+pub const TAVILY_BASE_URL: &str = "https://api.tavily.com";
 
 /// Default model for each supported provider.
 pub static PROVIDER_DEFAULT_MODELS: LazyLock<HashMap<&'static str, &'static str>> =
@@ -77,6 +78,7 @@ pub fn normalize_web_search_provider(value: Option<&str>) -> String {
     match value.unwrap_or_default().trim().to_lowercase().as_str() {
         "firecrawl" => "firecrawl".to_string(),
         "brave" => "brave".to_string(),
+        "tavily" => "tavily".to_string(),
         _ => "exa".to_string(),
     }
 }
@@ -192,6 +194,7 @@ pub struct AgentConfig {
     pub exa_base_url: String,
     pub firecrawl_base_url: String,
     pub brave_base_url: String,
+    pub tavily_base_url: String,
 
     // API keys
     pub api_key: Option<String>,
@@ -204,6 +207,7 @@ pub struct AgentConfig {
     pub exa_api_key: Option<String>,
     pub firecrawl_api_key: Option<String>,
     pub brave_api_key: Option<String>,
+    pub tavily_api_key: Option<String>,
     pub web_search_provider: String,
     pub voyage_api_key: Option<String>,
 
@@ -253,6 +257,7 @@ impl Default for AgentConfig {
             exa_base_url: "https://api.exa.ai".into(),
             firecrawl_base_url: "https://api.firecrawl.dev/v1".into(),
             brave_base_url: BRAVE_BASE_URL.into(),
+            tavily_base_url: TAVILY_BASE_URL.into(),
             api_key: Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.into()),
             openai_api_key: Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.into()),
             openai_oauth_token: None,
@@ -263,6 +268,7 @@ impl Default for AgentConfig {
             exa_api_key: None,
             firecrawl_api_key: None,
             brave_api_key: None,
+            tavily_api_key: None,
             web_search_provider: "exa".into(),
             voyage_api_key: None,
             max_depth: 4,
@@ -319,6 +325,8 @@ impl AgentConfig {
             env_opt("OPENPLANTER_FIRECRAWL_API_KEY").or_else(|| env_opt("FIRECRAWL_API_KEY"));
         let brave_api_key =
             env_opt("OPENPLANTER_BRAVE_API_KEY").or_else(|| env_opt("BRAVE_API_KEY"));
+        let tavily_api_key =
+            env_opt("OPENPLANTER_TAVILY_API_KEY").or_else(|| env_opt("TAVILY_API_KEY"));
 
         let voyage_api_key =
             env_opt("OPENPLANTER_VOYAGE_API_KEY").or_else(|| env_opt("VOYAGE_API_KEY"));
@@ -385,6 +393,7 @@ impl AgentConfig {
                 "https://api.firecrawl.dev/v1",
             ),
             brave_base_url: env_or("OPENPLANTER_BRAVE_BASE_URL", BRAVE_BASE_URL),
+            tavily_base_url: env_or("OPENPLANTER_TAVILY_BASE_URL", TAVILY_BASE_URL),
             openai_api_key,
             openai_oauth_token,
             anthropic_api_key,
@@ -394,6 +403,7 @@ impl AgentConfig {
             exa_api_key,
             firecrawl_api_key,
             brave_api_key,
+            tavily_api_key,
             web_search_provider,
             voyage_api_key,
             max_depth: env_int("OPENPLANTER_MAX_DEPTH", 4),
@@ -475,6 +485,8 @@ mod tests {
         assert_eq!(cfg.web_search_provider, "exa");
         assert_eq!(cfg.brave_base_url, BRAVE_BASE_URL);
         assert!(cfg.brave_api_key.is_none());
+        assert_eq!(cfg.tavily_base_url, TAVILY_BASE_URL);
+        assert!(cfg.tavily_api_key.is_none());
         assert_eq!(cfg.rate_limit_max_retries, 12);
         assert_eq!(cfg.rate_limit_backoff_base_sec, 1.0);
         assert_eq!(cfg.rate_limit_backoff_max_sec, 60.0);
@@ -532,6 +544,9 @@ mod tests {
             "OPENPLANTER_BRAVE_API_KEY",
             "BRAVE_API_KEY",
             "OPENPLANTER_BRAVE_BASE_URL",
+            "OPENPLANTER_TAVILY_API_KEY",
+            "TAVILY_API_KEY",
+            "OPENPLANTER_TAVILY_BASE_URL",
             "OPENPLANTER_ZAI_PLAN",
             "OPENPLANTER_ZAI_BASE_URL",
             "OPENPLANTER_RATE_LIMIT_MAX_RETRIES",
@@ -568,6 +583,7 @@ mod tests {
         );
         assert!(cfg.zai_api_key.is_none());
         assert!(cfg.brave_api_key.is_none());
+        assert!(cfg.tavily_api_key.is_none());
         assert_eq!(cfg.openai_base_url, FOUNDRY_OPENAI_BASE_URL);
         assert_eq!(cfg.anthropic_base_url, FOUNDRY_ANTHROPIC_BASE_URL);
         assert_eq!(cfg.web_search_provider, "exa");
@@ -587,13 +603,15 @@ mod tests {
             env::set_var("OPENAI_API_KEY", "sk-test123");
             env::set_var("ZAI_API_KEY", "zai-test123");
             env::set_var("BRAVE_API_KEY", "brave-test123");
-            env::set_var("OPENPLANTER_WEB_SEARCH_PROVIDER", "brave");
+            env::set_var("TAVILY_API_KEY", "tavily-test123");
+            env::set_var("OPENPLANTER_WEB_SEARCH_PROVIDER", "tavily");
             env::set_var("OPENPLANTER_RATE_LIMIT_MAX_RETRIES", "5");
             env::set_var("OPENPLANTER_RATE_LIMIT_BACKOFF_BASE_SEC", "2.5");
             env::set_var("OPENPLANTER_RATE_LIMIT_BACKOFF_MAX_SEC", "30.0");
             env::set_var("OPENPLANTER_RATE_LIMIT_RETRY_AFTER_CAP_SEC", "90.0");
             env::set_var("OPENPLANTER_ZAI_PLAN", "coding");
             env::set_var("OPENPLANTER_ZAI_STREAM_MAX_RETRIES", "7");
+            env::set_var("OPENPLANTER_TAVILY_BASE_URL", "https://tavily.example");
         }
 
         let cfg = AgentConfig::from_env("/tmp");
@@ -606,10 +624,12 @@ mod tests {
         assert_eq!(cfg.openai_api_key, Some("sk-test123".into()));
         assert_eq!(cfg.zai_api_key, Some("zai-test123".into()));
         assert_eq!(cfg.brave_api_key, Some("brave-test123".into()));
+        assert_eq!(cfg.tavily_api_key, Some("tavily-test123".into()));
         assert_eq!(cfg.zai_plan, "coding");
         assert_eq!(cfg.zai_base_url, ZAI_CODING_BASE_URL);
         assert_eq!(cfg.zai_stream_max_retries, 7);
-        assert_eq!(cfg.web_search_provider, "brave");
+        assert_eq!(cfg.web_search_provider, "tavily");
+        assert_eq!(cfg.tavily_base_url, "https://tavily.example");
         assert_eq!(cfg.rate_limit_max_retries, 5);
         assert_eq!(cfg.rate_limit_backoff_base_sec, 2.5);
         assert_eq!(cfg.rate_limit_backoff_max_sec, 30.0);
@@ -658,6 +678,7 @@ mod tests {
             "firecrawl"
         );
         assert_eq!(normalize_web_search_provider(Some("brave")), "brave");
+        assert_eq!(normalize_web_search_provider(Some("tavily")), "tavily");
         assert_eq!(normalize_web_search_provider(Some("other")), "exa");
         assert!(is_foundry_openai_base_url(FOUNDRY_OPENAI_BASE_URL));
         assert!(is_foundry_anthropic_base_url(FOUNDRY_ANTHROPIC_BASE_URL));
diff --git a/openplanter-desktop/crates/op-core/src/credentials.rs b/openplanter-desktop/crates/op-core/src/credentials.rs
index 44817768..5ec9aa49 100644
--- a/openplanter-desktop/crates/op-core/src/credentials.rs
+++ b/openplanter-desktop/crates/op-core/src/credentials.rs
@@ -21,6 +21,7 @@ pub struct CredentialBundle {
     pub exa_api_key: Option<String>,
     pub firecrawl_api_key: Option<String>,
     pub brave_api_key: Option<String>,
+    pub tavily_api_key: Option<String>,
     pub voyage_api_key: Option<String>,
 }
 
@@ -37,6 +38,7 @@ impl CredentialBundle {
             &self.exa_api_key,
             &self.firecrawl_api_key,
             &self.brave_api_key,
+            &self.tavily_api_key,
             &self.voyage_api_key,
         ];
         keys.iter()
@@ -61,6 +63,7 @@ impl CredentialBundle {
         fill!(exa_api_key);
         fill!(firecrawl_api_key);
         fill!(brave_api_key);
+        fill!(tavily_api_key);
         fill!(voyage_api_key);
     }
 
@@ -83,6 +86,7 @@ impl CredentialBundle {
         add!(exa_api_key, "exa_api_key");
         add!(firecrawl_api_key, "firecrawl_api_key");
         add!(brave_api_key, "brave_api_key");
+        add!(tavily_api_key, "tavily_api_key");
         add!(voyage_api_key, "voyage_api_key");
         out
     }
@@ -105,6 +109,7 @@ impl CredentialBundle {
             exa_api_key: get_str(payload, "exa_api_key"),
             firecrawl_api_key: get_str(payload, "firecrawl_api_key"),
             brave_api_key: get_str(payload, "brave_api_key"),
+            tavily_api_key: get_str(payload, "tavily_api_key"),
             voyage_api_key: get_str(payload, "voyage_api_key"),
         }
     }
@@ -177,6 +182,7 @@ pub fn parse_env_file(path: &Path) -> CredentialBundle {
             "OPENPLANTER_FIRECRAWL_API_KEY",
         ),
         brave_api_key: get_key(&env_map, "BRAVE_API_KEY", "OPENPLANTER_BRAVE_API_KEY"),
+        tavily_api_key: get_key(&env_map, "TAVILY_API_KEY", "OPENPLANTER_TAVILY_API_KEY"),
         voyage_api_key: get_key(&env_map, "VOYAGE_API_KEY", "OPENPLANTER_VOYAGE_API_KEY"),
     }
 }
@@ -201,6 +207,7 @@ pub fn credentials_from_env() -> CredentialBundle {
         exa_api_key: env_key("OPENPLANTER_EXA_API_KEY", "EXA_API_KEY"),
         firecrawl_api_key: env_key("OPENPLANTER_FIRECRAWL_API_KEY", "FIRECRAWL_API_KEY"),
         brave_api_key: env_key("OPENPLANTER_BRAVE_API_KEY", "BRAVE_API_KEY"),
+        tavily_api_key: env_key("OPENPLANTER_TAVILY_API_KEY", "TAVILY_API_KEY"),
         voyage_api_key: env_key("OPENPLANTER_VOYAGE_API_KEY", "VOYAGE_API_KEY"),
     }
 }
@@ -383,6 +390,7 @@ mod tests {
             openrouter_api_key: Some("or-456".into()),
             firecrawl_api_key: Some("fc-789".into()),
             brave_api_key: Some("brave-101".into()),
+            tavily_api_key: Some("tavily-202".into()),
             ..Default::default()
         };
         let json = bundle.to_json();
@@ -391,6 +399,7 @@ mod tests {
         assert_eq!(json.get("openrouter_api_key").unwrap(), "or-456");
         assert_eq!(json.get("firecrawl_api_key").unwrap(), "fc-789");
         assert_eq!(json.get("brave_api_key").unwrap(), "brave-101");
+        assert_eq!(json.get("tavily_api_key").unwrap(), "tavily-202");
     }
 
     #[test]
@@ -407,6 +416,7 @@ EXA_API_KEY="exa-quoted"
 ZAI_API_KEY=zai-from-env
 OPENPLANTER_FIRECRAWL_API_KEY="firecrawl-quoted"
 BRAVE_API_KEY=brave-from-env
+OPENPLANTER_TAVILY_API_KEY=tavily-from-env
 UNRELATED_VAR=foo
 "#,
         )
@@ -419,6 +429,7 @@ UNRELATED_VAR=foo
         assert_eq!(bundle.zai_api_key, Some("zai-from-env".into()));
         assert_eq!(bundle.firecrawl_api_key, Some("firecrawl-quoted".into()));
         assert_eq!(bundle.brave_api_key, Some("brave-from-env".into()));
+        assert_eq!(bundle.tavily_api_key, Some("tavily-from-env".into()));
         assert!(bundle.cerebras_api_key.is_none());
     }
 
@@ -431,6 +442,7 @@ UNRELATED_VAR=foo
             anthropic_api_key: Some("ant-test".into()),
             zai_api_key: Some("zai-test".into()),
             brave_api_key: Some("brave-test".into()),
+            tavily_api_key: Some("tavily-test".into()),
             ..Default::default()
         };
         store.save(&bundle).unwrap();
@@ -439,6 +451,7 @@ UNRELATED_VAR=foo
         assert_eq!(loaded.anthropic_api_key, Some("ant-test".into()));
         assert_eq!(loaded.zai_api_key, Some("zai-test".into()));
         assert_eq!(loaded.brave_api_key, Some("brave-test".into()));
+        assert_eq!(loaded.tavily_api_key, Some("tavily-test".into()));
     }
 
     #[test]
diff --git a/openplanter-desktop/crates/op-core/src/tools/defs.rs b/openplanter-desktop/crates/op-core/src/tools/defs.rs
index 7b1d5835..88b268e5 100644
--- a/openplanter-desktop/crates/op-core/src/tools/defs.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/defs.rs
@@ -176,7 +176,7 @@ fn mvp_tool_defs() -> Vec<ToolDef> {
         // ── Web ──
         ToolDef {
             name: "web_search",
-            description: "Search the web using the configured Exa, Firecrawl, or Brave backend. Returns URLs, titles, snippets, and optional page text.",
+            description: "Search the web using the configured Exa, Firecrawl, Brave, or Tavily backend. Returns URLs, titles, snippets, and optional page text.",
             parameters: json!({
                 "type": "object",
                 "properties": {
@@ -199,7 +199,7 @@ fn mvp_tool_defs() -> Vec<ToolDef> {
         },
         ToolDef {
             name: "fetch_url",
-            description: "Fetch and return the text content of one or more URLs using the configured Exa, Firecrawl, or Brave backend.",
+            description: "Fetch and return the text content of one or more URLs using the configured Exa, Firecrawl, Brave, or Tavily backend.",
             parameters: json!({
                 "type": "object",
                 "properties": {
diff --git a/openplanter-desktop/crates/op-core/src/tools/mod.rs b/openplanter-desktop/crates/op-core/src/tools/mod.rs
index f6220a92..693eb00e 100644
--- a/openplanter-desktop/crates/op-core/src/tools/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/mod.rs
@@ -60,6 +60,8 @@ pub struct WorkspaceTools {
     firecrawl_base_url: String,
     brave_api_key: Option<String>,
     brave_base_url: String,
+    tavily_api_key: Option<String>,
+    tavily_base_url: String,
     files_read: HashSet<PathBuf>,
     bg_jobs: shell::BgJobs,
 }
@@ -92,6 +94,8 @@ impl WorkspaceTools {
             firecrawl_base_url: config.firecrawl_base_url.clone(),
             brave_api_key: config.brave_api_key.clone(),
             brave_base_url: config.brave_base_url.clone(),
+            tavily_api_key: config.tavily_api_key.clone(),
+            tavily_base_url: config.tavily_base_url.clone(),
             files_read: HashSet::new(),
             bg_jobs: shell::BgJobs::new(),
         }
@@ -120,6 +124,8 @@ impl WorkspaceTools {
             firecrawl_base_url: config.firecrawl_base_url.clone(),
             brave_api_key: config.brave_api_key.clone(),
             brave_base_url: config.brave_base_url.clone(),
+            tavily_api_key: config.tavily_api_key.clone(),
+            tavily_base_url: config.tavily_base_url.clone(),
             files_read: HashSet::new(),
             bg_jobs: shell::BgJobs::new(),
         }
@@ -249,6 +255,8 @@ impl WorkspaceTools {
                     &self.firecrawl_base_url,
                     self.brave_api_key.as_deref(),
                     &self.brave_base_url,
+                    self.tavily_api_key.as_deref(),
+                    &self.tavily_base_url,
                     query,
                     num_results,
                     include_text,
@@ -273,6 +281,10 @@ impl WorkspaceTools {
                     &self.exa_base_url,
                     self.firecrawl_api_key.as_deref(),
                     &self.firecrawl_base_url,
+                    self.brave_api_key.as_deref(),
+                    &self.brave_base_url,
+                    self.tavily_api_key.as_deref(),
+                    &self.tavily_base_url,
                     &urls,
                     self.max_file_chars,
                     self.command_timeout_sec,
diff --git a/openplanter-desktop/crates/op-core/src/tools/web.rs b/openplanter-desktop/crates/op-core/src/tools/web.rs
index 2b36060e..eda00835 100644
--- a/openplanter-desktop/crates/op-core/src/tools/web.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/web.rs
@@ -1,6 +1,6 @@
-/// Web tools: Exa / Firecrawl / Brave search and fetch_url.
-use std::time::Duration;
 use std::sync::LazyLock;
+/// Web tools: Exa / Firecrawl / Brave / Tavily search and fetch_url.
+use std::time::Duration;
 
 use regex::Regex;
 use serde_json::json;
@@ -161,6 +161,40 @@ async fn brave_request(
         .map_err(|e| format!("Brave API returned non-JSON payload: {e}"))
 }
 
+async fn tavily_request(
+    api_key: Option<&str>,
+    tavily_base_url: &str,
+    endpoint: &str,
+    payload: &serde_json::Value,
+    timeout_sec: u64,
+) -> Result<serde_json::Value, String> {
+    let api_key = match api_key {
+        Some(value) if !value.trim().is_empty() => value,
+        _ => return Err("TAVILY_API_KEY not configured".into()),
+    };
+
+    let url = format!("{}{}", tavily_base_url.trim_end_matches('/'), endpoint);
+    let client = reqwest::Client::new();
+    let response = client
+        .post(&url)
+        .header("Authorization", format!("Bearer {api_key}"))
+        .header("Content-Type", "application/json")
+        .timeout(Duration::from_secs(timeout_sec))
+        .json(payload)
+        .send()
+        .await
+        .map_err(|e| format!("Tavily API request failed: {e}"))?;
+
+    let response = response
+        .error_for_status()
+        .map_err(|e| format!("Tavily API request failed: {e}"))?;
+
+    response
+        .json::<serde_json::Value>()
+        .await
+        .map_err(|e| format!("Tavily API returned non-JSON payload: {e}"))
+}
+
 async fn fetch_direct_page(url: &str, timeout_sec: u64) -> serde_json::Value {
     let client = reqwest::Client::new();
     let response = match client
@@ -240,6 +274,8 @@ pub async fn web_search(
     firecrawl_base_url: &str,
     brave_api_key: Option<&str>,
     brave_base_url: &str,
+    tavily_api_key: Option<&str>,
+    tavily_base_url: &str,
     query: &str,
     num_results: i64,
     include_text: bool,
@@ -333,10 +369,7 @@ pub async fn web_search(
             Err(error) => return ToolResult::error(format!("Web search failed: {error}")),
         }
     } else if provider == "brave" {
-        let mut params = vec![
-            ("q", query.to_string()),
-            ("count", clamped.to_string()),
-        ];
+        let mut params = vec![("q", query.to_string()), ("count", clamped.to_string())];
         if include_text {
             params.push(("extra_snippets", "true".to_string()));
         }
@@ -411,6 +444,62 @@ pub async fn web_search(
             }
             Err(error) => return ToolResult::error(format!("Web search failed: {error}")),
         }
+    } else if provider == "tavily" {
+        let mut payload = json!({
+            "query": query,
+            "max_results": clamped,
+        });
+        if include_text {
+            payload["include_raw_content"] = json!("markdown");
+        }
+
+        match tavily_request(
+            tavily_api_key,
+            tavily_base_url,
+            "/search",
+            &payload,
+            timeout_sec,
+        )
+        .await
+        {
+            Ok(body) => {
+                let mut results: Vec<serde_json::Value> = Vec::new();
+                if let Some(rows) = body.get("results").and_then(|value| value.as_array()) {
+                    for row in rows {
+                        let snippet = row
+                            .get("content")
+                            .and_then(|value| value.as_str())
+                            .or_else(|| row.get("snippet").and_then(|value| value.as_str()))
+                            .unwrap_or("");
+                        let mut item = json!({
+                            "url": row.get("url").and_then(|value| value.as_str()).unwrap_or(""),
+                            "title": row.get("title").and_then(|value| value.as_str()).unwrap_or(""),
+                            "snippet": snippet,
+                        });
+                        if include_text {
+                            if let Some(text) = row
+                                .get("raw_content")
+                                .and_then(|value| value.as_str())
+                                .or_else(|| row.get("content").and_then(|value| value.as_str()))
+                            {
+                                if !text.is_empty() {
+                                    item["text"] = json!(clip(text, 4_000));
+                                }
+                            }
+                        }
+                        results.push(item);
+                    }
+                }
+
+                json!({
+                    "query": query,
+                    "provider": provider,
+                    "results": results,
+                    "total": results.len(),
+                })
+            }
+            Err(error) => return ToolResult::error(format!("Web search failed: {error}")),
+        }
     } else {
         let mut payload = json!({
             "query": query,
@@ -468,6 +557,10 @@ pub async fn fetch_url(
     exa_base_url: &str,
     firecrawl_api_key: Option<&str>,
     firecrawl_base_url: &str,
+    brave_api_key: Option<&str>,
+    brave_base_url: &str,
+    tavily_api_key: Option<&str>,
+    tavily_base_url: &str,
     urls: &[String],
     max_file_chars: usize,
     timeout_sec: u64,
@@ -534,6 +627,8 @@ pub async fn fetch_url(
             "total": pages.len(),
         })
     } else if provider == "brave" {
+        let _ = brave_api_key;
+        let _ = brave_base_url;
         let mut pages: Vec<serde_json::Value> = Vec::new();
         for url in &normalized {
             pages.push(fetch_direct_page(url, timeout_sec).await);
@@ -544,6 +639,48 @@ pub async fn fetch_url(
             "pages": pages,
             "total": pages.len(),
         })
+    } else if provider == "tavily" {
+        let payload = json!({
+            "urls": normalized,
+            "extract_depth": "basic",
+            "include_images": false,
+        });
+
+        match tavily_request(
+            tavily_api_key,
+            tavily_base_url,
+            "/extract",
+            &payload,
+            timeout_sec,
+        )
+        .await
+        {
+            Ok(body) => {
+                let mut pages: Vec<serde_json::Value> = Vec::new();
+                if let Some(rows) = body.get("results").and_then(|value| value.as_array()) {
+                    for row in rows {
+                        pages.push(json!({
+                            "url": row.get("url").and_then(|value| value.as_str()).unwrap_or(""),
+                            "title": row.get("title").and_then(|value| value.as_str()).unwrap_or(""),
+                            "text": clip(
+                                row.get("raw_content")
+                                    .and_then(|value| value.as_str())
+                                    .or_else(|| row.get("content").and_then(|value| value.as_str()))
+                                    .unwrap_or(""),
+                                8_000,
+                            ),
+                        }));
+                    }
+                }
+
+                json!({
+                    "provider": provider,
+                    "pages": pages,
+                    "total": pages.len(),
+                })
+            }
+            Err(error) => return ToolResult::error(format!("Fetch URL failed: {error}")),
+        }
     } else {
         let payload = json!({
             "ids": normalized,
@@ -705,6 +842,8 @@ mod tests {
             "https://api.firecrawl.dev/v1",
             None,
             "https://api.search.brave.com/res/v1",
+            None,
+            "https://api.tavily.com",
             "example query",
             5,
             true,
@@ -746,6 +885,8 @@ mod tests {
             &format!("http://{addr}"),
             None,
             "https://api.search.brave.com/res/v1",
+            None,
+            "https://api.tavily.com",
             "example query",
             5,
             true,
@@ -781,6 +922,10 @@ mod tests {
             "https://api.exa.ai",
             Some("fc-key"),
             &format!("http://{addr}"),
+            None,
+            "https://api.search.brave.com/res/v1",
+            None,
+            "https://api.tavily.com",
             &[String::from("https://example.com/article")],
             20_000,
             5,
@@ -821,6 +966,8 @@ mod tests {
             "https://api.firecrawl.dev/v1",
             Some("brave-key"),
             &format!("http://{addr}"),
+            None,
+            "https://api.tavily.com",
             "example query",
             5,
             true,
@@ -833,7 +980,12 @@ mod tests {
         let parsed: Value = serde_json::from_str(&result.content).unwrap();
         assert_eq!(parsed["provider"], "brave");
         assert_eq!(parsed["results"][0]["title"], "Brave Title");
-        assert!(parsed["results"][0]["text"].as_str().unwrap().contains("Extra context"));
+        assert!(
+            parsed["results"][0]["text"]
+                .as_str()
+                .unwrap()
+                .contains("Extra context")
+        );
     }
 
     #[tokio::test]
@@ -851,6 +1003,10 @@ mod tests {
             "https://api.exa.ai",
             None,
             "https://api.firecrawl.dev/v1",
+            None,
+            "https://api.search.brave.com/res/v1",
+            None,
+            "https://api.tavily.com",
             &[format!("http://{addr}/page")],
             20_000,
             5,
@@ -861,7 +1017,12 @@ mod tests {
         let parsed: Value = serde_json::from_str(&result.content).unwrap();
         assert_eq!(parsed["provider"], "brave");
         assert_eq!(parsed["pages"][0]["title"], "Brave Page");
-        assert!(parsed["pages"][0]["text"].as_str().unwrap().contains("Hello Brave"));
+        assert!(
+            parsed["pages"][0]["text"]
+                .as_str()
+                .unwrap()
+                .contains("Hello Brave")
+        );
     }
 
     #[tokio::test]
@@ -874,6 +1035,8 @@ mod tests {
             "https://api.firecrawl.dev/v1",
             None,
             "https://api.search.brave.com/res/v1",
+            None,
+            "https://api.tavily.com",
             "example query",
             5,
             false,
@@ -896,6 +1059,8 @@ mod tests {
             "https://api.firecrawl.dev/v1",
             None,
             "https://api.search.brave.com/res/v1",
+            None,
+            "https://api.tavily.com",
             "example query",
             5,
             false,
@@ -908,6 +1073,112 @@ mod tests {
         assert!(result.content.contains("BRAVE_API_KEY"));
     }
 
+    #[tokio::test]
+    async fn test_web_search_tavily_output_shape() {
+        let addr = start_json_server(
+            "/search",
+            json!({
+                "results": [
+                    {
+                        "url": "https://example.com/tavily",
+                        "title": "Tavily Title",
+                        "content": "Tavily snippet",
+                        "raw_content": "Tavily raw content"
+                    }
+                ]
+            }),
+        )
+        .await;
+
+        let result = web_search(
+            "tavily",
+            None,
+            "https://api.exa.ai",
+            None,
+            "https://api.firecrawl.dev/v1",
+            None,
+            "https://api.search.brave.com/res/v1",
+            Some("tavily-key"),
+            &format!("http://{addr}"),
+            "example query",
+            5,
+            true,
+            20_000,
+            5,
+        )
+        .await;
+
+        assert!(!result.is_error);
+        let parsed: Value = serde_json::from_str(&result.content).unwrap();
+        assert_eq!(parsed["provider"], "tavily");
+        assert_eq!(parsed["results"][0]["title"], "Tavily Title");
+        assert_eq!(parsed["results"][0]["snippet"], "Tavily snippet");
+        assert_eq!(parsed["results"][0]["text"], "Tavily raw content");
+    }
+
+    #[tokio::test]
+    async fn test_fetch_url_tavily_output_shape() {
+        let addr = start_json_server(
+            "/extract",
+            json!({
+                "results": [
+                    {
+                        "url": "https://example.com/article",
+                        "title": "Tavily Article",
+                        "raw_content": "Article body"
+                    }
+                ]
+            }),
+        )
+        .await;
+
+        let result = fetch_url(
+            "tavily",
+            None,
+            "https://api.exa.ai",
+            None,
+            "https://api.firecrawl.dev/v1",
+            None,
+            "https://api.search.brave.com/res/v1",
+            Some("tavily-key"),
+            &format!("http://{addr}"),
+            &[String::from("https://example.com/article")],
+            20_000,
+            5,
+        )
+        .await;
+
+        assert!(!result.is_error);
+        let parsed: Value = serde_json::from_str(&result.content).unwrap();
+        assert_eq!(parsed["provider"], "tavily");
+        assert_eq!(parsed["pages"][0]["title"], "Tavily Article");
+        assert_eq!(parsed["pages"][0]["text"], "Article body");
+    }
+
+    #[tokio::test]
+    async fn test_missing_tavily_key_errors() {
+        let result = web_search(
+            "tavily",
+            None,
+            "https://api.exa.ai",
+            None,
+            "https://api.firecrawl.dev/v1",
+            None,
+            "https://api.search.brave.com/res/v1",
+            None,
+            "https://api.tavily.com",
+            "example query",
+            5,
+            false,
+            20_000,
+            5,
+        )
+        .await;
+
+        assert!(result.is_error);
+        assert!(result.content.contains("TAVILY_API_KEY"));
+    }
+
     #[tokio::test]
     async fn test_exa_http_error_bubbles_up() {
         let addr = start_status_server("/search", StatusCode::BAD_GATEWAY).await;
@@ -920,6 +1191,8 @@ mod tests {
             "https://api.firecrawl.dev/v1",
             None,
             "https://api.search.brave.com/res/v1",
+            None,
+            "https://api.tavily.com",
             "example query",
             5,
             false,
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/config.rs b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
index 9e624b3e..4d331489 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/config.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
@@ -210,6 +210,7 @@ pub fn build_credential_status(cfg: &op_core::config::AgentConfig) -> HashMap<St
     status.insert("exa".to_string(), cfg.exa_api_key.is_some());
     status.insert("firecrawl".to_string(), cfg.firecrawl_api_key.is_some());
     status.insert("brave".to_string(), cfg.brave_api_key.is_some());
+    status.insert("tavily".to_string(), cfg.tavily_api_key.is_some());
     status.insert("voyage".to_string(), cfg.voyage_api_key.is_some());
     status
 }
@@ -262,6 +263,10 @@ pub async fn get_credentials_status(
         "brave".to_string(),
         cfg.brave_api_key.is_some() || env_creds.brave_api_key.is_some(),
     );
+    status.insert(
+        "tavily".to_string(),
+        cfg.tavily_api_key.is_some() || env_creds.tavily_api_key.is_some(),
+    );
     status.insert(
         "voyage".to_string(),
         cfg.voyage_api_key.is_some() || env_creds.voyage_api_key.is_some(),
@@ -372,6 +377,7 @@ mod tests {
         cfg.exa_api_key = None;
         cfg.firecrawl_api_key = None;
         cfg.brave_api_key = None;
+        cfg.tavily_api_key = None;
         cfg.voyage_api_key = None;
         let status = build_credential_status(&cfg);
         assert_eq!(status["openai"], false);
@@ -381,6 +387,7 @@ mod tests {
         assert_eq!(status["zai"], false);
         assert_eq!(status["ollama"], true, "ollama always true");
         assert_eq!(status["brave"], false);
+        assert_eq!(status["tavily"], false);
         assert_eq!(status["voyage"], false);
     }
 
@@ -436,7 +443,8 @@ mod tests {
         cfg.exa_api_key = Some("k6".to_string());
         cfg.firecrawl_api_key = Some("k7".to_string());
         cfg.brave_api_key = Some("k8".to_string());
-        cfg.voyage_api_key = Some("k9".to_string());
+        cfg.tavily_api_key = Some("k9".to_string());
+        cfg.voyage_api_key = Some("k10".to_string());
         let status = build_credential_status(&cfg);
         for (provider, has_key) in &status {
             assert!(has_key, "{} should be true when key is set", provider);
@@ -444,13 +452,13 @@ mod tests {
     }
 
     #[test]
-    fn test_cred_status_has_ten_entries() {
+    fn test_cred_status_has_eleven_entries() {
         let cfg = op_core::config::AgentConfig::from_env("/nonexistent");
         let status = build_credential_status(&cfg);
         assert_eq!(
             status.len(),
-            10,
-            "should have 10 entries (6 providers + 4 services)"
+            11,
+            "should have 11 entries (6 providers + 5 services)"
         );
     }
 
diff --git a/openplanter-desktop/crates/op-tauri/src/state.rs b/openplanter-desktop/crates/op-tauri/src/state.rs
index 9cc0d01d..f19f1be5 100644
--- a/openplanter-desktop/crates/op-tauri/src/state.rs
+++ b/openplanter-desktop/crates/op-tauri/src/state.rs
@@ -101,6 +101,7 @@ pub fn merge_credentials_into_config(
     merge!(exa_api_key);
     merge!(firecrawl_api_key);
     merge!(brave_api_key);
+    merge!(tavily_api_key);
     merge!(voyage_api_key);
 }
 
@@ -428,6 +429,7 @@ mod tests {
         cfg.exa_api_key = None;
         cfg.firecrawl_api_key = None;
         cfg.brave_api_key = None;
+        cfg.tavily_api_key = None;
         cfg.voyage_api_key = None;
         cfg
     }
@@ -512,12 +514,13 @@ mod tests {
     }
 
     #[test]
-    fn test_merge_includes_zai_firecrawl_brave_and_voyage() {
+    fn test_merge_includes_zai_firecrawl_brave_tavily_and_voyage() {
         let mut cfg = empty_cfg();
         let env_creds = CredentialBundle {
             zai_api_key: Some("zai-env".to_string()),
             firecrawl_api_key: Some("fc-env".to_string()),
             brave_api_key: Some("brave-env".to_string()),
+            tavily_api_key: Some("tavily-env".to_string()),
             voyage_api_key: Some("voyage-env".to_string()),
             ..Default::default()
         };
@@ -525,6 +528,7 @@ mod tests {
         assert_eq!(cfg.zai_api_key, Some("zai-env".to_string()));
         assert_eq!(cfg.firecrawl_api_key, Some("fc-env".to_string()));
         assert_eq!(cfg.brave_api_key, Some("brave-env".to_string()));
+        assert_eq!(cfg.tavily_api_key, Some("tavily-env".to_string()));
         assert_eq!(cfg.voyage_api_key, Some("voyage-env".to_string()));
     }
 
diff --git a/openplanter-desktop/frontend/src/api/invoke.test.ts b/openplanter-desktop/frontend/src/api/invoke.test.ts
index f5ab7de8..965fbbbd 100644
--- a/openplanter-desktop/frontend/src/api/invoke.test.ts
+++ b/openplanter-desktop/frontend/src/api/invoke.test.ts
@@ -127,6 +127,7 @@ describe("invoke wrappers", () => {
       exa: false,
       firecrawl: true,
       brave: false,
+      tavily: true,
       voyage: true,
     }));
     const status = await getCredentialsStatus();
@@ -135,6 +136,7 @@ describe("invoke wrappers", () => {
     expect(status.zai).toBe(true);
     expect(status.firecrawl).toBe(true);
     expect(status.brave).toBe(false);
+    expect(status.tavily).toBe(true);
     expect(status.voyage).toBe(true);
   });
 
diff --git a/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts b/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
index e019d03a..4ef78cf7 100644
--- a/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
+++ b/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
@@ -81,13 +81,13 @@ describe("completionRegistry", () => {
     expect(childValues).toEqual(["low", "medium", "high", "off"]);
   });
 
-  it("/web-search has exa, firecrawl, and brave children", () => {
+  it("/web-search has exa, firecrawl, brave, and tavily children", () => {
     const webSearchCmd = COMMAND_COMPLETIONS.find((c) => c.value === "/web-search");
     expect(webSearchCmd).toBeDefined();
     expect(webSearchCmd!.children).toBeDefined();
 
     const childValues = webSearchCmd!.children!.map((c) => c.value);
-    expect(childValues).toEqual(["exa", "firecrawl", "brave"]);
+    expect(childValues).toEqual(["exa", "firecrawl", "brave", "tavily"]);
     expect(webSearchCmd!.children![0].children?.[0].value).toBe("--save");
   });
 
diff --git a/openplanter-desktop/frontend/src/commands/completionRegistry.ts b/openplanter-desktop/frontend/src/commands/completionRegistry.ts
index 2133f2d3..973dc00e 100644
--- a/openplanter-desktop/frontend/src/commands/completionRegistry.ts
+++ b/openplanter-desktop/frontend/src/commands/completionRegistry.ts
@@ -40,6 +40,7 @@ const WEB_SEARCH_PROVIDERS: CompletionItem[] = [
   { value: "exa", description: "Use Exa for web search", children: SAVE_FLAG },
   { value: "firecrawl", description: "Use Firecrawl for web search", children: SAVE_FLAG },
   { value: "brave", description: "Use Brave Search for web search", children: SAVE_FLAG },
+  { value: "tavily", description: "Use Tavily for web search", children: SAVE_FLAG },
 ];
 
 const ZAI_PLANS: CompletionItem[] = [
diff --git a/openplanter-desktop/frontend/src/commands/slash.ts b/openplanter-desktop/frontend/src/commands/slash.ts
index 34df61f1..748b312d 100644
--- a/openplanter-desktop/frontend/src/commands/slash.ts
+++ b/openplanter-desktop/frontend/src/commands/slash.ts
@@ -34,7 +34,7 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
           "  /zai-plan <plan>   Set Z.AI endpoint family (paygo, coding)",
           "  /zai-plan <plan> --save  Set and persist",
           "  /web-search        Show current web search provider",
-          "  /web-search <provider>  Set web search provider (exa, firecrawl, brave)",
+          "  /web-search <provider>  Set web search provider (exa, firecrawl, brave, tavily)",
           "  /web-search <provider> --save  Set and persist",
           "  /reasoning          Show/set reasoning effort",
           "  /reasoning <level>  Set level (low, medium, high, off)",
diff --git a/openplanter-desktop/frontend/src/commands/webSearch.test.ts b/openplanter-desktop/frontend/src/commands/webSearch.test.ts
index cb5ed492..70d08e6d 100644
--- a/openplanter-desktop/frontend/src/commands/webSearch.test.ts
+++ b/openplanter-desktop/frontend/src/commands/webSearch.test.ts
@@ -31,7 +31,7 @@ describe("handleWebSearchCommand", () => {
 
   it("switches provider for the current session", async () => {
     __setHandler("update_config", ({ partial }: { partial: Record<string, string> }) => {
-      expect(partial.web_search_provider).toBe("brave");
+      expect(partial.web_search_provider).toBe("tavily");
       return {
         provider: "anthropic",
         model: "claude-opus-4-6",
@@ -42,14 +42,14 @@ describe("handleWebSearchCommand", () => {
         max_depth: 4,
         max_steps_per_call: 100,
         reasoning_effort: "high",
-        web_search_provider: "brave",
+        web_search_provider: "tavily",
         demo: false,
       };
     });
 
-    const result = await handleWebSearchCommand("brave");
-    expect(result.lines).toContain("Web search provider set to: brave");
-    expect(appState.get().webSearchProvider).toBe("brave");
+    const result = await handleWebSearchCommand("tavily");
+    expect(result.lines).toContain("Web search provider set to: tavily");
+    expect(appState.get().webSearchProvider).toBe("tavily");
   });
 
   it("save persists the selected provider", async () => {
@@ -63,14 +63,14 @@ describe("handleWebSearchCommand", () => {
       max_depth: 4,
       max_steps_per_call: 100,
       reasoning_effort: "high",
-      web_search_provider: "brave",
+      web_search_provider: "tavily",
       demo: false,
     }));
     __setHandler("save_settings", ({ settings }: { settings: Record<string, string> }) => {
-      expect(settings.web_search_provider).toBe("brave");
+      expect(settings.web_search_provider).toBe("tavily");
     });
 
-    const result = await handleWebSearchCommand("brave --save");
+    const result = await handleWebSearchCommand("tavily --save");
     expect(result.lines).toContain("(Settings saved)");
   });
 });
diff --git a/openplanter-desktop/frontend/src/commands/webSearch.ts b/openplanter-desktop/frontend/src/commands/webSearch.ts
index c18ed806..9db4fdf4 100644
--- a/openplanter-desktop/frontend/src/commands/webSearch.ts
+++ b/openplanter-desktop/frontend/src/commands/webSearch.ts
@@ -3,7 +3,7 @@ import { saveSettings, updateConfig } from "../api/invoke";
 import { appState } from "../state/store";
 import type { CommandResult } from "./model";
 
-const VALID_WEB_SEARCH_PROVIDERS = ["exa", "firecrawl", "brave"];
+const VALID_WEB_SEARCH_PROVIDERS = ["exa", "firecrawl", "brave", "tavily"];
 
 /** Handle /web-search [provider] [--save]. */
 export async function handleWebSearchCommand(args: string): Promise<CommandResult> {
diff --git a/openplanter-desktop/frontend/src/components/App.test.ts b/openplanter-desktop/frontend/src/components/App.test.ts
index 30037232..1a3d0bd6 100644
--- a/openplanter-desktop/frontend/src/components/App.test.ts
+++ b/openplanter-desktop/frontend/src/components/App.test.ts
@@ -48,7 +48,7 @@ describe("createApp", () => {
     __setHandler("list_sessions", () => [SESSION_B, SESSION_A]);
     __setHandler("get_credentials_status", () => ({
       openai: true, anthropic: true, openrouter: false,
-      cerebras: false, zai: true, ollama: true, exa: false, firecrawl: true, brave: false, voyage: true,
+      cerebras: false, zai: true, ollama: true, exa: false, firecrawl: true, brave: false, tavily: true, voyage: true,
     }));
     __setHandler("open_session", () => ({
       id: "20260227-120000-cccc3333",
@@ -103,7 +103,7 @@ describe("createApp", () => {
 
     await vi.waitFor(() => {
       const creds = root.querySelector(".cred-status");
-      expect(creds!.children.length).toBe(10);
+      expect(creds!.children.length).toBe(11);
       expect(creds!.querySelector(".cred-ok")!.textContent).toContain("openai");
       expect(creds!.querySelector(".cred-missing")!.textContent).toContain("openrouter");
     });
diff --git a/openplanter-desktop/frontend/src/components/App.ts b/openplanter-desktop/frontend/src/components/App.ts
index 9b162fdf..715c0f38 100644
--- a/openplanter-desktop/frontend/src/components/App.ts
+++ b/openplanter-desktop/frontend/src/components/App.ts
@@ -302,7 +302,7 @@ async function loadCredentials(container: HTMLElement): Promise<void> {
   try {
     const status = await getCredentialsStatus();
     container.innerHTML = "";
-    const providers = ["openai", "anthropic", "openrouter", "cerebras", "zai", "ollama", "exa", "firecrawl", "brave", "voyage"];
+    const providers = ["openai", "anthropic", "openrouter", "cerebras", "zai", "ollama", "exa", "firecrawl", "brave", "tavily", "voyage"];
     for (const p of providers) {
       const row = document.createElement("div");
       const hasKey = status[p] ?? false;
diff --git a/tests/test_coverage_gaps.py b/tests/test_coverage_gaps.py
index 067e255e..25675a90 100644
--- a/tests/test_coverage_gaps.py
+++ b/tests/test_coverage_gaps.py
@@ -69,12 +69,18 @@ def test_inner_quotes_preserved(self) -> None:
 class MergeMissingTests(unittest.TestCase):
     def test_fills_missing_keys(self) -> None:
         a = CredentialBundle(openai_api_key="oa")
-        b = CredentialBundle(anthropic_api_key="an", exa_api_key="exa", brave_api_key="brave")
+        b = CredentialBundle(
+            anthropic_api_key="an",
+            exa_api_key="exa",
+            brave_api_key="brave",
+            tavily_api_key="tavily",
+        )
         a.merge_missing(b)
         self.assertEqual(a.openai_api_key, "oa")
         self.assertEqual(a.anthropic_api_key, "an")
         self.assertEqual(a.exa_api_key, "exa")
         self.assertEqual(a.brave_api_key, "brave")
+        self.assertEqual(a.tavily_api_key, "tavily")
 
     def test_does_not_overwrite_existing(self) -> None:
         a = CredentialBundle(openai_api_key="mine")
@@ -97,6 +103,7 @@ def test_merge_all_fields(self) -> None:
             cerebras_api_key="cb",
             exa_api_key="exa",
             brave_api_key="brave",
+            tavily_api_key="tavily",
         )
         a.merge_missing(b)
         self.assertEqual(a.openai_api_key, "oa")
@@ -105,6 +112,7 @@ def test_merge_all_fields(self) -> None:
         self.assertEqual(a.cerebras_api_key, "cb")
         self.assertEqual(a.exa_api_key, "exa")
         self.assertEqual(a.brave_api_key, "brave")
+        self.assertEqual(a.tavily_api_key, "tavily")
 
 
 # ---------------------------------------------------------------------------
@@ -120,6 +128,7 @@ def test_reads_standard_env_vars(self) -> None:
             "OPENROUTER_API_KEY": "or-key",
             "EXA_API_KEY": "exa-key",
             "BRAVE_API_KEY": "brave-key",
+            "TAVILY_API_KEY": "tavily-key",
         }
         with patch.dict(os.environ, env, clear=True):
             creds = credentials_from_env()
@@ -128,6 +137,7 @@ def test_reads_standard_env_vars(self) -> None:
         self.assertEqual(creds.openrouter_api_key, "or-key")
         self.assertEqual(creds.exa_api_key, "exa-key")
         self.assertEqual(creds.brave_api_key, "brave-key")
+        self.assertEqual(creds.tavily_api_key, "tavily-key")
 
     def test_rlm_prefix_takes_priority(self) -> None:
         env = {
@@ -191,6 +201,8 @@ def test_custom_env_overrides(self) -> None:
             "OPENPLANTER_MAX_DEPTH": "5",
             "OPENPLANTER_MAX_STEPS": "20",
             "OPENPLANTER_SHELL": "/bin/bash",
+            "OPENPLANTER_WEB_SEARCH_PROVIDER": "tavily",
+            "OPENPLANTER_TAVILY_BASE_URL": "https://tavily.example",
         }
         with patch.dict(os.environ, env, clear=True):
             cfg = AgentConfig.from_env("/tmp/test-ws")
@@ -200,6 +212,8 @@ def test_custom_env_overrides(self) -> None:
         self.assertEqual(cfg.max_depth, 5)
         self.assertEqual(cfg.max_steps_per_call, 20)
         self.assertEqual(cfg.shell, "/bin/bash")
+        self.assertEqual(cfg.web_search_provider, "tavily")
+        self.assertEqual(cfg.tavily_base_url, "https://tavily.example")
 
     def test_rate_limit_and_zai_stream_retries_from_env(self) -> None:
         env = {
@@ -247,6 +261,7 @@ def test_api_keys_from_env(self) -> None:
             "OPENROUTER_API_KEY": "or",
             "EXA_API_KEY": "exa",
             "BRAVE_API_KEY": "brave",
+            "TAVILY_API_KEY": "tavily",
         }
         with patch.dict(os.environ, env, clear=True):
             cfg = AgentConfig.from_env("/tmp/test-ws")
@@ -255,6 +270,7 @@ def test_api_keys_from_env(self) -> None:
         self.assertEqual(cfg.openrouter_api_key, "or")
         self.assertEqual(cfg.exa_api_key, "exa")
         self.assertEqual(cfg.brave_api_key, "brave")
+        self.assertEqual(cfg.tavily_api_key, "tavily")
 
     def test_openai_oauth_token_from_env_without_api_key(self) -> None:
         env = {"OPENAI_OAUTH_TOKEN": "oauth-token"}
diff --git a/tests/test_credentials.py b/tests/test_credentials.py
index 6d729824..161b66cb 100644
--- a/tests/test_credentials.py
+++ b/tests/test_credentials.py
@@ -27,6 +27,7 @@ def test_parse_env_file_extracts_supported_keys(self) -> None:
                         "EXA_API_KEY=exa-key",
                         "FIRECRAWL_API_KEY=fc-key",
                         "BRAVE_API_KEY=brave-key",
+                        "OPENPLANTER_TAVILY_API_KEY=tavily-key",
                     ]
                 ),
                 encoding="utf-8",
@@ -40,6 +41,7 @@ def test_parse_env_file_extracts_supported_keys(self) -> None:
             self.assertEqual(creds.exa_api_key, "exa-key")
             self.assertEqual(creds.firecrawl_api_key, "fc-key")
             self.assertEqual(creds.brave_api_key, "brave-key")
+            self.assertEqual(creds.tavily_api_key, "tavily-key")
 
     def test_store_roundtrip(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
@@ -54,6 +56,7 @@ def test_store_roundtrip(self) -> None:
                 exa_api_key="exa",
                 firecrawl_api_key="fc",
                 brave_api_key="brave",
+                tavily_api_key="tavily",
             )
             store.save(creds)
             loaded = store.load()
diff --git a/tests/test_tools.py b/tests/test_tools.py
index 6a5f9887..c1fd374d 100644
--- a/tests/test_tools.py
+++ b/tests/test_tools.py
@@ -203,6 +203,59 @@ def test_fetch_url_with_mocked_brave_response(self) -> None:
             self.assertEqual(parsed["pages"][0]["title"], "Brave Example")
             self.assertEqual(parsed["pages"][0]["text"], "Page body")
 
+    def test_web_search_with_mocked_tavily_response(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            tools = WorkspaceTools(
+                root=root,
+                web_search_provider="tavily",
+                tavily_api_key="tavily-key",
+            )
+            mocked = {
+                "results": [
+                    {
+                        "url": "https://example.com/tavily",
+                        "title": "Tavily Result",
+                        "content": "Snippet",
+                        "raw_content": "Long markdown body",
+                    }
+                ]
+            }
+            with patch.object(WorkspaceTools, "_tavily_request", return_value=mocked):
+                raw = tools.web_search("test query", num_results=3, include_text=True)
+            parsed = json.loads(raw)
+            self.assertEqual(parsed["provider"], "tavily")
+            self.assertEqual(parsed["query"], "test query")
+            self.assertEqual(parsed["total"], 1)
+            self.assertEqual(parsed["results"][0]["url"], "https://example.com/tavily")
+            self.assertEqual(parsed["results"][0]["snippet"], "Snippet")
+            self.assertEqual(parsed["results"][0]["text"], "Long markdown body")
+
+    def test_fetch_url_with_mocked_tavily_response(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            tools = WorkspaceTools(
+                root=root,
+                web_search_provider="tavily",
+                tavily_api_key="tavily-key",
+            )
+            mocked = {
+                "results": [
+                    {
+                        "url": "https://example.com/tavily",
+                        "title": "Tavily Example",
+                        "raw_content": "Page body",
+                    }
+                ]
+            }
+            with patch.object(WorkspaceTools, "_tavily_request", return_value=mocked):
+                raw = tools.fetch_url(["https://example.com/tavily"])
+            parsed = json.loads(raw)
+            self.assertEqual(parsed["provider"], "tavily")
+            self.assertEqual(parsed["total"], 1)
+            self.assertEqual(parsed["pages"][0]["title"], "Tavily Example")
+            self.assertEqual(parsed["pages"][0]["text"], "Page body")
+
     def test_web_search_without_exa_key(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)
@@ -224,6 +277,13 @@ def test_web_search_without_brave_key(self) -> None:
             out = tools.web_search("test")
             self.assertIn("BRAVE_API_KEY not configured", out)
 
+    def test_web_search_without_tavily_key(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            tools = WorkspaceTools(root=root, web_search_provider="tavily", tavily_api_key=None)
+            out = tools.web_search("test")
+            self.assertIn("TAVILY_API_KEY not configured", out)
+
     def test_repo_map_python_symbols(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)

From f104f0c2ee087bb39fce37414bd10f5371bde881 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Thu, 12 Mar 2026 15:58:58 -0400
Subject: [PATCH 09/58] Add desktop init and migration workflows

---
 .../crates/op-core/src/config_hydration.rs    |  126 ++
 .../crates/op-core/src/events.rs              |  126 ++
 openplanter-desktop/crates/op-core/src/lib.rs |    2 +
 .../crates/op-core/src/workspace_init.rs      | 1176 +++++++++++++++++
 .../crates/op-tauri/src/commands/agent.rs     |   24 +-
 .../crates/op-tauri/src/commands/init.rs      |   82 ++
 .../crates/op-tauri/src/commands/mod.rs       |    1 +
 .../crates/op-tauri/src/main.rs               |    5 +
 .../crates/op-tauri/src/state.rs              |  143 +-
 .../frontend/src/api/events.test.ts           |   17 +
 .../frontend/src/api/events.ts                |   15 +-
 .../frontend/src/api/invoke.test.ts           |   82 ++
 .../frontend/src/api/invoke.ts                |   29 +
 openplanter-desktop/frontend/src/api/types.ts |   76 ++
 .../src/commands/completionRegistry.test.ts   |   13 +
 .../src/commands/completionRegistry.ts        |   11 +
 .../frontend/src/commands/init.ts             |  133 ++
 .../frontend/src/commands/slash.test.ts       |   43 +
 .../frontend/src/commands/slash.ts            |    7 +
 .../frontend/src/components/App.test.ts       |   40 +-
 .../frontend/src/components/App.ts            |    5 +
 .../frontend/src/components/InputBar.test.ts  |   47 +-
 .../frontend/src/components/InputBar.ts       |   20 +-
 .../src/components/WorkspaceInitGate.ts       |  402 ++++++
 openplanter-desktop/frontend/src/main.ts      |   26 +-
 .../frontend/src/state/store.test.ts          |    3 +
 .../frontend/src/state/store.ts               |   20 +
 27 files changed, 2541 insertions(+), 133 deletions(-)
 create mode 100644 openplanter-desktop/crates/op-core/src/config_hydration.rs
 create mode 100644 openplanter-desktop/crates/op-core/src/workspace_init.rs
 create mode 100644 openplanter-desktop/crates/op-tauri/src/commands/init.rs
 create mode 100644 openplanter-desktop/frontend/src/commands/init.ts
 create mode 100644 openplanter-desktop/frontend/src/components/WorkspaceInitGate.ts

diff --git a/openplanter-desktop/crates/op-core/src/config_hydration.rs b/openplanter-desktop/crates/op-core/src/config_hydration.rs
new file mode 100644
index 00000000..90177523
--- /dev/null
+++ b/openplanter-desktop/crates/op-core/src/config_hydration.rs
@@ -0,0 +1,126 @@
+use std::env;
+
+use crate::config::{
+    AgentConfig, FOUNDRY_OPENAI_API_KEY_PLACEHOLDER, normalize_web_search_provider,
+    normalize_zai_plan, resolve_openai_api_key, resolve_zai_base_url,
+};
+use crate::credentials::CredentialBundle;
+use crate::settings::PersistentSettings;
+
+/// Merge credentials into an AgentConfig.
+/// Priority: existing config value > env_creds > file_creds.
+pub fn merge_credentials_into_config(
+    cfg: &mut AgentConfig,
+    env_creds: &CredentialBundle,
+    file_creds: &CredentialBundle,
+) {
+    if cfg.openai_oauth_token.is_none() {
+        cfg.openai_oauth_token = env_creds
+            .openai_oauth_token
+            .clone()
+            .or_else(|| file_creds.openai_oauth_token.clone());
+    }
+    cfg.openai_api_key = cfg
+        .openai_api_key
+        .clone()
+        .filter(|value| {
+            let trimmed = value.trim();
+            !trimmed.is_empty() && trimmed != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
+        })
+        .or_else(|| env_creds.openai_api_key.clone())
+        .or_else(|| file_creds.openai_api_key.clone())
+        .or_else(|| cfg.openai_api_key.clone());
+    cfg.openai_api_key = resolve_openai_api_key(
+        cfg.openai_api_key.clone(),
+        &cfg.openai_base_url,
+        cfg.openai_oauth_token.clone(),
+    );
+    cfg.api_key = resolve_openai_api_key(
+        cfg.openai_api_key
+            .clone()
+            .filter(|value| {
+                let trimmed = value.trim();
+                !trimmed.is_empty() && trimmed != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
+            })
+            .or_else(|| {
+                cfg.api_key.clone().filter(|value| {
+                    let trimmed = value.trim();
+                    !trimmed.is_empty() && trimmed != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
+                })
+            })
+            .or_else(|| cfg.openai_api_key.clone())
+            .or_else(|| cfg.api_key.clone()),
+        &cfg.base_url,
+        cfg.openai_oauth_token.clone(),
+    );
+
+    macro_rules! merge {
+        ($field:ident) => {
+            if cfg.$field.is_none() {
+                cfg.$field = env_creds
+                    .$field
+                    .clone()
+                    .or_else(|| file_creds.$field.clone());
+            }
+        };
+    }
+    merge!(anthropic_api_key);
+    merge!(openrouter_api_key);
+    merge!(cerebras_api_key);
+    merge!(zai_api_key);
+    merge!(exa_api_key);
+    merge!(firecrawl_api_key);
+    merge!(brave_api_key);
+    merge!(tavily_api_key);
+    merge!(voyage_api_key);
+}
+
+pub fn apply_settings_to_config(cfg: &mut AgentConfig, settings: &PersistentSettings) {
+    if !has_env_value(&["OPENPLANTER_REASONING_EFFORT"]) {
+        if let Some(reasoning_effort) = settings.default_reasoning_effort.clone() {
+            cfg.reasoning_effort = Some(reasoning_effort);
+        }
+    }
+
+    if !has_env_value(&["OPENPLANTER_ZAI_PLAN"]) {
+        if let Some(plan) = settings.zai_plan.as_deref() {
+            cfg.zai_plan = normalize_zai_plan(Some(plan));
+        }
+    }
+
+    if !has_env_value(&["OPENPLANTER_ZAI_BASE_URL"]) {
+        cfg.zai_base_url = resolve_zai_base_url(
+            &cfg.zai_plan,
+            &cfg.zai_paygo_base_url,
+            &cfg.zai_coding_base_url,
+        );
+    }
+
+    if !has_env_value(&["OPENPLANTER_WEB_SEARCH_PROVIDER"]) {
+        if let Some(provider) = settings.web_search_provider.as_deref() {
+            cfg.web_search_provider = normalize_web_search_provider(Some(provider));
+        }
+    }
+
+    if !has_env_value(&["OPENPLANTER_MODEL"]) {
+        let saved_model = if cfg.provider == "auto" {
+            settings.default_model.as_deref()
+        } else {
+            settings
+                .default_model_for_provider(cfg.provider.as_str())
+                .or(settings.default_model.as_deref())
+        };
+        if let Some(model) = saved_model {
+            cfg.model = model.to_string();
+        }
+    }
+}
+
+fn has_env_value(keys: &[&str]) -> bool {
+    keys.iter().any(|key| {
+        env::var(key)
+            .ok()
+            .map(|value| !value.trim().is_empty())
+            .unwrap_or(false)
+    })
+}
diff --git a/openplanter-desktop/crates/op-core/src/events.rs b/openplanter-desktop/crates/op-core/src/events.rs
index 156cfce4..22c111d8 100644
--- a/openplanter-desktop/crates/op-core/src/events.rs
+++ b/openplanter-desktop/crates/op-core/src/events.rs
@@ -164,6 +164,116 @@ pub struct SlashResult {
     pub success: bool,
 }
 
+/// Frontend gate state for workspace initialization.
+#[derive(Debug, Clone, Serialize, Deserialize, PartialEq, Eq)]
+#[serde(rename_all = "snake_case")]
+pub enum InitGateState {
+    Ready,
+    RequiresAction,
+    Blocked,
+}
+
+/// Report returned by standard workspace initialization.
+#[derive(Debug, Clone, Default, Serialize, Deserialize, PartialEq, Eq)]
+pub struct StandardInitReportView {
+    pub workspace: String,
+    pub created_paths: Vec<String>,
+    pub copied_paths: Vec<String>,
+    pub skipped_existing: u64,
+    pub errors: Vec<String>,
+    pub onboarding_required: bool,
+}
+
+/// Current initialization state for the runtime workspace.
+#[derive(Debug, Clone, Default, Serialize, Deserialize, PartialEq, Eq)]
+pub struct InitStatusView {
+    pub runtime_workspace: String,
+    pub gate_state: String,
+    pub onboarding_completed: bool,
+    pub has_openplanter_root: bool,
+    pub has_runtime_wiki: bool,
+    pub has_runtime_index: bool,
+    pub init_state_path: String,
+    pub last_migration_target: Option<String>,
+    pub warnings: Vec<String>,
+}
+
+/// Migration source classification.
+#[derive(Debug, Clone, Serialize, Deserialize, PartialEq, Eq)]
+#[serde(rename_all = "snake_case")]
+pub enum MigrationSourceKind {
+    OpenPlanterWorkspace,
+    ManualResearch,
+    Unknown,
+}
+
+/// Inspection data for a migration source.
+#[derive(Debug, Clone, Default, Serialize, Deserialize, PartialEq, Eq)]
+pub struct MigrationSourceInspection {
+    pub path: String,
+    pub kind: String,
+    pub has_sessions: bool,
+    pub has_settings: bool,
+    pub has_credentials: bool,
+    pub has_runtime_wiki: bool,
+    pub has_baseline_wiki: bool,
+    pub markdown_files: u64,
+    pub warnings: Vec<String>,
+}
+
+/// A user-selected migration source.
+#[derive(Debug, Clone, Default, Serialize, Deserialize, PartialEq, Eq)]
+pub struct MigrationSourceInput {
+    pub path: String,
+}
+
+/// Request payload for migration init.
+#[derive(Debug, Clone, Default, Serialize, Deserialize, PartialEq, Eq)]
+pub struct MigrationInitRequest {
+    pub target_workspace: String,
+    pub sources: Vec<MigrationSourceInput>,
+}
+
+/// Progress stages emitted during migration.
+#[derive(Debug, Clone, Serialize, Deserialize, PartialEq, Eq)]
+#[serde(rename_all = "snake_case")]
+pub enum MigrationProgressStage {
+    Inspect,
+    Copy,
+    MergeSessions,
+    MergeSettings,
+    MergeCredentials,
+    Synthesize,
+    Rewrite,
+    Done,
+}
+
+/// Progress event emitted while migration runs.
+#[derive(Debug, Clone, Default, Serialize, Deserialize, PartialEq, Eq)]
+pub struct MigrationProgressEvent {
+    pub stage: String,
+    pub message: String,
+    pub current: u32,
+    pub total: u32,
+}
+
+/// Result payload returned after migration init completes.
+#[derive(Debug, Clone, Default, Serialize, Deserialize, PartialEq, Eq)]
+pub struct MigrationInitResultView {
+    pub target_workspace: String,
+    pub sources: Vec<String>,
+    pub sessions_copied: u64,
+    pub sessions_renamed: u64,
+    pub settings_merged_fields: Vec<String>,
+    pub credentials_merged_fields: Vec<String>,
+    pub wiki_files_synthesized: u64,
+    pub raw_preservation_root: String,
+    pub rewrite_summary: String,
+    pub restart_required: bool,
+    pub restart_message: String,
+    pub warnings: Vec<String>,
+}
+
 #[cfg(test)]
 mod tests {
     use super::*;
@@ -262,4 +372,20 @@ mod tests {
         assert_eq!(parsed["tool_name"], "read_file");
         assert_eq!(parsed["tokens"]["input_tokens"], 1234);
     }
+
+    #[test]
+    fn test_init_gate_state_serialization() {
+        assert_eq!(
+            serde_json::to_string(&InitGateState::RequiresAction).unwrap(),
+            "\"requires_action\""
+        );
+    }
+
+    #[test]
+    fn test_migration_progress_stage_serialization() {
+        assert_eq!(
+            serde_json::to_string(&MigrationProgressStage::MergeSessions).unwrap(),
+            "\"merge_sessions\""
+        );
+    }
 }
diff --git a/openplanter-desktop/crates/op-core/src/lib.rs b/openplanter-desktop/crates/op-core/src/lib.rs
index 62efa5cf..aeb3a3ef 100644
--- a/openplanter-desktop/crates/op-core/src/lib.rs
+++ b/openplanter-desktop/crates/op-core/src/lib.rs
@@ -1,5 +1,6 @@
 pub mod builder;
 pub mod config;
+pub mod config_hydration;
 pub mod credentials;
 pub mod engine;
 pub mod events;
@@ -9,3 +10,4 @@ pub mod session;
 pub mod settings;
 pub mod tools;
 pub mod wiki;
+pub mod workspace_init;
diff --git a/openplanter-desktop/crates/op-core/src/workspace_init.rs b/openplanter-desktop/crates/op-core/src/workspace_init.rs
new file mode 100644
index 00000000..255fd9b1
--- /dev/null
+++ b/openplanter-desktop/crates/op-core/src/workspace_init.rs
@@ -0,0 +1,1176 @@
+use std::collections::{HashMap, HashSet};
+use std::env;
+use std::fs;
+use std::path::{Path, PathBuf};
+
+use chrono::Utc;
+use serde::{Deserialize, Serialize};
+use thiserror::Error;
+use tokio::runtime::Builder as TokioRuntimeBuilder;
+use tokio_util::sync::CancellationToken;
+use walkdir::WalkDir;
+
+use crate::config::AgentConfig;
+use crate::config_hydration::{apply_settings_to_config, merge_credentials_into_config};
+use crate::credentials::{CredentialBundle, CredentialStore};
+use crate::engine::curator::{CuratorResult, run_curator};
+use crate::events::{
+    InitGateState, InitStatusView, MigrationInitRequest, MigrationInitResultView,
+    MigrationProgressEvent, MigrationProgressStage, MigrationSourceInspection, MigrationSourceKind,
+    SessionInfo, StandardInitReportView,
+};
+use crate::settings::{PersistentSettings, SettingsStore};
+
+const INIT_STATE_FILE: &str = "init-state.json";
+const BASELINE_INDEX: &str = include_str!("../../../../wiki/index.md");
+const BASELINE_TEMPLATE: &str = include_str!("../../../../wiki/template.md");
+
+#[derive(Debug, Error)]
+pub enum WorkspaceInitError {
+    #[error("{0}")]
+    InvalidRequest(String),
+    #[error("I/O error: {0}")]
+    Io(#[from] std::io::Error),
+    #[error("Serialization error: {0}")]
+    Serde(#[from] serde_json::Error),
+    #[error("Curator rewrite failed: {0}")]
+    Curator(String),
+}
+
+#[derive(Debug, Clone, Serialize, Deserialize)]
+struct InitStateFile {
+    version: u32,
+    initialized_at: String,
+    last_standard_init_at: Option<String>,
+    onboarding_completed: bool,
+    last_migration_target: Option<String>,
+}
+
+impl Default for InitStateFile {
+    fn default() -> Self {
+        Self {
+            version: 1,
+            initialized_at: now_rfc3339(),
+            last_standard_init_at: None,
+            onboarding_completed: false,
+            last_migration_target: None,
+        }
+    }
+}
+
+#[derive(Debug, Clone)]
+struct SourceSpec {
+    original: String,
+    canonical: PathBuf,
+    inspection: MigrationSourceInspection,
+}
+
+pub fn run_standard_init(
+    workspace: &Path,
+    session_root_dir: &str,
+    mark_onboarding_complete: bool,
+) -> Result<StandardInitReportView, WorkspaceInitError> {
+    let workspace = workspace.to_path_buf();
+    let root = workspace.join(session_root_dir);
+    let wiki_dir = root.join("wiki");
+    let index_path = wiki_dir.join("index.md");
+    let init_path = root.join(INIT_STATE_FILE);
+
+    let root_preexisting = root.exists();
+    let index_preexisting = index_path.exists();
+    let mut report = StandardInitReportView {
+        workspace: workspace.display().to_string(),
+        ..Default::default()
+    };
+
+    ensure_dir(&workspace, &mut report.created_paths)?;
+    ensure_dir(&root, &mut report.created_paths)?;
+    ensure_dir(&root.join("sessions"), &mut report.created_paths)?;
+    ensure_dir(&root.join("migration"), &mut report.created_paths)?;
+    ensure_dir(
+        &root.join("migration").join("raw"),
+        &mut report.created_paths,
+    )?;
+    ensure_dir(&wiki_dir, &mut report.created_paths)?;
+
+    write_text_if_missing(&root.join("settings.json"), "{}", &mut report)?;
+    write_text_if_missing(&root.join("credentials.json"), "{}", &mut report)?;
+    write_text_if_missing(&index_path, BASELINE_INDEX, &mut report)?;
+    write_text_if_missing(
+        &wiki_dir.join("template.md"),
+        BASELINE_TEMPLATE,
+        &mut report,
+    )?;
+
+    let mut state = read_init_state(&init_path).unwrap_or_else(|| InitStateFile {
+        onboarding_completed: root_preexisting || index_preexisting,
+        ..InitStateFile::default()
+    });
+    if mark_onboarding_complete {
+        state.onboarding_completed = true;
+    }
+    state.last_standard_init_at = Some(now_rfc3339());
+    write_init_state(&init_path, &state)?;
+    report.onboarding_required = !state.onboarding_completed;
+
+    Ok(report)
+}
+
+pub fn complete_first_run_gate(
+    workspace: &Path,
+    session_root_dir: &str,
+) -> Result<InitStatusView, WorkspaceInitError> {
+    let _ = run_standard_init(workspace, session_root_dir, true)?;
+    get_init_status(workspace, session_root_dir)
+}
+
+pub fn get_init_status(
+    workspace: &Path,
+    session_root_dir: &str,
+) -> Result<InitStatusView, WorkspaceInitError> {
+    let root = workspace.join(session_root_dir);
+    let wiki_dir = root.join("wiki");
+    let index_path = wiki_dir.join("index.md");
+    let init_path = root.join(INIT_STATE_FILE);
+    let mut warnings = Vec::new();
+    let init_state = match fs::read_to_string(&init_path) {
+        Ok(content) => match serde_json::from_str::<InitStateFile>(&content) {
+            Ok(state) => Some(state),
+            Err(err) => {
+                warnings.push(format!("Failed to parse init state: {err}"));
+                None
+            }
+        },
+        Err(_) => None,
+    };
+    let onboarding_completed = init_state
+        .as_ref()
+        .map(|state| state.onboarding_completed)
+        .unwrap_or_else(|| root.exists() && index_path.exists());
+    let gate_state =
+        if root.exists() && wiki_dir.exists() && index_path.exists() && onboarding_completed {
+            InitGateState::Ready
+        } else {
+            InitGateState::RequiresAction
+        };
+
+    Ok(InitStatusView {
+        runtime_workspace: workspace.display().to_string(),
+        gate_state: gate_state_name(gate_state).to_string(),
+        onboarding_completed,
+        has_openplanter_root: root.exists(),
+        has_runtime_wiki: wiki_dir.exists(),
+        has_runtime_index: index_path.exists(),
+        init_state_path: init_path.display().to_string(),
+        last_migration_target: init_state.and_then(|state| state.last_migration_target),
+        warnings,
+    })
+}
+
+pub fn inspect_migration_source(path: &Path) -> MigrationSourceInspection {
+    let canonical = canonicalize_or_self(path);
+    let openplanter_root = canonical.join(".openplanter");
+    let runtime_wiki = openplanter_root.join("wiki");
+    let baseline_wiki = canonical.join("wiki");
+    let markdown_files = count_markdown_files(&canonical);
+    let kind = if openplanter_root.exists() {
+        MigrationSourceKind::OpenPlanterWorkspace
+    } else if markdown_files > 0 {
+        MigrationSourceKind::ManualResearch
+    } else {
+        MigrationSourceKind::Unknown
+    };
+
+    MigrationSourceInspection {
+        path: canonical.display().to_string(),
+        kind: source_kind_name(kind).to_string(),
+        has_sessions: openplanter_root.join("sessions").exists(),
+        has_settings: openplanter_root.join("settings.json").exists(),
+        has_credentials: openplanter_root.join("credentials.json").exists(),
+        has_runtime_wiki: runtime_wiki.exists(),
+        has_baseline_wiki: baseline_wiki.exists(),
+        markdown_files,
+        warnings: Vec::new(),
+    }
+}
+
+pub fn run_migration_init<F>(
+    request: &MigrationInitRequest,
+    runtime_config: &AgentConfig,
+    emit_progress: F,
+) -> Result<MigrationInitResultView, WorkspaceInitError>
+where
+    F: FnMut(MigrationProgressEvent),
+{
+    run_migration_init_with_runner(request, runtime_config, emit_progress, run_curator_blocking)
+}
+
+fn run_migration_init_with_runner<F, R>(
+    request: &MigrationInitRequest,
+    runtime_config: &AgentConfig,
+    mut emit_progress: F,
+    mut curator_runner: R,
+) -> Result<MigrationInitResultView, WorkspaceInitError>
+where
+    F: FnMut(MigrationProgressEvent),
+    R: FnMut(&str, &AgentConfig) -> Result<CuratorResult, WorkspaceInitError>,
+{
+    if request.target_workspace.trim().is_empty() {
+        return Err(WorkspaceInitError::InvalidRequest(
+            "Target workspace is required".to_string(),
+        ));
+    }
+    if request.sources.is_empty() {
+        return Err(WorkspaceInitError::InvalidRequest(
+            "At least one migration source is required".to_string(),
+        ));
+    }
+
+    let session_root_dir = runtime_config.session_root_dir.as_str();
+    let target = canonicalize_target_path(&expand_home(&request.target_workspace))?;
+    let total = request.sources.len() as u32;
+    let mut source_specs = Vec::new();
+    let mut seen_sources = HashSet::new();
+
+    for (index, source) in request.sources.iter().enumerate() {
+        let source_path = expand_home(&source.path);
+        if !source_path.exists() {
+            return Err(WorkspaceInitError::InvalidRequest(format!(
+                "Source does not exist: {}",
+                source.path
+            )));
+        }
+        let canonical = canonicalize_or_self(&source_path);
+        if canonical == target {
+            return Err(WorkspaceInitError::InvalidRequest(
+                "Target workspace cannot also be a source".to_string(),
+            ));
+        }
+        if !seen_sources.insert(canonical.clone()) {
+            return Err(WorkspaceInitError::InvalidRequest(format!(
+                "Duplicate source: {}",
+                canonical.display()
+            )));
+        }
+        emit_progress(progress_event(
+            MigrationProgressStage::Inspect,
+            format!("Inspecting {}", canonical.display()),
+            (index + 1) as u32,
+            total,
+        ));
+        source_specs.push(SourceSpec {
+            original: source.path.clone(),
+            canonical: canonical.clone(),
+            inspection: inspect_migration_source(&canonical),
+        });
+    }
+
+    let _ = run_standard_init(&target, session_root_dir, false)?;
+    let root = target.join(session_root_dir);
+    let raw_root = root.join("migration").join("raw");
+    let target_sessions_dir = root.join("sessions");
+    let target_wiki_dir = root.join("wiki");
+    let mut warnings = Vec::new();
+    let mut raw_specs = Vec::new();
+
+    for (index, spec) in source_specs.iter().enumerate() {
+        let slug = format!(
+            "{:02}-{}",
+            index + 1,
+            slugify_component(&display_name(&spec.canonical))
+        );
+        let raw_dest = raw_root.join(slug);
+        emit_progress(progress_event(
+            MigrationProgressStage::Copy,
+            format!("Copying raw content from {}", spec.canonical.display()),
+            (index + 1) as u32,
+            total,
+        ));
+        copy_source_snapshot(&spec.canonical, &raw_dest, &spec.inspection, &mut warnings)?;
+        raw_specs.push((spec.clone(), raw_dest));
+    }
+
+    emit_progress(progress_event(
+        MigrationProgressStage::MergeSessions,
+        "Merging sessions".to_string(),
+        0,
+        total,
+    ));
+    let mut sessions_copied = 0u64;
+    let mut sessions_renamed = 0u64;
+    for (_, raw_dest) in &raw_specs {
+        let sessions_dir = raw_dest.join(".openplanter").join("sessions");
+        if !sessions_dir.exists() {
+            continue;
+        }
+        for entry in fs::read_dir(&sessions_dir)? {
+            let entry = entry?;
+            if !entry.path().is_dir() {
+                continue;
+            }
+            let original_id = entry.file_name().to_string_lossy().to_string();
+            let resolved_id = unique_session_id(&target_sessions_dir, &original_id);
+            if resolved_id != original_id {
+                sessions_renamed += 1;
+            }
+            let target_session_dir = target_sessions_dir.join(&resolved_id);
+            copy_dir_all(&entry.path(), &target_session_dir)?;
+            rewrite_session_metadata_id(&target_session_dir, &resolved_id)?;
+            sessions_copied += 1;
+        }
+    }
+
+    emit_progress(progress_event(
+        MigrationProgressStage::MergeSettings,
+        "Merging settings".to_string(),
+        0,
+        total,
+    ));
+    let settings_store = SettingsStore::new(&target, session_root_dir);
+    let mut merged_settings = settings_store.load();
+    let mut settings_fields = Vec::new();
+    for (_, raw_dest) in &raw_specs {
+        let settings_path = raw_dest.join(".openplanter").join("settings.json");
+        if settings_path.exists() {
+            let incoming = read_settings_from_path(&settings_path)?;
+            merge_settings_missing(&mut merged_settings, &incoming, &mut settings_fields);
+        }
+    }
+    settings_store.save(&merged_settings)?;
+    settings_fields.sort();
+    settings_fields.dedup();
+
+    emit_progress(progress_event(
+        MigrationProgressStage::MergeCredentials,
+        "Merging credentials".to_string(),
+        0,
+        total,
+    ));
+    let credential_store = CredentialStore::new(&target, session_root_dir);
+    let mut merged_credentials = credential_store.load();
+    let mut credential_fields = Vec::new();
+    for (_, raw_dest) in &raw_specs {
+        let credentials_path = raw_dest.join(".openplanter").join("credentials.json");
+        if credentials_path.exists() {
+            let incoming = read_credentials_from_path(&credentials_path)?;
+            merge_credentials_missing(&mut merged_credentials, &incoming, &mut credential_fields);
+        }
+    }
+    credential_store.save(&merged_credentials)?;
+    credential_fields.sort();
+    credential_fields.dedup();
+
+    emit_progress(progress_event(
+        MigrationProgressStage::Synthesize,
+        "Preparing the target wiki for a one-time curator rewrite".to_string(),
+        0,
+        1,
+    ));
+    clear_runtime_wiki_documents(&target_wiki_dir)?;
+    let curator_context = build_migration_curator_context(&target, &raw_root, &raw_specs);
+    let curator_config = build_target_curator_config(
+        runtime_config,
+        &target,
+        &merged_settings,
+        &merged_credentials,
+    );
+
+    emit_progress(progress_event(
+        MigrationProgressStage::Rewrite,
+        "Running a one-time curator rewrite over imported sources".to_string(),
+        0,
+        1,
+    ));
+    let curator_result = curator_runner(&curator_context, &curator_config)?;
+    let rewrite_summary = normalize_rewrite_summary(&curator_result);
+    let wiki_files_synthesized = count_runtime_wiki_pages(&target_wiki_dir);
+    emit_progress(progress_event(
+        MigrationProgressStage::Rewrite,
+        rewrite_summary.clone(),
+        1,
+        1,
+    ));
+
+    let init_path = root.join(INIT_STATE_FILE);
+    let mut state = read_init_state(&init_path).unwrap_or_default();
+    state.onboarding_completed = true;
+    state.last_migration_target = Some(target.display().to_string());
+    state.last_standard_init_at = Some(now_rfc3339());
+    write_init_state(&init_path, &state)?;
+
+    let result = MigrationInitResultView {
+        target_workspace: target.display().to_string(),
+        sources: raw_specs
+            .iter()
+            .map(|(spec, _)| spec.canonical.display().to_string())
+            .collect(),
+        sessions_copied,
+        sessions_renamed,
+        settings_merged_fields: settings_fields,
+        credentials_merged_fields: credential_fields,
+        wiki_files_synthesized,
+        raw_preservation_root: raw_root.display().to_string(),
+        rewrite_summary,
+        restart_required: true,
+        restart_message: format!(
+            "Migration completed. Restart OpenPlanter with OPENPLANTER_WORKSPACE={} to use the new Desktop workspace.",
+            target.display()
+        ),
+        warnings,
+    };
+
+    emit_progress(progress_event(
+        MigrationProgressStage::Done,
+        "Migration complete".to_string(),
+        total,
+        total,
+    ));
+    Ok(result)
+}
+
+fn now_rfc3339() -> String {
+    Utc::now().to_rfc3339()
+}
+
+fn gate_state_name(state: InitGateState) -> &'static str {
+    match state {
+        InitGateState::Ready => "ready",
+        InitGateState::RequiresAction => "requires_action",
+        InitGateState::Blocked => "blocked",
+    }
+}
+
+fn source_kind_name(kind: MigrationSourceKind) -> &'static str {
+    match kind {
+        MigrationSourceKind::OpenPlanterWorkspace => "openplanter_workspace",
+        MigrationSourceKind::ManualResearch => "manual_research",
+        MigrationSourceKind::Unknown => "unknown",
+    }
+}
+
+fn progress_stage_name(stage: MigrationProgressStage) -> &'static str {
+    match stage {
+        MigrationProgressStage::Inspect => "inspect",
+        MigrationProgressStage::Copy => "copy",
+        MigrationProgressStage::MergeSessions => "merge_sessions",
+        MigrationProgressStage::MergeSettings => "merge_settings",
+        MigrationProgressStage::MergeCredentials => "merge_credentials",
+        MigrationProgressStage::Synthesize => "synthesize",
+        MigrationProgressStage::Rewrite => "rewrite",
+        MigrationProgressStage::Done => "done",
+    }
+}
+
+fn progress_event(
+    stage: MigrationProgressStage,
+    message: String,
+    current: u32,
+    total: u32,
+) -> MigrationProgressEvent {
+    MigrationProgressEvent {
+        stage: progress_stage_name(stage).to_string(),
+        message,
+        current,
+        total,
+    }
+}
+
+fn read_init_state(path: &Path) -> Option<InitStateFile> {
+    let content = fs::read_to_string(path).ok()?;
+    serde_json::from_str(&content).ok()
+}
+
+fn write_init_state(path: &Path, state: &InitStateFile) -> Result<(), WorkspaceInitError> {
+    if let Some(parent) = path.parent() {
+        fs::create_dir_all(parent)?;
+    }
+    fs::write(path, serde_json::to_string_pretty(state)?)?;
+    Ok(())
+}
+
+fn ensure_dir(path: &Path, created_paths: &mut Vec<String>) -> Result<(), WorkspaceInitError> {
+    if !path.exists() {
+        fs::create_dir_all(path)?;
+        created_paths.push(path.display().to_string());
+    }
+    Ok(())
+}
+
+fn write_text_if_missing(
+    path: &Path,
+    contents: &str,
+    report: &mut StandardInitReportView,
+) -> Result<(), WorkspaceInitError> {
+    if path.exists() {
+        report.skipped_existing += 1;
+        return Ok(());
+    }
+    if let Some(parent) = path.parent() {
+        fs::create_dir_all(parent)?;
+    }
+    fs::write(path, contents)?;
+    report.copied_paths.push(path.display().to_string());
+    Ok(())
+}
+
+fn expand_home(raw: &str) -> PathBuf {
+    if raw == "~" {
+        return home_dir().unwrap_or_else(|| PathBuf::from(raw));
+    }
+    if let Some(rest) = raw.strip_prefix("~/") {
+        if let Some(home) = home_dir() {
+            return home.join(rest);
+        }
+    }
+    PathBuf::from(raw)
+}
+
+fn home_dir() -> Option<PathBuf> {
+    #[cfg(windows)]
+    {
+        env::var_os("USERPROFILE").map(PathBuf::from)
+    }
+    #[cfg(not(windows))]
+    {
+        env::var_os("HOME").map(PathBuf::from)
+    }
+}
+
+fn canonicalize_or_self(path: &Path) -> PathBuf {
+    path.canonicalize().unwrap_or_else(|_| path.to_path_buf())
+}
+
+fn canonicalize_target_path(path: &Path) -> Result<PathBuf, WorkspaceInitError> {
+    if path.exists() {
+        return Ok(canonicalize_or_self(path));
+    }
+    if let Some(parent) = path.parent() {
+        fs::create_dir_all(parent)?;
+    }
+    Ok(path.to_path_buf())
+}
+
+fn count_markdown_files(path: &Path) -> u64 {
+    WalkDir::new(path)
+        .into_iter()
+        .filter_entry(|entry| !should_skip_walk_entry(entry.path()))
+        .filter_map(Result::ok)
+        .filter(|entry| entry.file_type().is_file())
+        .filter(|entry| is_markdown(entry.path()))
+        .count() as u64
+}
+
+fn should_skip_walk_entry(path: &Path) -> bool {
+    path.file_name()
+        .and_then(|value| value.to_str())
+        .map(|name| {
+            matches!(
+                name,
+                ".git" | "node_modules" | "target" | "dist" | "__pycache__"
+            )
+        })
+        .unwrap_or(false)
+}
+
+fn is_markdown(path: &Path) -> bool {
+    matches!(
+        path.extension().and_then(|value| value.to_str()),
+        Some("md") | Some("markdown")
+    )
+}
+
+fn display_name(path: &Path) -> String {
+    path.file_name()
+        .and_then(|value| value.to_str())
+        .map(ToString::to_string)
+        .unwrap_or_else(|| path.display().to_string())
+}
+
+fn slugify_component(text: &str) -> String {
+    let slug = text
+        .to_lowercase()
+        .chars()
+        .map(|ch| if ch.is_ascii_alphanumeric() { ch } else { '-' })
+        .collect::<String>()
+        .split('-')
+        .filter(|part| !part.is_empty())
+        .collect::<Vec<_>>()
+        .join("-");
+    if slug.is_empty() {
+        "workspace".to_string()
+    } else {
+        slug
+    }
+}
+
+fn copy_source_snapshot(
+    source: &Path,
+    raw_dest: &Path,
+    inspection: &MigrationSourceInspection,
+    warnings: &mut Vec<String>,
+) -> Result<(), WorkspaceInitError> {
+    fs::create_dir_all(raw_dest)?;
+    let openplanter_root = source.join(".openplanter");
+
+    if inspection.has_settings {
+        copy_file(
+            &openplanter_root.join("settings.json"),
+            &raw_dest.join(".openplanter").join("settings.json"),
+        )?;
+    }
+    if inspection.has_credentials {
+        copy_file(
+            &openplanter_root.join("credentials.json"),
+            &raw_dest.join(".openplanter").join("credentials.json"),
+        )?;
+    }
+    if inspection.has_sessions {
+        copy_dir_all(
+            &openplanter_root.join("sessions"),
+            &raw_dest.join(".openplanter").join("sessions"),
+        )?;
+    }
+    if inspection.has_runtime_wiki {
+        copy_dir_all(
+            &openplanter_root.join("wiki"),
+            &raw_dest.join(".openplanter").join("wiki"),
+        )?;
+    } else if inspection.has_baseline_wiki {
+        copy_dir_all(&source.join("wiki"), &raw_dest.join("wiki"))?;
+    }
+
+    if inspection.kind == source_kind_name(MigrationSourceKind::ManualResearch) {
+        let docs_root = raw_dest.join("documents");
+        let mut copied_any = false;
+        for entry in WalkDir::new(source)
+            .into_iter()
+            .filter_entry(|entry| !should_skip_walk_entry(entry.path()))
+            .filter_map(Result::ok)
+        {
+            if !entry.file_type().is_file() || !is_markdown(entry.path()) {
+                continue;
+            }
+            let rel = match entry.path().strip_prefix(source) {
+                Ok(rel) => rel,
+                Err(_) => continue,
+            };
+            copy_file(entry.path(), &docs_root.join(rel))?;
+            copied_any = true;
+        }
+        if !copied_any {
+            warnings.push(format!(
+                "No markdown documents found in manual source {}",
+                source.display()
+            ));
+        }
+    }
+
+    Ok(())
+}
+
+fn copy_file(src: &Path, dst: &Path) -> Result<(), WorkspaceInitError> {
+    if let Some(parent) = dst.parent() {
+        fs::create_dir_all(parent)?;
+    }
+    fs::copy(src, dst)?;
+    Ok(())
+}
+
+fn copy_dir_all(src: &Path, dst: &Path) -> Result<(), WorkspaceInitError> {
+    if !src.exists() {
+        return Ok(());
+    }
+    for entry in WalkDir::new(src).into_iter().filter_map(Result::ok) {
+        let rel = match entry.path().strip_prefix(src) {
+            Ok(rel) => rel,
+            Err(_) => continue,
+        };
+        let target = dst.join(rel);
+        if entry.file_type().is_dir() {
+            fs::create_dir_all(&target)?;
+        } else if entry.file_type().is_file() {
+            if let Some(parent) = target.parent() {
+                fs::create_dir_all(parent)?;
+            }
+            fs::copy(entry.path(), &target)?;
+        }
+    }
+    Ok(())
+}
+
+fn unique_session_id(target_sessions_dir: &Path, original_id: &str) -> String {
+    let mut candidate = original_id.to_string();
+    let mut suffix = 1u32;
+    while target_sessions_dir.join(&candidate).exists() {
+        suffix += 1;
+        candidate = format!("{original_id}-m{suffix}");
+    }
+    candidate
+}
+
+fn rewrite_session_metadata_id(session_dir: &Path, new_id: &str) -> Result<(), WorkspaceInitError> {
+    let metadata_path = session_dir.join("metadata.json");
+    if !metadata_path.exists() {
+        return Ok(());
+    }
+    let content = fs::read_to_string(&metadata_path)?;
+    let mut info: SessionInfo = serde_json::from_str(&content)?;
+    info.id = new_id.to_string();
+    fs::write(&metadata_path, serde_json::to_string_pretty(&info)?)?;
+    Ok(())
+}
+
+fn read_settings_from_path(path: &Path) -> Result<PersistentSettings, WorkspaceInitError> {
+    let content = fs::read_to_string(path)?;
+    let parsed: serde_json::Value = serde_json::from_str(&content)?;
+    Ok(PersistentSettings::from_json(&parsed).unwrap_or_default())
+}
+
+fn merge_settings_missing(
+    target: &mut PersistentSettings,
+    incoming: &PersistentSettings,
+    filled_fields: &mut Vec<String>,
+) {
+    macro_rules! fill {
+        ($field:ident) => {
+            if target.$field.is_none() && incoming.$field.is_some() {
+                target.$field = incoming.$field.clone();
+                filled_fields.push(stringify!($field).to_string());
+            }
+        };
+    }
+    fill!(default_model);
+    fill!(default_reasoning_effort);
+    fill!(default_model_openai);
+    fill!(default_model_anthropic);
+    fill!(default_model_openrouter);
+    fill!(default_model_cerebras);
+    fill!(default_model_zai);
+    fill!(default_model_ollama);
+    fill!(zai_plan);
+    fill!(web_search_provider);
+}
+
+fn read_credentials_from_path(path: &Path) -> Result<CredentialBundle, WorkspaceInitError> {
+    let content = fs::read_to_string(path)?;
+    let parsed: HashMap<String, serde_json::Value> = serde_json::from_str(&content)?;
+    Ok(CredentialBundle::from_json(&parsed))
+}
+
+fn merge_credentials_missing(
+    target: &mut CredentialBundle,
+    incoming: &CredentialBundle,
+    filled_fields: &mut Vec<String>,
+) {
+    macro_rules! fill {
+        ($field:ident) => {
+            if target.$field.is_none() && incoming.$field.is_some() {
+                target.$field = incoming.$field.clone();
+                filled_fields.push(stringify!($field).to_string());
+            }
+        };
+    }
+    fill!(openai_api_key);
+    fill!(openai_oauth_token);
+    fill!(anthropic_api_key);
+    fill!(openrouter_api_key);
+    fill!(cerebras_api_key);
+    fill!(zai_api_key);
+    fill!(exa_api_key);
+    fill!(firecrawl_api_key);
+    fill!(brave_api_key);
+    fill!(tavily_api_key);
+    fill!(voyage_api_key);
+}
+
+fn clear_runtime_wiki_documents(wiki_dir: &Path) -> Result<(), WorkspaceInitError> {
+    if !wiki_dir.exists() {
+        return Ok(());
+    }
+    for entry in fs::read_dir(wiki_dir)? {
+        let entry = entry?;
+        let path = entry.path();
+        let name = entry.file_name();
+        let keep = name == "index.md" || name == "template.md";
+        if keep {
+            continue;
+        }
+        if path.is_dir() {
+            fs::remove_dir_all(path)?;
+        } else {
+            fs::remove_file(path)?;
+        }
+    }
+    Ok(())
+}
+
+fn build_target_curator_config(
+    runtime_config: &AgentConfig,
+    target: &Path,
+    merged_settings: &PersistentSettings,
+    merged_credentials: &CredentialBundle,
+) -> AgentConfig {
+    let mut config = runtime_config.clone();
+    config.workspace = target.to_path_buf();
+    apply_settings_to_config(&mut config, merged_settings);
+    merge_credentials_into_config(
+        &mut config,
+        merged_credentials,
+        &CredentialBundle::default(),
+    );
+    config
+}
+
+fn build_migration_curator_context(
+    target: &Path,
+    raw_root: &Path,
+    raw_specs: &[(SourceSpec, PathBuf)],
+) -> String {
+    let raw_root_display = raw_root
+        .strip_prefix(target)
+        .unwrap_or(raw_root)
+        .display()
+        .to_string();
+    let mut lines = vec![
+        "You are performing a one-time workspace migration rewrite for the Desktop app."
+            .to_string(),
+        format!("Target workspace: {}", target.display()),
+        "Rewrite the canonical Desktop wiki inside `.openplanter/wiki/`.".to_string(),
+        format!(
+            "Read imported raw material from `{raw_root_display}` and treat it as the source of truth."
+        ),
+        "Merge duplicate information across sources, keep the result factual and legible, preserve provenance, and update `.openplanter/wiki/index.md` to match the final page set.".to_string(),
+        "Do not write outside `.openplanter/wiki/`, and do not modify raw snapshots under `.openplanter/migration/raw/`.".to_string(),
+        String::new(),
+        "Ordered import sources:".to_string(),
+    ];
+    for (index, (spec, raw_dest)) in raw_specs.iter().enumerate() {
+        let raw_display = raw_dest
+            .strip_prefix(target)
+            .unwrap_or(raw_dest)
+            .display()
+            .to_string();
+        lines.push(format!(
+            "{}. kind={} | source={} | original_input={} | raw_snapshot={}",
+            index + 1,
+            spec.inspection.kind,
+            spec.canonical.display(),
+            spec.original,
+            raw_display
+        ));
+    }
+    lines.join("\n")
+}
+
+fn normalize_rewrite_summary(result: &CuratorResult) -> String {
+    let summary = result.summary.trim();
+    if summary.is_empty() {
+        format!(
+            "Curator rewrite completed with {} wiki file(s) changed.",
+            result.files_changed
+        )
+    } else {
+        summary.to_string()
+    }
+}
+
+fn count_runtime_wiki_pages(wiki_dir: &Path) -> u64 {
+    WalkDir::new(wiki_dir)
+        .into_iter()
+        .filter_entry(|entry| !should_skip_walk_entry(entry.path()))
+        .filter_map(Result::ok)
+        .filter(|entry| entry.file_type().is_file())
+        .filter(|entry| is_markdown(entry.path()))
+        .filter(|entry| {
+            entry
+                .path()
+                .file_name()
+                .and_then(|value| value.to_str())
+                .map(|name| {
+                    !name.eq_ignore_ascii_case("index.md")
+                        && !name.eq_ignore_ascii_case("template.md")
+                })
+                .unwrap_or(true)
+        })
+        .count() as u64
+}
+
+fn run_curator_blocking(
+    context: &str,
+    config: &AgentConfig,
+) -> Result<CuratorResult, WorkspaceInitError> {
+    let runtime = TokioRuntimeBuilder::new_current_thread()
+        .enable_all()
+        .build()
+        .map_err(|err| WorkspaceInitError::Curator(err.to_string()))?;
+    runtime
+        .block_on(run_curator(context, config, CancellationToken::new()))
+        .map_err(WorkspaceInitError::Curator)
+}
+
+#[cfg(test)]
+mod tests {
+    use super::*;
+    use crate::events::MigrationSourceInput;
+    use tempfile::tempdir;
+
+    fn runtime_config(workspace: &Path) -> AgentConfig {
+        let mut cfg = AgentConfig::from_env(workspace);
+        cfg.workspace = workspace.to_path_buf();
+        cfg.provider = "auto".to_string();
+        cfg.model = "seed-model".to_string();
+        cfg.api_key = None;
+        cfg.openai_api_key = None;
+        cfg.openai_oauth_token = None;
+        cfg
+    }
+
+    #[test]
+    fn standard_init_is_idempotent() {
+        let temp = tempdir().unwrap();
+        let first = run_standard_init(temp.path(), ".openplanter", false).unwrap();
+        assert!(
+            temp.path()
+                .join(".openplanter")
+                .join("wiki")
+                .join("index.md")
+                .exists()
+        );
+        assert!(first.onboarding_required);
+
+        let second = run_standard_init(temp.path(), ".openplanter", true).unwrap();
+        assert!(!second.onboarding_required);
+
+        let status = get_init_status(temp.path(), ".openplanter").unwrap();
+        assert_eq!(status.gate_state, "ready");
+    }
+
+    #[test]
+    fn inspect_source_detects_openplanter_workspace() {
+        let temp = tempdir().unwrap();
+        let root = temp.path().join(".openplanter");
+        fs::create_dir_all(root.join("sessions")).unwrap();
+        fs::write(root.join("settings.json"), "{}").unwrap();
+        fs::write(root.join("credentials.json"), "{}").unwrap();
+        fs::create_dir_all(root.join("wiki")).unwrap();
+        fs::write(root.join("wiki").join("index.md"), BASELINE_INDEX).unwrap();
+
+        let inspection = inspect_migration_source(temp.path());
+        assert_eq!(inspection.kind, "openplanter_workspace");
+        assert!(inspection.has_sessions);
+        assert!(inspection.has_settings);
+    }
+
+    #[test]
+    fn migration_preserves_sources_and_merges_sessions() {
+        let temp = tempdir().unwrap();
+        let source_a = temp.path().join("source-a");
+        let source_b = temp.path().join("source-b");
+        let target = temp.path().join("target");
+
+        for source in [&source_a, &source_b] {
+            fs::create_dir_all(source.join(".openplanter").join("sessions").join("same-id"))
+                .unwrap();
+            fs::create_dir_all(
+                source
+                    .join(".openplanter")
+                    .join("wiki")
+                    .join("campaign-finance"),
+            )
+            .unwrap();
+            fs::write(
+                source
+                    .join(".openplanter")
+                    .join("sessions")
+                    .join("same-id")
+                    .join("metadata.json"),
+                serde_json::to_string_pretty(&SessionInfo {
+                    id: "same-id".to_string(),
+                    created_at: "2026-01-01T00:00:00Z".to_string(),
+                    turn_count: 1,
+                    last_objective: Some("Investigate".to_string()),
+                })
+                .unwrap(),
+            )
+            .unwrap();
+            fs::write(
+                source
+                    .join(".openplanter")
+                    .join("wiki")
+                    .join("campaign-finance")
+                    .join(format!("{}.md", display_name(source))),
+                format!(
+                    "# {}\n\n## Summary\n\nImported from {}\n",
+                    display_name(source),
+                    source.display()
+                ),
+            )
+            .unwrap();
+        }
+
+        fs::write(
+            source_a.join(".openplanter").join("settings.json"),
+            "{\"default_model\":\"alpha\"}",
+        )
+        .unwrap();
+        fs::write(
+            source_b.join(".openplanter").join("credentials.json"),
+            "{\"openai_api_key\":\"secret\"}",
+        )
+        .unwrap();
+
+        let request = MigrationInitRequest {
+            target_workspace: target.display().to_string(),
+            sources: vec![
+                MigrationSourceInput {
+                    path: source_a.display().to_string(),
+                },
+                MigrationSourceInput {
+                    path: source_b.display().to_string(),
+                },
+            ],
+        };
+
+        let mut progress = Vec::new();
+        let mut run_count = 0u32;
+        let source_a_display = source_a.display().to_string();
+        let source_b_display = source_b.display().to_string();
+        let result = run_migration_init_with_runner(
+            &request,
+            &runtime_config(temp.path()),
+            |event| progress.push(event.stage),
+            |context, cfg| {
+                run_count += 1;
+                assert!(context.contains(".openplanter/migration/raw"));
+                assert!(context.contains(&source_a_display));
+                assert!(context.contains(&source_b_display));
+                assert_eq!(cfg.workspace, target);
+                assert_eq!(cfg.model, "alpha");
+                assert_eq!(cfg.openai_api_key.as_deref(), Some("secret"));
+
+                let wiki_dir = cfg.workspace.join(&cfg.session_root_dir).join("wiki");
+                fs::create_dir_all(wiki_dir.join("campaign-finance")).unwrap();
+                fs::write(
+                    wiki_dir.join("campaign-finance").join("merged.md"),
+                    "# Merged Source\n\n## Overview\n\nCurated output.\n",
+                )
+                .unwrap();
+                fs::write(wiki_dir.join("index.md"), BASELINE_INDEX).unwrap();
+
+                Ok(CuratorResult {
+                    summary: "Curator rewrote 1 wiki file from imported sources.".to_string(),
+                    files_changed: 1,
+                })
+            },
+        )
+        .unwrap();
+
+        assert_eq!(result.sessions_copied, 2);
+        assert_eq!(result.sessions_renamed, 1);
+        assert_eq!(result.wiki_files_synthesized, 1);
+        assert_eq!(
+            result.rewrite_summary,
+            "Curator rewrote 1 wiki file from imported sources."
+        );
+        assert_eq!(run_count, 1);
+        assert!(
+            target
+                .join(".openplanter")
+                .join("migration")
+                .join("raw")
+                .exists()
+        );
+        assert!(
+            source_a
+                .join(".openplanter")
+                .join("sessions")
+                .join("same-id")
+                .exists()
+        );
+        assert!(
+            target
+                .join(".openplanter")
+                .join("wiki")
+                .join("campaign-finance")
+                .exists()
+                || target
+                    .join(".openplanter")
+                    .join("wiki")
+                    .join("imported")
+                    .exists()
+        );
+        let settings = SettingsStore::new(&target, ".openplanter").load();
+        assert_eq!(settings.default_model.as_deref(), Some("alpha"));
+        let creds = CredentialStore::new(&target, ".openplanter").load();
+        assert_eq!(creds.openai_api_key.as_deref(), Some("secret"));
+        let synth_index = progress
+            .iter()
+            .position(|stage| stage == "synthesize")
+            .unwrap();
+        let rewrite_index = progress
+            .iter()
+            .position(|stage| stage == "rewrite")
+            .unwrap();
+        assert!(synth_index < rewrite_index);
+        assert_eq!(
+            progress
+                .iter()
+                .filter(|stage| stage.as_str() == "rewrite")
+                .count(),
+            2
+        );
+        assert_eq!(progress.last().map(String::as_str), Some("done"));
+    }
+
+    #[test]
+    fn migration_surfaces_curator_errors_after_preserving_raw_sources() {
+        let temp = tempdir().unwrap();
+        let source = temp.path().join("source-a");
+        let target = temp.path().join("target");
+
+        fs::create_dir_all(source.join(".openplanter").join("sessions").join("same-id")).unwrap();
+        fs::create_dir_all(source.join(".openplanter").join("wiki")).unwrap();
+        fs::write(
+            source.join(".openplanter").join("wiki").join("source-a.md"),
+            "# Source A\n",
+        )
+        .unwrap();
+
+        let request = MigrationInitRequest {
+            target_workspace: target.display().to_string(),
+            sources: vec![MigrationSourceInput {
+                path: source.display().to_string(),
+            }],
+        };
+
+        let result = run_migration_init_with_runner(
+            &request,
+            &runtime_config(temp.path()),
+            |_| {},
+            |_context, _cfg| {
+                Err(WorkspaceInitError::Curator(
+                    "missing credentials".to_string(),
+                ))
+            },
+        );
+
+        assert!(matches!(
+            result,
+            Err(WorkspaceInitError::Curator(message)) if message == "missing credentials"
+        ));
+        assert!(
+            target
+                .join(".openplanter")
+                .join("migration")
+                .join("raw")
+                .exists()
+        );
+        assert!(
+            source
+                .join(".openplanter")
+                .join("wiki")
+                .join("source-a.md")
+                .exists()
+        );
+    }
+}
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
index 201ab9df..d251af51 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
@@ -6,6 +6,7 @@ use crate::commands::session::sessions_dir;
 use crate::state::AppState;
 use op_core::engine::SolveEmitter;
 use op_core::session::replay::{ReplayEntry, ReplayLogger};
+use op_core::workspace_init;
 
 /// Start solving an objective. Result streamed via events.
 #[tauri::command]
@@ -15,15 +16,29 @@ pub async fn solve(
     app: AppHandle,
     state: State<'_, AppState>,
 ) -> Result<(), String> {
+    let cfg = state.config.lock().await.clone();
+    let init_status = workspace_init::get_init_status(&cfg.workspace, &cfg.session_root_dir)
+        .map_err(|e| e.to_string())?;
+    if init_status.gate_state != "ready" {
+        return Err("Workspace initialization is not complete. Run /init first.".to_string());
+    }
+
+    {
+        let mut running = state.agent_running.lock().await;
+        if *running {
+            return Err("An agent task is already running.".to_string());
+        }
+        *running = true;
+    }
+
     // Create a fresh cancellation token for this solve run
     let token = CancellationToken::new();
     {
         let mut current = state.cancel_token.lock().await;
         *current = token.clone();
     }
-
-    let cfg = state.config.lock().await.clone();
     let error_handle = app.clone();
+    let running_flag = state.agent_running.clone();
 
     // Set up replay logging for this session
     let session_dir = sessions_dir(&state).await.join(&session_id);
@@ -74,6 +89,11 @@ pub async fn solve(
         })
         .await;
 
+        {
+            let mut running = running_flag.lock().await;
+            *running = false;
+        }
+
         // If the inner task panicked, emit an error so the frontend
         // doesn't get stuck in "running" state forever.
         if let Err(e) = result {
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/init.rs b/openplanter-desktop/crates/op-tauri/src/commands/init.rs
new file mode 100644
index 00000000..8e96e7f6
--- /dev/null
+++ b/openplanter-desktop/crates/op-tauri/src/commands/init.rs
@@ -0,0 +1,82 @@
+use std::path::PathBuf;
+
+use crate::state::AppState;
+use op_core::events::{
+    InitStatusView, MigrationInitRequest, MigrationInitResultView, MigrationSourceInspection,
+    StandardInitReportView,
+};
+use op_core::workspace_init;
+use tauri::{AppHandle, Emitter, State};
+
+async fn current_workspace_config(state: &State<'_, AppState>) -> op_core::config::AgentConfig {
+    state.config.lock().await.clone()
+}
+
+async fn ensure_idle(state: &State<'_, AppState>) -> Result<(), String> {
+    if *state.agent_running.lock().await {
+        return Err("Cannot run init while the agent is active".to_string());
+    }
+    Ok(())
+}
+
+#[tauri::command]
+pub async fn get_init_status(state: State<'_, AppState>) -> Result<InitStatusView, String> {
+    let cfg = current_workspace_config(&state).await;
+    workspace_init::get_init_status(&cfg.workspace, &cfg.session_root_dir)
+        .map_err(|e| e.to_string())
+}
+
+#[tauri::command]
+pub async fn run_standard_init(
+    state: State<'_, AppState>,
+) -> Result<StandardInitReportView, String> {
+    ensure_idle(&state).await?;
+    let _guard = state.init_lock.lock().await;
+    let cfg = current_workspace_config(&state).await;
+    tokio::task::spawn_blocking(move || {
+        workspace_init::run_standard_init(&cfg.workspace, &cfg.session_root_dir, true)
+    })
+    .await
+    .map_err(|e| e.to_string())?
+    .map_err(|e| e.to_string())
+}
+
+#[tauri::command]
+pub async fn complete_first_run_gate(state: State<'_, AppState>) -> Result<InitStatusView, String> {
+    ensure_idle(&state).await?;
+    let _guard = state.init_lock.lock().await;
+    let cfg = current_workspace_config(&state).await;
+    tokio::task::spawn_blocking(move || {
+        workspace_init::complete_first_run_gate(&cfg.workspace, &cfg.session_root_dir)
+    })
+    .await
+    .map_err(|e| e.to_string())?
+    .map_err(|e| e.to_string())
+}
+
+#[tauri::command]
+pub async fn inspect_migration_source(path: String) -> Result<MigrationSourceInspection, String> {
+    let path = PathBuf::from(path);
+    tokio::task::spawn_blocking(move || workspace_init::inspect_migration_source(&path))
+        .await
+        .map_err(|e| e.to_string())
+}
+
+#[tauri::command]
+pub async fn run_migration_init(
+    request: MigrationInitRequest,
+    app: AppHandle,
+    state: State<'_, AppState>,
+) -> Result<MigrationInitResultView, String> {
+    ensure_idle(&state).await?;
+    let _guard = state.init_lock.lock().await;
+    let cfg = current_workspace_config(&state).await;
+    tokio::task::spawn_blocking(move || {
+        workspace_init::run_migration_init(&request, &cfg, |event| {
+            let _ = app.emit("init:migration-progress", event);
+        })
+    })
+    .await
+    .map_err(|e| e.to_string())?
+    .map_err(|e| e.to_string())
+}
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/mod.rs b/openplanter-desktop/crates/op-tauri/src/commands/mod.rs
index 4f02ad95..b4525a46 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/mod.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/mod.rs
@@ -1,4 +1,5 @@
 pub mod agent;
 pub mod config;
+pub mod init;
 pub mod session;
 pub mod wiki;
diff --git a/openplanter-desktop/crates/op-tauri/src/main.rs b/openplanter-desktop/crates/op-tauri/src/main.rs
index edf948cf..49cefe20 100644
--- a/openplanter-desktop/crates/op-tauri/src/main.rs
+++ b/openplanter-desktop/crates/op-tauri/src/main.rs
@@ -23,6 +23,11 @@ fn main() {
             commands::config::list_models,
             commands::config::save_settings,
             commands::config::get_credentials_status,
+            commands::init::get_init_status,
+            commands::init::run_standard_init,
+            commands::init::complete_first_run_gate,
+            commands::init::inspect_migration_source,
+            commands::init::run_migration_init,
             commands::session::list_sessions,
             commands::session::open_session,
             commands::session::delete_session,
diff --git a/openplanter-desktop/crates/op-tauri/src/state.rs b/openplanter-desktop/crates/op-tauri/src/state.rs
index f19f1be5..6a649dda 100644
--- a/openplanter-desktop/crates/op-tauri/src/state.rs
+++ b/openplanter-desktop/crates/op-tauri/src/state.rs
@@ -1,11 +1,11 @@
-use op_core::config::{
-    AgentConfig, FOUNDRY_OPENAI_API_KEY_PLACEHOLDER, normalize_web_search_provider,
-    normalize_zai_plan, resolve_openai_api_key, resolve_zai_base_url,
-};
-use op_core::credentials::{
-    CredentialBundle, credentials_from_env, discover_env_candidates, parse_env_file,
-};
-use op_core::settings::{PersistentSettings, SettingsStore};
+use op_core::config::AgentConfig;
+use op_core::config_hydration::{apply_settings_to_config, merge_credentials_into_config};
+use op_core::credentials::CredentialBundle;
+use op_core::credentials::{credentials_from_env, discover_env_candidates, parse_env_file};
+#[cfg(test)]
+use op_core::settings::PersistentSettings;
+use op_core::settings::SettingsStore;
+use op_core::workspace_init;
 use std::env;
 use std::fs;
 use std::path::{Path, PathBuf};
@@ -37,124 +37,6 @@ struct LegacyMigrationReport {
     errors: Vec<String>,
 }
 
-/// Merge credentials into an AgentConfig.
-/// Priority: existing config value > env_creds > file_creds.
-pub fn merge_credentials_into_config(
-    cfg: &mut AgentConfig,
-    env_creds: &CredentialBundle,
-    file_creds: &CredentialBundle,
-) {
-    if cfg.openai_oauth_token.is_none() {
-        cfg.openai_oauth_token = env_creds
-            .openai_oauth_token
-            .clone()
-            .or_else(|| file_creds.openai_oauth_token.clone());
-    }
-    cfg.openai_api_key = cfg
-        .openai_api_key
-        .clone()
-        .filter(|value| {
-            let trimmed = value.trim();
-            !trimmed.is_empty() && trimmed != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
-        })
-        .or_else(|| env_creds.openai_api_key.clone())
-        .or_else(|| file_creds.openai_api_key.clone())
-        .or_else(|| cfg.openai_api_key.clone());
-    cfg.openai_api_key = resolve_openai_api_key(
-        cfg.openai_api_key.clone(),
-        &cfg.openai_base_url,
-        cfg.openai_oauth_token.clone(),
-    );
-    cfg.api_key = resolve_openai_api_key(
-        cfg.openai_api_key
-            .clone()
-            .filter(|value| {
-                let trimmed = value.trim();
-                !trimmed.is_empty() && trimmed != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
-            })
-            .or_else(|| {
-                cfg.api_key.clone().filter(|value| {
-                    let trimmed = value.trim();
-                    !trimmed.is_empty() && trimmed != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
-                })
-            })
-            .or_else(|| cfg.openai_api_key.clone())
-            .or_else(|| cfg.api_key.clone()),
-        &cfg.base_url,
-        cfg.openai_oauth_token.clone(),
-    );
-
-    macro_rules! merge {
-        ($field:ident) => {
-            if cfg.$field.is_none() {
-                cfg.$field = env_creds
-                    .$field
-                    .clone()
-                    .or_else(|| file_creds.$field.clone());
-            }
-        };
-    }
-    merge!(anthropic_api_key);
-    merge!(openrouter_api_key);
-    merge!(cerebras_api_key);
-    merge!(zai_api_key);
-    merge!(exa_api_key);
-    merge!(firecrawl_api_key);
-    merge!(brave_api_key);
-    merge!(tavily_api_key);
-    merge!(voyage_api_key);
-}
-
-fn has_env_value(keys: &[&str]) -> bool {
-    keys.iter().any(|key| {
-        env::var(key)
-            .ok()
-            .map(|value| !value.trim().is_empty())
-            .unwrap_or(false)
-    })
-}
-
-fn apply_settings_to_config(cfg: &mut AgentConfig, settings: &PersistentSettings) {
-    if !has_env_value(&["OPENPLANTER_REASONING_EFFORT"]) {
-        if let Some(reasoning_effort) = settings.default_reasoning_effort.clone() {
-            cfg.reasoning_effort = Some(reasoning_effort);
-        }
-    }
-
-    if !has_env_value(&["OPENPLANTER_ZAI_PLAN"]) {
-        if let Some(plan) = settings.zai_plan.as_deref() {
-            cfg.zai_plan = normalize_zai_plan(Some(plan));
-        }
-    }
-
-    if !has_env_value(&["OPENPLANTER_ZAI_BASE_URL"]) {
-        cfg.zai_base_url = resolve_zai_base_url(
-            &cfg.zai_plan,
-            &cfg.zai_paygo_base_url,
-            &cfg.zai_coding_base_url,
-        );
-    }
-
-    if !has_env_value(&["OPENPLANTER_WEB_SEARCH_PROVIDER"]) {
-        if let Some(provider) = settings.web_search_provider.as_deref() {
-            cfg.web_search_provider = normalize_web_search_provider(Some(provider));
-        }
-    }
-
-    if !has_env_value(&["OPENPLANTER_MODEL"]) {
-        let saved_model = if cfg.provider == "auto" {
-            settings.default_model.as_deref()
-        } else {
-            settings
-                .default_model_for_provider(cfg.provider.as_str())
-                .or(settings.default_model.as_deref())
-        };
-        if let Some(model) = saved_model {
-            cfg.model = model.to_string();
-        }
-    }
-}
-
 fn canonicalize_or_self(path: &Path) -> PathBuf {
     path.canonicalize().unwrap_or_else(|_| path.to_path_buf())
 }
@@ -372,6 +254,8 @@ pub struct AppState {
     pub config: Arc<Mutex<AgentConfig>>,
     pub session_id: Arc<Mutex<Option<String>>>,
     pub cancel_token: Arc<Mutex<CancellationToken>>,
+    pub agent_running: Arc<Mutex<bool>>,
+    pub init_lock: Arc<Mutex<()>>,
     startup_trace: String,
 }
 
@@ -381,6 +265,11 @@ impl AppState {
         let resolved_workspace = resolve_desktop_workspace();
         let mut cfg = AgentConfig::from_env(&resolved_workspace.path);
         let migration = migrate_legacy_desktop_state(&cfg.workspace, &cfg.session_root_dir);
+        if let Err(err) =
+            workspace_init::run_standard_init(&cfg.workspace, &cfg.session_root_dir, false)
+        {
+            eprintln!("[startup:init] {err}");
+        }
 
         // Load .env files and merge credentials into config
         let env_creds = credentials_from_env();
@@ -403,6 +292,8 @@ impl AppState {
             config: Arc::new(Mutex::new(cfg)),
             session_id: Arc::new(Mutex::new(None)),
             cancel_token: Arc::new(Mutex::new(CancellationToken::new())),
+            agent_running: Arc::new(Mutex::new(false)),
+            init_lock: Arc::new(Mutex::new(())),
             startup_trace: format_startup_trace(&current_dir, &resolved_workspace, &migration),
         }
     }
diff --git a/openplanter-desktop/frontend/src/api/events.test.ts b/openplanter-desktop/frontend/src/api/events.test.ts
index f7620ae7..88ea1cc1 100644
--- a/openplanter-desktop/frontend/src/api/events.test.ts
+++ b/openplanter-desktop/frontend/src/api/events.test.ts
@@ -17,6 +17,7 @@ import {
   onAgentDelta,
   onAgentComplete,
   onAgentError,
+  onMigrationProgress,
   onWikiUpdated,
 } from "./events";
 
@@ -98,6 +99,21 @@ describe("event listeners", () => {
     expect(callback).toHaveBeenCalledWith(graphData);
   });
 
+  it("onMigrationProgress registers listener and forwards progress payload", async () => {
+    const callback = vi.fn();
+    await onMigrationProgress(callback);
+
+    const handler = listeners.get("init:migration-progress")!;
+    const payload = {
+      stage: "copy",
+      message: "Copying raw content",
+      current: 1,
+      total: 3,
+    };
+    handler({ payload });
+    expect(callback).toHaveBeenCalledWith(payload);
+  });
+
   it("all listeners return unlisten function", async () => {
     const noop = vi.fn();
     const unlistens = await Promise.all([
@@ -106,6 +122,7 @@ describe("event listeners", () => {
       onAgentDelta(noop),
       onAgentComplete(noop),
       onAgentError(noop),
+      onMigrationProgress(noop),
       onWikiUpdated(noop),
     ]);
     for (const u of unlistens) {
diff --git a/openplanter-desktop/frontend/src/api/events.ts b/openplanter-desktop/frontend/src/api/events.ts
index 30cb0704..845ba8b9 100644
--- a/openplanter-desktop/frontend/src/api/events.ts
+++ b/openplanter-desktop/frontend/src/api/events.ts
@@ -1,6 +1,11 @@
 /** Tauri event subscriptions. */
 import { listen, type UnlistenFn } from "@tauri-apps/api/event";
-import type { AgentEvent, CuratorUpdateEvent, GraphData } from "./types";
+import type {
+  AgentEvent,
+  CuratorUpdateEvent,
+  GraphData,
+  MigrationProgressEvent,
+} from "./types";
 
 export function onAgentTrace(
   callback: (message: string) => void
@@ -51,3 +56,11 @@ export function onCuratorUpdate(
     callback(e.payload)
   );
 }
+
+export function onMigrationProgress(
+  callback: (event: MigrationProgressEvent) => void
+): Promise<UnlistenFn> {
+  return listen<MigrationProgressEvent>("init:migration-progress", (e) =>
+    callback(e.payload)
+  );
+}
diff --git a/openplanter-desktop/frontend/src/api/invoke.test.ts b/openplanter-desktop/frontend/src/api/invoke.test.ts
index 965fbbbd..62a2f232 100644
--- a/openplanter-desktop/frontend/src/api/invoke.test.ts
+++ b/openplanter-desktop/frontend/src/api/invoke.test.ts
@@ -18,7 +18,11 @@ import {
   openSession,
   deleteSession,
   getGraphData,
+  getInitStatus,
+  inspectMigrationSource,
   debugLog,
+  runMigrationInit,
+  runStandardInit,
 } from "./invoke";
 
 describe("invoke wrappers", () => {
@@ -211,6 +215,84 @@ describe("invoke wrappers", () => {
     await debugLog("test message");
   });
 
+  it("getInitStatus calls invoke", async () => {
+    __setHandler("get_init_status", () => ({
+      runtime_workspace: "/tmp/ws",
+      gate_state: "requires_action",
+      onboarding_completed: false,
+      has_openplanter_root: true,
+      has_runtime_wiki: true,
+      has_runtime_index: true,
+      init_state_path: "/tmp/ws/.openplanter/init-state.json",
+      last_migration_target: null,
+      warnings: [],
+    }));
+    const status = await getInitStatus();
+    expect(status.runtime_workspace).toBe("/tmp/ws");
+    expect(status.gate_state).toBe("requires_action");
+  });
+
+  it("runStandardInit calls invoke", async () => {
+    __setHandler("run_standard_init", () => ({
+      workspace: "/tmp/ws",
+      created_paths: ["/tmp/ws/.openplanter"],
+      copied_paths: ["/tmp/ws/.openplanter/wiki/index.md"],
+      skipped_existing: 0,
+      errors: [],
+      onboarding_required: false,
+    }));
+    const report = await runStandardInit();
+    expect(report.workspace).toBe("/tmp/ws");
+    expect(report.created_paths).toHaveLength(1);
+  });
+
+  it("inspectMigrationSource sends path", async () => {
+    __setHandler("inspect_migration_source", ({ path }: any) => {
+      expect(path).toBe("/tmp/source");
+      return {
+        path,
+        kind: "manual_research",
+        has_sessions: false,
+        has_settings: false,
+        has_credentials: false,
+        has_runtime_wiki: false,
+        has_baseline_wiki: false,
+        markdown_files: 4,
+        warnings: [],
+      };
+    });
+    const inspection = await inspectMigrationSource("/tmp/source");
+    expect(inspection.kind).toBe("manual_research");
+    expect(inspection.markdown_files).toBe(4);
+  });
+
+  it("runMigrationInit sends request payload", async () => {
+    __setHandler("run_migration_init", ({ request }: any) => {
+      expect(request.target_workspace).toBe("/tmp/target");
+      expect(request.sources).toEqual([{ path: "/tmp/a" }, { path: "/tmp/b" }]);
+      return {
+        target_workspace: "/tmp/target",
+        sources: ["/tmp/a", "/tmp/b"],
+        sessions_copied: 2,
+        sessions_renamed: 1,
+        settings_merged_fields: ["default_model"],
+        credentials_merged_fields: ["openai_api_key"],
+        wiki_files_synthesized: 3,
+        raw_preservation_root: "/tmp/target/.openplanter/migration/raw",
+        rewrite_summary: "Curator rewrote 3 wiki files from imported sources.",
+        restart_required: true,
+        restart_message: "Restart required",
+        warnings: [],
+      };
+    });
+    const result = await runMigrationInit({
+      target_workspace: "/tmp/target",
+      sources: [{ path: "/tmp/a" }, { path: "/tmp/b" }],
+    });
+    expect(result.sessions_copied).toBe(2);
+    expect(result.restart_required).toBe(true);
+  });
+
   it("unhandled command rejects", async () => {
     await expect(solve("test", "s1")).rejects.toThrow("No mock for command: solve");
   });
diff --git a/openplanter-desktop/frontend/src/api/invoke.ts b/openplanter-desktop/frontend/src/api/invoke.ts
index c3094dee..f07662a5 100644
--- a/openplanter-desktop/frontend/src/api/invoke.ts
+++ b/openplanter-desktop/frontend/src/api/invoke.ts
@@ -3,11 +3,16 @@ import { invoke } from "@tauri-apps/api/core";
 import type {
   ConfigView,
   GraphData,
+  InitStatusView,
+  MigrationInitRequest,
+  MigrationInitResultView,
+  MigrationSourceInspection,
   ModelInfo,
   PartialConfig,
   PersistentSettings,
   ReplayEntry,
   SessionInfo,
+  StandardInitReportView,
 } from "./types";
 
 export async function solve(objective: string, sessionId: string): Promise<void> {
@@ -68,3 +73,27 @@ export async function readWikiFile(path: string): Promise<string> {
 export async function debugLog(msg: string): Promise<void> {
   return invoke("debug_log", { msg });
 }
+
+export async function getInitStatus(): Promise<InitStatusView> {
+  return invoke("get_init_status");
+}
+
+export async function runStandardInit(): Promise<StandardInitReportView> {
+  return invoke("run_standard_init");
+}
+
+export async function completeFirstRunGate(): Promise<InitStatusView> {
+  return invoke("complete_first_run_gate");
+}
+
+export async function inspectMigrationSource(
+  path: string
+): Promise<MigrationSourceInspection> {
+  return invoke("inspect_migration_source", { path });
+}
+
+export async function runMigrationInit(
+  request: MigrationInitRequest
+): Promise<MigrationInitResultView> {
+  return invoke("run_migration_init", { request });
+}
diff --git a/openplanter-desktop/frontend/src/api/types.ts b/openplanter-desktop/frontend/src/api/types.ts
index 9bc29eb7..22c4d605 100644
--- a/openplanter-desktop/frontend/src/api/types.ts
+++ b/openplanter-desktop/frontend/src/api/types.ts
@@ -114,6 +114,82 @@ export interface SlashResult {
   success: boolean;
 }
 
+export type InitGateState = "ready" | "requires_action" | "blocked";
+export type MigrationSourceKind = "openplanter_workspace" | "manual_research" | "unknown";
+export type MigrationProgressStage =
+  | "inspect"
+  | "copy"
+  | "merge_sessions"
+  | "merge_settings"
+  | "merge_credentials"
+  | "synthesize"
+  | "rewrite"
+  | "done";
+
+export interface StandardInitReportView {
+  workspace: string;
+  created_paths: string[];
+  copied_paths: string[];
+  skipped_existing: number;
+  errors: string[];
+  onboarding_required: boolean;
+}
+
+export interface InitStatusView {
+  runtime_workspace: string;
+  gate_state: InitGateState;
+  onboarding_completed: boolean;
+  has_openplanter_root: boolean;
+  has_runtime_wiki: boolean;
+  has_runtime_index: boolean;
+  init_state_path: string;
+  last_migration_target: string | null;
+  warnings: string[];
+}
+
+export interface MigrationSourceInspection {
+  path: string;
+  kind: MigrationSourceKind;
+  has_sessions: boolean;
+  has_settings: boolean;
+  has_credentials: boolean;
+  has_runtime_wiki: boolean;
+  has_baseline_wiki: boolean;
+  markdown_files: number;
+  warnings: string[];
+}
+
+export interface MigrationSourceInput {
+  path: string;
+}
+
+export interface MigrationInitRequest {
+  target_workspace: string;
+  sources: MigrationSourceInput[];
+}
+
+export interface MigrationProgressEvent {
+  stage: MigrationProgressStage;
+  message: string;
+  current: number;
+  total: number;
+}
+
+export interface MigrationInitResultView {
+  target_workspace: string;
+  sources: string[];
+  sessions_copied: number;
+  sessions_renamed: number;
+  settings_merged_fields: string[];
+  credentials_merged_fields: string[];
+  wiki_files_synthesized: number;
+  raw_preservation_root: string;
+  rewrite_summary: string;
+  restart_required: boolean;
+  restart_message: string;
+  warnings: string[];
+}
+
 export interface StepToolCallEntry {
   name: string;
   key_arg: string;
diff --git a/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts b/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
index 4ef78cf7..42915f39 100644
--- a/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
+++ b/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
@@ -26,6 +26,7 @@ describe("completionRegistry", () => {
     expect(values).toContain("/zai-plan");
     expect(values).toContain("/web-search");
     expect(values).toContain("/reasoning");
+    expect(values).toContain("/init");
   });
 
   it("every item has a non-empty value and description", () => {
@@ -114,4 +115,16 @@ describe("completionRegistry", () => {
     expect(helpCmd).toBeDefined();
     expect(helpCmd!.children).toBeUndefined();
   });
+
+  it("/init has expected subcommands", () => {
+    const initCmd = COMMAND_COMPLETIONS.find((c) => c.value === "/init");
+    expect(initCmd).toBeDefined();
+    expect(initCmd!.children?.map((child) => child.value)).toEqual([
+      "status",
+      "standard",
+      "migrate",
+      "open",
+      "done",
+    ]);
+  });
 });
diff --git a/openplanter-desktop/frontend/src/commands/completionRegistry.ts b/openplanter-desktop/frontend/src/commands/completionRegistry.ts
index 973dc00e..e7ae9ab8 100644
--- a/openplanter-desktop/frontend/src/commands/completionRegistry.ts
+++ b/openplanter-desktop/frontend/src/commands/completionRegistry.ts
@@ -78,4 +78,15 @@ export const COMMAND_COMPLETIONS: CompletionItem[] = [
     description: "Set reasoning effort",
     children: REASONING_LEVELS,
   },
+  {
+    value: "/init",
+    description: "Workspace initialization and migration",
+    children: [
+      { value: "status", description: "Show init status" },
+      { value: "standard", description: "Initialize the current workspace" },
+      { value: "migrate", description: "Open the migration init panel" },
+      { value: "open", description: "Open the init panel" },
+      { value: "done", description: "Mark the first-run gate complete" },
+    ],
+  },
 ];
diff --git a/openplanter-desktop/frontend/src/commands/init.ts b/openplanter-desktop/frontend/src/commands/init.ts
new file mode 100644
index 00000000..44bff941
--- /dev/null
+++ b/openplanter-desktop/frontend/src/commands/init.ts
@@ -0,0 +1,133 @@
+import {
+  completeFirstRunGate,
+  getInitStatus,
+  runStandardInit,
+} from "../api/invoke";
+import type { InitStatusView } from "../api/types";
+import { appState } from "../state/store";
+import type { CommandResult } from "./model";
+
+function statusLines(status: InitStatusView): string[] {
+  return [
+    `Workspace:   ${status.runtime_workspace}`,
+    `Gate:        ${status.gate_state}`,
+    `Initialized: ${status.onboarding_completed ? "yes" : "no"}`,
+    `Wiki root:   ${status.has_runtime_wiki ? "yes" : "no"}`,
+    `Wiki index:  ${status.has_runtime_index ? "yes" : "no"}`,
+    `Last migration target: ${status.last_migration_target || "—"}`,
+    ...status.warnings.map((warning) => `Warning: ${warning}`),
+  ];
+}
+
+export async function handleInitCommand(args: string): Promise<CommandResult> {
+  const parts = args.trim().split(/\s+/).filter(Boolean);
+  const subcommand = (parts[0] || "status").toLowerCase();
+
+  if (appState.get().isInitBusy) {
+    return {
+      action: "handled",
+      lines: ["Initialization is already running. Wait for it to finish first."],
+    };
+  }
+
+  if (subcommand === "status") {
+    const status = await getInitStatus();
+    appState.update((s) => ({
+      ...s,
+      initStatus: status,
+      initGateState: status.gate_state,
+      initGateVisible: status.gate_state !== "ready" ? true : s.initGateVisible,
+    }));
+    return { action: "handled", lines: statusLines(status) };
+  }
+
+  if (subcommand === "standard") {
+    try {
+      appState.update((s) => ({ ...s, isInitBusy: true, migrationResult: null }));
+      const report = await runStandardInit();
+      const status = await getInitStatus();
+      appState.update((s) => ({
+        ...s,
+        isInitBusy: false,
+        initStatus: status,
+        initGateState: status.gate_state,
+        initGateVisible: status.gate_state !== "ready" ? true : false,
+        initGateMode: "standard",
+        migrationProgress: null,
+      }));
+      if (typeof window !== "undefined") {
+        window.dispatchEvent(new CustomEvent("curator-done"));
+      }
+      return {
+        action: "handled",
+        lines: [
+          `Standard init completed for ${report.workspace}.`,
+          `Created paths: ${report.created_paths.length}`,
+          `Copied files: ${report.copied_paths.length}`,
+          `Skipped existing: ${report.skipped_existing}`,
+          ...statusLines(status),
+        ],
+      };
+    } catch (error) {
+      appState.update((s) => ({ ...s, isInitBusy: false }));
+      return {
+        action: "handled",
+        lines: [`Standard init failed: ${error}`],
+      };
+    }
+  }
+
+  if (subcommand === "migrate") {
+    appState.update((s) => ({
+      ...s,
+      initGateVisible: true,
+      initGateMode: "migration",
+      migrationResult: null,
+    }));
+    return {
+      action: "handled",
+      lines: ["Opened Migration Init. Add a target workspace and one or more sources in the setup panel."],
+    };
+  }
+
+  if (subcommand === "open") {
+    appState.update((s) => ({
+      ...s,
+      initGateVisible: true,
+      initGateMode: s.initGateMode,
+    }));
+    return {
+      action: "handled",
+      lines: ["Opened the workspace initialization panel."],
+    };
+  }
+
+  if (subcommand === "done") {
+    try {
+      appState.update((s) => ({ ...s, isInitBusy: true }));
+      const status = await completeFirstRunGate();
+      appState.update((s) => ({
+        ...s,
+        isInitBusy: false,
+        initStatus: status,
+        initGateState: status.gate_state,
+        initGateVisible: status.gate_state !== "ready",
+      }));
+      return { action: "handled", lines: statusLines(status) };
+    } catch (error) {
+      appState.update((s) => ({ ...s, isInitBusy: false }));
+      return {
+        action: "handled",
+        lines: [`Failed to complete onboarding: ${error}`],
+      };
+    }
+  }
+
+  return {
+    action: "handled",
+    lines: [
+      `Unknown /init subcommand: ${subcommand}`,
+      "Use /init status, /init standard, or /init migrate.",
+    ],
+  };
+}
diff --git a/openplanter-desktop/frontend/src/commands/slash.test.ts b/openplanter-desktop/frontend/src/commands/slash.test.ts
index e95062f4..d5db6e44 100644
--- a/openplanter-desktop/frontend/src/commands/slash.test.ts
+++ b/openplanter-desktop/frontend/src/commands/slash.test.ts
@@ -21,6 +21,7 @@ describe("dispatchSlashCommand", () => {
       webSearchProvider: "exa",
       sessionId: "20260101-120000-deadbeef",
       reasoningEffort: "medium",
+      initGateState: "ready",
     });
   });
 
@@ -166,4 +167,46 @@ describe("dispatchSlashCommand", () => {
 
     (globalThis as any).window = origWindow;
   });
+
+  it("/init status dispatches", async () => {
+    __setHandler("get_init_status", () => ({
+      runtime_workspace: "/tmp/ws",
+      gate_state: "requires_action",
+      onboarding_completed: false,
+      has_openplanter_root: true,
+      has_runtime_wiki: true,
+      has_runtime_index: true,
+      init_state_path: "/tmp/ws/.openplanter/init-state.json",
+      last_migration_target: null,
+      warnings: [],
+    }));
+    const result = await dispatchSlashCommand("/init status");
+    expect(result).not.toBeNull();
+    expect(result!.lines.some((l) => l.includes("Gate:"))).toBe(true);
+  });
+
+  it("/init standard dispatches", async () => {
+    __setHandler("run_standard_init", () => ({
+      workspace: "/tmp/ws",
+      created_paths: [],
+      copied_paths: [],
+      skipped_existing: 0,
+      errors: [],
+      onboarding_required: false,
+    }));
+    __setHandler("get_init_status", () => ({
+      runtime_workspace: "/tmp/ws",
+      gate_state: "ready",
+      onboarding_completed: true,
+      has_openplanter_root: true,
+      has_runtime_wiki: true,
+      has_runtime_index: true,
+      init_state_path: "/tmp/ws/.openplanter/init-state.json",
+      last_migration_target: null,
+      warnings: [],
+    }));
+    const result = await dispatchSlashCommand("/init standard");
+    expect(result).not.toBeNull();
+    expect(result!.lines.some((l) => l.includes("Standard init completed"))).toBe(true);
+  });
 });
diff --git a/openplanter-desktop/frontend/src/commands/slash.ts b/openplanter-desktop/frontend/src/commands/slash.ts
index 748b312d..125eeb14 100644
--- a/openplanter-desktop/frontend/src/commands/slash.ts
+++ b/openplanter-desktop/frontend/src/commands/slash.ts
@@ -5,6 +5,7 @@ import { handleModelCommand, type CommandResult } from "./model";
 import { handleReasoningCommand } from "./reasoning";
 import { handleWebSearchCommand } from "./webSearch";
 import { handleZaiPlanCommand } from "./zaiPlan";
+import { handleInitCommand } from "./init";
 
 /** Dispatch a slash command. Returns null if not a slash command. */
 export async function dispatchSlashCommand(input: string): Promise<CommandResult | null> {
@@ -38,6 +39,9 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
           "  /web-search <provider> --save  Set and persist",
           "  /reasoning          Show/set reasoning effort",
           "  /reasoning <level>  Set level (low, medium, high, off)",
+          "  /init status        Show workspace init status",
+          "  /init standard      Initialize the current workspace",
+          "  /init migrate       Open the migration init panel",
         ],
       };
 
@@ -110,6 +114,9 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
     case "/reasoning":
       return handleReasoningCommand(args);
 
+    case "/init":
+      return handleInitCommand(args);
+
     default:
       return {
         action: "handled",
diff --git a/openplanter-desktop/frontend/src/components/App.test.ts b/openplanter-desktop/frontend/src/components/App.test.ts
index 1a3d0bd6..19d87533 100644
--- a/openplanter-desktop/frontend/src/components/App.test.ts
+++ b/openplanter-desktop/frontend/src/components/App.test.ts
@@ -44,7 +44,17 @@ describe("createApp", () => {
 
   beforeEach(() => {
     uuidCounter = 0;
-    appState.set({ ...originalState, messages: [], sessionId: null });
+    appState.set({
+      ...originalState,
+      messages: [],
+      sessionId: null,
+      initGateVisible: false,
+      initGateState: "ready",
+      initStatus: null,
+      isInitBusy: false,
+      migrationProgress: null,
+      migrationResult: null,
+    });
     __setHandler("list_sessions", () => [SESSION_B, SESSION_A]);
     __setHandler("get_credentials_status", () => ({
       openai: true, anthropic: true, openrouter: false,
@@ -139,6 +149,34 @@ describe("createApp", () => {
       expect(items[0].textContent).toBe("No sessions yet");
     });
   });
+
+  it("renders workspace init gate when requested", async () => {
+    appState.update((s) => ({
+      ...s,
+      initGateVisible: true,
+      initGateState: "requires_action",
+      initStatus: {
+        runtime_workspace: "/tmp/ws",
+        gate_state: "requires_action",
+        onboarding_completed: false,
+        has_openplanter_root: true,
+        has_runtime_wiki: true,
+        has_runtime_index: true,
+        init_state_path: "/tmp/ws/.openplanter/init-state.json",
+        last_migration_target: null,
+        warnings: [],
+      },
+    }));
+    const root = document.createElement("div");
+    document.body.appendChild(root);
+    createApp(root);
+
+    await vi.waitFor(() => {
+      const gate = root.querySelector(".workspace-init-gate") as HTMLElement;
+      expect(gate).not.toBeNull();
+      expect(gate.style.display).toBe("flex");
+    });
+  });
 });
 
 describe("session delete confirmation flow", () => {
diff --git a/openplanter-desktop/frontend/src/components/App.ts b/openplanter-desktop/frontend/src/components/App.ts
index 715c0f38..4ef96820 100644
--- a/openplanter-desktop/frontend/src/components/App.ts
+++ b/openplanter-desktop/frontend/src/components/App.ts
@@ -2,6 +2,7 @@
 import { createStatusBar } from "./StatusBar";
 import { createChatPane } from "./ChatPane";
 import { createGraphPane } from "./GraphPane";
+import { createWorkspaceInitGate } from "./WorkspaceInitGate";
 import { appState } from "../state/store";
 import { listSessions, openSession, deleteSession, getCredentialsStatus, getSessionHistory } from "../api/invoke";
 import type { ChatMessage } from "../state/store";
@@ -61,6 +62,10 @@ export function createApp(root: HTMLElement): void {
   const graphPane = createGraphPane();
   root.appendChild(graphPane);
 
+  // Workspace init gate
+  const workspaceInitGate = createWorkspaceInitGate();
+  root.appendChild(workspaceInitGate);
+
   // Reactive settings display
   function renderSettings() {
     const s = appState.get();
diff --git a/openplanter-desktop/frontend/src/components/InputBar.test.ts b/openplanter-desktop/frontend/src/components/InputBar.test.ts
index cf5277a5..1bea6eb1 100644
--- a/openplanter-desktop/frontend/src/components/InputBar.test.ts
+++ b/openplanter-desktop/frontend/src/components/InputBar.test.ts
@@ -21,7 +21,13 @@ describe("createInputBar", () => {
 
   beforeEach(() => {
     uuidCounter = 0;
-    appState.set({ ...originalState, messages: [], inputHistory: [], inputQueue: [] });
+    appState.set({
+      ...originalState,
+      messages: [],
+      inputHistory: [],
+      inputQueue: [],
+      initGateState: "ready",
+    });
     // Default handlers to prevent unhandled rejection
     __setHandler("solve", () => {});
     __setHandler("cancel", () => {});
@@ -386,4 +392,43 @@ describe("createInputBar", () => {
 
     document.body.removeChild(bar);
   });
+
+  it("blocks normal objective submit until init is ready", async () => {
+    appState.update((s) => ({ ...s, initGateState: "requires_action" }));
+    const bar = createInputBar();
+    document.body.appendChild(bar);
+    const textarea = bar.querySelector("textarea")!;
+
+    textarea.value = "blocked objective";
+    bar.querySelectorAll("button")[0].click();
+
+    await vi.waitFor(() => {
+      expect(appState.get().isRunning).toBe(false);
+      expect(
+        appState.get().messages.some((m) =>
+          m.content.includes("Workspace initialization is required")
+        )
+      ).toBe(true);
+    });
+
+    document.body.removeChild(bar);
+  });
+
+  it("blocks non-init slash commands until init is ready", async () => {
+    appState.update((s) => ({ ...s, initGateState: "requires_action" }));
+    const bar = createInputBar();
+    document.body.appendChild(bar);
+    const textarea = bar.querySelector("textarea")!;
+
+    textarea.value = "/status";
+    bar.querySelectorAll("button")[0].click();
+
+    await vi.waitFor(() => {
+      expect(
+        appState.get().messages.some((m) => m.content.includes("Use /init first"))
+      ).toBe(true);
+    });
+
+    document.body.removeChild(bar);
+  });
 });
diff --git a/openplanter-desktop/frontend/src/components/InputBar.ts b/openplanter-desktop/frontend/src/components/InputBar.ts
index cad43240..4575bb27 100644
--- a/openplanter-desktop/frontend/src/components/InputBar.ts
+++ b/openplanter-desktop/frontend/src/components/InputBar.ts
@@ -55,6 +55,15 @@ export function createInputBar(): HTMLElement {
 
     // Check for slash commands
     if (text.startsWith("/")) {
+      const initRequired = appState.get().initGateState !== "ready";
+      const lower = text.toLowerCase();
+      if (initRequired && !lower.startsWith("/init") && !lower.startsWith("/help")) {
+        textarea.value = "";
+        autoResize();
+        addSystemMessage("Workspace initialization is required. Use /init first.");
+        return;
+      }
+
       textarea.value = "";
       autoResize();
 
@@ -80,6 +89,13 @@ export function createInputBar(): HTMLElement {
       return;
     }
 
+    if (appState.get().initGateState !== "ready") {
+      addSystemMessage(
+        "Workspace initialization is required before starting an objective. Use /init."
+      );
+      return;
+    }
+
     // If running, queue the input instead of blocking
     if (appState.get().isRunning) {
       appState.update((s) => ({
@@ -259,7 +275,9 @@ export function createInputBar(): HTMLElement {
     cancelBtn.style.display = running ? "" : "none";
     textarea.placeholder = running
       ? "Type to queue..."
-      : "Enter objective or /command...";
+      : appState.get().initGateState !== "ready"
+        ? "Complete workspace init or use /init..."
+        : "Enter objective or /command...";
     // Keep textarea enabled during execution for queuing
     submitBtn.disabled = false;
   });
diff --git a/openplanter-desktop/frontend/src/components/WorkspaceInitGate.ts b/openplanter-desktop/frontend/src/components/WorkspaceInitGate.ts
new file mode 100644
index 00000000..5baac0fd
--- /dev/null
+++ b/openplanter-desktop/frontend/src/components/WorkspaceInitGate.ts
@@ -0,0 +1,402 @@
+import {
+  getInitStatus,
+  inspectMigrationSource,
+  runMigrationInit,
+  runStandardInit,
+} from "../api/invoke";
+import type { MigrationSourceInspection } from "../api/types";
+import { appState } from "../state/store";
+
+interface SourceDraft {
+  path: string;
+  inspection: MigrationSourceInspection | null;
+}
+
+export function createWorkspaceInitGate(): HTMLElement {
+  const overlay = document.createElement("div");
+  overlay.className = "workspace-init-gate";
+  overlay.style.position = "fixed";
+  overlay.style.inset = "0";
+  overlay.style.display = "none";
+  overlay.style.alignItems = "center";
+  overlay.style.justifyContent = "center";
+  overlay.style.background = "rgba(6, 10, 14, 0.78)";
+  overlay.style.zIndex = "999";
+
+  const panel = document.createElement("div");
+  panel.className = "workspace-init-panel";
+  panel.style.width = "min(760px, 92vw)";
+  panel.style.maxHeight = "88vh";
+  panel.style.overflow = "auto";
+  panel.style.padding = "20px";
+  panel.style.borderRadius = "16px";
+  panel.style.background = "var(--bg-secondary)";
+  panel.style.border = "1px solid var(--border)";
+  panel.style.boxShadow = "0 24px 80px rgba(0, 0, 0, 0.35)";
+  overlay.appendChild(panel);
+
+  let targetWorkspace = "";
+  let sources: SourceDraft[] = [{ path: "", inspection: null }];
+  let localError = "";
+
+  function ensureDefaultTarget(): void {
+    const workspace = appState.get().workspace;
+    if (!targetWorkspace && workspace) {
+      targetWorkspace = `${workspace}-desktop`;
+    }
+  }
+
+  async function refreshStatus(): Promise<void> {
+    const status = await getInitStatus();
+    appState.update((s) => ({
+      ...s,
+      initStatus: status,
+      initGateState: status.gate_state,
+      initGateVisible: status.gate_state !== "ready" ? true : s.initGateVisible,
+    }));
+  }
+
+  function visibilityState(): boolean {
+    const state = appState.get();
+    return state.initGateVisible || state.initGateState !== "ready";
+  }
+
+  function updateBusy(isInitBusy: boolean): void {
+    appState.update((s) => ({ ...s, isInitBusy }));
+  }
+
+  async function handleStandardInit(): Promise<void> {
+    localError = "";
+    updateBusy(true);
+    try {
+      await runStandardInit();
+      await refreshStatus();
+      appState.update((s) => ({
+        ...s,
+        initGateVisible: false,
+        initGateMode: "standard",
+        migrationProgress: null,
+        migrationResult: null,
+      }));
+      window.dispatchEvent(new CustomEvent("curator-done"));
+    } catch (error) {
+      localError = `Standard init failed: ${error}`;
+    } finally {
+      updateBusy(false);
+      render();
+    }
+  }
+
+  async function handleInspect(index: number): Promise<void> {
+    const draft = sources[index];
+    if (!draft || !draft.path.trim()) {
+      localError = "Enter a source path before inspecting it.";
+      render();
+      return;
+    }
+    localError = "";
+    updateBusy(true);
+    try {
+      const inspection = await inspectMigrationSource(draft.path.trim());
+      sources[index] = { ...draft, inspection };
+    } catch (error) {
+      localError = `Inspection failed: ${error}`;
+    } finally {
+      updateBusy(false);
+      render();
+    }
+  }
+
+  async function handleMigration(): Promise<void> {
+    const trimmedTarget = targetWorkspace.trim();
+    const trimmedSources = sources
+      .map((source) => source.path.trim())
+      .filter(Boolean);
+    if (!trimmedTarget) {
+      localError = "Enter a target workspace path.";
+      render();
+      return;
+    }
+    if (trimmedSources.length === 0) {
+      localError = "Add at least one source workspace or research directory.";
+      render();
+      return;
+    }
+
+    localError = "";
+    appState.update((s) => ({
+      ...s,
+      isInitBusy: true,
+      migrationProgress: null,
+      migrationResult: null,
+      initGateMode: "migration",
+      initGateVisible: true,
+    }));
+    try {
+      const result = await runMigrationInit({
+        target_workspace: trimmedTarget,
+        sources: trimmedSources.map((path) => ({ path })),
+      });
+      appState.update((s) => ({
+        ...s,
+        isInitBusy: false,
+        migrationResult: result,
+        initGateVisible: true,
+      }));
+    } catch (error) {
+      localError = `Migration failed: ${error}`;
+      updateBusy(false);
+    } finally {
+      render();
+    }
+  }
+
+  function renderSourceRow(index: number, stateBusy: boolean): HTMLElement {
+    const draft = sources[index];
+    const row = document.createElement("div");
+    row.style.display = "grid";
+    row.style.gridTemplateColumns = "1fr auto auto";
+    row.style.gap = "8px";
+    row.style.marginBottom = "10px";
+
+    const input = document.createElement("input");
+    input.type = "text";
+    input.value = draft.path;
+    input.placeholder = "/path/to/openplanter-workspace-or-research-dir";
+    input.disabled = stateBusy;
+    input.addEventListener("input", () => {
+      sources[index] = { path: input.value, inspection: null };
+    });
+
+    const inspectBtn = document.createElement("button");
+    inspectBtn.textContent = "Inspect";
+    inspectBtn.disabled = stateBusy;
+    inspectBtn.addEventListener("click", () => {
+      void handleInspect(index);
+    });
+
+    const removeBtn = document.createElement("button");
+    removeBtn.textContent = "Remove";
+    removeBtn.disabled = stateBusy || sources.length === 1;
+    removeBtn.addEventListener("click", () => {
+      sources.splice(index, 1);
+      render();
+    });
+
+    row.appendChild(input);
+    row.appendChild(inspectBtn);
+    row.appendChild(removeBtn);
+
+    if (draft.inspection) {
+      const details = document.createElement("div");
+      details.style.gridColumn = "1 / -1";
+      details.style.padding = "8px 10px";
+      details.style.border = "1px solid var(--border)";
+      details.style.borderRadius = "10px";
+      details.style.background = "var(--bg-tertiary)";
+      details.textContent = [
+        `kind=${draft.inspection.kind}`,
+        `markdown=${draft.inspection.markdown_files}`,
+        `sessions=${draft.inspection.has_sessions ? "yes" : "no"}`,
+        `settings=${draft.inspection.has_settings ? "yes" : "no"}`,
+        `credentials=${draft.inspection.has_credentials ? "yes" : "no"}`,
+        `runtime_wiki=${draft.inspection.has_runtime_wiki ? "yes" : "no"}`,
+      ].join("  |  ");
+      row.appendChild(details);
+    }
+
+    return row;
+  }
+
+  function render(): void {
+    ensureDefaultTarget();
+    const state = appState.get();
+    const visible = visibilityState();
+    overlay.style.display = visible ? "flex" : "none";
+    if (!visible) {
+      return;
+    }
+
+    panel.replaceChildren();
+
+    const title = document.createElement("h2");
+    title.textContent = "Workspace Initialization";
+    panel.appendChild(title);
+
+    const intro = document.createElement("p");
+    intro.textContent =
+      state.initGateState !== "ready"
+        ? "Choose Standard Init to prepare the current workspace, or Migration Init to build a new Desktop workspace from one or more existing sources."
+        : "Manage the current workspace or open a migration flow to build a new Desktop workspace.";
+    panel.appendChild(intro);
+
+    const modeBar = document.createElement("div");
+    modeBar.style.display = "flex";
+    modeBar.style.gap = "8px";
+    modeBar.style.marginBottom = "14px";
+
+    const standardTab = document.createElement("button");
+    standardTab.textContent = "Standard Init";
+    standardTab.disabled = state.isInitBusy;
+    standardTab.style.fontWeight = state.initGateMode === "standard" ? "700" : "400";
+    standardTab.addEventListener("click", () => {
+      appState.update((s) => ({ ...s, initGateMode: "standard", migrationResult: null }));
+    });
+
+    const migrationTab = document.createElement("button");
+    migrationTab.textContent = "Migration Init";
+    migrationTab.disabled = state.isInitBusy;
+    migrationTab.style.fontWeight = state.initGateMode === "migration" ? "700" : "400";
+    migrationTab.addEventListener("click", () => {
+      appState.update((s) => ({ ...s, initGateMode: "migration" }));
+    });
+
+    modeBar.appendChild(standardTab);
+    modeBar.appendChild(migrationTab);
+    panel.appendChild(modeBar);
+
+    if (state.initStatus) {
+      const status = document.createElement("div");
+      status.style.padding = "10px 12px";
+      status.style.border = "1px solid var(--border)";
+      status.style.borderRadius = "12px";
+      status.style.background = "var(--bg-tertiary)";
+      status.style.marginBottom = "14px";
+      status.textContent = [
+        `workspace=${state.initStatus.runtime_workspace}`,
+        `gate=${state.initStatus.gate_state}`,
+        `wiki=${state.initStatus.has_runtime_index ? "ready" : "missing"}`,
+        `last_migration=${state.initStatus.last_migration_target || "—"}`,
+      ].join("  |  ");
+      panel.appendChild(status);
+    }
+
+    if (state.migrationProgress) {
+      const progress = document.createElement("div");
+      progress.style.padding = "10px 12px";
+      progress.style.border = "1px solid var(--border)";
+      progress.style.borderRadius = "12px";
+      progress.style.background = "rgba(57, 148, 255, 0.08)";
+      progress.style.marginBottom = "14px";
+      progress.textContent = `[${state.migrationProgress.stage}] ${state.migrationProgress.message}`;
+      panel.appendChild(progress);
+    }
+
+    if (state.migrationResult) {
+      const result = document.createElement("div");
+      result.style.padding = "12px";
+      result.style.border = "1px solid var(--border)";
+      result.style.borderRadius = "12px";
+      result.style.background = "rgba(56, 184, 90, 0.10)";
+      result.style.marginBottom = "14px";
+      result.textContent = [
+        `Target: ${state.migrationResult.target_workspace}`,
+        `Sessions copied: ${state.migrationResult.sessions_copied}`,
+        `Sessions renamed: ${state.migrationResult.sessions_renamed}`,
+        `Wiki pages available: ${state.migrationResult.wiki_files_synthesized}`,
+        `Curator summary: ${state.migrationResult.rewrite_summary}`,
+        state.migrationResult.restart_message,
+      ].join("\n");
+      panel.appendChild(result);
+    }
+
+    if (localError) {
+      const error = document.createElement("div");
+      error.style.padding = "10px 12px";
+      error.style.border = "1px solid rgba(255, 99, 99, 0.45)";
+      error.style.borderRadius = "12px";
+      error.style.background = "rgba(255, 99, 99, 0.10)";
+      error.style.marginBottom = "14px";
+      error.textContent = localError;
+      panel.appendChild(error);
+    }
+
+    if (state.initGateMode === "standard") {
+      const block = document.createElement("div");
+      const body = document.createElement("p");
+      body.textContent =
+        "Standard Init prepares the current workspace, creates the runtime wiki skeleton, and marks the Desktop onboarding flow complete.";
+      const button = document.createElement("button");
+      button.textContent = state.isInitBusy ? "Initializing..." : "Initialize Current Workspace";
+      button.disabled = state.isInitBusy;
+      button.addEventListener("click", () => {
+        void handleStandardInit();
+      });
+      block.appendChild(body);
+      block.appendChild(button);
+      panel.appendChild(block);
+    } else {
+      const migration = document.createElement("div");
+
+      const targetLabel = document.createElement("label");
+      targetLabel.textContent = "Target Workspace";
+      targetLabel.style.display = "block";
+      targetLabel.style.marginBottom = "6px";
+      migration.appendChild(targetLabel);
+
+      const targetInput = document.createElement("input");
+      targetInput.type = "text";
+      targetInput.value = targetWorkspace;
+      targetInput.placeholder = "/path/to/new-desktop-workspace";
+      targetInput.style.width = "100%";
+      targetInput.style.marginBottom = "14px";
+      targetInput.disabled = state.isInitBusy;
+      targetInput.addEventListener("input", () => {
+        targetWorkspace = targetInput.value;
+      });
+      migration.appendChild(targetInput);
+
+      const sourcesHeader = document.createElement("div");
+      sourcesHeader.textContent = "Migration Sources";
+      sourcesHeader.style.fontWeight = "700";
+      sourcesHeader.style.marginBottom = "8px";
+      migration.appendChild(sourcesHeader);
+
+      const sourceList = document.createElement("div");
+      for (let index = 0; index < sources.length; index += 1) {
+        sourceList.appendChild(renderSourceRow(index, state.isInitBusy));
+      }
+      migration.appendChild(sourceList);
+
+      const actions = document.createElement("div");
+      actions.style.display = "flex";
+      actions.style.gap = "8px";
+      actions.style.marginTop = "12px";
+
+      const addBtn = document.createElement("button");
+      addBtn.textContent = "Add Source";
+      addBtn.disabled = state.isInitBusy;
+      addBtn.addEventListener("click", () => {
+        sources.push({ path: "", inspection: null });
+        render();
+      });
+
+      const migrateBtn = document.createElement("button");
+      migrateBtn.textContent = state.isInitBusy ? "Migrating..." : "Run Migration Init";
+      migrateBtn.disabled = state.isInitBusy;
+      migrateBtn.addEventListener("click", () => {
+        void handleMigration();
+      });
+
+      actions.appendChild(addBtn);
+      actions.appendChild(migrateBtn);
+      migration.appendChild(actions);
+      panel.appendChild(migration);
+    }
+
+    if (state.initGateState === "ready") {
+      const closeBtn = document.createElement("button");
+      closeBtn.textContent = "Close";
+      closeBtn.style.marginTop = "16px";
+      closeBtn.disabled = state.isInitBusy;
+      closeBtn.addEventListener("click", () => {
+        appState.update((s) => ({ ...s, initGateVisible: false }));
+      });
+      panel.appendChild(closeBtn);
+    }
+  }
+
+  appState.subscribe(render);
+  render();
+  return overlay;
+}
diff --git a/openplanter-desktop/frontend/src/main.ts b/openplanter-desktop/frontend/src/main.ts
index ad9ac303..bb9696a8 100644
--- a/openplanter-desktop/frontend/src/main.ts
+++ b/openplanter-desktop/frontend/src/main.ts
@@ -1,5 +1,5 @@
 import { createApp } from "./components/App";
-import { getConfig } from "./api/invoke";
+import { getConfig, getInitStatus } from "./api/invoke";
 import {
   onAgentTrace,
   onAgentDelta,
@@ -8,6 +8,7 @@ import {
   onAgentStep,
   onWikiUpdated,
   onCuratorUpdate,
+  onMigrationProgress,
 } from "./api/events";
 import { appState } from "./state/store";
 
@@ -31,6 +32,7 @@ async function init() {
     const config = await getConfig();
     provider = config.provider;
     model = config.model;
+    const initStatus = await getInitStatus();
     appState.update((s) => ({
       ...s,
       provider: config.provider,
@@ -43,6 +45,9 @@ async function init() {
       workspace: config.workspace,
       maxDepth: config.max_depth,
       maxStepsPerCall: config.max_steps_per_call,
+      initStatus,
+      initGateState: initStatus.gate_state,
+      initGateVisible: initStatus.gate_state !== "ready",
     }));
   } catch (e) {
     console.error("Failed to load config:", e);
@@ -82,6 +87,17 @@ async function init() {
         content: "Type /help for commands. ESC to cancel a running task.",
         timestamp: Date.now(),
       },
+      ...(state.initGateState !== "ready"
+        ? [
+            {
+              id: crypto.randomUUID(),
+              role: "system" as const,
+              content:
+                "Workspace initialization is required before running the agent. Use the setup panel or /init.",
+              timestamp: Date.now(),
+            },
+          ]
+        : []),
     ],
   }));
 
@@ -175,6 +191,14 @@ async function init() {
     // Notify graph pane to refresh with curator's wiki changes
     window.dispatchEvent(new CustomEvent("curator-done"));
   });
+
+  await onMigrationProgress((event) => {
+    appState.update((s) => ({
+      ...s,
+      migrationProgress: event,
+      isInitBusy: event.stage !== "done",
+    }));
+  });
 }
 
 function processQueue() {
diff --git a/openplanter-desktop/frontend/src/state/store.test.ts b/openplanter-desktop/frontend/src/state/store.test.ts
index 7796926e..41420430 100644
--- a/openplanter-desktop/frontend/src/state/store.test.ts
+++ b/openplanter-desktop/frontend/src/state/store.test.ts
@@ -71,6 +71,9 @@ describe("appState", () => {
     expect(state.maxDepth).toBe(4);
     expect(state.maxStepsPerCall).toBe(100);
     expect(state.inputQueue).toEqual([]);
+    expect(state.initGateState).toBe("ready");
+    expect(state.isInitBusy).toBe(false);
+    expect(state.initGateVisible).toBe(false);
   });
 
   it("message append via update", () => {
diff --git a/openplanter-desktop/frontend/src/state/store.ts b/openplanter-desktop/frontend/src/state/store.ts
index eafa4c8a..27d1a382 100644
--- a/openplanter-desktop/frontend/src/state/store.ts
+++ b/openplanter-desktop/frontend/src/state/store.ts
@@ -1,4 +1,10 @@
 /** Simple observable state store. */
+import type {
+  InitStatusView,
+  MigrationInitResultView,
+  MigrationProgressEvent,
+} from "../api/types";
+
 type Listener<T> = (value: T) => void;
 
 export class Store<T> {
@@ -77,6 +83,13 @@ export interface AppState {
   currentDepth: number;
   inputHistory: string[];
   inputQueue: string[];
+  initGateState: "ready" | "requires_action" | "blocked";
+  initStatus: InitStatusView | null;
+  isInitBusy: boolean;
+  initGateVisible: boolean;
+  initGateMode: "standard" | "migration";
+  migrationProgress: MigrationProgressEvent | null;
+  migrationResult: MigrationInitResultView | null;
 }
 
 export const appState = new Store<AppState>({
@@ -98,4 +111,11 @@ export const appState = new Store<AppState>({
   currentDepth: 0,
   inputHistory: [],
   inputQueue: [],
+  initGateState: "ready",
+  initStatus: null,
+  isInitBusy: false,
+  initGateVisible: false,
+  initGateMode: "standard",
+  migrationProgress: null,
+  migrationResult: null,
 });

From fd08764530cadd1629543e42cb4a7a4e28f00df1 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Thu, 12 Mar 2026 17:14:24 -0400
Subject: [PATCH 10/58] Remove investigation artifacts from repository

---
 .gitignore | 40 ++++++++++++++++++++++++++++++++++++----
 LICENSE    | 21 ---------------------
 2 files changed, 36 insertions(+), 25 deletions(-)
 delete mode 100644 LICENSE

diff --git a/.gitignore b/.gitignore
index 6c4fc33f..e5a51452 100644
--- a/.gitignore
+++ b/.gitignore
@@ -1,11 +1,43 @@
+# Local environment and workspace state
 .env
 .env.*
-node_modules/
+.venv/
+.python-version
+.direnv/
+.openplanter/
+/workspace/
+
+# Python caches and build artifacts
 __pycache__/
-*.pyc
+*.py[cod]
 *.egg-info/
-dist/
+.pytest_cache/
+.coverage
+.coverage.*
+htmlcov/
+.mypy_cache/
+.ruff_cache/
+.hypothesis/
+.tox/
+.nox/
 build/
+dist/
+pip-wheel-metadata/
+
+# Frontend and test artifacts
+node_modules/
+coverage/
+playwright-report/
+test-results/
+
+# Rust / Tauri build output
+target/
+
+# Generated captures
 *.cast
 *.mp4
-.openplanter/
+
+# Editor and OS cruft
+.DS_Store
+.idea/
+.vscode/
diff --git a/LICENSE b/LICENSE
deleted file mode 100644
index e8b35c70..00000000
--- a/LICENSE
+++ /dev/null
@@ -1,21 +0,0 @@
-MIT License
-
-Copyright (c) 2026 OpenPlanter Contributors
-
-Permission is hereby granted, free of charge, to any person obtaining a copy
-of this software and associated documentation files (the "Software"), to deal
-in the Software without restriction, including without limitation the rights
-to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
-copies of the Software, and to permit persons to whom the Software is
-furnished to do so, subject to the following conditions:
-
-The above copyright notice and this permission notice shall be included in all
-copies or substantial portions of the Software.
-
-THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
-IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
-FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
-AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
-LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
-OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
-SOFTWARE.

From 4e33f5ab5139ed3730c53cfdc10c30a5af730970 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Fri, 13 Mar 2026 09:04:19 -0400
Subject: [PATCH 11/58] fix: preserve replay sequence across resumed sessions

---
 agent/engine.py                               |   2 +-
 agent/replay_log.py                           |  65 ++++++++-
 .../crates/op-core/src/session/replay.rs      | 137 ++++++++++++++++++
 tests/test_replay_log.py                      |  41 +++++-
 4 files changed, 242 insertions(+), 3 deletions(-)

diff --git a/agent/engine.py b/agent/engine.py
index 422dbf99..b762c621 100644
--- a/agent/engine.py
+++ b/agent/engine.py
@@ -355,7 +355,7 @@ def _solve_recursive(
 
         conversation = model.create_conversation(self.system_prompt, initial_message)
 
-        if replay_logger and replay_logger._seq == 0:
+        if replay_logger and replay_logger.needs_header:
             replay_logger.write_header(
                 provider=type(model).__name__,
                 model=getattr(model, "model", "(unknown)"),
diff --git a/agent/replay_log.py b/agent/replay_log.py
index 96a399a7..466b53af 100644
--- a/agent/replay_log.py
+++ b/agent/replay_log.py
@@ -25,6 +25,16 @@ class ReplayLogger:
     conversation_id: str = "root"
     _seq: int = field(default=0, init=False)
     _last_msg_count: int = field(default=0, init=False)
+    _has_call: bool = field(default=False, init=False)
+    _has_header: bool = field(default=False, init=False)
+
+    def __post_init__(self) -> None:
+        self._seq = self._scan_next_seq()
+        self._hydrate_conversation_state()
+
+    @property
+    def needs_header(self) -> bool:
+        return not self._has_header
 
     def child(self, depth: int, step: int) -> "ReplayLogger":
         """Create a child logger for a subtask conversation."""
@@ -56,6 +66,7 @@ def write_header(
         if temperature is not None:
             record["temperature"] = temperature
         self._append(record)
+        self._has_header = True
 
     def log_call(
         self,
@@ -68,6 +79,7 @@ def log_call(
         output_tokens: int = 0,
         elapsed_sec: float = 0.0,
     ) -> None:
+        self._seq = max(self._seq, self._scan_next_seq())
         record: dict[str, Any] = {
             "type": "call",
             "conversation_id": self.conversation_id,
@@ -76,7 +88,7 @@ def log_call(
             "step": step,
             "ts": datetime.now(timezone.utc).isoformat(),
         }
-        if self._seq == 0:
+        if not self._has_call:
             record["messages_snapshot"] = messages
         else:
             record["messages_delta"] = messages[self._last_msg_count:]
@@ -86,9 +98,60 @@ def log_call(
         record["elapsed_sec"] = round(elapsed_sec, 3)
 
         self._last_msg_count = len(messages)
+        self._has_call = True
         self._seq += 1
         self._append(record)
 
+    def _scan_next_seq(self) -> int:
+        if not self.path.exists():
+            return 0
+        next_seq = 0
+        for raw_line in self.path.read_text(encoding="utf-8").splitlines():
+            line = raw_line.strip()
+            if not line:
+                continue
+            try:
+                record = json.loads(line)
+            except json.JSONDecodeError:
+                continue
+            seq = record.get("seq")
+            if isinstance(seq, int) and seq >= next_seq:
+                next_seq = seq + 1
+        return next_seq
+
+    def _hydrate_conversation_state(self) -> None:
+        if not self.path.exists():
+            return
+        msg_count = 0
+        has_call = False
+        has_header = False
+        for raw_line in self.path.read_text(encoding="utf-8").splitlines():
+            line = raw_line.strip()
+            if not line:
+                continue
+            try:
+                record = json.loads(line)
+            except json.JSONDecodeError:
+                continue
+            if record.get("conversation_id") != self.conversation_id:
+                continue
+            if record.get("type") == "header":
+                has_header = True
+                continue
+            if record.get("type") != "call":
+                continue
+            has_call = True
+            snapshot = record.get("messages_snapshot")
+            if isinstance(snapshot, list):
+                msg_count = len(snapshot)
+                continue
+            delta = record.get("messages_delta")
+            if isinstance(delta, list):
+                msg_count += len(delta)
+        self._has_call = has_call
+        self._has_header = has_header
+        self._last_msg_count = msg_count
+
     def _append(self, record: dict[str, Any]) -> None:
         self.path.parent.mkdir(parents=True, exist_ok=True)
         with self.path.open("a", encoding="utf-8") as fh:
diff --git a/openplanter-desktop/crates/op-core/src/session/replay.rs b/openplanter-desktop/crates/op-core/src/session/replay.rs
index d347874a..df6895aa 100644
--- a/openplanter-desktop/crates/op-core/src/session/replay.rs
+++ b/openplanter-desktop/crates/op-core/src/session/replay.rs
@@ -58,6 +58,7 @@ impl ReplayLogger {
 
     /// Append an entry to the replay log.
     pub async fn append(&mut self, mut entry: ReplayEntry) -> std::io::Result<()> {
+        self.seq = self.seq.max(Self::max_seq_from_file(&self.path).await?);
         self.seq += 1;
         entry.seq = self.seq;
         if entry.timestamp.is_empty() {
@@ -77,6 +78,29 @@ impl ReplayLogger {
         Ok(())
     }
 
+    async fn max_seq_from_file(path: &Path) -> std::io::Result<u64> {
+        if !path.exists() {
+            return Ok(0);
+        }
+        let content = fs::read_to_string(path).await?;
+        let mut max_seq = 0_u64;
+        for line in content.lines() {
+            let trimmed = line.trim();
+            if trimmed.is_empty() {
+                continue;
+            }
+            match serde_json::from_str::<ReplayEntry>(trimmed) {
+                Ok(entry) => {
+                    max_seq = max_seq.max(entry.seq);
+                }
+                Err(e) => {
+                    eprintln!("[replay] skipping malformed line: {e}");
+                }
+            }
+        }
+        Ok(max_seq)
+    }
+
     /// Read all entries from a session's replay log.
     pub async fn read_all(session_dir: &Path) -> std::io::Result<Vec<ReplayEntry>> {
         let path = session_dir.join("replay.jsonl");
@@ -292,4 +316,117 @@ mod tests {
         assert!(!content.contains("step_number"));
         assert!(!content.contains("step_tool_calls"));
     }
+
+    #[tokio::test]
+    async fn test_append_continues_seq_from_existing_file() {
+        let tmp = tempdir().unwrap();
+        let path = tmp.path().join("replay.jsonl");
+        let content = format!(
+            "{}\n{}\n",
+            serde_json::to_string(&ReplayEntry {
+                seq: 4,
+                timestamp: "2026-01-01T00:00:00Z".into(),
+                role: "user".into(),
+                content: "first".into(),
+                tool_name: None,
+                is_rendered: None,
+                step_number: None,
+                step_tokens_in: None,
+                step_tokens_out: None,
+                step_elapsed: None,
+                step_model_preview: None,
+                step_tool_calls: None,
+            })
+            .unwrap(),
+            serde_json::to_string(&ReplayEntry {
+                seq: 6,
+                timestamp: "2026-01-01T00:01:00Z".into(),
+                role: "assistant".into(),
+                content: "second".into(),
+                tool_name: None,
+                is_rendered: None,
+                step_number: None,
+                step_tokens_in: None,
+                step_tokens_out: None,
+                step_elapsed: None,
+                step_model_preview: None,
+                step_tool_calls: None,
+            })
+            .unwrap(),
+        );
+        fs::write(&path, content).await.unwrap();
+
+        let mut logger = ReplayLogger::new(tmp.path());
+        logger
+            .append(ReplayEntry {
+                seq: 0,
+                timestamp: String::new(),
+                role: "user".into(),
+                content: "third".into(),
+                tool_name: None,
+                is_rendered: None,
+                step_number: None,
+                step_tokens_in: None,
+                step_tokens_out: None,
+                step_elapsed: None,
+                step_model_preview: None,
+                step_tool_calls: None,
+            })
+            .await
+            .unwrap();
+
+        let entries = ReplayLogger::read_all(tmp.path()).await.unwrap();
+        assert_eq!(entries.last().unwrap().seq, 7);
+    }
+
+    #[tokio::test]
+    async fn test_append_ignores_malformed_lines_when_scanning_seq() {
+        let tmp = tempdir().unwrap();
+        let path = tmp.path().join("replay.jsonl");
+        fs::write(
+            &path,
+            format!(
+                "{}\nnot json\n",
+                serde_json::to_string(&ReplayEntry {
+                    seq: 2,
+                    timestamp: "2026-01-01T00:00:00Z".into(),
+                    role: "user".into(),
+                    content: "first".into(),
+                    tool_name: None,
+                    is_rendered: None,
+                    step_number: None,
+                    step_tokens_in: None,
+                    step_tokens_out: None,
+                    step_elapsed: None,
+                    step_model_preview: None,
+                    step_tool_calls: None,
+                })
+                .unwrap()
+            ),
+        )
+        .await
+        .unwrap();
+
+        let mut logger = ReplayLogger::new(tmp.path());
+        logger
+            .append(ReplayEntry {
+                seq: 0,
+                timestamp: String::new(),
+                role: "assistant".into(),
+                content: "next".into(),
+                tool_name: None,
+                is_rendered: None,
+                step_number: None,
+                step_tokens_in: None,
+                step_tokens_out: None,
+                step_elapsed: None,
+                step_model_preview: None,
+                step_tool_calls: None,
+            })
+            .await
+            .unwrap();
+
+        let entries = ReplayLogger::read_all(tmp.path()).await.unwrap();
+        assert_eq!(entries.last().unwrap().seq, 3);
+    }
 }
diff --git a/tests/test_replay_log.py b/tests/test_replay_log.py
index ff31e7a9..97d6c837 100644
--- a/tests/test_replay_log.py
+++ b/tests/test_replay_log.py
@@ -174,7 +174,7 @@ def test_child_logger(self) -> None:
             self.assertEqual(records[2]["conversation_id"], "root/d0s2")
             self.assertEqual(records[2]["model"], "m-child")
             self.assertEqual(records[3]["conversation_id"], "root/d0s2")
-            self.assertEqual(records[3]["seq"], 0)
+            self.assertEqual(records[3]["seq"], 1)
             self.assertIn("messages_snapshot", records[3])
 
     def test_creates_parent_dirs(self) -> None:
@@ -187,6 +187,45 @@ def test_creates_parent_dirs(self) -> None:
             )
             self.assertTrue(p.exists())
 
+    def test_initializes_seq_from_existing_file(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            p = Path(tmpdir) / "replay.jsonl"
+            p.write_text(
+                "\n".join([
+                    json.dumps({"type": "header", "conversation_id": "root"}),
+                    json.dumps({"type": "call", "conversation_id": "root", "seq": 3, "messages_snapshot": [{"role": "user", "content": "hi"}]}),
+                    "{malformed",
+                    json.dumps({"type": "call", "conversation_id": "other", "seq": 8, "messages_snapshot": [{"role": "user", "content": "x"}]}),
+                ])
+                + "\n",
+                encoding="utf-8",
+            )
+
+            logger = ReplayLogger(path=p)
+            logger.log_call(
+                depth=0,
+                step=2,
+                messages=[
+                    {"role": "user", "content": "hi"},
+                    {"role": "assistant", "content": "hello"},
+                ],
+                response={"r": 1},
+            )
+
+            records = []
+            for line in p.read_text(encoding="utf-8").splitlines():
+                line = line.strip()
+                if not line:
+                    continue
+                try:
+                    records.append(json.loads(line))
+                except json.JSONDecodeError:
+                    continue
+            calls = [r for r in records if r.get("type") == "call" and r.get("conversation_id") == "root"]
+            self.assertEqual(calls[-1]["seq"], 9)
+            self.assertIn("messages_delta", calls[-1])
+            self.assertEqual(calls[-1]["messages_delta"], [{"role": "assistant", "content": "hello"}])
+
 
 class ReplayLoggerIntegrationTests(unittest.TestCase):
     def _read_records(self, path: Path) -> list[dict]:

From fe390d4e7fded1d029e8170c796172fcb4144e95 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Fri, 13 Mar 2026 09:10:51 -0400
Subject: [PATCH 12/58] feat: add runtime loop guardrails and metrics

---
 agent/engine.py              | 102 +++++++++++++++++++++++++++++++++++
 agent/runtime.py             |  46 +++++++++++++++-
 tests/test_engine.py         |  35 ++++++++++++
 tests/test_turn_summaries.py |  69 ++++++++++++++++++++++++
 4 files changed, 251 insertions(+), 1 deletion(-)

diff --git a/agent/engine.py b/agent/engine.py
index b762c621..434503ea 100644
--- a/agent/engine.py
+++ b/agent/engine.py
@@ -24,6 +24,30 @@
 ContentDeltaCallback = Callable[[str, str], None]
 
 
+_RECON_TOOL_NAMES = {
+    "list_files",
+    "search_files",
+    "repo_map",
+    "web_search",
+    "fetch_url",
+    "read_file",
+    "read_image",
+    "list_artifacts",
+    "read_artifact",
+}
+_ARTIFACT_TOOL_NAMES = {
+    "write_file",
+    "apply_patch",
+    "edit_file",
+    "hashline_edit",
+}
+_META_FINAL_PATTERNS = (
+    re.compile(r"^\s*(here(?:'s| is)\s+(?:my|the)\s+(?:plan|approach|analysis))\b", re.I),
+    re.compile(r"\b(i\s+(?:will|can|should|need to|want to|am going to|plan to))\b", re.I),
+    re.compile(r"\b(let me|next,?\s+i\s+will|i\s+should\s+start\s+by)\b", re.I),
+)
+
+
 def _summarize_args(args: dict[str, Any], max_len: int = 120) -> str:
     """One-line summary of tool call arguments."""
     parts: list[str] = []
@@ -169,6 +193,7 @@ class RLMEngine:
     _shell_command_counts: dict[tuple[int, str], int] = field(default_factory=dict)
     _cancel: threading.Event = field(default_factory=threading.Event)
     _pending_image: threading.local = field(default_factory=threading.local)
+    last_loop_metrics: dict[str, Any] = field(default_factory=dict)
 
     def __post_init__(self) -> None:
         if not self.system_prompt:
@@ -300,6 +325,14 @@ def _judge_result(
         except Exception as exc:
             return f"PASS\n(judge error: {exc})"
 
+    def _is_meta_final_text(self, text: str) -> bool:
+        stripped = text.strip()
+        if not stripped:
+            return True
+        if len(stripped.split()) < 5:
+            return False
+        return any(pattern.search(stripped) for pattern in _META_FINAL_PATTERNS)
+
     def _solve_recursive(
         self,
         objective: str,
@@ -355,6 +388,17 @@ def _solve_recursive(
 
         conversation = model.create_conversation(self.system_prompt, initial_message)
 
+        loop_metrics: dict[str, Any] = {
+            "steps": 0,
+            "model_turns": 0,
+            "tool_calls": 0,
+            "phase_counts": {"investigate": 0, "build": 0, "iterate": 0, "finalize": 0},
+            "recon_streak": 0,
+            "max_recon_streak": 0,
+            "guardrail_warnings": 0,
+            "final_rejections": 0,
+        }
+
         if replay_logger and replay_logger.needs_header:
             replay_logger.write_header(
                 provider=type(model).__name__,
@@ -420,6 +464,8 @@ def _solve_recursive(
                 if hasattr(model, "on_content_delta"):
                     model.on_content_delta = None
             elapsed = time.monotonic() - t0
+            loop_metrics["steps"] = step
+            loop_metrics["model_turns"] += 1
 
             if replay_logger:
                 try:
@@ -469,6 +515,7 @@ def _solve_recursive(
                             "output_tokens": turn.output_tokens,
                             "elapsed_sec": round(elapsed, 2),
                             "is_final": False,
+                            "phase": "model",
                         }
                     )
                 except Exception:
@@ -476,11 +523,30 @@ def _solve_recursive(
 
             # No tool calls + text present = final answer
             if not turn.tool_calls and turn.text:
+                if self._is_meta_final_text(turn.text):
+                    loop_metrics["final_rejections"] += 1
+                    self._emit(
+                        f"[d{depth}/s{step}] rejected meta final-answer text; requesting concrete completion",
+                        on_event,
+                    )
+                    rejection_result = ToolResult(
+                        tool_call_id="meta-final-reject",
+                        name="system",
+                        content=(
+                            "Final-answer candidate rejected: response is meta/process text. "
+                            "Provide a concrete completion summary (what was produced/changed) "
+                            "instead of describing what you will do next."
+                        ),
+                    )
+                    model.append_tool_results(conversation, [rejection_result])
+                    continue
+                loop_metrics["phase_counts"]["finalize"] += 1
                 preview = turn.text[:200] + "..." if len(turn.text) > 200 else turn.text
                 self._emit(
                     f"[d{depth}/s{step}] final answer ({len(turn.text)} chars, {elapsed:.1f}s): {preview}",
                     on_event,
                 )
+                self.last_loop_metrics = loop_metrics
                 if on_step:
                     try:
                         on_step(
@@ -491,6 +557,8 @@ def _solve_recursive(
                                 "action": {"name": "final", "arguments": {"text": turn.text}},
                                 "observation": turn.text,
                                 "is_final": True,
+                                "phase": "finalize",
+                                "loop_metrics": dict(loop_metrics),
                             }
                         )
                     except Exception:
@@ -510,6 +578,21 @@ def _solve_recursive(
 
             # Log tool calls from model
             tc_names = [tc.name for tc in turn.tool_calls]
+            loop_metrics["tool_calls"] += len(tc_names)
+            has_recon = any(name in _RECON_TOOL_NAMES for name in tc_names)
+            has_artifact = any(name in _ARTIFACT_TOOL_NAMES for name in tc_names)
+            if has_recon and not has_artifact and all(name in _RECON_TOOL_NAMES for name in tc_names):
+                loop_metrics["recon_streak"] += 1
+                loop_metrics["phase_counts"]["investigate"] += 1
+            elif has_artifact:
+                loop_metrics["recon_streak"] = 0
+                loop_metrics["phase_counts"]["build"] += 1
+            else:
+                loop_metrics["recon_streak"] = 0
+                loop_metrics["phase_counts"]["iterate"] += 1
+            loop_metrics["max_recon_streak"] = max(
+                int(loop_metrics["max_recon_streak"]), int(loop_metrics["recon_streak"])
+            )
             self._emit(
                 f"[d{depth}/s{step}] model returned {len(turn.tool_calls)} tool call(s) ({elapsed:.1f}s): {', '.join(tc_names)}",
                 on_event,
@@ -618,6 +701,24 @@ def _solve_recursive(
                         image=rl.image,
                     )
 
+            if (
+                final_answer is None
+                and results
+                and int(loop_metrics["recon_streak"]) >= 3
+                and not has_artifact
+            ):
+                loop_metrics["guardrail_warnings"] += 1
+                soft_warning = ToolResult(
+                    "recon-guardrail",
+                    "system",
+                    (
+                        "Soft guardrail: you've spent multiple consecutive steps in read/list/search mode "
+                        "without producing artifacts. Move to implementation now (edit files, run targeted "
+                        "validation, and return concrete outputs)."
+                    ),
+                )
+                results.append(soft_warning)
+
             # Plan injection — find newest *.plan.md in session dir, append to last result
             if self.session_dir is not None and results and final_answer is None:
                 try:
@@ -650,6 +751,7 @@ def _solve_recursive(
 
             if final_answer is not None:
                 self._emit(f"[d{depth}] completed in {step} step(s)", on_event)
+                self.last_loop_metrics = loop_metrics
                 return final_answer
 
             for r in results:
diff --git a/agent/runtime.py b/agent/runtime.py
index d28b070e..2dfafcb9 100644
--- a/agent/runtime.py
+++ b/agent/runtime.py
@@ -228,6 +228,7 @@ class SessionRuntime:
     max_persisted_observations: int = 400
     turn_history: list[TurnSummary] | None = None
     max_turn_summaries: int = 50
+    loop_metrics: dict[str, Any] | None = None
 
     @classmethod
     def bootstrap(
@@ -265,6 +266,19 @@ def bootstrap(
                     except (KeyError, TypeError):
                         pass
         max_turns = max(1, config.max_turn_summaries)
+        raw_loop_metrics = state.get("loop_metrics", {})
+        loop_metrics: dict[str, Any] = raw_loop_metrics if isinstance(raw_loop_metrics, dict) else {}
+        loop_metrics.setdefault("turns", 0)
+        loop_metrics.setdefault("steps", 0)
+        loop_metrics.setdefault("model_turns", 0)
+        loop_metrics.setdefault("tool_calls", 0)
+        loop_metrics.setdefault("guardrail_warnings", 0)
+        loop_metrics.setdefault("final_rejections", 0)
+        loop_metrics.setdefault("phase_counts", {})
+        if not isinstance(loop_metrics["phase_counts"], dict):
+            loop_metrics["phase_counts"] = {}
+        for phase in ("investigate", "build", "iterate", "finalize"):
+            loop_metrics["phase_counts"].setdefault(phase, 0)
 
         runtime = cls(
             engine=engine,
@@ -274,6 +288,7 @@ def bootstrap(
             max_persisted_observations=max_obs,
             turn_history=turn_history[-max_turns:],
             max_turn_summaries=max_turns,
+            loop_metrics=loop_metrics,
         )
         try:
             runtime.store.append_event(
@@ -373,6 +388,34 @@ def _combined_on_step(step_event: dict[str, Any]) -> None:
         )
         self.context = updated_context
 
+        latest_loop_metrics = self.engine.last_loop_metrics if isinstance(self.engine.last_loop_metrics, dict) else {}
+        if self.loop_metrics is None:
+            self.loop_metrics = {
+                "turns": 0,
+                "steps": 0,
+                "model_turns": 0,
+                "tool_calls": 0,
+                "guardrail_warnings": 0,
+                "final_rejections": 0,
+                "phase_counts": {"investigate": 0, "build": 0, "iterate": 0, "finalize": 0},
+            }
+        self.loop_metrics["turns"] = int(self.loop_metrics.get("turns", 0)) + 1
+        self.loop_metrics["steps"] = int(self.loop_metrics.get("steps", 0)) + int(latest_loop_metrics.get("steps", 0))
+        self.loop_metrics["model_turns"] = int(self.loop_metrics.get("model_turns", 0)) + int(latest_loop_metrics.get("model_turns", 0))
+        self.loop_metrics["tool_calls"] = int(self.loop_metrics.get("tool_calls", 0)) + int(latest_loop_metrics.get("tool_calls", 0))
+        self.loop_metrics["guardrail_warnings"] = int(self.loop_metrics.get("guardrail_warnings", 0)) + int(latest_loop_metrics.get("guardrail_warnings", 0))
+        self.loop_metrics["final_rejections"] = int(self.loop_metrics.get("final_rejections", 0)) + int(latest_loop_metrics.get("final_rejections", 0))
+        phase_counts = self.loop_metrics.setdefault("phase_counts", {})
+        latest_phase_counts = latest_loop_metrics.get("phase_counts", {})
+        if not isinstance(phase_counts, dict):
+            phase_counts = {}
+            self.loop_metrics["phase_counts"] = phase_counts
+        if not isinstance(latest_phase_counts, dict):
+            latest_phase_counts = {}
+        for phase in ("investigate", "build", "iterate", "finalize"):
+            phase_counts[phase] = int(phase_counts.get(phase, 0)) + int(latest_phase_counts.get(phase, 0))
+        self.loop_metrics["last_turn"] = latest_loop_metrics
+
         # Generate turn summary
         if self.turn_history is None:
             self.turn_history = []
@@ -414,5 +457,6 @@ def _persist_state(self) -> None:
         }
         if self.turn_history:
             state["turn_history"] = [t.to_dict() for t in self.turn_history]
+        if self.loop_metrics:
+            state["loop_metrics"] = self.loop_metrics
         self.store.save_state(self.session_id, state)
-
diff --git a/tests/test_engine.py b/tests/test_engine.py
index c0780fb9..5527bf5f 100644
--- a/tests/test_engine.py
+++ b/tests/test_engine.py
@@ -136,6 +136,41 @@ def test_runtime_policy_blocks_repeated_shell_command(self) -> None:
                 "expected policy block observation in context",
             )
 
+    def test_meta_text_not_accepted_as_final_answer(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(workspace=root, max_depth=1, max_steps_per_call=4, acceptance_criteria=False)
+            tools = WorkspaceTools(root=root)
+            model = ScriptedModel(
+                scripted_turns=[
+                    ModelTurn(text="Here is my plan: I will inspect files and then implement.", stop_reason="end_turn"),
+                    ModelTurn(text="Concrete result delivered.", stop_reason="end_turn"),
+                ]
+            )
+            engine = RLMEngine(model=model, tools=tools, config=cfg)
+            result = engine.solve("meta final rejection")
+            self.assertEqual(result, "Concrete result delivered.")
+            self.assertEqual(engine.last_loop_metrics.get("final_rejections"), 1)
+
+    def test_soft_guardrail_for_repeated_recon(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(workspace=root, max_depth=1, max_steps_per_call=6, acceptance_criteria=False)
+            tools = WorkspaceTools(root=root)
+            model = ScriptedModel(
+                scripted_turns=[
+                    ModelTurn(tool_calls=[_tc("list_files")]),
+                    ModelTurn(tool_calls=[_tc("search_files", query="x")]),
+                    ModelTurn(tool_calls=[_tc("repo_map")]),
+                    ModelTurn(text="done", stop_reason="end_turn"),
+                ]
+            )
+            engine = RLMEngine(model=model, tools=tools, config=cfg)
+            result, ctx = engine.solve_with_context("trigger recon guardrail")
+            self.assertEqual(result, "done")
+            self.assertTrue(any("Soft guardrail" in obs for obs in ctx.observations))
+            self.assertGreaterEqual(int(engine.last_loop_metrics.get("guardrail_warnings", 0)), 1)
+
 
 class CustomSystemPromptTests(unittest.TestCase):
     def test_custom_system_prompt_override(self) -> None:
diff --git a/tests/test_turn_summaries.py b/tests/test_turn_summaries.py
index c7e99828..008f095d 100644
--- a/tests/test_turn_summaries.py
+++ b/tests/test_turn_summaries.py
@@ -282,6 +282,75 @@ def test_backward_compat_old_state_no_turn_history(self) -> None:
             self.assertEqual(len(rt.turn_history), 1)
             self.assertEqual(rt.turn_history[0].turn_number, 1)
 
+    def test_loop_metrics_persisted_and_loaded_additively(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = self._make_config(root)
+
+            model1 = ScriptedModel(
+                scripted_turns=[
+                    ModelTurn(tool_calls=[_tc("list_files")]),
+                    ModelTurn(text="done-1", stop_reason="end_turn"),
+                ]
+            )
+            engine1 = RLMEngine(model=model1, tools=WorkspaceTools(root=root), config=cfg)
+            rt1 = SessionRuntime.bootstrap(
+                engine=engine1, config=cfg, session_id="sess-loop", resume=False,
+            )
+            rt1.solve("first")
+
+            state_path = root / ".openplanter" / "sessions" / "sess-loop" / "state.json"
+            state_after_first = json.loads(state_path.read_text(encoding="utf-8"))
+            self.assertIn("loop_metrics", state_after_first)
+            self.assertEqual(state_after_first["loop_metrics"]["turns"], 1)
+
+            model2 = ScriptedModel(
+                scripted_turns=[ModelTurn(text="done-2", stop_reason="end_turn")]
+            )
+            engine2 = RLMEngine(model=model2, tools=WorkspaceTools(root=root), config=cfg)
+            rt2 = SessionRuntime.bootstrap(
+                engine=engine2, config=cfg, session_id="sess-loop", resume=True,
+            )
+            self.assertIn("turns", rt2.loop_metrics)
+            rt2.solve("second")
+
+            state_after_second = json.loads(state_path.read_text(encoding="utf-8"))
+            self.assertEqual(state_after_second["loop_metrics"]["turns"], 2)
+            self.assertIn("last_turn", state_after_second["loop_metrics"])
+
+    def test_backward_compat_old_state_no_loop_metrics(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = self._make_config(root)
+
+            session_dir = root / ".openplanter" / "sessions" / "sess-no-loop"
+            session_dir.mkdir(parents=True)
+            (session_dir / "artifacts").mkdir()
+            (session_dir / "metadata.json").write_text(
+                json.dumps({"session_id": "sess-no-loop", "workspace": str(root)}),
+                encoding="utf-8",
+            )
+            (session_dir / "state.json").write_text(
+                json.dumps({
+                    "session_id": "sess-no-loop",
+                    "saved_at": "2026-01-01T00:00:00Z",
+                    "external_observations": [],
+                }),
+                encoding="utf-8",
+            )
+
+            model = ScriptedModel(
+                scripted_turns=[ModelTurn(text="resumed", stop_reason="end_turn")]
+            )
+            engine = RLMEngine(model=model, tools=WorkspaceTools(root=root), config=cfg)
+            rt = SessionRuntime.bootstrap(
+                engine=engine, config=cfg, session_id="sess-no-loop", resume=True,
+            )
+            self.assertIsNotNone(rt.loop_metrics)
+            self.assertEqual(rt.loop_metrics.get("turns"), 0)
+            rt.solve("new turn")
+            self.assertEqual(rt.loop_metrics.get("turns"), 1)
+
 
 if __name__ == "__main__":
     unittest.main()

From c17a1bef9fc0ee3aca2920209b6473c4201081ff Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Fri, 13 Mar 2026 10:43:31 -0400
Subject: [PATCH 13/58] fix: resolve runtime loop metrics merge cleanup

---
 agent/engine.py | 12 ++++++++++++
 1 file changed, 12 insertions(+)

diff --git a/agent/engine.py b/agent/engine.py
index 434503ea..cd12e735 100644
--- a/agent/engine.py
+++ b/agent/engine.py
@@ -397,8 +397,11 @@ def _solve_recursive(
             "max_recon_streak": 0,
             "guardrail_warnings": 0,
             "final_rejections": 0,
+            "last_guardrail_streak": 0,
         }
 
+        self.last_loop_metrics = loop_metrics
+
         if replay_logger and replay_logger.needs_header:
             replay_logger.write_header(
                 provider=type(model).__name__,
@@ -413,9 +416,11 @@ def _solve_recursive(
         for step in range(1, self.config.max_steps_per_call + 1):
             if self._cancel.is_set():
                 self._emit(f"[d{depth}] cancelled by user", on_event)
+                self.last_loop_metrics = loop_metrics
                 return "Task cancelled."
             if deadline and time.monotonic() > deadline:
                 self._emit(f"[d{depth}] wall-clock limit reached", on_event)
+                self.last_loop_metrics = loop_metrics
                 return "Time limit exceeded. Try a more focused objective."
             self._emit(f"[d{depth}/s{step}] calling model...", on_event)
             t0 = time.monotonic()
@@ -427,6 +432,7 @@ def _solve_recursive(
                 while True:
                     if self._cancel.is_set():
                         self._emit(f"[d{depth}] cancelled by user", on_event)
+                        self.last_loop_metrics = loop_metrics
                         return "Task cancelled."
                     try:
                         turn = model.complete(conversation)
@@ -434,6 +440,7 @@ def _solve_recursive(
                     except RateLimitError as exc:
                         if rate_limit_retries >= self.config.rate_limit_max_retries:
                             self._emit(f"[d{depth}/s{step}] model error: {exc}", on_event)
+                            self.last_loop_metrics = loop_metrics
                             return f"Model error at depth {depth}, step {step}: {exc}"
                         rate_limit_retries += 1
                         delay: float | None = None
@@ -448,6 +455,7 @@ def _solve_recursive(
                         delay = min(delay, self.config.rate_limit_backoff_max_sec)
                         if deadline and (time.monotonic() + delay) > deadline:
                             self._emit(f"[d{depth}] wall-clock limit reached", on_event)
+                            self.last_loop_metrics = loop_metrics
                             return "Time limit exceeded. Try a more focused objective."
                         provider_code = f" ({exc.provider_code})" if exc.provider_code is not None else ""
                         self._emit(
@@ -459,6 +467,7 @@ def _solve_recursive(
                             time.sleep(delay)
             except ModelError as exc:
                 self._emit(f"[d{depth}/s{step}] model error: {exc}", on_event)
+                self.last_loop_metrics = loop_metrics
                 return f"Model error at depth {depth}, step {step}: {exc}"
             finally:
                 if hasattr(model, "on_content_delta"):
@@ -706,8 +715,10 @@ def _solve_recursive(
                 and results
                 and int(loop_metrics["recon_streak"]) >= 3
                 and not has_artifact
+                and int(loop_metrics.get("last_guardrail_streak", 0)) != int(loop_metrics["recon_streak"])
             ):
                 loop_metrics["guardrail_warnings"] += 1
+                loop_metrics["last_guardrail_streak"] = int(loop_metrics["recon_streak"])
                 soft_warning = ToolResult(
                     "recon-guardrail",
                     "system",
@@ -757,6 +768,7 @@ def _solve_recursive(
             for r in results:
                 context.add(f"[depth {depth} step {step}]\n{r.content}")
 
+        self.last_loop_metrics = loop_metrics
         return (
             f"Step budget exhausted at depth {depth} for objective: {objective}\n"
             "Please try with a more specific task, higher step budget, or deeper recursion."

From c96f6395d48c50f5f8f69f97a567a6e78411e018 Mon Sep 17 00:00:00 2001
From: Drake Thomsen <120344051+ThomsenDrake@users.noreply.github.com>
Date: Fri, 13 Mar 2026 11:55:54 -0400
Subject: [PATCH 14/58] docs: add RFC for typed ontology-first
 InvestigationState

---
 docs/rfcs/0001-typed-investigation-state.md | 399 ++++++++++++++++++++
 1 file changed, 399 insertions(+)
 create mode 100644 docs/rfcs/0001-typed-investigation-state.md

diff --git a/docs/rfcs/0001-typed-investigation-state.md b/docs/rfcs/0001-typed-investigation-state.md
new file mode 100644
index 00000000..ac7c22e1
--- /dev/null
+++ b/docs/rfcs/0001-typed-investigation-state.md
@@ -0,0 +1,399 @@
+# RFC 0001: Typed `InvestigationState` (Ontology-First Session Memory)
+
+- **Status:** Proposed
+- **Authors:** OpenPlanter team
+- **Created:** 2026-03-13
+- **Target release:** staged rollout over 3 milestones
+- **Scope:** session persistence (`state.json` successor), event/replay projection, runtime APIs for Python + Rust
+
+## 1. Summary
+
+This RFC defines an implementation-ready, typed `InvestigationState` to replace today’s mostly append-only text memory model with an ontology-first graph model centered on:
+
+- entities
+- links
+- claims
+- evidence
+- hypotheses
+- open questions
+- tasks/actions
+- provenance
+- confidence
+
+The current session state is predominantly `external_observations: string[]` with optional turn summaries and loop metrics, which biases memory toward late synthesis and makes structured reasoning (e.g., “which evidence supports this claim?”) difficult to perform incrementally. The new state introduces typed records with stable IDs, lifecycle fields, and confidence/provenance semantics that can be updated throughout the investigation.
+
+## 2. Motivation and Current Gaps
+
+## 2.1 Current Python session state is string-heavy and late-structured
+
+`SessionRuntime._persist_state()` persists `external_observations` as plain strings, plus `turn_history` and `loop_metrics`; no typed entities/claims/evidence graph exists in persisted state. The runtime loads this into `ExternalContext(observations=list[str])`, then injects summaries into prompts for later synthesis. This is useful for continuity, but it is not ontology-native. 
+
+## 2.2 Current events and replay logs are rich but not canonicalized into typed state
+
+- `events.jsonl` captures `objective`, `trace`, `step`, `result`, and artifacts.
+- `replay.jsonl` captures model call records (`header`, `call`, message snapshots/deltas, responses, token usage).
+
+These logs provide temporal traceability, but they are not normalized into first-class analytical objects (claims/evidence/hypotheses/tasks) that can be reasoned over directly.
+
+## 2.3 Python/Rust state model divergence
+
+Rust’s `ExternalContext` currently expects `observations: Vec<Observation{source,timestamp,content}>` from `state.json`, while Python writes `external_observations: string[]`. This creates an interoperability mismatch and makes cross-runtime typed state consumption brittle.
+
+## 2.4 Consequences
+
+- hard to query support/opposition relationships for claims
+- weak provenance granularity (source spans, extraction method, derived-from chain)
+- confidence tracked informally in text, not as updateable fields
+- poor lifecycle tracking for open questions, hypotheses, and tasks
+- expensive/fragile “read all logs, then synthesize” behavior
+
+## 3. Goals and Non-Goals
+
+### 3.1 Goals
+
+1. Define a versioned, typed, ontology-first `InvestigationState` schema.
+2. Preserve append-only logs (`events.jsonl`, `replay.jsonl`) as immutable trace, while introducing a mutable canonical state projection.
+3. Provide deterministic migration from legacy `state.json` and optional bootstrap from replay/events logs.
+4. Define runtime consumption contracts for both Python and Rust.
+5. Enable incremental updates throughout the loop (investigate/build/iterate/finalize), not only final summarization.
+
+### 3.2 Non-Goals
+
+1. Replacing replay/events logging.
+2. Building a global cross-session knowledge graph in this RFC.
+3. Defining UI-level rendering details beyond data contract implications.
+
+## 4. Proposed Data Model
+
+## 4.1 File layout
+
+Within each session directory:
+
+- `investigation_state.json` (**new canonical typed state**)
+- `state.json` (legacy compatibility; transitional)
+- `events.jsonl` (append-only trace, unchanged)
+- `replay.jsonl` (append-only model transcript, unchanged)
+
+## 4.2 Top-level schema
+
+```json
+{
+  "schema_version": "1.0.0",
+  "session_id": "20260313-120000-abc123",
+  "created_at": "2026-03-13T12:00:00Z",
+  "updated_at": "2026-03-13T12:05:00Z",
+  "objective": "Investigate relationships between X and Y",
+  "ontology": {
+    "namespace": "openplanter.core",
+    "version": "2026-03"
+  },
+  "entities": {},
+  "links": {},
+  "claims": {},
+  "evidence": {},
+  "hypotheses": {},
+  "questions": {},
+  "tasks": {},
+  "actions": {},
+  "provenance_nodes": {},
+  "confidence_profiles": {},
+  "timeline": [],
+  "indexes": {
+    "by_external_ref": {},
+    "by_tag": {}
+  },
+  "legacy": {
+    "external_observations": [],
+    "turn_history": [],
+    "loop_metrics": {}
+  }
+}
+```
+
+Design choice: object maps keyed by stable IDs (`ent_`, `clm_`, `ev_`, etc.) rather than only arrays to allow O(1) merge/update and conflict resolution.
+
+## 4.3 Core record types
+
+### 4.3.1 Entity
+
+Represents person/org/location/asset/document/event/concept.
+
+Required fields:
+
+- `id`, `kind`, `canonical_name`, `status`
+- `created_at`, `updated_at`
+- `provenance_ids[]`
+- `confidence_id`
+
+Optional:
+
+- aliases, attributes, external_refs, tags
+
+```json
+{
+  "id": "ent_01H...",
+  "kind": "organization",
+  "canonical_name": "Acme Holdings LLC",
+  "aliases": ["Acme Holdings"],
+  "attributes": {"jurisdiction": "DE"},
+  "external_refs": [{"system": "sec_cik", "value": "0000123456"}],
+  "status": "active",
+  "provenance_ids": ["prov_..."],
+  "confidence_id": "conf_...",
+  "created_at": "...",
+  "updated_at": "..."
+}
+```
+
+### 4.3.2 Link
+
+Typed relationship between two entities (or entity↔claim where needed).
+
+- `source_entity_id`, `target_entity_id`, `predicate`
+- `directional` (bool), `valid_time` (optional interval)
+- provenance + confidence
+
+### 4.3.3 Claim
+
+Atomic proposition that may be supported or contradicted.
+
+- `text`, `claim_type` (`factual`, `attribution`, `quantitative`, etc.)
+- `subject_refs[]` (entity/link IDs)
+- `status` (`proposed`, `supported`, `contested`, `retracted`)
+- `evidence_support_ids[]`, `evidence_contra_ids[]`
+- provenance + confidence
+
+### 4.3.4 Evidence
+
+Observation/excerpt/document-derived fact unit.
+
+- `evidence_type` (`document`, `api_response`, `tool_output`, `human_note`)
+- `content` (normalized value or excerpt)
+- `source_uri`/`artifact_path`/`event_ref`
+- `extraction` metadata (`method`, `extractor_version`, `span`)
+- `hash` (optional dedupe)
+- provenance + confidence
+
+### 4.3.5 Hypothesis
+
+Testable explanatory model composed of one or more claims.
+
+- `statement`
+- `claim_ids[]`
+- `status` (`open`, `plausible`, `weakened`, `rejected`, `accepted`)
+- `test_plan_task_ids[]`
+- provenance + confidence
+
+### 4.3.6 Open Question
+
+Resolvable question with lifecycle.
+
+- `question_text`
+- `priority` (`low|medium|high|critical`)
+- `status` (`open|in_progress|blocked|resolved|won't_fix`)
+- `resolution_claim_id` (optional)
+- `related_entity_ids[]`, `related_hypothesis_ids[]`
+- provenance + confidence
+
+### 4.3.7 Task / Action
+
+Task = planned unit of work. Action = executed step/tool invocation.
+
+Task fields:
+
+- `title`, `description`, `status`, `assignee` (agent/human/system)
+- `depends_on_task_ids[]`, `produced_ids[]`, `consumed_ids[]`
+- `opened_by_question_id`/`opened_by_hypothesis_id`
+
+Action fields:
+
+- `task_id`, `action_type` (`tool_call`, `manual_edit`, `analysis_step`)
+- `started_at`, `ended_at`, `outcome`
+- `event_refs[]`, `replay_refs[]`, `artifact_paths[]`
+
+### 4.3.8 Provenance node
+
+First-class provenance object for source and transformation lineage.
+
+- `source_kind` (`event_log`, `replay_log`, `artifact`, `external_api`, `user_input`)
+- `source_ref` (e.g., `events.jsonl#line:120`, URI, file path)
+- `captured_at`
+- `derived_from_ids[]`
+- `method` (parser/model/tool), `method_version`
+
+### 4.3.9 Confidence profile
+
+Shared representation for confidence + rationale.
+
+- `score` (0.0-1.0)
+- `grade` (`very_low|low|medium|high|very_high`)
+- `dimensions` (source reliability, corroboration, recency, extraction certainty)
+- `rationale` (short text)
+- `updated_by` (agent/tool/user)
+
+## 4.4 Cross-object invariants
+
+1. All referenced IDs MUST exist.
+2. `updated_at >= created_at`.
+3. Closed objects (`resolved/rejected/retracted`) MUST include closure metadata (`closed_at`, `closed_reason`).
+4. Claim status transition to `supported` requires at least one support evidence reference.
+5. Evidence used by claims MUST include provenance.
+6. Confidence profile referenced by object MUST exist (or explicit `null` if unknown is allowed by configuration).
+
+## 5. Lifecycle Model
+
+Each turn updates typed state continuously:
+
+1. **Ingest**: parse tool outputs/events into candidate evidence/entities.
+2. **Normalize**: dedupe, entity resolution, link extraction.
+3. **Assert**: create/update claims and hypothesis weights.
+4. **Plan**: open/close questions; generate/update tasks.
+5. **Act**: execute actions and attach provenance/replay refs.
+6. **Review**: recompute confidence and status transitions.
+7. **Persist**: atomic write of `investigation_state.json` + event emission.
+
+State updates are **idempotent upserts** keyed by IDs or deterministic signatures.
+
+## 6. Migration Plan
+
+## 6.1 Legacy inputs
+
+- `state.json` (primary): `external_observations`, `turn_history`, `loop_metrics`
+- `events.jsonl` (optional enrichment)
+- `replay.jsonl` (optional deep enrichment)
+
+## 6.2 Migration phases
+
+### Phase A (compatibility + scaffold)
+
+- Introduce writer for `investigation_state.json` with top-level metadata and `legacy` block copied from current `state.json`.
+- Build pseudo-evidence from each legacy observation:
+  - `evidence_type = "legacy_observation"`
+  - content = observation string
+  - provenance source = `state.json#external_observations[i]`
+  - confidence = default baseline (e.g., 0.4, low)
+
+### Phase B (log projection backfill)
+
+- Parse `events.jsonl` to synthesize tasks/actions timeline:
+  - `objective` -> task roots
+  - `step` -> action nodes
+  - `result` -> claim/hypothesis candidate notes
+- Parse `replay.jsonl` for optional high-fidelity provenance edges:
+  - map model/tool turns to `action.replay_refs`
+  - attach token/time diagnostics to action metadata
+
+### Phase C (native typed operation)
+
+- Runtime writes typed objects directly during investigation loop.
+- Legacy `state.json` becomes derived compatibility projection (or frozen fallback).
+
+## 6.3 Deterministic ID strategy
+
+Use ULID/UUIDv7 for new runtime objects; for migrated objects optionally derive stable hash IDs from `(session_id, source_ref, normalized_content)` to avoid duplicate backfills.
+
+## 6.4 Conflict handling
+
+- If object exists: merge by field precedence (`new structured parse` > `legacy text parse` > `defaults`).
+- If confidence differs: keep latest score and append to confidence history (optional extension field).
+
+## 7. Runtime Consumption Contracts
+
+## 7.1 Python runtime contract
+
+Add a typed state layer in Python:
+
+- `InvestigationState` dataclasses / pydantic models.
+- Loader order:
+  1. load `investigation_state.json` if present and version-compatible
+  2. else migrate from `state.json` (+ optional logs)
+- During `solve()`, update typed graph incrementally from steps/results.
+- Persist both:
+  - canonical `investigation_state.json`
+  - compatibility `state.json` (minimal projection for older consumers)
+
+Recommended module boundaries:
+
+- `agent/investigation_state/schema.py`
+- `agent/investigation_state/store.py`
+- `agent/investigation_state/migrate.py`
+- `agent/investigation_state/projectors.py` (events/replay -> typed)
+
+## 7.2 Rust runtime contract
+
+Replace/extend `engine::context::ExternalContext` usage with typed equivalents:
+
+- `InvestigationState` serde structs mirroring schema version 1.
+- tolerant deserialization with `#[serde(default)]` for forward-compatible additive fields.
+- loader order identical to Python.
+- provide read APIs for prompt assembly:
+  - high-confidence active claims
+  - unresolved high-priority questions
+  - active hypotheses + recent supporting evidence
+
+Recommended modules:
+
+- `op-core/src/engine/investigation_state.rs`
+- `op-core/src/engine/investigation_migrate.rs`
+- keep `context.rs` as compatibility facade during transition
+
+## 7.3 Interop guarantees
+
+1. Shared JSON schema version and semantic rules.
+2. Unknown fields ignored, known fields validated.
+3. Both runtimes can round-trip without lossy deletion of unknown extension fields.
+
+## 8. Schema Governance and Validation
+
+- Publish JSON Schema at `docs/schemas/investigation_state.schema.json` (follow-up RFC task).
+- Enforce `schema_version` and migration matrix.
+- Add golden session fixtures (legacy + migrated + native typed) for Python/Rust parity tests.
+
+## 9. Rollout Plan
+
+### Milestone 1 (1-2 sprints)
+
+- Write/read scaffold + migration from `state.json`.
+- No prompt changes required yet.
+
+### Milestone 2 (1-2 sprints)
+
+- Event/replay projector for tasks/actions/provenance.
+- Prompt/context assembly begins consuming typed slices.
+
+### Milestone 3 (2+ sprints)
+
+- Full ontology-native loop updates and confidence lifecycle.
+- `state.json` reduced to compatibility export; deprecation notice.
+
+## 10. Backward Compatibility
+
+- Existing sessions remain readable.
+- If only `state.json` exists, runtime auto-migrates in-memory and writes typed file.
+- Legacy clients can continue reading `state.json` until formal removal.
+
+## 11. Risks and Mitigations
+
+- **Risk:** schema over-complexity slows iteration.
+  - **Mitigation:** strict v1 core + extension points.
+- **Risk:** noisy auto-extraction creates low-quality entities/claims.
+  - **Mitigation:** confidence gating and status `proposed` until corroborated.
+- **Risk:** Python/Rust drift.
+  - **Mitigation:** shared fixture suite + contract tests in CI.
+
+## 12. Open Design Questions
+
+1. Should confidence history be first-class now or deferred to v1.1?
+2. Should we store denormalized indexes on disk or rebuild at load?
+3. What minimum evidence requirements are needed before a claim can influence final answers?
+
+## 13. Implementation Checklist
+
+- [ ] Add canonical typed state file and loader in Python
+- [ ] Add migration path from legacy `state.json`
+- [ ] Add optional projectors from `events.jsonl` and `replay.jsonl`
+- [ ] Add canonical typed state structs and loader in Rust
+- [ ] Add compatibility projection writer to legacy `state.json`
+- [ ] Add schema validation + fixtures + parity tests
+- [ ] Update prompt/context assembly to consume typed state slices
+

From 0d9dd54a57116ded0fab675aaf0b490a6c7debda Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Fri, 13 Mar 2026 12:01:58 -0400
Subject: [PATCH 15/58] Improve desktop loop governance telemetry

---
 .../crates/op-core/src/engine/mod.rs          | 231 +++++++++++++++++-
 .../crates/op-core/src/events.rs              |  82 +++++++
 .../op-core/tests/test_model_streaming.rs     | 197 +++++++++++++--
 .../crates/op-tauri/src/bridge.rs             |  50 +++-
 .../frontend/src/api/events.test.ts           |  64 ++++-
 .../frontend/src/api/events.ts                |  29 ++-
 openplanter-desktop/frontend/src/api/types.ts |  44 +++-
 .../frontend/src/commands/slash.ts            |   2 +
 .../frontend/src/components/App.ts            |   4 +
 .../frontend/src/components/InputBar.ts       |   8 +
 .../frontend/src/components/StatusBar.test.ts |  32 +++
 .../frontend/src/components/StatusBar.ts      |  14 +-
 openplanter-desktop/frontend/src/main.ts      |  20 +-
 .../frontend/src/state/store.ts               |   6 +
 14 files changed, 739 insertions(+), 44 deletions(-)

diff --git a/openplanter-desktop/crates/op-core/src/engine/mod.rs b/openplanter-desktop/crates/op-core/src/engine/mod.rs
index 0df7fe9d..1803cf10 100644
--- a/openplanter-desktop/crates/op-core/src/engine/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/mod.rs
@@ -16,7 +16,7 @@ use tokio_util::sync::CancellationToken;
 
 use crate::builder::build_model;
 use crate::config::AgentConfig;
-use crate::events::{DeltaEvent, DeltaKind, StepEvent, TokenUsage};
+use crate::events::{DeltaEvent, DeltaKind, LoopMetrics, LoopPhase, StepEvent, TokenUsage};
 use crate::model::{BaseModel, Message, ModelTurn, RateLimitError};
 use crate::prompts::build_system_prompt;
 use crate::tools::WorkspaceTools;
@@ -208,8 +208,17 @@ pub trait SolveEmitter: Send + Sync {
     fn emit_trace(&self, message: &str);
     fn emit_delta(&self, event: DeltaEvent);
     fn emit_step(&self, event: StepEvent);
-    fn emit_complete(&self, result: &str);
+    fn emit_complete(&self, result: &str, loop_metrics: Option<LoopMetrics>);
     fn emit_error(&self, message: &str);
+    fn emit_loop_health(
+        &self,
+        _depth: u32,
+        _step: u32,
+        _phase: LoopPhase,
+        _metrics: LoopMetrics,
+        _is_final: bool,
+    ) {
+    }
     /// Called when a background curator finishes updating wiki files.
     /// Default no-op — override in TauriEmitter/LoggingEmitter.
     fn emit_curator_update(&self, _summary: &str, _files_changed: u32) {}
@@ -256,6 +265,21 @@ pub async fn demo_solve(objective: &str, emitter: &dyn SolveEmitter, cancel: Can
         tokio::time::sleep(std::time::Duration::from_millis(50)).await;
     }
 
+    let loop_metrics = LoopMetrics {
+        steps: 1,
+        model_turns: 1,
+        tool_calls: 0,
+        investigate_steps: 0,
+        build_steps: 0,
+        iterate_steps: 0,
+        finalize_steps: 1,
+        recon_streak: 0,
+        max_recon_streak: 0,
+        guardrail_warnings: 0,
+        final_rejections: 0,
+    };
+    emitter.emit_loop_health(0, 1, LoopPhase::Finalize, loop_metrics.clone(), true);
+
     // Emit step summary
     emitter.emit_step(StepEvent {
         depth: 0,
@@ -267,9 +291,11 @@ pub async fn demo_solve(objective: &str, emitter: &dyn SolveEmitter, cancel: Can
         },
         elapsed_ms: 350,
         is_final: true,
+        loop_phase: Some(LoopPhase::Finalize),
+        loop_metrics: Some(loop_metrics.clone()),
     });
 
-    emitter.emit_complete(&response);
+    emitter.emit_complete(&response, Some(loop_metrics));
 }
 
 /// Rough token estimate: ~4 chars per token.
@@ -396,6 +422,102 @@ async fn chat_stream_with_rate_limit_retries(
     }
 }
 
+fn is_meta_final_text(text: &str) -> bool {
+    let stripped = text.trim();
+    if stripped.is_empty() {
+        return true;
+    }
+    let lower = stripped.to_ascii_lowercase();
+    let meta_starts = [
+        "here is my plan",
+        "here's my plan",
+        "here is the plan",
+        "here's the plan",
+        "here is my approach",
+        "here's my approach",
+        "here is the approach",
+        "here's the approach",
+        "here is my analysis",
+        "here's my analysis",
+        "here is the analysis",
+        "here's the analysis",
+        "let me",
+        "next, i will",
+        "next i will",
+    ];
+    if meta_starts.iter().any(|p| lower.starts_with(p)) {
+        return true;
+    }
+    if stripped.split_whitespace().count() < 5 {
+        return false;
+    }
+    let padded = format!(" {lower} ");
+    [
+        " i will ",
+        " i can ",
+        " i should ",
+        " i need to ",
+        " i want to ",
+        " i am going to ",
+        " plan to ",
+        " let me ",
+        " next, i will ",
+        " next i will ",
+        " i should start by ",
+    ]
+    .iter()
+    .any(|needle| padded.contains(needle))
+}
+
+fn is_recon_tool(name: &str) -> bool {
+    matches!(
+        name,
+        "list_files"
+            | "search_files"
+            | "repo_map"
+            | "web_search"
+            | "fetch_url"
+            | "read_file"
+            | "read_image"
+            | "list_artifacts"
+            | "read_artifact"
+    )
+}
+
+fn is_artifact_tool(name: &str) -> bool {
+    matches!(
+        name,
+        "write_file" | "apply_patch" | "edit_file" | "hashline_edit"
+    )
+}
+
+fn classify_loop_phase(tool_calls: &[crate::model::ToolCall], is_final: bool) -> LoopPhase {
+    if is_final {
+        return LoopPhase::Finalize;
+    }
+    if tool_calls.is_empty() {
+        return LoopPhase::Iterate;
+    }
+    let has_recon = tool_calls.iter().any(|tc| is_recon_tool(&tc.name));
+    let has_artifact = tool_calls.iter().any(|tc| is_artifact_tool(&tc.name));
+    if has_artifact {
+        LoopPhase::Build
+    } else if has_recon && tool_calls.iter().all(|tc| is_recon_tool(&tc.name)) {
+        LoopPhase::Investigate
+    } else {
+        LoopPhase::Iterate
+    }
+}
+
+fn increment_phase(metrics: &mut LoopMetrics, phase: &LoopPhase) {
+    match phase {
+        LoopPhase::Investigate => metrics.investigate_steps += 1,
+        LoopPhase::Build => metrics.build_steps += 1,
+        LoopPhase::Iterate => metrics.iterate_steps += 1,
+        LoopPhase::Finalize => metrics.finalize_steps += 1,
+    }
+}
+
 /// Real solve flow with a multi-step agentic loop.
 ///
 /// Calls the model with tool definitions. If the model returns tool calls,
@@ -441,6 +563,8 @@ pub async fn solve(
     ];
 
     let max_steps = config.max_steps_per_call as usize;
+    let mut loop_metrics = LoopMetrics::default();
+    let mut last_guardrail_streak = 0u32;
 
     // 3. Background curator channel
     let (curator_tx, mut curator_rx) = mpsc::unbounded_channel::<CuratorOutcome>();
@@ -500,6 +624,9 @@ pub async fn solve(
             }
         };
 
+        loop_metrics.steps = step as u32;
+        loop_metrics.model_turns += 1;
+
         // Append assistant message to conversation
         let tool_calls_opt = if turn.tool_calls.is_empty() {
             None
@@ -511,8 +638,30 @@ pub async fn solve(
             tool_calls: tool_calls_opt,
         });
 
-        // No tool calls → final answer
+        // No tool calls → final answer (unless rejected by governance)
         if turn.tool_calls.is_empty() {
+            if turn.text.trim().is_empty() {
+                emitter.emit_trace(&format!(
+                    "[d0/s{step}] empty model response, requesting tool use or concrete final answer"
+                ));
+                messages.push(Message::User {
+                    content: "No tool calls and no final answer were returned. Continue solving: use tools if needed or return the concrete final deliverable.".to_string(),
+                });
+                continue;
+            }
+            if is_meta_final_text(&turn.text) {
+                loop_metrics.final_rejections += 1;
+                emitter.emit_trace(&format!(
+                    "[d0/s{step}] rejected meta final answer; requesting concrete deliverable"
+                ));
+                messages.push(Message::User {
+                    content: "Your previous response was process/meta commentary rather than a concrete final answer. Continue solving: use tools if needed and return a direct final deliverable.".to_string(),
+                });
+                continue;
+            }
+            let phase = LoopPhase::Finalize;
+            increment_phase(&mut loop_metrics, &phase);
+            emitter.emit_loop_health(0, step as u32, phase.clone(), loop_metrics.clone(), true);
             let tool_name = None;
             emitter.emit_step(StepEvent {
                 depth: 0,
@@ -524,8 +673,10 @@ pub async fn solve(
                 },
                 elapsed_ms: step_start.elapsed().as_millis() as u64,
                 is_final: true,
+                loop_phase: Some(phase),
+                loop_metrics: Some(loop_metrics.clone()),
             });
-            emitter.emit_complete(&turn.text);
+            emitter.emit_complete(&turn.text, Some(loop_metrics.clone()));
             tools.cleanup();
             // Wait for in-flight curators before exiting
             finish_curators(
@@ -542,6 +693,8 @@ pub async fn solve(
             return;
         }
 
+        loop_metrics.tool_calls += turn.tool_calls.len() as u32;
+
         // Execute each tool call and collect results
         for tc in &turn.tool_calls {
             if cancel.is_cancelled() {
@@ -568,6 +721,30 @@ pub async fn solve(
             });
         }
 
+        let phase = classify_loop_phase(&turn.tool_calls, false);
+        if matches!(phase, LoopPhase::Investigate) {
+            loop_metrics.recon_streak += 1;
+        } else {
+            loop_metrics.recon_streak = 0;
+        }
+        loop_metrics.max_recon_streak =
+            loop_metrics.max_recon_streak.max(loop_metrics.recon_streak);
+        increment_phase(&mut loop_metrics, &phase);
+        if matches!(phase, LoopPhase::Investigate)
+            && loop_metrics.recon_streak >= 3
+            && loop_metrics.recon_streak != last_guardrail_streak
+        {
+            loop_metrics.guardrail_warnings += 1;
+            last_guardrail_streak = loop_metrics.recon_streak;
+            emitter.emit_trace(&format!(
+                "[d0/s{step}] soft guardrail: multiple consecutive recon steps without artifacts; nudging toward implementation"
+            ));
+            messages.push(Message::User {
+                content: "Soft guardrail: you've spent multiple consecutive steps in read/list/search mode without producing artifacts. Move to implementation now: edit files, run targeted validation, and return concrete outputs.".to_string(),
+            });
+        }
+        emitter.emit_loop_health(0, step as u32, phase.clone(), loop_metrics.clone(), false);
+
         // Emit step (non-final) AFTER tools execute so the frontend
         // can refresh the wiki graph with newly written files.
         let first_tool = turn.tool_calls.first().map(|tc| tc.name.clone());
@@ -581,6 +758,8 @@ pub async fn solve(
             },
             elapsed_ms: step_start.elapsed().as_millis() as u64,
             is_final: false,
+            loop_phase: Some(phase),
+            loop_metrics: Some(loop_metrics.clone()),
         });
 
         // Spawn background curator after each non-final step
@@ -640,6 +819,14 @@ mod tests {
     use super::*;
     use std::sync::{Arc, Mutex};
 
+    fn tool_call(name: &str) -> crate::model::ToolCall {
+        crate::model::ToolCall {
+            id: format!("call-{name}"),
+            name: name.to_string(),
+            arguments: "{}".to_string(),
+        }
+    }
+
     #[derive(Debug, Clone)]
     #[allow(dead_code)]
     enum RecordedEvent {
@@ -685,7 +872,7 @@ mod tests {
             self.events.lock().unwrap().push(RecordedEvent::Step(event));
         }
 
-        fn emit_complete(&self, result: &str) {
+        fn emit_complete(&self, result: &str, _loop_metrics: Option<LoopMetrics>) {
             self.events
                 .lock()
                 .unwrap()
@@ -1018,4 +1205,36 @@ mod tests {
             assert_eq!(content.len(), 8000, "recent tool result should be intact");
         }
     }
+
+    #[test]
+    fn test_is_meta_final_text_rejects_empty_and_meta_prefixes() {
+        assert!(is_meta_final_text(""));
+        assert!(is_meta_final_text(
+            "Here is my plan for finishing the task."
+        ));
+        assert!(is_meta_final_text(
+            "I should start by checking the workspace layout."
+        ));
+        assert!(!is_meta_final_text(
+            "Completed the fix and updated the failing test."
+        ));
+    }
+
+    #[test]
+    fn test_classify_loop_phase_recon_only_is_investigate() {
+        let phase = classify_loop_phase(&[tool_call("read_file"), tool_call("list_files")], false);
+        assert_eq!(phase, LoopPhase::Investigate);
+    }
+
+    #[test]
+    fn test_classify_loop_phase_artifact_tools_are_build() {
+        let phase = classify_loop_phase(&[tool_call("read_file"), tool_call("write_file")], false);
+        assert_eq!(phase, LoopPhase::Build);
+    }
+
+    #[test]
+    fn test_classify_loop_phase_mixed_recon_and_non_recon_is_iterate() {
+        let phase = classify_loop_phase(&[tool_call("read_file"), tool_call("run_shell")], false);
+        assert_eq!(phase, LoopPhase::Iterate);
+    }
 }
diff --git a/openplanter-desktop/crates/op-core/src/events.rs b/openplanter-desktop/crates/op-core/src/events.rs
index 22c111d8..a5c8a834 100644
--- a/openplanter-desktop/crates/op-core/src/events.rs
+++ b/openplanter-desktop/crates/op-core/src/events.rs
@@ -18,6 +18,37 @@ pub struct StepEvent {
     pub tokens: TokenUsage,
     pub elapsed_ms: u64,
     pub is_final: bool,
+    #[serde(default, skip_serializing_if = "Option::is_none")]
+    pub loop_phase: Option<LoopPhase>,
+    #[serde(default, skip_serializing_if = "Option::is_none")]
+    pub loop_metrics: Option<LoopMetrics>,
+}
+
+/// High-level phase classification for the current loop step.
+#[derive(Debug, Clone, PartialEq, Eq, Serialize, Deserialize)]
+#[serde(rename_all = "snake_case")]
+pub enum LoopPhase {
+    Investigate,
+    Build,
+    Iterate,
+    Finalize,
+}
+
+/// Cumulative loop telemetry for health and governance UX.
+#[derive(Debug, Clone, Default, PartialEq, Eq, Serialize, Deserialize)]
+#[serde(default)]
+pub struct LoopMetrics {
+    pub steps: u32,
+    pub model_turns: u32,
+    pub tool_calls: u32,
+    pub investigate_steps: u32,
+    pub build_steps: u32,
+    pub iterate_steps: u32,
+    pub finalize_steps: u32,
+    pub recon_streak: u32,
+    pub max_recon_streak: u32,
+    pub guardrail_warnings: u32,
+    pub final_rejections: u32,
 }
 
 /// Token usage counters.
@@ -48,6 +79,18 @@ pub enum DeltaKind {
 #[derive(Debug, Clone, Serialize, Deserialize)]
 pub struct CompleteEvent {
     pub result: String,
+    #[serde(default, skip_serializing_if = "Option::is_none")]
+    pub loop_metrics: Option<LoopMetrics>,
+}
+
+/// Periodic loop health telemetry event.
+#[derive(Debug, Clone, Serialize, Deserialize)]
+pub struct LoopHealthEvent {
+    pub depth: u32,
+    pub step: u32,
+    pub phase: LoopPhase,
+    pub metrics: LoopMetrics,
+    pub is_final: bool,
 }
 
 /// Agent encountered an error.
@@ -112,6 +155,7 @@ pub enum AgentEvent {
     Complete(CompleteEvent),
     Error(ErrorEvent),
     WikiUpdated(GraphData),
+    LoopHealth(LoopHealthEvent),
 }
 
 /// Configuration view sent to the frontend.
@@ -364,6 +408,8 @@ mod tests {
             },
             elapsed_ms: 2345,
             is_final: false,
+            loop_phase: None,
+            loop_metrics: None,
         };
         let json = serde_json::to_string(&step).unwrap();
         let parsed: serde_json::Value = serde_json::from_str(&json).unwrap();
@@ -373,6 +419,42 @@ mod tests {
         assert_eq!(parsed["tokens"]["input_tokens"], 1234);
     }
 
+    #[test]
+    fn test_loop_metrics_deserialize_backfills_new_fields() {
+        let parsed: LoopMetrics = serde_json::from_str(
+            r#"{
+                "steps": 2,
+                "model_turns": 2,
+                "tool_calls": 1,
+                "investigate_steps": 1,
+                "build_steps": 0,
+                "iterate_steps": 0,
+                "finalize_steps": 1,
+                "recon_streak": 0,
+                "max_recon_streak": 1,
+                "final_rejections": 1
+            }"#,
+        )
+        .unwrap();
+
+        assert_eq!(
+            parsed,
+            LoopMetrics {
+                steps: 2,
+                model_turns: 2,
+                tool_calls: 1,
+                investigate_steps: 1,
+                build_steps: 0,
+                iterate_steps: 0,
+                finalize_steps: 1,
+                recon_streak: 0,
+                max_recon_streak: 1,
+                guardrail_warnings: 0,
+                final_rejections: 1,
+            }
+        );
+    }
+
     #[test]
     fn test_init_gate_state_serialization() {
         assert_eq!(
diff --git a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
index ae880264..fb43b3ef 100644
--- a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
+++ b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
@@ -549,7 +549,7 @@ async fn test_solve_with_mock_anthropic() {
         fn emit_step(&self, event: StepEvent) {
             self.events.lock().unwrap().push(Ev::Step(event));
         }
-        fn emit_complete(&self, result: &str) {
+        fn emit_complete(&self, result: &str, _loop_metrics: Option<op_core::events::LoopMetrics>) {
             self.events
                 .lock()
                 .unwrap()
@@ -657,7 +657,7 @@ async fn test_solve_with_mock_openai() {
         fn emit_step(&self, event: StepEvent) {
             self.events.lock().unwrap().push(Ev2::Step(event));
         }
-        fn emit_complete(&self, result: &str) {
+        fn emit_complete(&self, result: &str, _loop_metrics: Option<op_core::events::LoopMetrics>) {
             self.events
                 .lock()
                 .unwrap()
@@ -754,7 +754,7 @@ async fn test_solve_http_error_emits_error() {
         fn emit_trace(&self, _: &str) {}
         fn emit_delta(&self, _: DeltaEvent) {}
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, _: &str) {}
+        fn emit_complete(&self, _: &str, _: Option<op_core::events::LoopMetrics>) {}
         fn emit_error(&self, msg: &str) {
             self.errors.lock().unwrap().push(msg.to_string());
         }
@@ -812,7 +812,7 @@ async fn test_solve_rate_limit_retry_eventually_completes() {
 
         fn emit_step(&self, _: StepEvent) {}
 
-        fn emit_complete(&self, result: &str) {
+        fn emit_complete(&self, result: &str, _loop_metrics: Option<op_core::events::LoopMetrics>) {
             self.events
                 .lock()
                 .unwrap()
@@ -902,7 +902,7 @@ async fn test_solve_cancel_emits_cancelled() {
         fn emit_trace(&self, _: &str) {}
         fn emit_delta(&self, _: DeltaEvent) {}
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, _: &str) {}
+        fn emit_complete(&self, _: &str, _: Option<op_core::events::LoopMetrics>) {}
         fn emit_error(&self, msg: &str) {
             self.events.lock().unwrap().push(msg.to_string());
         }
@@ -947,7 +947,7 @@ async fn test_solve_demo_mode_bypasses_llm() {
         fn emit_trace(&self, _: &str) {}
         fn emit_delta(&self, _: DeltaEvent) {}
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, result: &str) {
+        fn emit_complete(&self, result: &str, _loop_metrics: Option<op_core::events::LoopMetrics>) {
             self.events.lock().unwrap().push(result.to_string());
         }
         fn emit_error(&self, msg: &str) {
@@ -988,7 +988,7 @@ async fn test_solve_missing_key_emits_error() {
         fn emit_trace(&self, _: &str) {}
         fn emit_delta(&self, _: DeltaEvent) {}
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, _: &str) {}
+        fn emit_complete(&self, _: &str, _: Option<op_core::events::LoopMetrics>) {}
         fn emit_error(&self, msg: &str) {
             self.errors.lock().unwrap().push(msg.to_string());
         }
@@ -1089,7 +1089,7 @@ async fn start_stateful_mock_server(responses: Vec<&'static str>) -> SocketAddr
 async fn test_solve_multi_step_agentic_loop() {
     use op_core::config::AgentConfig;
     use op_core::engine::{SolveEmitter, solve};
-    use op_core::events::StepEvent;
+    use op_core::events::{LoopMetrics, LoopPhase, StepEvent};
 
     // Mock server: first call → tool call, second call → final answer
     let addr =
@@ -1101,7 +1101,10 @@ async fn test_solve_multi_step_agentic_loop() {
         Trace(String),
         Delta(DeltaEvent),
         Step(StepEvent),
-        Complete(String),
+        Complete {
+            result: String,
+            loop_metrics: Option<LoopMetrics>,
+        },
         Error(String),
     }
 
@@ -1121,11 +1124,11 @@ async fn test_solve_multi_step_agentic_loop() {
         fn emit_step(&self, event: StepEvent) {
             self.events.lock().unwrap().push(Ev3::Step(event));
         }
-        fn emit_complete(&self, result: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev3::Complete(result.to_string()));
+        fn emit_complete(&self, result: &str, loop_metrics: Option<op_core::events::LoopMetrics>) {
+            self.events.lock().unwrap().push(Ev3::Complete {
+                result: result.to_string(),
+                loop_metrics,
+            });
         }
         fn emit_error(&self, message: &str) {
             self.events
@@ -1185,9 +1188,34 @@ async fn test_solve_multi_step_agentic_loop() {
         Some("list_files"),
         "first step should show list_files tool"
     );
+    assert_eq!(steps[0].loop_phase, Some(LoopPhase::Investigate));
+    assert_eq!(
+        steps[0]
+            .loop_metrics
+            .as_ref()
+            .map(|metrics| metrics.tool_calls),
+        Some(1)
+    );
+    assert_eq!(
+        steps[0]
+            .loop_metrics
+            .as_ref()
+            .map(|metrics| metrics.recon_streak),
+        Some(1)
+    );
 
     // Last step should be final
     assert!(steps.last().unwrap().is_final, "last step should be final");
+    assert_eq!(steps.last().unwrap().loop_phase, Some(LoopPhase::Finalize));
+    assert_eq!(
+        steps
+            .last()
+            .unwrap()
+            .loop_metrics
+            .as_ref()
+            .map(|metrics| metrics.tool_calls),
+        Some(1)
+    );
 
     // Should have tool execution trace
     let has_tool_trace = recorded
@@ -1217,9 +1245,12 @@ async fn test_solve_multi_step_agentic_loop() {
 
     // Should complete with the final answer text
     assert!(
-        recorded
-            .iter()
-            .any(|e| matches!(e, Ev3::Complete(t) if t.contains("Here is the answer"))),
+        recorded.iter().any(|e| matches!(
+            e,
+            Ev3::Complete { result, loop_metrics }
+                if result.contains("Here is the answer")
+                    && loop_metrics.as_ref().map(|metrics| metrics.tool_calls) == Some(1)
+        )),
         "should complete with the final answer"
     );
 
@@ -1237,3 +1268,135 @@ async fn test_solve_multi_step_agentic_loop() {
         errors
     );
 }
+
+const ANTHROPIC_SSE_META_FINAL: &str = "\
+event: message_start\ndata: {\"type\":\"message_start\",\"message\":{\"id\":\"msg_meta_1\",\"type\":\"message\",\"role\":\"assistant\",\"content\":[],\"usage\":{\"input_tokens\":40}}}\n\n\
+event: content_block_start\ndata: {\"type\":\"content_block_start\",\"index\":0,\"content_block\":{\"type\":\"text\",\"text\":\"\"}}\n\n\
+event: content_block_delta\ndata: {\"type\":\"content_block_delta\",\"index\":0,\"delta\":{\"type\":\"text_delta\",\"text\":\"Here is my plan for finishing the task.\"}}\n\n\
+event: content_block_stop\ndata: {\"type\":\"content_block_stop\",\"index\":0}\n\n\
+event: message_delta\ndata: {\"type\":\"message_delta\",\"delta\":{\"stop_reason\":\"end_turn\"},\"usage\":{\"output_tokens\":9}}\n\n\
+event: message_stop\ndata: {\"type\":\"message_stop\"}\n\n";
+
+const ANTHROPIC_SSE_CONCRETE_FINAL: &str = "\
+event: message_start\ndata: {\"type\":\"message_start\",\"message\":{\"id\":\"msg_meta_2\",\"type\":\"message\",\"role\":\"assistant\",\"content\":[],\"usage\":{\"input_tokens\":55}}}\n\n\
+event: content_block_start\ndata: {\"type\":\"content_block_start\",\"index\":0,\"content_block\":{\"type\":\"text\",\"text\":\"\"}}\n\n\
+event: content_block_delta\ndata: {\"type\":\"content_block_delta\",\"index\":0,\"delta\":{\"type\":\"text_delta\",\"text\":\"Completed the task and produced the requested answer.\"}}\n\n\
+event: content_block_stop\ndata: {\"type\":\"content_block_stop\",\"index\":0}\n\n\
+event: message_delta\ndata: {\"type\":\"message_delta\",\"delta\":{\"stop_reason\":\"end_turn\"},\"usage\":{\"output_tokens\":11}}\n\n\
+event: message_stop\ndata: {\"type\":\"message_stop\"}\n\n";
+
+#[tokio::test]
+async fn test_solve_rejects_meta_final_until_concrete_completion() {
+    use op_core::config::AgentConfig;
+    use op_core::engine::{SolveEmitter, solve};
+    use op_core::events::{LoopMetrics, StepEvent};
+
+    let addr =
+        start_stateful_mock_server(vec![ANTHROPIC_SSE_META_FINAL, ANTHROPIC_SSE_CONCRETE_FINAL])
+            .await;
+
+    #[derive(Debug, Clone)]
+    #[allow(dead_code)]
+    enum Ev4 {
+        Trace(String),
+        Step(StepEvent),
+        Complete {
+            result: String,
+            loop_metrics: Option<LoopMetrics>,
+        },
+        Error(String),
+    }
+
+    struct TestEmitter4 {
+        events: Arc<Mutex<Vec<Ev4>>>,
+    }
+
+    impl SolveEmitter for TestEmitter4 {
+        fn emit_trace(&self, message: &str) {
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev4::Trace(message.to_string()));
+        }
+
+        fn emit_delta(&self, _: DeltaEvent) {}
+
+        fn emit_step(&self, event: StepEvent) {
+            self.events.lock().unwrap().push(Ev4::Step(event));
+        }
+
+        fn emit_complete(&self, result: &str, loop_metrics: Option<LoopMetrics>) {
+            self.events.lock().unwrap().push(Ev4::Complete {
+                result: result.to_string(),
+                loop_metrics,
+            });
+        }
+
+        fn emit_error(&self, message: &str) {
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev4::Error(message.to_string()));
+        }
+    }
+
+    let events = Arc::new(Mutex::new(Vec::new()));
+    let emitter = TestEmitter4 {
+        events: events.clone(),
+    };
+
+    let cfg = AgentConfig {
+        provider: "anthropic".into(),
+        model: "claude-sonnet-4-5".into(),
+        anthropic_api_key: Some("test-key".into()),
+        anthropic_base_url: format!("http://{addr}"),
+        demo: false,
+        ..Default::default()
+    };
+
+    let cancel = CancellationToken::new();
+    solve("Produce the final answer directly", &cfg, &emitter, cancel).await;
+
+    let recorded = events.lock().unwrap().clone();
+    assert!(
+        recorded.iter().any(|event| matches!(
+            event,
+            Ev4::Trace(message) if message.contains("rejected meta final answer")
+        )),
+        "expected a meta-final rejection trace, got: {recorded:?}"
+    );
+
+    let steps: Vec<&StepEvent> = recorded
+        .iter()
+        .filter_map(|event| match event {
+            Ev4::Step(step) => Some(step),
+            _ => None,
+        })
+        .collect();
+    assert_eq!(steps.len(), 1, "only the concrete final should emit a step");
+    assert!(
+        steps[0].is_final,
+        "the emitted step should be the concrete final"
+    );
+    assert_eq!(
+        steps[0]
+            .loop_metrics
+            .as_ref()
+            .map(|metrics| metrics.final_rejections),
+        Some(1)
+    );
+
+    assert!(
+        recorded.iter().any(|event| matches!(
+            event,
+            Ev4::Complete { result, loop_metrics }
+                if result.contains("Completed the task")
+                    && loop_metrics.as_ref().map(|metrics| metrics.final_rejections) == Some(1)
+        )),
+        "expected completion after the rejection loop, got: {recorded:?}"
+    );
+    assert!(
+        !recorded.iter().any(|event| matches!(event, Ev4::Error(_))),
+        "did not expect errors, got: {recorded:?}"
+    );
+}
diff --git a/openplanter-desktop/crates/op-tauri/src/bridge.rs b/openplanter-desktop/crates/op-tauri/src/bridge.rs
index e522dbdc..4a436e59 100644
--- a/openplanter-desktop/crates/op-tauri/src/bridge.rs
+++ b/openplanter-desktop/crates/op-tauri/src/bridge.rs
@@ -11,7 +11,8 @@ use tauri::{AppHandle, Emitter};
 
 use op_core::engine::SolveEmitter;
 use op_core::events::{
-    CompleteEvent, CuratorUpdateEvent, DeltaEvent, DeltaKind, ErrorEvent, StepEvent, TraceEvent,
+    CompleteEvent, CuratorUpdateEvent, DeltaEvent, DeltaKind, ErrorEvent, LoopHealthEvent,
+    LoopMetrics, LoopPhase, StepEvent, TraceEvent,
 };
 use op_core::session::replay::{ReplayEntry, ReplayLogger, StepToolCallEntry};
 
@@ -107,12 +108,13 @@ impl SolveEmitter for TauriEmitter {
         let _ = self.handle.emit("agent:step", event);
     }
 
-    fn emit_complete(&self, result: &str) {
+    fn emit_complete(&self, result: &str, loop_metrics: Option<LoopMetrics>) {
         eprintln!("[bridge] complete: {result}");
         let _ = self.handle.emit(
             "agent:complete",
             CompleteEvent {
                 result: result.to_string(),
+                loop_metrics,
             },
         );
     }
@@ -127,6 +129,26 @@ impl SolveEmitter for TauriEmitter {
         );
     }
 
+    fn emit_loop_health(
+        &self,
+        depth: u32,
+        step: u32,
+        phase: LoopPhase,
+        metrics: LoopMetrics,
+        is_final: bool,
+    ) {
+        let _ = self.handle.emit(
+            "agent:loop-health",
+            LoopHealthEvent {
+                depth,
+                step,
+                phase,
+                metrics,
+                is_final,
+            },
+        );
+    }
+
     fn emit_curator_update(&self, summary: &str, files_changed: u32) {
         eprintln!("[bridge] curator update: {summary} ({files_changed} files)");
         let _ = self.handle.emit(
@@ -308,7 +330,7 @@ impl<E: SolveEmitter> SolveEmitter for LoggingEmitter<E> {
         self.inner.emit_step(event);
     }
 
-    fn emit_complete(&self, result: &str) {
+    fn emit_complete(&self, result: &str, loop_metrics: Option<LoopMetrics>) {
         let entry = ReplayEntry {
             seq: 0,
             timestamp: String::new(),
@@ -334,13 +356,25 @@ impl<E: SolveEmitter> SolveEmitter for LoggingEmitter<E> {
             });
         });
 
-        self.inner.emit_complete(result);
+        self.inner.emit_complete(result, loop_metrics);
     }
 
     fn emit_error(&self, message: &str) {
         self.inner.emit_error(message);
     }
 
+    fn emit_loop_health(
+        &self,
+        depth: u32,
+        step: u32,
+        phase: LoopPhase,
+        metrics: LoopMetrics,
+        is_final: bool,
+    ) {
+        self.inner
+            .emit_loop_health(depth, step, phase, metrics, is_final);
+    }
+
     fn emit_curator_update(&self, summary: &str, files_changed: u32) {
         // Log curator update to replay
         let entry = ReplayEntry {
@@ -386,7 +420,7 @@ mod tests {
         fn emit_trace(&self, _: &str) {}
         fn emit_delta(&self, _: DeltaEvent) {}
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, _: &str) {}
+        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>) {}
         fn emit_error(&self, _: &str) {}
     }
 
@@ -503,7 +537,7 @@ mod tests {
             self.deltas.lock().unwrap().push(event);
         }
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, _: &str) {}
+        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>) {}
         fn emit_error(&self, _: &str) {}
     }
 
@@ -527,6 +561,8 @@ mod tests {
             tokens: Default::default(),
             elapsed_ms: 1,
             is_final: false,
+            loop_phase: None,
+            loop_metrics: None,
         });
 
         let entries = ReplayLogger::read_all(tmp.path()).await.unwrap();
@@ -575,6 +611,8 @@ mod tests {
             tokens: Default::default(),
             elapsed_ms: 1,
             is_final: false,
+            loop_phase: None,
+            loop_metrics: None,
         });
 
         let entries = ReplayLogger::read_all(tmp.path()).await.unwrap();
diff --git a/openplanter-desktop/frontend/src/api/events.test.ts b/openplanter-desktop/frontend/src/api/events.test.ts
index 88ea1cc1..294aeed5 100644
--- a/openplanter-desktop/frontend/src/api/events.test.ts
+++ b/openplanter-desktop/frontend/src/api/events.test.ts
@@ -16,7 +16,9 @@ import {
   onAgentStep,
   onAgentDelta,
   onAgentComplete,
+  onAgentCompleteEvent,
   onAgentError,
+  onLoopHealth,
   onMigrationProgress,
   onWikiUpdated,
 } from "./events";
@@ -73,10 +75,40 @@ describe("event listeners", () => {
     await onAgentComplete(callback);
 
     const handler = listeners.get("agent:complete")!;
-    handler({ payload: { result: "final answer" } });
+    handler({
+      payload: {
+        result: "final answer",
+        loop_metrics: { final_rejections: 1 },
+      },
+    });
     expect(callback).toHaveBeenCalledWith("final answer");
   });
 
+  it("onAgentCompleteEvent registers listener and forwards full payload", async () => {
+    const callback = vi.fn();
+    await onAgentCompleteEvent(callback);
+
+    const handler = listeners.get("agent:complete")!;
+    const payload = {
+      result: "final answer",
+      loop_metrics: {
+        steps: 2,
+        model_turns: 2,
+        tool_calls: 1,
+        investigate_steps: 1,
+        build_steps: 0,
+        iterate_steps: 0,
+        finalize_steps: 1,
+        recon_streak: 0,
+        max_recon_streak: 1,
+        guardrail_warnings: 0,
+        final_rejections: 1,
+      },
+    };
+    handler({ payload });
+    expect(callback).toHaveBeenCalledWith(payload);
+  });
+
   it("onAgentError registers listener and extracts message", async () => {
     const callback = vi.fn();
     await onAgentError(callback);
@@ -114,6 +146,34 @@ describe("event listeners", () => {
     expect(callback).toHaveBeenCalledWith(payload);
   });
 
+  it("onLoopHealth registers listener and forwards payload", async () => {
+    const callback = vi.fn();
+    await onLoopHealth(callback);
+
+    const handler = listeners.get("agent:loop-health")!;
+    const payload = {
+      depth: 0,
+      step: 3,
+      phase: "investigate",
+      metrics: {
+        steps: 3,
+        model_turns: 3,
+        tool_calls: 2,
+        investigate_steps: 2,
+        build_steps: 0,
+        iterate_steps: 0,
+        finalize_steps: 0,
+        recon_streak: 2,
+        max_recon_streak: 2,
+        guardrail_warnings: 1,
+        final_rejections: 1,
+      },
+      is_final: false,
+    };
+    handler({ payload });
+    expect(callback).toHaveBeenCalledWith(payload);
+  });
+
   it("all listeners return unlisten function", async () => {
     const noop = vi.fn();
     const unlistens = await Promise.all([
@@ -121,7 +181,9 @@ describe("event listeners", () => {
       onAgentStep(noop),
       onAgentDelta(noop),
       onAgentComplete(noop),
+      onAgentCompleteEvent(noop),
       onAgentError(noop),
+      onLoopHealth(noop),
       onMigrationProgress(noop),
       onWikiUpdated(noop),
     ]);
diff --git a/openplanter-desktop/frontend/src/api/events.ts b/openplanter-desktop/frontend/src/api/events.ts
index 845ba8b9..0801c234 100644
--- a/openplanter-desktop/frontend/src/api/events.ts
+++ b/openplanter-desktop/frontend/src/api/events.ts
@@ -2,11 +2,16 @@
 import { listen, type UnlistenFn } from "@tauri-apps/api/event";
 import type {
   AgentEvent,
+  CompleteEvent,
   CuratorUpdateEvent,
   GraphData,
+  LoopHealthEvent,
   MigrationProgressEvent,
 } from "./types";
 
+type AgentStepEvent = Extract<AgentEvent, { type: "step" }>;
+type AgentDeltaEvent = Extract<AgentEvent, { type: "delta" }>;
+
 export function onAgentTrace(
   callback: (message: string) => void
 ): Promise<UnlistenFn> {
@@ -16,23 +21,27 @@ export function onAgentTrace(
 }
 
 export function onAgentStep(
-  callback: (event: AgentEvent & { type: "step" }) => void
+  callback: (event: AgentStepEvent) => void
 ): Promise<UnlistenFn> {
-  return listen("agent:step", (e) => callback(e.payload as any));
+  return listen<AgentStepEvent>("agent:step", (e) => callback(e.payload));
 }
 
 export function onAgentDelta(
-  callback: (event: AgentEvent & { type: "delta" }) => void
+  callback: (event: AgentDeltaEvent) => void
+): Promise<UnlistenFn> {
+  return listen<AgentDeltaEvent>("agent:delta", (e) => callback(e.payload));
+}
+
+export function onAgentCompleteEvent(
+  callback: (event: CompleteEvent) => void
 ): Promise<UnlistenFn> {
-  return listen("agent:delta", (e) => callback(e.payload as any));
+  return listen<CompleteEvent>("agent:complete", (e) => callback(e.payload));
 }
 
 export function onAgentComplete(
   callback: (result: string) => void
 ): Promise<UnlistenFn> {
-  return listen<{ result: string }>("agent:complete", (e) =>
-    callback(e.payload.result)
-  );
+  return onAgentCompleteEvent((event) => callback(event.result));
 }
 
 export function onAgentError(
@@ -64,3 +73,9 @@ export function onMigrationProgress(
     callback(e.payload)
   );
 }
+
+export function onLoopHealth(
+  callback: (event: LoopHealthEvent) => void
+): Promise<UnlistenFn> {
+  return listen<LoopHealthEvent>("agent:loop-health", (e) => callback(e.payload));
+}
diff --git a/openplanter-desktop/frontend/src/api/types.ts b/openplanter-desktop/frontend/src/api/types.ts
index 22c4d605..2f13046b 100644
--- a/openplanter-desktop/frontend/src/api/types.ts
+++ b/openplanter-desktop/frontend/src/api/types.ts
@@ -9,6 +9,22 @@ export interface TraceEvent {
   message: string;
 }
 
+export type LoopPhase = "investigate" | "build" | "iterate" | "finalize";
+
+export interface LoopMetrics {
+  steps: number;
+  model_turns: number;
+  tool_calls: number;
+  investigate_steps: number;
+  build_steps: number;
+  iterate_steps: number;
+  finalize_steps: number;
+  recon_streak: number;
+  max_recon_streak: number;
+  guardrail_warnings: number;
+  final_rejections: number;
+}
+
 export interface StepEvent {
   depth: number;
   step: number;
@@ -16,6 +32,8 @@ export interface StepEvent {
   tokens: TokenUsage;
   elapsed_ms: number;
   is_final: boolean;
+  loop_phase?: LoopPhase;
+  loop_metrics?: LoopMetrics;
 }
 
 export type DeltaKind = "text" | "thinking" | "tool_call_start" | "tool_call_args";
@@ -27,6 +45,15 @@ export interface DeltaEvent {
 
 export interface CompleteEvent {
   result: string;
+  loop_metrics?: LoopMetrics;
+}
+
+export interface LoopHealthEvent {
+  depth: number;
+  step: number;
+  phase: LoopPhase;
+  metrics: LoopMetrics;
+  is_final: boolean;
 }
 
 export interface ErrorEvent {
@@ -213,8 +240,19 @@ export interface ReplayEntry {
 
 export type AgentEvent =
   | { type: "trace"; message: string }
-  | { type: "step"; depth: number; step: number; tool_name: string | null; tokens: TokenUsage; elapsed_ms: number; is_final: boolean }
+  | {
+      type: "step";
+      depth: number;
+      step: number;
+      tool_name: string | null;
+      tokens: TokenUsage;
+      elapsed_ms: number;
+      is_final: boolean;
+      loop_phase?: LoopPhase;
+      loop_metrics?: LoopMetrics;
+    }
   | { type: "delta"; kind: DeltaKind; text: string }
-  | { type: "complete"; result: string }
+  | { type: "complete"; result: string; loop_metrics?: LoopMetrics }
   | { type: "error"; message: string }
-  | { type: "wiki_updated"; nodes: GraphNode[]; edges: GraphEdge[] };
+  | { type: "wiki_updated"; nodes: GraphNode[]; edges: GraphEdge[] }
+  | { type: "loop_health"; depth: number; step: number; phase: LoopPhase; metrics: LoopMetrics; is_final: boolean };
diff --git a/openplanter-desktop/frontend/src/commands/slash.ts b/openplanter-desktop/frontend/src/commands/slash.ts
index 125eeb14..99118010 100644
--- a/openplanter-desktop/frontend/src/commands/slash.ts
+++ b/openplanter-desktop/frontend/src/commands/slash.ts
@@ -56,6 +56,8 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
           outputTokens: 0,
           currentStep: 0,
           currentDepth: 0,
+          loopHealth: null,
+          lastLoopMetrics: null,
           inputQueue: [],
         }));
         window.dispatchEvent(new CustomEvent("session-changed", { detail: { isNew: true } }));
diff --git a/openplanter-desktop/frontend/src/components/App.ts b/openplanter-desktop/frontend/src/components/App.ts
index 4ef96820..ea84d5b9 100644
--- a/openplanter-desktop/frontend/src/components/App.ts
+++ b/openplanter-desktop/frontend/src/components/App.ts
@@ -105,6 +105,8 @@ async function switchToNewSession(sessionList: HTMLElement): Promise<void> {
       outputTokens: 0,
       currentStep: 0,
       currentDepth: 0,
+      loopHealth: null,
+      lastLoopMetrics: null,
       inputQueue: [],
     }));
     // Dispatch event to clear ChatPane DOM
@@ -162,6 +164,8 @@ async function switchToSession(sessionId: string, sessionList: HTMLElement): Pro
       outputTokens: 0,
       currentStep: 0,
       currentDepth: 0,
+      loopHealth: null,
+      lastLoopMetrics: null,
       inputQueue: [],
     }));
     // Dispatch event to clear ChatPane DOM
diff --git a/openplanter-desktop/frontend/src/components/InputBar.ts b/openplanter-desktop/frontend/src/components/InputBar.ts
index 4575bb27..3b39aa84 100644
--- a/openplanter-desktop/frontend/src/components/InputBar.ts
+++ b/openplanter-desktop/frontend/src/components/InputBar.ts
@@ -112,6 +112,10 @@ export function createInputBar(): HTMLElement {
     appState.update((s) => ({
       ...s,
       isRunning: true,
+      currentStep: 0,
+      currentDepth: 0,
+      loopHealth: null,
+      lastLoopMetrics: null,
       messages: [
         ...s.messages,
         {
@@ -240,6 +244,10 @@ export function createInputBar(): HTMLElement {
     appState.update((s) => ({
       ...s,
       isRunning: true,
+      currentStep: 0,
+      currentDepth: 0,
+      loopHealth: null,
+      lastLoopMetrics: null,
       messages: [
         ...s.messages,
         {
diff --git a/openplanter-desktop/frontend/src/components/StatusBar.test.ts b/openplanter-desktop/frontend/src/components/StatusBar.test.ts
index 34aba5ca..8e83288d 100644
--- a/openplanter-desktop/frontend/src/components/StatusBar.test.ts
+++ b/openplanter-desktop/frontend/src/components/StatusBar.test.ts
@@ -97,6 +97,38 @@ describe("createStatusBar", () => {
     expect(bar.querySelector(".session")!.textContent).toBe("step 3 depth 1");
   });
 
+  it("shows loop health details when telemetry is present", () => {
+    appState.update((s) => ({
+      ...s,
+      isRunning: true,
+      currentStep: 4,
+      currentDepth: 0,
+      loopHealth: {
+        depth: 0,
+        step: 4,
+        phase: "investigate",
+        metrics: {
+          steps: 4,
+          model_turns: 4,
+          tool_calls: 2,
+          investigate_steps: 3,
+          build_steps: 0,
+          iterate_steps: 0,
+          finalize_steps: 0,
+          recon_streak: 3,
+          max_recon_streak: 3,
+          guardrail_warnings: 1,
+          final_rejections: 2,
+        },
+        is_final: false,
+      },
+    }));
+    const bar = createStatusBar();
+    expect(bar.querySelector(".session")!.textContent).toBe(
+      "step 4 depth 0 investigate recon:3 reject:2 guard:1"
+    );
+  });
+
   it("renders token counts", () => {
     appState.update((s) => ({ ...s, inputTokens: 5000, outputTokens: 2500 }));
     const bar = createStatusBar();
diff --git a/openplanter-desktop/frontend/src/components/StatusBar.ts b/openplanter-desktop/frontend/src/components/StatusBar.ts
index f2f119ad..2bd3aa36 100644
--- a/openplanter-desktop/frontend/src/components/StatusBar.ts
+++ b/openplanter-desktop/frontend/src/components/StatusBar.ts
@@ -47,7 +47,19 @@ export function createStatusBar(): HTMLElement {
     sessionEl.textContent = s.sessionId ? `session ${s.sessionId.slice(0, 8)}` : "";
 
     if (s.isRunning && s.currentStep > 0) {
-      sessionEl.textContent = `step ${s.currentStep} depth ${s.currentDepth}`;
+      const health = s.loopHealth;
+      if (health) {
+        const guardrailText =
+          health.metrics.guardrail_warnings > 0
+            ? ` guard:${health.metrics.guardrail_warnings}`
+            : "";
+        sessionEl.textContent =
+          `step ${s.currentStep} depth ${s.currentDepth} ` +
+          `${health.phase} recon:${health.metrics.recon_streak} ` +
+          `reject:${health.metrics.final_rejections}${guardrailText}`;
+      } else {
+        sessionEl.textContent = `step ${s.currentStep} depth ${s.currentDepth}`;
+      }
     }
 
     const inK = (s.inputTokens / 1000).toFixed(1);
diff --git a/openplanter-desktop/frontend/src/main.ts b/openplanter-desktop/frontend/src/main.ts
index bb9696a8..c5b61f9a 100644
--- a/openplanter-desktop/frontend/src/main.ts
+++ b/openplanter-desktop/frontend/src/main.ts
@@ -3,11 +3,12 @@ import { getConfig, getInitStatus } from "./api/invoke";
 import {
   onAgentTrace,
   onAgentDelta,
-  onAgentComplete,
+  onAgentCompleteEvent,
   onAgentError,
   onAgentStep,
   onWikiUpdated,
   onCuratorUpdate,
+  onLoopHealth,
   onMigrationProgress,
 } from "./api/events";
 import { appState } from "./state/store";
@@ -113,6 +114,7 @@ async function init() {
       outputTokens: s.outputTokens + event.tokens.output_tokens,
       currentStep: event.step,
       currentDepth: event.depth,
+      lastLoopMetrics: event.loop_metrics ?? s.lastLoopMetrics,
     }));
 
     // Dispatch to ChatPane for rich step summary rendering
@@ -126,18 +128,20 @@ async function init() {
     window.dispatchEvent(detail);
   });
 
-  await onAgentComplete((result) => {
+  await onAgentCompleteEvent((event) => {
     appState.update((s) => ({
       ...s,
       isRunning: false,
       currentStep: 0,
       currentDepth: 0,
+      loopHealth: null,
+      lastLoopMetrics: event.loop_metrics ?? s.lastLoopMetrics,
       messages: [
         ...s.messages,
         {
           id: crypto.randomUUID(),
           role: "assistant" as const,
-          content: result,
+          content: event.result,
           timestamp: Date.now(),
           isRendered: true,
         },
@@ -154,6 +158,7 @@ async function init() {
       isRunning: false,
       currentStep: 0,
       currentDepth: 0,
+      loopHealth: null,
       messages: [
         ...s.messages,
         {
@@ -192,6 +197,15 @@ async function init() {
     window.dispatchEvent(new CustomEvent("curator-done"));
   });
 
+
+  await onLoopHealth((event) => {
+    appState.update((s) => ({
+      ...s,
+      loopHealth: event,
+      lastLoopMetrics: event.metrics,
+    }));
+  });
+
   await onMigrationProgress((event) => {
     appState.update((s) => ({
       ...s,
diff --git a/openplanter-desktop/frontend/src/state/store.ts b/openplanter-desktop/frontend/src/state/store.ts
index 27d1a382..bf21d516 100644
--- a/openplanter-desktop/frontend/src/state/store.ts
+++ b/openplanter-desktop/frontend/src/state/store.ts
@@ -1,6 +1,8 @@
 /** Simple observable state store. */
 import type {
   InitStatusView,
+  LoopMetrics,
+  LoopHealthEvent,
   MigrationInitResultView,
   MigrationProgressEvent,
 } from "../api/types";
@@ -81,6 +83,8 @@ export interface AppState {
   maxStepsPerCall: number;
   currentStep: number;
   currentDepth: number;
+  loopHealth: LoopHealthEvent | null;
+  lastLoopMetrics: LoopMetrics | null;
   inputHistory: string[];
   inputQueue: string[];
   initGateState: "ready" | "requires_action" | "blocked";
@@ -109,6 +113,8 @@ export const appState = new Store<AppState>({
   maxStepsPerCall: 100,
   currentStep: 0,
   currentDepth: 0,
+  loopHealth: null,
+  lastLoopMetrics: null,
   inputHistory: [],
   inputQueue: [],
   initGateState: "ready",

From 12ac998deb7a33bbe0152d856d02c49d42b5db7c Mon Sep 17 00:00:00 2001
From: Drake Thomsen <120344051+ThomsenDrake@users.noreply.github.com>
Date: Fri, 13 Mar 2026 12:06:35 -0400
Subject: [PATCH 16/58] docs: add RFC for evidence normalization and action
 layer

---
 ...research-normalization-and-action-layer.md | 374 ++++++++++++++++++
 1 file changed, 374 insertions(+)
 create mode 100644 docs/rfcs/0001-research-normalization-and-action-layer.md

diff --git a/docs/rfcs/0001-research-normalization-and-action-layer.md b/docs/rfcs/0001-research-normalization-and-action-layer.md
new file mode 100644
index 00000000..4358f0da
--- /dev/null
+++ b/docs/rfcs/0001-research-normalization-and-action-layer.md
@@ -0,0 +1,374 @@
+# RFC 0001: Research Normalization and Future Action Layer
+
+- **Status:** Draft
+- **Authors:** OpenPlanter contributors
+- **Last Updated:** 2026-03-13
+- **Audience:** Agent/runtime, ontology, and workflow maintainers
+
+## 1) Summary
+
+This RFC defines a two-part architecture for ontology-first investigations:
+
+1. **Research normalization**: all incoming research artifacts (local files, web fetches, transcripts, API responses, search results) are normalized into a single **Evidence** model.
+2. **Future action layer**: unresolved questions derived from evidence/claims become explicit **NextAction** records with expected payoff, required inputs, and provenance-backed rationale.
+
+The design is intentionally provenance-heavy: every normalized object and every action recommendation must preserve where it came from, when it was observed, and how confident we are in its freshness and relevance.
+
+## 2) Motivation
+
+Investigations currently involve heterogeneous inputs with inconsistent metadata and ad hoc follow-up planning. This causes:
+
+- brittle downstream extraction/claiming logic,
+- weak comparability between evidence types,
+- missing or lossy provenance,
+- and no unified, inspectable queue of “what to do next.”
+
+For an ontology-first workflow, we need stable primitives:
+
+- **Evidence** as the canonical atomic observation unit,
+- **Claim** as a typed assertion grounded in evidence,
+- **Question** as explicit uncertainty,
+- **NextAction** as executable resolution path with expected payoff.
+
+## 3) Goals
+
+1. Define a canonical evidence model that all ingestion paths map to.
+2. Preserve complete provenance chains (source, retrieval, transforms, extractor versions).
+3. Track freshness/temporal validity separately from extraction confidence.
+4. Standardize extracted entities and links between evidence and claims.
+5. Convert unresolved questions into prioritized, auditable next actions.
+6. Keep the model implementation-agnostic enough for CLI and desktop workflows.
+
+## 4) Non-goals
+
+- Prescribing a specific storage backend (SQLite, graph DB, document store).
+- Replacing existing dataset-specific fetchers.
+- Defining UI pixel-level behavior for action rendering.
+- Mandating one ranking model for payoff estimation.
+
+## 5) Design Principles
+
+1. **Ontology first**: entities, relations, claims, and questions use typed ontology IDs before free-form tags.
+2. **Provenance by default**: no evidence/claim/action without source and processing lineage.
+3. **Lossless normalization**: preserve source-native payloads; add normalized projections.
+4. **Temporal explicitness**: distinguish publication date, retrieval date, and validity window.
+5. **Actionability over verbosity**: unresolved uncertainty should produce concrete, bounded next actions.
+6. **Composable confidence**: extraction confidence, source reliability, and freshness decay are separate signals.
+
+## 6) Canonical Evidence Model
+
+`Evidence` is the normalized envelope for every incoming artifact.
+
+```yaml
+Evidence:
+  evidence_id: ev_<ULID>
+  kind: [local_file, web_fetch, transcript, api_response, search_result]
+  modality: [text, html, json, pdf, audio, video, table, mixed]
+
+  content:
+    raw_ref: <pointer to immutable raw bytes/blob>
+    normalized_text: <UTF-8 text projection, optional>
+    normalized_structured: <JSON projection, optional>
+    chunks: [
+      {
+        chunk_id: ch_<ULID>,
+        type: [paragraph, table_row, json_path, timestamped_utterance],
+        locator: <offset/span/xpath/jsonpath/timestamp>,
+        text: <chunk text>,
+        hash: <sha256>
+      }
+    ]
+
+  provenance:
+    source_type: [filesystem, http, api, search_index, transcript_pipeline]
+    source_uri: <file://... | https://... | api://provider/endpoint>
+    source_title: <best available title>
+    publisher: <org/person/system>
+    acquisition:
+      observed_at: <UTC timestamp>
+      retrieved_at: <UTC timestamp>
+      retrieval_method: <tool + version>
+      request_fingerprint: <canonicalized request hash>
+      response_fingerprint: <response hash/etag>
+    processing_lineage:
+      - stage: [decode, ocr, asr, parse, chunk, extract]
+        tool: <name>
+        version: <semver/git sha>
+        run_id: <pipeline run id>
+        timestamp: <UTC>
+
+  freshness:
+    published_at: <UTC optional>
+    effective_from: <UTC optional>
+    effective_to: <UTC optional>
+    stale_after: <UTC optional>
+    recency_score: <0..1>
+    decay_policy: [none, linear, exponential, source_defined]
+
+  reliability:
+    source_reliability_score: <0..1>
+    extraction_confidence: <0..1>
+    integrity:
+      checksum: <sha256>
+      signature_verified: <bool optional>
+
+  ontology_links:
+    entities: [
+      {
+        entity_id: ent_<ULID>,
+        ontology_type: <Person|Organization|Asset|Contract|Event|Location|...>,
+        mention_span: <chunk locator>,
+        confidence: <0..1>,
+        resolution_state: [resolved, candidate, unresolved]
+      }
+    ]
+    relations: [
+      {
+        relation_id: rel_<ULID>,
+        predicate: <ontology predicate>,
+        subject_entity_id: ent_...,
+        object_entity_id: ent_...,
+        confidence: <0..1>
+      }
+    ]
+
+  claim_links:
+    supports: [cl_<ULID>]
+    contradicts: [cl_<ULID>]
+    mentions: [cl_<ULID>]
+
+  governance:
+    sensitivity: [public, internal, restricted]
+    license: <SPDX or source term>
+```
+
+### Required fields
+
+At minimum: `evidence_id`, `kind`, `provenance.source_uri`, `provenance.acquisition.retrieved_at`, and one content representation (`raw_ref`, `normalized_text`, or `normalized_structured`).
+
+## 7) Source-Specific Normalization Contracts
+
+Each ingestion path maps into the same `Evidence` envelope with source-specific adapters.
+
+### 7.1 Local files
+
+- `kind=local_file`
+- `source_uri=file://<absolute path>`
+- fingerprint from file bytes + inode metadata snapshot
+- if structured file (CSV/JSON/Parquet), populate `normalized_structured`
+- if text-like, also populate `normalized_text` and paragraph chunks
+
+### 7.2 Web fetches
+
+- `kind=web_fetch`
+- `source_uri=https://...` after redirect resolution
+- store HTTP metadata in provenance extension (status, etag, cache-control)
+- keep raw HTML/PDF bytes immutable, plus extracted text projection
+- capture canonical URL and retrieval agent identity
+
+### 7.3 Transcripts (audio/video/meeting/call)
+
+- `kind=transcript`
+- include ASR engine/version in `processing_lineage`
+- chunk type defaults to `timestamped_utterance`
+- provenance should include media source and diarization metadata when available
+
+### 7.4 API responses
+
+- `kind=api_response`
+- `source_uri=api://<provider>/<endpoint>` and request fingerprint
+- normalized structured projection is primary
+- capture pagination context and token scopes in provenance extension
+
+### 7.5 Search results
+
+- `kind=search_result`
+- represent each result item as independent evidence with query provenance
+- include ranking metadata (rank, score, provider)
+- link result evidence to follow-up fetched evidence via derivation edges
+
+## 8) Provenance and Freshness Semantics
+
+### 8.1 Provenance chain
+
+Every derived artifact stores:
+
+- parent evidence IDs,
+- transformation stage,
+- tool version,
+- timestamp.
+
+This enables full replay from claim/action back to raw source.
+
+### 8.2 Freshness semantics
+
+Freshness is not binary. We compute:
+
+- `recency_score` from source-specific decay policy,
+- `stale_after` from explicit source directives if present,
+- investigation-time override for domains where historical records remain valid.
+
+Claims should consume freshness as a weighting factor, not a hard validity gate.
+
+## 9) Entities, Claims, and Linking
+
+## 9.1 Entity extraction and resolution
+
+Entity mentions are extracted per chunk and mapped to ontology types. Resolution pipeline states:
+
+1. `unresolved` (new mention)
+2. `candidate` (one or more possible canonical entities)
+3. `resolved` (canonical entity assigned)
+
+Each state transition writes provenance (`who/what/when/how`).
+
+### 9.2 Claim model (minimal)
+
+```yaml
+Claim:
+  claim_id: cl_<ULID>
+  claim_type: <ontology assertion type>
+  subject_entity_id: ent_...
+  predicate: <ontology predicate>
+  object: <entity_id | literal>
+  status: [proposed, supported, disputed, rejected]
+  support_evidence_ids: [ev_...]
+  contradiction_evidence_ids: [ev_...]
+  confidence: <0..1>
+  last_evaluated_at: <UTC>
+```
+
+Evidence links to claims through `supports`, `contradicts`, or `mentions`.
+
+### 9.3 Contradiction handling
+
+Contradictions are first-class edges, not overwrite events. Investigations should preserve both competing evidence sets and open a resolving question if conflict materially affects conclusions.
+
+## 10) Unresolved Questions → Next Actions
+
+`Question` records represent uncertainty or missing information; `NextAction` records represent concrete attempts to resolve it.
+
+### 10.1 Question model
+
+```yaml
+Question:
+  question_id: q_<ULID>
+  text: <natural language uncertainty>
+  ontology_scope: [entity_ids, claim_ids, predicates]
+  blocking_level: [critical, high, medium, low]
+  created_from:
+    evidence_ids: [ev_...]
+    claim_ids: [cl_...]
+  status: [open, in_progress, resolved, abandoned]
+```
+
+### 10.2 NextAction model
+
+```yaml
+NextAction:
+  action_id: act_<ULID>
+  question_id: q_<ULID>
+  action_type: [fetch, search, extract, resolve_entity, verify_claim, request_human_input]
+  hypothesis: <what this action aims to confirm/deny>
+
+  required_inputs:
+    required_evidence_kinds: [api_response, web_fetch, ...]
+    required_entities: [ent_...]
+    required_claims: [cl_...]
+    external_dependencies: [api_key:provider, tool:ocr_v2]
+
+  expected_payoff:
+    uncertainty_reduction: <0..1>
+    decision_impact: <0..1>
+    graph_expansion_value: <0..1>
+    estimated_cost: <time/compute/API>
+    payoff_score: <normalized scalar>
+
+  execution:
+    suggested_tools: [web_search, fetch_url, read_file, ...]
+    acceptance_criteria:
+      - <objective completion criterion>
+    stop_conditions:
+      - <condition>
+
+  provenance:
+    generated_by: <planner component + version>
+    generated_at: <UTC>
+    based_on_evidence_ids: [ev_...]
+    based_on_claim_ids: [cl_...]
+
+  status: [queued, ready, blocked, running, completed, failed, superseded]
+```
+
+### 10.3 Payoff scoring guidance
+
+Default heuristic:
+
+`payoff_score = (0.45 * uncertainty_reduction) + (0.35 * decision_impact) + (0.20 * graph_expansion_value) - cost_penalty`
+
+Where `cost_penalty` is normalized from estimated resource cost and latency. Weights are configurable by investigation profile.
+
+### 10.4 Required input semantics
+
+Actions are only `ready` when all required inputs are available/resolved. Otherwise they remain `blocked` and should emit explicit dependency hints (e.g., “requires canonical entity for vendor alias X”).
+
+## 11) Workflow Integration (Ontology-First Investigation)
+
+1. Ingest source artifact.
+2. Normalize to `Evidence` + provenance/freshness.
+3. Extract entity mentions and candidate relations.
+4. Generate/update claims with support/contradiction links.
+5. Detect unresolved questions (missing evidence, unresolved entity, contradictory claims).
+6. Materialize ranked `NextAction` queue.
+7. Execute top ready actions; loop until stop criteria are satisfied.
+
+Stop criteria examples:
+
+- no critical questions remain,
+- marginal payoff of top action below threshold,
+- time/budget exhausted,
+- human reviewer sign-off.
+
+## 12) Minimal Implementation Plan
+
+### Phase 1: Data contracts
+
+- Introduce versioned schema definitions for `Evidence`, `Claim`, `Question`, `NextAction`.
+- Add adapter interfaces for each source kind.
+
+### Phase 2: Provenance/freshness enforcement
+
+- Reject evidence writes missing required provenance fields.
+- Add freshness scoring utility with source-specific decay presets.
+
+### Phase 3: Question/action engine
+
+- Add unresolved-question detector.
+- Add action generator with payoff scoring and dependency gating.
+
+### Phase 4: Observability
+
+- Add lineage trace views (claim → evidence → raw source).
+- Add action queue diagnostics (why blocked, why ranked).
+
+## 13) Backward Compatibility
+
+- Existing fetch/extract scripts remain valid as long as adapters can map their outputs into `Evidence`.
+- Legacy records can be wrapped as `Evidence` with partial fields and `normalization_version=legacy` until reprocessed.
+
+## 14) Open Questions
+
+1. Should search result evidence always remain separate from fetched page evidence, or be auto-merged when identical URLs/content hashes match?
+2. Which domains require non-decaying freshness (e.g., incorporation date) by default?
+3. Should payoff scoring be globally configured or profile-specific per investigation objective?
+4. How should human-authored notes be modeled: separate `kind=analyst_note` or `local_file` subtype?
+
+## 15) Acceptance Criteria
+
+This RFC is accepted when:
+
+1. Every ingestion pathway can emit schema-valid `Evidence` objects.
+2. Every claim can be traced to one or more evidence items with provenance lineage.
+3. Every open high/critical question has at least one generated `NextAction`.
+4. Action queue exposes payoff and blocked-input explanations.
+5. Replay from action → question → claim → evidence → raw source is possible in tooling.

From f860da8d80fca132b43d7a3eb0edd2ff4b22d00b Mon Sep 17 00:00:00 2001
From: Drake Thomsen <120344051+ThomsenDrake@users.noreply.github.com>
Date: Fri, 13 Mar 2026 12:07:13 -0400
Subject: [PATCH 17/58] Add RFC for normalization and action layer research

---
 ...n-layer.md => 0002-research-normalization-and-action-layer.md} | 0
 1 file changed, 0 insertions(+), 0 deletions(-)
 rename docs/rfcs/{0001-research-normalization-and-action-layer.md => 0002-research-normalization-and-action-layer.md} (100%)

diff --git a/docs/rfcs/0001-research-normalization-and-action-layer.md b/docs/rfcs/0002-research-normalization-and-action-layer.md
similarity index 100%
rename from docs/rfcs/0001-research-normalization-and-action-layer.md
rename to docs/rfcs/0002-research-normalization-and-action-layer.md

From dd37410a9851fc9b8a2ffd5f73aaaa5b5b841e32 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Fri, 13 Mar 2026 12:51:13 -0400
Subject: [PATCH 18/58] fix: close remaining stage 1-4 gaps

---
 agent/engine.py                               |  27 ++-
 agent/replay_log.py                           |  10 +-
 agent/runtime.py                              |   2 +-
 .../crates/op-core/src/engine/mod.rs          | 108 ++++++++--
 .../op-core/tests/test_model_streaming.rs     | 198 ++++++++++++++++++
 .../frontend/src/api/events.test.ts           |   3 +-
 .../frontend/src/api/events.ts                |  14 +-
 tests/test_engine.py                          |  65 +++++-
 tests/test_replay_log.py                      |  90 ++++++++
 tests/test_turn_summaries.py                  |  41 ++++
 10 files changed, 512 insertions(+), 46 deletions(-)

diff --git a/agent/engine.py b/agent/engine.py
index cd12e735..dbbe5fc7 100644
--- a/agent/engine.py
+++ b/agent/engine.py
@@ -41,11 +41,17 @@
     "edit_file",
     "hashline_edit",
 }
-_META_FINAL_PATTERNS = (
+_WEAK_STRUCTURAL_META_PATTERNS = (
     re.compile(r"^\s*(here(?:'s| is)\s+(?:my|the)\s+(?:plan|approach|analysis))\b", re.I),
+)
+_STRONG_PROCESS_META_PATTERNS = (
     re.compile(r"\b(i\s+(?:will|can|should|need to|want to|am going to|plan to))\b", re.I),
     re.compile(r"\b(let me|next,?\s+i\s+will|i\s+should\s+start\s+by)\b", re.I),
 )
+_META_DELIVERABLE_OBJECTIVE_PATTERN = re.compile(
+    r"\b(plan(?:ning)?|approach|strategy|outline|spec(?:ification)?|design|roadmap|proposal|review|audit|analysis|analyze|brainstorm)\b",
+    re.I,
+)
 
 
 def _summarize_args(args: dict[str, Any], max_len: int = 120) -> str:
@@ -325,13 +331,18 @@ def _judge_result(
         except Exception as exc:
             return f"PASS\n(judge error: {exc})"
 
-    def _is_meta_final_text(self, text: str) -> bool:
+    def _objective_allows_meta_final(self, objective: str) -> bool:
+        return bool(_META_DELIVERABLE_OBJECTIVE_PATTERN.search(objective))
+
+    def _is_meta_final_text(self, text: str, objective: str = "") -> bool:
         stripped = text.strip()
         if not stripped:
             return True
-        if len(stripped.split()) < 5:
-            return False
-        return any(pattern.search(stripped) for pattern in _META_FINAL_PATTERNS)
+        if any(pattern.search(stripped) for pattern in _STRONG_PROCESS_META_PATTERNS):
+            return True
+        if any(pattern.search(stripped) for pattern in _WEAK_STRUCTURAL_META_PATTERNS):
+            return not self._objective_allows_meta_final(objective)
+        return False
 
     def _solve_recursive(
         self,
@@ -532,7 +543,7 @@ def _solve_recursive(
 
             # No tool calls + text present = final answer
             if not turn.tool_calls and turn.text:
-                if self._is_meta_final_text(turn.text):
+                if self._is_meta_final_text(turn.text, objective):
                     loop_metrics["final_rejections"] += 1
                     self._emit(
                         f"[d{depth}/s{step}] rejected meta final-answer text; requesting concrete completion",
@@ -595,9 +606,11 @@ def _solve_recursive(
                 loop_metrics["phase_counts"]["investigate"] += 1
             elif has_artifact:
                 loop_metrics["recon_streak"] = 0
+                loop_metrics["last_guardrail_streak"] = 0
                 loop_metrics["phase_counts"]["build"] += 1
             else:
                 loop_metrics["recon_streak"] = 0
+                loop_metrics["last_guardrail_streak"] = 0
                 loop_metrics["phase_counts"]["iterate"] += 1
             loop_metrics["max_recon_streak"] = max(
                 int(loop_metrics["max_recon_streak"]), int(loop_metrics["recon_streak"])
@@ -715,7 +728,7 @@ def _solve_recursive(
                 and results
                 and int(loop_metrics["recon_streak"]) >= 3
                 and not has_artifact
-                and int(loop_metrics.get("last_guardrail_streak", 0)) != int(loop_metrics["recon_streak"])
+                and int(loop_metrics.get("last_guardrail_streak", 0)) == 0
             ):
                 loop_metrics["guardrail_warnings"] += 1
                 loop_metrics["last_guardrail_streak"] = int(loop_metrics["recon_streak"])
diff --git a/agent/replay_log.py b/agent/replay_log.py
index 466b53af..522f8899 100644
--- a/agent/replay_log.py
+++ b/agent/replay_log.py
@@ -23,6 +23,7 @@ class ReplayLogger:
 
     path: Path
     conversation_id: str = "root"
+    force_snapshot_first_call: bool = False
     _seq: int = field(default=0, init=False)
     _last_msg_count: int = field(default=0, init=False)
     _has_call: bool = field(default=False, init=False)
@@ -31,6 +32,9 @@ class ReplayLogger:
     def __post_init__(self) -> None:
         self._seq = self._scan_next_seq()
         self._hydrate_conversation_state()
+        if self.force_snapshot_first_call:
+            self._has_call = False
+            self._last_msg_count = 0
 
     @property
     def needs_header(self) -> bool:
@@ -39,7 +43,11 @@ def needs_header(self) -> bool:
     def child(self, depth: int, step: int) -> "ReplayLogger":
         """Create a child logger for a subtask conversation."""
         child_id = f"{self.conversation_id}/d{depth}s{step}"
-        return ReplayLogger(path=self.path, conversation_id=child_id)
+        return ReplayLogger(
+            path=self.path,
+            conversation_id=child_id,
+            force_snapshot_first_call=self.force_snapshot_first_call,
+        )
 
     def write_header(
         self,
diff --git a/agent/runtime.py b/agent/runtime.py
index 2dfafcb9..29dd5718 100644
--- a/agent/runtime.py
+++ b/agent/runtime.py
@@ -374,7 +374,7 @@ def _combined_on_step(step_event: dict[str, Any]) -> None:
                     pass
 
         replay_path = self.store._session_dir(self.session_id) / "replay.jsonl"
-        replay_logger = ReplayLogger(path=replay_path)
+        replay_logger = ReplayLogger(path=replay_path, force_snapshot_first_call=True)
         replay_seq_start = replay_logger._seq
 
         result, updated_context = self.engine.solve_with_context(
diff --git a/openplanter-desktop/crates/op-core/src/engine/mod.rs b/openplanter-desktop/crates/op-core/src/engine/mod.rs
index 1803cf10..cf274420 100644
--- a/openplanter-desktop/crates/op-core/src/engine/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/mod.rs
@@ -422,13 +422,39 @@ async fn chat_stream_with_rate_limit_retries(
     }
 }
 
-fn is_meta_final_text(text: &str) -> bool {
+fn objective_allows_meta_final(objective: &str) -> bool {
+    objective
+        .split(|c: char| !c.is_ascii_alphanumeric())
+        .filter(|token| !token.is_empty())
+        .any(|token| {
+            matches!(
+                token.to_ascii_lowercase().as_str(),
+                "plan"
+                    | "planning"
+                    | "approach"
+                    | "strategy"
+                    | "outline"
+                    | "spec"
+                    | "specification"
+                    | "design"
+                    | "roadmap"
+                    | "proposal"
+                    | "review"
+                    | "audit"
+                    | "analysis"
+                    | "analyze"
+                    | "brainstorm"
+            )
+        })
+}
+
+fn is_meta_final_text(text: &str, objective: &str) -> bool {
     let stripped = text.trim();
     if stripped.is_empty() {
         return true;
     }
     let lower = stripped.to_ascii_lowercase();
-    let meta_starts = [
+    let weak_structural_meta = [
         "here is my plan",
         "here's my plan",
         "here is the plan",
@@ -441,18 +467,9 @@ fn is_meta_final_text(text: &str) -> bool {
         "here's my analysis",
         "here is the analysis",
         "here's the analysis",
-        "let me",
-        "next, i will",
-        "next i will",
     ];
-    if meta_starts.iter().any(|p| lower.starts_with(p)) {
-        return true;
-    }
-    if stripped.split_whitespace().count() < 5 {
-        return false;
-    }
     let padded = format!(" {lower} ");
-    [
+    let strong_process_meta = [
         " i will ",
         " i can ",
         " i should ",
@@ -464,9 +481,17 @@ fn is_meta_final_text(text: &str) -> bool {
         " next, i will ",
         " next i will ",
         " i should start by ",
-    ]
-    .iter()
-    .any(|needle| padded.contains(needle))
+    ];
+    if strong_process_meta
+        .iter()
+        .any(|needle| padded.contains(needle))
+    {
+        return true;
+    }
+    if weak_structural_meta.iter().any(|p| lower.starts_with(p)) {
+        return !objective_allows_meta_final(objective);
+    }
+    false
 }
 
 fn is_recon_tool(name: &str) -> bool {
@@ -518,6 +543,10 @@ fn increment_phase(metrics: &mut LoopMetrics, phase: &LoopPhase) {
     }
 }
 
+fn should_emit_recon_guardrail(recon_streak: u32, last_guardrail_streak: u32) -> bool {
+    recon_streak >= 3 && last_guardrail_streak == 0
+}
+
 /// Real solve flow with a multi-step agentic loop.
 ///
 /// Calls the model with tool definitions. If the model returns tool calls,
@@ -649,7 +678,7 @@ pub async fn solve(
                 });
                 continue;
             }
-            if is_meta_final_text(&turn.text) {
+            if is_meta_final_text(&turn.text, objective) {
                 loop_metrics.final_rejections += 1;
                 emitter.emit_trace(&format!(
                     "[d0/s{step}] rejected meta final answer; requesting concrete deliverable"
@@ -726,13 +755,13 @@ pub async fn solve(
             loop_metrics.recon_streak += 1;
         } else {
             loop_metrics.recon_streak = 0;
+            last_guardrail_streak = 0;
         }
         loop_metrics.max_recon_streak =
             loop_metrics.max_recon_streak.max(loop_metrics.recon_streak);
         increment_phase(&mut loop_metrics, &phase);
         if matches!(phase, LoopPhase::Investigate)
-            && loop_metrics.recon_streak >= 3
-            && loop_metrics.recon_streak != last_guardrail_streak
+            && should_emit_recon_guardrail(loop_metrics.recon_streak, last_guardrail_streak)
         {
             loop_metrics.guardrail_warnings += 1;
             last_guardrail_streak = loop_metrics.recon_streak;
@@ -1207,16 +1236,31 @@ mod tests {
     }
 
     #[test]
-    fn test_is_meta_final_text_rejects_empty_and_meta_prefixes() {
-        assert!(is_meta_final_text(""));
+    fn test_is_meta_final_text_rejects_empty_and_strong_process_meta() {
+        assert!(is_meta_final_text("", "Answer the question directly"));
         assert!(is_meta_final_text(
-            "Here is my plan for finishing the task."
+            "I should start by checking the workspace layout.",
+            "Answer the question directly"
         ));
+        assert!(!is_meta_final_text(
+            "Completed the fix and updated the failing test.",
+            "Answer the question directly"
+        ));
+    }
+
+    #[test]
+    fn test_is_meta_final_text_respects_objective_policy_for_structural_meta() {
         assert!(is_meta_final_text(
-            "I should start by checking the workspace layout."
+            "Here is my plan for finishing the task.",
+            "Answer the question directly"
         ));
         assert!(!is_meta_final_text(
-            "Completed the fix and updated the failing test."
+            "Here is my plan for finishing the task.",
+            "Write a plan for finishing the task"
+        ));
+        assert!(is_meta_final_text(
+            "Here is my plan: I will inspect files and then implement.",
+            "Write a plan for finishing the task"
         ));
     }
 
@@ -1237,4 +1281,22 @@ mod tests {
         let phase = classify_loop_phase(&[tool_call("read_file"), tool_call("run_shell")], false);
         assert_eq!(phase, LoopPhase::Iterate);
     }
+
+    #[test]
+    fn test_should_emit_recon_guardrail_once_per_episode() {
+        let mut last_guardrail_streak = 0;
+
+        assert!(!should_emit_recon_guardrail(1, last_guardrail_streak));
+        assert!(!should_emit_recon_guardrail(2, last_guardrail_streak));
+        assert!(should_emit_recon_guardrail(3, last_guardrail_streak));
+
+        last_guardrail_streak = 3;
+        assert!(!should_emit_recon_guardrail(4, last_guardrail_streak));
+        assert!(!should_emit_recon_guardrail(5, last_guardrail_streak));
+
+        last_guardrail_streak = 0;
+        assert!(!should_emit_recon_guardrail(1, last_guardrail_streak));
+        assert!(!should_emit_recon_guardrail(2, last_guardrail_streak));
+        assert!(should_emit_recon_guardrail(3, last_guardrail_streak));
+    }
 }
diff --git a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
index fb43b3ef..a22cf1da 100644
--- a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
+++ b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
@@ -1285,6 +1285,14 @@ event: content_block_stop\ndata: {\"type\":\"content_block_stop\",\"index\":0}\n
 event: message_delta\ndata: {\"type\":\"message_delta\",\"delta\":{\"stop_reason\":\"end_turn\"},\"usage\":{\"output_tokens\":11}}\n\n\
 event: message_stop\ndata: {\"type\":\"message_stop\"}\n\n";
 
+const ANTHROPIC_SSE_META_FINAL_WITH_PROCESS: &str = "\
+event: message_start\ndata: {\"type\":\"message_start\",\"message\":{\"id\":\"msg_meta_3\",\"type\":\"message\",\"role\":\"assistant\",\"content\":[],\"usage\":{\"input_tokens\":45}}}\n\n\
+event: content_block_start\ndata: {\"type\":\"content_block_start\",\"index\":0,\"content_block\":{\"type\":\"text\",\"text\":\"\"}}\n\n\
+event: content_block_delta\ndata: {\"type\":\"content_block_delta\",\"index\":0,\"delta\":{\"type\":\"text_delta\",\"text\":\"Here is my plan: I will inspect files and then implement the fix.\"}}\n\n\
+event: content_block_stop\ndata: {\"type\":\"content_block_stop\",\"index\":0}\n\n\
+event: message_delta\ndata: {\"type\":\"message_delta\",\"delta\":{\"stop_reason\":\"end_turn\"},\"usage\":{\"output_tokens\":12}}\n\n\
+event: message_stop\ndata: {\"type\":\"message_stop\"}\n\n";
+
 #[tokio::test]
 async fn test_solve_rejects_meta_final_until_concrete_completion() {
     use op_core::config::AgentConfig;
@@ -1400,3 +1408,193 @@ async fn test_solve_rejects_meta_final_until_concrete_completion() {
         "did not expect errors, got: {recorded:?}"
     );
 }
+
+#[tokio::test]
+async fn test_solve_allows_structural_meta_for_plan_objectives() {
+    use op_core::config::AgentConfig;
+    use op_core::engine::{solve, SolveEmitter};
+    use op_core::events::{LoopMetrics, StepEvent};
+
+    let addr = start_stateful_mock_server(vec![ANTHROPIC_SSE_META_FINAL]).await;
+
+    #[derive(Debug, Clone)]
+    #[allow(dead_code)]
+    enum Ev5 {
+        Trace(String),
+        Step(StepEvent),
+        Complete {
+            result: String,
+            loop_metrics: Option<LoopMetrics>,
+        },
+        Error(String),
+    }
+
+    struct TestEmitter5 {
+        events: Arc<Mutex<Vec<Ev5>>>,
+    }
+
+    impl SolveEmitter for TestEmitter5 {
+        fn emit_trace(&self, message: &str) {
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev5::Trace(message.to_string()));
+        }
+
+        fn emit_delta(&self, _: DeltaEvent) {}
+
+        fn emit_step(&self, event: StepEvent) {
+            self.events.lock().unwrap().push(Ev5::Step(event));
+        }
+
+        fn emit_complete(&self, result: &str, loop_metrics: Option<LoopMetrics>) {
+            self.events.lock().unwrap().push(Ev5::Complete {
+                result: result.to_string(),
+                loop_metrics,
+            });
+        }
+
+        fn emit_error(&self, message: &str) {
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev5::Error(message.to_string()));
+        }
+    }
+
+    let events = Arc::new(Mutex::new(Vec::new()));
+    let emitter = TestEmitter5 {
+        events: events.clone(),
+    };
+
+    let cfg = AgentConfig {
+        provider: "anthropic".into(),
+        model: "claude-sonnet-4-5".into(),
+        anthropic_api_key: Some("test-key".into()),
+        anthropic_base_url: format!("http://{addr}"),
+        demo: false,
+        ..Default::default()
+    };
+
+    let cancel = CancellationToken::new();
+    solve("Write a plan for finishing the task", &cfg, &emitter, cancel).await;
+
+    let recorded = events.lock().unwrap().clone();
+    assert!(
+        !recorded.iter().any(|event| matches!(
+            event,
+            Ev5::Trace(message) if message.contains("rejected meta final answer")
+        )),
+        "did not expect a meta-final rejection trace, got: {recorded:?}"
+    );
+    assert!(
+        recorded.iter().any(|event| matches!(
+            event,
+            Ev5::Complete { result, loop_metrics }
+                if result.contains("Here is my plan")
+                    && loop_metrics.as_ref().map(|metrics| metrics.final_rejections) == Some(0)
+        )),
+        "expected structural plan response to complete cleanly, got: {recorded:?}"
+    );
+    assert!(
+        !recorded.iter().any(|event| matches!(event, Ev5::Error(_))),
+        "did not expect errors, got: {recorded:?}"
+    );
+}
+
+#[tokio::test]
+async fn test_solve_rejects_process_meta_even_for_plan_objectives() {
+    use op_core::config::AgentConfig;
+    use op_core::engine::{solve, SolveEmitter};
+    use op_core::events::{LoopMetrics, StepEvent};
+
+    let addr = start_stateful_mock_server(vec![
+        ANTHROPIC_SSE_META_FINAL_WITH_PROCESS,
+        ANTHROPIC_SSE_CONCRETE_FINAL,
+    ])
+    .await;
+
+    #[derive(Debug, Clone)]
+    #[allow(dead_code)]
+    enum Ev6 {
+        Trace(String),
+        Step(StepEvent),
+        Complete {
+            result: String,
+            loop_metrics: Option<LoopMetrics>,
+        },
+        Error(String),
+    }
+
+    struct TestEmitter6 {
+        events: Arc<Mutex<Vec<Ev6>>>,
+    }
+
+    impl SolveEmitter for TestEmitter6 {
+        fn emit_trace(&self, message: &str) {
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev6::Trace(message.to_string()));
+        }
+
+        fn emit_delta(&self, _: DeltaEvent) {}
+
+        fn emit_step(&self, event: StepEvent) {
+            self.events.lock().unwrap().push(Ev6::Step(event));
+        }
+
+        fn emit_complete(&self, result: &str, loop_metrics: Option<LoopMetrics>) {
+            self.events.lock().unwrap().push(Ev6::Complete {
+                result: result.to_string(),
+                loop_metrics,
+            });
+        }
+
+        fn emit_error(&self, message: &str) {
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev6::Error(message.to_string()));
+        }
+    }
+
+    let events = Arc::new(Mutex::new(Vec::new()));
+    let emitter = TestEmitter6 {
+        events: events.clone(),
+    };
+
+    let cfg = AgentConfig {
+        provider: "anthropic".into(),
+        model: "claude-sonnet-4-5".into(),
+        anthropic_api_key: Some("test-key".into()),
+        anthropic_base_url: format!("http://{addr}"),
+        demo: false,
+        ..Default::default()
+    };
+
+    let cancel = CancellationToken::new();
+    solve("Write a plan for finishing the task", &cfg, &emitter, cancel).await;
+
+    let recorded = events.lock().unwrap().clone();
+    assert!(
+        recorded.iter().any(|event| matches!(
+            event,
+            Ev6::Trace(message) if message.contains("rejected meta final answer")
+        )),
+        "expected a meta-final rejection trace, got: {recorded:?}"
+    );
+    assert!(
+        recorded.iter().any(|event| matches!(
+            event,
+            Ev6::Complete { result, loop_metrics }
+                if result.contains("Completed the task")
+                    && loop_metrics.as_ref().map(|metrics| metrics.final_rejections) == Some(1)
+        )),
+        "expected completion after rejecting process-meta response, got: {recorded:?}"
+    );
+    assert!(
+        !recorded.iter().any(|event| matches!(event, Ev6::Error(_))),
+        "did not expect errors, got: {recorded:?}"
+    );
+}
diff --git a/openplanter-desktop/frontend/src/api/events.test.ts b/openplanter-desktop/frontend/src/api/events.test.ts
index 294aeed5..eaca9324 100644
--- a/openplanter-desktop/frontend/src/api/events.test.ts
+++ b/openplanter-desktop/frontend/src/api/events.test.ts
@@ -49,7 +49,6 @@ describe("event listeners", () => {
 
     const handler = listeners.get("agent:step")!;
     const payload = {
-      type: "step",
       step: 1,
       depth: 0,
       tokens: { input_tokens: 100, output_tokens: 50 },
@@ -65,7 +64,7 @@ describe("event listeners", () => {
     await onAgentDelta(callback);
 
     const handler = listeners.get("agent:delta")!;
-    const payload = { type: "delta", kind: "text", text: "hello" };
+    const payload = { kind: "text", text: "hello" };
     handler({ payload });
     expect(callback).toHaveBeenCalledWith(payload);
   });
diff --git a/openplanter-desktop/frontend/src/api/events.ts b/openplanter-desktop/frontend/src/api/events.ts
index 0801c234..a00b62ee 100644
--- a/openplanter-desktop/frontend/src/api/events.ts
+++ b/openplanter-desktop/frontend/src/api/events.ts
@@ -1,17 +1,15 @@
 /** Tauri event subscriptions. */
 import { listen, type UnlistenFn } from "@tauri-apps/api/event";
 import type {
-  AgentEvent,
   CompleteEvent,
   CuratorUpdateEvent,
+  DeltaEvent,
   GraphData,
   LoopHealthEvent,
   MigrationProgressEvent,
+  StepEvent,
 } from "./types";
 
-type AgentStepEvent = Extract<AgentEvent, { type: "step" }>;
-type AgentDeltaEvent = Extract<AgentEvent, { type: "delta" }>;
-
 export function onAgentTrace(
   callback: (message: string) => void
 ): Promise<UnlistenFn> {
@@ -21,15 +19,15 @@ export function onAgentTrace(
 }
 
 export function onAgentStep(
-  callback: (event: AgentStepEvent) => void
+  callback: (event: StepEvent) => void
 ): Promise<UnlistenFn> {
-  return listen<AgentStepEvent>("agent:step", (e) => callback(e.payload));
+  return listen<StepEvent>("agent:step", (e) => callback(e.payload));
 }
 
 export function onAgentDelta(
-  callback: (event: AgentDeltaEvent) => void
+  callback: (event: DeltaEvent) => void
 ): Promise<UnlistenFn> {
-  return listen<AgentDeltaEvent>("agent:delta", (e) => callback(e.payload));
+  return listen<DeltaEvent>("agent:delta", (e) => callback(e.payload));
 }
 
 export function onAgentCompleteEvent(
diff --git a/tests/test_engine.py b/tests/test_engine.py
index 5527bf5f..e9d237a6 100644
--- a/tests/test_engine.py
+++ b/tests/test_engine.py
@@ -152,24 +152,81 @@ def test_meta_text_not_accepted_as_final_answer(self) -> None:
             self.assertEqual(result, "Concrete result delivered.")
             self.assertEqual(engine.last_loop_metrics.get("final_rejections"), 1)
 
-    def test_soft_guardrail_for_repeated_recon(self) -> None:
+    def test_plan_objective_allows_structural_meta_final(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)
-            cfg = AgentConfig(workspace=root, max_depth=1, max_steps_per_call=6, acceptance_criteria=False)
+            cfg = AgentConfig(workspace=root, max_depth=1, max_steps_per_call=2, acceptance_criteria=False)
+            tools = WorkspaceTools(root=root)
+            model = ScriptedModel(
+                scripted_turns=[
+                    ModelTurn(text="Here is my plan for finishing the task.", stop_reason="end_turn"),
+                ]
+            )
+            engine = RLMEngine(model=model, tools=tools, config=cfg)
+            result = engine.solve("Draft a plan for finishing the task")
+            self.assertEqual(result, "Here is my plan for finishing the task.")
+            self.assertEqual(engine.last_loop_metrics.get("final_rejections"), 0)
+
+    def test_plan_objective_still_rejects_strong_process_meta(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(workspace=root, max_depth=1, max_steps_per_call=4, acceptance_criteria=False)
+            tools = WorkspaceTools(root=root)
+            model = ScriptedModel(
+                scripted_turns=[
+                    ModelTurn(text="Here is my plan: I will inspect files and then implement.", stop_reason="end_turn"),
+                    ModelTurn(text="Concrete planning deliverable.", stop_reason="end_turn"),
+                ]
+            )
+            engine = RLMEngine(model=model, tools=tools, config=cfg)
+            result = engine.solve("Write an implementation plan for the fix")
+            self.assertEqual(result, "Concrete planning deliverable.")
+            self.assertEqual(engine.last_loop_metrics.get("final_rejections"), 1)
+
+    def test_soft_guardrail_fires_once_per_recon_episode(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(workspace=root, max_depth=1, max_steps_per_call=7, acceptance_criteria=False)
             tools = WorkspaceTools(root=root)
             model = ScriptedModel(
                 scripted_turns=[
                     ModelTurn(tool_calls=[_tc("list_files")]),
                     ModelTurn(tool_calls=[_tc("search_files", query="x")]),
                     ModelTurn(tool_calls=[_tc("repo_map")]),
+                    ModelTurn(tool_calls=[_tc("list_files")]),
                     ModelTurn(text="done", stop_reason="end_turn"),
                 ]
             )
             engine = RLMEngine(model=model, tools=tools, config=cfg)
             result, ctx = engine.solve_with_context("trigger recon guardrail")
             self.assertEqual(result, "done")
-            self.assertTrue(any("Soft guardrail" in obs for obs in ctx.observations))
-            self.assertGreaterEqual(int(engine.last_loop_metrics.get("guardrail_warnings", 0)), 1)
+            warnings = [obs for obs in ctx.observations if "Soft guardrail" in obs]
+            self.assertEqual(len(warnings), 1)
+            self.assertEqual(int(engine.last_loop_metrics.get("guardrail_warnings", 0)), 1)
+
+    def test_soft_guardrail_resets_for_second_recon_episode(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(workspace=root, max_depth=1, max_steps_per_call=9, acceptance_criteria=False)
+            tools = WorkspaceTools(root=root)
+            model = ScriptedModel(
+                scripted_turns=[
+                    ModelTurn(tool_calls=[_tc("list_files")]),
+                    ModelTurn(tool_calls=[_tc("search_files", query="x")]),
+                    ModelTurn(tool_calls=[_tc("repo_map")]),
+                    ModelTurn(tool_calls=[_tc("write_file", path="artifact.txt", content="data")]),
+                    ModelTurn(tool_calls=[_tc("list_files")]),
+                    ModelTurn(tool_calls=[_tc("search_files", query="x")]),
+                    ModelTurn(tool_calls=[_tc("repo_map")]),
+                    ModelTurn(text="done", stop_reason="end_turn"),
+                ]
+            )
+            engine = RLMEngine(model=model, tools=tools, config=cfg)
+            result, ctx = engine.solve_with_context("trigger two recon episodes")
+            self.assertEqual(result, "done")
+            warnings = [obs for obs in ctx.observations if "Soft guardrail" in obs]
+            self.assertEqual(len(warnings), 2)
+            self.assertEqual(int(engine.last_loop_metrics.get("guardrail_warnings", 0)), 2)
 
 
 class CustomSystemPromptTests(unittest.TestCase):
diff --git a/tests/test_replay_log.py b/tests/test_replay_log.py
index 97d6c837..7f5f528e 100644
--- a/tests/test_replay_log.py
+++ b/tests/test_replay_log.py
@@ -226,6 +226,65 @@ def test_initializes_seq_from_existing_file(self) -> None:
             self.assertIn("messages_delta", calls[-1])
             self.assertEqual(calls[-1]["messages_delta"], [{"role": "assistant", "content": "hello"}])
 
+    def test_force_snapshot_first_call_resets_root_message_latch(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            p = Path(tmpdir) / "replay.jsonl"
+            first = ReplayLogger(path=p, force_snapshot_first_call=True)
+            first.log_call(
+                depth=0,
+                step=1,
+                messages=[{"role": "user", "content": "turn one"}],
+                response={"r": 1},
+            )
+
+            second = ReplayLogger(path=p, force_snapshot_first_call=True)
+            second.log_call(
+                depth=0,
+                step=1,
+                messages=[{"role": "user", "content": "turn two"}],
+                response={"r": 2},
+            )
+
+            calls = [r for r in self._read_records(p) if r.get("type") == "call" and r.get("conversation_id") == "root"]
+            self.assertEqual(calls[0]["seq"], 0)
+            self.assertIn("messages_snapshot", calls[0])
+            self.assertEqual(calls[1]["seq"], 1)
+            self.assertIn("messages_snapshot", calls[1])
+            self.assertNotIn("messages_delta", calls[1])
+
+    def test_force_snapshot_first_call_propagates_to_child_logger(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            p = Path(tmpdir) / "replay.jsonl"
+
+            first = ReplayLogger(path=p, force_snapshot_first_call=True)
+            child_first = first.child(depth=0, step=1)
+            child_first.log_call(
+                depth=1,
+                step=1,
+                messages=[{"role": "user", "content": "child turn one"}],
+                response={"r": 1},
+            )
+
+            second = ReplayLogger(path=p, force_snapshot_first_call=True)
+            child_second = second.child(depth=0, step=1)
+            child_second.log_call(
+                depth=1,
+                step=1,
+                messages=[{"role": "user", "content": "child turn two"}],
+                response={"r": 2},
+            )
+
+            calls = [
+                r
+                for r in self._read_records(p)
+                if r.get("type") == "call" and r.get("conversation_id") == "root/d0s1"
+            ]
+            self.assertEqual(calls[0]["seq"], 0)
+            self.assertIn("messages_snapshot", calls[0])
+            self.assertEqual(calls[1]["seq"], 1)
+            self.assertIn("messages_snapshot", calls[1])
+            self.assertNotIn("messages_delta", calls[1])
+
 
 class ReplayLoggerIntegrationTests(unittest.TestCase):
     def _read_records(self, path: Path) -> list[dict]:
@@ -343,6 +402,37 @@ def test_replay_log_via_runtime(self) -> None:
             self.assertIn("header", types)
             self.assertIn("call", types)
 
+    def test_runtime_second_solve_starts_with_snapshot(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(workspace=root, max_depth=1, max_steps_per_call=4)
+            tools = WorkspaceTools(root=root)
+            model = ScriptedModel(
+                scripted_turns=[
+                    ModelTurn(text="first", stop_reason="end_turn"),
+                    ModelTurn(text="second", stop_reason="end_turn"),
+                ]
+            )
+            engine = RLMEngine(model=model, tools=tools, config=cfg)
+
+            from agent.runtime import SessionRuntime
+
+            runtime = SessionRuntime.bootstrap(engine=engine, config=cfg, session_id="sess-replay-two", resume=False)
+            self.assertEqual(runtime.solve("first objective"), "first")
+            self.assertEqual(runtime.solve("second objective"), "second")
+
+            replay_path = (
+                root / cfg.session_root_dir / "sessions" / runtime.session_id / "replay.jsonl"
+            )
+            records = self._read_records(replay_path)
+            calls = [r for r in records if r.get("type") == "call" and r.get("conversation_id") == "root"]
+            self.assertEqual(len(calls), 2)
+            self.assertEqual(calls[0]["seq"], 0)
+            self.assertIn("messages_snapshot", calls[0])
+            self.assertEqual(calls[1]["seq"], 1)
+            self.assertIn("messages_snapshot", calls[1])
+            self.assertNotIn("messages_delta", calls[1])
+
 
 if __name__ == "__main__":
     unittest.main()
diff --git a/tests/test_turn_summaries.py b/tests/test_turn_summaries.py
index 008f095d..2c7307b8 100644
--- a/tests/test_turn_summaries.py
+++ b/tests/test_turn_summaries.py
@@ -318,6 +318,47 @@ def test_loop_metrics_persisted_and_loaded_additively(self) -> None:
             self.assertEqual(state_after_second["loop_metrics"]["turns"], 2)
             self.assertIn("last_turn", state_after_second["loop_metrics"])
 
+    def test_replay_seq_start_stays_monotonic_and_second_turn_starts_with_snapshot(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = self._make_config(root)
+
+            model1 = ScriptedModel(
+                scripted_turns=[ModelTurn(text="done-1", stop_reason="end_turn")]
+            )
+            engine1 = RLMEngine(model=model1, tools=WorkspaceTools(root=root), config=cfg)
+            rt1 = SessionRuntime.bootstrap(
+                engine=engine1, config=cfg, session_id="sess-replay-boundary", resume=False,
+            )
+            rt1.solve("first turn")
+
+            model2 = ScriptedModel(
+                scripted_turns=[ModelTurn(text="done-2", stop_reason="end_turn")]
+            )
+            engine2 = RLMEngine(model=model2, tools=WorkspaceTools(root=root), config=cfg)
+            rt2 = SessionRuntime.bootstrap(
+                engine=engine2, config=cfg, session_id="sess-replay-boundary", resume=True,
+            )
+            rt2.solve("second turn")
+
+            state_path = root / ".openplanter" / "sessions" / "sess-replay-boundary" / "state.json"
+            state = json.loads(state_path.read_text(encoding="utf-8"))
+            history = state["turn_history"]
+            self.assertEqual(len(history), 2)
+            self.assertLess(history[0]["replay_seq_start"], history[1]["replay_seq_start"])
+
+            replay_path = root / ".openplanter" / "sessions" / "sess-replay-boundary" / "replay.jsonl"
+            records = [
+                json.loads(line)
+                for line in replay_path.read_text(encoding="utf-8").splitlines()
+                if line.strip()
+            ]
+            calls = [r for r in records if r.get("type") == "call" and r.get("conversation_id") == "root"]
+            self.assertEqual(len(calls), 2)
+            self.assertIn("messages_snapshot", calls[0])
+            self.assertIn("messages_snapshot", calls[1])
+            self.assertNotIn("messages_delta", calls[1])
+
     def test_backward_compat_old_state_no_loop_metrics(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)

From 34b8f4aed05aee01ffedb0ee63964df107046eb7 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Fri, 13 Mar 2026 13:03:46 -0400
Subject: [PATCH 19/58] docs: align RFC 0002 with InvestigationState

---
 ...research-normalization-and-action-layer.md | 737 ++++++++++++------
 1 file changed, 490 insertions(+), 247 deletions(-)

diff --git a/docs/rfcs/0002-research-normalization-and-action-layer.md b/docs/rfcs/0002-research-normalization-and-action-layer.md
index 4358f0da..d1e57419 100644
--- a/docs/rfcs/0002-research-normalization-and-action-layer.md
+++ b/docs/rfcs/0002-research-normalization-and-action-layer.md
@@ -1,374 +1,617 @@
-# RFC 0001: Research Normalization and Future Action Layer
+# RFC 0002: Research Normalization and Action Planning Extensions to `InvestigationState`
 
-- **Status:** Draft
+- **Status:** Proposed
 - **Authors:** OpenPlanter contributors
+- **Created:** 2026-03-13
 - **Last Updated:** 2026-03-13
+- **Depends On:** RFC 0001 (`Typed InvestigationState`)
 - **Audience:** Agent/runtime, ontology, and workflow maintainers
 
-## 1) Summary
+## 1. Summary
 
-This RFC defines a two-part architecture for ontology-first investigations:
+RFC 0001 established `investigation_state.json` as the canonical persisted session model for ontology-first investigations. This RFC extends that model with two implementation-ready capabilities:
 
-1. **Research normalization**: all incoming research artifacts (local files, web fetches, transcripts, API responses, search results) are normalized into a single **Evidence** model.
-2. **Future action layer**: unresolved questions derived from evidence/claims become explicit **NextAction** records with expected payoff, required inputs, and provenance-backed rationale.
+1. **Research normalization**: a deterministic adapter contract for turning heterogeneous research inputs into canonical RFC 0001 state updates.
+2. **Action planning**: a deterministic planning contract for turning unresolved questions into ranked, provenance-backed canonical tasks and subsequent executed actions.
 
-The design is intentionally provenance-heavy: every normalized object and every action recommendation must preserve where it came from, when it was observed, and how confident we are in its freshness and relevance.
+This RFC does **not** introduce a second persisted schema for evidence, claims, questions, or actions. The source of truth remains RFC 0001. Stage 5 defines how source-specific ingestion and planning logic project into that canonical state.
 
-## 2) Motivation
+## 2. Relationship to RFC 0001
 
-Investigations currently involve heterogeneous inputs with inconsistent metadata and ad hoc follow-up planning. This causes:
+### 2.1 Source of truth
 
-- brittle downstream extraction/claiming logic,
-- weak comparability between evidence types,
-- missing or lossy provenance,
-- and no unified, inspectable queue of “what to do next.”
+RFC 0001 remains the authoritative persistence contract:
 
-For an ontology-first workflow, we need stable primitives:
+- `investigation_state.json` is the only canonical mutable session state.
+- `events.jsonl` and `replay.jsonl` remain immutable append-only traces.
+- Python and Rust runtimes MUST persist and read canonical objects using RFC 0001 IDs and top-level collections.
 
-- **Evidence** as the canonical atomic observation unit,
-- **Claim** as a typed assertion grounded in evidence,
-- **Question** as explicit uncertainty,
-- **NextAction** as executable resolution path with expected payoff.
+RFC 0002 adds normalization and planning rules for populating these RFC 0001 collections:
 
-## 3) Goals
+- `evidence`
+- `claims`
+- `questions`
+- `tasks`
+- `actions`
+- `provenance_nodes`
+- `confidence_profiles`
 
-1. Define a canonical evidence model that all ingestion paths map to.
-2. Preserve complete provenance chains (source, retrieval, transforms, extractor versions).
-3. Track freshness/temporal validity separately from extraction confidence.
-4. Standardize extracted entities and links between evidence and claims.
-5. Convert unresolved questions into prioritized, auditable next actions.
-6. Keep the model implementation-agnostic enough for CLI and desktop workflows.
+### 2.2 No competing top-level records
 
-## 4) Non-goals
+This RFC intentionally avoids creating new top-level persisted collections such as:
 
-- Prescribing a specific storage backend (SQLite, graph DB, document store).
-- Replacing existing dataset-specific fetchers.
-- Defining UI pixel-level behavior for action rendering.
-- Mandating one ranking model for payoff estimation.
+- `next_actions`
+- `normalized_evidence`
+- `claim_queue`
 
-## 5) Design Principles
+Instead:
 
-1. **Ontology first**: entities, relations, claims, and questions use typed ontology IDs before free-form tags.
-2. **Provenance by default**: no evidence/claim/action without source and processing lineage.
-3. **Lossless normalization**: preserve source-native payloads; add normalized projections.
-4. **Temporal explicitness**: distinguish publication date, retrieval date, and validity window.
-5. **Actionability over verbosity**: unresolved uncertainty should produce concrete, bounded next actions.
-6. **Composable confidence**: extraction confidence, source reliability, and freshness decay are separate signals.
+- a **normalized evidence envelope** is an adapter-side contract that compiles into canonical RFC 0001 `evidence`, `provenance_nodes`, and `confidence_profiles`;
+- a **next action** is a planner concept that compiles into a canonical RFC 0001 `task`;
+- an executed task produces canonical RFC 0001 `actions`.
 
-## 6) Canonical Evidence Model
+### 2.3 Terminology mapping
 
-`Evidence` is the normalized envelope for every incoming artifact.
+For the rest of this RFC:
+
+- **Evidence envelope** means an adapter-produced intermediate structure before canonical persistence.
+- **Canonical evidence** means an entry in `InvestigationState.evidence`.
+- **Next action** means a ranked proposed step before admission to state.
+- **Task** means the admitted planned step stored in `InvestigationState.tasks`.
+- **Action** means an executed step stored in `InvestigationState.actions`.
+
+## 3. Goals
+
+1. Define a single normalization contract that all ingestion paths can implement.
+2. Preserve provenance and derivation without introducing a second persistence model.
+3. Standardize how freshness, source reliability, and extraction confidence feed RFC 0001 `confidence_profiles`.
+4. Standardize how unresolved questions produce canonical `tasks`.
+5. Keep the contract deterministic enough that Python and Rust produce the same state shape from the same inputs.
+6. Keep the design compatible with the ontology-first product vision: evidence -> claims -> questions -> tasks -> actions.
+
+## 4. Non-goals
+
+- Replacing RFC 0001.
+- Defining a storage backend.
+- Defining UI pixel details for action queues or lineage views.
+- Replacing domain-specific fetchers, extractors, or entity-resolution systems.
+- Defining a single universal ranking model beyond the default baseline in this RFC.
+
+## 5. Canonical Extension Rules
+
+### 5.1 Canonical persisted objects
+
+RFC 0002 refines, but does not replace, these RFC 0001 objects:
+
+- `Evidence`
+- `Claim`
+- `Question`
+- `Task`
+- `Action`
+- `ProvenanceNode`
+- `ConfidenceProfile`
+
+### 5.2 Status vocabulary alignment
+
+All runtimes MUST use RFC 0001 status vocabularies when persisting canonical objects.
+
+#### Canonical claim statuses
+
+Claims MUST use:
+
+- `proposed`
+- `supported`
+- `contested`
+- `retracted`
+
+This RFC does **not** introduce `disputed` or `rejected` as canonical claim statuses.
+
+#### Canonical question statuses
+
+Questions MUST use:
+
+- `open`
+- `in_progress`
+- `blocked`
+- `resolved`
+- `won't_fix`
+
+This RFC does **not** introduce `abandoned` as a canonical persisted question status. Planner-side abandonment should persist as `won't_fix`.
+
+#### Canonical task statuses
+
+RFC 0001 left `task.status` open-ended. RFC 0002 standardizes research/planning tasks to:
+
+- `open`
+- `ready`
+- `blocked`
+- `running`
+- `completed`
+- `failed`
+- `superseded`
+- `won't_do`
+
+Executed `actions` continue to record actual outcome and trace references.
+
+## 6. Research Normalization Contract
+
+### 6.1 Adapter-side envelope
+
+Each ingestion path MUST first normalize source material into a temporary adapter-side envelope. This envelope is not a new persisted top-level object; it is a write contract for producing canonical RFC 0001 state updates.
 
 ```yaml
-Evidence:
-  evidence_id: ev_<ULID>
-  kind: [local_file, web_fetch, transcript, api_response, search_result]
-  modality: [text, html, json, pdf, audio, video, table, mixed]
+NormalizedEvidenceEnvelope:
+  envelope_id: nev_<ULID>
+
+  source:
+    kind: [local_file, web_fetch, transcript, api_response, search_result, analyst_note]
+    source_uri: <file://... | https://... | api://provider/endpoint | note://session/...>
+    title: <best available title>
+    publisher: <org/person/system optional>
 
   content:
-    raw_ref: <pointer to immutable raw bytes/blob>
-    normalized_text: <UTF-8 text projection, optional>
-    normalized_structured: <JSON projection, optional>
-    chunks: [
-      {
-        chunk_id: ch_<ULID>,
-        type: [paragraph, table_row, json_path, timestamped_utterance],
-        locator: <offset/span/xpath/jsonpath/timestamp>,
-        text: <chunk text>,
+    raw_ref: <pointer to immutable raw bytes/blob/artifact>
+    normalized_text_ref: <pointer to text projection optional>
+    normalized_structured_ref: <pointer to JSON/table projection optional>
+    primary_excerpt: <short excerpt for canonical Evidence.content>
+    chunks:
+      - chunk_id: ch_<ULID>
+        kind: [paragraph, table_row, json_path, timestamped_utterance, search_hit]
+        locator: <offset/span/xpath/jsonpath/timestamp>
+        text: <chunk text>
         hash: <sha256>
-      }
-    ]
 
   provenance:
-    source_type: [filesystem, http, api, search_index, transcript_pipeline]
-    source_uri: <file://... | https://... | api://provider/endpoint>
-    source_title: <best available title>
-    publisher: <org/person/system>
     acquisition:
-      observed_at: <UTC timestamp>
-      retrieved_at: <UTC timestamp>
-      retrieval_method: <tool + version>
-      request_fingerprint: <canonicalized request hash>
-      response_fingerprint: <response hash/etag>
-    processing_lineage:
-      - stage: [decode, ocr, asr, parse, chunk, extract]
-        tool: <name>
-        version: <semver/git sha>
-        run_id: <pipeline run id>
-        timestamp: <UTC>
+      observed_at: <UTC>
+      retrieved_at: <UTC>
+      method: <tool name>
+      method_version: <semver/git sha>
+      request_fingerprint: <hash optional>
+      response_fingerprint: <hash optional>
+    derivation:
+      parent_evidence_ids: [ev_...]
+      stage: [decode, ocr, asr, parse, chunk, extract, summarize]
+      run_id: <pipeline run id optional>
 
   freshness:
     published_at: <UTC optional>
     effective_from: <UTC optional>
     effective_to: <UTC optional>
     stale_after: <UTC optional>
-    recency_score: <0..1>
     decay_policy: [none, linear, exponential, source_defined]
+    recency_score: <0..1>
 
   reliability:
     source_reliability_score: <0..1>
     extraction_confidence: <0..1>
+    corroboration_score: <0..1 optional>
     integrity:
-      checksum: <sha256>
+      checksum: <sha256 optional>
       signature_verified: <bool optional>
 
-  ontology_links:
-    entities: [
-      {
-        entity_id: ent_<ULID>,
-        ontology_type: <Person|Organization|Asset|Contract|Event|Location|...>,
-        mention_span: <chunk locator>,
-        confidence: <0..1>,
-        resolution_state: [resolved, candidate, unresolved]
-      }
-    ]
-    relations: [
-      {
-        relation_id: rel_<ULID>,
-        predicate: <ontology predicate>,
-        subject_entity_id: ent_...,
-        object_entity_id: ent_...,
-        confidence: <0..1>
-      }
-    ]
+  extraction:
+    entity_mentions: [...]
+    relation_mentions: [...]
+    claim_hints: [...]
+
+  governance:
+    sensitivity: [public, internal, restricted]
+    license: <SPDX or source term optional>
+
+  normalization_version: v1
+```
+
+### 6.2 Required envelope fields
+
+At minimum, adapters MUST provide:
+
+- `source.kind`
+- `source.source_uri`
+- `provenance.acquisition.retrieved_at`
+- one of:
+  - `content.raw_ref`
+  - `content.normalized_text_ref`
+  - `content.normalized_structured_ref`
+- `normalization_version`
+
+### 6.3 Canonical projection into RFC 0001
+
+For each envelope, runtimes MUST project into canonical RFC 0001 state as follows:
 
-  claim_links:
-    supports: [cl_<ULID>]
-    contradicts: [cl_<ULID>]
-    mentions: [cl_<ULID>]
+| Envelope data | Canonical destination |
+| --- | --- |
+| `source.kind`, `primary_excerpt`, source refs | `InvestigationState.evidence[ev_*]` |
+| acquisition + derivation lineage | `InvestigationState.provenance_nodes[prov_*]` |
+| reliability + freshness + corroboration inputs | `InvestigationState.confidence_profiles[conf_*]` |
+| extracted entity mentions / relations | `entities` and `links` updates, when confidence threshold is met |
+| claim hints or verified assertions | `claims` updates |
+| detected uncertainty | `questions` updates |
+
+### 6.4 Canonical `Evidence` extension fields
+
+RFC 0001 defined `Evidence` at a high level. RFC 0002 standardizes these additive fields inside canonical evidence records:
+
+```yaml
+Evidence:
+  id: ev_<ULID>
+  evidence_type: [document, api_response, tool_output, human_note]
+  content: <short normalized excerpt or summary>
+  source_uri: <canonical source URI optional>
+  artifact_path: <workspace/session artifact path optional>
+  event_ref: <events.jsonl ref optional>
+
+  extraction:
+    method: <tool/parser/asr/ocr/extractor>
+    extractor_version: <semver/git sha>
+    span: <primary locator optional>
+    modality: [text, html, json, pdf, audio, video, table, mixed]
+    normalized_text_ref: <artifact/blob ref optional>
+    normalized_structured_ref: <artifact/blob ref optional>
+    chunk_refs: [chunk_id...]
+
+  normalization:
+    kind: [local_file, web_fetch, transcript, api_response, search_result, analyst_note]
+    raw_ref: <artifact/blob ref optional>
+    normalization_version: v1 | legacy-v1
+
+  freshness:
+    published_at: <UTC optional>
+    effective_from: <UTC optional>
+    effective_to: <UTC optional>
+    stale_after: <UTC optional>
+    decay_policy: [none, linear, exponential, source_defined]
+
+  reliability:
+    source_reliability_score: <0..1>
+    extraction_confidence: <0..1>
+    corroboration_score: <0..1 optional>
 
   governance:
     sensitivity: [public, internal, restricted]
-    license: <SPDX or source term>
+    license: <SPDX or source term optional>
+
+  provenance_ids: [prov_...]
+  confidence_id: conf_<...>
 ```
 
-### Required fields
+These fields are additive refinements to RFC 0001, not a second evidence schema.
 
-At minimum: `evidence_id`, `kind`, `provenance.source_uri`, `provenance.acquisition.retrieved_at`, and one content representation (`raw_ref`, `normalized_text`, or `normalized_structured`).
+### 6.5 Broad evidence type mapping
 
-## 7) Source-Specific Normalization Contracts
+To avoid fragmenting canonical types, adapters MUST map source kinds into RFC 0001 `evidence_type` as follows:
 
-Each ingestion path maps into the same `Evidence` envelope with source-specific adapters.
+| Source kind | Canonical `evidence_type` | Canonical `normalization.kind` |
+| --- | --- | --- |
+| `local_file` | `document` | `local_file` |
+| `web_fetch` | `document` | `web_fetch` |
+| `transcript` | `document` | `transcript` |
+| `api_response` | `api_response` | `api_response` |
+| `search_result` | `tool_output` | `search_result` |
+| `analyst_note` | `human_note` | `analyst_note` |
 
-### 7.1 Local files
+This preserves a compact canonical evidence taxonomy while retaining source-specific semantics in `normalization.kind`.
 
-- `kind=local_file`
-- `source_uri=file://<absolute path>`
-- fingerprint from file bytes + inode metadata snapshot
-- if structured file (CSV/JSON/Parquet), populate `normalized_structured`
-- if text-like, also populate `normalized_text` and paragraph chunks
+## 7. Provenance and Derivation
 
-### 7.2 Web fetches
+### 7.1 Canonical provenance nodes
 
-- `kind=web_fetch`
-- `source_uri=https://...` after redirect resolution
-- store HTTP metadata in provenance extension (status, etag, cache-control)
-- keep raw HTML/PDF bytes immutable, plus extracted text projection
-- capture canonical URL and retrieval agent identity
+Every canonical evidence record used by claims or questions MUST reference one or more RFC 0001 provenance nodes.
 
-### 7.3 Transcripts (audio/video/meeting/call)
+At minimum, each envelope MUST produce:
 
-- `kind=transcript`
-- include ASR engine/version in `processing_lineage`
-- chunk type defaults to `timestamped_utterance`
-- provenance should include media source and diarization metadata when available
+1. one acquisition provenance node describing the original source observation/fetch;
+2. one derivation provenance node when the evidence is derived from prior evidence or transformed content.
 
-### 7.4 API responses
+### 7.2 Derivation requirements
 
-- `kind=api_response`
-- `source_uri=api://<provider>/<endpoint>` and request fingerprint
-- normalized structured projection is primary
-- capture pagination context and token scopes in provenance extension
+Derived evidence MUST persist derivation via provenance nodes using RFC 0001 `derived_from_ids[]`.
 
-### 7.5 Search results
+This requirement applies to:
 
-- `kind=search_result`
-- represent each result item as independent evidence with query provenance
-- include ranking metadata (rank, score, provider)
-- link result evidence to follow-up fetched evidence via derivation edges
+- OCR output from PDFs/images
+- ASR output from audio/video
+- extracted chunks from structured or unstructured documents
+- search result records derived from a provider response
+- summaries or transformed projections used for downstream claim extraction
 
-## 8) Provenance and Freshness Semantics
+### 7.3 Search result lineage
 
-### 8.1 Provenance chain
+Search result evidence MUST remain distinct from fetched-page evidence.
 
-Every derived artifact stores:
+If a search result leads to a later fetch:
 
-- parent evidence IDs,
-- transformation stage,
-- tool version,
-- timestamp.
+- the search result remains canonical evidence;
+- the fetched page becomes a second canonical evidence record;
+- derivation/provenance links connect the later fetch to the originating search result.
 
-This enables full replay from claim/action back to raw source.
+This preserves replayability and ranking provenance.
 
-### 8.2 Freshness semantics
+## 8. Confidence and Freshness Composition
 
-Freshness is not binary. We compute:
+### 8.1 Source of truth
 
-- `recency_score` from source-specific decay policy,
-- `stale_after` from explicit source directives if present,
-- investigation-time override for domains where historical records remain valid.
+Raw confidence-related signals may live on canonical `Evidence`, but the authoritative merged score for downstream reasoning MUST be the RFC 0001 `confidence_profile` referenced by `confidence_id`.
 
-Claims should consume freshness as a weighting factor, not a hard validity gate.
+### 8.2 Required confidence dimensions
 
-## 9) Entities, Claims, and Linking
+The canonical confidence profile produced from normalized evidence MUST include these dimensions when available:
 
-## 9.1 Entity extraction and resolution
+- `source_reliability`
+- `extraction_certainty`
+- `recency`
+- `corroboration`
 
-Entity mentions are extracted per chunk and mapped to ontology types. Resolution pipeline states:
+### 8.3 Default composition rule
 
-1. `unresolved` (new mention)
-2. `candidate` (one or more possible canonical entities)
-3. `resolved` (canonical entity assigned)
+Unless an investigation profile explicitly overrides it, runtimes MUST compute:
 
-Each state transition writes provenance (`who/what/when/how`).
+`score = (0.35 * source_reliability) + (0.30 * extraction_certainty) + (0.20 * recency) + (0.15 * corroboration)`
 
-### 9.2 Claim model (minimal)
+Rules:
 
-```yaml
-Claim:
-  claim_id: cl_<ULID>
-  claim_type: <ontology assertion type>
-  subject_entity_id: ent_...
-  predicate: <ontology predicate>
-  object: <entity_id | literal>
-  status: [proposed, supported, disputed, rejected]
-  support_evidence_ids: [ev_...]
-  contradiction_evidence_ids: [ev_...]
-  confidence: <0..1>
-  last_evaluated_at: <UTC>
-```
+- if a dimension is unavailable, treat it as unknown rather than zero;
+- renormalize weights across known dimensions;
+- store both the final score and the per-dimension values in the confidence profile.
+
+### 8.4 Freshness semantics
+
+Freshness affects confidence as a weighting factor, not a hard validity switch, unless the source itself defines an explicit validity window.
 
-Evidence links to claims through `supports`, `contradicts`, or `mentions`.
+Default decay policies:
 
-### 9.3 Contradiction handling
+- `none`: historical facts with stable long-term validity
+- `linear`: slow decay for routine public records
+- `exponential`: rapidly aging operational or news-like data
+- `source_defined`: provider-specific explicit staleness rules
 
-Contradictions are first-class edges, not overwrite events. Investigations should preserve both competing evidence sets and open a resolving question if conflict materially affects conclusions.
+Domain-specific presets may be added later, but all runtimes MUST support the same four baseline policies.
 
-## 10) Unresolved Questions → Next Actions
+## 9. Claims, Questions, and Uncertainty
 
-`Question` records represent uncertainty or missing information; `NextAction` records represent concrete attempts to resolve it.
+### 9.1 Claims
 
-### 10.1 Question model
+Claims generated from normalized evidence MUST persist as RFC 0001 `claims` and MUST follow RFC 0001 invariants:
+
+- `supported` requires at least one support evidence reference;
+- `contested` is used when contradictory evidence materially exists;
+- `retracted` is used when the claim should no longer participate in active reasoning.
+
+### 9.2 Question creation triggers
+
+Runtimes MUST open or update canonical RFC 0001 questions when any of the following occur:
+
+- an entity remains unresolved after resolution attempts;
+- a material claim lacks sufficient supporting evidence;
+- support and contradiction evidence materially conflict;
+- required freshness threshold is not met for a claim-critical evidence set;
+- a task cannot proceed because required inputs are missing.
+
+### 9.3 Canonical question extension fields
+
+RFC 0002 adds these optional question fields:
 
 ```yaml
 Question:
-  question_id: q_<ULID>
-  text: <natural language uncertainty>
-  ontology_scope: [entity_ids, claim_ids, predicates]
-  blocking_level: [critical, high, medium, low]
-  created_from:
+  origin:
     evidence_ids: [ev_...]
     claim_ids: [cl_...]
-  status: [open, in_progress, resolved, abandoned]
+    trigger: [missing_evidence, unresolved_entity, contradiction, freshness_risk, dependency_gap]
 ```
 
-### 10.2 NextAction model
+Canonical question priority remains RFC 0001 `priority`:
+
+- `low`
+- `medium`
+- `high`
+- `critical`
+
+## 10. Action Planning as Canonical Tasks
+
+### 10.1 Core rule
+
+A "next action" is a planner concept, not a persisted top-level schema object.
+
+When admitted to canonical state, a next action MUST be persisted as an RFC 0001 `task`. When executed, that task produces one or more RFC 0001 `actions`.
+
+### 10.2 Canonical task planning extension
+
+RFC 0002 standardizes these additive task fields:
 
 ```yaml
-NextAction:
-  action_id: act_<ULID>
-  question_id: q_<ULID>
-  action_type: [fetch, search, extract, resolve_entity, verify_claim, request_human_input]
-  hypothesis: <what this action aims to confirm/deny>
-
-  required_inputs:
-    required_evidence_kinds: [api_response, web_fetch, ...]
-    required_entities: [ent_...]
-    required_claims: [cl_...]
-    external_dependencies: [api_key:provider, tool:ocr_v2]
-
-  expected_payoff:
-    uncertainty_reduction: <0..1>
-    decision_impact: <0..1>
-    graph_expansion_value: <0..1>
-    estimated_cost: <time/compute/API>
-    payoff_score: <normalized scalar>
-
-  execution:
+Task:
+  title: <short user-facing action description>
+  description: <why this task exists>
+  status: [open, ready, blocked, running, completed, failed, superseded, won't_do]
+  assignee: [agent, human, system]
+  depends_on_task_ids: [task_...]
+  produced_ids: [claim_id | evidence_id | entity_id ...]
+  consumed_ids: [claim_id | evidence_id | entity_id ...]
+  opened_by_question_id: q_<...>
+
+  planning:
+    action_type: [
+      fetch,
+      search,
+      extract,
+      resolve_entity,
+      verify_claim,
+      request_human_input,
+      external_write,
+      monitor
+    ]
+    required_inputs:
+      evidence_ids: [ev_...]
+      entity_ids: [ent_...]
+      claim_ids: [cl_...]
+      external_dependencies: [api_key:provider, tool:ocr_v2]
+    payoff:
+      uncertainty_reduction: <0..1>
+      decision_impact: <0..1>
+      graph_expansion_value: <0..1>
+      estimated_cost: <normalized scalar or structured estimate>
+      payoff_score: <normalized scalar>
     suggested_tools: [web_search, fetch_url, read_file, ...]
     acceptance_criteria:
-      - <objective completion criterion>
+      - <completion criterion>
     stop_conditions:
-      - <condition>
-
-  provenance:
+      - <stop condition>
     generated_by: <planner component + version>
     generated_at: <UTC>
-    based_on_evidence_ids: [ev_...]
-    based_on_claim_ids: [cl_...]
-
-  status: [queued, ready, blocked, running, completed, failed, superseded]
 ```
 
-### 10.3 Payoff scoring guidance
+### 10.3 Task readiness
+
+Task readiness rules:
+
+- `ready`: all required inputs and dependencies are available;
+- `blocked`: one or more required inputs or dependencies are unresolved;
+- `open`: admitted to state but not yet scheduled;
+- `running`: currently being executed;
+- `completed` / `failed` / `superseded` / `won't_do`: closed outcomes.
+
+Blocked tasks SHOULD include dependency hints in `description` or `planning.required_inputs`.
+
+### 10.4 Default payoff scoring
 
-Default heuristic:
+Unless a profile override exists, planners MUST compute:
 
 `payoff_score = (0.45 * uncertainty_reduction) + (0.35 * decision_impact) + (0.20 * graph_expansion_value) - cost_penalty`
 
-Where `cost_penalty` is normalized from estimated resource cost and latency. Weights are configurable by investigation profile.
+Where:
 
-### 10.4 Required input semantics
+- `cost_penalty` is normalized from estimated latency, compute, API spend, and human effort;
+- payoff is advisory for ranking, not a replacement for policy constraints or explicit human ordering.
 
-Actions are only `ready` when all required inputs are available/resolved. Otherwise they remain `blocked` and should emit explicit dependency hints (e.g., “requires canonical entity for vendor alias X”).
+## 11. Executed Actions
 
-## 11) Workflow Integration (Ontology-First Investigation)
+When a task is executed, runtimes MUST persist canonical RFC 0001 `actions` with:
 
-1. Ingest source artifact.
-2. Normalize to `Evidence` + provenance/freshness.
-3. Extract entity mentions and candidate relations.
-4. Generate/update claims with support/contradiction links.
-5. Detect unresolved questions (missing evidence, unresolved entity, contradictory claims).
-6. Materialize ranked `NextAction` queue.
-7. Execute top ready actions; loop until stop criteria are satisfied.
+- `task_id`
+- `action_type`
+- `started_at`
+- `ended_at`
+- `outcome`
+- `event_refs[]`
+- `replay_refs[]`
+- `artifact_paths[]`
 
-Stop criteria examples:
+This is the only canonical record of execution. Planner metadata stays on the task; execution trace stays on actions and append-only logs.
 
-- no critical questions remain,
-- marginal payoff of top action below threshold,
-- time/budget exhausted,
-- human reviewer sign-off.
+## 12. Source-Specific Adapter Rules
 
-## 12) Minimal Implementation Plan
+### 12.1 Local files
 
-### Phase 1: Data contracts
+- MUST produce `normalization.kind=local_file`
+- SHOULD fingerprint raw bytes
+- SHOULD emit paragraph or structured chunks when feasible
 
-- Introduce versioned schema definitions for `Evidence`, `Claim`, `Question`, `NextAction`.
-- Add adapter interfaces for each source kind.
+### 12.2 Web fetches
 
-### Phase 2: Provenance/freshness enforcement
+- MUST preserve the final canonical URL in `source_uri`
+- SHOULD preserve redirect and HTTP metadata in provenance details
+- SHOULD retain raw HTML/PDF bytes plus extracted text projection when possible
 
-- Reject evidence writes missing required provenance fields.
-- Add freshness scoring utility with source-specific decay presets.
+### 12.3 Transcripts
 
-### Phase 3: Question/action engine
+- MUST record ASR engine and version in provenance
+- SHOULD emit `timestamped_utterance` chunks
+- SHOULD persist diarization metadata when available
 
-- Add unresolved-question detector.
-- Add action generator with payoff scoring and dependency gating.
+### 12.4 API responses
 
-### Phase 4: Observability
+- MUST persist request fingerprint and endpoint identity
+- SHOULD retain normalized structured projection as the primary representation
+- SHOULD capture pagination context when relevant
+
+### 12.5 Search results
+
+- MUST persist each result item as separate canonical evidence
+- MUST record provider, rank, and score in provenance or extraction metadata
+- MUST remain distinct from follow-up fetch evidence
+
+### 12.6 Analyst notes
+
+Human-authored notes are standardized as:
+
+- `evidence_type=human_note`
+- `normalization.kind=analyst_note`
+- provenance `source_kind=user_input` or equivalent compatible source
+
+This resolves the earlier ambiguity around modeling notes.
+
+## 13. Workflow Integration
+
+RFC 0002 extends the RFC 0001 lifecycle, not replaces it:
+
+1. **Ingest**: fetch/read/receive source data.
+2. **Normalize**: emit `NormalizedEvidenceEnvelope`.
+3. **Project**: write canonical evidence, provenance nodes, confidence profiles, and derived entities/claims/questions.
+4. **Plan**: rank candidate next actions and admit selected ones as canonical tasks.
+5. **Act**: execute tasks and persist canonical actions plus append-only trace references.
+6. **Review**: recompute claim status, question status, and confidence after new evidence arrives.
+7. **Persist**: atomically update `investigation_state.json`.
+
+## 14. Backward Compatibility and Migration
+
+### 14.1 Legacy adapters
+
+Existing fetch/extract scripts remain valid if they can emit the adapter-side envelope defined here.
+
+### 14.2 Legacy normalization marker
 
-- Add lineage trace views (claim → evidence → raw source).
-- Add action queue diagnostics (why blocked, why ranked).
+Legacy data MUST use:
 
-## 13) Backward Compatibility
+- `Evidence.normalization.normalization_version = legacy-v1`
 
-- Existing fetch/extract scripts remain valid as long as adapters can map their outputs into `Evidence`.
-- Legacy records can be wrapped as `Evidence` with partial fields and `normalization_version=legacy` until reprocessed.
+This replaces the ambiguous earlier `normalization_version=legacy` wording.
 
-## 14) Open Questions
+### 14.3 Migration boundary
 
-1. Should search result evidence always remain separate from fetched page evidence, or be auto-merged when identical URLs/content hashes match?
-2. Which domains require non-decaying freshness (e.g., incorporation date) by default?
-3. Should payoff scoring be globally configured or profile-specific per investigation objective?
-4. How should human-authored notes be modeled: separate `kind=analyst_note` or `local_file` subtype?
+Migration still follows RFC 0001:
 
-## 15) Acceptance Criteria
+- legacy records are projected into canonical `investigation_state.json`;
+- this RFC only refines how evidence and planning fields are populated during that migration and during native operation.
+
+## 15. Minimal Implementation Plan
+
+### Phase 1: Canonical evidence extension
+
+- Add adapter interfaces that emit `NormalizedEvidenceEnvelope`.
+- Extend canonical RFC 0001 `Evidence` writes with `normalization`, `freshness`, `reliability`, and `governance`.
+- Extend canonical provenance and confidence writers to support derivation and confidence composition.
+
+### Phase 2: Claim/question projection
+
+- Project extraction output into canonical `claims`, `questions`, `entities`, and `links`.
+- Enforce RFC 0001 claim and question vocabularies.
+
+### Phase 3: Task planning
+
+- Add planner that ranks candidate next actions.
+- Admit ranked candidates as canonical `tasks` with `planning` metadata.
+- Preserve execution traces as canonical `actions`.
+
+### Phase 4: Observability
+
+- Add lineage views for claim -> evidence -> provenance -> raw source.
+- Add task diagnostics for blocked inputs, ranking rationale, and payoff fields.
+
+## 16. Acceptance Criteria
 
 This RFC is accepted when:
 
-1. Every ingestion pathway can emit schema-valid `Evidence` objects.
-2. Every claim can be traced to one or more evidence items with provenance lineage.
-3. Every open high/critical question has at least one generated `NextAction`.
-4. Action queue exposes payoff and blocked-input explanations.
-5. Replay from action → question → claim → evidence → raw source is possible in tooling.
+1. Every ingestion pathway can emit the adapter-side envelope and persist canonical RFC 0001 evidence/provenance/confidence updates.
+2. No new competing top-level persisted collection is introduced for normalized evidence or next actions.
+3. Every claim persisted from normalized evidence uses RFC 0001 claim statuses and is traceable to canonical evidence plus provenance nodes.
+4. Every high/critical open question can produce at least one canonical task with planning metadata, unless explicitly marked `won't_fix`.
+5. Executed tasks produce canonical actions with event and replay references.
+6. Python and Rust runtimes can project the same source input into materially equivalent canonical state.
+
+## 17. Deferred Questions
+
+The following are intentionally deferred because they do not block the core contract in this RFC:
+
+1. Domain-specific freshness presets beyond the baseline decay policies.
+2. Profile-specific payoff weighting beyond the default baseline.
+3. Whether search-result deduplication should collapse visually in the UI while remaining distinct canonically in state.

From 958cc341a1b6306909d8e9cc79bee82dae8b0a1e Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Fri, 13 Mar 2026 14:02:10 -0400
Subject: [PATCH 20/58] Add typed investigation state persistence

---
 agent/investigation_state.py                  | 301 ++++++
 agent/prompts.py                              |   6 +-
 agent/runtime.py                              |  63 +-
 git-apply-1.txt                               | 946 ++++++++++++++++++
 git-apply-2.txt                               | 809 +++++++++++++++
 git-apply-3.txt                               | 724 ++++++++++++++
 git-apply-4.txt                               | 809 +++++++++++++++
 .../crates/op-core/src/engine/context.rs      | 295 +++++-
 .../op-core/src/engine/investigation_state.rs | 448 +++++++++
 .../crates/op-core/src/engine/mod.rs          |   1 +
 .../crates/op-core/src/prompts.rs             |   6 +-
 tests/test_investigation_state.py             | 206 ++++
 12 files changed, 4597 insertions(+), 17 deletions(-)
 create mode 100644 agent/investigation_state.py
 create mode 100644 git-apply-1.txt
 create mode 100644 git-apply-2.txt
 create mode 100644 git-apply-3.txt
 create mode 100644 git-apply-4.txt
 create mode 100644 openplanter-desktop/crates/op-core/src/engine/investigation_state.rs
 create mode 100644 tests/test_investigation_state.py

diff --git a/agent/investigation_state.py b/agent/investigation_state.py
new file mode 100644
index 00000000..e0324ce7
--- /dev/null
+++ b/agent/investigation_state.py
@@ -0,0 +1,301 @@
+from __future__ import annotations
+
+import copy
+import json
+from datetime import datetime, timezone
+from pathlib import Path
+from typing import Any
+
+SCHEMA_VERSION = "1.0.0"
+ONTOLOGY_NAMESPACE = "openplanter.core"
+ONTOLOGY_VERSION = "2026-03"
+_LEGACY_KNOWN_KEYS = {
+    "session_id",
+    "saved_at",
+    "external_observations",
+    "observations",
+    "turn_history",
+    "loop_metrics",
+}
+
+
+def utc_now_iso() -> str:
+    return datetime.now(timezone.utc).isoformat()
+
+
+def default_state(session_id: str, now: str | None = None) -> dict[str, Any]:
+    ts = now or utc_now_iso()
+    return {
+        "schema_version": SCHEMA_VERSION,
+        "session_id": session_id,
+        "created_at": ts,
+        "updated_at": ts,
+        "objective": "",
+        "ontology": {
+            "namespace": ONTOLOGY_NAMESPACE,
+            "version": ONTOLOGY_VERSION,
+        },
+        "entities": {},
+        "links": {},
+        "claims": {},
+        "evidence": {},
+        "hypotheses": {},
+        "questions": {},
+        "tasks": {},
+        "actions": {},
+        "provenance_nodes": {},
+        "confidence_profiles": {},
+        "timeline": [],
+        "indexes": {
+            "by_external_ref": {},
+            "by_tag": {},
+        },
+        "legacy": {
+            "external_observations": [],
+            "turn_history": [],
+            "loop_metrics": {},
+            "extra_fields": {},
+        },
+    }
+
+
+def normalize_legacy_state(session_id: str, raw_state: dict[str, Any]) -> dict[str, Any]:
+    state = raw_state if isinstance(raw_state, dict) else {}
+    observations = state.get("external_observations")
+    if not isinstance(observations, list):
+        observations = _observations_from_rust_state(state)
+
+    normalized = {
+        "session_id": str(state.get("session_id") or session_id),
+        "saved_at": str(state.get("saved_at") or utc_now_iso()),
+        "external_observations": _string_list(observations),
+        "turn_history": _json_list(state.get("turn_history")),
+        "loop_metrics": _json_object(state.get("loop_metrics")),
+    }
+    normalized.update(_extra_fields_from_legacy_state(state))
+    return normalized
+
+
+def migrate_legacy_state(
+    session_id: str,
+    legacy_state: dict[str, Any],
+    now: str | None = None,
+) -> dict[str, Any]:
+    normalized = normalize_legacy_state(session_id, legacy_state)
+    ts = now or str(normalized.get("saved_at") or utc_now_iso())
+    migrated = default_state(session_id=session_id, now=ts)
+    migrated["updated_at"] = ts
+    migrated["legacy"] = {
+        "external_observations": list(normalized.get("external_observations", [])),
+        "turn_history": _json_list(normalized.get("turn_history")),
+        "loop_metrics": _json_object(normalized.get("loop_metrics")),
+        "extra_fields": {
+            key: value
+            for key, value in normalized.items()
+            if key not in {"session_id", "saved_at", "external_observations", "turn_history", "loop_metrics"}
+        },
+    }
+    return upsert_legacy_observations(migrated, migrated["legacy"]["external_observations"], now=ts)
+
+
+def state_to_legacy_projection(state: dict[str, Any], session_id: str) -> dict[str, Any]:
+    legacy = state.get("legacy", {})
+    legacy_dict = legacy if isinstance(legacy, dict) else {}
+    projected = {
+        "session_id": str(state.get("session_id") or session_id),
+        "saved_at": str(state.get("updated_at") or utc_now_iso()),
+        "external_observations": _legacy_observations_from_state(state),
+        "turn_history": _json_list(legacy_dict.get("turn_history")),
+        "loop_metrics": _json_object(legacy_dict.get("loop_metrics")),
+    }
+    extras = legacy_dict.get("extra_fields")
+    if isinstance(extras, dict):
+        projected.update(copy.deepcopy(extras))
+    return projected
+
+
+def upsert_legacy_observations(
+    state: dict[str, Any],
+    observations: list[str],
+    now: str | None = None,
+) -> dict[str, Any]:
+    ts = now or utc_now_iso()
+    out = copy.deepcopy(state)
+    out.setdefault("schema_version", SCHEMA_VERSION)
+    out.setdefault("session_id", "")
+    out.setdefault("created_at", ts)
+    out["updated_at"] = ts
+    out.setdefault(
+        "ontology",
+        {
+            "namespace": ONTOLOGY_NAMESPACE,
+            "version": ONTOLOGY_VERSION,
+        },
+    )
+    out.setdefault("entities", {})
+    out.setdefault("links", {})
+    out.setdefault("claims", {})
+    out.setdefault("hypotheses", {})
+    out.setdefault("questions", {})
+    out.setdefault("tasks", {})
+    out.setdefault("actions", {})
+    out.setdefault("provenance_nodes", {})
+    out.setdefault("confidence_profiles", {})
+    out.setdefault("timeline", [])
+
+    indexes = out.setdefault("indexes", {})
+    if not isinstance(indexes, dict):
+        indexes = {}
+        out["indexes"] = indexes
+    by_external_ref = indexes.setdefault("by_external_ref", {})
+    if not isinstance(by_external_ref, dict):
+        by_external_ref = {}
+        indexes["by_external_ref"] = by_external_ref
+    indexes.setdefault("by_tag", {})
+
+    legacy = out.setdefault("legacy", {})
+    if not isinstance(legacy, dict):
+        legacy = {}
+        out["legacy"] = legacy
+    legacy["external_observations"] = [str(item) for item in observations]
+    legacy.setdefault("turn_history", [])
+    legacy.setdefault("loop_metrics", {})
+    legacy.setdefault("extra_fields", {})
+
+    evidence = out.setdefault("evidence", {})
+    if not isinstance(evidence, dict):
+        evidence = {}
+        out["evidence"] = evidence
+
+    for index, observation in enumerate(observations):
+        evidence_id = _legacy_evidence_id(index)
+        source_uri = _legacy_source_uri(index)
+        existing = evidence.get(evidence_id)
+        record = existing if isinstance(existing, dict) else {}
+        created_at = str(record.get("created_at") or ts)
+        record.update(
+            {
+                "id": evidence_id,
+                "evidence_type": "legacy_observation",
+                "content": str(observation),
+                "source_uri": source_uri,
+                "normalization": {
+                    "kind": "legacy_observation",
+                    "normalization_version": "legacy-v1",
+                },
+                "provenance_ids": [],
+                "confidence_id": None,
+                "created_at": created_at,
+                "updated_at": ts,
+            }
+        )
+        evidence[evidence_id] = record
+        by_external_ref[source_uri] = evidence_id
+
+    keep_ids = {_legacy_evidence_id(index) for index in range(len(observations))}
+    for evidence_id in list(evidence.keys()):
+        record = evidence.get(evidence_id)
+        if _is_legacy_evidence(evidence_id, record) and evidence_id not in keep_ids:
+            del evidence[evidence_id]
+
+    for key in list(by_external_ref.keys()):
+        value = by_external_ref.get(key)
+        if (
+            isinstance(key, str)
+            and key.startswith("state.json#external_observations[")
+            and isinstance(value, str)
+            and value.startswith("ev_legacy_")
+            and value not in keep_ids
+        ):
+            del by_external_ref[key]
+
+    return out
+
+
+def load_investigation_state(path: Path) -> dict[str, Any]:
+    state = json.loads(path.read_text(encoding="utf-8"))
+    if not isinstance(state, dict):
+        raise json.JSONDecodeError("Investigation state must be a JSON object", str(path), 0)
+    return state
+
+
+def save_investigation_state(path: Path, state: dict[str, Any]) -> None:
+    path.write_text(json.dumps(state, indent=2), encoding="utf-8")
+
+
+def _string_list(value: Any) -> list[str]:
+    if not isinstance(value, list):
+        return []
+    return [str(item) for item in value]
+
+
+def _json_list(value: Any) -> list[Any]:
+    if not isinstance(value, list):
+        return []
+    return copy.deepcopy(value)
+
+
+def _json_object(value: Any) -> dict[str, Any]:
+    if not isinstance(value, dict):
+        return {}
+    return copy.deepcopy(value)
+
+
+def _observations_from_rust_state(state: dict[str, Any]) -> list[str]:
+    observations = state.get("observations")
+    if not isinstance(observations, list):
+        return []
+
+    out: list[str] = []
+    for item in observations:
+        if not isinstance(item, dict):
+            continue
+        content = item.get("content")
+        if isinstance(content, str):
+            out.append(content)
+    return out
+
+
+def _extra_fields_from_legacy_state(state: dict[str, Any]) -> dict[str, Any]:
+    extras: dict[str, Any] = {}
+    for key, value in state.items():
+        if key not in _LEGACY_KNOWN_KEYS:
+            extras[key] = copy.deepcopy(value)
+    return extras
+
+
+def _legacy_observations_from_state(state: dict[str, Any]) -> list[str]:
+    legacy = state.get("legacy", {})
+    if isinstance(legacy, dict):
+        persisted = legacy.get("external_observations")
+        if isinstance(persisted, list):
+            return [str(item) for item in persisted]
+
+    evidence = state.get("evidence", {})
+    if isinstance(evidence, dict):
+        legacy_records: list[tuple[str, str]] = []
+        for evidence_id, record in evidence.items():
+            if not _is_legacy_evidence(str(evidence_id), record):
+                continue
+            content = record.get("content") if isinstance(record, dict) else None
+            if isinstance(content, str):
+                legacy_records.append((str(evidence_id), content))
+        legacy_records.sort(key=lambda item: item[0])
+        return [content for _, content in legacy_records]
+
+    return []
+
+
+def _legacy_evidence_id(index: int) -> str:
+    return f"ev_legacy_{index + 1:06d}"
+
+
+def _legacy_source_uri(index: int) -> str:
+    return f"state.json#external_observations[{index}]"
+
+
+def _is_legacy_evidence(evidence_id: str, record: Any) -> bool:
+    if not evidence_id.startswith("ev_legacy_") or not isinstance(record, dict):
+        return False
+    normalization = record.get("normalization")
+    return isinstance(normalization, dict) and normalization.get("kind") == "legacy_observation"
diff --git a/agent/prompts.py b/agent/prompts.py
index 57129d6b..ee5a892a 100644
--- a/agent/prompts.py
+++ b/agent/prompts.py
@@ -346,8 +346,10 @@
 - {session_dir}/events.jsonl — Trace events log (JSONL). Each record has a
   timestamp, event type ("objective", "trace", "step", "result"), and payload.
   Use this for a lightweight overview of objectives and results without full messages.
-- {session_dir}/state.json — Persisted external context observations from prior turns.
-  This is what feeds the external_context_summary in your initial message.
+- {session_dir}/investigation_state.json — Canonical typed session state with
+  structured evidence plus a legacy projection of prior observations.
+- {session_dir}/state.json — Legacy compatibility projection of session state.
+  This still feeds the external_context_summary in your initial message.
 
 These files grow throughout the session. If you need to recall prior analysis,
 check what you did before, or pick up where you left off, read these logs.
diff --git a/agent/runtime.py b/agent/runtime.py
index 29dd5718..076a8b63 100644
--- a/agent/runtime.py
+++ b/agent/runtime.py
@@ -11,6 +11,14 @@
 
 from .config import AgentConfig
 from .engine import ContentDeltaCallback, ExternalContext, RLMEngine, StepCallback, TurnSummary
+from .investigation_state import (
+    load_investigation_state,
+    migrate_legacy_state,
+    normalize_legacy_state,
+    save_investigation_state,
+    state_to_legacy_projection,
+    upsert_legacy_observations,
+)
 from .replay_log import ReplayLogger
 
 EventCallback = Callable[[str], None]
@@ -53,6 +61,9 @@ def _metadata_path(self, session_id: str) -> Path:
     def _state_path(self, session_id: str) -> Path:
         return self._session_dir(session_id) / "state.json"
 
+    def _investigation_state_path(self, session_id: str) -> Path:
+        return self._session_dir(session_id) / "investigation_state.json"
+
     def _events_path(self, session_id: str) -> Path:
         return self._session_dir(session_id) / "events.jsonl"
 
@@ -135,20 +146,68 @@ def open_session(
         return sid, state, created_new
 
     def load_state(self, session_id: str) -> dict[str, Any]:
+        investigation_path = self._investigation_state_path(session_id)
+        if investigation_path.exists():
+            try:
+                typed_state = load_investigation_state(investigation_path)
+            except json.JSONDecodeError as exc:
+                raise SessionError(
+                    f"Session investigation state is invalid JSON: {investigation_path}"
+                ) from exc
+            return state_to_legacy_projection(typed_state, session_id=session_id)
+
         state_path = self._state_path(session_id)
         if not state_path.exists():
             return {
                 "session_id": session_id,
+                "saved_at": _utc_now(),
                 "external_observations": [],
             }
         try:
-            return json.loads(state_path.read_text(encoding="utf-8"))
+            raw_state = json.loads(state_path.read_text(encoding="utf-8"))
         except json.JSONDecodeError as exc:
             raise SessionError(f"Session state is invalid JSON: {state_path}") from exc
+        if not isinstance(raw_state, dict):
+            raise SessionError(f"Session state must be a JSON object: {state_path}")
+        return normalize_legacy_state(session_id, raw_state)
 
     def save_state(self, session_id: str, state: dict[str, Any]) -> None:
+        normalized_legacy = normalize_legacy_state(session_id, state)
         state_path = self._state_path(session_id)
-        state_path.write_text(json.dumps(state, indent=2), encoding="utf-8")
+        state_path.write_text(json.dumps(normalized_legacy, indent=2), encoding="utf-8")
+
+        investigation_path = self._investigation_state_path(session_id)
+        if investigation_path.exists():
+            try:
+                typed_state = load_investigation_state(investigation_path)
+            except json.JSONDecodeError as exc:
+                raise SessionError(
+                    f"Session investigation state is invalid JSON: {investigation_path}"
+                ) from exc
+        else:
+            typed_state = migrate_legacy_state(session_id=session_id, legacy_state=normalized_legacy)
+
+        typed_state = upsert_legacy_observations(
+            typed_state,
+            normalized_legacy["external_observations"],
+            now=normalized_legacy.get("saved_at"),
+        )
+        legacy = typed_state.setdefault("legacy", {})
+        if not isinstance(legacy, dict):
+            legacy = {}
+            typed_state["legacy"] = legacy
+        legacy["turn_history"] = normalized_legacy.get("turn_history", [])
+        legacy["loop_metrics"] = normalized_legacy.get("loop_metrics", {})
+        legacy["extra_fields"] = {
+            key: value
+            for key, value in normalized_legacy.items()
+            if key not in {"session_id", "saved_at", "external_observations", "turn_history", "loop_metrics"}
+        }
+
+        typed_state["session_id"] = session_id
+        typed_state["updated_at"] = normalized_legacy.get("saved_at", _utc_now())
+        typed_state.setdefault("created_at", typed_state["updated_at"])
+        save_investigation_state(investigation_path, typed_state)
         self._touch_metadata(session_id)
 
     def append_event(self, session_id: str, event_type: str, payload: dict[str, Any]) -> None:
diff --git a/git-apply-1.txt b/git-apply-1.txt
new file mode 100644
index 00000000..2b867b38
--- /dev/null
+++ b/git-apply-1.txt
@@ -0,0 +1,946 @@
+ (cd "$(git rev-parse --show-toplevel)" && git apply --3way <<'EOF' 
+diff --git a/agent/investigation_state.py b/agent/investigation_state.py
+new file mode 100644
+index 0000000000000000000000000000000000000000..b78ed7dbb50c5946f9e6c8f25f3f3b085ac9a7fd
+--- /dev/null
++++ b/agent/investigation_state.py
+@@ -0,0 +1,186 @@
++from __future__ import annotations
++
++import copy
++import json
++from datetime import datetime, timezone
++from pathlib import Path
++from typing import Any
++
++SCHEMA_VERSION = "1.0.0"
++
++
++def utc_now_iso() -> str:
++    return datetime.now(timezone.utc).isoformat()
++
++
++def default_state(session_id: str, now: str | None = None) -> dict[str, Any]:
++    ts = now or utc_now_iso()
++    return {
++        "schema_version": SCHEMA_VERSION,
++        "session_id": session_id,
++        "created_at": ts,
++        "updated_at": ts,
++        "objective": "",
++        "ontology": {"namespace": "openplanter.core", "version": "2026-03"},
++        "entities": {},
++        "links": {},
++        "claims": {},
++        "evidence": {},
++        "hypotheses": {},
++        "questions": {},
++        "tasks": {},
++        "actions": {},
++        "provenance_nodes": {},
++        "confidence_profiles": {},
++        "timeline": [],
++        "indexes": {"by_external_ref": {}, "by_tag": {}},
++        "legacy": {
++            "external_observations": [],
++            "turn_history": [],
++            "loop_metrics": {},
++            "extra_fields": {},
++        },
++    }
++
++
++def _evidence_id(index: int) -> str:
++    return f"ev_legacy_{index + 1:06d}"
++
++
++def _legacy_observations_from_state(state: dict[str, Any]) -> list[str]:
++    legacy = state.get("legacy", {})
++    if isinstance(legacy, dict):
++        persisted = legacy.get("external_observations", [])
++        if isinstance(persisted, list):
++            return [str(item) for item in persisted]
++
++    evidence = state.get("evidence", {})
++    if isinstance(evidence, dict):
++        out: list[str] = []
++        for key in sorted(evidence.keys()):
++            record = evidence.get(key)
++            if not isinstance(record, dict):
++                continue
++            normalization = record.get("normalization", {})
++            if isinstance(normalization, dict) and normalization.get("kind") != "legacy_observation":
++                continue
++            content = record.get("content")
++            if isinstance(content, str):
++                out.append(content)
++        if out:
++            return out
++
++    return []
++
++
++def state_to_legacy_projection(state: dict[str, Any], session_id: str) -> dict[str, Any]:
++    """Project typed InvestigationState into legacy state.json-compatible payload."""
++    legacy = state.get("legacy", {})
++    legacy_dict = legacy if isinstance(legacy, dict) else {}
++    projected = {
++        "session_id": str(state.get("session_id") or session_id),
++        "external_observations": _legacy_observations_from_state(state),
++        "turn_history": legacy_dict.get("turn_history", []),
++        "loop_metrics": legacy_dict.get("loop_metrics", {}),
++    }
++    extras = legacy_dict.get("extra_fields", {})
++    if isinstance(extras, dict):
++        projected.update(extras)
++    return projected
++
++
++def migrate_legacy_state(session_id: str, legacy_state: dict[str, Any], now: str | None = None) -> dict[str, Any]:
++    """Build typed InvestigationState from old state.json payload."""
++    ts = now or utc_now_iso()
++    migrated = default_state(session_id=session_id, now=ts)
++    known_keys = {"session_id", "saved_at", "external_observations", "turn_history", "loop_metrics"}
++    migrated["legacy"] = {
++        "external_observations": list(legacy_state.get("external_observations", []))
++        if isinstance(legacy_state.get("external_observations", []), list)
++        else [],
++        "turn_history": list(legacy_state.get("turn_history", []))
++        if isinstance(legacy_state.get("turn_history", []), list)
++        else [],
++        "loop_metrics": legacy_state.get("loop_metrics", {})
++        if isinstance(legacy_state.get("loop_metrics", {}), dict)
++        else {},
++        "extra_fields": {k: v for k, v in legacy_state.items() if k not in known_keys},
++    }
++
++    observations = migrated["legacy"]["external_observations"]
++    for idx, observation in enumerate(observations):
++        eid = _evidence_id(idx)
++        migrated["evidence"][eid] = {
++            "id": eid,
++            "evidence_type": "legacy_observation",
++            "content": str(observation),
++            "source_uri": f"state.json#external_observations[{idx}]",
++            "normalization": {
++                "kind": "legacy_observation",
++                "normalization_version": "legacy-v1",
++            },
++            "provenance_ids": [],
++            "confidence_id": None,
++            "created_at": ts,
++            "updated_at": ts,
++        }
++    return migrated
++
++
++def upsert_legacy_observations(
++    state: dict[str, Any],
++    observations: list[str],
++    now: str | None = None,
++) -> dict[str, Any]:
++    ts = now or utc_now_iso()
++    out = copy.deepcopy(state)
++    out["updated_at"] = ts
++    legacy = out.setdefault("legacy", {})
++    if not isinstance(legacy, dict):
++        legacy = {}
++        out["legacy"] = legacy
++    legacy["external_observations"] = [str(item) for item in observations]
++    legacy.setdefault("turn_history", [])
++    legacy.setdefault("loop_metrics", {})
++    legacy.setdefault("extra_fields", {})
++
++    evidence = out.setdefault("evidence", {})
++    if not isinstance(evidence, dict):
++        evidence = {}
++        out["evidence"] = evidence
++
++    for idx, observation in enumerate(observations):
++        eid = _evidence_id(idx)
++        existing = evidence.get(eid)
++        record = existing if isinstance(existing, dict) else {}
++        record.update(
++            {
++                "id": eid,
++                "evidence_type": "legacy_observation",
++                "content": str(observation),
++                "source_uri": f"state.json#external_observations[{idx}]",
++                "normalization": {
++                    "kind": "legacy_observation",
++                    "normalization_version": "legacy-v1",
++                },
++                "updated_at": ts,
++            }
++        )
++        record.setdefault("created_at", ts)
++        record.setdefault("provenance_ids", [])
++        record.setdefault("confidence_id", None)
++        evidence[eid] = record
++
++    keep = {_evidence_id(idx) for idx in range(len(observations))}
++    for key in list(evidence.keys()):
++        if key.startswith("ev_legacy_") and key not in keep:
++            del evidence[key]
++    return out
++
++
++def load_investigation_state(path: Path) -> dict[str, Any]:
++    return json.loads(path.read_text(encoding="utf-8"))
++
++
++def save_investigation_state(path: Path, state: dict[str, Any]) -> None:
++    path.write_text(json.dumps(state, indent=2), encoding="utf-8")
+diff --git a/agent/runtime.py b/agent/runtime.py
+index 29dd571854b635b939f1e187f4ffe66d1a027197..2711bff540ad45e2d0b22d2dc6d34879a2a3455a 100644
+--- a/agent/runtime.py
++++ b/agent/runtime.py
+@@ -1,83 +1,93 @@
+ from __future__ import annotations
+ 
+ import json
+ import re
+ import secrets
+ import shutil
+ from dataclasses import dataclass
+ from datetime import datetime, timezone
+ from pathlib import Path
+ from typing import Any, Callable
+ 
+ from .config import AgentConfig
+ from .engine import ContentDeltaCallback, ExternalContext, RLMEngine, StepCallback, TurnSummary
++from .investigation_state import (
++    load_investigation_state,
++    migrate_legacy_state,
++    save_investigation_state,
++    state_to_legacy_projection,
++    upsert_legacy_observations,
++)
+ from .replay_log import ReplayLogger
+ 
+ EventCallback = Callable[[str], None]
+ 
+ 
+ class SessionError(RuntimeError):
+     pass
+ 
+ 
+ def _utc_now() -> str:
+     return datetime.now(timezone.utc).isoformat()
+ 
+ 
+ def _new_session_id() -> str:
+     stamp = datetime.now(timezone.utc).strftime("%Y%m%d-%H%M%S")
+     return f"{stamp}-{secrets.token_hex(3)}"
+ 
+ 
+ def _safe_component(text: str) -> str:
+     return re.sub(r"[^A-Za-z0-9._-]+", "-", text).strip("-") or "artifact"
+ 
+ 
+ @dataclass
+ class SessionStore:
+     workspace: Path
+     session_root_dir: str = ".openplanter"
+ 
+     def __post_init__(self) -> None:
+         self.workspace = self.workspace.expanduser().resolve()
+         self.root = (self.workspace / self.session_root_dir).resolve()
+         self.sessions = self.root / "sessions"
+         self.sessions.mkdir(parents=True, exist_ok=True)
+ 
+     def _session_dir(self, session_id: str) -> Path:
+         return self.sessions / session_id
+ 
+     def _metadata_path(self, session_id: str) -> Path:
+         return self._session_dir(session_id) / "metadata.json"
+ 
+     def _state_path(self, session_id: str) -> Path:
+         return self._session_dir(session_id) / "state.json"
+ 
+     def _events_path(self, session_id: str) -> Path:
+         return self._session_dir(session_id) / "events.jsonl"
+ 
++    def _investigation_state_path(self, session_id: str) -> Path:
++        return self._session_dir(session_id) / "investigation_state.json"
++
+     def _artifacts_dir(self, session_id: str) -> Path:
+         return self._session_dir(session_id) / "artifacts"
+ 
+     def _plan_dir(self, session_id: str) -> Path:
+         """Directory where *.plan.md files live (same as session dir)."""
+         return self._session_dir(session_id)
+ 
+     def latest_session_id(self) -> str | None:
+         session_dirs = [p for p in self.sessions.iterdir() if p.is_dir()]
+         if not session_dirs:
+             return None
+         latest = max(session_dirs, key=lambda p: p.stat().st_mtime)
+         return latest.name
+ 
+     def list_sessions(self, limit: int = 100) -> list[dict[str, Any]]:
+         session_dirs = sorted(
+             (p for p in self.sessions.iterdir() if p.is_dir()),
+             key=lambda p: p.stat().st_mtime,
+             reverse=True,
+         )
+         out: list[dict[str, Any]] = []
+         for path in session_dirs[:limit]:
+             meta_path = path / "metadata.json"
+             meta: dict[str, Any] = {}
+             if meta_path.exists():
+@@ -113,64 +123,90 @@ class SessionStore:
+                 raise SessionError(f"Cannot resume missing session: {sid}")
+         else:
+             if session_dir.exists():
+                 sid = f"{sid}-{secrets.token_hex(2)}"
+                 session_dir = self._session_dir(sid)
+             session_dir.mkdir(parents=True, exist_ok=True)
+             created_new = True
+ 
+         session_dir.mkdir(parents=True, exist_ok=True)
+         self._artifacts_dir(sid).mkdir(parents=True, exist_ok=True)
+ 
+         meta_path = self._metadata_path(sid)
+         if not meta_path.exists():
+             meta = {
+                 "session_id": sid,
+                 "workspace": str(self.workspace),
+                 "created_at": _utc_now(),
+                 "updated_at": _utc_now(),
+             }
+             meta_path.write_text(json.dumps(meta, indent=2), encoding="utf-8")
+ 
+         state = self.load_state(sid)
+         return sid, state, created_new
+ 
+     def load_state(self, session_id: str) -> dict[str, Any]:
++        investigation_path = self._investigation_state_path(session_id)
++        if investigation_path.exists():
++            try:
++                typed = load_investigation_state(investigation_path)
++            except json.JSONDecodeError as exc:
++                raise SessionError(f"Session investigation state is invalid JSON: {investigation_path}") from exc
++            return state_to_legacy_projection(typed, session_id=session_id)
++
+         state_path = self._state_path(session_id)
+         if not state_path.exists():
+             return {
+                 "session_id": session_id,
+                 "external_observations": [],
+             }
+         try:
+             return json.loads(state_path.read_text(encoding="utf-8"))
+         except json.JSONDecodeError as exc:
+             raise SessionError(f"Session state is invalid JSON: {state_path}") from exc
+ 
+     def save_state(self, session_id: str, state: dict[str, Any]) -> None:
+         state_path = self._state_path(session_id)
+         state_path.write_text(json.dumps(state, indent=2), encoding="utf-8")
++        investigation_path = self._investigation_state_path(session_id)
++        if investigation_path.exists():
++            try:
++                investigation_state = load_investigation_state(investigation_path)
++            except json.JSONDecodeError as exc:
++                raise SessionError(f"Session investigation state is invalid JSON: {investigation_path}") from exc
++        else:
++            investigation_state = migrate_legacy_state(session_id=session_id, legacy_state=state)
++        observations = state.get("external_observations", [])
++        obs = [str(x) for x in observations] if isinstance(observations, list) else []
++        updated_investigation_state = upsert_legacy_observations(investigation_state, obs)
++        legacy = updated_investigation_state.setdefault("legacy", {})
++        if isinstance(legacy, dict):
++            legacy["turn_history"] = state.get("turn_history", []) if isinstance(state.get("turn_history", []), list) else []
++            legacy["loop_metrics"] = state.get("loop_metrics", {}) if isinstance(state.get("loop_metrics", {}), dict) else {}
++            known_keys = {"session_id", "saved_at", "external_observations", "turn_history", "loop_metrics"}
++            legacy["extra_fields"] = {k: v for k, v in state.items() if k not in known_keys}
++        save_investigation_state(investigation_path, updated_investigation_state)
+         self._touch_metadata(session_id)
+ 
+     def append_event(self, session_id: str, event_type: str, payload: dict[str, Any]) -> None:
+         event_path = self._events_path(session_id)
+         event = {
+             "ts": _utc_now(),
+             "type": event_type,
+             "payload": payload,
+         }
+         with event_path.open("a", encoding="utf-8") as fh:
+             fh.write(json.dumps(event, ensure_ascii=True) + "\n")
+         self._touch_metadata(session_id)
+ 
+     def write_artifact(
+         self, session_id: str, category: str, name: str, content: str
+     ) -> str:
+         category_safe = _safe_component(category)
+         name_safe = _safe_component(name)
+         artifact_rel = Path("artifacts") / category_safe / name_safe
+         artifact_abs = self._session_dir(session_id) / artifact_rel
+         artifact_abs.parent.mkdir(parents=True, exist_ok=True)
+         artifact_abs.write_text(content, encoding="utf-8")
+         self._touch_metadata(session_id)
+         return artifact_rel.as_posix()
+ 
+diff --git a/openplanter-desktop/crates/op-core/src/engine/context.rs b/openplanter-desktop/crates/op-core/src/engine/context.rs
+index 0b522c2fdd088982f95c0ec18295c58d52a709ec..4a36cb391c3bea41d4721e1ae21b5f4ee7f210e7 100644
+--- a/openplanter-desktop/crates/op-core/src/engine/context.rs
++++ b/openplanter-desktop/crates/op-core/src/engine/context.rs
+@@ -1,129 +1,211 @@
+ // External context and turn summary types for multi-turn sessions.
+ 
+ use serde::{Deserialize, Serialize};
+ use std::path::Path;
+ use tokio::fs;
+ 
++use super::investigation_state::InvestigationState;
++
+ /// Summary of a completed turn for inclusion in subsequent prompts.
+ #[derive(Debug, Clone, Serialize, Deserialize)]
+ pub struct TurnSummary {
+     pub turn_number: u32,
+     pub objective: String,
+     pub result_preview: String,
+     pub timestamp: String,
+     pub steps_used: u32,
+     pub replay_seq_start: u64,
+ }
+ 
+ /// External context observations persisted to state.json.
+ #[derive(Debug, Clone, Serialize, Deserialize)]
+ pub struct ExternalContext {
+     pub observations: Vec<Observation>,
+ }
+ 
+ /// A single observation from an external source.
+ #[derive(Debug, Clone, Serialize, Deserialize)]
+ pub struct Observation {
+     pub source: String,
+     pub timestamp: String,
+     pub content: String,
+ }
+ 
+ impl ExternalContext {
+     pub fn new() -> Self {
+         Self {
+             observations: vec![],
+         }
+     }
+ 
+     /// Add a new observation with the current timestamp.
+     pub fn add_observation(&mut self, source: &str, content: &str) {
+         self.observations.push(Observation {
+             source: source.to_string(),
+             timestamp: chrono::Utc::now().to_rfc3339(),
+             content: content.to_string(),
+         });
+     }
+ 
+-    /// Load external context from state.json in the session directory.
++    /// Load external context from investigation_state.json or state.json in the session directory.
+     pub async fn load(session_dir: &Path) -> std::io::Result<Self> {
+-        let path = session_dir.join("state.json");
+-        if !path.exists() {
++        let investigation_path = session_dir.join("investigation_state.json");
++        if investigation_path.exists() {
++            let content = fs::read_to_string(&investigation_path).await?;
++            let typed: InvestigationState = serde_json::from_str(&content)
++                .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
++            let observations = typed
++                .legacy
++                .external_observations
++                .iter()
++                .map(|text| Observation {
++                    source: "legacy".to_string(),
++                    timestamp: String::new(),
++                    content: text.clone(),
++                })
++                .collect();
++            return Ok(Self { observations });
++        }
++
++        let state_path = session_dir.join("state.json");
++        if !state_path.exists() {
+             return Ok(Self::new());
+         }
+-        let content = fs::read_to_string(&path).await?;
+-        serde_json::from_str(&content)
+-            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))
++        let content = fs::read_to_string(&state_path).await?;
++        let value: serde_json::Value = serde_json::from_str(&content)
++            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
++
++        if value.get("observations").is_some() {
++            let parsed: ExternalContext = serde_json::from_value(value)
++                .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
++            return Ok(parsed);
++        }
++
++        let legacy_observations = value
++            .get("external_observations")
++            .and_then(|v| v.as_array())
++            .map(|arr| {
++                arr.iter()
++                    .filter_map(|item| item.as_str())
++                    .map(|text| Observation {
++                        source: "legacy".to_string(),
++                        timestamp: String::new(),
++                        content: text.to_string(),
++                    })
++                    .collect::<Vec<_>>()
++            })
++            .unwrap_or_default();
++
++        Ok(Self {
++            observations: legacy_observations,
++        })
+     }
+ 
+-    /// Save external context to state.json in the session directory.
++    /// Save external context to state.json and typed investigation_state.json.
+     pub async fn save(&self, session_dir: &Path) -> std::io::Result<()> {
+-        let path = session_dir.join("state.json");
+-        let json = serde_json::to_string_pretty(self)
++        let state_path = session_dir.join("state.json");
++        let session_id = session_dir
++            .file_name()
++            .and_then(|s| s.to_str())
++            .unwrap_or_default();
++
++        let mut typed = InvestigationState::new(session_id);
++        typed.legacy.external_observations = self
++            .observations
++            .iter()
++            .map(|o| o.content.clone())
++            .collect::<Vec<_>>();
++        typed.upsert_legacy_observations();
++
++        let legacy_json = serde_json::to_string_pretty(&typed.to_legacy_state_json())
++            .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
++        fs::write(&state_path, legacy_json).await?;
++
++        let investigation_path = session_dir.join("investigation_state.json");
++        let typed_json = serde_json::to_string_pretty(&typed)
+             .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
+-        fs::write(&path, json).await
++        fs::write(&investigation_path, typed_json).await
+     }
+ }
+ 
+ impl Default for ExternalContext {
+     fn default() -> Self {
+         Self::new()
+     }
+ }
+ 
+ #[cfg(test)]
+ mod tests {
+     use super::*;
+     use tempfile::tempdir;
+ 
+     #[test]
+     fn test_new_context_empty() {
+         let ctx = ExternalContext::new();
+         assert!(ctx.observations.is_empty());
+     }
+ 
+     #[test]
+     fn test_add_observation() {
+         let mut ctx = ExternalContext::new();
+         ctx.add_observation("wiki", "Found entity Acme Corp");
+         assert_eq!(ctx.observations.len(), 1);
+         assert_eq!(ctx.observations[0].source, "wiki");
+         assert_eq!(ctx.observations[0].content, "Found entity Acme Corp");
+         assert!(!ctx.observations[0].timestamp.is_empty());
+     }
+ 
+     #[tokio::test]
+     async fn test_save_and_load() {
+         let tmp = tempdir().unwrap();
+         let mut ctx = ExternalContext::new();
+         ctx.add_observation("wiki", "test observation");
+         ctx.save(tmp.path()).await.unwrap();
+ 
+         let loaded = ExternalContext::load(tmp.path()).await.unwrap();
+         assert_eq!(loaded.observations.len(), 1);
+         assert_eq!(loaded.observations[0].content, "test observation");
++
++        let typed = fs::read_to_string(tmp.path().join("investigation_state.json"))
++            .await
++            .unwrap();
++        assert!(typed.contains("\"schema_version\""));
+     }
+ 
+     #[tokio::test]
+     async fn test_load_missing_returns_empty() {
+         let tmp = tempdir().unwrap();
+         let ctx = ExternalContext::load(tmp.path()).await.unwrap();
+         assert!(ctx.observations.is_empty());
+     }
+ 
++    #[tokio::test]
++    async fn test_load_legacy_state_json() {
++        let tmp = tempdir().unwrap();
++        fs::write(
++            tmp.path().join("state.json"),
++            r#"{"session_id":"x","external_observations":["one","two"]}"#,
++        )
++        .await
++        .unwrap();
++        let ctx = ExternalContext::load(tmp.path()).await.unwrap();
++        assert_eq!(ctx.observations.len(), 2);
++        assert_eq!(ctx.observations[0].content, "one");
++    }
++
+     #[test]
+     fn test_turn_summary_serialization() {
+         let ts = TurnSummary {
+             turn_number: 1,
+             objective: "Investigate Acme Corp".into(),
+             result_preview: "Found connections to...".into(),
+             timestamp: "2026-01-01T00:00:00Z".into(),
+             steps_used: 3,
+             replay_seq_start: 1,
+         };
+         let json = serde_json::to_string(&ts).unwrap();
+         let parsed: TurnSummary = serde_json::from_str(&json).unwrap();
+         assert_eq!(parsed.turn_number, 1);
+         assert_eq!(parsed.objective, "Investigate Acme Corp");
+     }
+ }
+diff --git a/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs b/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs
+new file mode 100644
+index 0000000000000000000000000000000000000000..6029dde612e3d1d3ea6673aa96d5317496826a09
+--- /dev/null
++++ b/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs
+@@ -0,0 +1,202 @@
++use chrono::Utc;
++use serde::{Deserialize, Serialize};
++use std::collections::BTreeMap;
++
++const SCHEMA_VERSION: &str = "1.0.0";
++
++#[derive(Debug, Clone, Serialize, Deserialize, Default)]
++pub struct InvestigationState {
++    #[serde(default = "default_schema_version")]
++    pub schema_version: String,
++    #[serde(default)]
++    pub session_id: String,
++    #[serde(default)]
++    pub created_at: String,
++    #[serde(default)]
++    pub updated_at: String,
++    #[serde(default)]
++    pub objective: String,
++    #[serde(default = "default_ontology")]
++    pub ontology: Ontology,
++    #[serde(default)]
++    pub entities: BTreeMap<String, serde_json::Value>,
++    #[serde(default)]
++    pub links: BTreeMap<String, serde_json::Value>,
++    #[serde(default)]
++    pub claims: BTreeMap<String, serde_json::Value>,
++    #[serde(default)]
++    pub evidence: BTreeMap<String, serde_json::Value>,
++    #[serde(default)]
++    pub hypotheses: BTreeMap<String, serde_json::Value>,
++    #[serde(default)]
++    pub questions: BTreeMap<String, serde_json::Value>,
++    #[serde(default)]
++    pub tasks: BTreeMap<String, serde_json::Value>,
++    #[serde(default)]
++    pub actions: BTreeMap<String, serde_json::Value>,
++    #[serde(default)]
++    pub provenance_nodes: BTreeMap<String, serde_json::Value>,
++    #[serde(default)]
++    pub confidence_profiles: BTreeMap<String, serde_json::Value>,
++    #[serde(default)]
++    pub timeline: Vec<serde_json::Value>,
++    #[serde(default)]
++    pub indexes: Indexes,
++    #[serde(default)]
++    pub legacy: LegacyState,
++}
++
++#[derive(Debug, Clone, Serialize, Deserialize, Default)]
++pub struct Ontology {
++    pub namespace: String,
++    pub version: String,
++}
++
++#[derive(Debug, Clone, Serialize, Deserialize, Default)]
++pub struct Indexes {
++    #[serde(default)]
++    pub by_external_ref: BTreeMap<String, serde_json::Value>,
++    #[serde(default)]
++    pub by_tag: BTreeMap<String, serde_json::Value>,
++}
++
++#[derive(Debug, Clone, Serialize, Deserialize, Default)]
++pub struct LegacyState {
++    #[serde(default)]
++    pub external_observations: Vec<String>,
++    #[serde(default)]
++    pub turn_history: Vec<serde_json::Value>,
++    #[serde(default)]
++    pub loop_metrics: serde_json::Map<String, serde_json::Value>,
++}
++
++fn default_ontology() -> Ontology {
++    Ontology {
++        namespace: "openplanter.core".to_string(),
++        version: "2026-03".to_string(),
++    }
++}
++
++fn default_schema_version() -> String {
++    SCHEMA_VERSION.to_string()
++}
++
++fn now() -> String {
++    Utc::now().to_rfc3339()
++}
++
++fn evidence_id(index: usize) -> String {
++    format!("ev_legacy_{:06}", index + 1)
++}
++
++impl InvestigationState {
++    pub fn new(session_id: &str) -> Self {
++        let ts = now();
++        Self {
++            schema_version: default_schema_version(),
++            session_id: session_id.to_string(),
++            created_at: ts.clone(),
++            updated_at: ts,
++            objective: String::new(),
++            ontology: default_ontology(),
++            entities: BTreeMap::new(),
++            links: BTreeMap::new(),
++            claims: BTreeMap::new(),
++            evidence: BTreeMap::new(),
++            hypotheses: BTreeMap::new(),
++            questions: BTreeMap::new(),
++            tasks: BTreeMap::new(),
++            actions: BTreeMap::new(),
++            provenance_nodes: BTreeMap::new(),
++            confidence_profiles: BTreeMap::new(),
++            timeline: vec![],
++            indexes: Indexes::default(),
++            legacy: LegacyState::default(),
++        }
++    }
++
++    pub fn from_legacy_state_json(session_id: &str, legacy_json: &serde_json::Value) -> Self {
++        let mut state = Self::new(session_id);
++        let observations = legacy_json
++            .get("external_observations")
++            .and_then(|v| v.as_array())
++            .map(|arr| arr.iter().filter_map(|v| v.as_str().map(|s| s.to_string())).collect())
++            .unwrap_or_default();
++        state.legacy.external_observations = observations;
++        state.legacy.turn_history = legacy_json
++            .get("turn_history")
++            .and_then(|v| v.as_array().cloned())
++            .unwrap_or_default();
++        state.legacy.loop_metrics = legacy_json
++            .get("loop_metrics")
++            .and_then(|v| v.as_object().cloned())
++            .unwrap_or_default();
++        state.upsert_legacy_observations();
++        state
++    }
++
++    pub fn upsert_legacy_observations(&mut self) {
++        let ts = now();
++        self.updated_at = ts.clone();
++        for (idx, content) in self.legacy.external_observations.iter().enumerate() {
++            let id = evidence_id(idx);
++            let mut value = serde_json::Map::new();
++            value.insert("id".to_string(), serde_json::Value::String(id.clone()));
++            value.insert("evidence_type".to_string(), serde_json::Value::String("legacy_observation".to_string()));
++            value.insert("content".to_string(), serde_json::Value::String(content.clone()));
++            value.insert(
++                "source_uri".to_string(),
++                serde_json::Value::String(format!("state.json#external_observations[{}]", idx)),
++            );
++            value.insert(
++                "normalization".to_string(),
++                serde_json::json!({"kind": "legacy_observation", "normalization_version": "legacy-v1"}),
++            );
++            value.insert("provenance_ids".to_string(), serde_json::json!([]));
++            value.insert("confidence_id".to_string(), serde_json::Value::Null);
++            value.insert("updated_at".to_string(), serde_json::Value::String(ts.clone()));
++            if let Some(existing) = self.evidence.get(&id).and_then(|v| v.as_object()) {
++                if let Some(created_at) = existing.get("created_at") {
++                    value.insert("created_at".to_string(), created_at.clone());
++                }
++            }
++            value
++                .entry("created_at".to_string())
++                .or_insert_with(|| serde_json::Value::String(ts.clone()));
++            self.evidence.insert(id, serde_json::Value::Object(value));
++        }
++
++        let keep: std::collections::BTreeSet<String> = (0..self.legacy.external_observations.len())
++            .map(evidence_id)
++            .collect();
++        self.evidence
++            .retain(|k, _| !k.starts_with("ev_legacy_") || keep.contains(k));
++    }
++
++    pub fn to_legacy_state_json(&self) -> serde_json::Value {
++        serde_json::json!({
++            "session_id": self.session_id,
++            "external_observations": self.legacy.external_observations,
++            "turn_history": self.legacy.turn_history,
++            "loop_metrics": self.legacy.loop_metrics,
++        })
++    }
++}
++
++#[cfg(test)]
++mod tests {
++    use super::*;
++
++    #[test]
++    fn migrates_legacy_observations_into_evidence() {
++        let legacy = serde_json::json!({
++            "external_observations": ["obs1", "obs2"],
++            "turn_history": [],
++            "loop_metrics": {}
++        });
++        let state = InvestigationState::from_legacy_state_json("sid", &legacy);
++        assert_eq!(state.legacy.external_observations.len(), 2);
++        assert!(state.evidence.contains_key("ev_legacy_000001"));
++        assert!(state.evidence.contains_key("ev_legacy_000002"));
++    }
++}
+diff --git a/openplanter-desktop/crates/op-core/src/engine/mod.rs b/openplanter-desktop/crates/op-core/src/engine/mod.rs
+index cf274420c1b8df43c7524e4b5f06ff57311f4609..5c5cf0bec2268f63328f7150232fe0614b30221d 100644
+--- a/openplanter-desktop/crates/op-core/src/engine/mod.rs
++++ b/openplanter-desktop/crates/op-core/src/engine/mod.rs
+@@ -1,33 +1,34 @@
+ // Recursive language model engine.
+ //
+ // Provides the SolveEmitter trait, demo_solve, and a real solve flow
+ // with a multi-step agentic loop that executes tool calls.
+ 
+ pub mod context;
+ pub mod curator;
+ pub mod judge;
++pub mod investigation_state;
+ 
+ use std::time::Duration;
+ 
+ use anyhow::anyhow;
+ use tokio::sync::mpsc;
+ use tokio::task::JoinHandle;
+ use tokio_util::sync::CancellationToken;
+ 
+ use crate::builder::build_model;
+ use crate::config::AgentConfig;
+ use crate::events::{DeltaEvent, DeltaKind, LoopMetrics, LoopPhase, StepEvent, TokenUsage};
+ use crate::model::{BaseModel, Message, ModelTurn, RateLimitError};
+ use crate::prompts::build_system_prompt;
+ use crate::tools::WorkspaceTools;
+ use crate::tools::defs::build_tool_defs;
+ 
+ use self::curator::{CuratorResult, extract_step_context, run_curator};
+ 
+ /// Outcome from a background curator task (success or error).
+ enum CuratorOutcome {
+     Done(CuratorResult),
+     Error(String),
+ }
+ 
+ fn spawn_curator_task(
+diff --git a/tests/test_investigation_state.py b/tests/test_investigation_state.py
+new file mode 100644
+index 0000000000000000000000000000000000000000..339067cf5e3ad2917b8b8f164ab01c125962b72c
+--- /dev/null
++++ b/tests/test_investigation_state.py
+@@ -0,0 +1,82 @@
++from __future__ import annotations
++
++import json
++import tempfile
++import unittest
++from pathlib import Path
++
++from agent.investigation_state import (
++    migrate_legacy_state,
++    state_to_legacy_projection,
++    upsert_legacy_observations,
++)
++from agent.runtime import SessionStore
++
++
++class InvestigationStateMigrationTests(unittest.TestCase):
++    def test_migrate_legacy_state_adds_structured_evidence(self) -> None:
++        legacy = {
++            "session_id": "sid",
++            "external_observations": ["obs a", "obs b"],
++            "turn_history": [{"turn_number": 1}],
++            "loop_metrics": {"turns": 1},
++        }
++        state = migrate_legacy_state("sid", legacy, now="2026-03-13T00:00:00+00:00")
++        self.assertEqual(state["schema_version"], "1.0.0")
++        self.assertEqual(state["legacy"]["external_observations"], ["obs a", "obs b"])
++        self.assertIn("ev_legacy_000001", state["evidence"])
++        self.assertEqual(state["evidence"]["ev_legacy_000002"]["content"], "obs b")
++
++    def test_projection_back_to_legacy_state_prefers_legacy_block(self) -> None:
++        state = migrate_legacy_state("sid", {"external_observations": ["obs a"]})
++        projected = state_to_legacy_projection(state, session_id="sid")
++        self.assertEqual(projected["external_observations"], ["obs a"])
++        self.assertIn("session_id", projected)
++
++    def test_upsert_rewrites_and_prunes_legacy_evidence(self) -> None:
++        state = migrate_legacy_state("sid", {"external_observations": ["old1", "old2"]})
++        updated = upsert_legacy_observations(state, ["new1"])
++        self.assertIn("ev_legacy_000001", updated["evidence"])
++        self.assertNotIn("ev_legacy_000002", updated["evidence"])
++        self.assertEqual(updated["evidence"]["ev_legacy_000001"]["content"], "new1")
++
++
++class SessionStoreTypedStateTests(unittest.TestCase):
++    def test_save_state_writes_investigation_state_json(self) -> None:
++        with tempfile.TemporaryDirectory() as tmp:
++            root = Path(tmp)
++            store = SessionStore(workspace=root)
++            sid, _, _ = store.open_session(session_id="typed-save", resume=False)
++            store.save_state(
++                sid,
++                {
++                    "session_id": sid,
++                    "external_observations": ["alpha", "beta"],
++                    "turn_history": [{"turn_number": 1}],
++                    "loop_metrics": {"turns": 1},
++                },
++            )
++
++            typed_path = root / ".openplanter" / "sessions" / sid / "investigation_state.json"
++            self.assertTrue(typed_path.exists())
++            typed = json.loads(typed_path.read_text(encoding="utf-8"))
++            self.assertEqual(typed["legacy"]["external_observations"], ["alpha", "beta"])
++            self.assertEqual(typed["evidence"]["ev_legacy_000001"]["content"], "alpha")
++
++    def test_load_state_reads_from_typed_state_when_present(self) -> None:
++        with tempfile.TemporaryDirectory() as tmp:
++            root = Path(tmp)
++            store = SessionStore(workspace=root)
++            sid, _, _ = store.open_session(session_id="typed-load", resume=False)
++            store.save_state(sid, {"session_id": sid, "external_observations": ["typed obs"]})
++
++            # Corrupt legacy file contents to verify typed file is source of truth for loading.
++            state_path = root / ".openplanter" / "sessions" / sid / "state.json"
++            state_path.write_text("{}", encoding="utf-8")
++
++            loaded = store.load_state(sid)
++            self.assertEqual(loaded["external_observations"], ["typed obs"])
++
++
++if __name__ == "__main__":
++    unittest.main()
+ 
+EOF
+)
\ No newline at end of file
diff --git a/git-apply-2.txt b/git-apply-2.txt
new file mode 100644
index 00000000..b13d5066
--- /dev/null
+++ b/git-apply-2.txt
@@ -0,0 +1,809 @@
+ (cd "$(git rev-parse --show-toplevel)" && git apply --3way <<'EOF'
+diff --git a/agent/investigation_state.py b/agent/investigation_state.py
+new file mode 100644
+index 0000000000000000000000000000000000000000..47556b48e13dc7f69baac973b580a4b61a388acd
+--- /dev/null
++++ b/agent/investigation_state.py
+@@ -0,0 +1,150 @@
++from __future__ import annotations
++
++import hashlib
++from datetime import datetime, timezone
++from typing import Any
++
++
++SCHEMA_VERSION = "1.0.0"
++ONTOLOGY_NAMESPACE = "openplanter.core"
++ONTOLOGY_VERSION = "2026-03"
++
++
++def _utc_now() -> str:
++    return datetime.now(timezone.utc).isoformat()
++
++
++def _stable_observation_evidence_id(observation: str) -> str:
++    digest = hashlib.sha256(observation.encode("utf-8")).hexdigest()[:24]
++    return f"ev_legacy_{digest}"
++
++
++def empty_investigation_state(session_id: str) -> dict[str, Any]:
++    now = _utc_now()
++    return {
++        "schema_version": SCHEMA_VERSION,
++        "session_id": session_id,
++        "created_at": now,
++        "updated_at": now,
++        "objective": "",
++        "ontology": {"namespace": ONTOLOGY_NAMESPACE, "version": ONTOLOGY_VERSION},
++        "entities": {},
++        "links": {},
++        "claims": {},
++        "evidence": {},
++        "hypotheses": {},
++        "questions": {},
++        "tasks": {},
++        "actions": {},
++        "provenance_nodes": {},
++        "confidence_profiles": {},
++        "timeline": [],
++        "indexes": {"by_external_ref": {}, "by_tag": {}},
++        "legacy": {
++            "external_observations": [],
++            "turn_history": [],
++            "loop_metrics": {},
++            "compat_fields": {},
++        },
++    }
++
++
++def _ensure_defaults(state: dict[str, Any], session_id: str) -> dict[str, Any]:
++    base = empty_investigation_state(session_id)
++    for key, value in base.items():
++        state.setdefault(key, value)
++    state.setdefault("ontology", {}).setdefault("namespace", ONTOLOGY_NAMESPACE)
++    state.setdefault("ontology", {}).setdefault("version", ONTOLOGY_VERSION)
++    state.setdefault("indexes", {}).setdefault("by_external_ref", {})
++    state.setdefault("indexes", {}).setdefault("by_tag", {})
++    state.setdefault("legacy", {}).setdefault("external_observations", [])
++    state.setdefault("legacy", {}).setdefault("turn_history", [])
++    state.setdefault("legacy", {}).setdefault("loop_metrics", {})
++    state.setdefault("legacy", {}).setdefault("compat_fields", {})
++    return state
++
++
++def migrate_legacy_state(session_id: str, legacy_state: dict[str, Any]) -> dict[str, Any]:
++    state = empty_investigation_state(session_id)
++    observations = legacy_state.get("external_observations", [])
++    obs_list = [str(x) for x in observations] if isinstance(observations, list) else []
++    turn_history = legacy_state.get("turn_history", [])
++    loop_metrics = legacy_state.get("loop_metrics", {})
++    state["legacy"]["external_observations"] = obs_list
++    state["legacy"]["turn_history"] = turn_history if isinstance(turn_history, list) else []
++    state["legacy"]["loop_metrics"] = loop_metrics if isinstance(loop_metrics, dict) else {}
++    state["legacy"]["compat_fields"] = {
++        k: v
++        for k, v in legacy_state.items()
++        if k not in {"session_id", "saved_at", "external_observations", "turn_history", "loop_metrics"}
++    }
++
++    for obs in obs_list:
++        ev_id = _stable_observation_evidence_id(obs)
++        state["evidence"][ev_id] = {
++            "id": ev_id,
++            "evidence_type": "tool_output",
++            "content": obs,
++            "normalization": {
++                "kind": "analyst_note",
++                "normalization_version": "legacy-v1",
++            },
++            "provenance_ids": [],
++            "confidence_id": None,
++            "created_at": _utc_now(),
++            "updated_at": _utc_now(),
++        }
++        state["indexes"]["by_external_ref"][f"legacy_observation_sha256:{ev_id}"] = ev_id
++    return state
++
++
++def update_with_legacy_fields(
++    state: dict[str, Any],
++    session_id: str,
++    observations: list[str],
++    turn_history: list[dict[str, Any]] | None,
++    loop_metrics: dict[str, Any] | None,
++) -> dict[str, Any]:
++    st = _ensure_defaults(state, session_id)
++    st["session_id"] = session_id
++    if not st.get("created_at"):
++        st["created_at"] = _utc_now()
++    st["updated_at"] = _utc_now()
++    st["legacy"]["external_observations"] = observations
++    st["legacy"]["turn_history"] = turn_history or []
++    st["legacy"]["loop_metrics"] = loop_metrics or {}
++
++    st["legacy"].setdefault("compat_fields", {})
++
++    for obs in observations:
++        ev_id = _stable_observation_evidence_id(obs)
++        if ev_id in st["evidence"]:
++            continue
++        st["evidence"][ev_id] = {
++            "id": ev_id,
++            "evidence_type": "tool_output",
++            "content": obs,
++            "normalization": {
++                "kind": "analyst_note",
++                "normalization_version": "legacy-v1",
++            },
++            "provenance_ids": [],
++            "confidence_id": None,
++            "created_at": _utc_now(),
++            "updated_at": _utc_now(),
++        }
++    return st
++
++
++def with_legacy_compat_aliases(state: dict[str, Any]) -> dict[str, Any]:
++    out = dict(state)
++    legacy = out.get("legacy", {}) if isinstance(out, dict) else {}
++    if isinstance(legacy, dict):
++        out["external_observations"] = legacy.get("external_observations", [])
++        out["turn_history"] = legacy.get("turn_history", [])
++        out["loop_metrics"] = legacy.get("loop_metrics", {})
++        compat = legacy.get("compat_fields", {})
++        if isinstance(compat, dict):
++            for k, v in compat.items():
++                out.setdefault(k, v)
++    return out
+diff --git a/agent/runtime.py b/agent/runtime.py
+index 29dd571854b635b939f1e187f4ffe66d1a027197..0736e113584bee896d0e756700cb48604494e377 100644
+--- a/agent/runtime.py
++++ b/agent/runtime.py
+@@ -1,80 +1,89 @@
+ from __future__ import annotations
+
+ import json
+ import re
+ import secrets
+ import shutil
+ from dataclasses import dataclass
+ from datetime import datetime, timezone
+ from pathlib import Path
+ from typing import Any, Callable
+
+ from .config import AgentConfig
+ from .engine import ContentDeltaCallback, ExternalContext, RLMEngine, StepCallback, TurnSummary
++from .investigation_state import (
++    empty_investigation_state,
++    migrate_legacy_state,
++    update_with_legacy_fields,
++    with_legacy_compat_aliases,
++)
+ from .replay_log import ReplayLogger
+
+ EventCallback = Callable[[str], None]
+
+
+ class SessionError(RuntimeError):
+     pass
+
+
+ def _utc_now() -> str:
+     return datetime.now(timezone.utc).isoformat()
+
+
+ def _new_session_id() -> str:
+     stamp = datetime.now(timezone.utc).strftime("%Y%m%d-%H%M%S")
+     return f"{stamp}-{secrets.token_hex(3)}"
+
+
+ def _safe_component(text: str) -> str:
+     return re.sub(r"[^A-Za-z0-9._-]+", "-", text).strip("-") or "artifact"
+
+
+ @dataclass
+ class SessionStore:
+     workspace: Path
+     session_root_dir: str = ".openplanter"
+
+     def __post_init__(self) -> None:
+         self.workspace = self.workspace.expanduser().resolve()
+         self.root = (self.workspace / self.session_root_dir).resolve()
+         self.sessions = self.root / "sessions"
+         self.sessions.mkdir(parents=True, exist_ok=True)
+
+     def _session_dir(self, session_id: str) -> Path:
+         return self.sessions / session_id
+
+     def _metadata_path(self, session_id: str) -> Path:
+         return self._session_dir(session_id) / "metadata.json"
+
+     def _state_path(self, session_id: str) -> Path:
+         return self._session_dir(session_id) / "state.json"
+
++    def _investigation_state_path(self, session_id: str) -> Path:
++        return self._session_dir(session_id) / "investigation_state.json"
++
+     def _events_path(self, session_id: str) -> Path:
+         return self._session_dir(session_id) / "events.jsonl"
+
+     def _artifacts_dir(self, session_id: str) -> Path:
+         return self._session_dir(session_id) / "artifacts"
+
+     def _plan_dir(self, session_id: str) -> Path:
+         """Directory where *.plan.md files live (same as session dir)."""
+         return self._session_dir(session_id)
+
+     def latest_session_id(self) -> str | None:
+         session_dirs = [p for p in self.sessions.iterdir() if p.is_dir()]
+         if not session_dirs:
+             return None
+         latest = max(session_dirs, key=lambda p: p.stat().st_mtime)
+         return latest.name
+
+     def list_sessions(self, limit: int = 100) -> list[dict[str, Any]]:
+         session_dirs = sorted(
+             (p for p in self.sessions.iterdir() if p.is_dir()),
+             key=lambda p: p.stat().st_mtime,
+             reverse=True,
+         )
+         out: list[dict[str, Any]] = []
+         for path in session_dirs[:limit]:
+@@ -113,64 +122,98 @@ class SessionStore:
+                 raise SessionError(f"Cannot resume missing session: {sid}")
+         else:
+             if session_dir.exists():
+                 sid = f"{sid}-{secrets.token_hex(2)}"
+                 session_dir = self._session_dir(sid)
+             session_dir.mkdir(parents=True, exist_ok=True)
+             created_new = True
+
+         session_dir.mkdir(parents=True, exist_ok=True)
+         self._artifacts_dir(sid).mkdir(parents=True, exist_ok=True)
+
+         meta_path = self._metadata_path(sid)
+         if not meta_path.exists():
+             meta = {
+                 "session_id": sid,
+                 "workspace": str(self.workspace),
+                 "created_at": _utc_now(),
+                 "updated_at": _utc_now(),
+             }
+             meta_path.write_text(json.dumps(meta, indent=2), encoding="utf-8")
+
+         state = self.load_state(sid)
+         return sid, state, created_new
+
+     def load_state(self, session_id: str) -> dict[str, Any]:
+-        state_path = self._state_path(session_id)
+-        if not state_path.exists():
+-            return {
+-                "session_id": session_id,
+-                "external_observations": [],
+-            }
++        inv_state_path = self._investigation_state_path(session_id)
++        legacy_state_path = self._state_path(session_id)
++        if inv_state_path.exists():
++            try:
++                state = json.loads(inv_state_path.read_text(encoding="utf-8"))
++                if isinstance(state, dict):
++                    return with_legacy_compat_aliases(state)
++                raise SessionError(f"Investigation state is not an object: {inv_state_path}")
++            except json.JSONDecodeError as exc:
++                raise SessionError(f"Investigation state is invalid JSON: {inv_state_path}") from exc
++
++        if not legacy_state_path.exists():
++            return empty_investigation_state(session_id)
++
+         try:
+-            return json.loads(state_path.read_text(encoding="utf-8"))
++            legacy_state = json.loads(legacy_state_path.read_text(encoding="utf-8"))
+         except json.JSONDecodeError as exc:
+-            raise SessionError(f"Session state is invalid JSON: {state_path}") from exc
++            raise SessionError(f"Session state is invalid JSON: {legacy_state_path}") from exc
++
++        if not isinstance(legacy_state, dict):
++            raise SessionError(f"Session state must be a JSON object: {legacy_state_path}")
++        return with_legacy_compat_aliases(migrate_legacy_state(session_id, legacy_state))
+
+     def save_state(self, session_id: str, state: dict[str, Any]) -> None:
++        typed_state = state
++        if "legacy" not in typed_state and "external_observations" in typed_state:
++            typed_state = migrate_legacy_state(session_id, typed_state)
++        inv_state_path = self._investigation_state_path(session_id)
++        inv_state_path.write_text(json.dumps(typed_state, indent=2), encoding="utf-8")
++
++        legacy = typed_state.get("legacy", {}) if isinstance(typed_state, dict) else {}
++        legacy_state = {
++            "session_id": session_id,
++            "saved_at": typed_state.get("updated_at", _utc_now()) if isinstance(typed_state, dict) else _utc_now(),
++            "external_observations": legacy.get("external_observations", []),
++        }
++        turn_history = legacy.get("turn_history")
++        if turn_history:
++            legacy_state["turn_history"] = turn_history
++        loop_metrics = legacy.get("loop_metrics")
++        if loop_metrics:
++            legacy_state["loop_metrics"] = loop_metrics
++        compat_fields = legacy.get("compat_fields", {})
++        if isinstance(compat_fields, dict):
++            for k, v in compat_fields.items():
++                legacy_state[k] = v
+         state_path = self._state_path(session_id)
+-        state_path.write_text(json.dumps(state, indent=2), encoding="utf-8")
++        state_path.write_text(json.dumps(legacy_state, indent=2), encoding="utf-8")
+         self._touch_metadata(session_id)
+
+     def append_event(self, session_id: str, event_type: str, payload: dict[str, Any]) -> None:
+         event_path = self._events_path(session_id)
+         event = {
+             "ts": _utc_now(),
+             "type": event_type,
+             "payload": payload,
+         }
+         with event_path.open("a", encoding="utf-8") as fh:
+             fh.write(json.dumps(event, ensure_ascii=True) + "\n")
+         self._touch_metadata(session_id)
+
+     def write_artifact(
+         self, session_id: str, category: str, name: str, content: str
+     ) -> str:
+         category_safe = _safe_component(category)
+         name_safe = _safe_component(name)
+         artifact_rel = Path("artifacts") / category_safe / name_safe
+         artifact_abs = self._session_dir(session_id) / artifact_rel
+         artifact_abs.parent.mkdir(parents=True, exist_ok=True)
+         artifact_abs.write_text(content, encoding="utf-8")
+         self._touch_metadata(session_id)
+         return artifact_rel.as_posix()
+
+@@ -225,70 +268,71 @@ class SessionRuntime:
+     store: SessionStore
+     session_id: str
+     context: ExternalContext
+     max_persisted_observations: int = 400
+     turn_history: list[TurnSummary] | None = None
+     max_turn_summaries: int = 50
+     loop_metrics: dict[str, Any] | None = None
+
+     @classmethod
+     def bootstrap(
+         cls,
+         engine: RLMEngine,
+         config: AgentConfig,
+         session_id: str | None = None,
+         resume: bool = False,
+     ) -> "SessionRuntime":
+         store = SessionStore(
+             workspace=config.workspace,
+             session_root_dir=config.session_root_dir,
+         )
+         try:
+             _seed_wiki(config.workspace, config.session_root_dir)
+         except OSError:
+             pass
+         sid, state, created_new = store.open_session(session_id=session_id, resume=resume)
+-        persisted = state.get("external_observations", [])
++        legacy = state.get("legacy", {}) if isinstance(state, dict) else {}
++        persisted = legacy.get("external_observations", []) if isinstance(legacy, dict) else []
+         obs = [str(x) for x in persisted] if isinstance(persisted, list) else []
+         max_obs = max(1, config.max_persisted_observations)
+         context = ExternalContext(observations=obs[-max_obs:])
+
+         engine.session_dir = store._session_dir(sid)
+         engine.session_id = sid
+
+         # Load turn history from persisted state
+-        raw_history = state.get("turn_history", [])
++        raw_history = legacy.get("turn_history", []) if isinstance(legacy, dict) else []
+         turn_history: list[TurnSummary] = []
+         if isinstance(raw_history, list):
+             for item in raw_history:
+                 if isinstance(item, dict):
+                     try:
+                         turn_history.append(TurnSummary.from_dict(item))
+                     except (KeyError, TypeError):
+                         pass
+         max_turns = max(1, config.max_turn_summaries)
+-        raw_loop_metrics = state.get("loop_metrics", {})
++        raw_loop_metrics = legacy.get("loop_metrics", {}) if isinstance(legacy, dict) else {}
+         loop_metrics: dict[str, Any] = raw_loop_metrics if isinstance(raw_loop_metrics, dict) else {}
+         loop_metrics.setdefault("turns", 0)
+         loop_metrics.setdefault("steps", 0)
+         loop_metrics.setdefault("model_turns", 0)
+         loop_metrics.setdefault("tool_calls", 0)
+         loop_metrics.setdefault("guardrail_warnings", 0)
+         loop_metrics.setdefault("final_rejections", 0)
+         loop_metrics.setdefault("phase_counts", {})
+         if not isinstance(loop_metrics["phase_counts"], dict):
+             loop_metrics["phase_counts"] = {}
+         for phase in ("investigate", "build", "iterate", "finalize"):
+             loop_metrics["phase_counts"].setdefault(phase, 0)
+
+         runtime = cls(
+             engine=engine,
+             store=store,
+             session_id=sid,
+             context=context,
+             max_persisted_observations=max_obs,
+             turn_history=turn_history[-max_turns:],
+             max_turn_summaries=max_turns,
+             loop_metrics=loop_metrics,
+         )
+         try:
+             runtime.store.append_event(
+@@ -428,35 +472,34 @@ class SessionRuntime:
+             result_preview=result_preview,
+             timestamp=_utc_now(),
+             steps_used=steps_used,
+             replay_seq_start=replay_seq_start,
+         )
+         self.turn_history.append(summary)
+         if len(self.turn_history) > self.max_turn_summaries:
+             self.turn_history = self.turn_history[-self.max_turn_summaries:]
+         try:
+             self.store.append_event(
+                 self.session_id,
+                 "result",
+                 {"text": result},
+             )
+         except OSError:
+             pass
+         try:
+             self._persist_state()
+         except OSError:
+             pass
+         return result
+
+     def _persist_state(self) -> None:
+         if len(self.context.observations) > self.max_persisted_observations:
+             self.context.observations = self.context.observations[-self.max_persisted_observations :]
+-        state: dict[str, Any] = {
+-            "session_id": self.session_id,
+-            "saved_at": _utc_now(),
+-            "external_observations": self.context.observations,
+-        }
+-        if self.turn_history:
+-            state["turn_history"] = [t.to_dict() for t in self.turn_history]
+-        if self.loop_metrics:
+-            state["loop_metrics"] = self.loop_metrics
++        current = self.store.load_state(self.session_id)
++        state = update_with_legacy_fields(
++            current,
++            self.session_id,
++            self.context.observations,
++            [t.to_dict() for t in self.turn_history] if self.turn_history else [],
++            self.loop_metrics or {},
++        )
+         self.store.save_state(self.session_id, state)
+diff --git a/openplanter-desktop/crates/op-core/src/engine/context.rs b/openplanter-desktop/crates/op-core/src/engine/context.rs
+index 0b522c2fdd088982f95c0ec18295c58d52a709ec..d261b21ecf3b9e32166fc680dc778f792289ca39 100644
+--- a/openplanter-desktop/crates/op-core/src/engine/context.rs
++++ b/openplanter-desktop/crates/op-core/src/engine/context.rs
+@@ -1,129 +1,247 @@
+ // External context and turn summary types for multi-turn sessions.
+
+ use serde::{Deserialize, Serialize};
++use serde_json::Value;
+ use std::path::Path;
+ use tokio::fs;
+
+ /// Summary of a completed turn for inclusion in subsequent prompts.
+ #[derive(Debug, Clone, Serialize, Deserialize)]
+ pub struct TurnSummary {
+     pub turn_number: u32,
+     pub objective: String,
+     pub result_preview: String,
+     pub timestamp: String,
+     pub steps_used: u32,
+     pub replay_seq_start: u64,
+ }
+
+-/// External context observations persisted to state.json.
++/// External context observations persisted to state files.
+ #[derive(Debug, Clone, Serialize, Deserialize)]
+ pub struct ExternalContext {
+     pub observations: Vec<Observation>,
+ }
+
+ /// A single observation from an external source.
+ #[derive(Debug, Clone, Serialize, Deserialize)]
+ pub struct Observation {
+     pub source: String,
+     pub timestamp: String,
+     pub content: String,
+ }
+
+ impl ExternalContext {
+     pub fn new() -> Self {
+         Self {
+             observations: vec![],
+         }
+     }
+
+     /// Add a new observation with the current timestamp.
+     pub fn add_observation(&mut self, source: &str, content: &str) {
+         self.observations.push(Observation {
+             source: source.to_string(),
+             timestamp: chrono::Utc::now().to_rfc3339(),
+             content: content.to_string(),
+         });
+     }
+
+-    /// Load external context from state.json in the session directory.
++    fn from_state_value(value: Value) -> std::io::Result<Self> {
++        let obj = value.as_object().ok_or_else(|| {
++            std::io::Error::new(std::io::ErrorKind::InvalidData, "state must be JSON object")
++        })?;
++
++        // New typed investigation_state.json shape.
++        if let Some(legacy) = obj.get("legacy").and_then(|v| v.as_object()) {
++            if let Some(observations) = legacy.get("external_observations").and_then(|v| v.as_array()) {
++                return Ok(Self {
++                    observations: observations
++                        .iter()
++                        .filter_map(|v| v.as_str())
++                        .map(|content| Observation {
++                            source: "legacy".to_string(),
++                            timestamp: chrono::Utc::now().to_rfc3339(),
++                            content: content.to_string(),
++                        })
++                        .collect(),
++                });
++            }
++        }
++
++        // Old Python state.json shape.
++        if let Some(observations) = obj.get("external_observations").and_then(|v| v.as_array()) {
++            return Ok(Self {
++                observations: observations
++                    .iter()
++                    .filter_map(|v| v.as_str())
++                    .map(|content| Observation {
++                        source: "legacy".to_string(),
++                        timestamp: chrono::Utc::now().to_rfc3339(),
++                        content: content.to_string(),
++                    })
++                    .collect(),
++            });
++        }
++
++        // Existing Rust shape.
++        serde_json::from_value(Value::Object(obj.clone()))
++            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))
++    }
++
++    /// Load external context from investigation_state.json or state.json.
+     pub async fn load(session_dir: &Path) -> std::io::Result<Self> {
+-        let path = session_dir.join("state.json");
+-        if !path.exists() {
++        let inv_path = session_dir.join("investigation_state.json");
++        if inv_path.exists() {
++            let content = fs::read_to_string(&inv_path).await?;
++            let value: Value = serde_json::from_str(&content)
++                .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
++            return Self::from_state_value(value);
++        }
++
++        let legacy_path = session_dir.join("state.json");
++        if !legacy_path.exists() {
+             return Ok(Self::new());
+         }
+-        let content = fs::read_to_string(&path).await?;
+-        serde_json::from_str(&content)
+-            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))
++        let content = fs::read_to_string(&legacy_path).await?;
++        let value: Value = serde_json::from_str(&content)
++            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
++        Self::from_state_value(value)
+     }
+
+-    /// Save external context to state.json in the session directory.
++    /// Save external context in both investigation_state.json and legacy state.json.
+     pub async fn save(&self, session_dir: &Path) -> std::io::Result<()> {
+-        let path = session_dir.join("state.json");
+-        let json = serde_json::to_string_pretty(self)
++        let legacy_observations: Vec<String> = self.observations.iter().map(|o| o.content.clone()).collect();
++        let now = chrono::Utc::now().to_rfc3339();
++
++        let investigation_state = serde_json::json!({
++            "schema_version": "1.0.0",
++            "session_id": session_dir.file_name().and_then(|x| x.to_str()).unwrap_or_default(),
++            "created_at": now,
++            "updated_at": now,
++            "objective": "",
++            "ontology": {"namespace": "openplanter.core", "version": "2026-03"},
++            "entities": {},
++            "links": {},
++            "claims": {},
++            "evidence": {},
++            "hypotheses": {},
++            "questions": {},
++            "tasks": {},
++            "actions": {},
++            "provenance_nodes": {},
++            "confidence_profiles": {},
++            "timeline": [],
++            "indexes": {"by_external_ref": {}, "by_tag": {}},
++            "legacy": {
++                "external_observations": legacy_observations,
++                "turn_history": [],
++                "loop_metrics": {}
++            }
++        });
++
++        let inv_json = serde_json::to_string_pretty(&investigation_state)
+             .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
+-        fs::write(&path, json).await
++        fs::write(session_dir.join("investigation_state.json"), inv_json).await?;
++
++        let legacy_json = serde_json::to_string_pretty(&serde_json::json!({
++            "session_id": session_dir.file_name().and_then(|x| x.to_str()).unwrap_or_default(),
++            "saved_at": chrono::Utc::now().to_rfc3339(),
++            "external_observations": self.observations.iter().map(|o| o.content.clone()).collect::<Vec<String>>()
++        }))
++        .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
++        fs::write(session_dir.join("state.json"), legacy_json).await
+     }
+ }
+
+ impl Default for ExternalContext {
+     fn default() -> Self {
+         Self::new()
+     }
+ }
+
+ #[cfg(test)]
+ mod tests {
+     use super::*;
+     use tempfile::tempdir;
+
+     #[test]
+     fn test_new_context_empty() {
+         let ctx = ExternalContext::new();
+         assert!(ctx.observations.is_empty());
+     }
+
+     #[test]
+     fn test_add_observation() {
+         let mut ctx = ExternalContext::new();
+         ctx.add_observation("wiki", "Found entity Acme Corp");
+         assert_eq!(ctx.observations.len(), 1);
+         assert_eq!(ctx.observations[0].source, "wiki");
+         assert_eq!(ctx.observations[0].content, "Found entity Acme Corp");
+         assert!(!ctx.observations[0].timestamp.is_empty());
+     }
+
+     #[tokio::test]
+     async fn test_save_and_load() {
+         let tmp = tempdir().unwrap();
+         let mut ctx = ExternalContext::new();
+         ctx.add_observation("wiki", "test observation");
+         ctx.save(tmp.path()).await.unwrap();
+
+         let loaded = ExternalContext::load(tmp.path()).await.unwrap();
+         assert_eq!(loaded.observations.len(), 1);
+         assert_eq!(loaded.observations[0].content, "test observation");
+     }
+
+     #[tokio::test]
+     async fn test_load_missing_returns_empty() {
+         let tmp = tempdir().unwrap();
+         let ctx = ExternalContext::load(tmp.path()).await.unwrap();
+         assert!(ctx.observations.is_empty());
+     }
+
++    #[tokio::test]
++    async fn test_load_legacy_python_state_shape() {
++        let tmp = tempdir().unwrap();
++        fs::write(
++            tmp.path().join("state.json"),
++            r#"{"session_id":"s1","external_observations":["a","b"]}"#,
++        )
++        .await
++        .unwrap();
++
++        let loaded = ExternalContext::load(tmp.path()).await.unwrap();
++        assert_eq!(loaded.observations.len(), 2);
++        assert_eq!(loaded.observations[0].content, "a");
++    }
++
++    #[tokio::test]
++    async fn test_load_typed_investigation_state_shape() {
++        let tmp = tempdir().unwrap();
++        fs::write(
++            tmp.path().join("investigation_state.json"),
++            r#"{"legacy":{"external_observations":["x"]}}"#,
++        )
++        .await
++        .unwrap();
++
++        let loaded = ExternalContext::load(tmp.path()).await.unwrap();
++        assert_eq!(loaded.observations.len(), 1);
++        assert_eq!(loaded.observations[0].content, "x");
++    }
++
+     #[test]
+     fn test_turn_summary_serialization() {
+         let ts = TurnSummary {
+             turn_number: 1,
+             objective: "Investigate Acme Corp".into(),
+             result_preview: "Found connections to...".into(),
+             timestamp: "2026-01-01T00:00:00Z".into(),
+             steps_used: 3,
+             replay_seq_start: 1,
+         };
+         let json = serde_json::to_string(&ts).unwrap();
+         let parsed: TurnSummary = serde_json::from_str(&json).unwrap();
+         assert_eq!(parsed.turn_number, 1);
+         assert_eq!(parsed.objective, "Investigate Acme Corp");
+     }
+ }
+diff --git a/tests/test_investigation_state.py b/tests/test_investigation_state.py
+new file mode 100644
+index 0000000000000000000000000000000000000000..bafbedbdbe615fddd44f48c683cb43d7d74d97bc
+--- /dev/null
++++ b/tests/test_investigation_state.py
+@@ -0,0 +1,59 @@
++from __future__ import annotations
++
++import json
++import tempfile
++import unittest
++from pathlib import Path
++
++from agent.config import AgentConfig
++from agent.model import ScriptedModel
++from agent.runtime import SessionStore, SessionRuntime
++from agent.tools import WorkspaceTools
++from agent.engine import RLMEngine
++
++
++class InvestigationStateTests(unittest.TestCase):
++    def test_load_state_migrates_legacy_state_json(self) -> None:
++        with tempfile.TemporaryDirectory() as tmpdir:
++            root = Path(tmpdir)
++            store = SessionStore(workspace=root)
++            sid, _, _ = store.open_session(session_id="legacy-migrate", resume=False)
++            state_path = root / ".openplanter" / "sessions" / sid / "state.json"
++            legacy = {
++                "session_id": sid,
++                "external_observations": ["obs-1", "obs-2"],
++                "turn_history": [{"turn_number": 1}],
++                "loop_metrics": {"turns": 1},
++            }
++            state_path.write_text(json.dumps(legacy), encoding="utf-8")
++
++            typed = store.load_state(sid)
++            self.assertEqual(typed["schema_version"], "1.0.0")
++            self.assertEqual(typed["legacy"]["external_observations"], ["obs-1", "obs-2"])
++            self.assertGreaterEqual(len(typed["evidence"]), 2)
++            for item in typed["evidence"].values():
++                self.assertEqual(item["normalization"]["normalization_version"], "legacy-v1")
++
++    def test_persist_writes_typed_and_legacy_files(self) -> None:
++        with tempfile.TemporaryDirectory() as tmpdir:
++            root = Path(tmpdir)
++            cfg = AgentConfig(workspace=root, session_root_dir=".openplanter")
++            engine = RLMEngine(model=ScriptedModel(scripted_turns=[]), tools=WorkspaceTools(root=root), config=cfg)
++            runtime = SessionRuntime.bootstrap(engine=engine, config=cfg, session_id="typed-save", resume=False)
++            runtime.context.observations = ["alpha"]
++            runtime._persist_state()
++
++            session_dir = root / ".openplanter" / "sessions" / "typed-save"
++            typed_path = session_dir / "investigation_state.json"
++            legacy_path = session_dir / "state.json"
++            self.assertTrue(typed_path.exists())
++            self.assertTrue(legacy_path.exists())
++
++            typed = json.loads(typed_path.read_text(encoding="utf-8"))
++            legacy = json.loads(legacy_path.read_text(encoding="utf-8"))
++            self.assertEqual(typed["legacy"]["external_observations"], ["alpha"])
++            self.assertEqual(legacy["external_observations"], ["alpha"])
++
++
++if __name__ == "__main__":
++    unittest.main()
+
+EOF
+)
diff --git a/git-apply-3.txt b/git-apply-3.txt
new file mode 100644
index 00000000..48e16492
--- /dev/null
+++ b/git-apply-3.txt
@@ -0,0 +1,724 @@
+ (cd "$(git rev-parse --show-toplevel)" && git apply --3way <<'EOF'
+diff --git a/agent/runtime.py b/agent/runtime.py
+index 29dd571854b635b939f1e187f4ffe66d1a027197..7e0412cacfc5435ea6bc63696b87b46772586797 100644
+--- a/agent/runtime.py
++++ b/agent/runtime.py
+@@ -31,50 +31,53 @@ def _new_session_id() -> str:
+
+ def _safe_component(text: str) -> str:
+     return re.sub(r"[^A-Za-z0-9._-]+", "-", text).strip("-") or "artifact"
+
+
+ @dataclass
+ class SessionStore:
+     workspace: Path
+     session_root_dir: str = ".openplanter"
+
+     def __post_init__(self) -> None:
+         self.workspace = self.workspace.expanduser().resolve()
+         self.root = (self.workspace / self.session_root_dir).resolve()
+         self.sessions = self.root / "sessions"
+         self.sessions.mkdir(parents=True, exist_ok=True)
+
+     def _session_dir(self, session_id: str) -> Path:
+         return self.sessions / session_id
+
+     def _metadata_path(self, session_id: str) -> Path:
+         return self._session_dir(session_id) / "metadata.json"
+
+     def _state_path(self, session_id: str) -> Path:
+         return self._session_dir(session_id) / "state.json"
+
++    def _investigation_state_path(self, session_id: str) -> Path:
++        return self._session_dir(session_id) / "investigation_state.json"
++
+     def _events_path(self, session_id: str) -> Path:
+         return self._session_dir(session_id) / "events.jsonl"
+
+     def _artifacts_dir(self, session_id: str) -> Path:
+         return self._session_dir(session_id) / "artifacts"
+
+     def _plan_dir(self, session_id: str) -> Path:
+         """Directory where *.plan.md files live (same as session dir)."""
+         return self._session_dir(session_id)
+
+     def latest_session_id(self) -> str | None:
+         session_dirs = [p for p in self.sessions.iterdir() if p.is_dir()]
+         if not session_dirs:
+             return None
+         latest = max(session_dirs, key=lambda p: p.stat().st_mtime)
+         return latest.name
+
+     def list_sessions(self, limit: int = 100) -> list[dict[str, Any]]:
+         session_dirs = sorted(
+             (p for p in self.sessions.iterdir() if p.is_dir()),
+             key=lambda p: p.stat().st_mtime,
+             reverse=True,
+         )
+         out: list[dict[str, Any]] = []
+         for path in session_dirs[:limit]:
+@@ -113,63 +116,78 @@ class SessionStore:
+                 raise SessionError(f"Cannot resume missing session: {sid}")
+         else:
+             if session_dir.exists():
+                 sid = f"{sid}-{secrets.token_hex(2)}"
+                 session_dir = self._session_dir(sid)
+             session_dir.mkdir(parents=True, exist_ok=True)
+             created_new = True
+
+         session_dir.mkdir(parents=True, exist_ok=True)
+         self._artifacts_dir(sid).mkdir(parents=True, exist_ok=True)
+
+         meta_path = self._metadata_path(sid)
+         if not meta_path.exists():
+             meta = {
+                 "session_id": sid,
+                 "workspace": str(self.workspace),
+                 "created_at": _utc_now(),
+                 "updated_at": _utc_now(),
+             }
+             meta_path.write_text(json.dumps(meta, indent=2), encoding="utf-8")
+
+         state = self.load_state(sid)
+         return sid, state, created_new
+
+     def load_state(self, session_id: str) -> dict[str, Any]:
++        inv_state_path = self._investigation_state_path(session_id)
+         state_path = self._state_path(session_id)
++        if inv_state_path.exists():
++            try:
++                inv_state = json.loads(inv_state_path.read_text(encoding="utf-8"))
++                return _legacy_projection_from_investigation_state(inv_state, session_id)
++            except json.JSONDecodeError as exc:
++                raise SessionError(
++                    f"Investigation state is invalid JSON: {inv_state_path}"
++                ) from exc
+         if not state_path.exists():
+             return {
+                 "session_id": session_id,
+                 "external_observations": [],
+             }
+         try:
+-            return json.loads(state_path.read_text(encoding="utf-8"))
++            legacy_state = json.loads(state_path.read_text(encoding="utf-8"))
++            return _normalize_legacy_state(legacy_state, session_id)
+         except json.JSONDecodeError as exc:
+             raise SessionError(f"Session state is invalid JSON: {state_path}") from exc
+
+     def save_state(self, session_id: str, state: dict[str, Any]) -> None:
++        inv_state_path = self._investigation_state_path(session_id)
+         state_path = self._state_path(session_id)
++        inv_state_path.write_text(
++            json.dumps(_build_investigation_state(state, session_id), indent=2),
++            encoding="utf-8",
++        )
+         state_path.write_text(json.dumps(state, indent=2), encoding="utf-8")
+         self._touch_metadata(session_id)
+
+     def append_event(self, session_id: str, event_type: str, payload: dict[str, Any]) -> None:
+         event_path = self._events_path(session_id)
+         event = {
+             "ts": _utc_now(),
+             "type": event_type,
+             "payload": payload,
+         }
+         with event_path.open("a", encoding="utf-8") as fh:
+             fh.write(json.dumps(event, ensure_ascii=True) + "\n")
+         self._touch_metadata(session_id)
+
+     def write_artifact(
+         self, session_id: str, category: str, name: str, content: str
+     ) -> str:
+         category_safe = _safe_component(category)
+         name_safe = _safe_component(name)
+         artifact_rel = Path("artifacts") / category_safe / name_safe
+         artifact_abs = self._session_dir(session_id) / artifact_rel
+         artifact_abs.parent.mkdir(parents=True, exist_ok=True)
+         artifact_abs.write_text(content, encoding="utf-8")
+         self._touch_metadata(session_id)
+         return artifact_rel.as_posix()
+@@ -438,25 +456,124 @@ class SessionRuntime:
+                 self.session_id,
+                 "result",
+                 {"text": result},
+             )
+         except OSError:
+             pass
+         try:
+             self._persist_state()
+         except OSError:
+             pass
+         return result
+
+     def _persist_state(self) -> None:
+         if len(self.context.observations) > self.max_persisted_observations:
+             self.context.observations = self.context.observations[-self.max_persisted_observations :]
+         state: dict[str, Any] = {
+             "session_id": self.session_id,
+             "saved_at": _utc_now(),
+             "external_observations": self.context.observations,
+         }
+         if self.turn_history:
+             state["turn_history"] = [t.to_dict() for t in self.turn_history]
+         if self.loop_metrics:
+             state["loop_metrics"] = self.loop_metrics
+         self.store.save_state(self.session_id, state)
++
++
++def _normalize_legacy_state(raw: dict[str, Any], session_id: str) -> dict[str, Any]:
++    normalized = dict(raw) if isinstance(raw, dict) else {}
++    normalized["session_id"] = str(normalized.get("session_id") or session_id)
++    obs = normalized.get("external_observations")
++    if isinstance(obs, list):
++        normalized["external_observations"] = [str(item) for item in obs]
++    else:
++        normalized["external_observations"] = []
++    return normalized
++
++
++def _legacy_projection_from_investigation_state(
++    inv_state: dict[str, Any],
++    session_id: str,
++) -> dict[str, Any]:
++    fallback = _normalize_legacy_state({}, session_id)
++    if not isinstance(inv_state, dict):
++        return fallback
++
++    legacy = inv_state.get("legacy")
++    observations: list[str] = []
++    if isinstance(legacy, dict):
++        raw_obs = legacy.get("external_observations")
++        if isinstance(raw_obs, list):
++            observations = [str(item) for item in raw_obs]
++
++    if not observations:
++        evidence = inv_state.get("evidence")
++        if isinstance(evidence, dict):
++            legacy_items: list[tuple[str, dict[str, Any]]] = []
++            for evidence_id, value in evidence.items():
++                if not isinstance(value, dict):
++                    continue
++                normalization = value.get("normalization")
++                if not (
++                    isinstance(normalization, dict)
++                    and normalization.get("kind") == "legacy_observation"
++                ):
++                    continue
++                content = value.get("content")
++                if isinstance(content, str) and content:
++                    legacy_items.append((str(evidence_id), value))
++            legacy_items.sort(key=lambda item: item[0])
++            observations = [item[1]["content"] for item in legacy_items]
++
++    return {
++        "session_id": str(inv_state.get("session_id") or session_id),
++        "saved_at": str(inv_state.get("updated_at") or _utc_now()),
++        "external_observations": observations,
++        "turn_history": legacy.get("turn_history", []) if isinstance(legacy, dict) else [],
++        "loop_metrics": legacy.get("loop_metrics", {}) if isinstance(legacy, dict) else {},
++    }
++
++
++def _build_investigation_state(legacy_state: dict[str, Any], session_id: str) -> dict[str, Any]:
++    now = _utc_now()
++    normalized_legacy = _normalize_legacy_state(legacy_state, session_id)
++    observations = normalized_legacy.get("external_observations", [])
++    evidence: dict[str, Any] = {}
++    if isinstance(observations, list):
++        for idx, item in enumerate(observations):
++            evidence_id = f"ev_legacy_{idx:04d}"
++            evidence[evidence_id] = {
++                "id": evidence_id,
++                "evidence_type": "legacy_observation",
++                "content": str(item),
++                "normalization": {
++                    "kind": "legacy_observation",
++                    "normalization_version": "legacy-v1",
++                },
++            }
++
++    return {
++        "schema_version": "1.0.0",
++        "session_id": str(normalized_legacy.get("session_id") or session_id),
++        "created_at": str(normalized_legacy.get("created_at") or now),
++        "updated_at": str(normalized_legacy.get("saved_at") or now),
++        "objective": normalized_legacy.get("objective"),
++        "ontology": {"namespace": "openplanter.core", "version": "2026-03"},
++        "entities": {},
++        "links": {},
++        "claims": {},
++        "evidence": evidence,
++        "hypotheses": {},
++        "questions": {},
++        "tasks": {},
++        "actions": {},
++        "provenance_nodes": {},
++        "confidence_profiles": {},
++        "timeline": [],
++        "indexes": {"by_external_ref": {}, "by_tag": {}},
++        "legacy": {
++            "external_observations": observations,
++            "turn_history": normalized_legacy.get("turn_history", []),
++            "loop_metrics": normalized_legacy.get("loop_metrics", {}),
++        },
++    }
+diff --git a/openplanter-desktop/crates/op-core/src/engine/context.rs b/openplanter-desktop/crates/op-core/src/engine/context.rs
+index 0b522c2fdd088982f95c0ec18295c58d52a709ec..f904fa0d2dcd047b4c4c14ef4401b70afe9c3f31 100644
+--- a/openplanter-desktop/crates/op-core/src/engine/context.rs
++++ b/openplanter-desktop/crates/op-core/src/engine/context.rs
+@@ -1,129 +1,337 @@
+ // External context and turn summary types for multi-turn sessions.
+
+ use serde::{Deserialize, Serialize};
+ use std::path::Path;
+ use tokio::fs;
+
++const INVESTIGATION_STATE_SCHEMA_VERSION: &str = "1.0.0";
++
+ /// Summary of a completed turn for inclusion in subsequent prompts.
+ #[derive(Debug, Clone, Serialize, Deserialize)]
+ pub struct TurnSummary {
+     pub turn_number: u32,
+     pub objective: String,
+     pub result_preview: String,
+     pub timestamp: String,
+     pub steps_used: u32,
+     pub replay_seq_start: u64,
+ }
+
+ /// External context observations persisted to state.json.
+ #[derive(Debug, Clone, Serialize, Deserialize)]
+ pub struct ExternalContext {
+     pub observations: Vec<Observation>,
+ }
+
++#[derive(Debug, Clone, Serialize, Deserialize)]
++struct LegacyState {
++    #[serde(default)]
++    session_id: Option<String>,
++    #[serde(default)]
++    external_observations: Vec<String>,
++}
++
++#[derive(Debug, Clone, Serialize, Deserialize)]
++struct InvestigationState {
++    #[serde(default)]
++    schema_version: String,
++    #[serde(default)]
++    session_id: Option<String>,
++    #[serde(default)]
++    legacy: LegacyInvestigationBlock,
++    #[serde(default)]
++    evidence: std::collections::BTreeMap<String, EvidenceRecord>,
++}
++
++#[derive(Debug, Clone, Serialize, Deserialize, Default)]
++struct LegacyInvestigationBlock {
++    #[serde(default)]
++    external_observations: Vec<String>,
++}
++
++#[derive(Debug, Clone, Serialize, Deserialize, Default)]
++struct EvidenceRecord {
++    #[serde(default)]
++    content: Option<String>,
++    #[serde(default)]
++    normalization: Option<EvidenceNormalization>,
++}
++
++#[derive(Debug, Clone, Serialize, Deserialize, Default)]
++struct EvidenceNormalization {
++    #[serde(default)]
++    kind: Option<String>,
++}
++
+ /// A single observation from an external source.
+ #[derive(Debug, Clone, Serialize, Deserialize)]
+ pub struct Observation {
+     pub source: String,
+     pub timestamp: String,
+     pub content: String,
+ }
+
+ impl ExternalContext {
+     pub fn new() -> Self {
+         Self {
+             observations: vec![],
+         }
+     }
+
+     /// Add a new observation with the current timestamp.
+     pub fn add_observation(&mut self, source: &str, content: &str) {
+         self.observations.push(Observation {
+             source: source.to_string(),
+             timestamp: chrono::Utc::now().to_rfc3339(),
+             content: content.to_string(),
+         });
+     }
+
+     /// Load external context from state.json in the session directory.
+     pub async fn load(session_dir: &Path) -> std::io::Result<Self> {
++        let inv_path = session_dir.join("investigation_state.json");
+         let path = session_dir.join("state.json");
++        if inv_path.exists() {
++            let content = fs::read_to_string(&inv_path).await?;
++            let state: InvestigationState = serde_json::from_str(&content)
++                .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
++            return Ok(Self {
++                observations: observations_from_investigation_state(&state)
++                    .into_iter()
++                    .map(|content| Observation {
++                        source: "legacy_migration".to_string(),
++                        timestamp: chrono::Utc::now().to_rfc3339(),
++                        content,
++                    })
++                    .collect(),
++            });
++        }
+         if !path.exists() {
+             return Ok(Self::new());
+         }
+         let content = fs::read_to_string(&path).await?;
+-        serde_json::from_str(&content)
+-            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))
++        if let Ok(ctx) = serde_json::from_str::<Self>(&content) {
++            return Ok(ctx);
++        }
++        if let Ok(legacy) = serde_json::from_str::<LegacyState>(&content) {
++            return Ok(Self {
++                observations: legacy
++                    .external_observations
++                    .into_iter()
++                    .map(|content| Observation {
++                        source: "legacy_state".to_string(),
++                        timestamp: chrono::Utc::now().to_rfc3339(),
++                        content,
++                    })
++                    .collect(),
++            });
++        }
++        Err(std::io::Error::new(
++            std::io::ErrorKind::InvalidData,
++            "state.json format not recognized",
++        ))
+     }
+
+     /// Save external context to state.json in the session directory.
+     pub async fn save(&self, session_dir: &Path) -> std::io::Result<()> {
+         let path = session_dir.join("state.json");
++        let inv_path = session_dir.join("investigation_state.json");
+         let json = serde_json::to_string_pretty(self)
+             .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
+-        fs::write(&path, json).await
++        fs::write(&path, json).await?;
++
++        let investigation_state = build_investigation_state(self);
++        let inv_json = serde_json::to_string_pretty(&investigation_state)
++            .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
++        fs::write(&inv_path, inv_json).await
++    }
++}
++
++fn observations_from_investigation_state(state: &InvestigationState) -> Vec<String> {
++    if !state.legacy.external_observations.is_empty() {
++        return state.legacy.external_observations.clone();
++    }
++    let mut extracted = vec![];
++    for evidence in state.evidence.values() {
++        let is_legacy = evidence
++            .normalization
++            .as_ref()
++            .and_then(|norm| norm.kind.as_deref())
++            == Some("legacy_observation");
++        if !is_legacy {
++            continue;
++        }
++        if let Some(content) = &evidence.content {
++            if !content.is_empty() {
++                extracted.push(content.clone());
++            }
++        }
+     }
++    extracted
++}
++
++fn build_investigation_state(context: &ExternalContext) -> serde_json::Value {
++    let mut evidence = serde_json::Map::new();
++    for (idx, obs) in context.observations.iter().enumerate() {
++        let id = format!("ev_legacy_{idx:04}");
++        evidence.insert(
++            id.clone(),
++            serde_json::json!({
++                "id": id,
++                "evidence_type": "legacy_observation",
++                "content": obs.content,
++                "normalization": {
++                    "kind": "legacy_observation",
++                    "normalization_version": "legacy-v1"
++                }
++            }),
++        );
++    }
++    serde_json::json!({
++        "schema_version": INVESTIGATION_STATE_SCHEMA_VERSION,
++        "session_id": serde_json::Value::Null,
++        "created_at": chrono::Utc::now().to_rfc3339(),
++        "updated_at": chrono::Utc::now().to_rfc3339(),
++        "objective": serde_json::Value::Null,
++        "ontology": {"namespace": "openplanter.core", "version": "2026-03"},
++        "entities": {},
++        "links": {},
++        "claims": {},
++        "evidence": evidence,
++        "hypotheses": {},
++        "questions": {},
++        "tasks": {},
++        "actions": {},
++        "provenance_nodes": {},
++        "confidence_profiles": {},
++        "timeline": [],
++        "indexes": {"by_external_ref": {}, "by_tag": {}},
++        "legacy": {
++            "external_observations": context
++                .observations
++                .iter()
++                .map(|o| o.content.clone())
++                .collect::<Vec<_>>()
++        }
++    })
+ }
+
+ impl Default for ExternalContext {
+     fn default() -> Self {
+         Self::new()
+     }
+ }
+
+ #[cfg(test)]
+ mod tests {
+     use super::*;
+     use tempfile::tempdir;
+
+     #[test]
+     fn test_new_context_empty() {
+         let ctx = ExternalContext::new();
+         assert!(ctx.observations.is_empty());
+     }
+
+     #[test]
+     fn test_add_observation() {
+         let mut ctx = ExternalContext::new();
+         ctx.add_observation("wiki", "Found entity Acme Corp");
+         assert_eq!(ctx.observations.len(), 1);
+         assert_eq!(ctx.observations[0].source, "wiki");
+         assert_eq!(ctx.observations[0].content, "Found entity Acme Corp");
+         assert!(!ctx.observations[0].timestamp.is_empty());
+     }
+
+     #[tokio::test]
+     async fn test_save_and_load() {
+         let tmp = tempdir().unwrap();
+         let mut ctx = ExternalContext::new();
+         ctx.add_observation("wiki", "test observation");
+         ctx.save(tmp.path()).await.unwrap();
+
+         let loaded = ExternalContext::load(tmp.path()).await.unwrap();
+         assert_eq!(loaded.observations.len(), 1);
+         assert_eq!(loaded.observations[0].content, "test observation");
+     }
+
+     #[tokio::test]
+     async fn test_load_missing_returns_empty() {
+         let tmp = tempdir().unwrap();
+         let ctx = ExternalContext::load(tmp.path()).await.unwrap();
+         assert!(ctx.observations.is_empty());
+     }
+
++    #[tokio::test]
++    async fn test_load_legacy_state_json_string_observations() {
++        let tmp = tempdir().unwrap();
++        fs::write(
++            tmp.path().join("state.json"),
++            r#"{"session_id":"s1","external_observations":["one","two"]}"#,
++        )
++        .await
++        .unwrap();
++
++        let loaded = ExternalContext::load(tmp.path()).await.unwrap();
++        assert_eq!(loaded.observations.len(), 2);
++        assert_eq!(loaded.observations[0].content, "one");
++        assert_eq!(loaded.observations[1].content, "two");
++    }
++
++    #[tokio::test]
++    async fn test_load_investigation_state_prefers_legacy_block() {
++        let tmp = tempdir().unwrap();
++        fs::write(
++            tmp.path().join("investigation_state.json"),
++            r#"{
++  "schema_version":"1.0.0",
++  "legacy":{"external_observations":["from-legacy"]},
++  "evidence":{"ev_legacy_0000":{"content":"from-evidence","normalization":{"kind":"legacy_observation"}}}
++}"#,
++        )
++        .await
++        .unwrap();
++
++        let loaded = ExternalContext::load(tmp.path()).await.unwrap();
++        assert_eq!(loaded.observations.len(), 1);
++        assert_eq!(loaded.observations[0].content, "from-legacy");
++    }
++
++    #[tokio::test]
++    async fn test_save_writes_investigation_state() {
++        let tmp = tempdir().unwrap();
++        let mut ctx = ExternalContext::new();
++        ctx.add_observation("wiki", "test observation");
++        ctx.save(tmp.path()).await.unwrap();
++
++        let inv = fs::read_to_string(tmp.path().join("investigation_state.json"))
++            .await
++            .unwrap();
++        let parsed: serde_json::Value = serde_json::from_str(&inv).unwrap();
++        assert_eq!(parsed["schema_version"], "1.0.0");
++        assert_eq!(
++            parsed["legacy"]["external_observations"][0],
++            "test observation"
++        );
++        assert_eq!(
++            parsed["evidence"]["ev_legacy_0000"]["normalization"]["kind"],
++            "legacy_observation"
++        );
++    }
++
+     #[test]
+     fn test_turn_summary_serialization() {
+         let ts = TurnSummary {
+             turn_number: 1,
+             objective: "Investigate Acme Corp".into(),
+             result_preview: "Found connections to...".into(),
+             timestamp: "2026-01-01T00:00:00Z".into(),
+             steps_used: 3,
+             replay_seq_start: 1,
+         };
+         let json = serde_json::to_string(&ts).unwrap();
+         let parsed: TurnSummary = serde_json::from_str(&json).unwrap();
+         assert_eq!(parsed.turn_number, 1);
+         assert_eq!(parsed.objective, "Investigate Acme Corp");
+     }
+ }
+diff --git a/tests/test_investigation_state_migration.py b/tests/test_investigation_state_migration.py
+new file mode 100644
+index 0000000000000000000000000000000000000000..e3c73cfd80380dd8a6ba1d4a537b84d9c9227015
+--- /dev/null
++++ b/tests/test_investigation_state_migration.py
+@@ -0,0 +1,106 @@
++from __future__ import annotations
++
++import json
++import tempfile
++import unittest
++from pathlib import Path
++
++from agent.runtime import SessionStore
++
++
++class InvestigationStateMigrationTests(unittest.TestCase):
++    def test_save_state_writes_investigation_state_and_legacy_projection(self) -> None:
++        with tempfile.TemporaryDirectory() as tmpdir:
++            root = Path(tmpdir)
++            store = SessionStore(workspace=root, session_root_dir=".openplanter")
++            sid, _, _ = store.open_session(session_id="migration-a", resume=False)
++
++            legacy_state = {
++                "session_id": sid,
++                "saved_at": "2026-03-13T12:10:00Z",
++                "external_observations": ["obs-a", "obs-b"],
++                "turn_history": [{"turn_number": 1}],
++                "loop_metrics": {"turns": 1},
++            }
++            store.save_state(sid, legacy_state)
++
++            inv_path = root / ".openplanter" / "sessions" / sid / "investigation_state.json"
++            self.assertTrue(inv_path.exists())
++            inv = json.loads(inv_path.read_text(encoding="utf-8"))
++            self.assertEqual(inv["schema_version"], "1.0.0")
++            self.assertEqual(inv["legacy"]["external_observations"], ["obs-a", "obs-b"])
++            self.assertEqual(
++                inv["evidence"]["ev_legacy_0000"]["normalization"]["kind"],
++                "legacy_observation",
++            )
++            self.assertEqual(inv["evidence"]["ev_legacy_0001"]["content"], "obs-b")
++
++    def test_load_state_prefers_investigation_state(self) -> None:
++        with tempfile.TemporaryDirectory() as tmpdir:
++            root = Path(tmpdir)
++            store = SessionStore(workspace=root, session_root_dir=".openplanter")
++            sid, _, _ = store.open_session(session_id="migration-b", resume=False)
++            session_dir = root / ".openplanter" / "sessions" / sid
++
++            (session_dir / "state.json").write_text(
++                json.dumps({"session_id": sid, "external_observations": ["legacy-file"]}),
++                encoding="utf-8",
++            )
++            (session_dir / "investigation_state.json").write_text(
++                json.dumps(
++                    {
++                        "schema_version": "1.0.0",
++                        "session_id": sid,
++                        "updated_at": "2026-03-13T12:00:00Z",
++                        "legacy": {"external_observations": ["typed-file"]},
++                        "evidence": {
++                            "ev_legacy_0000": {
++                                "content": "from-evidence",
++                                "normalization": {"kind": "legacy_observation"},
++                            }
++                        },
++                    }
++                ),
++                encoding="utf-8",
++            )
++
++            loaded = store.load_state(sid)
++            self.assertEqual(loaded["external_observations"], ["typed-file"])
++
++    def test_load_state_uses_evidence_when_legacy_block_missing(self) -> None:
++        with tempfile.TemporaryDirectory() as tmpdir:
++            root = Path(tmpdir)
++            store = SessionStore(workspace=root, session_root_dir=".openplanter")
++            sid, _, _ = store.open_session(session_id="migration-c", resume=False)
++            session_dir = root / ".openplanter" / "sessions" / sid
++
++            (session_dir / "investigation_state.json").write_text(
++                json.dumps(
++                    {
++                        "schema_version": "1.0.0",
++                        "session_id": sid,
++                        "evidence": {
++                            "ev_legacy_0001": {
++                                "content": "second",
++                                "normalization": {"kind": "legacy_observation"},
++                            },
++                            "ev_legacy_0000": {
++                                "content": "first",
++                                "normalization": {"kind": "legacy_observation"},
++                            },
++                            "ev_other": {
++                                "content": "ignore",
++                                "normalization": {"kind": "web_fetch"},
++                            },
++                        },
++                    }
++                ),
++                encoding="utf-8",
++            )
++
++            loaded = store.load_state(sid)
++            self.assertEqual(loaded["external_observations"], ["first", "second"])
++
++
++if __name__ == "__main__":
++    unittest.main()
+
+EOF
+)
diff --git a/git-apply-4.txt b/git-apply-4.txt
new file mode 100644
index 00000000..29e8014f
--- /dev/null
+++ b/git-apply-4.txt
@@ -0,0 +1,809 @@
+ (cd "$(git rev-parse --show-toplevel)" && git apply --3way <<'EOF'
+diff --git a/agent/investigation_state.py b/agent/investigation_state.py
+new file mode 100644
+index 0000000000000000000000000000000000000000..4ac8305dc13d542f2a5d69d7d0497ab417551bd9
+--- /dev/null
++++ b/agent/investigation_state.py
+@@ -0,0 +1,137 @@
++from __future__ import annotations
++
++from datetime import datetime, timezone
++from typing import Any
++
++
++SCHEMA_VERSION = "1.0.0"
++
++
++def utc_now() -> str:
++    return datetime.now(timezone.utc).isoformat()
++
++
++def _as_string_list(value: Any) -> list[str]:
++    if not isinstance(value, list):
++        return []
++    return [str(item) for item in value]
++
++
++def _default_state(session_id: str) -> dict[str, Any]:
++    now = utc_now()
++    return {
++        "schema_version": SCHEMA_VERSION,
++        "session_id": session_id,
++        "created_at": now,
++        "updated_at": now,
++        "objective": "",
++        "ontology": {
++            "namespace": "openplanter.core",
++            "version": "2026-03",
++        },
++        "entities": {},
++        "links": {},
++        "claims": {},
++        "evidence": {},
++        "hypotheses": {},
++        "questions": {},
++        "tasks": {},
++        "actions": {},
++        "provenance_nodes": {},
++        "confidence_profiles": {},
++        "timeline": [],
++        "indexes": {
++            "by_external_ref": {},
++            "by_tag": {},
++        },
++        "legacy": {
++            "external_observations": [],
++            "turn_history": [],
++            "loop_metrics": {},
++        },
++    }
++
++
++def from_legacy_state(legacy_state: dict[str, Any], session_id: str) -> dict[str, Any]:
++    state = _default_state(session_id)
++    external_observations = _as_string_list(legacy_state.get("external_observations"))
++    state["legacy"] = {
++        "external_observations": external_observations,
++        "turn_history": legacy_state.get("turn_history", []) if isinstance(legacy_state.get("turn_history"), list) else [],
++        "loop_metrics": legacy_state.get("loop_metrics", {}) if isinstance(legacy_state.get("loop_metrics"), dict) else {},
++    }
++
++    evidence: dict[str, dict[str, Any]] = {}
++    for idx, observation in enumerate(external_observations, start=1):
++        evidence_id = f"ev_legacy_{idx:04d}"
++        evidence[evidence_id] = {
++            "id": evidence_id,
++            "evidence_type": "human_note",
++            "content": observation,
++            "normalization": {
++                "kind": "analyst_note",
++                "normalization_version": "legacy-v1",
++            },
++        }
++    state["evidence"] = evidence
++    if isinstance(legacy_state.get("saved_at"), str):
++        state["updated_at"] = str(legacy_state["saved_at"])
++    return state
++
++
++def merge_legacy_updates(
++    current_state: dict[str, Any],
++    *,
++    observations: list[str],
++    turn_history: list[dict[str, Any]] | None,
++    loop_metrics: dict[str, Any] | None,
++) -> dict[str, Any]:
++    now = utc_now()
++    merged = dict(current_state)
++    merged.setdefault("schema_version", SCHEMA_VERSION)
++    merged["updated_at"] = now
++    merged.setdefault("session_id", "")
++    merged.setdefault("created_at", now)
++    merged.setdefault("ontology", {"namespace": "openplanter.core", "version": "2026-03"})
++    for key in (
++        "entities",
++        "links",
++        "claims",
++        "evidence",
++        "hypotheses",
++        "questions",
++        "tasks",
++        "actions",
++        "provenance_nodes",
++        "confidence_profiles",
++    ):
++        merged.setdefault(key, {})
++    merged.setdefault("timeline", [])
++    merged.setdefault("indexes", {"by_external_ref": {}, "by_tag": {}})
++
++    legacy = merged.get("legacy")
++    if not isinstance(legacy, dict):
++        legacy = {}
++    legacy["external_observations"] = list(observations)
++    legacy["turn_history"] = turn_history if turn_history is not None else []
++    legacy["loop_metrics"] = loop_metrics if loop_metrics is not None else {}
++    merged["legacy"] = legacy
++
++    evidence = merged.get("evidence")
++    if not isinstance(evidence, dict):
++        evidence = {}
++    for idx, observation in enumerate(observations, start=1):
++        evidence_id = f"ev_legacy_{idx:04d}"
++        if evidence_id in evidence:
++            continue
++        evidence[evidence_id] = {
++            "id": evidence_id,
++            "evidence_type": "human_note",
++            "content": observation,
++            "normalization": {
++                "kind": "analyst_note",
++                "normalization_version": "legacy-v1",
++            },
++        }
++    merged["evidence"] = evidence
++    return merged
+diff --git a/agent/runtime.py b/agent/runtime.py
+index 29dd571854b635b939f1e187f4ffe66d1a027197..f497669bffc5f399246b2c8efe1d0b93e1cbe736 100644
+--- a/agent/runtime.py
++++ b/agent/runtime.py
+@@ -1,83 +1,87 @@
+ from __future__ import annotations
+
+ import json
+ import re
+ import secrets
+ import shutil
+ from dataclasses import dataclass
+ from datetime import datetime, timezone
+ from pathlib import Path
+ from typing import Any, Callable
+
+ from .config import AgentConfig
+ from .engine import ContentDeltaCallback, ExternalContext, RLMEngine, StepCallback, TurnSummary
++from .investigation_state import from_legacy_state, merge_legacy_updates
+ from .replay_log import ReplayLogger
+
+ EventCallback = Callable[[str], None]
+
+
+ class SessionError(RuntimeError):
+     pass
+
+
+ def _utc_now() -> str:
+     return datetime.now(timezone.utc).isoformat()
+
+
+ def _new_session_id() -> str:
+     stamp = datetime.now(timezone.utc).strftime("%Y%m%d-%H%M%S")
+     return f"{stamp}-{secrets.token_hex(3)}"
+
+
+ def _safe_component(text: str) -> str:
+     return re.sub(r"[^A-Za-z0-9._-]+", "-", text).strip("-") or "artifact"
+
+
+ @dataclass
+ class SessionStore:
+     workspace: Path
+     session_root_dir: str = ".openplanter"
+
+     def __post_init__(self) -> None:
+         self.workspace = self.workspace.expanduser().resolve()
+         self.root = (self.workspace / self.session_root_dir).resolve()
+         self.sessions = self.root / "sessions"
+         self.sessions.mkdir(parents=True, exist_ok=True)
+
+     def _session_dir(self, session_id: str) -> Path:
+         return self.sessions / session_id
+
+     def _metadata_path(self, session_id: str) -> Path:
+         return self._session_dir(session_id) / "metadata.json"
+
+     def _state_path(self, session_id: str) -> Path:
+         return self._session_dir(session_id) / "state.json"
+
+     def _events_path(self, session_id: str) -> Path:
+         return self._session_dir(session_id) / "events.jsonl"
+
++    def _investigation_state_path(self, session_id: str) -> Path:
++        return self._session_dir(session_id) / "investigation_state.json"
++
+     def _artifacts_dir(self, session_id: str) -> Path:
+         return self._session_dir(session_id) / "artifacts"
+
+     def _plan_dir(self, session_id: str) -> Path:
+         """Directory where *.plan.md files live (same as session dir)."""
+         return self._session_dir(session_id)
+
+     def latest_session_id(self) -> str | None:
+         session_dirs = [p for p in self.sessions.iterdir() if p.is_dir()]
+         if not session_dirs:
+             return None
+         latest = max(session_dirs, key=lambda p: p.stat().st_mtime)
+         return latest.name
+
+     def list_sessions(self, limit: int = 100) -> list[dict[str, Any]]:
+         session_dirs = sorted(
+             (p for p in self.sessions.iterdir() if p.is_dir()),
+             key=lambda p: p.stat().st_mtime,
+             reverse=True,
+         )
+         out: list[dict[str, Any]] = []
+         for path in session_dirs[:limit]:
+             meta_path = path / "metadata.json"
+             meta: dict[str, Any] = {}
+             if meta_path.exists():
+@@ -129,50 +133,68 @@ class SessionStore:
+                 "created_at": _utc_now(),
+                 "updated_at": _utc_now(),
+             }
+             meta_path.write_text(json.dumps(meta, indent=2), encoding="utf-8")
+
+         state = self.load_state(sid)
+         return sid, state, created_new
+
+     def load_state(self, session_id: str) -> dict[str, Any]:
+         state_path = self._state_path(session_id)
+         if not state_path.exists():
+             return {
+                 "session_id": session_id,
+                 "external_observations": [],
+             }
+         try:
+             return json.loads(state_path.read_text(encoding="utf-8"))
+         except json.JSONDecodeError as exc:
+             raise SessionError(f"Session state is invalid JSON: {state_path}") from exc
+
+     def save_state(self, session_id: str, state: dict[str, Any]) -> None:
+         state_path = self._state_path(session_id)
+         state_path.write_text(json.dumps(state, indent=2), encoding="utf-8")
+         self._touch_metadata(session_id)
+
++    def load_investigation_state(self, session_id: str) -> dict[str, Any]:
++        typed_path = self._investigation_state_path(session_id)
++        if typed_path.exists():
++            try:
++                return json.loads(typed_path.read_text(encoding="utf-8"))
++            except json.JSONDecodeError as exc:
++                raise SessionError(f"Typed investigation state is invalid JSON: {typed_path}") from exc
++
++        legacy_state = self.load_state(session_id)
++        typed_state = from_legacy_state(legacy_state=legacy_state, session_id=session_id)
++        self.save_investigation_state(session_id, typed_state)
++        return typed_state
++
++    def save_investigation_state(self, session_id: str, typed_state: dict[str, Any]) -> None:
++        typed_path = self._investigation_state_path(session_id)
++        typed_path.write_text(json.dumps(typed_state, indent=2), encoding="utf-8")
++        self._touch_metadata(session_id)
++
+     def append_event(self, session_id: str, event_type: str, payload: dict[str, Any]) -> None:
+         event_path = self._events_path(session_id)
+         event = {
+             "ts": _utc_now(),
+             "type": event_type,
+             "payload": payload,
+         }
+         with event_path.open("a", encoding="utf-8") as fh:
+             fh.write(json.dumps(event, ensure_ascii=True) + "\n")
+         self._touch_metadata(session_id)
+
+     def write_artifact(
+         self, session_id: str, category: str, name: str, content: str
+     ) -> str:
+         category_safe = _safe_component(category)
+         name_safe = _safe_component(name)
+         artifact_rel = Path("artifacts") / category_safe / name_safe
+         artifact_abs = self._session_dir(session_id) / artifact_rel
+         artifact_abs.parent.mkdir(parents=True, exist_ok=True)
+         artifact_abs.write_text(content, encoding="utf-8")
+         self._touch_metadata(session_id)
+         return artifact_rel.as_posix()
+
+     def _touch_metadata(self, session_id: str) -> None:
+         meta_path = self._metadata_path(session_id)
+@@ -225,50 +247,51 @@ class SessionRuntime:
+     store: SessionStore
+     session_id: str
+     context: ExternalContext
+     max_persisted_observations: int = 400
+     turn_history: list[TurnSummary] | None = None
+     max_turn_summaries: int = 50
+     loop_metrics: dict[str, Any] | None = None
+
+     @classmethod
+     def bootstrap(
+         cls,
+         engine: RLMEngine,
+         config: AgentConfig,
+         session_id: str | None = None,
+         resume: bool = False,
+     ) -> "SessionRuntime":
+         store = SessionStore(
+             workspace=config.workspace,
+             session_root_dir=config.session_root_dir,
+         )
+         try:
+             _seed_wiki(config.workspace, config.session_root_dir)
+         except OSError:
+             pass
+         sid, state, created_new = store.open_session(session_id=session_id, resume=resume)
++        store.load_investigation_state(sid)
+         persisted = state.get("external_observations", [])
+         obs = [str(x) for x in persisted] if isinstance(persisted, list) else []
+         max_obs = max(1, config.max_persisted_observations)
+         context = ExternalContext(observations=obs[-max_obs:])
+
+         engine.session_dir = store._session_dir(sid)
+         engine.session_id = sid
+
+         # Load turn history from persisted state
+         raw_history = state.get("turn_history", [])
+         turn_history: list[TurnSummary] = []
+         if isinstance(raw_history, list):
+             for item in raw_history:
+                 if isinstance(item, dict):
+                     try:
+                         turn_history.append(TurnSummary.from_dict(item))
+                     except (KeyError, TypeError):
+                         pass
+         max_turns = max(1, config.max_turn_summaries)
+         raw_loop_metrics = state.get("loop_metrics", {})
+         loop_metrics: dict[str, Any] = raw_loop_metrics if isinstance(raw_loop_metrics, dict) else {}
+         loop_metrics.setdefault("turns", 0)
+         loop_metrics.setdefault("steps", 0)
+         loop_metrics.setdefault("model_turns", 0)
+         loop_metrics.setdefault("tool_calls", 0)
+@@ -438,25 +461,33 @@ class SessionRuntime:
+                 self.session_id,
+                 "result",
+                 {"text": result},
+             )
+         except OSError:
+             pass
+         try:
+             self._persist_state()
+         except OSError:
+             pass
+         return result
+
+     def _persist_state(self) -> None:
+         if len(self.context.observations) > self.max_persisted_observations:
+             self.context.observations = self.context.observations[-self.max_persisted_observations :]
+         state: dict[str, Any] = {
+             "session_id": self.session_id,
+             "saved_at": _utc_now(),
+             "external_observations": self.context.observations,
+         }
+         if self.turn_history:
+             state["turn_history"] = [t.to_dict() for t in self.turn_history]
+         if self.loop_metrics:
+             state["loop_metrics"] = self.loop_metrics
+         self.store.save_state(self.session_id, state)
++        typed_state = self.store.load_investigation_state(self.session_id)
++        merged_typed_state = merge_legacy_updates(
++            typed_state,
++            observations=self.context.observations,
++            turn_history=state.get("turn_history"),
++            loop_metrics=state.get("loop_metrics"),
++        )
++        self.store.save_investigation_state(self.session_id, merged_typed_state)
+diff --git a/openplanter-desktop/crates/op-core/src/engine/context.rs b/openplanter-desktop/crates/op-core/src/engine/context.rs
+index 0b522c2fdd088982f95c0ec18295c58d52a709ec..4f26bcd69285b9554a76ea00aebf6670c25fd0c7 100644
+--- a/openplanter-desktop/crates/op-core/src/engine/context.rs
++++ b/openplanter-desktop/crates/op-core/src/engine/context.rs
+@@ -1,129 +1,323 @@
+ // External context and turn summary types for multi-turn sessions.
+
+ use serde::{Deserialize, Serialize};
++use serde_json::{json, Map, Value};
+ use std::path::Path;
+ use tokio::fs;
+
+ /// Summary of a completed turn for inclusion in subsequent prompts.
+ #[derive(Debug, Clone, Serialize, Deserialize)]
+ pub struct TurnSummary {
+     pub turn_number: u32,
+     pub objective: String,
+     pub result_preview: String,
+     pub timestamp: String,
+     pub steps_used: u32,
+     pub replay_seq_start: u64,
+ }
+
+ /// External context observations persisted to state.json.
+ #[derive(Debug, Clone, Serialize, Deserialize)]
+ pub struct ExternalContext {
+     pub observations: Vec<Observation>,
+ }
+
+ /// A single observation from an external source.
+ #[derive(Debug, Clone, Serialize, Deserialize)]
+ pub struct Observation {
+     pub source: String,
+     pub timestamp: String,
+     pub content: String,
+ }
+
++#[derive(Debug, Clone, Deserialize)]
++struct LegacyState {
++    #[serde(default)]
++    external_observations: Vec<String>,
++}
++
+ impl ExternalContext {
+     pub fn new() -> Self {
+         Self {
+             observations: vec![],
+         }
+     }
+
+     /// Add a new observation with the current timestamp.
+     pub fn add_observation(&mut self, source: &str, content: &str) {
+         self.observations.push(Observation {
+             source: source.to_string(),
+             timestamp: chrono::Utc::now().to_rfc3339(),
+             content: content.to_string(),
+         });
+     }
+
+-    /// Load external context from state.json in the session directory.
++    /// Load external context from typed/legacy session state.
+     pub async fn load(session_dir: &Path) -> std::io::Result<Self> {
++        let typed_path = session_dir.join("investigation_state.json");
++        if typed_path.exists() {
++            let content = fs::read_to_string(&typed_path).await?;
++            let parsed: Value = serde_json::from_str(&content)
++                .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
++            if let Some(legacy_obs) = parsed
++                .get("legacy")
++                .and_then(|legacy| legacy.get("external_observations"))
++                .and_then(Value::as_array)
++            {
++                let observations = legacy_obs
++                    .iter()
++                    .map(|v| Observation {
++                        source: "legacy".to_string(),
++                        timestamp: String::new(),
++                        content: v.as_str().unwrap_or_default().to_string(),
++                    })
++                    .collect();
++                return Ok(Self { observations });
++            }
++            return Ok(Self::new());
++        }
++
+         let path = session_dir.join("state.json");
+         if !path.exists() {
+             return Ok(Self::new());
+         }
+         let content = fs::read_to_string(&path).await?;
+-        serde_json::from_str(&content)
+-            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))
++
++        if let Ok(parsed) = serde_json::from_str::<ExternalContext>(&content) {
++            return Ok(parsed);
++        }
++
++        if let Ok(legacy) = serde_json::from_str::<LegacyState>(&content) {
++            let observations = legacy
++                .external_observations
++                .into_iter()
++                .map(|content| Observation {
++                    source: "legacy".to_string(),
++                    timestamp: String::new(),
++                    content,
++                })
++                .collect();
++            return Ok(Self { observations });
++        }
++
++        Err(std::io::Error::new(
++            std::io::ErrorKind::InvalidData,
++            "invalid state.json format",
++        ))
+     }
+
+-    /// Save external context to state.json in the session directory.
++    /// Save external context to state.json and additive investigation_state.json.
+     pub async fn save(&self, session_dir: &Path) -> std::io::Result<()> {
+         let path = session_dir.join("state.json");
+         let json = serde_json::to_string_pretty(self)
+-            .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
+-        fs::write(&path, json).await
++            .map_err(|e| std::io::Error::other(e.to_string()))?;
++        fs::write(&path, json).await?;
++
++        let typed_path = session_dir.join("investigation_state.json");
++        let typed = merge_into_typed_state(
++            load_existing_typed_state(&typed_path).await?,
++            session_dir
++                .file_name()
++                .and_then(|name| name.to_str())
++                .unwrap_or_default(),
++            self,
++        );
++        let typed_json = serde_json::to_string_pretty(&typed)
++            .map_err(|e| std::io::Error::other(e.to_string()))?;
++        fs::write(typed_path, typed_json).await
++    }
++}
++
++fn load_default_typed_state(session_id: &str) -> Value {
++    let now = chrono::Utc::now().to_rfc3339();
++    json!({
++      "schema_version": "1.0.0",
++      "session_id": session_id,
++      "created_at": now,
++      "updated_at": now,
++      "objective": "",
++      "ontology": {"namespace": "openplanter.core", "version": "2026-03"},
++      "entities": {},
++      "links": {},
++      "claims": {},
++      "evidence": {},
++      "hypotheses": {},
++      "questions": {},
++      "tasks": {},
++      "actions": {},
++      "provenance_nodes": {},
++      "confidence_profiles": {},
++      "timeline": [],
++      "indexes": {"by_external_ref": {}, "by_tag": {}},
++      "legacy": {"external_observations": [], "turn_history": [], "loop_metrics": {}}
++    })
++}
++
++async fn load_existing_typed_state(typed_path: &Path) -> std::io::Result<Option<Value>> {
++    if !typed_path.exists() {
++        return Ok(None);
++    }
++    let content = fs::read_to_string(typed_path).await?;
++    let parsed: Value = serde_json::from_str(&content)
++        .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
++    Ok(Some(parsed))
++}
++
++fn ensure_object<'a>(map: &'a mut Map<String, Value>, key: &str) -> &'a mut Map<String, Value> {
++    let value = map
++        .entry(key.to_string())
++        .or_insert_with(|| Value::Object(Map::new()));
++    if !value.is_object() {
++        *value = Value::Object(Map::new());
++    }
++    value.as_object_mut().expect("object initialized")
++}
++
++fn merge_into_typed_state(existing: Option<Value>, session_id: &str, ctx: &ExternalContext) -> Value {
++    let now = chrono::Utc::now().to_rfc3339();
++    let mut root = existing.unwrap_or_else(|| load_default_typed_state(session_id));
++    if !root.is_object() {
++        root = load_default_typed_state(session_id);
++    }
++    let root_obj = root.as_object_mut().expect("root object");
++    root_obj.insert("schema_version".to_string(), Value::String("1.0.0".to_string()));
++    root_obj
++        .entry("session_id".to_string())
++        .or_insert_with(|| Value::String(session_id.to_string()));
++    root_obj
++        .entry("created_at".to_string())
++        .or_insert_with(|| Value::String(now.clone()));
++    root_obj.insert("updated_at".to_string(), Value::String(now));
++
++    let legacy_obj = ensure_object(root_obj, "legacy");
++    legacy_obj.insert(
++        "external_observations".to_string(),
++        Value::Array(
++            ctx.observations
++                .iter()
++                .map(|obs| Value::String(obs.content.clone()))
++                .collect(),
++        ),
++    );
++
++    legacy_obj
++        .entry("turn_history".to_string())
++        .or_insert_with(|| Value::Array(vec![]));
++    legacy_obj
++        .entry("loop_metrics".to_string())
++        .or_insert_with(|| Value::Object(Map::new()));
++
++    let evidence_obj = ensure_object(root_obj, "evidence");
++    for (idx, observation) in ctx.observations.iter().enumerate() {
++        let evidence_id = format!("ev_legacy_{:04}", idx + 1);
++        evidence_obj.entry(evidence_id.clone()).or_insert_with(|| {
++            json!({
++                "id": evidence_id,
++                "evidence_type": "human_note",
++                "content": observation.content,
++                "normalization": {
++                    "kind": "analyst_note",
++                    "normalization_version": "legacy-v1"
++                }
++            })
++        });
+     }
++
++    root
+ }
+
+ impl Default for ExternalContext {
+     fn default() -> Self {
+         Self::new()
+     }
+ }
+
+ #[cfg(test)]
+ mod tests {
+     use super::*;
+     use tempfile::tempdir;
+
+     #[test]
+     fn test_new_context_empty() {
+         let ctx = ExternalContext::new();
+         assert!(ctx.observations.is_empty());
+     }
+
+     #[test]
+     fn test_add_observation() {
+         let mut ctx = ExternalContext::new();
+         ctx.add_observation("wiki", "Found entity Acme Corp");
+         assert_eq!(ctx.observations.len(), 1);
+         assert_eq!(ctx.observations[0].source, "wiki");
+         assert_eq!(ctx.observations[0].content, "Found entity Acme Corp");
+         assert!(!ctx.observations[0].timestamp.is_empty());
+     }
+
+     #[tokio::test]
+     async fn test_save_and_load() {
+         let tmp = tempdir().unwrap();
+         let mut ctx = ExternalContext::new();
+         ctx.add_observation("wiki", "test observation");
+         ctx.save(tmp.path()).await.unwrap();
+
+         let loaded = ExternalContext::load(tmp.path()).await.unwrap();
+         assert_eq!(loaded.observations.len(), 1);
+         assert_eq!(loaded.observations[0].content, "test observation");
++
++        let typed_path = tmp.path().join("investigation_state.json");
++        assert!(typed_path.exists());
+     }
+
+     #[tokio::test]
+     async fn test_load_missing_returns_empty() {
+         let tmp = tempdir().unwrap();
+         let ctx = ExternalContext::load(tmp.path()).await.unwrap();
+         assert!(ctx.observations.is_empty());
+     }
+
++    #[tokio::test]
++    async fn test_loads_legacy_text_observations() {
++        let tmp = tempdir().unwrap();
++        fs::write(
++            tmp.path().join("state.json"),
++            r#"{"external_observations":["obs a","obs b"]}"#,
++        )
++        .await
++        .unwrap();
++
++        let loaded = ExternalContext::load(tmp.path()).await.unwrap();
++        assert_eq!(loaded.observations.len(), 2);
++        assert_eq!(loaded.observations[0].content, "obs a");
++    }
++
++    #[tokio::test]
++    async fn test_loads_from_typed_legacy_section() {
++        let tmp = tempdir().unwrap();
++        fs::write(
++            tmp.path().join("investigation_state.json"),
++            r#"{"legacy":{"external_observations":["typed obs"]}}"#,
++        )
++        .await
++        .unwrap();
++
++        let loaded = ExternalContext::load(tmp.path()).await.unwrap();
++        assert_eq!(loaded.observations.len(), 1);
++        assert_eq!(loaded.observations[0].content, "typed obs");
++    }
++
+     #[test]
+     fn test_turn_summary_serialization() {
+         let ts = TurnSummary {
+             turn_number: 1,
+             objective: "Investigate Acme Corp".into(),
+             result_preview: "Found connections to...".into(),
+             timestamp: "2026-01-01T00:00:00Z".into(),
+             steps_used: 3,
+             replay_seq_start: 1,
+         };
+         let json = serde_json::to_string(&ts).unwrap();
+         let parsed: TurnSummary = serde_json::from_str(&json).unwrap();
+         assert_eq!(parsed.turn_number, 1);
+         assert_eq!(parsed.objective, "Investigate Acme Corp");
+     }
+ }
+diff --git a/tests/test_investigation_state_migration.py b/tests/test_investigation_state_migration.py
+new file mode 100644
+index 0000000000000000000000000000000000000000..f37a31b8cd060bb5013b19df6403dc90515f05ab
+--- /dev/null
++++ b/tests/test_investigation_state_migration.py
+@@ -0,0 +1,75 @@
++from __future__ import annotations
++
++import json
++import tempfile
++import unittest
++from pathlib import Path
++
++from agent.config import AgentConfig
++from agent.engine import RLMEngine
++from agent.model import ModelTurn, ScriptedModel
++from agent.runtime import SessionRuntime
++from agent.tools import WorkspaceTools
++
++
++class InvestigationStateMigrationTests(unittest.TestCase):
++    def test_bootstrap_migrates_legacy_state_into_typed_file(self) -> None:
++        with tempfile.TemporaryDirectory() as tmpdir:
++            root = Path(tmpdir)
++            session_dir = root / ".openplanter" / "sessions" / "legacy-sess"
++            session_dir.mkdir(parents=True, exist_ok=True)
++            (session_dir / "state.json").write_text(
++                json.dumps(
++                    {
++                        "session_id": "legacy-sess",
++                        "saved_at": "2026-03-13T00:00:00+00:00",
++                        "external_observations": ["alpha", "beta"],
++                    }
++                ),
++                encoding="utf-8",
++            )
++
++            cfg = AgentConfig(workspace=root, session_root_dir=".openplanter")
++            model = ScriptedModel(scripted_turns=[ModelTurn(text="done", stop_reason="end_turn")])
++            runtime = SessionRuntime.bootstrap(
++                engine=RLMEngine(model=model, tools=WorkspaceTools(root=root), config=cfg),
++                config=cfg,
++                session_id="legacy-sess",
++                resume=True,
++            )
++            self.assertEqual(runtime.context.observations, ["alpha", "beta"])
++
++            typed = json.loads((session_dir / "investigation_state.json").read_text(encoding="utf-8"))
++            self.assertEqual(typed["legacy"]["external_observations"], ["alpha", "beta"])
++            self.assertIn("ev_legacy_0001", typed["evidence"])
++            self.assertEqual(typed["evidence"]["ev_legacy_0002"]["content"], "beta")
++
++    def test_persist_updates_typed_legacy_section_without_removing_existing_keys(self) -> None:
++        with tempfile.TemporaryDirectory() as tmpdir:
++            root = Path(tmpdir)
++            cfg = AgentConfig(workspace=root, session_root_dir=".openplanter")
++            model = ScriptedModel(scripted_turns=[ModelTurn(text="ok", stop_reason="end_turn")])
++            runtime = SessionRuntime.bootstrap(
++                engine=RLMEngine(model=model, tools=WorkspaceTools(root=root), config=cfg),
++                config=cfg,
++                session_id="typed-sess",
++                resume=False,
++            )
++            session_dir = root / ".openplanter" / "sessions" / "typed-sess"
++            typed_path = session_dir / "investigation_state.json"
++
++            typed = json.loads(typed_path.read_text(encoding="utf-8"))
++            typed["questions"] = {"q_1": {"id": "q_1", "question_text": "keep me"}}
++            typed_path.write_text(json.dumps(typed), encoding="utf-8")
++
++            runtime.context.observations = ["obs one"]
++            runtime._persist_state()
++
++            updated = json.loads(typed_path.read_text(encoding="utf-8"))
++            self.assertEqual(updated["legacy"]["external_observations"], ["obs one"])
++            self.assertEqual(updated["questions"]["q_1"]["question_text"], "keep me")
++            self.assertEqual(updated["evidence"]["ev_legacy_0001"]["content"], "obs one")
++
++
++if __name__ == "__main__":
++    unittest.main()
+
+EOF
+)
diff --git a/openplanter-desktop/crates/op-core/src/engine/context.rs b/openplanter-desktop/crates/op-core/src/engine/context.rs
index 0b522c2f..e84955cd 100644
--- a/openplanter-desktop/crates/op-core/src/engine/context.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/context.rs
@@ -1,9 +1,12 @@
 // External context and turn summary types for multi-turn sessions.
 
 use serde::{Deserialize, Serialize};
+use serde_json::Value;
 use std::path::Path;
 use tokio::fs;
 
+use super::investigation_state::InvestigationState;
+
 /// Summary of a completed turn for inclusion in subsequent prompts.
 #[derive(Debug, Clone, Serialize, Deserialize)]
 pub struct TurnSummary {
@@ -45,23 +48,84 @@ impl ExternalContext {
         });
     }
 
-    /// Load external context from state.json in the session directory.
+    /// Load external context from canonical investigation_state.json or legacy state.json.
     pub async fn load(session_dir: &Path) -> std::io::Result<Self> {
-        let path = session_dir.join("state.json");
-        if !path.exists() {
+        let typed_path = session_dir.join("investigation_state.json");
+        if typed_path.exists() {
+            let content = fs::read_to_string(&typed_path).await?;
+            let state: InvestigationState = serde_json::from_str(&content)
+                .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
+            return Ok(Self {
+                observations: state
+                    .legacy_observations()
+                    .into_iter()
+                    .map(|content| Observation {
+                        source: "legacy".to_string(),
+                        timestamp: String::new(),
+                        content,
+                    })
+                    .collect(),
+            });
+        }
+
+        let legacy_path = session_dir.join("state.json");
+        if !legacy_path.exists() {
             return Ok(Self::new());
         }
-        let content = fs::read_to_string(&path).await?;
-        serde_json::from_str(&content)
-            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))
+        let content = fs::read_to_string(&legacy_path).await?;
+        let value: Value = serde_json::from_str(&content)
+            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
+
+        if let Some(observations) = legacy_python_observations(&value) {
+            return Ok(Self {
+                observations: observations
+                    .into_iter()
+                    .map(|content| Observation {
+                        source: "legacy".to_string(),
+                        timestamp: String::new(),
+                        content,
+                    })
+                    .collect(),
+            });
+        }
+
+        if let Some(observations) = legacy_rust_observations(&value) {
+            return Ok(Self { observations });
+        }
+
+        Err(std::io::Error::new(
+            std::io::ErrorKind::InvalidData,
+            "state.json format not recognized",
+        ))
     }
 
-    /// Save external context to state.json in the session directory.
+    /// Save external context to additive investigation_state.json and legacy state.json.
     pub async fn save(&self, session_dir: &Path) -> std::io::Result<()> {
-        let path = session_dir.join("state.json");
-        let json = serde_json::to_string_pretty(self)
-            .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
-        fs::write(&path, json).await
+        let session_id = session_dir
+            .file_name()
+            .and_then(|value| value.to_str())
+            .unwrap_or_default();
+        let typed_path = session_dir.join("investigation_state.json");
+        let legacy_path = session_dir.join("state.json");
+
+        let mut typed_state = load_existing_investigation_state(session_dir, session_id).await?;
+        if typed_state.session_id.is_empty() {
+            typed_state.session_id = session_id.to_string();
+        }
+        let observations: Vec<String> = self
+            .observations
+            .iter()
+            .map(|observation| observation.content.clone())
+            .collect();
+        typed_state.merge_legacy_updates(&observations, None, None, None);
+
+        let typed_json = serde_json::to_string_pretty(&typed_state)
+            .map_err(|e| std::io::Error::other(e.to_string()))?;
+        fs::write(&typed_path, typed_json).await?;
+
+        let legacy_json = serde_json::to_string_pretty(&typed_state.to_legacy_python_projection())
+            .map_err(|e| std::io::Error::other(e.to_string()))?;
+        fs::write(&legacy_path, legacy_json).await
     }
 }
 
@@ -71,6 +135,84 @@ impl Default for ExternalContext {
     }
 }
 
+async fn load_existing_investigation_state(
+    session_dir: &Path,
+    session_id: &str,
+) -> std::io::Result<InvestigationState> {
+    let typed_path = session_dir.join("investigation_state.json");
+    if typed_path.exists() {
+        let content = fs::read_to_string(&typed_path).await?;
+        return serde_json::from_str(&content)
+            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e));
+    }
+
+    let legacy_path = session_dir.join("state.json");
+    if !legacy_path.exists() {
+        return Ok(InvestigationState::new(session_id));
+    }
+
+    let content = fs::read_to_string(&legacy_path).await?;
+    let value: Value = serde_json::from_str(&content)
+        .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
+
+    if legacy_python_observations(&value).is_some() {
+        return Ok(InvestigationState::from_legacy_python_state(
+            session_id, &value,
+        ));
+    }
+    if legacy_rust_observations(&value).is_some() {
+        return Ok(InvestigationState::from_legacy_rust_state(
+            session_id, &value,
+        ));
+    }
+
+    Err(std::io::Error::new(
+        std::io::ErrorKind::InvalidData,
+        "state.json format not recognized",
+    ))
+}
+
+fn legacy_python_observations(value: &Value) -> Option<Vec<String>> {
+    value
+        .as_object()?
+        .get("external_observations")?
+        .as_array()
+        .map(|items| {
+            items
+                .iter()
+                .filter_map(Value::as_str)
+                .map(ToString::to_string)
+                .collect()
+        })
+}
+
+fn legacy_rust_observations(value: &Value) -> Option<Vec<Observation>> {
+    let observations = value.as_object()?.get("observations")?.as_array()?;
+    Some(
+        observations
+            .iter()
+            .filter_map(|item| item.as_object())
+            .map(|item| Observation {
+                source: item
+                    .get("source")
+                    .and_then(Value::as_str)
+                    .unwrap_or("legacy")
+                    .to_string(),
+                timestamp: item
+                    .get("timestamp")
+                    .and_then(Value::as_str)
+                    .unwrap_or_default()
+                    .to_string(),
+                content: item
+                    .get("content")
+                    .and_then(Value::as_str)
+                    .unwrap_or_default()
+                    .to_string(),
+            })
+            .collect(),
+    )
+}
+
 #[cfg(test)]
 mod tests {
     use super::*;
@@ -102,6 +244,8 @@ mod tests {
         let loaded = ExternalContext::load(tmp.path()).await.unwrap();
         assert_eq!(loaded.observations.len(), 1);
         assert_eq!(loaded.observations[0].content, "test observation");
+        assert!(tmp.path().join("investigation_state.json").exists());
+        assert!(tmp.path().join("state.json").exists());
     }
 
     #[tokio::test]
@@ -111,6 +255,135 @@ mod tests {
         assert!(ctx.observations.is_empty());
     }
 
+    #[tokio::test]
+    async fn test_load_legacy_python_state_shape() {
+        let tmp = tempdir().unwrap();
+        fs::write(
+            tmp.path().join("state.json"),
+            r#"{"session_id":"sid","external_observations":["one","two"]}"#,
+        )
+        .await
+        .unwrap();
+
+        let ctx = ExternalContext::load(tmp.path()).await.unwrap();
+        assert_eq!(ctx.observations.len(), 2);
+        assert_eq!(ctx.observations[0].content, "one");
+        assert_eq!(ctx.observations[1].content, "two");
+    }
+
+    #[tokio::test]
+    async fn test_load_legacy_rust_state_shape() {
+        let tmp = tempdir().unwrap();
+        fs::write(
+            tmp.path().join("state.json"),
+            r#"{"observations":[{"source":"wiki","timestamp":"2026-03-13T00:00:00Z","content":"one"},{"source":"tool","timestamp":"2026-03-13T00:00:01Z","content":"two"}]}"#,
+        )
+        .await
+        .unwrap();
+
+        let ctx = ExternalContext::load(tmp.path()).await.unwrap();
+        assert_eq!(ctx.observations.len(), 2);
+        assert_eq!(ctx.observations[0].source, "wiki");
+        assert_eq!(ctx.observations[1].content, "two");
+    }
+
+    #[tokio::test]
+    async fn test_load_typed_state_falls_back_to_evidence() {
+        let tmp = tempdir().unwrap();
+        fs::write(
+            tmp.path().join("investigation_state.json"),
+            r#"{"schema_version":"1.0.0","session_id":"sid","evidence":{"ev_legacy_000002":{"content":"two","normalization":{"kind":"legacy_observation"}},"ev_legacy_000001":{"content":"one","normalization":{"kind":"legacy_observation"}}}}"#,
+        )
+        .await
+        .unwrap();
+
+        let ctx = ExternalContext::load(tmp.path()).await.unwrap();
+        assert_eq!(ctx.observations.len(), 2);
+        assert_eq!(ctx.observations[0].content, "one");
+        assert_eq!(ctx.observations[1].content, "two");
+    }
+
+    #[tokio::test]
+    async fn test_save_preserves_existing_typed_fields_and_extra_fields() {
+        let tmp = tempdir().unwrap();
+        fs::write(
+            tmp.path().join("investigation_state.json"),
+            r#"{
+  "schema_version": "1.0.0",
+  "session_id": "",
+  "created_at": "2026-03-13T00:00:00Z",
+  "updated_at": "2026-03-13T00:00:00Z",
+  "objective": "",
+  "ontology": {"namespace": "openplanter.core", "version": "2026-03"},
+  "entities": {},
+  "links": {},
+  "claims": {},
+  "evidence": {
+    "ev_legacy_000002": {
+      "id": "ev_legacy_000002",
+      "content": "stale",
+      "normalization": {"kind": "legacy_observation"}
+    },
+    "ev_other": {
+      "id": "ev_other",
+      "content": "keep me",
+      "normalization": {"kind": "web_fetch"}
+    }
+  },
+  "hypotheses": {},
+  "questions": {"q_1": {"id": "q_1", "question_text": "keep me"}},
+  "tasks": {},
+  "actions": {},
+  "provenance_nodes": {},
+  "confidence_profiles": {},
+  "timeline": [],
+  "indexes": {"by_external_ref": {}, "by_tag": {}},
+  "legacy": {
+    "external_observations": ["stale"],
+    "turn_history": [{"turn_number": 2}],
+    "loop_metrics": {"turns": 2},
+    "extra_fields": {"custom_field": "persist"}
+  }
+}"#,
+        )
+        .await
+        .unwrap();
+
+        let mut ctx = ExternalContext::new();
+        ctx.add_observation("wiki", "fresh");
+        ctx.save(tmp.path()).await.unwrap();
+
+        let typed: Value = serde_json::from_str(
+            &fs::read_to_string(tmp.path().join("investigation_state.json"))
+                .await
+                .unwrap(),
+        )
+        .unwrap();
+        assert_eq!(
+            typed["questions"]["q_1"]["question_text"],
+            Value::String("keep me".to_string())
+        );
+        assert!(typed["evidence"].get("ev_other").is_some());
+        assert!(typed["evidence"].get("ev_legacy_000002").is_none());
+        assert_eq!(
+            typed["evidence"]["ev_legacy_000001"]["content"],
+            Value::String("fresh".to_string())
+        );
+
+        let legacy: Value = serde_json::from_str(
+            &fs::read_to_string(tmp.path().join("state.json"))
+                .await
+                .unwrap(),
+        )
+        .unwrap();
+        assert_eq!(
+            legacy["external_observations"],
+            serde_json::json!(["fresh"])
+        );
+        assert_eq!(legacy["custom_field"], Value::String("persist".to_string()));
+        assert_eq!(legacy["loop_metrics"]["turns"], Value::from(2));
+    }
+
     #[test]
     fn test_turn_summary_serialization() {
         let ts = TurnSummary {
diff --git a/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs b/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs
new file mode 100644
index 00000000..e2620158
--- /dev/null
+++ b/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs
@@ -0,0 +1,448 @@
+use chrono::Utc;
+use serde::{Deserialize, Serialize};
+use serde_json::{Map, Value};
+use std::collections::{BTreeMap, BTreeSet};
+
+const SCHEMA_VERSION: &str = "1.0.0";
+const ONTOLOGY_NAMESPACE: &str = "openplanter.core";
+const ONTOLOGY_VERSION: &str = "2026-03";
+const LEGACY_KNOWN_KEYS: &[&str] = &[
+    "session_id",
+    "saved_at",
+    "external_observations",
+    "observations",
+    "turn_history",
+    "loop_metrics",
+];
+
+#[derive(Debug, Clone, Serialize, Deserialize)]
+pub struct InvestigationState {
+    #[serde(default = "default_schema_version")]
+    pub schema_version: String,
+    #[serde(default)]
+    pub session_id: String,
+    #[serde(default)]
+    pub created_at: String,
+    #[serde(default)]
+    pub updated_at: String,
+    #[serde(default)]
+    pub objective: String,
+    #[serde(default)]
+    pub ontology: Ontology,
+    #[serde(default)]
+    pub entities: BTreeMap<String, Value>,
+    #[serde(default)]
+    pub links: BTreeMap<String, Value>,
+    #[serde(default)]
+    pub claims: BTreeMap<String, Value>,
+    #[serde(default)]
+    pub evidence: BTreeMap<String, Value>,
+    #[serde(default)]
+    pub hypotheses: BTreeMap<String, Value>,
+    #[serde(default)]
+    pub questions: BTreeMap<String, Value>,
+    #[serde(default)]
+    pub tasks: BTreeMap<String, Value>,
+    #[serde(default)]
+    pub actions: BTreeMap<String, Value>,
+    #[serde(default)]
+    pub provenance_nodes: BTreeMap<String, Value>,
+    #[serde(default)]
+    pub confidence_profiles: BTreeMap<String, Value>,
+    #[serde(default)]
+    pub timeline: Vec<Value>,
+    #[serde(default)]
+    pub indexes: Indexes,
+    #[serde(default)]
+    pub legacy: LegacyState,
+}
+
+#[derive(Debug, Clone, Serialize, Deserialize)]
+pub struct Ontology {
+    #[serde(default = "default_ontology_namespace")]
+    pub namespace: String,
+    #[serde(default = "default_ontology_version")]
+    pub version: String,
+}
+
+#[derive(Debug, Clone, Serialize, Deserialize, Default)]
+pub struct LegacyState {
+    #[serde(default)]
+    pub external_observations: Vec<String>,
+    #[serde(default)]
+    pub turn_history: Vec<Value>,
+    #[serde(default)]
+    pub loop_metrics: Map<String, Value>,
+    #[serde(default)]
+    pub extra_fields: BTreeMap<String, Value>,
+}
+
+#[derive(Debug, Clone, Serialize, Deserialize, Default)]
+pub struct Indexes {
+    #[serde(default)]
+    pub by_external_ref: BTreeMap<String, Value>,
+    #[serde(default)]
+    pub by_tag: BTreeMap<String, Value>,
+}
+
+impl Default for InvestigationState {
+    fn default() -> Self {
+        Self::new("")
+    }
+}
+
+impl Default for Ontology {
+    fn default() -> Self {
+        Self {
+            namespace: default_ontology_namespace(),
+            version: default_ontology_version(),
+        }
+    }
+}
+
+impl InvestigationState {
+    pub fn new(session_id: &str) -> Self {
+        let ts = now();
+        Self {
+            schema_version: default_schema_version(),
+            session_id: session_id.to_string(),
+            created_at: ts.clone(),
+            updated_at: ts,
+            objective: String::new(),
+            ontology: Ontology::default(),
+            entities: BTreeMap::new(),
+            links: BTreeMap::new(),
+            claims: BTreeMap::new(),
+            evidence: BTreeMap::new(),
+            hypotheses: BTreeMap::new(),
+            questions: BTreeMap::new(),
+            tasks: BTreeMap::new(),
+            actions: BTreeMap::new(),
+            provenance_nodes: BTreeMap::new(),
+            confidence_profiles: BTreeMap::new(),
+            timeline: vec![],
+            indexes: Indexes::default(),
+            legacy: LegacyState::default(),
+        }
+    }
+
+    pub fn from_legacy_python_state(session_id: &str, legacy_json: &Value) -> Self {
+        let mut state = Self::new(session_id);
+        let Some(obj) = legacy_json.as_object() else {
+            return state;
+        };
+
+        if let Some(saved_at) = obj.get("saved_at").and_then(Value::as_str) {
+            state.updated_at = saved_at.to_string();
+            state.created_at = saved_at.to_string();
+        }
+        if let Some(session_id) = obj.get("session_id").and_then(Value::as_str) {
+            state.session_id = session_id.to_string();
+        }
+        state.legacy.external_observations = obj
+            .get("external_observations")
+            .and_then(Value::as_array)
+            .map(|items| string_vec(items))
+            .unwrap_or_default();
+        state.legacy.turn_history = obj
+            .get("turn_history")
+            .and_then(Value::as_array)
+            .cloned()
+            .unwrap_or_default();
+        state.legacy.loop_metrics = obj
+            .get("loop_metrics")
+            .and_then(Value::as_object)
+            .cloned()
+            .unwrap_or_default();
+        state.legacy.extra_fields = extra_fields_from_object(obj);
+        let observations = state.legacy.external_observations.clone();
+        state.merge_legacy_updates(
+            &observations,
+            Some(&state.legacy.turn_history.clone()),
+            Some(&state.legacy.loop_metrics.clone()),
+            Some(&state.legacy.extra_fields.clone()),
+        );
+        state
+    }
+
+    pub fn from_legacy_rust_state(session_id: &str, legacy_json: &Value) -> Self {
+        let mut state = Self::new(session_id);
+        let Some(obj) = legacy_json.as_object() else {
+            return state;
+        };
+
+        state.legacy.external_observations = obj
+            .get("observations")
+            .and_then(Value::as_array)
+            .map(|items| {
+                items
+                    .iter()
+                    .filter_map(|item| item.get("content").and_then(Value::as_str))
+                    .map(ToString::to_string)
+                    .collect()
+            })
+            .unwrap_or_default();
+        state.legacy.extra_fields = extra_fields_from_object(obj);
+        let observations = state.legacy.external_observations.clone();
+        state.merge_legacy_updates(
+            &observations,
+            Some(&state.legacy.turn_history.clone()),
+            Some(&state.legacy.loop_metrics.clone()),
+            Some(&state.legacy.extra_fields.clone()),
+        );
+        state
+    }
+
+    pub fn legacy_observations(&self) -> Vec<String> {
+        if !self.legacy.external_observations.is_empty() {
+            return self.legacy.external_observations.clone();
+        }
+
+        let mut observations: Vec<(String, String)> = self
+            .evidence
+            .iter()
+            .filter_map(|(evidence_id, record)| {
+                if !is_legacy_evidence(evidence_id, record) {
+                    return None;
+                }
+                record
+                    .get("content")
+                    .and_then(Value::as_str)
+                    .map(|content| (evidence_id.clone(), content.to_string()))
+            })
+            .collect();
+        observations.sort_by(|left, right| left.0.cmp(&right.0));
+        observations
+            .into_iter()
+            .map(|(_, content)| content)
+            .collect()
+    }
+
+    pub fn merge_legacy_updates(
+        &mut self,
+        observations: &[String],
+        turn_history: Option<&[Value]>,
+        loop_metrics: Option<&Map<String, Value>>,
+        extra_fields: Option<&BTreeMap<String, Value>>,
+    ) {
+        let ts = now();
+        if self.created_at.is_empty() {
+            self.created_at = ts.clone();
+        }
+        self.updated_at = ts.clone();
+        self.schema_version = default_schema_version();
+        self.legacy.external_observations = observations.to_vec();
+        if let Some(turn_history) = turn_history {
+            self.legacy.turn_history = turn_history.to_vec();
+        }
+        if let Some(loop_metrics) = loop_metrics {
+            self.legacy.loop_metrics = loop_metrics.clone();
+        }
+        if let Some(extra_fields) = extra_fields {
+            self.legacy.extra_fields = extra_fields.clone();
+        }
+
+        for (index, observation) in observations.iter().enumerate() {
+            let evidence_id = legacy_evidence_id(index);
+            let source_uri = legacy_source_uri(index);
+            let created_at = self
+                .evidence
+                .get(&evidence_id)
+                .and_then(|value| value.get("created_at"))
+                .and_then(Value::as_str)
+                .unwrap_or(ts.as_str())
+                .to_string();
+            self.evidence.insert(
+                evidence_id.clone(),
+                serde_json::json!({
+                    "id": evidence_id,
+                    "evidence_type": "legacy_observation",
+                    "content": observation,
+                    "source_uri": source_uri,
+                    "normalization": {
+                        "kind": "legacy_observation",
+                        "normalization_version": "legacy-v1",
+                    },
+                    "provenance_ids": [],
+                    "confidence_id": Value::Null,
+                    "created_at": created_at,
+                    "updated_at": ts,
+                }),
+            );
+            self.indexes
+                .by_external_ref
+                .insert(source_uri, Value::String(legacy_evidence_id(index)));
+        }
+
+        let keep_ids: BTreeSet<String> = (0..observations.len()).map(legacy_evidence_id).collect();
+        self.evidence.retain(|evidence_id, record| {
+            !is_legacy_evidence(evidence_id, record) || keep_ids.contains(evidence_id)
+        });
+        self.indexes.by_external_ref.retain(|source_ref, target| {
+            if !source_ref.starts_with("state.json#external_observations[") {
+                return true;
+            }
+            target
+                .as_str()
+                .map(|target| keep_ids.contains(target))
+                .unwrap_or(false)
+        });
+    }
+
+    pub fn to_legacy_python_projection(&self) -> Value {
+        let mut projected = Map::new();
+        projected.insert(
+            "session_id".to_string(),
+            Value::String(self.session_id.clone()),
+        );
+        projected.insert(
+            "saved_at".to_string(),
+            Value::String(self.updated_at.clone()),
+        );
+        projected.insert(
+            "external_observations".to_string(),
+            Value::Array(
+                self.legacy_observations()
+                    .into_iter()
+                    .map(Value::String)
+                    .collect(),
+            ),
+        );
+        projected.insert(
+            "turn_history".to_string(),
+            Value::Array(self.legacy.turn_history.clone()),
+        );
+        projected.insert(
+            "loop_metrics".to_string(),
+            Value::Object(self.legacy.loop_metrics.clone()),
+        );
+        for (key, value) in &self.legacy.extra_fields {
+            projected
+                .entry(key.clone())
+                .or_insert_with(|| value.clone());
+        }
+        Value::Object(projected)
+    }
+}
+
+fn default_schema_version() -> String {
+    SCHEMA_VERSION.to_string()
+}
+
+fn default_ontology_namespace() -> String {
+    ONTOLOGY_NAMESPACE.to_string()
+}
+
+fn default_ontology_version() -> String {
+    ONTOLOGY_VERSION.to_string()
+}
+
+fn now() -> String {
+    Utc::now().to_rfc3339()
+}
+
+fn legacy_evidence_id(index: usize) -> String {
+    format!("ev_legacy_{:06}", index + 1)
+}
+
+fn legacy_source_uri(index: usize) -> String {
+    format!("state.json#external_observations[{index}]")
+}
+
+fn string_vec(items: &[Value]) -> Vec<String> {
+    items
+        .iter()
+        .filter_map(Value::as_str)
+        .map(ToString::to_string)
+        .collect()
+}
+
+fn extra_fields_from_object(obj: &Map<String, Value>) -> BTreeMap<String, Value> {
+    obj.iter()
+        .filter(|(key, _)| !LEGACY_KNOWN_KEYS.contains(&key.as_str()))
+        .map(|(key, value)| (key.clone(), value.clone()))
+        .collect()
+}
+
+fn is_legacy_evidence(evidence_id: &str, record: &Value) -> bool {
+    if !evidence_id.starts_with("ev_legacy_") {
+        return false;
+    }
+    record
+        .get("normalization")
+        .and_then(Value::as_object)
+        .and_then(|normalization| normalization.get("kind"))
+        .and_then(Value::as_str)
+        == Some("legacy_observation")
+}
+
+#[cfg(test)]
+mod tests {
+    use super::*;
+
+    #[test]
+    fn migrates_legacy_python_state_with_extra_fields() {
+        let legacy = serde_json::json!({
+            "session_id": "sid",
+            "saved_at": "2026-03-13T00:00:00Z",
+            "external_observations": ["obs-a", "obs-b"],
+            "turn_history": [{"turn_number": 1}],
+            "loop_metrics": {"turns": 1},
+            "custom_field": "keep-me"
+        });
+
+        let state = InvestigationState::from_legacy_python_state("sid", &legacy);
+        assert_eq!(state.legacy.external_observations, vec!["obs-a", "obs-b"]);
+        assert_eq!(
+            state.legacy.extra_fields.get("custom_field"),
+            Some(&Value::String("keep-me".to_string()))
+        );
+        assert_eq!(
+            state.evidence["ev_legacy_000001"]["source_uri"],
+            Value::String("state.json#external_observations[0]".to_string())
+        );
+    }
+
+    #[test]
+    fn merge_legacy_updates_preserves_non_legacy_fields_and_prunes_old_legacy_entries() {
+        let mut state = InvestigationState::new("sid");
+        state.questions.insert(
+            "q_1".to_string(),
+            serde_json::json!({"id": "q_1", "question_text": "keep me"}),
+        );
+        state.evidence.insert(
+            "ev_other".to_string(),
+            serde_json::json!({
+                "id": "ev_other",
+                "content": "keep me",
+                "normalization": {"kind": "web_fetch"}
+            }),
+        );
+        state.evidence.insert(
+            "ev_legacy_000002".to_string(),
+            serde_json::json!({
+                "id": "ev_legacy_000002",
+                "content": "remove me",
+                "normalization": {"kind": "legacy_observation"}
+            }),
+        );
+        let extra_fields = BTreeMap::from([(
+            "custom_field".to_string(),
+            Value::String("after".to_string()),
+        )]);
+
+        state.merge_legacy_updates(&[String::from("fresh")], None, None, Some(&extra_fields));
+
+        assert!(state.questions.contains_key("q_1"));
+        assert!(state.evidence.contains_key("ev_other"));
+        assert!(!state.evidence.contains_key("ev_legacy_000002"));
+        assert_eq!(
+            state.evidence["ev_legacy_000001"]["content"],
+            Value::String("fresh".to_string())
+        );
+        assert_eq!(
+            state.legacy.extra_fields.get("custom_field"),
+            Some(&Value::String("after".to_string()))
+        );
+    }
+}
diff --git a/openplanter-desktop/crates/op-core/src/engine/mod.rs b/openplanter-desktop/crates/op-core/src/engine/mod.rs
index cf274420..edd79d8a 100644
--- a/openplanter-desktop/crates/op-core/src/engine/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/mod.rs
@@ -5,6 +5,7 @@
 
 pub mod context;
 pub mod curator;
+pub mod investigation_state;
 pub mod judge;
 
 use std::time::Duration;
diff --git a/openplanter-desktop/crates/op-core/src/prompts.rs b/openplanter-desktop/crates/op-core/src/prompts.rs
index 83a5e85a..70342ad7 100644
--- a/openplanter-desktop/crates/op-core/src/prompts.rs
+++ b/openplanter-desktop/crates/op-core/src/prompts.rs
@@ -214,8 +214,10 @@ logs you can read with read_file to recall prior work:
 - {session_dir}/events.jsonl — Trace events log (JSONL). Each record has a
   timestamp, event type ("objective", "trace", "step", "result"), and payload.
   Use this for a lightweight overview of objectives and results without full messages.
-- {session_dir}/state.json — Persisted external context observations from prior turns.
-  This is what feeds the external_context_summary in your initial message.
+- {session_dir}/investigation_state.json — Canonical typed session state with
+  structured evidence plus a legacy projection of prior observations.
+- {session_dir}/state.json — Legacy compatibility projection of session state.
+  This still feeds the external_context_summary in your initial message.
 
 These files grow throughout the session. If you need to recall prior analysis,
 check what you did before, or pick up where you left off, read these logs.
diff --git a/tests/test_investigation_state.py b/tests/test_investigation_state.py
new file mode 100644
index 00000000..9673c423
--- /dev/null
+++ b/tests/test_investigation_state.py
@@ -0,0 +1,206 @@
+from __future__ import annotations
+
+import json
+import tempfile
+import unittest
+from pathlib import Path
+
+from agent.investigation_state import (
+    migrate_legacy_state,
+    state_to_legacy_projection,
+)
+from agent.runtime import SessionStore
+
+
+class InvestigationStateMigrationTests(unittest.TestCase):
+    def test_migrate_legacy_state_creates_structured_evidence(self) -> None:
+        legacy = {
+            "session_id": "sid",
+            "saved_at": "2026-03-13T00:00:00+00:00",
+            "external_observations": ["obs a", "obs b"],
+            "turn_history": [{"turn_number": 1}],
+            "loop_metrics": {"turns": 1},
+            "custom_field": "keep me",
+        }
+        state = migrate_legacy_state("sid", legacy)
+
+        self.assertEqual(state["schema_version"], "1.0.0")
+        self.assertEqual(state["legacy"]["external_observations"], ["obs a", "obs b"])
+        self.assertEqual(state["legacy"]["extra_fields"]["custom_field"], "keep me")
+        self.assertEqual(
+            state["evidence"]["ev_legacy_000001"]["evidence_type"],
+            "legacy_observation",
+        )
+        self.assertEqual(
+            state["evidence"]["ev_legacy_000002"]["source_uri"],
+            "state.json#external_observations[1]",
+        )
+
+    def test_state_to_legacy_projection_falls_back_to_evidence(self) -> None:
+        state = {
+            "schema_version": "1.0.0",
+            "session_id": "sid",
+            "updated_at": "2026-03-13T00:00:00+00:00",
+            "legacy": {"turn_history": [], "loop_metrics": {}, "extra_fields": {"custom_field": "hello"}},
+            "evidence": {
+                "ev_legacy_000002": {
+                    "content": "second",
+                    "normalization": {"kind": "legacy_observation"},
+                },
+                "ev_legacy_000001": {
+                    "content": "first",
+                    "normalization": {"kind": "legacy_observation"},
+                },
+            },
+        }
+
+        projected = state_to_legacy_projection(state, session_id="sid")
+        self.assertEqual(projected["external_observations"], ["first", "second"])
+        self.assertEqual(projected["custom_field"], "hello")
+
+
+class SessionStoreTypedStateTests(unittest.TestCase):
+    def test_save_state_writes_typed_file_and_typed_first_load_preserves_extras(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            store = SessionStore(workspace=root)
+            sid, _, _ = store.open_session(session_id="typed-save", resume=False)
+
+            store.save_state(
+                sid,
+                {
+                    "session_id": sid,
+                    "saved_at": "2026-03-13T12:00:00+00:00",
+                    "external_observations": ["alpha", "beta"],
+                    "turn_history": [{"turn_number": 1}],
+                    "loop_metrics": {"turns": 1},
+                    "custom_field": "hello",
+                },
+            )
+
+            session_dir = root / ".openplanter" / "sessions" / sid
+            typed_path = session_dir / "investigation_state.json"
+            self.assertTrue(typed_path.exists())
+
+            typed = json.loads(typed_path.read_text(encoding="utf-8"))
+            self.assertEqual(typed["legacy"]["extra_fields"]["custom_field"], "hello")
+            self.assertEqual(typed["evidence"]["ev_legacy_000001"]["content"], "alpha")
+
+            (session_dir / "state.json").write_text("{}", encoding="utf-8")
+            loaded = store.load_state(sid)
+            self.assertEqual(loaded["external_observations"], ["alpha", "beta"])
+            self.assertEqual(loaded["custom_field"], "hello")
+            self.assertEqual(loaded["turn_history"], [{"turn_number": 1}])
+
+    def test_load_state_accepts_legacy_rust_external_context_shape(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            store = SessionStore(workspace=root)
+            sid, _, _ = store.open_session(session_id="rust-legacy", resume=False)
+            session_dir = root / ".openplanter" / "sessions" / sid
+
+            (session_dir / "state.json").write_text(
+                json.dumps(
+                    {
+                        "observations": [
+                            {
+                                "source": "wiki",
+                                "timestamp": "2026-03-13T00:00:00Z",
+                                "content": "obs one",
+                            },
+                            {
+                                "source": "tool",
+                                "timestamp": "2026-03-13T00:00:01Z",
+                                "content": "obs two",
+                            },
+                        ],
+                        "custom_field": "preserve-me",
+                    }
+                ),
+                encoding="utf-8",
+            )
+
+            loaded = store.load_state(sid)
+            self.assertEqual(loaded["external_observations"], ["obs one", "obs two"])
+            self.assertEqual(loaded["custom_field"], "preserve-me")
+
+    def test_save_state_preserves_existing_typed_fields_and_prunes_only_legacy_evidence(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            store = SessionStore(workspace=root)
+            sid, _, _ = store.open_session(session_id="typed-merge", resume=False)
+            session_dir = root / ".openplanter" / "sessions" / sid
+
+            typed = {
+                "schema_version": "1.0.0",
+                "session_id": sid,
+                "created_at": "2026-03-13T00:00:00+00:00",
+                "updated_at": "2026-03-13T00:00:00+00:00",
+                "objective": "",
+                "ontology": {"namespace": "openplanter.core", "version": "2026-03"},
+                "entities": {},
+                "links": {},
+                "claims": {},
+                "evidence": {
+                    "ev_legacy_000001": {
+                        "id": "ev_legacy_000001",
+                        "content": "stale",
+                        "normalization": {"kind": "legacy_observation"},
+                    },
+                    "ev_legacy_000002": {
+                        "id": "ev_legacy_000002",
+                        "content": "remove me",
+                        "normalization": {"kind": "legacy_observation"},
+                    },
+                    "ev_other": {
+                        "id": "ev_other",
+                        "content": "keep me",
+                        "normalization": {"kind": "web_fetch"},
+                    },
+                },
+                "hypotheses": {},
+                "questions": {"q_1": {"id": "q_1", "question_text": "keep me"}},
+                "tasks": {},
+                "actions": {},
+                "provenance_nodes": {},
+                "confidence_profiles": {},
+                "timeline": [],
+                "indexes": {"by_external_ref": {}, "by_tag": {}},
+                "legacy": {
+                    "external_observations": ["stale", "remove me"],
+                    "turn_history": [],
+                    "loop_metrics": {},
+                    "extra_fields": {"custom_field": "before"},
+                },
+            }
+            (session_dir / "investigation_state.json").write_text(
+                json.dumps(typed),
+                encoding="utf-8",
+            )
+
+            store.save_state(
+                sid,
+                {
+                    "session_id": sid,
+                    "saved_at": "2026-03-13T12:30:00+00:00",
+                    "external_observations": ["fresh"],
+                    "turn_history": [{"turn_number": 3}],
+                    "loop_metrics": {"turns": 3},
+                    "custom_field": "after",
+                },
+            )
+
+            updated = json.loads((session_dir / "investigation_state.json").read_text(encoding="utf-8"))
+            self.assertEqual(updated["questions"]["q_1"]["question_text"], "keep me")
+            self.assertIn("ev_other", updated["evidence"])
+            self.assertEqual(updated["evidence"]["ev_legacy_000001"]["content"], "fresh")
+            self.assertNotIn("ev_legacy_000002", updated["evidence"])
+            self.assertEqual(updated["legacy"]["extra_fields"]["custom_field"], "after")
+
+            projected = json.loads((session_dir / "state.json").read_text(encoding="utf-8"))
+            self.assertEqual(projected["external_observations"], ["fresh"])
+            self.assertEqual(projected["custom_field"], "after")
+
+
+if __name__ == "__main__":
+    unittest.main()

From fe8cc3e2588f0fb032729892ff70502817bc2372 Mon Sep 17 00:00:00 2001
From: Drake Thomsen <120344051+ThomsenDrake@users.noreply.github.com>
Date: Fri, 13 Mar 2026 14:04:10 -0400
Subject: [PATCH 21/58] Delete git-apply-1.txt

---
 git-apply-1.txt | 946 ------------------------------------------------
 1 file changed, 946 deletions(-)
 delete mode 100644 git-apply-1.txt

diff --git a/git-apply-1.txt b/git-apply-1.txt
deleted file mode 100644
index 2b867b38..00000000
--- a/git-apply-1.txt
+++ /dev/null
@@ -1,946 +0,0 @@
- (cd "$(git rev-parse --show-toplevel)" && git apply --3way <<'EOF' 
-diff --git a/agent/investigation_state.py b/agent/investigation_state.py
-new file mode 100644
-index 0000000000000000000000000000000000000000..b78ed7dbb50c5946f9e6c8f25f3f3b085ac9a7fd
---- /dev/null
-+++ b/agent/investigation_state.py
-@@ -0,0 +1,186 @@
-+from __future__ import annotations
-+
-+import copy
-+import json
-+from datetime import datetime, timezone
-+from pathlib import Path
-+from typing import Any
-+
-+SCHEMA_VERSION = "1.0.0"
-+
-+
-+def utc_now_iso() -> str:
-+    return datetime.now(timezone.utc).isoformat()
-+
-+
-+def default_state(session_id: str, now: str | None = None) -> dict[str, Any]:
-+    ts = now or utc_now_iso()
-+    return {
-+        "schema_version": SCHEMA_VERSION,
-+        "session_id": session_id,
-+        "created_at": ts,
-+        "updated_at": ts,
-+        "objective": "",
-+        "ontology": {"namespace": "openplanter.core", "version": "2026-03"},
-+        "entities": {},
-+        "links": {},
-+        "claims": {},
-+        "evidence": {},
-+        "hypotheses": {},
-+        "questions": {},
-+        "tasks": {},
-+        "actions": {},
-+        "provenance_nodes": {},
-+        "confidence_profiles": {},
-+        "timeline": [],
-+        "indexes": {"by_external_ref": {}, "by_tag": {}},
-+        "legacy": {
-+            "external_observations": [],
-+            "turn_history": [],
-+            "loop_metrics": {},
-+            "extra_fields": {},
-+        },
-+    }
-+
-+
-+def _evidence_id(index: int) -> str:
-+    return f"ev_legacy_{index + 1:06d}"
-+
-+
-+def _legacy_observations_from_state(state: dict[str, Any]) -> list[str]:
-+    legacy = state.get("legacy", {})
-+    if isinstance(legacy, dict):
-+        persisted = legacy.get("external_observations", [])
-+        if isinstance(persisted, list):
-+            return [str(item) for item in persisted]
-+
-+    evidence = state.get("evidence", {})
-+    if isinstance(evidence, dict):
-+        out: list[str] = []
-+        for key in sorted(evidence.keys()):
-+            record = evidence.get(key)
-+            if not isinstance(record, dict):
-+                continue
-+            normalization = record.get("normalization", {})
-+            if isinstance(normalization, dict) and normalization.get("kind") != "legacy_observation":
-+                continue
-+            content = record.get("content")
-+            if isinstance(content, str):
-+                out.append(content)
-+        if out:
-+            return out
-+
-+    return []
-+
-+
-+def state_to_legacy_projection(state: dict[str, Any], session_id: str) -> dict[str, Any]:
-+    """Project typed InvestigationState into legacy state.json-compatible payload."""
-+    legacy = state.get("legacy", {})
-+    legacy_dict = legacy if isinstance(legacy, dict) else {}
-+    projected = {
-+        "session_id": str(state.get("session_id") or session_id),
-+        "external_observations": _legacy_observations_from_state(state),
-+        "turn_history": legacy_dict.get("turn_history", []),
-+        "loop_metrics": legacy_dict.get("loop_metrics", {}),
-+    }
-+    extras = legacy_dict.get("extra_fields", {})
-+    if isinstance(extras, dict):
-+        projected.update(extras)
-+    return projected
-+
-+
-+def migrate_legacy_state(session_id: str, legacy_state: dict[str, Any], now: str | None = None) -> dict[str, Any]:
-+    """Build typed InvestigationState from old state.json payload."""
-+    ts = now or utc_now_iso()
-+    migrated = default_state(session_id=session_id, now=ts)
-+    known_keys = {"session_id", "saved_at", "external_observations", "turn_history", "loop_metrics"}
-+    migrated["legacy"] = {
-+        "external_observations": list(legacy_state.get("external_observations", []))
-+        if isinstance(legacy_state.get("external_observations", []), list)
-+        else [],
-+        "turn_history": list(legacy_state.get("turn_history", []))
-+        if isinstance(legacy_state.get("turn_history", []), list)
-+        else [],
-+        "loop_metrics": legacy_state.get("loop_metrics", {})
-+        if isinstance(legacy_state.get("loop_metrics", {}), dict)
-+        else {},
-+        "extra_fields": {k: v for k, v in legacy_state.items() if k not in known_keys},
-+    }
-+
-+    observations = migrated["legacy"]["external_observations"]
-+    for idx, observation in enumerate(observations):
-+        eid = _evidence_id(idx)
-+        migrated["evidence"][eid] = {
-+            "id": eid,
-+            "evidence_type": "legacy_observation",
-+            "content": str(observation),
-+            "source_uri": f"state.json#external_observations[{idx}]",
-+            "normalization": {
-+                "kind": "legacy_observation",
-+                "normalization_version": "legacy-v1",
-+            },
-+            "provenance_ids": [],
-+            "confidence_id": None,
-+            "created_at": ts,
-+            "updated_at": ts,
-+        }
-+    return migrated
-+
-+
-+def upsert_legacy_observations(
-+    state: dict[str, Any],
-+    observations: list[str],
-+    now: str | None = None,
-+) -> dict[str, Any]:
-+    ts = now or utc_now_iso()
-+    out = copy.deepcopy(state)
-+    out["updated_at"] = ts
-+    legacy = out.setdefault("legacy", {})
-+    if not isinstance(legacy, dict):
-+        legacy = {}
-+        out["legacy"] = legacy
-+    legacy["external_observations"] = [str(item) for item in observations]
-+    legacy.setdefault("turn_history", [])
-+    legacy.setdefault("loop_metrics", {})
-+    legacy.setdefault("extra_fields", {})
-+
-+    evidence = out.setdefault("evidence", {})
-+    if not isinstance(evidence, dict):
-+        evidence = {}
-+        out["evidence"] = evidence
-+
-+    for idx, observation in enumerate(observations):
-+        eid = _evidence_id(idx)
-+        existing = evidence.get(eid)
-+        record = existing if isinstance(existing, dict) else {}
-+        record.update(
-+            {
-+                "id": eid,
-+                "evidence_type": "legacy_observation",
-+                "content": str(observation),
-+                "source_uri": f"state.json#external_observations[{idx}]",
-+                "normalization": {
-+                    "kind": "legacy_observation",
-+                    "normalization_version": "legacy-v1",
-+                },
-+                "updated_at": ts,
-+            }
-+        )
-+        record.setdefault("created_at", ts)
-+        record.setdefault("provenance_ids", [])
-+        record.setdefault("confidence_id", None)
-+        evidence[eid] = record
-+
-+    keep = {_evidence_id(idx) for idx in range(len(observations))}
-+    for key in list(evidence.keys()):
-+        if key.startswith("ev_legacy_") and key not in keep:
-+            del evidence[key]
-+    return out
-+
-+
-+def load_investigation_state(path: Path) -> dict[str, Any]:
-+    return json.loads(path.read_text(encoding="utf-8"))
-+
-+
-+def save_investigation_state(path: Path, state: dict[str, Any]) -> None:
-+    path.write_text(json.dumps(state, indent=2), encoding="utf-8")
-diff --git a/agent/runtime.py b/agent/runtime.py
-index 29dd571854b635b939f1e187f4ffe66d1a027197..2711bff540ad45e2d0b22d2dc6d34879a2a3455a 100644
---- a/agent/runtime.py
-+++ b/agent/runtime.py
-@@ -1,83 +1,93 @@
- from __future__ import annotations
- 
- import json
- import re
- import secrets
- import shutil
- from dataclasses import dataclass
- from datetime import datetime, timezone
- from pathlib import Path
- from typing import Any, Callable
- 
- from .config import AgentConfig
- from .engine import ContentDeltaCallback, ExternalContext, RLMEngine, StepCallback, TurnSummary
-+from .investigation_state import (
-+    load_investigation_state,
-+    migrate_legacy_state,
-+    save_investigation_state,
-+    state_to_legacy_projection,
-+    upsert_legacy_observations,
-+)
- from .replay_log import ReplayLogger
- 
- EventCallback = Callable[[str], None]
- 
- 
- class SessionError(RuntimeError):
-     pass
- 
- 
- def _utc_now() -> str:
-     return datetime.now(timezone.utc).isoformat()
- 
- 
- def _new_session_id() -> str:
-     stamp = datetime.now(timezone.utc).strftime("%Y%m%d-%H%M%S")
-     return f"{stamp}-{secrets.token_hex(3)}"
- 
- 
- def _safe_component(text: str) -> str:
-     return re.sub(r"[^A-Za-z0-9._-]+", "-", text).strip("-") or "artifact"
- 
- 
- @dataclass
- class SessionStore:
-     workspace: Path
-     session_root_dir: str = ".openplanter"
- 
-     def __post_init__(self) -> None:
-         self.workspace = self.workspace.expanduser().resolve()
-         self.root = (self.workspace / self.session_root_dir).resolve()
-         self.sessions = self.root / "sessions"
-         self.sessions.mkdir(parents=True, exist_ok=True)
- 
-     def _session_dir(self, session_id: str) -> Path:
-         return self.sessions / session_id
- 
-     def _metadata_path(self, session_id: str) -> Path:
-         return self._session_dir(session_id) / "metadata.json"
- 
-     def _state_path(self, session_id: str) -> Path:
-         return self._session_dir(session_id) / "state.json"
- 
-     def _events_path(self, session_id: str) -> Path:
-         return self._session_dir(session_id) / "events.jsonl"
- 
-+    def _investigation_state_path(self, session_id: str) -> Path:
-+        return self._session_dir(session_id) / "investigation_state.json"
-+
-     def _artifacts_dir(self, session_id: str) -> Path:
-         return self._session_dir(session_id) / "artifacts"
- 
-     def _plan_dir(self, session_id: str) -> Path:
-         """Directory where *.plan.md files live (same as session dir)."""
-         return self._session_dir(session_id)
- 
-     def latest_session_id(self) -> str | None:
-         session_dirs = [p for p in self.sessions.iterdir() if p.is_dir()]
-         if not session_dirs:
-             return None
-         latest = max(session_dirs, key=lambda p: p.stat().st_mtime)
-         return latest.name
- 
-     def list_sessions(self, limit: int = 100) -> list[dict[str, Any]]:
-         session_dirs = sorted(
-             (p for p in self.sessions.iterdir() if p.is_dir()),
-             key=lambda p: p.stat().st_mtime,
-             reverse=True,
-         )
-         out: list[dict[str, Any]] = []
-         for path in session_dirs[:limit]:
-             meta_path = path / "metadata.json"
-             meta: dict[str, Any] = {}
-             if meta_path.exists():
-@@ -113,64 +123,90 @@ class SessionStore:
-                 raise SessionError(f"Cannot resume missing session: {sid}")
-         else:
-             if session_dir.exists():
-                 sid = f"{sid}-{secrets.token_hex(2)}"
-                 session_dir = self._session_dir(sid)
-             session_dir.mkdir(parents=True, exist_ok=True)
-             created_new = True
- 
-         session_dir.mkdir(parents=True, exist_ok=True)
-         self._artifacts_dir(sid).mkdir(parents=True, exist_ok=True)
- 
-         meta_path = self._metadata_path(sid)
-         if not meta_path.exists():
-             meta = {
-                 "session_id": sid,
-                 "workspace": str(self.workspace),
-                 "created_at": _utc_now(),
-                 "updated_at": _utc_now(),
-             }
-             meta_path.write_text(json.dumps(meta, indent=2), encoding="utf-8")
- 
-         state = self.load_state(sid)
-         return sid, state, created_new
- 
-     def load_state(self, session_id: str) -> dict[str, Any]:
-+        investigation_path = self._investigation_state_path(session_id)
-+        if investigation_path.exists():
-+            try:
-+                typed = load_investigation_state(investigation_path)
-+            except json.JSONDecodeError as exc:
-+                raise SessionError(f"Session investigation state is invalid JSON: {investigation_path}") from exc
-+            return state_to_legacy_projection(typed, session_id=session_id)
-+
-         state_path = self._state_path(session_id)
-         if not state_path.exists():
-             return {
-                 "session_id": session_id,
-                 "external_observations": [],
-             }
-         try:
-             return json.loads(state_path.read_text(encoding="utf-8"))
-         except json.JSONDecodeError as exc:
-             raise SessionError(f"Session state is invalid JSON: {state_path}") from exc
- 
-     def save_state(self, session_id: str, state: dict[str, Any]) -> None:
-         state_path = self._state_path(session_id)
-         state_path.write_text(json.dumps(state, indent=2), encoding="utf-8")
-+        investigation_path = self._investigation_state_path(session_id)
-+        if investigation_path.exists():
-+            try:
-+                investigation_state = load_investigation_state(investigation_path)
-+            except json.JSONDecodeError as exc:
-+                raise SessionError(f"Session investigation state is invalid JSON: {investigation_path}") from exc
-+        else:
-+            investigation_state = migrate_legacy_state(session_id=session_id, legacy_state=state)
-+        observations = state.get("external_observations", [])
-+        obs = [str(x) for x in observations] if isinstance(observations, list) else []
-+        updated_investigation_state = upsert_legacy_observations(investigation_state, obs)
-+        legacy = updated_investigation_state.setdefault("legacy", {})
-+        if isinstance(legacy, dict):
-+            legacy["turn_history"] = state.get("turn_history", []) if isinstance(state.get("turn_history", []), list) else []
-+            legacy["loop_metrics"] = state.get("loop_metrics", {}) if isinstance(state.get("loop_metrics", {}), dict) else {}
-+            known_keys = {"session_id", "saved_at", "external_observations", "turn_history", "loop_metrics"}
-+            legacy["extra_fields"] = {k: v for k, v in state.items() if k not in known_keys}
-+        save_investigation_state(investigation_path, updated_investigation_state)
-         self._touch_metadata(session_id)
- 
-     def append_event(self, session_id: str, event_type: str, payload: dict[str, Any]) -> None:
-         event_path = self._events_path(session_id)
-         event = {
-             "ts": _utc_now(),
-             "type": event_type,
-             "payload": payload,
-         }
-         with event_path.open("a", encoding="utf-8") as fh:
-             fh.write(json.dumps(event, ensure_ascii=True) + "\n")
-         self._touch_metadata(session_id)
- 
-     def write_artifact(
-         self, session_id: str, category: str, name: str, content: str
-     ) -> str:
-         category_safe = _safe_component(category)
-         name_safe = _safe_component(name)
-         artifact_rel = Path("artifacts") / category_safe / name_safe
-         artifact_abs = self._session_dir(session_id) / artifact_rel
-         artifact_abs.parent.mkdir(parents=True, exist_ok=True)
-         artifact_abs.write_text(content, encoding="utf-8")
-         self._touch_metadata(session_id)
-         return artifact_rel.as_posix()
- 
-diff --git a/openplanter-desktop/crates/op-core/src/engine/context.rs b/openplanter-desktop/crates/op-core/src/engine/context.rs
-index 0b522c2fdd088982f95c0ec18295c58d52a709ec..4a36cb391c3bea41d4721e1ae21b5f4ee7f210e7 100644
---- a/openplanter-desktop/crates/op-core/src/engine/context.rs
-+++ b/openplanter-desktop/crates/op-core/src/engine/context.rs
-@@ -1,129 +1,211 @@
- // External context and turn summary types for multi-turn sessions.
- 
- use serde::{Deserialize, Serialize};
- use std::path::Path;
- use tokio::fs;
- 
-+use super::investigation_state::InvestigationState;
-+
- /// Summary of a completed turn for inclusion in subsequent prompts.
- #[derive(Debug, Clone, Serialize, Deserialize)]
- pub struct TurnSummary {
-     pub turn_number: u32,
-     pub objective: String,
-     pub result_preview: String,
-     pub timestamp: String,
-     pub steps_used: u32,
-     pub replay_seq_start: u64,
- }
- 
- /// External context observations persisted to state.json.
- #[derive(Debug, Clone, Serialize, Deserialize)]
- pub struct ExternalContext {
-     pub observations: Vec<Observation>,
- }
- 
- /// A single observation from an external source.
- #[derive(Debug, Clone, Serialize, Deserialize)]
- pub struct Observation {
-     pub source: String,
-     pub timestamp: String,
-     pub content: String,
- }
- 
- impl ExternalContext {
-     pub fn new() -> Self {
-         Self {
-             observations: vec![],
-         }
-     }
- 
-     /// Add a new observation with the current timestamp.
-     pub fn add_observation(&mut self, source: &str, content: &str) {
-         self.observations.push(Observation {
-             source: source.to_string(),
-             timestamp: chrono::Utc::now().to_rfc3339(),
-             content: content.to_string(),
-         });
-     }
- 
--    /// Load external context from state.json in the session directory.
-+    /// Load external context from investigation_state.json or state.json in the session directory.
-     pub async fn load(session_dir: &Path) -> std::io::Result<Self> {
--        let path = session_dir.join("state.json");
--        if !path.exists() {
-+        let investigation_path = session_dir.join("investigation_state.json");
-+        if investigation_path.exists() {
-+            let content = fs::read_to_string(&investigation_path).await?;
-+            let typed: InvestigationState = serde_json::from_str(&content)
-+                .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
-+            let observations = typed
-+                .legacy
-+                .external_observations
-+                .iter()
-+                .map(|text| Observation {
-+                    source: "legacy".to_string(),
-+                    timestamp: String::new(),
-+                    content: text.clone(),
-+                })
-+                .collect();
-+            return Ok(Self { observations });
-+        }
-+
-+        let state_path = session_dir.join("state.json");
-+        if !state_path.exists() {
-             return Ok(Self::new());
-         }
--        let content = fs::read_to_string(&path).await?;
--        serde_json::from_str(&content)
--            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))
-+        let content = fs::read_to_string(&state_path).await?;
-+        let value: serde_json::Value = serde_json::from_str(&content)
-+            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
-+
-+        if value.get("observations").is_some() {
-+            let parsed: ExternalContext = serde_json::from_value(value)
-+                .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
-+            return Ok(parsed);
-+        }
-+
-+        let legacy_observations = value
-+            .get("external_observations")
-+            .and_then(|v| v.as_array())
-+            .map(|arr| {
-+                arr.iter()
-+                    .filter_map(|item| item.as_str())
-+                    .map(|text| Observation {
-+                        source: "legacy".to_string(),
-+                        timestamp: String::new(),
-+                        content: text.to_string(),
-+                    })
-+                    .collect::<Vec<_>>()
-+            })
-+            .unwrap_or_default();
-+
-+        Ok(Self {
-+            observations: legacy_observations,
-+        })
-     }
- 
--    /// Save external context to state.json in the session directory.
-+    /// Save external context to state.json and typed investigation_state.json.
-     pub async fn save(&self, session_dir: &Path) -> std::io::Result<()> {
--        let path = session_dir.join("state.json");
--        let json = serde_json::to_string_pretty(self)
-+        let state_path = session_dir.join("state.json");
-+        let session_id = session_dir
-+            .file_name()
-+            .and_then(|s| s.to_str())
-+            .unwrap_or_default();
-+
-+        let mut typed = InvestigationState::new(session_id);
-+        typed.legacy.external_observations = self
-+            .observations
-+            .iter()
-+            .map(|o| o.content.clone())
-+            .collect::<Vec<_>>();
-+        typed.upsert_legacy_observations();
-+
-+        let legacy_json = serde_json::to_string_pretty(&typed.to_legacy_state_json())
-+            .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
-+        fs::write(&state_path, legacy_json).await?;
-+
-+        let investigation_path = session_dir.join("investigation_state.json");
-+        let typed_json = serde_json::to_string_pretty(&typed)
-             .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
--        fs::write(&path, json).await
-+        fs::write(&investigation_path, typed_json).await
-     }
- }
- 
- impl Default for ExternalContext {
-     fn default() -> Self {
-         Self::new()
-     }
- }
- 
- #[cfg(test)]
- mod tests {
-     use super::*;
-     use tempfile::tempdir;
- 
-     #[test]
-     fn test_new_context_empty() {
-         let ctx = ExternalContext::new();
-         assert!(ctx.observations.is_empty());
-     }
- 
-     #[test]
-     fn test_add_observation() {
-         let mut ctx = ExternalContext::new();
-         ctx.add_observation("wiki", "Found entity Acme Corp");
-         assert_eq!(ctx.observations.len(), 1);
-         assert_eq!(ctx.observations[0].source, "wiki");
-         assert_eq!(ctx.observations[0].content, "Found entity Acme Corp");
-         assert!(!ctx.observations[0].timestamp.is_empty());
-     }
- 
-     #[tokio::test]
-     async fn test_save_and_load() {
-         let tmp = tempdir().unwrap();
-         let mut ctx = ExternalContext::new();
-         ctx.add_observation("wiki", "test observation");
-         ctx.save(tmp.path()).await.unwrap();
- 
-         let loaded = ExternalContext::load(tmp.path()).await.unwrap();
-         assert_eq!(loaded.observations.len(), 1);
-         assert_eq!(loaded.observations[0].content, "test observation");
-+
-+        let typed = fs::read_to_string(tmp.path().join("investigation_state.json"))
-+            .await
-+            .unwrap();
-+        assert!(typed.contains("\"schema_version\""));
-     }
- 
-     #[tokio::test]
-     async fn test_load_missing_returns_empty() {
-         let tmp = tempdir().unwrap();
-         let ctx = ExternalContext::load(tmp.path()).await.unwrap();
-         assert!(ctx.observations.is_empty());
-     }
- 
-+    #[tokio::test]
-+    async fn test_load_legacy_state_json() {
-+        let tmp = tempdir().unwrap();
-+        fs::write(
-+            tmp.path().join("state.json"),
-+            r#"{"session_id":"x","external_observations":["one","two"]}"#,
-+        )
-+        .await
-+        .unwrap();
-+        let ctx = ExternalContext::load(tmp.path()).await.unwrap();
-+        assert_eq!(ctx.observations.len(), 2);
-+        assert_eq!(ctx.observations[0].content, "one");
-+    }
-+
-     #[test]
-     fn test_turn_summary_serialization() {
-         let ts = TurnSummary {
-             turn_number: 1,
-             objective: "Investigate Acme Corp".into(),
-             result_preview: "Found connections to...".into(),
-             timestamp: "2026-01-01T00:00:00Z".into(),
-             steps_used: 3,
-             replay_seq_start: 1,
-         };
-         let json = serde_json::to_string(&ts).unwrap();
-         let parsed: TurnSummary = serde_json::from_str(&json).unwrap();
-         assert_eq!(parsed.turn_number, 1);
-         assert_eq!(parsed.objective, "Investigate Acme Corp");
-     }
- }
-diff --git a/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs b/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs
-new file mode 100644
-index 0000000000000000000000000000000000000000..6029dde612e3d1d3ea6673aa96d5317496826a09
---- /dev/null
-+++ b/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs
-@@ -0,0 +1,202 @@
-+use chrono::Utc;
-+use serde::{Deserialize, Serialize};
-+use std::collections::BTreeMap;
-+
-+const SCHEMA_VERSION: &str = "1.0.0";
-+
-+#[derive(Debug, Clone, Serialize, Deserialize, Default)]
-+pub struct InvestigationState {
-+    #[serde(default = "default_schema_version")]
-+    pub schema_version: String,
-+    #[serde(default)]
-+    pub session_id: String,
-+    #[serde(default)]
-+    pub created_at: String,
-+    #[serde(default)]
-+    pub updated_at: String,
-+    #[serde(default)]
-+    pub objective: String,
-+    #[serde(default = "default_ontology")]
-+    pub ontology: Ontology,
-+    #[serde(default)]
-+    pub entities: BTreeMap<String, serde_json::Value>,
-+    #[serde(default)]
-+    pub links: BTreeMap<String, serde_json::Value>,
-+    #[serde(default)]
-+    pub claims: BTreeMap<String, serde_json::Value>,
-+    #[serde(default)]
-+    pub evidence: BTreeMap<String, serde_json::Value>,
-+    #[serde(default)]
-+    pub hypotheses: BTreeMap<String, serde_json::Value>,
-+    #[serde(default)]
-+    pub questions: BTreeMap<String, serde_json::Value>,
-+    #[serde(default)]
-+    pub tasks: BTreeMap<String, serde_json::Value>,
-+    #[serde(default)]
-+    pub actions: BTreeMap<String, serde_json::Value>,
-+    #[serde(default)]
-+    pub provenance_nodes: BTreeMap<String, serde_json::Value>,
-+    #[serde(default)]
-+    pub confidence_profiles: BTreeMap<String, serde_json::Value>,
-+    #[serde(default)]
-+    pub timeline: Vec<serde_json::Value>,
-+    #[serde(default)]
-+    pub indexes: Indexes,
-+    #[serde(default)]
-+    pub legacy: LegacyState,
-+}
-+
-+#[derive(Debug, Clone, Serialize, Deserialize, Default)]
-+pub struct Ontology {
-+    pub namespace: String,
-+    pub version: String,
-+}
-+
-+#[derive(Debug, Clone, Serialize, Deserialize, Default)]
-+pub struct Indexes {
-+    #[serde(default)]
-+    pub by_external_ref: BTreeMap<String, serde_json::Value>,
-+    #[serde(default)]
-+    pub by_tag: BTreeMap<String, serde_json::Value>,
-+}
-+
-+#[derive(Debug, Clone, Serialize, Deserialize, Default)]
-+pub struct LegacyState {
-+    #[serde(default)]
-+    pub external_observations: Vec<String>,
-+    #[serde(default)]
-+    pub turn_history: Vec<serde_json::Value>,
-+    #[serde(default)]
-+    pub loop_metrics: serde_json::Map<String, serde_json::Value>,
-+}
-+
-+fn default_ontology() -> Ontology {
-+    Ontology {
-+        namespace: "openplanter.core".to_string(),
-+        version: "2026-03".to_string(),
-+    }
-+}
-+
-+fn default_schema_version() -> String {
-+    SCHEMA_VERSION.to_string()
-+}
-+
-+fn now() -> String {
-+    Utc::now().to_rfc3339()
-+}
-+
-+fn evidence_id(index: usize) -> String {
-+    format!("ev_legacy_{:06}", index + 1)
-+}
-+
-+impl InvestigationState {
-+    pub fn new(session_id: &str) -> Self {
-+        let ts = now();
-+        Self {
-+            schema_version: default_schema_version(),
-+            session_id: session_id.to_string(),
-+            created_at: ts.clone(),
-+            updated_at: ts,
-+            objective: String::new(),
-+            ontology: default_ontology(),
-+            entities: BTreeMap::new(),
-+            links: BTreeMap::new(),
-+            claims: BTreeMap::new(),
-+            evidence: BTreeMap::new(),
-+            hypotheses: BTreeMap::new(),
-+            questions: BTreeMap::new(),
-+            tasks: BTreeMap::new(),
-+            actions: BTreeMap::new(),
-+            provenance_nodes: BTreeMap::new(),
-+            confidence_profiles: BTreeMap::new(),
-+            timeline: vec![],
-+            indexes: Indexes::default(),
-+            legacy: LegacyState::default(),
-+        }
-+    }
-+
-+    pub fn from_legacy_state_json(session_id: &str, legacy_json: &serde_json::Value) -> Self {
-+        let mut state = Self::new(session_id);
-+        let observations = legacy_json
-+            .get("external_observations")
-+            .and_then(|v| v.as_array())
-+            .map(|arr| arr.iter().filter_map(|v| v.as_str().map(|s| s.to_string())).collect())
-+            .unwrap_or_default();
-+        state.legacy.external_observations = observations;
-+        state.legacy.turn_history = legacy_json
-+            .get("turn_history")
-+            .and_then(|v| v.as_array().cloned())
-+            .unwrap_or_default();
-+        state.legacy.loop_metrics = legacy_json
-+            .get("loop_metrics")
-+            .and_then(|v| v.as_object().cloned())
-+            .unwrap_or_default();
-+        state.upsert_legacy_observations();
-+        state
-+    }
-+
-+    pub fn upsert_legacy_observations(&mut self) {
-+        let ts = now();
-+        self.updated_at = ts.clone();
-+        for (idx, content) in self.legacy.external_observations.iter().enumerate() {
-+            let id = evidence_id(idx);
-+            let mut value = serde_json::Map::new();
-+            value.insert("id".to_string(), serde_json::Value::String(id.clone()));
-+            value.insert("evidence_type".to_string(), serde_json::Value::String("legacy_observation".to_string()));
-+            value.insert("content".to_string(), serde_json::Value::String(content.clone()));
-+            value.insert(
-+                "source_uri".to_string(),
-+                serde_json::Value::String(format!("state.json#external_observations[{}]", idx)),
-+            );
-+            value.insert(
-+                "normalization".to_string(),
-+                serde_json::json!({"kind": "legacy_observation", "normalization_version": "legacy-v1"}),
-+            );
-+            value.insert("provenance_ids".to_string(), serde_json::json!([]));
-+            value.insert("confidence_id".to_string(), serde_json::Value::Null);
-+            value.insert("updated_at".to_string(), serde_json::Value::String(ts.clone()));
-+            if let Some(existing) = self.evidence.get(&id).and_then(|v| v.as_object()) {
-+                if let Some(created_at) = existing.get("created_at") {
-+                    value.insert("created_at".to_string(), created_at.clone());
-+                }
-+            }
-+            value
-+                .entry("created_at".to_string())
-+                .or_insert_with(|| serde_json::Value::String(ts.clone()));
-+            self.evidence.insert(id, serde_json::Value::Object(value));
-+        }
-+
-+        let keep: std::collections::BTreeSet<String> = (0..self.legacy.external_observations.len())
-+            .map(evidence_id)
-+            .collect();
-+        self.evidence
-+            .retain(|k, _| !k.starts_with("ev_legacy_") || keep.contains(k));
-+    }
-+
-+    pub fn to_legacy_state_json(&self) -> serde_json::Value {
-+        serde_json::json!({
-+            "session_id": self.session_id,
-+            "external_observations": self.legacy.external_observations,
-+            "turn_history": self.legacy.turn_history,
-+            "loop_metrics": self.legacy.loop_metrics,
-+        })
-+    }
-+}
-+
-+#[cfg(test)]
-+mod tests {
-+    use super::*;
-+
-+    #[test]
-+    fn migrates_legacy_observations_into_evidence() {
-+        let legacy = serde_json::json!({
-+            "external_observations": ["obs1", "obs2"],
-+            "turn_history": [],
-+            "loop_metrics": {}
-+        });
-+        let state = InvestigationState::from_legacy_state_json("sid", &legacy);
-+        assert_eq!(state.legacy.external_observations.len(), 2);
-+        assert!(state.evidence.contains_key("ev_legacy_000001"));
-+        assert!(state.evidence.contains_key("ev_legacy_000002"));
-+    }
-+}
-diff --git a/openplanter-desktop/crates/op-core/src/engine/mod.rs b/openplanter-desktop/crates/op-core/src/engine/mod.rs
-index cf274420c1b8df43c7524e4b5f06ff57311f4609..5c5cf0bec2268f63328f7150232fe0614b30221d 100644
---- a/openplanter-desktop/crates/op-core/src/engine/mod.rs
-+++ b/openplanter-desktop/crates/op-core/src/engine/mod.rs
-@@ -1,33 +1,34 @@
- // Recursive language model engine.
- //
- // Provides the SolveEmitter trait, demo_solve, and a real solve flow
- // with a multi-step agentic loop that executes tool calls.
- 
- pub mod context;
- pub mod curator;
- pub mod judge;
-+pub mod investigation_state;
- 
- use std::time::Duration;
- 
- use anyhow::anyhow;
- use tokio::sync::mpsc;
- use tokio::task::JoinHandle;
- use tokio_util::sync::CancellationToken;
- 
- use crate::builder::build_model;
- use crate::config::AgentConfig;
- use crate::events::{DeltaEvent, DeltaKind, LoopMetrics, LoopPhase, StepEvent, TokenUsage};
- use crate::model::{BaseModel, Message, ModelTurn, RateLimitError};
- use crate::prompts::build_system_prompt;
- use crate::tools::WorkspaceTools;
- use crate::tools::defs::build_tool_defs;
- 
- use self::curator::{CuratorResult, extract_step_context, run_curator};
- 
- /// Outcome from a background curator task (success or error).
- enum CuratorOutcome {
-     Done(CuratorResult),
-     Error(String),
- }
- 
- fn spawn_curator_task(
-diff --git a/tests/test_investigation_state.py b/tests/test_investigation_state.py
-new file mode 100644
-index 0000000000000000000000000000000000000000..339067cf5e3ad2917b8b8f164ab01c125962b72c
---- /dev/null
-+++ b/tests/test_investigation_state.py
-@@ -0,0 +1,82 @@
-+from __future__ import annotations
-+
-+import json
-+import tempfile
-+import unittest
-+from pathlib import Path
-+
-+from agent.investigation_state import (
-+    migrate_legacy_state,
-+    state_to_legacy_projection,
-+    upsert_legacy_observations,
-+)
-+from agent.runtime import SessionStore
-+
-+
-+class InvestigationStateMigrationTests(unittest.TestCase):
-+    def test_migrate_legacy_state_adds_structured_evidence(self) -> None:
-+        legacy = {
-+            "session_id": "sid",
-+            "external_observations": ["obs a", "obs b"],
-+            "turn_history": [{"turn_number": 1}],
-+            "loop_metrics": {"turns": 1},
-+        }
-+        state = migrate_legacy_state("sid", legacy, now="2026-03-13T00:00:00+00:00")
-+        self.assertEqual(state["schema_version"], "1.0.0")
-+        self.assertEqual(state["legacy"]["external_observations"], ["obs a", "obs b"])
-+        self.assertIn("ev_legacy_000001", state["evidence"])
-+        self.assertEqual(state["evidence"]["ev_legacy_000002"]["content"], "obs b")
-+
-+    def test_projection_back_to_legacy_state_prefers_legacy_block(self) -> None:
-+        state = migrate_legacy_state("sid", {"external_observations": ["obs a"]})
-+        projected = state_to_legacy_projection(state, session_id="sid")
-+        self.assertEqual(projected["external_observations"], ["obs a"])
-+        self.assertIn("session_id", projected)
-+
-+    def test_upsert_rewrites_and_prunes_legacy_evidence(self) -> None:
-+        state = migrate_legacy_state("sid", {"external_observations": ["old1", "old2"]})
-+        updated = upsert_legacy_observations(state, ["new1"])
-+        self.assertIn("ev_legacy_000001", updated["evidence"])
-+        self.assertNotIn("ev_legacy_000002", updated["evidence"])
-+        self.assertEqual(updated["evidence"]["ev_legacy_000001"]["content"], "new1")
-+
-+
-+class SessionStoreTypedStateTests(unittest.TestCase):
-+    def test_save_state_writes_investigation_state_json(self) -> None:
-+        with tempfile.TemporaryDirectory() as tmp:
-+            root = Path(tmp)
-+            store = SessionStore(workspace=root)
-+            sid, _, _ = store.open_session(session_id="typed-save", resume=False)
-+            store.save_state(
-+                sid,
-+                {
-+                    "session_id": sid,
-+                    "external_observations": ["alpha", "beta"],
-+                    "turn_history": [{"turn_number": 1}],
-+                    "loop_metrics": {"turns": 1},
-+                },
-+            )
-+
-+            typed_path = root / ".openplanter" / "sessions" / sid / "investigation_state.json"
-+            self.assertTrue(typed_path.exists())
-+            typed = json.loads(typed_path.read_text(encoding="utf-8"))
-+            self.assertEqual(typed["legacy"]["external_observations"], ["alpha", "beta"])
-+            self.assertEqual(typed["evidence"]["ev_legacy_000001"]["content"], "alpha")
-+
-+    def test_load_state_reads_from_typed_state_when_present(self) -> None:
-+        with tempfile.TemporaryDirectory() as tmp:
-+            root = Path(tmp)
-+            store = SessionStore(workspace=root)
-+            sid, _, _ = store.open_session(session_id="typed-load", resume=False)
-+            store.save_state(sid, {"session_id": sid, "external_observations": ["typed obs"]})
-+
-+            # Corrupt legacy file contents to verify typed file is source of truth for loading.
-+            state_path = root / ".openplanter" / "sessions" / sid / "state.json"
-+            state_path.write_text("{}", encoding="utf-8")
-+
-+            loaded = store.load_state(sid)
-+            self.assertEqual(loaded["external_observations"], ["typed obs"])
-+
-+
-+if __name__ == "__main__":
-+    unittest.main()
- 
-EOF
-)
\ No newline at end of file

From 97b582bd38e6d8ecd9d717ca3cce2c144b93c9aa Mon Sep 17 00:00:00 2001
From: Drake Thomsen <120344051+ThomsenDrake@users.noreply.github.com>
Date: Fri, 13 Mar 2026 14:04:20 -0400
Subject: [PATCH 22/58] Delete git-apply-2.txt

---
 git-apply-2.txt | 809 ------------------------------------------------
 1 file changed, 809 deletions(-)
 delete mode 100644 git-apply-2.txt

diff --git a/git-apply-2.txt b/git-apply-2.txt
deleted file mode 100644
index b13d5066..00000000
--- a/git-apply-2.txt
+++ /dev/null
@@ -1,809 +0,0 @@
- (cd "$(git rev-parse --show-toplevel)" && git apply --3way <<'EOF'
-diff --git a/agent/investigation_state.py b/agent/investigation_state.py
-new file mode 100644
-index 0000000000000000000000000000000000000000..47556b48e13dc7f69baac973b580a4b61a388acd
---- /dev/null
-+++ b/agent/investigation_state.py
-@@ -0,0 +1,150 @@
-+from __future__ import annotations
-+
-+import hashlib
-+from datetime import datetime, timezone
-+from typing import Any
-+
-+
-+SCHEMA_VERSION = "1.0.0"
-+ONTOLOGY_NAMESPACE = "openplanter.core"
-+ONTOLOGY_VERSION = "2026-03"
-+
-+
-+def _utc_now() -> str:
-+    return datetime.now(timezone.utc).isoformat()
-+
-+
-+def _stable_observation_evidence_id(observation: str) -> str:
-+    digest = hashlib.sha256(observation.encode("utf-8")).hexdigest()[:24]
-+    return f"ev_legacy_{digest}"
-+
-+
-+def empty_investigation_state(session_id: str) -> dict[str, Any]:
-+    now = _utc_now()
-+    return {
-+        "schema_version": SCHEMA_VERSION,
-+        "session_id": session_id,
-+        "created_at": now,
-+        "updated_at": now,
-+        "objective": "",
-+        "ontology": {"namespace": ONTOLOGY_NAMESPACE, "version": ONTOLOGY_VERSION},
-+        "entities": {},
-+        "links": {},
-+        "claims": {},
-+        "evidence": {},
-+        "hypotheses": {},
-+        "questions": {},
-+        "tasks": {},
-+        "actions": {},
-+        "provenance_nodes": {},
-+        "confidence_profiles": {},
-+        "timeline": [],
-+        "indexes": {"by_external_ref": {}, "by_tag": {}},
-+        "legacy": {
-+            "external_observations": [],
-+            "turn_history": [],
-+            "loop_metrics": {},
-+            "compat_fields": {},
-+        },
-+    }
-+
-+
-+def _ensure_defaults(state: dict[str, Any], session_id: str) -> dict[str, Any]:
-+    base = empty_investigation_state(session_id)
-+    for key, value in base.items():
-+        state.setdefault(key, value)
-+    state.setdefault("ontology", {}).setdefault("namespace", ONTOLOGY_NAMESPACE)
-+    state.setdefault("ontology", {}).setdefault("version", ONTOLOGY_VERSION)
-+    state.setdefault("indexes", {}).setdefault("by_external_ref", {})
-+    state.setdefault("indexes", {}).setdefault("by_tag", {})
-+    state.setdefault("legacy", {}).setdefault("external_observations", [])
-+    state.setdefault("legacy", {}).setdefault("turn_history", [])
-+    state.setdefault("legacy", {}).setdefault("loop_metrics", {})
-+    state.setdefault("legacy", {}).setdefault("compat_fields", {})
-+    return state
-+
-+
-+def migrate_legacy_state(session_id: str, legacy_state: dict[str, Any]) -> dict[str, Any]:
-+    state = empty_investigation_state(session_id)
-+    observations = legacy_state.get("external_observations", [])
-+    obs_list = [str(x) for x in observations] if isinstance(observations, list) else []
-+    turn_history = legacy_state.get("turn_history", [])
-+    loop_metrics = legacy_state.get("loop_metrics", {})
-+    state["legacy"]["external_observations"] = obs_list
-+    state["legacy"]["turn_history"] = turn_history if isinstance(turn_history, list) else []
-+    state["legacy"]["loop_metrics"] = loop_metrics if isinstance(loop_metrics, dict) else {}
-+    state["legacy"]["compat_fields"] = {
-+        k: v
-+        for k, v in legacy_state.items()
-+        if k not in {"session_id", "saved_at", "external_observations", "turn_history", "loop_metrics"}
-+    }
-+
-+    for obs in obs_list:
-+        ev_id = _stable_observation_evidence_id(obs)
-+        state["evidence"][ev_id] = {
-+            "id": ev_id,
-+            "evidence_type": "tool_output",
-+            "content": obs,
-+            "normalization": {
-+                "kind": "analyst_note",
-+                "normalization_version": "legacy-v1",
-+            },
-+            "provenance_ids": [],
-+            "confidence_id": None,
-+            "created_at": _utc_now(),
-+            "updated_at": _utc_now(),
-+        }
-+        state["indexes"]["by_external_ref"][f"legacy_observation_sha256:{ev_id}"] = ev_id
-+    return state
-+
-+
-+def update_with_legacy_fields(
-+    state: dict[str, Any],
-+    session_id: str,
-+    observations: list[str],
-+    turn_history: list[dict[str, Any]] | None,
-+    loop_metrics: dict[str, Any] | None,
-+) -> dict[str, Any]:
-+    st = _ensure_defaults(state, session_id)
-+    st["session_id"] = session_id
-+    if not st.get("created_at"):
-+        st["created_at"] = _utc_now()
-+    st["updated_at"] = _utc_now()
-+    st["legacy"]["external_observations"] = observations
-+    st["legacy"]["turn_history"] = turn_history or []
-+    st["legacy"]["loop_metrics"] = loop_metrics or {}
-+
-+    st["legacy"].setdefault("compat_fields", {})
-+
-+    for obs in observations:
-+        ev_id = _stable_observation_evidence_id(obs)
-+        if ev_id in st["evidence"]:
-+            continue
-+        st["evidence"][ev_id] = {
-+            "id": ev_id,
-+            "evidence_type": "tool_output",
-+            "content": obs,
-+            "normalization": {
-+                "kind": "analyst_note",
-+                "normalization_version": "legacy-v1",
-+            },
-+            "provenance_ids": [],
-+            "confidence_id": None,
-+            "created_at": _utc_now(),
-+            "updated_at": _utc_now(),
-+        }
-+    return st
-+
-+
-+def with_legacy_compat_aliases(state: dict[str, Any]) -> dict[str, Any]:
-+    out = dict(state)
-+    legacy = out.get("legacy", {}) if isinstance(out, dict) else {}
-+    if isinstance(legacy, dict):
-+        out["external_observations"] = legacy.get("external_observations", [])
-+        out["turn_history"] = legacy.get("turn_history", [])
-+        out["loop_metrics"] = legacy.get("loop_metrics", {})
-+        compat = legacy.get("compat_fields", {})
-+        if isinstance(compat, dict):
-+            for k, v in compat.items():
-+                out.setdefault(k, v)
-+    return out
-diff --git a/agent/runtime.py b/agent/runtime.py
-index 29dd571854b635b939f1e187f4ffe66d1a027197..0736e113584bee896d0e756700cb48604494e377 100644
---- a/agent/runtime.py
-+++ b/agent/runtime.py
-@@ -1,80 +1,89 @@
- from __future__ import annotations
-
- import json
- import re
- import secrets
- import shutil
- from dataclasses import dataclass
- from datetime import datetime, timezone
- from pathlib import Path
- from typing import Any, Callable
-
- from .config import AgentConfig
- from .engine import ContentDeltaCallback, ExternalContext, RLMEngine, StepCallback, TurnSummary
-+from .investigation_state import (
-+    empty_investigation_state,
-+    migrate_legacy_state,
-+    update_with_legacy_fields,
-+    with_legacy_compat_aliases,
-+)
- from .replay_log import ReplayLogger
-
- EventCallback = Callable[[str], None]
-
-
- class SessionError(RuntimeError):
-     pass
-
-
- def _utc_now() -> str:
-     return datetime.now(timezone.utc).isoformat()
-
-
- def _new_session_id() -> str:
-     stamp = datetime.now(timezone.utc).strftime("%Y%m%d-%H%M%S")
-     return f"{stamp}-{secrets.token_hex(3)}"
-
-
- def _safe_component(text: str) -> str:
-     return re.sub(r"[^A-Za-z0-9._-]+", "-", text).strip("-") or "artifact"
-
-
- @dataclass
- class SessionStore:
-     workspace: Path
-     session_root_dir: str = ".openplanter"
-
-     def __post_init__(self) -> None:
-         self.workspace = self.workspace.expanduser().resolve()
-         self.root = (self.workspace / self.session_root_dir).resolve()
-         self.sessions = self.root / "sessions"
-         self.sessions.mkdir(parents=True, exist_ok=True)
-
-     def _session_dir(self, session_id: str) -> Path:
-         return self.sessions / session_id
-
-     def _metadata_path(self, session_id: str) -> Path:
-         return self._session_dir(session_id) / "metadata.json"
-
-     def _state_path(self, session_id: str) -> Path:
-         return self._session_dir(session_id) / "state.json"
-
-+    def _investigation_state_path(self, session_id: str) -> Path:
-+        return self._session_dir(session_id) / "investigation_state.json"
-+
-     def _events_path(self, session_id: str) -> Path:
-         return self._session_dir(session_id) / "events.jsonl"
-
-     def _artifacts_dir(self, session_id: str) -> Path:
-         return self._session_dir(session_id) / "artifacts"
-
-     def _plan_dir(self, session_id: str) -> Path:
-         """Directory where *.plan.md files live (same as session dir)."""
-         return self._session_dir(session_id)
-
-     def latest_session_id(self) -> str | None:
-         session_dirs = [p for p in self.sessions.iterdir() if p.is_dir()]
-         if not session_dirs:
-             return None
-         latest = max(session_dirs, key=lambda p: p.stat().st_mtime)
-         return latest.name
-
-     def list_sessions(self, limit: int = 100) -> list[dict[str, Any]]:
-         session_dirs = sorted(
-             (p for p in self.sessions.iterdir() if p.is_dir()),
-             key=lambda p: p.stat().st_mtime,
-             reverse=True,
-         )
-         out: list[dict[str, Any]] = []
-         for path in session_dirs[:limit]:
-@@ -113,64 +122,98 @@ class SessionStore:
-                 raise SessionError(f"Cannot resume missing session: {sid}")
-         else:
-             if session_dir.exists():
-                 sid = f"{sid}-{secrets.token_hex(2)}"
-                 session_dir = self._session_dir(sid)
-             session_dir.mkdir(parents=True, exist_ok=True)
-             created_new = True
-
-         session_dir.mkdir(parents=True, exist_ok=True)
-         self._artifacts_dir(sid).mkdir(parents=True, exist_ok=True)
-
-         meta_path = self._metadata_path(sid)
-         if not meta_path.exists():
-             meta = {
-                 "session_id": sid,
-                 "workspace": str(self.workspace),
-                 "created_at": _utc_now(),
-                 "updated_at": _utc_now(),
-             }
-             meta_path.write_text(json.dumps(meta, indent=2), encoding="utf-8")
-
-         state = self.load_state(sid)
-         return sid, state, created_new
-
-     def load_state(self, session_id: str) -> dict[str, Any]:
--        state_path = self._state_path(session_id)
--        if not state_path.exists():
--            return {
--                "session_id": session_id,
--                "external_observations": [],
--            }
-+        inv_state_path = self._investigation_state_path(session_id)
-+        legacy_state_path = self._state_path(session_id)
-+        if inv_state_path.exists():
-+            try:
-+                state = json.loads(inv_state_path.read_text(encoding="utf-8"))
-+                if isinstance(state, dict):
-+                    return with_legacy_compat_aliases(state)
-+                raise SessionError(f"Investigation state is not an object: {inv_state_path}")
-+            except json.JSONDecodeError as exc:
-+                raise SessionError(f"Investigation state is invalid JSON: {inv_state_path}") from exc
-+
-+        if not legacy_state_path.exists():
-+            return empty_investigation_state(session_id)
-+
-         try:
--            return json.loads(state_path.read_text(encoding="utf-8"))
-+            legacy_state = json.loads(legacy_state_path.read_text(encoding="utf-8"))
-         except json.JSONDecodeError as exc:
--            raise SessionError(f"Session state is invalid JSON: {state_path}") from exc
-+            raise SessionError(f"Session state is invalid JSON: {legacy_state_path}") from exc
-+
-+        if not isinstance(legacy_state, dict):
-+            raise SessionError(f"Session state must be a JSON object: {legacy_state_path}")
-+        return with_legacy_compat_aliases(migrate_legacy_state(session_id, legacy_state))
-
-     def save_state(self, session_id: str, state: dict[str, Any]) -> None:
-+        typed_state = state
-+        if "legacy" not in typed_state and "external_observations" in typed_state:
-+            typed_state = migrate_legacy_state(session_id, typed_state)
-+        inv_state_path = self._investigation_state_path(session_id)
-+        inv_state_path.write_text(json.dumps(typed_state, indent=2), encoding="utf-8")
-+
-+        legacy = typed_state.get("legacy", {}) if isinstance(typed_state, dict) else {}
-+        legacy_state = {
-+            "session_id": session_id,
-+            "saved_at": typed_state.get("updated_at", _utc_now()) if isinstance(typed_state, dict) else _utc_now(),
-+            "external_observations": legacy.get("external_observations", []),
-+        }
-+        turn_history = legacy.get("turn_history")
-+        if turn_history:
-+            legacy_state["turn_history"] = turn_history
-+        loop_metrics = legacy.get("loop_metrics")
-+        if loop_metrics:
-+            legacy_state["loop_metrics"] = loop_metrics
-+        compat_fields = legacy.get("compat_fields", {})
-+        if isinstance(compat_fields, dict):
-+            for k, v in compat_fields.items():
-+                legacy_state[k] = v
-         state_path = self._state_path(session_id)
--        state_path.write_text(json.dumps(state, indent=2), encoding="utf-8")
-+        state_path.write_text(json.dumps(legacy_state, indent=2), encoding="utf-8")
-         self._touch_metadata(session_id)
-
-     def append_event(self, session_id: str, event_type: str, payload: dict[str, Any]) -> None:
-         event_path = self._events_path(session_id)
-         event = {
-             "ts": _utc_now(),
-             "type": event_type,
-             "payload": payload,
-         }
-         with event_path.open("a", encoding="utf-8") as fh:
-             fh.write(json.dumps(event, ensure_ascii=True) + "\n")
-         self._touch_metadata(session_id)
-
-     def write_artifact(
-         self, session_id: str, category: str, name: str, content: str
-     ) -> str:
-         category_safe = _safe_component(category)
-         name_safe = _safe_component(name)
-         artifact_rel = Path("artifacts") / category_safe / name_safe
-         artifact_abs = self._session_dir(session_id) / artifact_rel
-         artifact_abs.parent.mkdir(parents=True, exist_ok=True)
-         artifact_abs.write_text(content, encoding="utf-8")
-         self._touch_metadata(session_id)
-         return artifact_rel.as_posix()
-
-@@ -225,70 +268,71 @@ class SessionRuntime:
-     store: SessionStore
-     session_id: str
-     context: ExternalContext
-     max_persisted_observations: int = 400
-     turn_history: list[TurnSummary] | None = None
-     max_turn_summaries: int = 50
-     loop_metrics: dict[str, Any] | None = None
-
-     @classmethod
-     def bootstrap(
-         cls,
-         engine: RLMEngine,
-         config: AgentConfig,
-         session_id: str | None = None,
-         resume: bool = False,
-     ) -> "SessionRuntime":
-         store = SessionStore(
-             workspace=config.workspace,
-             session_root_dir=config.session_root_dir,
-         )
-         try:
-             _seed_wiki(config.workspace, config.session_root_dir)
-         except OSError:
-             pass
-         sid, state, created_new = store.open_session(session_id=session_id, resume=resume)
--        persisted = state.get("external_observations", [])
-+        legacy = state.get("legacy", {}) if isinstance(state, dict) else {}
-+        persisted = legacy.get("external_observations", []) if isinstance(legacy, dict) else []
-         obs = [str(x) for x in persisted] if isinstance(persisted, list) else []
-         max_obs = max(1, config.max_persisted_observations)
-         context = ExternalContext(observations=obs[-max_obs:])
-
-         engine.session_dir = store._session_dir(sid)
-         engine.session_id = sid
-
-         # Load turn history from persisted state
--        raw_history = state.get("turn_history", [])
-+        raw_history = legacy.get("turn_history", []) if isinstance(legacy, dict) else []
-         turn_history: list[TurnSummary] = []
-         if isinstance(raw_history, list):
-             for item in raw_history:
-                 if isinstance(item, dict):
-                     try:
-                         turn_history.append(TurnSummary.from_dict(item))
-                     except (KeyError, TypeError):
-                         pass
-         max_turns = max(1, config.max_turn_summaries)
--        raw_loop_metrics = state.get("loop_metrics", {})
-+        raw_loop_metrics = legacy.get("loop_metrics", {}) if isinstance(legacy, dict) else {}
-         loop_metrics: dict[str, Any] = raw_loop_metrics if isinstance(raw_loop_metrics, dict) else {}
-         loop_metrics.setdefault("turns", 0)
-         loop_metrics.setdefault("steps", 0)
-         loop_metrics.setdefault("model_turns", 0)
-         loop_metrics.setdefault("tool_calls", 0)
-         loop_metrics.setdefault("guardrail_warnings", 0)
-         loop_metrics.setdefault("final_rejections", 0)
-         loop_metrics.setdefault("phase_counts", {})
-         if not isinstance(loop_metrics["phase_counts"], dict):
-             loop_metrics["phase_counts"] = {}
-         for phase in ("investigate", "build", "iterate", "finalize"):
-             loop_metrics["phase_counts"].setdefault(phase, 0)
-
-         runtime = cls(
-             engine=engine,
-             store=store,
-             session_id=sid,
-             context=context,
-             max_persisted_observations=max_obs,
-             turn_history=turn_history[-max_turns:],
-             max_turn_summaries=max_turns,
-             loop_metrics=loop_metrics,
-         )
-         try:
-             runtime.store.append_event(
-@@ -428,35 +472,34 @@ class SessionRuntime:
-             result_preview=result_preview,
-             timestamp=_utc_now(),
-             steps_used=steps_used,
-             replay_seq_start=replay_seq_start,
-         )
-         self.turn_history.append(summary)
-         if len(self.turn_history) > self.max_turn_summaries:
-             self.turn_history = self.turn_history[-self.max_turn_summaries:]
-         try:
-             self.store.append_event(
-                 self.session_id,
-                 "result",
-                 {"text": result},
-             )
-         except OSError:
-             pass
-         try:
-             self._persist_state()
-         except OSError:
-             pass
-         return result
-
-     def _persist_state(self) -> None:
-         if len(self.context.observations) > self.max_persisted_observations:
-             self.context.observations = self.context.observations[-self.max_persisted_observations :]
--        state: dict[str, Any] = {
--            "session_id": self.session_id,
--            "saved_at": _utc_now(),
--            "external_observations": self.context.observations,
--        }
--        if self.turn_history:
--            state["turn_history"] = [t.to_dict() for t in self.turn_history]
--        if self.loop_metrics:
--            state["loop_metrics"] = self.loop_metrics
-+        current = self.store.load_state(self.session_id)
-+        state = update_with_legacy_fields(
-+            current,
-+            self.session_id,
-+            self.context.observations,
-+            [t.to_dict() for t in self.turn_history] if self.turn_history else [],
-+            self.loop_metrics or {},
-+        )
-         self.store.save_state(self.session_id, state)
-diff --git a/openplanter-desktop/crates/op-core/src/engine/context.rs b/openplanter-desktop/crates/op-core/src/engine/context.rs
-index 0b522c2fdd088982f95c0ec18295c58d52a709ec..d261b21ecf3b9e32166fc680dc778f792289ca39 100644
---- a/openplanter-desktop/crates/op-core/src/engine/context.rs
-+++ b/openplanter-desktop/crates/op-core/src/engine/context.rs
-@@ -1,129 +1,247 @@
- // External context and turn summary types for multi-turn sessions.
-
- use serde::{Deserialize, Serialize};
-+use serde_json::Value;
- use std::path::Path;
- use tokio::fs;
-
- /// Summary of a completed turn for inclusion in subsequent prompts.
- #[derive(Debug, Clone, Serialize, Deserialize)]
- pub struct TurnSummary {
-     pub turn_number: u32,
-     pub objective: String,
-     pub result_preview: String,
-     pub timestamp: String,
-     pub steps_used: u32,
-     pub replay_seq_start: u64,
- }
-
--/// External context observations persisted to state.json.
-+/// External context observations persisted to state files.
- #[derive(Debug, Clone, Serialize, Deserialize)]
- pub struct ExternalContext {
-     pub observations: Vec<Observation>,
- }
-
- /// A single observation from an external source.
- #[derive(Debug, Clone, Serialize, Deserialize)]
- pub struct Observation {
-     pub source: String,
-     pub timestamp: String,
-     pub content: String,
- }
-
- impl ExternalContext {
-     pub fn new() -> Self {
-         Self {
-             observations: vec![],
-         }
-     }
-
-     /// Add a new observation with the current timestamp.
-     pub fn add_observation(&mut self, source: &str, content: &str) {
-         self.observations.push(Observation {
-             source: source.to_string(),
-             timestamp: chrono::Utc::now().to_rfc3339(),
-             content: content.to_string(),
-         });
-     }
-
--    /// Load external context from state.json in the session directory.
-+    fn from_state_value(value: Value) -> std::io::Result<Self> {
-+        let obj = value.as_object().ok_or_else(|| {
-+            std::io::Error::new(std::io::ErrorKind::InvalidData, "state must be JSON object")
-+        })?;
-+
-+        // New typed investigation_state.json shape.
-+        if let Some(legacy) = obj.get("legacy").and_then(|v| v.as_object()) {
-+            if let Some(observations) = legacy.get("external_observations").and_then(|v| v.as_array()) {
-+                return Ok(Self {
-+                    observations: observations
-+                        .iter()
-+                        .filter_map(|v| v.as_str())
-+                        .map(|content| Observation {
-+                            source: "legacy".to_string(),
-+                            timestamp: chrono::Utc::now().to_rfc3339(),
-+                            content: content.to_string(),
-+                        })
-+                        .collect(),
-+                });
-+            }
-+        }
-+
-+        // Old Python state.json shape.
-+        if let Some(observations) = obj.get("external_observations").and_then(|v| v.as_array()) {
-+            return Ok(Self {
-+                observations: observations
-+                    .iter()
-+                    .filter_map(|v| v.as_str())
-+                    .map(|content| Observation {
-+                        source: "legacy".to_string(),
-+                        timestamp: chrono::Utc::now().to_rfc3339(),
-+                        content: content.to_string(),
-+                    })
-+                    .collect(),
-+            });
-+        }
-+
-+        // Existing Rust shape.
-+        serde_json::from_value(Value::Object(obj.clone()))
-+            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))
-+    }
-+
-+    /// Load external context from investigation_state.json or state.json.
-     pub async fn load(session_dir: &Path) -> std::io::Result<Self> {
--        let path = session_dir.join("state.json");
--        if !path.exists() {
-+        let inv_path = session_dir.join("investigation_state.json");
-+        if inv_path.exists() {
-+            let content = fs::read_to_string(&inv_path).await?;
-+            let value: Value = serde_json::from_str(&content)
-+                .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
-+            return Self::from_state_value(value);
-+        }
-+
-+        let legacy_path = session_dir.join("state.json");
-+        if !legacy_path.exists() {
-             return Ok(Self::new());
-         }
--        let content = fs::read_to_string(&path).await?;
--        serde_json::from_str(&content)
--            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))
-+        let content = fs::read_to_string(&legacy_path).await?;
-+        let value: Value = serde_json::from_str(&content)
-+            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
-+        Self::from_state_value(value)
-     }
-
--    /// Save external context to state.json in the session directory.
-+    /// Save external context in both investigation_state.json and legacy state.json.
-     pub async fn save(&self, session_dir: &Path) -> std::io::Result<()> {
--        let path = session_dir.join("state.json");
--        let json = serde_json::to_string_pretty(self)
-+        let legacy_observations: Vec<String> = self.observations.iter().map(|o| o.content.clone()).collect();
-+        let now = chrono::Utc::now().to_rfc3339();
-+
-+        let investigation_state = serde_json::json!({
-+            "schema_version": "1.0.0",
-+            "session_id": session_dir.file_name().and_then(|x| x.to_str()).unwrap_or_default(),
-+            "created_at": now,
-+            "updated_at": now,
-+            "objective": "",
-+            "ontology": {"namespace": "openplanter.core", "version": "2026-03"},
-+            "entities": {},
-+            "links": {},
-+            "claims": {},
-+            "evidence": {},
-+            "hypotheses": {},
-+            "questions": {},
-+            "tasks": {},
-+            "actions": {},
-+            "provenance_nodes": {},
-+            "confidence_profiles": {},
-+            "timeline": [],
-+            "indexes": {"by_external_ref": {}, "by_tag": {}},
-+            "legacy": {
-+                "external_observations": legacy_observations,
-+                "turn_history": [],
-+                "loop_metrics": {}
-+            }
-+        });
-+
-+        let inv_json = serde_json::to_string_pretty(&investigation_state)
-             .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
--        fs::write(&path, json).await
-+        fs::write(session_dir.join("investigation_state.json"), inv_json).await?;
-+
-+        let legacy_json = serde_json::to_string_pretty(&serde_json::json!({
-+            "session_id": session_dir.file_name().and_then(|x| x.to_str()).unwrap_or_default(),
-+            "saved_at": chrono::Utc::now().to_rfc3339(),
-+            "external_observations": self.observations.iter().map(|o| o.content.clone()).collect::<Vec<String>>()
-+        }))
-+        .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
-+        fs::write(session_dir.join("state.json"), legacy_json).await
-     }
- }
-
- impl Default for ExternalContext {
-     fn default() -> Self {
-         Self::new()
-     }
- }
-
- #[cfg(test)]
- mod tests {
-     use super::*;
-     use tempfile::tempdir;
-
-     #[test]
-     fn test_new_context_empty() {
-         let ctx = ExternalContext::new();
-         assert!(ctx.observations.is_empty());
-     }
-
-     #[test]
-     fn test_add_observation() {
-         let mut ctx = ExternalContext::new();
-         ctx.add_observation("wiki", "Found entity Acme Corp");
-         assert_eq!(ctx.observations.len(), 1);
-         assert_eq!(ctx.observations[0].source, "wiki");
-         assert_eq!(ctx.observations[0].content, "Found entity Acme Corp");
-         assert!(!ctx.observations[0].timestamp.is_empty());
-     }
-
-     #[tokio::test]
-     async fn test_save_and_load() {
-         let tmp = tempdir().unwrap();
-         let mut ctx = ExternalContext::new();
-         ctx.add_observation("wiki", "test observation");
-         ctx.save(tmp.path()).await.unwrap();
-
-         let loaded = ExternalContext::load(tmp.path()).await.unwrap();
-         assert_eq!(loaded.observations.len(), 1);
-         assert_eq!(loaded.observations[0].content, "test observation");
-     }
-
-     #[tokio::test]
-     async fn test_load_missing_returns_empty() {
-         let tmp = tempdir().unwrap();
-         let ctx = ExternalContext::load(tmp.path()).await.unwrap();
-         assert!(ctx.observations.is_empty());
-     }
-
-+    #[tokio::test]
-+    async fn test_load_legacy_python_state_shape() {
-+        let tmp = tempdir().unwrap();
-+        fs::write(
-+            tmp.path().join("state.json"),
-+            r#"{"session_id":"s1","external_observations":["a","b"]}"#,
-+        )
-+        .await
-+        .unwrap();
-+
-+        let loaded = ExternalContext::load(tmp.path()).await.unwrap();
-+        assert_eq!(loaded.observations.len(), 2);
-+        assert_eq!(loaded.observations[0].content, "a");
-+    }
-+
-+    #[tokio::test]
-+    async fn test_load_typed_investigation_state_shape() {
-+        let tmp = tempdir().unwrap();
-+        fs::write(
-+            tmp.path().join("investigation_state.json"),
-+            r#"{"legacy":{"external_observations":["x"]}}"#,
-+        )
-+        .await
-+        .unwrap();
-+
-+        let loaded = ExternalContext::load(tmp.path()).await.unwrap();
-+        assert_eq!(loaded.observations.len(), 1);
-+        assert_eq!(loaded.observations[0].content, "x");
-+    }
-+
-     #[test]
-     fn test_turn_summary_serialization() {
-         let ts = TurnSummary {
-             turn_number: 1,
-             objective: "Investigate Acme Corp".into(),
-             result_preview: "Found connections to...".into(),
-             timestamp: "2026-01-01T00:00:00Z".into(),
-             steps_used: 3,
-             replay_seq_start: 1,
-         };
-         let json = serde_json::to_string(&ts).unwrap();
-         let parsed: TurnSummary = serde_json::from_str(&json).unwrap();
-         assert_eq!(parsed.turn_number, 1);
-         assert_eq!(parsed.objective, "Investigate Acme Corp");
-     }
- }
-diff --git a/tests/test_investigation_state.py b/tests/test_investigation_state.py
-new file mode 100644
-index 0000000000000000000000000000000000000000..bafbedbdbe615fddd44f48c683cb43d7d74d97bc
---- /dev/null
-+++ b/tests/test_investigation_state.py
-@@ -0,0 +1,59 @@
-+from __future__ import annotations
-+
-+import json
-+import tempfile
-+import unittest
-+from pathlib import Path
-+
-+from agent.config import AgentConfig
-+from agent.model import ScriptedModel
-+from agent.runtime import SessionStore, SessionRuntime
-+from agent.tools import WorkspaceTools
-+from agent.engine import RLMEngine
-+
-+
-+class InvestigationStateTests(unittest.TestCase):
-+    def test_load_state_migrates_legacy_state_json(self) -> None:
-+        with tempfile.TemporaryDirectory() as tmpdir:
-+            root = Path(tmpdir)
-+            store = SessionStore(workspace=root)
-+            sid, _, _ = store.open_session(session_id="legacy-migrate", resume=False)
-+            state_path = root / ".openplanter" / "sessions" / sid / "state.json"
-+            legacy = {
-+                "session_id": sid,
-+                "external_observations": ["obs-1", "obs-2"],
-+                "turn_history": [{"turn_number": 1}],
-+                "loop_metrics": {"turns": 1},
-+            }
-+            state_path.write_text(json.dumps(legacy), encoding="utf-8")
-+
-+            typed = store.load_state(sid)
-+            self.assertEqual(typed["schema_version"], "1.0.0")
-+            self.assertEqual(typed["legacy"]["external_observations"], ["obs-1", "obs-2"])
-+            self.assertGreaterEqual(len(typed["evidence"]), 2)
-+            for item in typed["evidence"].values():
-+                self.assertEqual(item["normalization"]["normalization_version"], "legacy-v1")
-+
-+    def test_persist_writes_typed_and_legacy_files(self) -> None:
-+        with tempfile.TemporaryDirectory() as tmpdir:
-+            root = Path(tmpdir)
-+            cfg = AgentConfig(workspace=root, session_root_dir=".openplanter")
-+            engine = RLMEngine(model=ScriptedModel(scripted_turns=[]), tools=WorkspaceTools(root=root), config=cfg)
-+            runtime = SessionRuntime.bootstrap(engine=engine, config=cfg, session_id="typed-save", resume=False)
-+            runtime.context.observations = ["alpha"]
-+            runtime._persist_state()
-+
-+            session_dir = root / ".openplanter" / "sessions" / "typed-save"
-+            typed_path = session_dir / "investigation_state.json"
-+            legacy_path = session_dir / "state.json"
-+            self.assertTrue(typed_path.exists())
-+            self.assertTrue(legacy_path.exists())
-+
-+            typed = json.loads(typed_path.read_text(encoding="utf-8"))
-+            legacy = json.loads(legacy_path.read_text(encoding="utf-8"))
-+            self.assertEqual(typed["legacy"]["external_observations"], ["alpha"])
-+            self.assertEqual(legacy["external_observations"], ["alpha"])
-+
-+
-+if __name__ == "__main__":
-+    unittest.main()
-
-EOF
-)

From 295079ad5d94246e7dbdd1756cf8ec5ef15d5417 Mon Sep 17 00:00:00 2001
From: Drake Thomsen <120344051+ThomsenDrake@users.noreply.github.com>
Date: Fri, 13 Mar 2026 14:04:29 -0400
Subject: [PATCH 23/58] Delete git-apply-3.txt

---
 git-apply-3.txt | 724 ------------------------------------------------
 1 file changed, 724 deletions(-)
 delete mode 100644 git-apply-3.txt

diff --git a/git-apply-3.txt b/git-apply-3.txt
deleted file mode 100644
index 48e16492..00000000
--- a/git-apply-3.txt
+++ /dev/null
@@ -1,724 +0,0 @@
- (cd "$(git rev-parse --show-toplevel)" && git apply --3way <<'EOF'
-diff --git a/agent/runtime.py b/agent/runtime.py
-index 29dd571854b635b939f1e187f4ffe66d1a027197..7e0412cacfc5435ea6bc63696b87b46772586797 100644
---- a/agent/runtime.py
-+++ b/agent/runtime.py
-@@ -31,50 +31,53 @@ def _new_session_id() -> str:
-
- def _safe_component(text: str) -> str:
-     return re.sub(r"[^A-Za-z0-9._-]+", "-", text).strip("-") or "artifact"
-
-
- @dataclass
- class SessionStore:
-     workspace: Path
-     session_root_dir: str = ".openplanter"
-
-     def __post_init__(self) -> None:
-         self.workspace = self.workspace.expanduser().resolve()
-         self.root = (self.workspace / self.session_root_dir).resolve()
-         self.sessions = self.root / "sessions"
-         self.sessions.mkdir(parents=True, exist_ok=True)
-
-     def _session_dir(self, session_id: str) -> Path:
-         return self.sessions / session_id
-
-     def _metadata_path(self, session_id: str) -> Path:
-         return self._session_dir(session_id) / "metadata.json"
-
-     def _state_path(self, session_id: str) -> Path:
-         return self._session_dir(session_id) / "state.json"
-
-+    def _investigation_state_path(self, session_id: str) -> Path:
-+        return self._session_dir(session_id) / "investigation_state.json"
-+
-     def _events_path(self, session_id: str) -> Path:
-         return self._session_dir(session_id) / "events.jsonl"
-
-     def _artifacts_dir(self, session_id: str) -> Path:
-         return self._session_dir(session_id) / "artifacts"
-
-     def _plan_dir(self, session_id: str) -> Path:
-         """Directory where *.plan.md files live (same as session dir)."""
-         return self._session_dir(session_id)
-
-     def latest_session_id(self) -> str | None:
-         session_dirs = [p for p in self.sessions.iterdir() if p.is_dir()]
-         if not session_dirs:
-             return None
-         latest = max(session_dirs, key=lambda p: p.stat().st_mtime)
-         return latest.name
-
-     def list_sessions(self, limit: int = 100) -> list[dict[str, Any]]:
-         session_dirs = sorted(
-             (p for p in self.sessions.iterdir() if p.is_dir()),
-             key=lambda p: p.stat().st_mtime,
-             reverse=True,
-         )
-         out: list[dict[str, Any]] = []
-         for path in session_dirs[:limit]:
-@@ -113,63 +116,78 @@ class SessionStore:
-                 raise SessionError(f"Cannot resume missing session: {sid}")
-         else:
-             if session_dir.exists():
-                 sid = f"{sid}-{secrets.token_hex(2)}"
-                 session_dir = self._session_dir(sid)
-             session_dir.mkdir(parents=True, exist_ok=True)
-             created_new = True
-
-         session_dir.mkdir(parents=True, exist_ok=True)
-         self._artifacts_dir(sid).mkdir(parents=True, exist_ok=True)
-
-         meta_path = self._metadata_path(sid)
-         if not meta_path.exists():
-             meta = {
-                 "session_id": sid,
-                 "workspace": str(self.workspace),
-                 "created_at": _utc_now(),
-                 "updated_at": _utc_now(),
-             }
-             meta_path.write_text(json.dumps(meta, indent=2), encoding="utf-8")
-
-         state = self.load_state(sid)
-         return sid, state, created_new
-
-     def load_state(self, session_id: str) -> dict[str, Any]:
-+        inv_state_path = self._investigation_state_path(session_id)
-         state_path = self._state_path(session_id)
-+        if inv_state_path.exists():
-+            try:
-+                inv_state = json.loads(inv_state_path.read_text(encoding="utf-8"))
-+                return _legacy_projection_from_investigation_state(inv_state, session_id)
-+            except json.JSONDecodeError as exc:
-+                raise SessionError(
-+                    f"Investigation state is invalid JSON: {inv_state_path}"
-+                ) from exc
-         if not state_path.exists():
-             return {
-                 "session_id": session_id,
-                 "external_observations": [],
-             }
-         try:
--            return json.loads(state_path.read_text(encoding="utf-8"))
-+            legacy_state = json.loads(state_path.read_text(encoding="utf-8"))
-+            return _normalize_legacy_state(legacy_state, session_id)
-         except json.JSONDecodeError as exc:
-             raise SessionError(f"Session state is invalid JSON: {state_path}") from exc
-
-     def save_state(self, session_id: str, state: dict[str, Any]) -> None:
-+        inv_state_path = self._investigation_state_path(session_id)
-         state_path = self._state_path(session_id)
-+        inv_state_path.write_text(
-+            json.dumps(_build_investigation_state(state, session_id), indent=2),
-+            encoding="utf-8",
-+        )
-         state_path.write_text(json.dumps(state, indent=2), encoding="utf-8")
-         self._touch_metadata(session_id)
-
-     def append_event(self, session_id: str, event_type: str, payload: dict[str, Any]) -> None:
-         event_path = self._events_path(session_id)
-         event = {
-             "ts": _utc_now(),
-             "type": event_type,
-             "payload": payload,
-         }
-         with event_path.open("a", encoding="utf-8") as fh:
-             fh.write(json.dumps(event, ensure_ascii=True) + "\n")
-         self._touch_metadata(session_id)
-
-     def write_artifact(
-         self, session_id: str, category: str, name: str, content: str
-     ) -> str:
-         category_safe = _safe_component(category)
-         name_safe = _safe_component(name)
-         artifact_rel = Path("artifacts") / category_safe / name_safe
-         artifact_abs = self._session_dir(session_id) / artifact_rel
-         artifact_abs.parent.mkdir(parents=True, exist_ok=True)
-         artifact_abs.write_text(content, encoding="utf-8")
-         self._touch_metadata(session_id)
-         return artifact_rel.as_posix()
-@@ -438,25 +456,124 @@ class SessionRuntime:
-                 self.session_id,
-                 "result",
-                 {"text": result},
-             )
-         except OSError:
-             pass
-         try:
-             self._persist_state()
-         except OSError:
-             pass
-         return result
-
-     def _persist_state(self) -> None:
-         if len(self.context.observations) > self.max_persisted_observations:
-             self.context.observations = self.context.observations[-self.max_persisted_observations :]
-         state: dict[str, Any] = {
-             "session_id": self.session_id,
-             "saved_at": _utc_now(),
-             "external_observations": self.context.observations,
-         }
-         if self.turn_history:
-             state["turn_history"] = [t.to_dict() for t in self.turn_history]
-         if self.loop_metrics:
-             state["loop_metrics"] = self.loop_metrics
-         self.store.save_state(self.session_id, state)
-+
-+
-+def _normalize_legacy_state(raw: dict[str, Any], session_id: str) -> dict[str, Any]:
-+    normalized = dict(raw) if isinstance(raw, dict) else {}
-+    normalized["session_id"] = str(normalized.get("session_id") or session_id)
-+    obs = normalized.get("external_observations")
-+    if isinstance(obs, list):
-+        normalized["external_observations"] = [str(item) for item in obs]
-+    else:
-+        normalized["external_observations"] = []
-+    return normalized
-+
-+
-+def _legacy_projection_from_investigation_state(
-+    inv_state: dict[str, Any],
-+    session_id: str,
-+) -> dict[str, Any]:
-+    fallback = _normalize_legacy_state({}, session_id)
-+    if not isinstance(inv_state, dict):
-+        return fallback
-+
-+    legacy = inv_state.get("legacy")
-+    observations: list[str] = []
-+    if isinstance(legacy, dict):
-+        raw_obs = legacy.get("external_observations")
-+        if isinstance(raw_obs, list):
-+            observations = [str(item) for item in raw_obs]
-+
-+    if not observations:
-+        evidence = inv_state.get("evidence")
-+        if isinstance(evidence, dict):
-+            legacy_items: list[tuple[str, dict[str, Any]]] = []
-+            for evidence_id, value in evidence.items():
-+                if not isinstance(value, dict):
-+                    continue
-+                normalization = value.get("normalization")
-+                if not (
-+                    isinstance(normalization, dict)
-+                    and normalization.get("kind") == "legacy_observation"
-+                ):
-+                    continue
-+                content = value.get("content")
-+                if isinstance(content, str) and content:
-+                    legacy_items.append((str(evidence_id), value))
-+            legacy_items.sort(key=lambda item: item[0])
-+            observations = [item[1]["content"] for item in legacy_items]
-+
-+    return {
-+        "session_id": str(inv_state.get("session_id") or session_id),
-+        "saved_at": str(inv_state.get("updated_at") or _utc_now()),
-+        "external_observations": observations,
-+        "turn_history": legacy.get("turn_history", []) if isinstance(legacy, dict) else [],
-+        "loop_metrics": legacy.get("loop_metrics", {}) if isinstance(legacy, dict) else {},
-+    }
-+
-+
-+def _build_investigation_state(legacy_state: dict[str, Any], session_id: str) -> dict[str, Any]:
-+    now = _utc_now()
-+    normalized_legacy = _normalize_legacy_state(legacy_state, session_id)
-+    observations = normalized_legacy.get("external_observations", [])
-+    evidence: dict[str, Any] = {}
-+    if isinstance(observations, list):
-+        for idx, item in enumerate(observations):
-+            evidence_id = f"ev_legacy_{idx:04d}"
-+            evidence[evidence_id] = {
-+                "id": evidence_id,
-+                "evidence_type": "legacy_observation",
-+                "content": str(item),
-+                "normalization": {
-+                    "kind": "legacy_observation",
-+                    "normalization_version": "legacy-v1",
-+                },
-+            }
-+
-+    return {
-+        "schema_version": "1.0.0",
-+        "session_id": str(normalized_legacy.get("session_id") or session_id),
-+        "created_at": str(normalized_legacy.get("created_at") or now),
-+        "updated_at": str(normalized_legacy.get("saved_at") or now),
-+        "objective": normalized_legacy.get("objective"),
-+        "ontology": {"namespace": "openplanter.core", "version": "2026-03"},
-+        "entities": {},
-+        "links": {},
-+        "claims": {},
-+        "evidence": evidence,
-+        "hypotheses": {},
-+        "questions": {},
-+        "tasks": {},
-+        "actions": {},
-+        "provenance_nodes": {},
-+        "confidence_profiles": {},
-+        "timeline": [],
-+        "indexes": {"by_external_ref": {}, "by_tag": {}},
-+        "legacy": {
-+            "external_observations": observations,
-+            "turn_history": normalized_legacy.get("turn_history", []),
-+            "loop_metrics": normalized_legacy.get("loop_metrics", {}),
-+        },
-+    }
-diff --git a/openplanter-desktop/crates/op-core/src/engine/context.rs b/openplanter-desktop/crates/op-core/src/engine/context.rs
-index 0b522c2fdd088982f95c0ec18295c58d52a709ec..f904fa0d2dcd047b4c4c14ef4401b70afe9c3f31 100644
---- a/openplanter-desktop/crates/op-core/src/engine/context.rs
-+++ b/openplanter-desktop/crates/op-core/src/engine/context.rs
-@@ -1,129 +1,337 @@
- // External context and turn summary types for multi-turn sessions.
-
- use serde::{Deserialize, Serialize};
- use std::path::Path;
- use tokio::fs;
-
-+const INVESTIGATION_STATE_SCHEMA_VERSION: &str = "1.0.0";
-+
- /// Summary of a completed turn for inclusion in subsequent prompts.
- #[derive(Debug, Clone, Serialize, Deserialize)]
- pub struct TurnSummary {
-     pub turn_number: u32,
-     pub objective: String,
-     pub result_preview: String,
-     pub timestamp: String,
-     pub steps_used: u32,
-     pub replay_seq_start: u64,
- }
-
- /// External context observations persisted to state.json.
- #[derive(Debug, Clone, Serialize, Deserialize)]
- pub struct ExternalContext {
-     pub observations: Vec<Observation>,
- }
-
-+#[derive(Debug, Clone, Serialize, Deserialize)]
-+struct LegacyState {
-+    #[serde(default)]
-+    session_id: Option<String>,
-+    #[serde(default)]
-+    external_observations: Vec<String>,
-+}
-+
-+#[derive(Debug, Clone, Serialize, Deserialize)]
-+struct InvestigationState {
-+    #[serde(default)]
-+    schema_version: String,
-+    #[serde(default)]
-+    session_id: Option<String>,
-+    #[serde(default)]
-+    legacy: LegacyInvestigationBlock,
-+    #[serde(default)]
-+    evidence: std::collections::BTreeMap<String, EvidenceRecord>,
-+}
-+
-+#[derive(Debug, Clone, Serialize, Deserialize, Default)]
-+struct LegacyInvestigationBlock {
-+    #[serde(default)]
-+    external_observations: Vec<String>,
-+}
-+
-+#[derive(Debug, Clone, Serialize, Deserialize, Default)]
-+struct EvidenceRecord {
-+    #[serde(default)]
-+    content: Option<String>,
-+    #[serde(default)]
-+    normalization: Option<EvidenceNormalization>,
-+}
-+
-+#[derive(Debug, Clone, Serialize, Deserialize, Default)]
-+struct EvidenceNormalization {
-+    #[serde(default)]
-+    kind: Option<String>,
-+}
-+
- /// A single observation from an external source.
- #[derive(Debug, Clone, Serialize, Deserialize)]
- pub struct Observation {
-     pub source: String,
-     pub timestamp: String,
-     pub content: String,
- }
-
- impl ExternalContext {
-     pub fn new() -> Self {
-         Self {
-             observations: vec![],
-         }
-     }
-
-     /// Add a new observation with the current timestamp.
-     pub fn add_observation(&mut self, source: &str, content: &str) {
-         self.observations.push(Observation {
-             source: source.to_string(),
-             timestamp: chrono::Utc::now().to_rfc3339(),
-             content: content.to_string(),
-         });
-     }
-
-     /// Load external context from state.json in the session directory.
-     pub async fn load(session_dir: &Path) -> std::io::Result<Self> {
-+        let inv_path = session_dir.join("investigation_state.json");
-         let path = session_dir.join("state.json");
-+        if inv_path.exists() {
-+            let content = fs::read_to_string(&inv_path).await?;
-+            let state: InvestigationState = serde_json::from_str(&content)
-+                .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
-+            return Ok(Self {
-+                observations: observations_from_investigation_state(&state)
-+                    .into_iter()
-+                    .map(|content| Observation {
-+                        source: "legacy_migration".to_string(),
-+                        timestamp: chrono::Utc::now().to_rfc3339(),
-+                        content,
-+                    })
-+                    .collect(),
-+            });
-+        }
-         if !path.exists() {
-             return Ok(Self::new());
-         }
-         let content = fs::read_to_string(&path).await?;
--        serde_json::from_str(&content)
--            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))
-+        if let Ok(ctx) = serde_json::from_str::<Self>(&content) {
-+            return Ok(ctx);
-+        }
-+        if let Ok(legacy) = serde_json::from_str::<LegacyState>(&content) {
-+            return Ok(Self {
-+                observations: legacy
-+                    .external_observations
-+                    .into_iter()
-+                    .map(|content| Observation {
-+                        source: "legacy_state".to_string(),
-+                        timestamp: chrono::Utc::now().to_rfc3339(),
-+                        content,
-+                    })
-+                    .collect(),
-+            });
-+        }
-+        Err(std::io::Error::new(
-+            std::io::ErrorKind::InvalidData,
-+            "state.json format not recognized",
-+        ))
-     }
-
-     /// Save external context to state.json in the session directory.
-     pub async fn save(&self, session_dir: &Path) -> std::io::Result<()> {
-         let path = session_dir.join("state.json");
-+        let inv_path = session_dir.join("investigation_state.json");
-         let json = serde_json::to_string_pretty(self)
-             .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
--        fs::write(&path, json).await
-+        fs::write(&path, json).await?;
-+
-+        let investigation_state = build_investigation_state(self);
-+        let inv_json = serde_json::to_string_pretty(&investigation_state)
-+            .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
-+        fs::write(&inv_path, inv_json).await
-+    }
-+}
-+
-+fn observations_from_investigation_state(state: &InvestigationState) -> Vec<String> {
-+    if !state.legacy.external_observations.is_empty() {
-+        return state.legacy.external_observations.clone();
-+    }
-+    let mut extracted = vec![];
-+    for evidence in state.evidence.values() {
-+        let is_legacy = evidence
-+            .normalization
-+            .as_ref()
-+            .and_then(|norm| norm.kind.as_deref())
-+            == Some("legacy_observation");
-+        if !is_legacy {
-+            continue;
-+        }
-+        if let Some(content) = &evidence.content {
-+            if !content.is_empty() {
-+                extracted.push(content.clone());
-+            }
-+        }
-     }
-+    extracted
-+}
-+
-+fn build_investigation_state(context: &ExternalContext) -> serde_json::Value {
-+    let mut evidence = serde_json::Map::new();
-+    for (idx, obs) in context.observations.iter().enumerate() {
-+        let id = format!("ev_legacy_{idx:04}");
-+        evidence.insert(
-+            id.clone(),
-+            serde_json::json!({
-+                "id": id,
-+                "evidence_type": "legacy_observation",
-+                "content": obs.content,
-+                "normalization": {
-+                    "kind": "legacy_observation",
-+                    "normalization_version": "legacy-v1"
-+                }
-+            }),
-+        );
-+    }
-+    serde_json::json!({
-+        "schema_version": INVESTIGATION_STATE_SCHEMA_VERSION,
-+        "session_id": serde_json::Value::Null,
-+        "created_at": chrono::Utc::now().to_rfc3339(),
-+        "updated_at": chrono::Utc::now().to_rfc3339(),
-+        "objective": serde_json::Value::Null,
-+        "ontology": {"namespace": "openplanter.core", "version": "2026-03"},
-+        "entities": {},
-+        "links": {},
-+        "claims": {},
-+        "evidence": evidence,
-+        "hypotheses": {},
-+        "questions": {},
-+        "tasks": {},
-+        "actions": {},
-+        "provenance_nodes": {},
-+        "confidence_profiles": {},
-+        "timeline": [],
-+        "indexes": {"by_external_ref": {}, "by_tag": {}},
-+        "legacy": {
-+            "external_observations": context
-+                .observations
-+                .iter()
-+                .map(|o| o.content.clone())
-+                .collect::<Vec<_>>()
-+        }
-+    })
- }
-
- impl Default for ExternalContext {
-     fn default() -> Self {
-         Self::new()
-     }
- }
-
- #[cfg(test)]
- mod tests {
-     use super::*;
-     use tempfile::tempdir;
-
-     #[test]
-     fn test_new_context_empty() {
-         let ctx = ExternalContext::new();
-         assert!(ctx.observations.is_empty());
-     }
-
-     #[test]
-     fn test_add_observation() {
-         let mut ctx = ExternalContext::new();
-         ctx.add_observation("wiki", "Found entity Acme Corp");
-         assert_eq!(ctx.observations.len(), 1);
-         assert_eq!(ctx.observations[0].source, "wiki");
-         assert_eq!(ctx.observations[0].content, "Found entity Acme Corp");
-         assert!(!ctx.observations[0].timestamp.is_empty());
-     }
-
-     #[tokio::test]
-     async fn test_save_and_load() {
-         let tmp = tempdir().unwrap();
-         let mut ctx = ExternalContext::new();
-         ctx.add_observation("wiki", "test observation");
-         ctx.save(tmp.path()).await.unwrap();
-
-         let loaded = ExternalContext::load(tmp.path()).await.unwrap();
-         assert_eq!(loaded.observations.len(), 1);
-         assert_eq!(loaded.observations[0].content, "test observation");
-     }
-
-     #[tokio::test]
-     async fn test_load_missing_returns_empty() {
-         let tmp = tempdir().unwrap();
-         let ctx = ExternalContext::load(tmp.path()).await.unwrap();
-         assert!(ctx.observations.is_empty());
-     }
-
-+    #[tokio::test]
-+    async fn test_load_legacy_state_json_string_observations() {
-+        let tmp = tempdir().unwrap();
-+        fs::write(
-+            tmp.path().join("state.json"),
-+            r#"{"session_id":"s1","external_observations":["one","two"]}"#,
-+        )
-+        .await
-+        .unwrap();
-+
-+        let loaded = ExternalContext::load(tmp.path()).await.unwrap();
-+        assert_eq!(loaded.observations.len(), 2);
-+        assert_eq!(loaded.observations[0].content, "one");
-+        assert_eq!(loaded.observations[1].content, "two");
-+    }
-+
-+    #[tokio::test]
-+    async fn test_load_investigation_state_prefers_legacy_block() {
-+        let tmp = tempdir().unwrap();
-+        fs::write(
-+            tmp.path().join("investigation_state.json"),
-+            r#"{
-+  "schema_version":"1.0.0",
-+  "legacy":{"external_observations":["from-legacy"]},
-+  "evidence":{"ev_legacy_0000":{"content":"from-evidence","normalization":{"kind":"legacy_observation"}}}
-+}"#,
-+        )
-+        .await
-+        .unwrap();
-+
-+        let loaded = ExternalContext::load(tmp.path()).await.unwrap();
-+        assert_eq!(loaded.observations.len(), 1);
-+        assert_eq!(loaded.observations[0].content, "from-legacy");
-+    }
-+
-+    #[tokio::test]
-+    async fn test_save_writes_investigation_state() {
-+        let tmp = tempdir().unwrap();
-+        let mut ctx = ExternalContext::new();
-+        ctx.add_observation("wiki", "test observation");
-+        ctx.save(tmp.path()).await.unwrap();
-+
-+        let inv = fs::read_to_string(tmp.path().join("investigation_state.json"))
-+            .await
-+            .unwrap();
-+        let parsed: serde_json::Value = serde_json::from_str(&inv).unwrap();
-+        assert_eq!(parsed["schema_version"], "1.0.0");
-+        assert_eq!(
-+            parsed["legacy"]["external_observations"][0],
-+            "test observation"
-+        );
-+        assert_eq!(
-+            parsed["evidence"]["ev_legacy_0000"]["normalization"]["kind"],
-+            "legacy_observation"
-+        );
-+    }
-+
-     #[test]
-     fn test_turn_summary_serialization() {
-         let ts = TurnSummary {
-             turn_number: 1,
-             objective: "Investigate Acme Corp".into(),
-             result_preview: "Found connections to...".into(),
-             timestamp: "2026-01-01T00:00:00Z".into(),
-             steps_used: 3,
-             replay_seq_start: 1,
-         };
-         let json = serde_json::to_string(&ts).unwrap();
-         let parsed: TurnSummary = serde_json::from_str(&json).unwrap();
-         assert_eq!(parsed.turn_number, 1);
-         assert_eq!(parsed.objective, "Investigate Acme Corp");
-     }
- }
-diff --git a/tests/test_investigation_state_migration.py b/tests/test_investigation_state_migration.py
-new file mode 100644
-index 0000000000000000000000000000000000000000..e3c73cfd80380dd8a6ba1d4a537b84d9c9227015
---- /dev/null
-+++ b/tests/test_investigation_state_migration.py
-@@ -0,0 +1,106 @@
-+from __future__ import annotations
-+
-+import json
-+import tempfile
-+import unittest
-+from pathlib import Path
-+
-+from agent.runtime import SessionStore
-+
-+
-+class InvestigationStateMigrationTests(unittest.TestCase):
-+    def test_save_state_writes_investigation_state_and_legacy_projection(self) -> None:
-+        with tempfile.TemporaryDirectory() as tmpdir:
-+            root = Path(tmpdir)
-+            store = SessionStore(workspace=root, session_root_dir=".openplanter")
-+            sid, _, _ = store.open_session(session_id="migration-a", resume=False)
-+
-+            legacy_state = {
-+                "session_id": sid,
-+                "saved_at": "2026-03-13T12:10:00Z",
-+                "external_observations": ["obs-a", "obs-b"],
-+                "turn_history": [{"turn_number": 1}],
-+                "loop_metrics": {"turns": 1},
-+            }
-+            store.save_state(sid, legacy_state)
-+
-+            inv_path = root / ".openplanter" / "sessions" / sid / "investigation_state.json"
-+            self.assertTrue(inv_path.exists())
-+            inv = json.loads(inv_path.read_text(encoding="utf-8"))
-+            self.assertEqual(inv["schema_version"], "1.0.0")
-+            self.assertEqual(inv["legacy"]["external_observations"], ["obs-a", "obs-b"])
-+            self.assertEqual(
-+                inv["evidence"]["ev_legacy_0000"]["normalization"]["kind"],
-+                "legacy_observation",
-+            )
-+            self.assertEqual(inv["evidence"]["ev_legacy_0001"]["content"], "obs-b")
-+
-+    def test_load_state_prefers_investigation_state(self) -> None:
-+        with tempfile.TemporaryDirectory() as tmpdir:
-+            root = Path(tmpdir)
-+            store = SessionStore(workspace=root, session_root_dir=".openplanter")
-+            sid, _, _ = store.open_session(session_id="migration-b", resume=False)
-+            session_dir = root / ".openplanter" / "sessions" / sid
-+
-+            (session_dir / "state.json").write_text(
-+                json.dumps({"session_id": sid, "external_observations": ["legacy-file"]}),
-+                encoding="utf-8",
-+            )
-+            (session_dir / "investigation_state.json").write_text(
-+                json.dumps(
-+                    {
-+                        "schema_version": "1.0.0",
-+                        "session_id": sid,
-+                        "updated_at": "2026-03-13T12:00:00Z",
-+                        "legacy": {"external_observations": ["typed-file"]},
-+                        "evidence": {
-+                            "ev_legacy_0000": {
-+                                "content": "from-evidence",
-+                                "normalization": {"kind": "legacy_observation"},
-+                            }
-+                        },
-+                    }
-+                ),
-+                encoding="utf-8",
-+            )
-+
-+            loaded = store.load_state(sid)
-+            self.assertEqual(loaded["external_observations"], ["typed-file"])
-+
-+    def test_load_state_uses_evidence_when_legacy_block_missing(self) -> None:
-+        with tempfile.TemporaryDirectory() as tmpdir:
-+            root = Path(tmpdir)
-+            store = SessionStore(workspace=root, session_root_dir=".openplanter")
-+            sid, _, _ = store.open_session(session_id="migration-c", resume=False)
-+            session_dir = root / ".openplanter" / "sessions" / sid
-+
-+            (session_dir / "investigation_state.json").write_text(
-+                json.dumps(
-+                    {
-+                        "schema_version": "1.0.0",
-+                        "session_id": sid,
-+                        "evidence": {
-+                            "ev_legacy_0001": {
-+                                "content": "second",
-+                                "normalization": {"kind": "legacy_observation"},
-+                            },
-+                            "ev_legacy_0000": {
-+                                "content": "first",
-+                                "normalization": {"kind": "legacy_observation"},
-+                            },
-+                            "ev_other": {
-+                                "content": "ignore",
-+                                "normalization": {"kind": "web_fetch"},
-+                            },
-+                        },
-+                    }
-+                ),
-+                encoding="utf-8",
-+            )
-+
-+            loaded = store.load_state(sid)
-+            self.assertEqual(loaded["external_observations"], ["first", "second"])
-+
-+
-+if __name__ == "__main__":
-+    unittest.main()
-
-EOF
-)

From 436cb78b8491252477f37cf7518998889080686d Mon Sep 17 00:00:00 2001
From: Drake Thomsen <120344051+ThomsenDrake@users.noreply.github.com>
Date: Fri, 13 Mar 2026 14:04:37 -0400
Subject: [PATCH 24/58] Delete git-apply-4.txt

---
 git-apply-4.txt | 809 ------------------------------------------------
 1 file changed, 809 deletions(-)
 delete mode 100644 git-apply-4.txt

diff --git a/git-apply-4.txt b/git-apply-4.txt
deleted file mode 100644
index 29e8014f..00000000
--- a/git-apply-4.txt
+++ /dev/null
@@ -1,809 +0,0 @@
- (cd "$(git rev-parse --show-toplevel)" && git apply --3way <<'EOF'
-diff --git a/agent/investigation_state.py b/agent/investigation_state.py
-new file mode 100644
-index 0000000000000000000000000000000000000000..4ac8305dc13d542f2a5d69d7d0497ab417551bd9
---- /dev/null
-+++ b/agent/investigation_state.py
-@@ -0,0 +1,137 @@
-+from __future__ import annotations
-+
-+from datetime import datetime, timezone
-+from typing import Any
-+
-+
-+SCHEMA_VERSION = "1.0.0"
-+
-+
-+def utc_now() -> str:
-+    return datetime.now(timezone.utc).isoformat()
-+
-+
-+def _as_string_list(value: Any) -> list[str]:
-+    if not isinstance(value, list):
-+        return []
-+    return [str(item) for item in value]
-+
-+
-+def _default_state(session_id: str) -> dict[str, Any]:
-+    now = utc_now()
-+    return {
-+        "schema_version": SCHEMA_VERSION,
-+        "session_id": session_id,
-+        "created_at": now,
-+        "updated_at": now,
-+        "objective": "",
-+        "ontology": {
-+            "namespace": "openplanter.core",
-+            "version": "2026-03",
-+        },
-+        "entities": {},
-+        "links": {},
-+        "claims": {},
-+        "evidence": {},
-+        "hypotheses": {},
-+        "questions": {},
-+        "tasks": {},
-+        "actions": {},
-+        "provenance_nodes": {},
-+        "confidence_profiles": {},
-+        "timeline": [],
-+        "indexes": {
-+            "by_external_ref": {},
-+            "by_tag": {},
-+        },
-+        "legacy": {
-+            "external_observations": [],
-+            "turn_history": [],
-+            "loop_metrics": {},
-+        },
-+    }
-+
-+
-+def from_legacy_state(legacy_state: dict[str, Any], session_id: str) -> dict[str, Any]:
-+    state = _default_state(session_id)
-+    external_observations = _as_string_list(legacy_state.get("external_observations"))
-+    state["legacy"] = {
-+        "external_observations": external_observations,
-+        "turn_history": legacy_state.get("turn_history", []) if isinstance(legacy_state.get("turn_history"), list) else [],
-+        "loop_metrics": legacy_state.get("loop_metrics", {}) if isinstance(legacy_state.get("loop_metrics"), dict) else {},
-+    }
-+
-+    evidence: dict[str, dict[str, Any]] = {}
-+    for idx, observation in enumerate(external_observations, start=1):
-+        evidence_id = f"ev_legacy_{idx:04d}"
-+        evidence[evidence_id] = {
-+            "id": evidence_id,
-+            "evidence_type": "human_note",
-+            "content": observation,
-+            "normalization": {
-+                "kind": "analyst_note",
-+                "normalization_version": "legacy-v1",
-+            },
-+        }
-+    state["evidence"] = evidence
-+    if isinstance(legacy_state.get("saved_at"), str):
-+        state["updated_at"] = str(legacy_state["saved_at"])
-+    return state
-+
-+
-+def merge_legacy_updates(
-+    current_state: dict[str, Any],
-+    *,
-+    observations: list[str],
-+    turn_history: list[dict[str, Any]] | None,
-+    loop_metrics: dict[str, Any] | None,
-+) -> dict[str, Any]:
-+    now = utc_now()
-+    merged = dict(current_state)
-+    merged.setdefault("schema_version", SCHEMA_VERSION)
-+    merged["updated_at"] = now
-+    merged.setdefault("session_id", "")
-+    merged.setdefault("created_at", now)
-+    merged.setdefault("ontology", {"namespace": "openplanter.core", "version": "2026-03"})
-+    for key in (
-+        "entities",
-+        "links",
-+        "claims",
-+        "evidence",
-+        "hypotheses",
-+        "questions",
-+        "tasks",
-+        "actions",
-+        "provenance_nodes",
-+        "confidence_profiles",
-+    ):
-+        merged.setdefault(key, {})
-+    merged.setdefault("timeline", [])
-+    merged.setdefault("indexes", {"by_external_ref": {}, "by_tag": {}})
-+
-+    legacy = merged.get("legacy")
-+    if not isinstance(legacy, dict):
-+        legacy = {}
-+    legacy["external_observations"] = list(observations)
-+    legacy["turn_history"] = turn_history if turn_history is not None else []
-+    legacy["loop_metrics"] = loop_metrics if loop_metrics is not None else {}
-+    merged["legacy"] = legacy
-+
-+    evidence = merged.get("evidence")
-+    if not isinstance(evidence, dict):
-+        evidence = {}
-+    for idx, observation in enumerate(observations, start=1):
-+        evidence_id = f"ev_legacy_{idx:04d}"
-+        if evidence_id in evidence:
-+            continue
-+        evidence[evidence_id] = {
-+            "id": evidence_id,
-+            "evidence_type": "human_note",
-+            "content": observation,
-+            "normalization": {
-+                "kind": "analyst_note",
-+                "normalization_version": "legacy-v1",
-+            },
-+        }
-+    merged["evidence"] = evidence
-+    return merged
-diff --git a/agent/runtime.py b/agent/runtime.py
-index 29dd571854b635b939f1e187f4ffe66d1a027197..f497669bffc5f399246b2c8efe1d0b93e1cbe736 100644
---- a/agent/runtime.py
-+++ b/agent/runtime.py
-@@ -1,83 +1,87 @@
- from __future__ import annotations
-
- import json
- import re
- import secrets
- import shutil
- from dataclasses import dataclass
- from datetime import datetime, timezone
- from pathlib import Path
- from typing import Any, Callable
-
- from .config import AgentConfig
- from .engine import ContentDeltaCallback, ExternalContext, RLMEngine, StepCallback, TurnSummary
-+from .investigation_state import from_legacy_state, merge_legacy_updates
- from .replay_log import ReplayLogger
-
- EventCallback = Callable[[str], None]
-
-
- class SessionError(RuntimeError):
-     pass
-
-
- def _utc_now() -> str:
-     return datetime.now(timezone.utc).isoformat()
-
-
- def _new_session_id() -> str:
-     stamp = datetime.now(timezone.utc).strftime("%Y%m%d-%H%M%S")
-     return f"{stamp}-{secrets.token_hex(3)}"
-
-
- def _safe_component(text: str) -> str:
-     return re.sub(r"[^A-Za-z0-9._-]+", "-", text).strip("-") or "artifact"
-
-
- @dataclass
- class SessionStore:
-     workspace: Path
-     session_root_dir: str = ".openplanter"
-
-     def __post_init__(self) -> None:
-         self.workspace = self.workspace.expanduser().resolve()
-         self.root = (self.workspace / self.session_root_dir).resolve()
-         self.sessions = self.root / "sessions"
-         self.sessions.mkdir(parents=True, exist_ok=True)
-
-     def _session_dir(self, session_id: str) -> Path:
-         return self.sessions / session_id
-
-     def _metadata_path(self, session_id: str) -> Path:
-         return self._session_dir(session_id) / "metadata.json"
-
-     def _state_path(self, session_id: str) -> Path:
-         return self._session_dir(session_id) / "state.json"
-
-     def _events_path(self, session_id: str) -> Path:
-         return self._session_dir(session_id) / "events.jsonl"
-
-+    def _investigation_state_path(self, session_id: str) -> Path:
-+        return self._session_dir(session_id) / "investigation_state.json"
-+
-     def _artifacts_dir(self, session_id: str) -> Path:
-         return self._session_dir(session_id) / "artifacts"
-
-     def _plan_dir(self, session_id: str) -> Path:
-         """Directory where *.plan.md files live (same as session dir)."""
-         return self._session_dir(session_id)
-
-     def latest_session_id(self) -> str | None:
-         session_dirs = [p for p in self.sessions.iterdir() if p.is_dir()]
-         if not session_dirs:
-             return None
-         latest = max(session_dirs, key=lambda p: p.stat().st_mtime)
-         return latest.name
-
-     def list_sessions(self, limit: int = 100) -> list[dict[str, Any]]:
-         session_dirs = sorted(
-             (p for p in self.sessions.iterdir() if p.is_dir()),
-             key=lambda p: p.stat().st_mtime,
-             reverse=True,
-         )
-         out: list[dict[str, Any]] = []
-         for path in session_dirs[:limit]:
-             meta_path = path / "metadata.json"
-             meta: dict[str, Any] = {}
-             if meta_path.exists():
-@@ -129,50 +133,68 @@ class SessionStore:
-                 "created_at": _utc_now(),
-                 "updated_at": _utc_now(),
-             }
-             meta_path.write_text(json.dumps(meta, indent=2), encoding="utf-8")
-
-         state = self.load_state(sid)
-         return sid, state, created_new
-
-     def load_state(self, session_id: str) -> dict[str, Any]:
-         state_path = self._state_path(session_id)
-         if not state_path.exists():
-             return {
-                 "session_id": session_id,
-                 "external_observations": [],
-             }
-         try:
-             return json.loads(state_path.read_text(encoding="utf-8"))
-         except json.JSONDecodeError as exc:
-             raise SessionError(f"Session state is invalid JSON: {state_path}") from exc
-
-     def save_state(self, session_id: str, state: dict[str, Any]) -> None:
-         state_path = self._state_path(session_id)
-         state_path.write_text(json.dumps(state, indent=2), encoding="utf-8")
-         self._touch_metadata(session_id)
-
-+    def load_investigation_state(self, session_id: str) -> dict[str, Any]:
-+        typed_path = self._investigation_state_path(session_id)
-+        if typed_path.exists():
-+            try:
-+                return json.loads(typed_path.read_text(encoding="utf-8"))
-+            except json.JSONDecodeError as exc:
-+                raise SessionError(f"Typed investigation state is invalid JSON: {typed_path}") from exc
-+
-+        legacy_state = self.load_state(session_id)
-+        typed_state = from_legacy_state(legacy_state=legacy_state, session_id=session_id)
-+        self.save_investigation_state(session_id, typed_state)
-+        return typed_state
-+
-+    def save_investigation_state(self, session_id: str, typed_state: dict[str, Any]) -> None:
-+        typed_path = self._investigation_state_path(session_id)
-+        typed_path.write_text(json.dumps(typed_state, indent=2), encoding="utf-8")
-+        self._touch_metadata(session_id)
-+
-     def append_event(self, session_id: str, event_type: str, payload: dict[str, Any]) -> None:
-         event_path = self._events_path(session_id)
-         event = {
-             "ts": _utc_now(),
-             "type": event_type,
-             "payload": payload,
-         }
-         with event_path.open("a", encoding="utf-8") as fh:
-             fh.write(json.dumps(event, ensure_ascii=True) + "\n")
-         self._touch_metadata(session_id)
-
-     def write_artifact(
-         self, session_id: str, category: str, name: str, content: str
-     ) -> str:
-         category_safe = _safe_component(category)
-         name_safe = _safe_component(name)
-         artifact_rel = Path("artifacts") / category_safe / name_safe
-         artifact_abs = self._session_dir(session_id) / artifact_rel
-         artifact_abs.parent.mkdir(parents=True, exist_ok=True)
-         artifact_abs.write_text(content, encoding="utf-8")
-         self._touch_metadata(session_id)
-         return artifact_rel.as_posix()
-
-     def _touch_metadata(self, session_id: str) -> None:
-         meta_path = self._metadata_path(session_id)
-@@ -225,50 +247,51 @@ class SessionRuntime:
-     store: SessionStore
-     session_id: str
-     context: ExternalContext
-     max_persisted_observations: int = 400
-     turn_history: list[TurnSummary] | None = None
-     max_turn_summaries: int = 50
-     loop_metrics: dict[str, Any] | None = None
-
-     @classmethod
-     def bootstrap(
-         cls,
-         engine: RLMEngine,
-         config: AgentConfig,
-         session_id: str | None = None,
-         resume: bool = False,
-     ) -> "SessionRuntime":
-         store = SessionStore(
-             workspace=config.workspace,
-             session_root_dir=config.session_root_dir,
-         )
-         try:
-             _seed_wiki(config.workspace, config.session_root_dir)
-         except OSError:
-             pass
-         sid, state, created_new = store.open_session(session_id=session_id, resume=resume)
-+        store.load_investigation_state(sid)
-         persisted = state.get("external_observations", [])
-         obs = [str(x) for x in persisted] if isinstance(persisted, list) else []
-         max_obs = max(1, config.max_persisted_observations)
-         context = ExternalContext(observations=obs[-max_obs:])
-
-         engine.session_dir = store._session_dir(sid)
-         engine.session_id = sid
-
-         # Load turn history from persisted state
-         raw_history = state.get("turn_history", [])
-         turn_history: list[TurnSummary] = []
-         if isinstance(raw_history, list):
-             for item in raw_history:
-                 if isinstance(item, dict):
-                     try:
-                         turn_history.append(TurnSummary.from_dict(item))
-                     except (KeyError, TypeError):
-                         pass
-         max_turns = max(1, config.max_turn_summaries)
-         raw_loop_metrics = state.get("loop_metrics", {})
-         loop_metrics: dict[str, Any] = raw_loop_metrics if isinstance(raw_loop_metrics, dict) else {}
-         loop_metrics.setdefault("turns", 0)
-         loop_metrics.setdefault("steps", 0)
-         loop_metrics.setdefault("model_turns", 0)
-         loop_metrics.setdefault("tool_calls", 0)
-@@ -438,25 +461,33 @@ class SessionRuntime:
-                 self.session_id,
-                 "result",
-                 {"text": result},
-             )
-         except OSError:
-             pass
-         try:
-             self._persist_state()
-         except OSError:
-             pass
-         return result
-
-     def _persist_state(self) -> None:
-         if len(self.context.observations) > self.max_persisted_observations:
-             self.context.observations = self.context.observations[-self.max_persisted_observations :]
-         state: dict[str, Any] = {
-             "session_id": self.session_id,
-             "saved_at": _utc_now(),
-             "external_observations": self.context.observations,
-         }
-         if self.turn_history:
-             state["turn_history"] = [t.to_dict() for t in self.turn_history]
-         if self.loop_metrics:
-             state["loop_metrics"] = self.loop_metrics
-         self.store.save_state(self.session_id, state)
-+        typed_state = self.store.load_investigation_state(self.session_id)
-+        merged_typed_state = merge_legacy_updates(
-+            typed_state,
-+            observations=self.context.observations,
-+            turn_history=state.get("turn_history"),
-+            loop_metrics=state.get("loop_metrics"),
-+        )
-+        self.store.save_investigation_state(self.session_id, merged_typed_state)
-diff --git a/openplanter-desktop/crates/op-core/src/engine/context.rs b/openplanter-desktop/crates/op-core/src/engine/context.rs
-index 0b522c2fdd088982f95c0ec18295c58d52a709ec..4f26bcd69285b9554a76ea00aebf6670c25fd0c7 100644
---- a/openplanter-desktop/crates/op-core/src/engine/context.rs
-+++ b/openplanter-desktop/crates/op-core/src/engine/context.rs
-@@ -1,129 +1,323 @@
- // External context and turn summary types for multi-turn sessions.
-
- use serde::{Deserialize, Serialize};
-+use serde_json::{json, Map, Value};
- use std::path::Path;
- use tokio::fs;
-
- /// Summary of a completed turn for inclusion in subsequent prompts.
- #[derive(Debug, Clone, Serialize, Deserialize)]
- pub struct TurnSummary {
-     pub turn_number: u32,
-     pub objective: String,
-     pub result_preview: String,
-     pub timestamp: String,
-     pub steps_used: u32,
-     pub replay_seq_start: u64,
- }
-
- /// External context observations persisted to state.json.
- #[derive(Debug, Clone, Serialize, Deserialize)]
- pub struct ExternalContext {
-     pub observations: Vec<Observation>,
- }
-
- /// A single observation from an external source.
- #[derive(Debug, Clone, Serialize, Deserialize)]
- pub struct Observation {
-     pub source: String,
-     pub timestamp: String,
-     pub content: String,
- }
-
-+#[derive(Debug, Clone, Deserialize)]
-+struct LegacyState {
-+    #[serde(default)]
-+    external_observations: Vec<String>,
-+}
-+
- impl ExternalContext {
-     pub fn new() -> Self {
-         Self {
-             observations: vec![],
-         }
-     }
-
-     /// Add a new observation with the current timestamp.
-     pub fn add_observation(&mut self, source: &str, content: &str) {
-         self.observations.push(Observation {
-             source: source.to_string(),
-             timestamp: chrono::Utc::now().to_rfc3339(),
-             content: content.to_string(),
-         });
-     }
-
--    /// Load external context from state.json in the session directory.
-+    /// Load external context from typed/legacy session state.
-     pub async fn load(session_dir: &Path) -> std::io::Result<Self> {
-+        let typed_path = session_dir.join("investigation_state.json");
-+        if typed_path.exists() {
-+            let content = fs::read_to_string(&typed_path).await?;
-+            let parsed: Value = serde_json::from_str(&content)
-+                .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
-+            if let Some(legacy_obs) = parsed
-+                .get("legacy")
-+                .and_then(|legacy| legacy.get("external_observations"))
-+                .and_then(Value::as_array)
-+            {
-+                let observations = legacy_obs
-+                    .iter()
-+                    .map(|v| Observation {
-+                        source: "legacy".to_string(),
-+                        timestamp: String::new(),
-+                        content: v.as_str().unwrap_or_default().to_string(),
-+                    })
-+                    .collect();
-+                return Ok(Self { observations });
-+            }
-+            return Ok(Self::new());
-+        }
-+
-         let path = session_dir.join("state.json");
-         if !path.exists() {
-             return Ok(Self::new());
-         }
-         let content = fs::read_to_string(&path).await?;
--        serde_json::from_str(&content)
--            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))
-+
-+        if let Ok(parsed) = serde_json::from_str::<ExternalContext>(&content) {
-+            return Ok(parsed);
-+        }
-+
-+        if let Ok(legacy) = serde_json::from_str::<LegacyState>(&content) {
-+            let observations = legacy
-+                .external_observations
-+                .into_iter()
-+                .map(|content| Observation {
-+                    source: "legacy".to_string(),
-+                    timestamp: String::new(),
-+                    content,
-+                })
-+                .collect();
-+            return Ok(Self { observations });
-+        }
-+
-+        Err(std::io::Error::new(
-+            std::io::ErrorKind::InvalidData,
-+            "invalid state.json format",
-+        ))
-     }
-
--    /// Save external context to state.json in the session directory.
-+    /// Save external context to state.json and additive investigation_state.json.
-     pub async fn save(&self, session_dir: &Path) -> std::io::Result<()> {
-         let path = session_dir.join("state.json");
-         let json = serde_json::to_string_pretty(self)
--            .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
--        fs::write(&path, json).await
-+            .map_err(|e| std::io::Error::other(e.to_string()))?;
-+        fs::write(&path, json).await?;
-+
-+        let typed_path = session_dir.join("investigation_state.json");
-+        let typed = merge_into_typed_state(
-+            load_existing_typed_state(&typed_path).await?,
-+            session_dir
-+                .file_name()
-+                .and_then(|name| name.to_str())
-+                .unwrap_or_default(),
-+            self,
-+        );
-+        let typed_json = serde_json::to_string_pretty(&typed)
-+            .map_err(|e| std::io::Error::other(e.to_string()))?;
-+        fs::write(typed_path, typed_json).await
-+    }
-+}
-+
-+fn load_default_typed_state(session_id: &str) -> Value {
-+    let now = chrono::Utc::now().to_rfc3339();
-+    json!({
-+      "schema_version": "1.0.0",
-+      "session_id": session_id,
-+      "created_at": now,
-+      "updated_at": now,
-+      "objective": "",
-+      "ontology": {"namespace": "openplanter.core", "version": "2026-03"},
-+      "entities": {},
-+      "links": {},
-+      "claims": {},
-+      "evidence": {},
-+      "hypotheses": {},
-+      "questions": {},
-+      "tasks": {},
-+      "actions": {},
-+      "provenance_nodes": {},
-+      "confidence_profiles": {},
-+      "timeline": [],
-+      "indexes": {"by_external_ref": {}, "by_tag": {}},
-+      "legacy": {"external_observations": [], "turn_history": [], "loop_metrics": {}}
-+    })
-+}
-+
-+async fn load_existing_typed_state(typed_path: &Path) -> std::io::Result<Option<Value>> {
-+    if !typed_path.exists() {
-+        return Ok(None);
-+    }
-+    let content = fs::read_to_string(typed_path).await?;
-+    let parsed: Value = serde_json::from_str(&content)
-+        .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
-+    Ok(Some(parsed))
-+}
-+
-+fn ensure_object<'a>(map: &'a mut Map<String, Value>, key: &str) -> &'a mut Map<String, Value> {
-+    let value = map
-+        .entry(key.to_string())
-+        .or_insert_with(|| Value::Object(Map::new()));
-+    if !value.is_object() {
-+        *value = Value::Object(Map::new());
-+    }
-+    value.as_object_mut().expect("object initialized")
-+}
-+
-+fn merge_into_typed_state(existing: Option<Value>, session_id: &str, ctx: &ExternalContext) -> Value {
-+    let now = chrono::Utc::now().to_rfc3339();
-+    let mut root = existing.unwrap_or_else(|| load_default_typed_state(session_id));
-+    if !root.is_object() {
-+        root = load_default_typed_state(session_id);
-+    }
-+    let root_obj = root.as_object_mut().expect("root object");
-+    root_obj.insert("schema_version".to_string(), Value::String("1.0.0".to_string()));
-+    root_obj
-+        .entry("session_id".to_string())
-+        .or_insert_with(|| Value::String(session_id.to_string()));
-+    root_obj
-+        .entry("created_at".to_string())
-+        .or_insert_with(|| Value::String(now.clone()));
-+    root_obj.insert("updated_at".to_string(), Value::String(now));
-+
-+    let legacy_obj = ensure_object(root_obj, "legacy");
-+    legacy_obj.insert(
-+        "external_observations".to_string(),
-+        Value::Array(
-+            ctx.observations
-+                .iter()
-+                .map(|obs| Value::String(obs.content.clone()))
-+                .collect(),
-+        ),
-+    );
-+
-+    legacy_obj
-+        .entry("turn_history".to_string())
-+        .or_insert_with(|| Value::Array(vec![]));
-+    legacy_obj
-+        .entry("loop_metrics".to_string())
-+        .or_insert_with(|| Value::Object(Map::new()));
-+
-+    let evidence_obj = ensure_object(root_obj, "evidence");
-+    for (idx, observation) in ctx.observations.iter().enumerate() {
-+        let evidence_id = format!("ev_legacy_{:04}", idx + 1);
-+        evidence_obj.entry(evidence_id.clone()).or_insert_with(|| {
-+            json!({
-+                "id": evidence_id,
-+                "evidence_type": "human_note",
-+                "content": observation.content,
-+                "normalization": {
-+                    "kind": "analyst_note",
-+                    "normalization_version": "legacy-v1"
-+                }
-+            })
-+        });
-     }
-+
-+    root
- }
-
- impl Default for ExternalContext {
-     fn default() -> Self {
-         Self::new()
-     }
- }
-
- #[cfg(test)]
- mod tests {
-     use super::*;
-     use tempfile::tempdir;
-
-     #[test]
-     fn test_new_context_empty() {
-         let ctx = ExternalContext::new();
-         assert!(ctx.observations.is_empty());
-     }
-
-     #[test]
-     fn test_add_observation() {
-         let mut ctx = ExternalContext::new();
-         ctx.add_observation("wiki", "Found entity Acme Corp");
-         assert_eq!(ctx.observations.len(), 1);
-         assert_eq!(ctx.observations[0].source, "wiki");
-         assert_eq!(ctx.observations[0].content, "Found entity Acme Corp");
-         assert!(!ctx.observations[0].timestamp.is_empty());
-     }
-
-     #[tokio::test]
-     async fn test_save_and_load() {
-         let tmp = tempdir().unwrap();
-         let mut ctx = ExternalContext::new();
-         ctx.add_observation("wiki", "test observation");
-         ctx.save(tmp.path()).await.unwrap();
-
-         let loaded = ExternalContext::load(tmp.path()).await.unwrap();
-         assert_eq!(loaded.observations.len(), 1);
-         assert_eq!(loaded.observations[0].content, "test observation");
-+
-+        let typed_path = tmp.path().join("investigation_state.json");
-+        assert!(typed_path.exists());
-     }
-
-     #[tokio::test]
-     async fn test_load_missing_returns_empty() {
-         let tmp = tempdir().unwrap();
-         let ctx = ExternalContext::load(tmp.path()).await.unwrap();
-         assert!(ctx.observations.is_empty());
-     }
-
-+    #[tokio::test]
-+    async fn test_loads_legacy_text_observations() {
-+        let tmp = tempdir().unwrap();
-+        fs::write(
-+            tmp.path().join("state.json"),
-+            r#"{"external_observations":["obs a","obs b"]}"#,
-+        )
-+        .await
-+        .unwrap();
-+
-+        let loaded = ExternalContext::load(tmp.path()).await.unwrap();
-+        assert_eq!(loaded.observations.len(), 2);
-+        assert_eq!(loaded.observations[0].content, "obs a");
-+    }
-+
-+    #[tokio::test]
-+    async fn test_loads_from_typed_legacy_section() {
-+        let tmp = tempdir().unwrap();
-+        fs::write(
-+            tmp.path().join("investigation_state.json"),
-+            r#"{"legacy":{"external_observations":["typed obs"]}}"#,
-+        )
-+        .await
-+        .unwrap();
-+
-+        let loaded = ExternalContext::load(tmp.path()).await.unwrap();
-+        assert_eq!(loaded.observations.len(), 1);
-+        assert_eq!(loaded.observations[0].content, "typed obs");
-+    }
-+
-     #[test]
-     fn test_turn_summary_serialization() {
-         let ts = TurnSummary {
-             turn_number: 1,
-             objective: "Investigate Acme Corp".into(),
-             result_preview: "Found connections to...".into(),
-             timestamp: "2026-01-01T00:00:00Z".into(),
-             steps_used: 3,
-             replay_seq_start: 1,
-         };
-         let json = serde_json::to_string(&ts).unwrap();
-         let parsed: TurnSummary = serde_json::from_str(&json).unwrap();
-         assert_eq!(parsed.turn_number, 1);
-         assert_eq!(parsed.objective, "Investigate Acme Corp");
-     }
- }
-diff --git a/tests/test_investigation_state_migration.py b/tests/test_investigation_state_migration.py
-new file mode 100644
-index 0000000000000000000000000000000000000000..f37a31b8cd060bb5013b19df6403dc90515f05ab
---- /dev/null
-+++ b/tests/test_investigation_state_migration.py
-@@ -0,0 +1,75 @@
-+from __future__ import annotations
-+
-+import json
-+import tempfile
-+import unittest
-+from pathlib import Path
-+
-+from agent.config import AgentConfig
-+from agent.engine import RLMEngine
-+from agent.model import ModelTurn, ScriptedModel
-+from agent.runtime import SessionRuntime
-+from agent.tools import WorkspaceTools
-+
-+
-+class InvestigationStateMigrationTests(unittest.TestCase):
-+    def test_bootstrap_migrates_legacy_state_into_typed_file(self) -> None:
-+        with tempfile.TemporaryDirectory() as tmpdir:
-+            root = Path(tmpdir)
-+            session_dir = root / ".openplanter" / "sessions" / "legacy-sess"
-+            session_dir.mkdir(parents=True, exist_ok=True)
-+            (session_dir / "state.json").write_text(
-+                json.dumps(
-+                    {
-+                        "session_id": "legacy-sess",
-+                        "saved_at": "2026-03-13T00:00:00+00:00",
-+                        "external_observations": ["alpha", "beta"],
-+                    }
-+                ),
-+                encoding="utf-8",
-+            )
-+
-+            cfg = AgentConfig(workspace=root, session_root_dir=".openplanter")
-+            model = ScriptedModel(scripted_turns=[ModelTurn(text="done", stop_reason="end_turn")])
-+            runtime = SessionRuntime.bootstrap(
-+                engine=RLMEngine(model=model, tools=WorkspaceTools(root=root), config=cfg),
-+                config=cfg,
-+                session_id="legacy-sess",
-+                resume=True,
-+            )
-+            self.assertEqual(runtime.context.observations, ["alpha", "beta"])
-+
-+            typed = json.loads((session_dir / "investigation_state.json").read_text(encoding="utf-8"))
-+            self.assertEqual(typed["legacy"]["external_observations"], ["alpha", "beta"])
-+            self.assertIn("ev_legacy_0001", typed["evidence"])
-+            self.assertEqual(typed["evidence"]["ev_legacy_0002"]["content"], "beta")
-+
-+    def test_persist_updates_typed_legacy_section_without_removing_existing_keys(self) -> None:
-+        with tempfile.TemporaryDirectory() as tmpdir:
-+            root = Path(tmpdir)
-+            cfg = AgentConfig(workspace=root, session_root_dir=".openplanter")
-+            model = ScriptedModel(scripted_turns=[ModelTurn(text="ok", stop_reason="end_turn")])
-+            runtime = SessionRuntime.bootstrap(
-+                engine=RLMEngine(model=model, tools=WorkspaceTools(root=root), config=cfg),
-+                config=cfg,
-+                session_id="typed-sess",
-+                resume=False,
-+            )
-+            session_dir = root / ".openplanter" / "sessions" / "typed-sess"
-+            typed_path = session_dir / "investigation_state.json"
-+
-+            typed = json.loads(typed_path.read_text(encoding="utf-8"))
-+            typed["questions"] = {"q_1": {"id": "q_1", "question_text": "keep me"}}
-+            typed_path.write_text(json.dumps(typed), encoding="utf-8")
-+
-+            runtime.context.observations = ["obs one"]
-+            runtime._persist_state()
-+
-+            updated = json.loads(typed_path.read_text(encoding="utf-8"))
-+            self.assertEqual(updated["legacy"]["external_observations"], ["obs one"])
-+            self.assertEqual(updated["questions"]["q_1"]["question_text"], "keep me")
-+            self.assertEqual(updated["evidence"]["ev_legacy_0001"]["content"], "obs one")
-+
-+
-+if __name__ == "__main__":
-+    unittest.main()
-
-EOF
-)

From 0a65294b76d3d41197ec4a764e187bcca284ca8d Mon Sep 17 00:00:00 2001
From: Drake Thomsen <120344051+ThomsenDrake@users.noreply.github.com>
Date: Fri, 13 Mar 2026 14:16:30 -0400
Subject: [PATCH 25/58] Add DeepWiki badge to README

Add badge for DeepWiki to README
---
 README.md | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/README.md b/README.md
index 618f6b43..abfb2898 100644
--- a/README.md
+++ b/README.md
@@ -1,3 +1,5 @@
+[![Ask DeepWiki](https://deepwiki.com/badge.svg)](https://deepwiki.com/ThomsenDrake/OpenPlanter)
+
 # OpenPlanter
 
 A recursive-language-model investigation agent with a desktop GUI and terminal interface. OpenPlanter ingests heterogeneous datasets — corporate registries, campaign finance records, lobbying disclosures, government contracts, and more — resolves entities across them, and surfaces non-obvious connections through evidence-backed analysis. It operates autonomously with file I/O, shell execution, web search, and recursive sub-agent delegation.

From 746f384d62c00600f1e175742ea3ebdd1972418f Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Fri, 13 Mar 2026 14:45:22 -0400
Subject: [PATCH 26/58] Fix replay logging and pre-stage-7 test baseline

---
 .gitignore                   |   1 +
 README.md                    |   9 ++-
 agent/prompts.py             |   2 +-
 agent/replay_log.py          | 148 +++++++++++++++++++++-------------
 agent/runtime.py             |   5 +-
 pyproject.toml               |   4 +
 tests/test_replay_log.py     |  46 +++++++++++
 tests/test_turn_summaries.py |  63 +++++++++++++++
 tests/test_user_stories.py   |   2 +-
 uv.lock                      | 151 ++++++++++++++++++++++++++++++++++-
 10 files changed, 368 insertions(+), 63 deletions(-)

diff --git a/.gitignore b/.gitignore
index e5a51452..13fd2565 100644
--- a/.gitignore
+++ b/.gitignore
@@ -36,6 +36,7 @@ target/
 # Generated captures
 *.cast
 *.mp4
+git-apply-*.txt
 
 # Editor and OS cruft
 .DS_Store
diff --git a/README.md b/README.md
index 618f6b43..2e4a4860 100644
--- a/README.md
+++ b/README.md
@@ -286,8 +286,11 @@ cargo test
 ### CLI Agent
 
 ```bash
-# Install in editable mode
-pip install -e .
+# Install in editable mode with test dependencies
+pip install -e ".[dev]"
+
+# Optional: include Textual extras for UI-focused tests
+pip install -e ".[dev,textual]"
 
 # Run tests
 python -m pytest tests/
@@ -296,7 +299,7 @@ python -m pytest tests/
 python -m pytest tests/ --ignore=tests/test_live_models.py --ignore=tests/test_integration_live.py
 ```
 
-Requires Python 3.10+. Dependencies: `rich`, `prompt_toolkit`, `pyfiglet`.
+Requires Python 3.10+. Runtime dependencies: `rich`, `prompt_toolkit`, `pyfiglet`.
 
 ## License
 
diff --git a/agent/prompts.py b/agent/prompts.py
index ee5a892a..e3ea5fc0 100644
--- a/agent/prompts.py
+++ b/agent/prompts.py
@@ -366,7 +366,7 @@
   - objective: the objective given to that turn
   - result_preview: first ~200 characters of the turn's result
   - timestamp: ISO 8601 UTC when the turn ran
-  - steps_used: how many engine steps were consumed
+  - steps_used: how many replayed model calls the turn produced, including delegated child conversations
   - replay_seq_start: starting sequence number in replay.jsonl
 
 Use turn history to:
diff --git a/agent/replay_log.py b/agent/replay_log.py
index 522f8899..6e8e4eb4 100644
--- a/agent/replay_log.py
+++ b/agent/replay_log.py
@@ -3,11 +3,19 @@
 from __future__ import annotations
 
 import json
-import time
+import threading
 from dataclasses import dataclass, field
 from datetime import datetime, timezone
 from pathlib import Path
-from typing import Any
+from typing import Any, ClassVar
+
+
+@dataclass
+class _ReplayFileState:
+    """Shared sequencing state for a single replay log file."""
+
+    lock: threading.RLock = field(default_factory=threading.RLock)
+    next_seq: int | None = None
 
 
 @dataclass
@@ -28,9 +36,16 @@ class ReplayLogger:
     _last_msg_count: int = field(default=0, init=False)
     _has_call: bool = field(default=False, init=False)
     _has_header: bool = field(default=False, init=False)
+    _registry_path: Path = field(init=False, repr=False)
+    _file_state: _ReplayFileState = field(init=False, repr=False)
+
+    _registry_lock: ClassVar[threading.Lock] = threading.Lock()
+    _file_states: ClassVar[dict[Path, _ReplayFileState]] = {}
 
     def __post_init__(self) -> None:
-        self._seq = self._scan_next_seq()
+        self._registry_path = self.path.resolve()
+        self._file_state = self._get_file_state(self._registry_path)
+        self._seq = self.current_seq
         self._hydrate_conversation_state()
         if self.force_snapshot_first_call:
             self._has_call = False
@@ -40,6 +55,11 @@ def __post_init__(self) -> None:
     def needs_header(self) -> bool:
         return not self._has_header
 
+    @property
+    def current_seq(self) -> int:
+        with self._file_state.lock:
+            return self._ensure_next_seq_locked()
+
     def child(self, depth: int, step: int) -> "ReplayLogger":
         """Create a child logger for a subtask conversation."""
         child_id = f"{self.conversation_id}/d{depth}s{step}"
@@ -73,7 +93,8 @@ def write_header(
             record["reasoning_effort"] = reasoning_effort
         if temperature is not None:
             record["temperature"] = temperature
-        self._append(record)
+        with self._file_state.lock:
+            self._append_locked(record)
         self._has_header = True
 
     def log_call(
@@ -87,28 +108,44 @@ def log_call(
         output_tokens: int = 0,
         elapsed_sec: float = 0.0,
     ) -> None:
-        self._seq = max(self._seq, self._scan_next_seq())
-        record: dict[str, Any] = {
-            "type": "call",
-            "conversation_id": self.conversation_id,
-            "seq": self._seq,
-            "depth": depth,
-            "step": step,
-            "ts": datetime.now(timezone.utc).isoformat(),
-        }
-        if not self._has_call:
-            record["messages_snapshot"] = messages
-        else:
-            record["messages_delta"] = messages[self._last_msg_count:]
-        record["response"] = response
-        record["input_tokens"] = input_tokens
-        record["output_tokens"] = output_tokens
-        record["elapsed_sec"] = round(elapsed_sec, 3)
-
-        self._last_msg_count = len(messages)
-        self._has_call = True
-        self._seq += 1
-        self._append(record)
+        with self._file_state.lock:
+            seq = self._ensure_next_seq_locked()
+            record: dict[str, Any] = {
+                "type": "call",
+                "conversation_id": self.conversation_id,
+                "seq": seq,
+                "depth": depth,
+                "step": step,
+                "ts": datetime.now(timezone.utc).isoformat(),
+            }
+            if not self._has_call:
+                record["messages_snapshot"] = messages
+            else:
+                record["messages_delta"] = messages[self._last_msg_count:]
+            record["response"] = response
+            record["input_tokens"] = input_tokens
+            record["output_tokens"] = output_tokens
+            record["elapsed_sec"] = round(elapsed_sec, 3)
+
+            self._append_locked(record)
+            self._file_state.next_seq = seq + 1
+            self._seq = self._file_state.next_seq
+            self._last_msg_count = len(messages)
+            self._has_call = True
+
+    @classmethod
+    def _get_file_state(cls, path: Path) -> _ReplayFileState:
+        with cls._registry_lock:
+            state = cls._file_states.get(path)
+            if state is None:
+                state = _ReplayFileState()
+                cls._file_states[path] = state
+            return state
+
+    def _ensure_next_seq_locked(self) -> int:
+        if self._file_state.next_seq is None:
+            self._file_state.next_seq = self._scan_next_seq()
+        return self._file_state.next_seq
 
     def _scan_next_seq(self) -> int:
         if not self.path.exists():
@@ -128,39 +165,40 @@ def _scan_next_seq(self) -> int:
         return next_seq
 
     def _hydrate_conversation_state(self) -> None:
-        if not self.path.exists():
-            return
-        msg_count = 0
-        has_call = False
-        has_header = False
-        for raw_line in self.path.read_text(encoding="utf-8").splitlines():
-            line = raw_line.strip()
-            if not line:
-                continue
-            try:
-                record = json.loads(line)
-            except json.JSONDecodeError:
-                continue
-            if record.get("conversation_id") != self.conversation_id:
-                continue
-            if record.get("type") == "header":
-                has_header = True
-                continue
-            if record.get("type") != "call":
-                continue
-            has_call = True
-            snapshot = record.get("messages_snapshot")
-            if isinstance(snapshot, list):
-                msg_count = len(snapshot)
-                continue
-            delta = record.get("messages_delta")
-            if isinstance(delta, list):
-                msg_count += len(delta)
+        with self._file_state.lock:
+            if not self.path.exists():
+                return
+            msg_count = 0
+            has_call = False
+            has_header = False
+            for raw_line in self.path.read_text(encoding="utf-8").splitlines():
+                line = raw_line.strip()
+                if not line:
+                    continue
+                try:
+                    record = json.loads(line)
+                except json.JSONDecodeError:
+                    continue
+                if record.get("conversation_id") != self.conversation_id:
+                    continue
+                if record.get("type") == "header":
+                    has_header = True
+                    continue
+                if record.get("type") != "call":
+                    continue
+                has_call = True
+                snapshot = record.get("messages_snapshot")
+                if isinstance(snapshot, list):
+                    msg_count = len(snapshot)
+                    continue
+                delta = record.get("messages_delta")
+                if isinstance(delta, list):
+                    msg_count += len(delta)
         self._has_call = has_call
         self._has_header = has_header
         self._last_msg_count = msg_count
 
-    def _append(self, record: dict[str, Any]) -> None:
+    def _append_locked(self, record: dict[str, Any]) -> None:
         self.path.parent.mkdir(parents=True, exist_ok=True)
         with self.path.open("a", encoding="utf-8") as fh:
             fh.write(json.dumps(record, ensure_ascii=True, default=str) + "\n")
diff --git a/agent/runtime.py b/agent/runtime.py
index 076a8b63..d12def81 100644
--- a/agent/runtime.py
+++ b/agent/runtime.py
@@ -434,7 +434,7 @@ def _combined_on_step(step_event: dict[str, Any]) -> None:
 
         replay_path = self.store._session_dir(self.session_id) / "replay.jsonl"
         replay_logger = ReplayLogger(path=replay_path, force_snapshot_first_call=True)
-        replay_seq_start = replay_logger._seq
+        replay_seq_start = replay_logger.current_seq
 
         result, updated_context = self.engine.solve_with_context(
             objective=objective,
@@ -480,7 +480,8 @@ def _combined_on_step(step_event: dict[str, Any]) -> None:
             self.turn_history = []
         turn_number = (self.turn_history[-1].turn_number + 1) if self.turn_history else 1
         result_preview = result[:200] + "..." if len(result) > 200 else result
-        steps_used = replay_logger._seq - replay_seq_start
+        replay_seq_end = replay_logger.current_seq
+        steps_used = max(0, replay_seq_end - replay_seq_start)
         summary = TurnSummary(
             turn_number=turn_number,
             objective=objective,
diff --git a/pyproject.toml b/pyproject.toml
index 8a21583b..abd778c3 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -15,6 +15,10 @@ dependencies = [
 ]
 
 [project.optional-dependencies]
+dev = [
+    "pytest>=8.0",
+    "pytest-asyncio>=0.23",
+]
 textual = [
     "textual>=0.89",
     "networkx>=3.2",
diff --git a/tests/test_replay_log.py b/tests/test_replay_log.py
index 7f5f528e..9b08762b 100644
--- a/tests/test_replay_log.py
+++ b/tests/test_replay_log.py
@@ -4,6 +4,7 @@
 
 import json
 import tempfile
+import threading
 import unittest
 from pathlib import Path
 
@@ -285,6 +286,51 @@ def test_force_snapshot_first_call_propagates_to_child_logger(self) -> None:
             self.assertIn("messages_snapshot", calls[1])
             self.assertNotIn("messages_delta", calls[1])
 
+    def test_parallel_child_loggers_keep_seq_unique_and_contiguous(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            p = Path(tmpdir) / "replay.jsonl"
+            parent = ReplayLogger(path=p)
+            parent.log_call(
+                depth=0,
+                step=1,
+                messages=[{"role": "user", "content": "root"}],
+                response={"r": "root"},
+            )
+
+            barrier = threading.Barrier(3)
+            errors: list[BaseException] = []
+
+            def _worker(step: int) -> None:
+                try:
+                    child = parent.child(depth=0, step=step)
+                    barrier.wait(timeout=5.0)
+                    child.log_call(
+                        depth=1,
+                        step=1,
+                        messages=[{"role": "user", "content": f"child-{step}"}],
+                        response={"r": step},
+                    )
+                except BaseException as exc:  # pragma: no cover - surfaced below
+                    errors.append(exc)
+
+            threads = [
+                threading.Thread(target=_worker, args=(1,)),
+                threading.Thread(target=_worker, args=(2,)),
+            ]
+            for thread in threads:
+                thread.start()
+            barrier.wait(timeout=5.0)
+            for thread in threads:
+                thread.join(timeout=5.0)
+
+            if errors:
+                raise errors[0]
+
+            call_records = [r for r in self._read_records(p) if r.get("type") == "call"]
+            seqs = [record["seq"] for record in call_records]
+            self.assertEqual(seqs, sorted(seqs))
+            self.assertEqual(seqs, list(range(len(call_records))))
+
 
 class ReplayLoggerIntegrationTests(unittest.TestCase):
     def _read_records(self, path: Path) -> list[dict]:
diff --git a/tests/test_turn_summaries.py b/tests/test_turn_summaries.py
index 2c7307b8..ab61bb2b 100644
--- a/tests/test_turn_summaries.py
+++ b/tests/test_turn_summaries.py
@@ -359,6 +359,69 @@ def test_replay_seq_start_stays_monotonic_and_second_turn_starts_with_snapshot(s
             self.assertIn("messages_snapshot", calls[1])
             self.assertNotIn("messages_delta", calls[1])
 
+    def test_steps_used_counts_parallel_child_conversations(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = self._make_config(
+                root,
+                max_depth=3,
+                max_steps_per_call=6,
+                recursive=True,
+                acceptance_criteria=False,
+            )
+
+            parent_model = ScriptedModel(
+                scripted_turns=[
+                    ModelTurn(tool_calls=[
+                        _tc("subtask", objective="task A", model="worker-a"),
+                        _tc("subtask", objective="task B", model="worker-b"),
+                    ]),
+                    ModelTurn(text="root done", stop_reason="end_turn"),
+                ]
+            )
+
+            def factory(model_name: str, _effort: str | None) -> ScriptedModel:
+                if model_name == "worker-a":
+                    return ScriptedModel(
+                        scripted_turns=[ModelTurn(text="child A", stop_reason="end_turn")]
+                    )
+                if model_name == "worker-b":
+                    return ScriptedModel(
+                        scripted_turns=[ModelTurn(text="child B", stop_reason="end_turn")]
+                    )
+                raise AssertionError(f"unexpected model request: {model_name}")
+
+            engine = RLMEngine(
+                model=parent_model,
+                tools=WorkspaceTools(root=root),
+                config=cfg,
+                model_factory=factory,
+            )
+            runtime = SessionRuntime.bootstrap(
+                engine=engine,
+                config=cfg,
+                session_id="sess-parallel-steps",
+                resume=False,
+            )
+
+            result = runtime.solve("parallel task")
+            self.assertEqual(result, "root done")
+
+            state_path = root / ".openplanter" / "sessions" / "sess-parallel-steps" / "state.json"
+            state = json.loads(state_path.read_text(encoding="utf-8"))
+            entry = state["turn_history"][0]
+            self.assertEqual(entry["steps_used"], 4)
+            self.assertEqual(entry["replay_seq_start"], 0)
+
+            replay_path = root / ".openplanter" / "sessions" / "sess-parallel-steps" / "replay.jsonl"
+            records = [
+                json.loads(line)
+                for line in replay_path.read_text(encoding="utf-8").splitlines()
+                if line.strip()
+            ]
+            calls = [r for r in records if r.get("type") == "call"]
+            self.assertEqual(len(calls), 4)
+
     def test_backward_compat_old_state_no_loop_metrics(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)
diff --git a/tests/test_user_stories.py b/tests/test_user_stories.py
index 4ab5cdaa..9e79f60b 100644
--- a/tests/test_user_stories.py
+++ b/tests/test_user_stories.py
@@ -939,7 +939,7 @@ def test_model_alias_resolution(self) -> None:
             ctx = ChatContext(runtime=runtime, cfg=cfg, settings_store=settings_store)
 
             lines = handle_model_command("opus", ctx)
-            self.assertEqual(cfg.model, "claude-opus-4-6")
+            self.assertEqual(cfg.model, "anthropic-foundry/claude-opus-4-6")
             self.assertTrue(any("alias" in l.lower() for l in lines))
 
     def test_reasoning_change_rebuilds_engine(self) -> None:
diff --git a/uv.lock b/uv.lock
index b8aac500..6b6d4eb7 100644
--- a/uv.lock
+++ b/uv.lock
@@ -6,6 +6,45 @@ resolution-markers = [
     "python_full_version < '3.11'",
 ]
 
+[[package]]
+name = "backports-asyncio-runner"
+version = "1.2.0"
+source = { registry = "https://pypi.org/simple" }
+sdist = { url = "https://files.pythonhosted.org/packages/8e/ff/70dca7d7cb1cbc0edb2c6cc0c38b65cba36cccc491eca64cabd5fe7f8670/backports_asyncio_runner-1.2.0.tar.gz", hash = "sha256:a5aa7b2b7d8f8bfcaa2b57313f70792df84e32a2a746f585213373f900b42162", size = 69893, upload-time = "2025-07-02T02:27:15.685Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/a0/59/76ab57e3fe74484f48a53f8e337171b4a2349e506eabe136d7e01d059086/backports_asyncio_runner-1.2.0-py3-none-any.whl", hash = "sha256:0da0a936a8aeb554eccb426dc55af3ba63bcdc69fa1a600b5bb305413a4477b5", size = 12313, upload-time = "2025-07-02T02:27:14.263Z" },
+]
+
+[[package]]
+name = "colorama"
+version = "0.4.6"
+source = { registry = "https://pypi.org/simple" }
+sdist = { url = "https://files.pythonhosted.org/packages/d8/53/6f443c9a4a8358a93a6792e2acffb9d9d5cb0a5cfd8802644b7b1c9a02e4/colorama-0.4.6.tar.gz", hash = "sha256:08695f5cb7ed6e0531a20572697297273c47b8cae5a63ffc6d6ed5c201be6e44", size = 27697, upload-time = "2022-10-25T02:36:22.414Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/d1/d6/3965ed04c63042e047cb6a3e6ed1a63a35087b6a609aa3a15ed8ac56c221/colorama-0.4.6-py2.py3-none-any.whl", hash = "sha256:4f1d9991f5acc0ca119f9d443620b77f9d6b33703e51011c16baf57afb285fc6", size = 25335, upload-time = "2022-10-25T02:36:20.889Z" },
+]
+
+[[package]]
+name = "exceptiongroup"
+version = "1.3.1"
+source = { registry = "https://pypi.org/simple" }
+dependencies = [
+    { name = "typing-extensions", marker = "python_full_version < '3.11'" },
+]
+sdist = { url = "https://files.pythonhosted.org/packages/50/79/66800aadf48771f6b62f7eb014e352e5d06856655206165d775e675a02c9/exceptiongroup-1.3.1.tar.gz", hash = "sha256:8b412432c6055b0b7d14c310000ae93352ed6754f70fa8f7c34141f91c4e3219", size = 30371, upload-time = "2025-11-21T23:01:54.787Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/8a/0e/97c33bf5009bdbac74fd2beace167cab3f978feb69cc36f1ef79360d6c4e/exceptiongroup-1.3.1-py3-none-any.whl", hash = "sha256:a7a39a3bd276781e98394987d3a5701d0c4edffb633bb7a5144577f82c773598", size = 16740, upload-time = "2025-11-21T23:01:53.443Z" },
+]
+
+[[package]]
+name = "iniconfig"
+version = "2.3.0"
+source = { registry = "https://pypi.org/simple" }
+sdist = { url = "https://files.pythonhosted.org/packages/72/34/14ca021ce8e5dfedc35312d08ba8bf51fdd999c576889fc2c24cb97f4f10/iniconfig-2.3.0.tar.gz", hash = "sha256:c76315c77db068650d49c5b56314774a7804df16fee4402c1f19d6d15d8c4730", size = 20503, upload-time = "2025-10-18T21:55:43.219Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/cb/b1/3846dd7f199d53cb17f49cba7e651e9ce294d8497c8c150530ed11865bb8/iniconfig-2.3.0-py3-none-any.whl", hash = "sha256:f631c04d2c48c52b84d0d0549c99ff3859c98df65b3101406327ecc7d53fbf12", size = 7484, upload-time = "2025-10-18T21:55:41.639Z" },
+]
+
 [[package]]
 name = "linkify-it-py"
 version = "2.1.0"
@@ -91,6 +130,10 @@ dependencies = [
 ]
 
 [package.optional-dependencies]
+dev = [
+    { name = "pytest" },
+    { name = "pytest-asyncio" },
+]
 textual = [
     { name = "networkx", version = "3.4.2", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version < '3.11'" },
     { name = "networkx", version = "3.6.1", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version >= '3.11'" },
@@ -102,10 +145,21 @@ requires-dist = [
     { name = "networkx", marker = "extra == 'textual'", specifier = ">=3.2" },
     { name = "prompt-toolkit", specifier = ">=3.0" },
     { name = "pyfiglet", specifier = ">=1.0" },
+    { name = "pytest", marker = "extra == 'dev'", specifier = ">=8.0" },
+    { name = "pytest-asyncio", marker = "extra == 'dev'", specifier = ">=0.23" },
     { name = "rich", specifier = ">=13.0" },
     { name = "textual", marker = "extra == 'textual'", specifier = ">=0.89" },
 ]
-provides-extras = ["textual"]
+provides-extras = ["dev", "textual"]
+
+[[package]]
+name = "packaging"
+version = "26.0"
+source = { registry = "https://pypi.org/simple" }
+sdist = { url = "https://files.pythonhosted.org/packages/65/ee/299d360cdc32edc7d2cf530f3accf79c4fca01e96ffc950d8a52213bd8e4/packaging-26.0.tar.gz", hash = "sha256:00243ae351a257117b6a241061796684b084ed1c516a08c48a3f7e147a9d80b4", size = 143416, upload-time = "2026-01-21T20:50:39.064Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/b7/b9/c538f279a4e237a006a2c98387d081e9eb060d203d8ed34467cc0f0b9b53/packaging-26.0-py3-none-any.whl", hash = "sha256:b36f1fef9334a5588b4166f8bcd26a14e521f2b55e6b9de3aaa80d3ff7a37529", size = 74366, upload-time = "2026-01-21T20:50:37.788Z" },
+]
 
 [[package]]
 name = "platformdirs"
@@ -116,6 +170,15 @@ wheels = [
     { url = "https://files.pythonhosted.org/packages/48/31/05e764397056194206169869b50cf2fee4dbbbc71b344705b9c0d878d4d8/platformdirs-4.9.2-py3-none-any.whl", hash = "sha256:9170634f126f8efdae22fb58ae8a0eaa86f38365bc57897a6c4f781d1f5875bd", size = 21168, upload-time = "2026-02-16T03:56:08.891Z" },
 ]
 
+[[package]]
+name = "pluggy"
+version = "1.6.0"
+source = { registry = "https://pypi.org/simple" }
+sdist = { url = "https://files.pythonhosted.org/packages/f9/e2/3e91f31a7d2b083fe6ef3fa267035b518369d9511ffab804f839851d2779/pluggy-1.6.0.tar.gz", hash = "sha256:7dcc130b76258d33b90f61b658791dede3486c3e6bfb003ee5c9bfb396dd22f3", size = 69412, upload-time = "2025-05-15T12:30:07.975Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/54/20/4d324d65cc6d9205fabedc306948156824eb9f0ee1633355a8f7ec5c66bf/pluggy-1.6.0-py3-none-any.whl", hash = "sha256:e920276dd6813095e9377c0bc5566d94c932c33b27a3e3945d8389c374dd4746", size = 20538, upload-time = "2025-05-15T12:30:06.134Z" },
+]
+
 [[package]]
 name = "prompt-toolkit"
 version = "3.0.52"
@@ -146,6 +209,38 @@ wheels = [
     { url = "https://files.pythonhosted.org/packages/c7/21/705964c7812476f378728bdf590ca4b771ec72385c533964653c68e86bdc/pygments-2.19.2-py3-none-any.whl", hash = "sha256:86540386c03d588bb81d44bc3928634ff26449851e99741617ecb9037ee5ec0b", size = 1225217, upload-time = "2025-06-21T13:39:07.939Z" },
 ]
 
+[[package]]
+name = "pytest"
+version = "9.0.2"
+source = { registry = "https://pypi.org/simple" }
+dependencies = [
+    { name = "colorama", marker = "sys_platform == 'win32'" },
+    { name = "exceptiongroup", marker = "python_full_version < '3.11'" },
+    { name = "iniconfig" },
+    { name = "packaging" },
+    { name = "pluggy" },
+    { name = "pygments" },
+    { name = "tomli", marker = "python_full_version < '3.11'" },
+]
+sdist = { url = "https://files.pythonhosted.org/packages/d1/db/7ef3487e0fb0049ddb5ce41d3a49c235bf9ad299b6a25d5780a89f19230f/pytest-9.0.2.tar.gz", hash = "sha256:75186651a92bd89611d1d9fc20f0b4345fd827c41ccd5c299a868a05d70edf11", size = 1568901, upload-time = "2025-12-06T21:30:51.014Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/3b/ab/b3226f0bd7cdcf710fbede2b3548584366da3b19b5021e74f5bde2a8fa3f/pytest-9.0.2-py3-none-any.whl", hash = "sha256:711ffd45bf766d5264d487b917733b453d917afd2b0ad65223959f59089f875b", size = 374801, upload-time = "2025-12-06T21:30:49.154Z" },
+]
+
+[[package]]
+name = "pytest-asyncio"
+version = "1.3.0"
+source = { registry = "https://pypi.org/simple" }
+dependencies = [
+    { name = "backports-asyncio-runner", marker = "python_full_version < '3.11'" },
+    { name = "pytest" },
+    { name = "typing-extensions", marker = "python_full_version < '3.13'" },
+]
+sdist = { url = "https://files.pythonhosted.org/packages/90/2c/8af215c0f776415f3590cac4f9086ccefd6fd463befeae41cd4d3f193e5a/pytest_asyncio-1.3.0.tar.gz", hash = "sha256:d7f52f36d231b80ee124cd216ffb19369aa168fc10095013c6b014a34d3ee9e5", size = 50087, upload-time = "2025-11-10T16:07:47.256Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/e5/35/f8b19922b6a25bc0880171a2f1a003eaeb93657475193ab516fd87cac9da/pytest_asyncio-1.3.0-py3-none-any.whl", hash = "sha256:611e26147c7f77640e6d0a92a38ed17c3e9848063698d5c93d5aa7aa11cebff5", size = 15075, upload-time = "2025-11-10T16:07:45.537Z" },
+]
+
 [[package]]
 name = "rich"
 version = "14.3.3"
@@ -176,6 +271,60 @@ wheels = [
     { url = "https://files.pythonhosted.org/packages/77/bc/0cd17f96f00b6e8bfbca64c574088c85f3c614912b3030f313752e30a099/textual-8.0.2-py3-none-any.whl", hash = "sha256:4ceadbe0e8a30eb80f9995000f4d031f711420a31b02da38f3482957b7c50ce4", size = 719174, upload-time = "2026-03-03T20:23:50.46Z" },
 ]
 
+[[package]]
+name = "tomli"
+version = "2.4.0"
+source = { registry = "https://pypi.org/simple" }
+sdist = { url = "https://files.pythonhosted.org/packages/82/30/31573e9457673ab10aa432461bee537ce6cef177667deca369efb79df071/tomli-2.4.0.tar.gz", hash = "sha256:aa89c3f6c277dd275d8e243ad24f3b5e701491a860d5121f2cdd399fbb31fc9c", size = 17477, upload-time = "2026-01-11T11:22:38.165Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/3c/d9/3dc2289e1f3b32eb19b9785b6a006b28ee99acb37d1d47f78d4c10e28bf8/tomli-2.4.0-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:b5ef256a3fd497d4973c11bf142e9ed78b150d36f5773f1ca6088c230ffc5867", size = 153663, upload-time = "2026-01-11T11:21:45.27Z" },
+    { url = "https://files.pythonhosted.org/packages/51/32/ef9f6845e6b9ca392cd3f64f9ec185cc6f09f0a2df3db08cbe8809d1d435/tomli-2.4.0-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:5572e41282d5268eb09a697c89a7bee84fae66511f87533a6f88bd2f7b652da9", size = 148469, upload-time = "2026-01-11T11:21:46.873Z" },
+    { url = "https://files.pythonhosted.org/packages/d6/c2/506e44cce89a8b1b1e047d64bd495c22c9f71f21e05f380f1a950dd9c217/tomli-2.4.0-cp311-cp311-manylinux2014_aarch64.manylinux_2_17_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:551e321c6ba03b55676970b47cb1b73f14a0a4dce6a3e1a9458fd6d921d72e95", size = 236039, upload-time = "2026-01-11T11:21:48.503Z" },
+    { url = "https://files.pythonhosted.org/packages/b3/40/e1b65986dbc861b7e986e8ec394598187fa8aee85b1650b01dd925ca0be8/tomli-2.4.0-cp311-cp311-manylinux2014_x86_64.manylinux_2_17_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:5e3f639a7a8f10069d0e15408c0b96a2a828cfdec6fca05296ebcdcc28ca7c76", size = 243007, upload-time = "2026-01-11T11:21:49.456Z" },
+    { url = "https://files.pythonhosted.org/packages/9c/6f/6e39ce66b58a5b7ae572a0f4352ff40c71e8573633deda43f6a379d56b3e/tomli-2.4.0-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:1b168f2731796b045128c45982d3a4874057626da0e2ef1fdd722848b741361d", size = 240875, upload-time = "2026-01-11T11:21:50.755Z" },
+    { url = "https://files.pythonhosted.org/packages/aa/ad/cb089cb190487caa80204d503c7fd0f4d443f90b95cf4ef5cf5aa0f439b0/tomli-2.4.0-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:133e93646ec4300d651839d382d63edff11d8978be23da4cc106f5a18b7d0576", size = 246271, upload-time = "2026-01-11T11:21:51.81Z" },
+    { url = "https://files.pythonhosted.org/packages/0b/63/69125220e47fd7a3a27fd0de0c6398c89432fec41bc739823bcc66506af6/tomli-2.4.0-cp311-cp311-win32.whl", hash = "sha256:b6c78bdf37764092d369722d9946cb65b8767bfa4110f902a1b2542d8d173c8a", size = 96770, upload-time = "2026-01-11T11:21:52.647Z" },
+    { url = "https://files.pythonhosted.org/packages/1e/0d/a22bb6c83f83386b0008425a6cd1fa1c14b5f3dd4bad05e98cf3dbbf4a64/tomli-2.4.0-cp311-cp311-win_amd64.whl", hash = "sha256:d3d1654e11d724760cdb37a3d7691f0be9db5fbdaef59c9f532aabf87006dbaa", size = 107626, upload-time = "2026-01-11T11:21:53.459Z" },
+    { url = "https://files.pythonhosted.org/packages/2f/6d/77be674a3485e75cacbf2ddba2b146911477bd887dda9d8c9dfb2f15e871/tomli-2.4.0-cp311-cp311-win_arm64.whl", hash = "sha256:cae9c19ed12d4e8f3ebf46d1a75090e4c0dc16271c5bce1c833ac168f08fb614", size = 94842, upload-time = "2026-01-11T11:21:54.831Z" },
+    { url = "https://files.pythonhosted.org/packages/3c/43/7389a1869f2f26dba52404e1ef13b4784b6b37dac93bac53457e3ff24ca3/tomli-2.4.0-cp312-cp312-macosx_10_13_x86_64.whl", hash = "sha256:920b1de295e72887bafa3ad9f7a792f811847d57ea6b1215154030cf131f16b1", size = 154894, upload-time = "2026-01-11T11:21:56.07Z" },
+    { url = "https://files.pythonhosted.org/packages/e9/05/2f9bf110b5294132b2edf13fe6ca6ae456204f3d749f623307cbb7a946f2/tomli-2.4.0-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:7d6d9a4aee98fac3eab4952ad1d73aee87359452d1c086b5ceb43ed02ddb16b8", size = 149053, upload-time = "2026-01-11T11:21:57.467Z" },
+    { url = "https://files.pythonhosted.org/packages/e8/41/1eda3ca1abc6f6154a8db4d714a4d35c4ad90adc0bcf700657291593fbf3/tomli-2.4.0-cp312-cp312-manylinux2014_aarch64.manylinux_2_17_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:36b9d05b51e65b254ea6c2585b59d2c4cb91c8a3d91d0ed0f17591a29aaea54a", size = 243481, upload-time = "2026-01-11T11:21:58.661Z" },
+    { url = "https://files.pythonhosted.org/packages/d2/6d/02ff5ab6c8868b41e7d4b987ce2b5f6a51d3335a70aa144edd999e055a01/tomli-2.4.0-cp312-cp312-manylinux2014_x86_64.manylinux_2_17_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:1c8a885b370751837c029ef9bc014f27d80840e48bac415f3412e6593bbc18c1", size = 251720, upload-time = "2026-01-11T11:22:00.178Z" },
+    { url = "https://files.pythonhosted.org/packages/7b/57/0405c59a909c45d5b6f146107c6d997825aa87568b042042f7a9c0afed34/tomli-2.4.0-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:8768715ffc41f0008abe25d808c20c3d990f42b6e2e58305d5da280ae7d1fa3b", size = 247014, upload-time = "2026-01-11T11:22:01.238Z" },
+    { url = "https://files.pythonhosted.org/packages/2c/0e/2e37568edd944b4165735687cbaf2fe3648129e440c26d02223672ee0630/tomli-2.4.0-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:7b438885858efd5be02a9a133caf5812b8776ee0c969fea02c45e8e3f296ba51", size = 251820, upload-time = "2026-01-11T11:22:02.727Z" },
+    { url = "https://files.pythonhosted.org/packages/5a/1c/ee3b707fdac82aeeb92d1a113f803cf6d0f37bdca0849cb489553e1f417a/tomli-2.4.0-cp312-cp312-win32.whl", hash = "sha256:0408e3de5ec77cc7f81960c362543cbbd91ef883e3138e81b729fc3eea5b9729", size = 97712, upload-time = "2026-01-11T11:22:03.777Z" },
+    { url = "https://files.pythonhosted.org/packages/69/13/c07a9177d0b3bab7913299b9278845fc6eaaca14a02667c6be0b0a2270c8/tomli-2.4.0-cp312-cp312-win_amd64.whl", hash = "sha256:685306e2cc7da35be4ee914fd34ab801a6acacb061b6a7abca922aaf9ad368da", size = 108296, upload-time = "2026-01-11T11:22:04.86Z" },
+    { url = "https://files.pythonhosted.org/packages/18/27/e267a60bbeeee343bcc279bb9e8fbed0cbe224bc7b2a3dc2975f22809a09/tomli-2.4.0-cp312-cp312-win_arm64.whl", hash = "sha256:5aa48d7c2356055feef06a43611fc401a07337d5b006be13a30f6c58f869e3c3", size = 94553, upload-time = "2026-01-11T11:22:05.854Z" },
+    { url = "https://files.pythonhosted.org/packages/34/91/7f65f9809f2936e1f4ce6268ae1903074563603b2a2bd969ebbda802744f/tomli-2.4.0-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:84d081fbc252d1b6a982e1870660e7330fb8f90f676f6e78b052ad4e64714bf0", size = 154915, upload-time = "2026-01-11T11:22:06.703Z" },
+    { url = "https://files.pythonhosted.org/packages/20/aa/64dd73a5a849c2e8f216b755599c511badde80e91e9bc2271baa7b2cdbb1/tomli-2.4.0-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:9a08144fa4cba33db5255f9b74f0b89888622109bd2776148f2597447f92a94e", size = 149038, upload-time = "2026-01-11T11:22:07.56Z" },
+    { url = "https://files.pythonhosted.org/packages/9e/8a/6d38870bd3d52c8d1505ce054469a73f73a0fe62c0eaf5dddf61447e32fa/tomli-2.4.0-cp313-cp313-manylinux2014_aarch64.manylinux_2_17_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:c73add4bb52a206fd0c0723432db123c0c75c280cbd67174dd9d2db228ebb1b4", size = 242245, upload-time = "2026-01-11T11:22:08.344Z" },
+    { url = "https://files.pythonhosted.org/packages/59/bb/8002fadefb64ab2669e5b977df3f5e444febea60e717e755b38bb7c41029/tomli-2.4.0-cp313-cp313-manylinux2014_x86_64.manylinux_2_17_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:1fb2945cbe303b1419e2706e711b7113da57b7db31ee378d08712d678a34e51e", size = 250335, upload-time = "2026-01-11T11:22:09.951Z" },
+    { url = "https://files.pythonhosted.org/packages/a5/3d/4cdb6f791682b2ea916af2de96121b3cb1284d7c203d97d92d6003e91c8d/tomli-2.4.0-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:bbb1b10aa643d973366dc2cb1ad94f99c1726a02343d43cbc011edbfac579e7c", size = 245962, upload-time = "2026-01-11T11:22:11.27Z" },
+    { url = "https://files.pythonhosted.org/packages/f2/4a/5f25789f9a460bd858ba9756ff52d0830d825b458e13f754952dd15fb7bb/tomli-2.4.0-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:4cbcb367d44a1f0c2be408758b43e1ffb5308abe0ea222897d6bfc8e8281ef2f", size = 250396, upload-time = "2026-01-11T11:22:12.325Z" },
+    { url = "https://files.pythonhosted.org/packages/aa/2f/b73a36fea58dfa08e8b3a268750e6853a6aac2a349241a905ebd86f3047a/tomli-2.4.0-cp313-cp313-win32.whl", hash = "sha256:7d49c66a7d5e56ac959cb6fc583aff0651094ec071ba9ad43df785abc2320d86", size = 97530, upload-time = "2026-01-11T11:22:13.865Z" },
+    { url = "https://files.pythonhosted.org/packages/3b/af/ca18c134b5d75de7e8dc551c5234eaba2e8e951f6b30139599b53de9c187/tomli-2.4.0-cp313-cp313-win_amd64.whl", hash = "sha256:3cf226acb51d8f1c394c1b310e0e0e61fecdd7adcb78d01e294ac297dd2e7f87", size = 108227, upload-time = "2026-01-11T11:22:15.224Z" },
+    { url = "https://files.pythonhosted.org/packages/22/c3/b386b832f209fee8073c8138ec50f27b4460db2fdae9ffe022df89a57f9b/tomli-2.4.0-cp313-cp313-win_arm64.whl", hash = "sha256:d20b797a5c1ad80c516e41bc1fb0443ddb5006e9aaa7bda2d71978346aeb9132", size = 94748, upload-time = "2026-01-11T11:22:16.009Z" },
+    { url = "https://files.pythonhosted.org/packages/f3/c4/84047a97eb1004418bc10bdbcfebda209fca6338002eba2dc27cc6d13563/tomli-2.4.0-cp314-cp314-macosx_10_15_x86_64.whl", hash = "sha256:26ab906a1eb794cd4e103691daa23d95c6919cc2fa9160000ac02370cc9dd3f6", size = 154725, upload-time = "2026-01-11T11:22:17.269Z" },
+    { url = "https://files.pythonhosted.org/packages/a8/5d/d39038e646060b9d76274078cddf146ced86dc2b9e8bbf737ad5983609a0/tomli-2.4.0-cp314-cp314-macosx_11_0_arm64.whl", hash = "sha256:20cedb4ee43278bc4f2fee6cb50daec836959aadaf948db5172e776dd3d993fc", size = 148901, upload-time = "2026-01-11T11:22:18.287Z" },
+    { url = "https://files.pythonhosted.org/packages/73/e5/383be1724cb30f4ce44983d249645684a48c435e1cd4f8b5cded8a816d3c/tomli-2.4.0-cp314-cp314-manylinux2014_aarch64.manylinux_2_17_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:39b0b5d1b6dd03684b3fb276407ebed7090bbec989fa55838c98560c01113b66", size = 243375, upload-time = "2026-01-11T11:22:19.154Z" },
+    { url = "https://files.pythonhosted.org/packages/31/f0/bea80c17971c8d16d3cc109dc3585b0f2ce1036b5f4a8a183789023574f2/tomli-2.4.0-cp314-cp314-manylinux2014_x86_64.manylinux_2_17_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:a26d7ff68dfdb9f87a016ecfd1e1c2bacbe3108f4e0f8bcd2228ef9a766c787d", size = 250639, upload-time = "2026-01-11T11:22:20.168Z" },
+    { url = "https://files.pythonhosted.org/packages/2c/8f/2853c36abbb7608e3f945d8a74e32ed3a74ee3a1f468f1ffc7d1cb3abba6/tomli-2.4.0-cp314-cp314-musllinux_1_2_aarch64.whl", hash = "sha256:20ffd184fb1df76a66e34bd1b36b4a4641bd2b82954befa32fe8163e79f1a702", size = 246897, upload-time = "2026-01-11T11:22:21.544Z" },
+    { url = "https://files.pythonhosted.org/packages/49/f0/6c05e3196ed5337b9fe7ea003e95fd3819a840b7a0f2bf5a408ef1dad8ed/tomli-2.4.0-cp314-cp314-musllinux_1_2_x86_64.whl", hash = "sha256:75c2f8bbddf170e8effc98f5e9084a8751f8174ea6ccf4fca5398436e0320bc8", size = 254697, upload-time = "2026-01-11T11:22:23.058Z" },
+    { url = "https://files.pythonhosted.org/packages/f3/f5/2922ef29c9f2951883525def7429967fc4d8208494e5ab524234f06b688b/tomli-2.4.0-cp314-cp314-win32.whl", hash = "sha256:31d556d079d72db7c584c0627ff3a24c5d3fb4f730221d3444f3efb1b2514776", size = 98567, upload-time = "2026-01-11T11:22:24.033Z" },
+    { url = "https://files.pythonhosted.org/packages/7b/31/22b52e2e06dd2a5fdbc3ee73226d763b184ff21fc24e20316a44ccc4d96b/tomli-2.4.0-cp314-cp314-win_amd64.whl", hash = "sha256:43e685b9b2341681907759cf3a04e14d7104b3580f808cfde1dfdb60ada85475", size = 108556, upload-time = "2026-01-11T11:22:25.378Z" },
+    { url = "https://files.pythonhosted.org/packages/48/3d/5058dff3255a3d01b705413f64f4306a141a8fd7a251e5a495e3f192a998/tomli-2.4.0-cp314-cp314-win_arm64.whl", hash = "sha256:3d895d56bd3f82ddd6faaff993c275efc2ff38e52322ea264122d72729dca2b2", size = 96014, upload-time = "2026-01-11T11:22:26.138Z" },
+    { url = "https://files.pythonhosted.org/packages/b8/4e/75dab8586e268424202d3a1997ef6014919c941b50642a1682df43204c22/tomli-2.4.0-cp314-cp314t-macosx_10_15_x86_64.whl", hash = "sha256:5b5807f3999fb66776dbce568cc9a828544244a8eb84b84b9bafc080c99597b9", size = 163339, upload-time = "2026-01-11T11:22:27.143Z" },
+    { url = "https://files.pythonhosted.org/packages/06/e3/b904d9ab1016829a776d97f163f183a48be6a4deb87304d1e0116a349519/tomli-2.4.0-cp314-cp314t-macosx_11_0_arm64.whl", hash = "sha256:c084ad935abe686bd9c898e62a02a19abfc9760b5a79bc29644463eaf2840cb0", size = 159490, upload-time = "2026-01-11T11:22:28.399Z" },
+    { url = "https://files.pythonhosted.org/packages/e3/5a/fc3622c8b1ad823e8ea98a35e3c632ee316d48f66f80f9708ceb4f2a0322/tomli-2.4.0-cp314-cp314t-manylinux2014_aarch64.manylinux_2_17_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:0f2e3955efea4d1cfbcb87bc321e00dc08d2bcb737fd1d5e398af111d86db5df", size = 269398, upload-time = "2026-01-11T11:22:29.345Z" },
+    { url = "https://files.pythonhosted.org/packages/fd/33/62bd6152c8bdd4c305ad9faca48f51d3acb2df1f8791b1477d46ff86e7f8/tomli-2.4.0-cp314-cp314t-manylinux2014_x86_64.manylinux_2_17_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:0e0fe8a0b8312acf3a88077a0802565cb09ee34107813bba1c7cd591fa6cfc8d", size = 276515, upload-time = "2026-01-11T11:22:30.327Z" },
+    { url = "https://files.pythonhosted.org/packages/4b/ff/ae53619499f5235ee4211e62a8d7982ba9e439a0fb4f2f351a93d67c1dd2/tomli-2.4.0-cp314-cp314t-musllinux_1_2_aarch64.whl", hash = "sha256:413540dce94673591859c4c6f794dfeaa845e98bf35d72ed59636f869ef9f86f", size = 273806, upload-time = "2026-01-11T11:22:32.56Z" },
+    { url = "https://files.pythonhosted.org/packages/47/71/cbca7787fa68d4d0a9f7072821980b39fbb1b6faeb5f5cf02f4a5559fa28/tomli-2.4.0-cp314-cp314t-musllinux_1_2_x86_64.whl", hash = "sha256:0dc56fef0e2c1c470aeac5b6ca8cc7b640bb93e92d9803ddaf9ea03e198f5b0b", size = 281340, upload-time = "2026-01-11T11:22:33.505Z" },
+    { url = "https://files.pythonhosted.org/packages/f5/00/d595c120963ad42474cf6ee7771ad0d0e8a49d0f01e29576ee9195d9ecdf/tomli-2.4.0-cp314-cp314t-win32.whl", hash = "sha256:d878f2a6707cc9d53a1be1414bbb419e629c3d6e67f69230217bb663e76b5087", size = 108106, upload-time = "2026-01-11T11:22:34.451Z" },
+    { url = "https://files.pythonhosted.org/packages/de/69/9aa0c6a505c2f80e519b43764f8b4ba93b5a0bbd2d9a9de6e2b24271b9a5/tomli-2.4.0-cp314-cp314t-win_amd64.whl", hash = "sha256:2add28aacc7425117ff6364fe9e06a183bb0251b03f986df0e78e974047571fd", size = 120504, upload-time = "2026-01-11T11:22:35.764Z" },
+    { url = "https://files.pythonhosted.org/packages/b3/9f/f1668c281c58cfae01482f7114a4b88d345e4c140386241a1a24dcc9e7bc/tomli-2.4.0-cp314-cp314t-win_arm64.whl", hash = "sha256:2b1e3b80e1d5e52e40e9b924ec43d81570f0e7d09d11081b797bc4692765a3d4", size = 99561, upload-time = "2026-01-11T11:22:36.624Z" },
+    { url = "https://files.pythonhosted.org/packages/23/d1/136eb2cb77520a31e1f64cbae9d33ec6df0d78bdf4160398e86eec8a8754/tomli-2.4.0-py3-none-any.whl", hash = "sha256:1f776e7d669ebceb01dee46484485f43a4048746235e683bcdffacdf1fb4785a", size = 14477, upload-time = "2026-01-11T11:22:37.446Z" },
+]
+
 [[package]]
 name = "typing-extensions"
 version = "4.15.0"

From f23cc387806ab9c8a564eb244232f88448c31e2e Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Fri, 13 Mar 2026 16:06:32 -0400
Subject: [PATCH 27/58] Add question-centric reasoning packet

---
 agent/engine.py                               |   5 +
 agent/investigation_state.py                  | 144 ++++++++++++++++++
 agent/prompts.py                              |  33 ++++
 agent/runtime.py                              |  40 +++++
 .../crates/op-core/src/prompts.rs             |  38 ++++-
 tests/test_engine.py                          |  38 +++++
 tests/test_investigation_state.py             |  69 +++++++++
 tests/test_session.py                         |  67 ++++++++
 8 files changed, 432 insertions(+), 2 deletions(-)

diff --git a/agent/engine.py b/agent/engine.py
index dbbe5fc7..6c3aa808 100644
--- a/agent/engine.py
+++ b/agent/engine.py
@@ -230,6 +230,7 @@ def solve_with_context(
         on_content_delta: ContentDeltaCallback | None = None,
         replay_logger: ReplayLogger | None = None,
         turn_history: list[TurnSummary] | None = None,
+        question_reasoning_packet: dict[str, Any] | None = None,
     ) -> tuple[str, ExternalContext]:
         if not objective.strip():
             return "No objective provided.", context or ExternalContext()
@@ -249,6 +250,7 @@ def solve_with_context(
                 deadline=deadline,
                 replay_logger=replay_logger,
                 turn_history=turn_history,
+                question_reasoning_packet=question_reasoning_packet,
             )
         finally:
             cleanup = getattr(self.tools, "cleanup_bg_jobs", None)
@@ -356,6 +358,7 @@ def _solve_recursive(
         model_override: BaseModel | None = None,
         replay_logger: ReplayLogger | None = None,
         turn_history: list[TurnSummary] | None = None,
+        question_reasoning_packet: dict[str, Any] | None = None,
     ) -> str:
         model = model_override or self.model
 
@@ -395,6 +398,8 @@ def _solve_recursive(
                 f"{len(turn_history)} prior turn(s). "
                 f"Read replay.jsonl/events.jsonl in session_dir for full details."
             )
+        if depth == 0 and question_reasoning_packet is not None:
+            initial_msg_dict["question_reasoning_packet"] = question_reasoning_packet
         initial_message = json.dumps(initial_msg_dict, ensure_ascii=True)
 
         conversation = model.create_conversation(self.system_prompt, initial_message)
diff --git a/agent/investigation_state.py b/agent/investigation_state.py
index e0324ce7..534da606 100644
--- a/agent/investigation_state.py
+++ b/agent/investigation_state.py
@@ -223,6 +223,117 @@ def save_investigation_state(path: Path, state: dict[str, Any]) -> None:
     path.write_text(json.dumps(state, indent=2), encoding="utf-8")
 
 
+def build_question_reasoning_packet(
+    state: dict[str, Any],
+    *,
+    max_questions: int = 8,
+    max_evidence_per_item: int = 6,
+) -> dict[str, Any]:
+    """Build a question-centric reasoning packet from canonical typed state."""
+
+    questions = state.get("questions") if isinstance(state.get("questions"), dict) else {}
+    claims = state.get("claims") if isinstance(state.get("claims"), dict) else {}
+    evidence = state.get("evidence") if isinstance(state.get("evidence"), dict) else {}
+
+    unresolved_questions: list[dict[str, Any]] = []
+    for question_id, raw_question in questions.items():
+        if not isinstance(raw_question, dict):
+            continue
+        status = str(raw_question.get("status") or "open").lower()
+        if status in {"resolved", "closed", "wont_fix", "won't_fix"}:
+            continue
+
+        unresolved_questions.append(
+            {
+                "id": str(raw_question.get("id") or question_id),
+                "question": str(raw_question.get("question_text") or raw_question.get("question") or ""),
+                "status": status,
+                "priority": str(raw_question.get("priority") or "medium").lower(),
+                "claim_ids": _id_list(raw_question.get("claim_ids") or raw_question.get("claims")),
+                "evidence_ids": _id_list(raw_question.get("evidence_ids"))[:max_evidence_per_item],
+                "triggers": _id_list(raw_question.get("trigger") or raw_question.get("triggers")),
+                "updated_at": str(raw_question.get("updated_at") or ""),
+            }
+        )
+
+    unresolved_questions.sort(key=_question_priority_sort_key)
+    focus_questions = unresolved_questions[: max(1, max_questions)]
+
+    supported: list[dict[str, Any]] = []
+    contested: list[dict[str, Any]] = []
+    unresolved: list[dict[str, Any]] = []
+    contradictions: list[dict[str, Any]] = []
+
+    for claim_id, raw_claim in claims.items():
+        if not isinstance(raw_claim, dict):
+            continue
+        claim_status = str(raw_claim.get("status") or "unresolved").lower()
+        support_ids = _id_list(raw_claim.get("support_evidence_ids") or raw_claim.get("evidence_ids"))
+        contradiction_ids = _id_list(
+            raw_claim.get("contradiction_evidence_ids") or raw_claim.get("contradict_evidence_ids")
+        )
+        confidence = raw_claim.get("confidence")
+        if confidence is None:
+            confidence = raw_claim.get("confidence_score")
+
+        claim_summary = {
+            "id": str(raw_claim.get("id") or claim_id),
+            "claim": str(raw_claim.get("claim_text") or raw_claim.get("text") or ""),
+            "status": claim_status,
+            "confidence": confidence,
+            "support_evidence_ids": support_ids[:max_evidence_per_item],
+            "contradiction_evidence_ids": contradiction_ids[:max_evidence_per_item],
+        }
+
+        if contradiction_ids:
+            contradictions.append(
+                {
+                    "claim_id": str(raw_claim.get("id") or claim_id),
+                    "support_evidence_ids": support_ids[:max_evidence_per_item],
+                    "contradiction_evidence_ids": contradiction_ids[:max_evidence_per_item],
+                }
+            )
+
+        if claim_status == "supported":
+            supported.append(claim_summary)
+        elif claim_status == "contested" or contradiction_ids:
+            contested.append(claim_summary)
+        else:
+            unresolved.append(claim_summary)
+
+    evidence_index: dict[str, dict[str, Any]] = {}
+    for evidence_id in _collect_evidence_ids(focus_questions, supported, contested, unresolved):
+        record = evidence.get(evidence_id)
+        if not isinstance(record, dict):
+            continue
+        evidence_index[evidence_id] = {
+            "evidence_type": record.get("evidence_type"),
+            "provenance_ids": _id_list(record.get("provenance_ids")),
+            "source_uri": record.get("source_uri"),
+            "confidence_id": record.get("confidence_id"),
+        }
+
+    return {
+        "reasoning_mode": "question_centric",
+        "loop": [
+            "select_unresolved_question",
+            "gather_discriminating_evidence",
+            "update_claim_status_and_confidence",
+            "record_contradictions",
+            "synthesize_supported_contested_unresolved",
+        ],
+        "focus_question_ids": [item["id"] for item in focus_questions],
+        "unresolved_questions": focus_questions,
+        "findings": {
+            "supported": supported,
+            "contested": contested,
+            "unresolved": unresolved,
+        },
+        "contradictions": contradictions,
+        "evidence_index": evidence_index,
+    }
+
+
 def _string_list(value: Any) -> list[str]:
     if not isinstance(value, list):
         return []
@@ -241,6 +352,39 @@ def _json_object(value: Any) -> dict[str, Any]:
     return copy.deepcopy(value)
 
 
+def _id_list(value: Any) -> list[str]:
+    if not isinstance(value, list):
+        return []
+    return [str(item) for item in value if item is not None]
+
+
+def _question_priority_sort_key(question: dict[str, Any]) -> tuple[int, str]:
+    rank = {"critical": 0, "high": 1, "medium": 2, "low": 3}
+    priority = str(question.get("priority") or "medium").lower()
+    question_id = str(question.get("id") or "")
+    return (rank.get(priority, 9), question_id)
+
+
+def _collect_evidence_ids(*collections: list[dict[str, Any]]) -> list[str]:
+    seen: set[str] = set()
+    out: list[str] = []
+    for collection in collections:
+        for item in collection:
+            if not isinstance(item, dict):
+                continue
+            for key in ("evidence_ids", "support_evidence_ids", "contradiction_evidence_ids"):
+                values = item.get(key)
+                if not isinstance(values, list):
+                    continue
+                for value in values:
+                    evidence_id = str(value)
+                    if evidence_id in seen:
+                        continue
+                    seen.add(evidence_id)
+                    out.append(evidence_id)
+    return out
+
+
 def _observations_from_rust_state(state: dict[str, Any]) -> list[str]:
     observations = state.get("observations")
     if not isinstance(observations, list):
diff --git a/agent/prompts.py b/agent/prompts.py
index e3ea5fc0..8687453e 100644
--- a/agent/prompts.py
+++ b/agent/prompts.py
@@ -379,6 +379,38 @@
 """
 
 
+QUESTION_REASONING_SECTION = """
+== QUESTION-CENTRIC REASONING ==
+Your initial message may contain a "question_reasoning_packet" derived from
+{session_dir}/investigation_state.json. Use question-centric reasoning over
+document-centric "read more then synthesize" behavior.
+
+Run this loop until step budget is low or high-priority questions are resolved:
+1) Select the next unresolved question from question_reasoning_packet.focus_question_ids
+   or question_reasoning_packet.unresolved_questions.
+2) Gather discriminating evidence targeted at that question.
+3) Update related claims in investigation_state.claims with explicit status
+   (supported / contested / unresolved), confidence, and cited evidence IDs.
+4) Record contradictions explicitly, preserving both supporting and contradictory
+   evidence with provenance IDs instead of collapsing disagreement.
+5) Only then synthesize, and repeat for remaining unresolved questions.
+
+Rules:
+- Ground reasoning in typed state references, not raw transcript quotes. Prefer
+  question IDs, claim IDs, evidence IDs, and provenance IDs.
+- Do not mark a claim supported without support evidence IDs.
+- Do not resolve a question without explicit claim/evidence linkage.
+- Prefer provenance-backed evidence over uncited notes.
+
+Final deliverables MUST separate findings into three sections:
+- Supported Findings
+- Contested Findings
+- Unresolved Findings
+
+Each item should cite the relevant evidence/provenance IDs.
+"""
+
+
 WIKI_SECTION = """
 == DATA SOURCES WIKI ==
 A runtime wiki of data source documentation is available at .openplanter/wiki/.
@@ -417,6 +449,7 @@ def build_system_prompt(
     prompt = SYSTEM_PROMPT_BASE
     prompt += SESSION_LOGS_SECTION
     prompt += TURN_HISTORY_SECTION
+    prompt += QUESTION_REASONING_SECTION
     prompt += WIKI_SECTION
     if recursive:
         prompt += RECURSIVE_SECTION
diff --git a/agent/runtime.py b/agent/runtime.py
index d12def81..0a8d867c 100644
--- a/agent/runtime.py
+++ b/agent/runtime.py
@@ -12,6 +12,8 @@
 from .config import AgentConfig
 from .engine import ContentDeltaCallback, ExternalContext, RLMEngine, StepCallback, TurnSummary
 from .investigation_state import (
+    build_question_reasoning_packet,
+    default_state,
     load_investigation_state,
     migrate_legacy_state,
     normalize_legacy_state,
@@ -41,6 +43,17 @@ def _safe_component(text: str) -> str:
     return re.sub(r"[^A-Za-z0-9._-]+", "-", text).strip("-") or "artifact"
 
 
+def _has_reasoning_content(packet: dict[str, Any]) -> bool:
+    findings = packet.get("findings", {})
+    if packet.get("focus_question_ids"):
+        return True
+    if packet.get("contradictions"):
+        return True
+    if not isinstance(findings, dict):
+        return False
+    return any(findings.get(key) for key in ("supported", "contested", "unresolved"))
+
+
 @dataclass
 class SessionStore:
     workspace: Path
@@ -171,6 +184,27 @@ def load_state(self, session_id: str) -> dict[str, Any]:
             raise SessionError(f"Session state must be a JSON object: {state_path}")
         return normalize_legacy_state(session_id, raw_state)
 
+    def load_typed_state(self, session_id: str) -> dict[str, Any]:
+        investigation_path = self._investigation_state_path(session_id)
+        if investigation_path.exists():
+            try:
+                return load_investigation_state(investigation_path)
+            except json.JSONDecodeError as exc:
+                raise SessionError(
+                    f"Session investigation state is invalid JSON: {investigation_path}"
+                ) from exc
+
+        state_path = self._state_path(session_id)
+        if not state_path.exists():
+            return default_state(session_id=session_id)
+        try:
+            raw_state = json.loads(state_path.read_text(encoding="utf-8"))
+        except json.JSONDecodeError as exc:
+            raise SessionError(f"Session state is invalid JSON: {state_path}") from exc
+        if not isinstance(raw_state, dict):
+            raise SessionError(f"Session state must be a JSON object: {state_path}")
+        return migrate_legacy_state(session_id=session_id, legacy_state=raw_state)
+
     def save_state(self, session_id: str, state: dict[str, Any]) -> None:
         normalized_legacy = normalize_legacy_state(session_id, state)
         state_path = self._state_path(session_id)
@@ -436,6 +470,11 @@ def _combined_on_step(step_event: dict[str, Any]) -> None:
         replay_logger = ReplayLogger(path=replay_path, force_snapshot_first_call=True)
         replay_seq_start = replay_logger.current_seq
 
+        typed_state = self.store.load_typed_state(self.session_id)
+        question_reasoning_packet = build_question_reasoning_packet(typed_state)
+        if not _has_reasoning_content(question_reasoning_packet):
+            question_reasoning_packet = None
+
         result, updated_context = self.engine.solve_with_context(
             objective=objective,
             context=self.context,
@@ -444,6 +483,7 @@ def _combined_on_step(step_event: dict[str, Any]) -> None:
             on_content_delta=on_content_delta,
             replay_logger=replay_logger,
             turn_history=self.turn_history,
+            question_reasoning_packet=question_reasoning_packet,
         )
         self.context = updated_context
 
diff --git a/openplanter-desktop/crates/op-core/src/prompts.rs b/openplanter-desktop/crates/op-core/src/prompts.rs
index 70342ad7..2cdd5962 100644
--- a/openplanter-desktop/crates/op-core/src/prompts.rs
+++ b/openplanter-desktop/crates/op-core/src/prompts.rs
@@ -232,7 +232,7 @@ from prior turns in this session. Each entry has:
   - objective: the objective given to that turn
   - result_preview: first ~200 characters of the turn's result
   - timestamp: ISO 8601 UTC when the turn ran
-  - steps_used: how many engine steps were consumed
+  - steps_used: how many replayed model calls the turn produced, including delegated child conversations
   - replay_seq_start: starting sequence number in replay.jsonl
 
 Use turn history to:
@@ -243,6 +243,36 @@ Use turn history to:
 For full details of any prior turn, read the session logs:
   replay.jsonl (full transcript) or events.jsonl (lightweight trace)."#;
 
+pub const QUESTION_REASONING_SECTION: &str = r#"
+== QUESTION-CENTRIC REASONING ==
+Your initial message may contain a "question_reasoning_packet" derived from
+{session_dir}/investigation_state.json. Use question-centric reasoning over
+document-centric "read more then synthesize" behavior.
+
+Run this loop until step budget is low or high-priority questions are resolved:
+1) Select the next unresolved question from question_reasoning_packet.focus_question_ids
+   or question_reasoning_packet.unresolved_questions.
+2) Gather discriminating evidence targeted at that question.
+3) Update related claims in investigation_state.claims with explicit status
+   (supported / contested / unresolved), confidence, and cited evidence IDs.
+4) Record contradictions explicitly, preserving both supporting and contradictory
+   evidence with provenance IDs instead of collapsing disagreement.
+5) Only then synthesize, and repeat for remaining unresolved questions.
+
+Rules:
+- Ground reasoning in typed state references, not raw transcript quotes. Prefer
+  question IDs, claim IDs, evidence IDs, and provenance IDs.
+- Do not mark a claim supported without support evidence IDs.
+- Do not resolve a question without explicit claim/evidence linkage.
+- Prefer provenance-backed evidence over uncited notes.
+
+Final deliverables MUST separate findings into three sections:
+- Supported Findings
+- Contested Findings
+- Unresolved Findings
+
+Each item should cite the relevant evidence/provenance IDs."#;
+
 pub const WIKI_SECTION: &str = r#"
 == DATA SOURCES WIKI ==
 A runtime wiki of data source documentation is available at .openplanter/wiki/.
@@ -395,6 +425,7 @@ pub fn build_system_prompt(recursive: bool, acceptance_criteria: bool, demo: boo
     prompt.push_str(SYSTEM_PROMPT_BASE);
     prompt.push_str(SESSION_LOGS_SECTION);
     prompt.push_str(TURN_HISTORY_SECTION);
+    prompt.push_str(QUESTION_REASONING_SECTION);
     prompt.push_str(WIKI_SECTION);
     if recursive {
         prompt.push_str(RECURSIVE_SECTION);
@@ -418,6 +449,7 @@ mod tests {
         assert!(prompt.contains("You are OpenPlanter"));
         assert!(prompt.contains("SESSION LOGS AND TRANSCRIPTS"));
         assert!(prompt.contains("TURN HISTORY"));
+        assert!(prompt.contains("QUESTION-CENTRIC REASONING"));
         assert!(prompt.contains("DATA SOURCES WIKI"));
         assert!(!prompt.contains("REPL STRUCTURE"));
         assert!(!prompt.contains("ACCEPTANCE CRITERIA"));
@@ -449,6 +481,7 @@ mod tests {
         let base_pos = prompt.find("You are OpenPlanter").unwrap();
         let session_pos = prompt.find("SESSION LOGS AND TRANSCRIPTS").unwrap();
         let turn_pos = prompt.find("TURN HISTORY").unwrap();
+        let question_pos = prompt.find("QUESTION-CENTRIC REASONING").unwrap();
         let wiki_pos = prompt.find("DATA SOURCES WIKI").unwrap();
         let repl_pos = prompt.find("REPL STRUCTURE").unwrap();
         let accept_pos = prompt.find("ACCEPTANCE CRITERIA").unwrap();
@@ -456,7 +489,8 @@ mod tests {
 
         assert!(base_pos < session_pos);
         assert!(session_pos < turn_pos);
-        assert!(turn_pos < wiki_pos);
+        assert!(turn_pos < question_pos);
+        assert!(question_pos < wiki_pos);
         assert!(wiki_pos < repl_pos);
         assert!(repl_pos < accept_pos);
         assert!(accept_pos < demo_pos);
diff --git a/tests/test_engine.py b/tests/test_engine.py
index e9d237a6..fe11db07 100644
--- a/tests/test_engine.py
+++ b/tests/test_engine.py
@@ -264,6 +264,12 @@ def test_flat_prompt_excludes_repl(self) -> None:
         prompt = _build_system_prompt(recursive=False)
         self.assertNotIn("REPL STRUCTURE", prompt)
 
+    def test_prompt_includes_question_centric_reasoning_rules(self) -> None:
+        prompt = _build_system_prompt(recursive=False)
+        self.assertIn("QUESTION-CENTRIC REASONING", prompt)
+        self.assertIn("supported / contested / unresolved", prompt)
+        self.assertIn("Supported Findings", prompt)
+
     def test_recursive_initial_message_has_repl_hint(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)
@@ -311,6 +317,38 @@ def create_conversation(self, system_prompt: str, initial_user_message: str):
             parsed = json.loads(captured[0])
             self.assertNotIn("repl_hint", parsed)
 
+    def test_initial_message_includes_question_reasoning_packet(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(workspace=root, max_depth=2, max_steps_per_call=3, recursive=False)
+            tools = WorkspaceTools(root=root)
+
+            captured: list[str] = []
+
+            class CapturingModel(ScriptedModel):
+                def create_conversation(self, system_prompt: str, initial_user_message: str):
+                    captured.append(initial_user_message)
+                    return super().create_conversation(system_prompt, initial_user_message)
+
+            model = CapturingModel(scripted_turns=[
+                ModelTurn(text="done", stop_reason="end_turn"),
+            ])
+            engine = RLMEngine(model=model, tools=tools, config=cfg)
+            packet = {
+                "reasoning_mode": "question_centric",
+                "focus_question_ids": ["q_1"],
+                "unresolved_questions": [{"id": "q_1", "question": "Open question"}],
+                "findings": {"supported": [], "contested": [], "unresolved": []},
+                "contradictions": [],
+                "evidence_index": {},
+            }
+
+            engine.solve_with_context("test objective", question_reasoning_packet=packet)
+
+            self.assertEqual(len(captured), 1)
+            parsed = json.loads(captured[0])
+            self.assertEqual(parsed["question_reasoning_packet"], packet)
+
 
 @dataclass
 class ThreadSafeScriptedModel:
diff --git a/tests/test_investigation_state.py b/tests/test_investigation_state.py
index 9673c423..0c97dbc7 100644
--- a/tests/test_investigation_state.py
+++ b/tests/test_investigation_state.py
@@ -6,6 +6,7 @@
 from pathlib import Path
 
 from agent.investigation_state import (
+    build_question_reasoning_packet,
     migrate_legacy_state,
     state_to_legacy_projection,
 )
@@ -202,5 +203,73 @@ def test_save_state_preserves_existing_typed_fields_and_prunes_only_legacy_evide
             self.assertEqual(projected["custom_field"], "after")
 
 
+class QuestionReasoningPacketTests(unittest.TestCase):
+    def test_build_question_reasoning_packet_groups_findings_and_contradictions(self) -> None:
+        state = {
+            "questions": {
+                "q_2": {
+                    "id": "q_2",
+                    "question_text": "Is claim 2 true?",
+                    "status": "open",
+                    "priority": "high",
+                    "claim_ids": ["cl_2"],
+                    "evidence_ids": ["ev_2"],
+                },
+                "q_1": {
+                    "id": "q_1",
+                    "question_text": "Is claim 1 true?",
+                    "status": "open",
+                    "priority": "critical",
+                    "claim_ids": ["cl_1"],
+                    "evidence_ids": ["ev_1", "ev_3"],
+                },
+                "q_done": {
+                    "id": "q_done",
+                    "question_text": "Ignore",
+                    "status": "resolved",
+                },
+            },
+            "claims": {
+                "cl_1": {
+                    "claim_text": "Claim supported",
+                    "status": "supported",
+                    "support_evidence_ids": ["ev_1"],
+                    "confidence": 0.91,
+                },
+                "cl_2": {
+                    "claim_text": "Claim contested",
+                    "status": "contested",
+                    "support_evidence_ids": ["ev_2"],
+                    "contradiction_evidence_ids": ["ev_3"],
+                    "confidence_score": 0.4,
+                },
+                "cl_3": {
+                    "claim_text": "Claim unresolved",
+                    "status": "unresolved",
+                    "evidence_ids": ["ev_4"],
+                },
+            },
+            "evidence": {
+                "ev_1": {"evidence_type": "doc", "provenance_ids": ["pv_1"], "source_uri": "s1"},
+                "ev_2": {"evidence_type": "doc", "provenance_ids": ["pv_2"], "source_uri": "s2"},
+                "ev_3": {"evidence_type": "doc", "provenance_ids": ["pv_3"], "source_uri": "s3"},
+                "ev_4": {"evidence_type": "doc", "provenance_ids": ["pv_4"], "source_uri": "s4"},
+            },
+        }
+
+        packet = build_question_reasoning_packet(state)
+
+        self.assertEqual(packet["reasoning_mode"], "question_centric")
+        self.assertEqual(packet["focus_question_ids"], ["q_1", "q_2"])
+        self.assertEqual(len(packet["findings"]["supported"]), 1)
+        self.assertEqual(packet["findings"]["supported"][0]["id"], "cl_1")
+        self.assertEqual(len(packet["findings"]["contested"]), 1)
+        self.assertEqual(packet["findings"]["contested"][0]["id"], "cl_2")
+        self.assertEqual(len(packet["findings"]["unresolved"]), 1)
+        self.assertEqual(packet["findings"]["unresolved"][0]["id"], "cl_3")
+        self.assertEqual(packet["contradictions"][0]["claim_id"], "cl_2")
+        self.assertIn("ev_3", packet["evidence_index"])
+
+
 if __name__ == "__main__":
     unittest.main()
diff --git a/tests/test_session.py b/tests/test_session.py
index 0b6428ef..19e0c76c 100644
--- a/tests/test_session.py
+++ b/tests/test_session.py
@@ -61,6 +61,73 @@ def test_session_persist_and_resume(self) -> None:
             result2 = runtime2.solve("finish")
             self.assertEqual(result2, "second done")
 
+    def test_runtime_solve_injects_question_reasoning_packet_from_typed_state(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(
+                workspace=root,
+                max_depth=1,
+                max_steps_per_call=2,
+                session_root_dir=".openplanter",
+                max_persisted_observations=50,
+            )
+
+            captured: list[str] = []
+
+            class CapturingModel(ScriptedModel):
+                def create_conversation(self, system_prompt: str, initial_user_message: str):
+                    captured.append(initial_user_message)
+                    return super().create_conversation(system_prompt, initial_user_message)
+
+            model = CapturingModel(scripted_turns=[ModelTurn(text="ok", stop_reason="end_turn")])
+            engine = RLMEngine(model=model, tools=WorkspaceTools(root=root), config=cfg)
+            runtime = SessionRuntime.bootstrap(
+                engine=engine,
+                config=cfg,
+                session_id="session-packet",
+                resume=False,
+            )
+
+            session_dir = root / ".openplanter" / "sessions" / "session-packet"
+            typed_state_path = session_dir / "investigation_state.json"
+            typed = json.loads(typed_state_path.read_text(encoding="utf-8"))
+            typed["questions"] = {
+                "q_1": {
+                    "id": "q_1",
+                    "question_text": "Open question",
+                    "status": "open",
+                    "priority": "high",
+                    "claim_ids": ["cl_1"],
+                }
+            }
+            typed["claims"] = {
+                "cl_1": {
+                    "id": "cl_1",
+                    "claim_text": "Needs support",
+                    "status": "unresolved",
+                    "evidence_ids": ["ev_1"],
+                }
+            }
+            typed["evidence"] = {
+                "ev_1": {
+                    "id": "ev_1",
+                    "evidence_type": "web_fetch",
+                    "source_uri": "https://example.test",
+                    "provenance_ids": ["pv_1"],
+                }
+            }
+            typed_state_path.write_text(json.dumps(typed), encoding="utf-8")
+
+            result = runtime.solve("continue")
+
+            self.assertEqual(result, "ok")
+            self.assertEqual(len(captured), 1)
+            parsed = json.loads(captured[0])
+            packet = parsed["question_reasoning_packet"]
+            self.assertEqual(packet["reasoning_mode"], "question_centric")
+            self.assertEqual(packet["focus_question_ids"], ["q_1"])
+            self.assertEqual(packet["findings"]["unresolved"][0]["id"], "cl_1")
+
     def test_patch_artifact_saved(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)

From e7b36b3e0fa3f154fb5ddcab0cc022e95c91ad01 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Fri, 13 Mar 2026 16:48:37 -0400
Subject: [PATCH 28/58] Patch replay child IDs and desktop reasoning context

---
 agent/engine.py                               |  15 +-
 agent/replay_log.py                           |  20 +-
 .../crates/op-core/src/engine/context.rs      |  55 ++-
 .../op-core/src/engine/investigation_state.rs | 378 ++++++++++++++++++
 .../crates/op-core/src/engine/mod.rs          | 159 +++++++-
 .../crates/op-tauri/src/commands/agent.rs     |  96 ++++-
 tests/test_replay_log.py                      |  89 +++++
 7 files changed, 804 insertions(+), 8 deletions(-)

diff --git a/agent/engine.py b/agent/engine.py
index 6c3aa808..317077c0 100644
--- a/agent/engine.py
+++ b/agent/engine.py
@@ -657,6 +657,7 @@ def _solve_recursive(
 
             if parallel and final_answer is None:
                 group_id = f"d{depth}-s{step}-{time.monotonic_ns()}"
+                use_parallel_owner = len(parallel) > 1
                 begin_group = getattr(self.tools, "begin_parallel_write_group", None)
                 end_group = getattr(self.tools, "end_parallel_write_group", None)
                 if callable(begin_group):
@@ -671,7 +672,7 @@ def _solve_recursive(
                                 deadline=deadline, current_model=model,
                                 replay_logger=replay_logger,
                                 parallel_group_id=group_id,
-                                parallel_owner=f"{tc.id or 'tc'}:{idx}",
+                                parallel_owner=(f"{tc.id or 'tc'}:{idx}" if use_parallel_owner else None),
                             ): idx
                             for idx, tc in parallel
                         }
@@ -834,6 +835,7 @@ def _run_one_tool(
                     current_model=current_model,
                     replay_logger=replay_logger,
                     step=step,
+                    child_conversation_owner=parallel_owner,
                 )
             except Exception as exc:
                 observation = f"Tool {tc.name} crashed: {type(exc).__name__}: {exc}"
@@ -881,6 +883,7 @@ def _apply_tool_call(
         current_model: BaseModel | None = None,
         replay_logger: ReplayLogger | None = None,
         step: int = 0,
+        child_conversation_owner: str | None = None,
     ) -> tuple[bool, str]:
         name = tool_call.name
         args = tool_call.arguments
@@ -1048,7 +1051,10 @@ def _apply_tool_call(
                     subtask_model = self._model_cache[cache_key]
 
             self._emit(f"[d{depth}] >> entering subtask: {objective}", on_event)
-            child_logger = replay_logger.child(depth, step) if replay_logger else None
+            child_logger = (
+                replay_logger.child(depth, step, owner=child_conversation_owner)
+                if replay_logger else None
+            )
             subtask_result = self._solve_recursive(
                 objective=objective,
                 depth=depth + 1,
@@ -1104,7 +1110,10 @@ def _apply_tool_call(
                 cur.tool_defs = get_tool_definitions(include_subtask=False, include_acceptance_criteria=self.config.acceptance_criteria)
 
             self._emit(f"[d{depth}] >> executing leaf: {objective}", on_event)
-            child_logger = replay_logger.child(depth, step) if replay_logger else None
+            child_logger = (
+                replay_logger.child(depth, step, owner=child_conversation_owner)
+                if replay_logger else None
+            )
             exec_result = self._solve_recursive(
                 objective=objective,
                 depth=depth + 1,
diff --git a/agent/replay_log.py b/agent/replay_log.py
index 6e8e4eb4..849ad280 100644
--- a/agent/replay_log.py
+++ b/agent/replay_log.py
@@ -2,13 +2,29 @@
 
 from __future__ import annotations
 
+import hashlib
 import json
+import re
 import threading
 from dataclasses import dataclass, field
 from datetime import datetime, timezone
 from pathlib import Path
 from typing import Any, ClassVar
 
+_OWNER_SLUG_MAX_CHARS = 24
+
+
+def _normalize_owner_slug(owner: str) -> str:
+    normalized = re.sub(r"[^A-Za-z0-9._-]+", "_", owner.strip())
+    normalized = re.sub(r"_+", "_", normalized).strip("._-")
+    if not normalized:
+        return "anon"
+    return normalized[:_OWNER_SLUG_MAX_CHARS]
+
+
+def _owner_hash(owner: str) -> str:
+    return hashlib.sha1(owner.encode("utf-8")).hexdigest()[:8]
+
 
 @dataclass
 class _ReplayFileState:
@@ -60,9 +76,11 @@ def current_seq(self) -> int:
         with self._file_state.lock:
             return self._ensure_next_seq_locked()
 
-    def child(self, depth: int, step: int) -> "ReplayLogger":
+    def child(self, depth: int, step: int, owner: str | None = None) -> "ReplayLogger":
         """Create a child logger for a subtask conversation."""
         child_id = f"{self.conversation_id}/d{depth}s{step}"
+        if owner is not None:
+            child_id = f"{child_id}/o{_normalize_owner_slug(owner)}_{_owner_hash(owner)}"
         return ReplayLogger(
             path=self.path,
             conversation_id=child_id,
diff --git a/openplanter-desktop/crates/op-core/src/engine/context.rs b/openplanter-desktop/crates/op-core/src/engine/context.rs
index e84955cd..cbf44d6e 100644
--- a/openplanter-desktop/crates/op-core/src/engine/context.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/context.rs
@@ -108,7 +108,7 @@ impl ExternalContext {
         let typed_path = session_dir.join("investigation_state.json");
         let legacy_path = session_dir.join("state.json");
 
-        let mut typed_state = load_existing_investigation_state(session_dir, session_id).await?;
+        let mut typed_state = load_or_migrate_investigation_state(session_dir).await?;
         if typed_state.session_id.is_empty() {
             typed_state.session_id = session_id.to_string();
         }
@@ -135,6 +135,16 @@ impl Default for ExternalContext {
     }
 }
 
+pub async fn load_or_migrate_investigation_state(
+    session_dir: &Path,
+) -> std::io::Result<InvestigationState> {
+    let session_id = session_dir
+        .file_name()
+        .and_then(|value| value.to_str())
+        .unwrap_or_default();
+    load_existing_investigation_state(session_dir, session_id).await
+}
+
 async fn load_existing_investigation_state(
     session_dir: &Path,
     session_id: &str,
@@ -271,6 +281,49 @@ mod tests {
         assert_eq!(ctx.observations[1].content, "two");
     }
 
+    #[tokio::test]
+    async fn test_load_or_migrate_investigation_state_prefers_typed_state() {
+        let tmp = tempdir().unwrap();
+        fs::write(
+            tmp.path().join("investigation_state.json"),
+            r#"{"schema_version":"1.0.0","session_id":"sid","questions":{"q_1":{"id":"q_1","question_text":"keep me"}}}"#,
+        )
+        .await
+        .unwrap();
+        fs::write(
+            tmp.path().join("state.json"),
+            r#"{"session_id":"sid","external_observations":["legacy"]}"#,
+        )
+        .await
+        .unwrap();
+
+        let state = load_or_migrate_investigation_state(tmp.path())
+            .await
+            .unwrap();
+        assert!(state.questions.contains_key("q_1"));
+        assert!(state.legacy.external_observations.is_empty());
+    }
+
+    #[tokio::test]
+    async fn test_load_or_migrate_investigation_state_migrates_legacy_state() {
+        let tmp = tempdir().unwrap();
+        fs::write(
+            tmp.path().join("state.json"),
+            r#"{"session_id":"sid","external_observations":["legacy one"]}"#,
+        )
+        .await
+        .unwrap();
+
+        let state = load_or_migrate_investigation_state(tmp.path())
+            .await
+            .unwrap();
+        assert_eq!(state.legacy.external_observations, vec!["legacy one"]);
+        assert_eq!(
+            state.evidence["ev_legacy_000001"]["content"],
+            Value::String("legacy one".to_string())
+        );
+    }
+
     #[tokio::test]
     async fn test_load_legacy_rust_state_shape() {
         let tmp = tempdir().unwrap();
diff --git a/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs b/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs
index e2620158..4c01e639 100644
--- a/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs
@@ -325,6 +325,188 @@ impl InvestigationState {
     }
 }
 
+pub fn build_question_reasoning_packet(
+    state: &InvestigationState,
+    max_questions: usize,
+    max_evidence_per_item: usize,
+) -> Value {
+    let mut unresolved_questions: Vec<Value> = state
+        .questions
+        .iter()
+        .filter_map(|(question_id, raw_question)| {
+            let question = raw_question.as_object()?;
+            let status = question
+                .get("status")
+                .and_then(Value::as_str)
+                .unwrap_or("open")
+                .to_ascii_lowercase();
+            if matches!(
+                status.as_str(),
+                "resolved" | "closed" | "wont_fix" | "won't_fix"
+            ) {
+                return None;
+            }
+
+            Some(serde_json::json!({
+                "id": question.get("id").and_then(Value::as_str).unwrap_or(question_id),
+                "question": question
+                    .get("question_text")
+                    .and_then(Value::as_str)
+                    .or_else(|| question.get("question").and_then(Value::as_str))
+                    .unwrap_or_default(),
+                "status": status,
+                "priority": question
+                    .get("priority")
+                    .and_then(Value::as_str)
+                    .unwrap_or("medium")
+                    .to_ascii_lowercase(),
+                "claim_ids": id_list(question.get("claim_ids").or_else(|| question.get("claims"))),
+                "evidence_ids": limit_ids(question.get("evidence_ids"), max_evidence_per_item),
+                "triggers": id_list(question.get("trigger").or_else(|| question.get("triggers"))),
+                "updated_at": question
+                    .get("updated_at")
+                    .and_then(Value::as_str)
+                    .unwrap_or_default(),
+            }))
+        })
+        .collect();
+    unresolved_questions.sort_by(question_priority_sort_key);
+    unresolved_questions.truncate(std::cmp::max(1, max_questions));
+
+    let mut supported = Vec::new();
+    let mut contested = Vec::new();
+    let mut unresolved = Vec::new();
+    let mut contradictions = Vec::new();
+
+    for (claim_id, raw_claim) in &state.claims {
+        let Some(claim) = raw_claim.as_object() else {
+            continue;
+        };
+        let claim_status = claim
+            .get("status")
+            .and_then(Value::as_str)
+            .unwrap_or("unresolved")
+            .to_ascii_lowercase();
+        let support_ids = limit_ids(
+            claim
+                .get("support_evidence_ids")
+                .or_else(|| claim.get("evidence_ids")),
+            max_evidence_per_item,
+        );
+        let contradiction_ids = limit_ids(
+            claim
+                .get("contradiction_evidence_ids")
+                .or_else(|| claim.get("contradict_evidence_ids")),
+            max_evidence_per_item,
+        );
+        let has_contradictions = !contradiction_ids.is_empty();
+        let confidence = claim
+            .get("confidence")
+            .cloned()
+            .or_else(|| claim.get("confidence_score").cloned())
+            .unwrap_or(Value::Null);
+        let claim_summary = serde_json::json!({
+            "id": claim.get("id").and_then(Value::as_str).unwrap_or(claim_id),
+            "claim": claim
+                .get("claim_text")
+                .and_then(Value::as_str)
+                .or_else(|| claim.get("text").and_then(Value::as_str))
+                .unwrap_or_default(),
+            "status": claim_status,
+            "confidence": confidence,
+            "support_evidence_ids": support_ids,
+            "contradiction_evidence_ids": contradiction_ids,
+        });
+
+        if has_contradictions {
+            contradictions.push(serde_json::json!({
+                "claim_id": claim.get("id").and_then(Value::as_str).unwrap_or(claim_id),
+                "support_evidence_ids": claim_summary["support_evidence_ids"].clone(),
+                "contradiction_evidence_ids": claim_summary["contradiction_evidence_ids"].clone(),
+            }));
+        }
+
+        if claim_status == "supported" {
+            supported.push(claim_summary);
+        } else if claim_status == "contested" || has_contradictions {
+            contested.push(claim_summary);
+        } else {
+            unresolved.push(claim_summary);
+        }
+    }
+
+    let mut evidence_index = Map::new();
+    for evidence_id in
+        collect_evidence_ids(&[&unresolved_questions, &supported, &contested, &unresolved])
+    {
+        let Some(record) = state.evidence.get(&evidence_id).and_then(Value::as_object) else {
+            continue;
+        };
+        evidence_index.insert(
+            evidence_id.clone(),
+            serde_json::json!({
+                "evidence_type": record.get("evidence_type").cloned().unwrap_or(Value::Null),
+                "provenance_ids": id_list(record.get("provenance_ids")),
+                "source_uri": record.get("source_uri").cloned().unwrap_or(Value::Null),
+                "confidence_id": record.get("confidence_id").cloned().unwrap_or(Value::Null),
+            }),
+        );
+    }
+
+    serde_json::json!({
+        "reasoning_mode": "question_centric",
+        "loop": [
+            "select_unresolved_question",
+            "gather_discriminating_evidence",
+            "update_claim_status_and_confidence",
+            "record_contradictions",
+            "synthesize_supported_contested_unresolved",
+        ],
+        "focus_question_ids": unresolved_questions
+            .iter()
+            .filter_map(|item| item.get("id").and_then(Value::as_str).map(ToString::to_string))
+            .collect::<Vec<_>>(),
+        "unresolved_questions": unresolved_questions,
+        "findings": {
+            "supported": supported,
+            "contested": contested,
+            "unresolved": unresolved,
+        },
+        "contradictions": contradictions,
+        "evidence_index": evidence_index,
+    })
+}
+
+pub fn has_reasoning_content(packet: &Value) -> bool {
+    let Some(obj) = packet.as_object() else {
+        return false;
+    };
+    if obj
+        .get("focus_question_ids")
+        .and_then(Value::as_array)
+        .is_some_and(|items| !items.is_empty())
+    {
+        return true;
+    }
+    if obj
+        .get("contradictions")
+        .and_then(Value::as_array)
+        .is_some_and(|items| !items.is_empty())
+    {
+        return true;
+    }
+    obj.get("findings")
+        .and_then(Value::as_object)
+        .is_some_and(|findings| {
+            ["supported", "contested", "unresolved"].iter().any(|key| {
+                findings
+                    .get(*key)
+                    .and_then(Value::as_array)
+                    .is_some_and(|items| !items.is_empty())
+            })
+        })
+}
+
 fn default_schema_version() -> String {
     SCHEMA_VERSION.to_string()
 }
@@ -376,6 +558,81 @@ fn is_legacy_evidence(evidence_id: &str, record: &Value) -> bool {
         == Some("legacy_observation")
 }
 
+fn id_list(value: Option<&Value>) -> Vec<String> {
+    value
+        .and_then(Value::as_array)
+        .map(|items| {
+            items
+                .iter()
+                .filter(|item| !item.is_null())
+                .map(stringify_value)
+                .collect()
+        })
+        .unwrap_or_default()
+}
+
+fn limit_ids(value: Option<&Value>, max_items: usize) -> Vec<String> {
+    let mut ids = id_list(value);
+    ids.truncate(max_items);
+    ids
+}
+
+fn stringify_value(value: &Value) -> String {
+    value
+        .as_str()
+        .map(ToString::to_string)
+        .unwrap_or_else(|| value.to_string())
+}
+
+fn question_priority_sort_key(left: &Value, right: &Value) -> std::cmp::Ordering {
+    let left_rank = question_priority_rank(left.get("priority").and_then(Value::as_str));
+    let right_rank = question_priority_rank(right.get("priority").and_then(Value::as_str));
+    left_rank.cmp(&right_rank).then_with(|| {
+        left.get("id")
+            .and_then(Value::as_str)
+            .unwrap_or_default()
+            .cmp(right.get("id").and_then(Value::as_str).unwrap_or_default())
+    })
+}
+
+fn question_priority_rank(priority: Option<&str>) -> u8 {
+    match priority.unwrap_or("medium").to_ascii_lowercase().as_str() {
+        "critical" => 0,
+        "high" => 1,
+        "medium" => 2,
+        "low" => 3,
+        _ => 9,
+    }
+}
+
+fn collect_evidence_ids(collections: &[&Vec<Value>]) -> Vec<String> {
+    let mut seen = BTreeSet::new();
+    let mut out = Vec::new();
+    for collection in collections {
+        for item in *collection {
+            let Some(obj) = item.as_object() else {
+                continue;
+            };
+            for key in [
+                "evidence_ids",
+                "support_evidence_ids",
+                "contradiction_evidence_ids",
+            ] {
+                let Some(values) = obj.get(key).and_then(Value::as_array) else {
+                    continue;
+                };
+                for value in values {
+                    let evidence_id = stringify_value(value);
+                    if seen.insert(evidence_id.clone()) {
+                        out.push(evidence_id);
+                    }
+                }
+            }
+        }
+    }
+    out
+}
+
 #[cfg(test)]
 mod tests {
     use super::*;
@@ -445,4 +702,125 @@ mod tests {
             Some(&Value::String("after".to_string()))
         );
     }
+
+    #[test]
+    fn build_question_reasoning_packet_groups_findings_and_contradictions() {
+        let mut state = InvestigationState::new("sid");
+        state.questions.insert(
+            "q_2".to_string(),
+            serde_json::json!({
+                "id": "q_2",
+                "question_text": "Is claim 2 true?",
+                "status": "open",
+                "priority": "high",
+                "claim_ids": ["cl_2"],
+                "evidence_ids": ["ev_2"],
+            }),
+        );
+        state.questions.insert(
+            "q_1".to_string(),
+            serde_json::json!({
+                "id": "q_1",
+                "question_text": "Is claim 1 true?",
+                "status": "open",
+                "priority": "critical",
+                "claim_ids": ["cl_1"],
+                "evidence_ids": ["ev_1", "ev_3"],
+            }),
+        );
+        state.questions.insert(
+            "q_done".to_string(),
+            serde_json::json!({
+                "id": "q_done",
+                "question_text": "Ignore",
+                "status": "resolved",
+            }),
+        );
+        state.claims.insert(
+            "cl_1".to_string(),
+            serde_json::json!({
+                "claim_text": "Claim supported",
+                "status": "supported",
+                "support_evidence_ids": ["ev_1"],
+                "confidence": 0.91,
+            }),
+        );
+        state.claims.insert(
+            "cl_2".to_string(),
+            serde_json::json!({
+                "claim_text": "Claim contested",
+                "status": "contested",
+                "support_evidence_ids": ["ev_2"],
+                "contradiction_evidence_ids": ["ev_3"],
+                "confidence_score": 0.4,
+            }),
+        );
+        state.claims.insert(
+            "cl_3".to_string(),
+            serde_json::json!({
+                "claim_text": "Claim unresolved",
+                "status": "unresolved",
+                "evidence_ids": ["ev_4"],
+            }),
+        );
+        state.evidence.insert(
+            "ev_1".to_string(),
+            serde_json::json!({"evidence_type": "doc", "provenance_ids": ["pv_1"], "source_uri": "s1"}),
+        );
+        state.evidence.insert(
+            "ev_2".to_string(),
+            serde_json::json!({"evidence_type": "doc", "provenance_ids": ["pv_2"], "source_uri": "s2"}),
+        );
+        state.evidence.insert(
+            "ev_3".to_string(),
+            serde_json::json!({"evidence_type": "doc", "provenance_ids": ["pv_3"], "source_uri": "s3"}),
+        );
+        state.evidence.insert(
+            "ev_4".to_string(),
+            serde_json::json!({"evidence_type": "doc", "provenance_ids": ["pv_4"], "source_uri": "s4"}),
+        );
+
+        let packet = build_question_reasoning_packet(&state, 8, 6);
+
+        assert_eq!(
+            packet["reasoning_mode"],
+            Value::String("question_centric".to_string())
+        );
+        assert_eq!(
+            packet["focus_question_ids"],
+            serde_json::json!(["q_1", "q_2"])
+        );
+        assert_eq!(
+            packet["findings"]["supported"][0]["id"],
+            Value::String("cl_1".to_string())
+        );
+        assert_eq!(
+            packet["findings"]["contested"][0]["id"],
+            Value::String("cl_2".to_string())
+        );
+        assert_eq!(
+            packet["findings"]["unresolved"][0]["id"],
+            Value::String("cl_3".to_string())
+        );
+        assert_eq!(
+            packet["contradictions"][0]["claim_id"],
+            Value::String("cl_2".to_string())
+        );
+        assert!(packet["evidence_index"].get("ev_3").is_some());
+        assert!(has_reasoning_content(&packet));
+    }
+
+    #[test]
+    fn has_reasoning_content_returns_false_for_empty_packet() {
+        let packet = serde_json::json!({
+            "focus_question_ids": [],
+            "findings": {
+                "supported": [],
+                "contested": [],
+                "unresolved": [],
+            },
+            "contradictions": [],
+        });
+        assert!(!has_reasoning_content(&packet));
+    }
 }
diff --git a/openplanter-desktop/crates/op-core/src/engine/mod.rs b/openplanter-desktop/crates/op-core/src/engine/mod.rs
index edd79d8a..9dc2f3e4 100644
--- a/openplanter-desktop/crates/op-core/src/engine/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/mod.rs
@@ -11,6 +11,8 @@ pub mod judge;
 use std::time::Duration;
 
 use anyhow::anyhow;
+use chrono::Utc;
+use serde_json::{Map, Value};
 use tokio::sync::mpsc;
 use tokio::task::JoinHandle;
 use tokio_util::sync::CancellationToken;
@@ -25,6 +27,13 @@ use crate::tools::defs::build_tool_defs;
 
 use self::curator::{CuratorResult, extract_step_context, run_curator};
 
+#[derive(Debug, Clone, Default)]
+pub struct SolveInitialContext {
+    pub session_id: Option<String>,
+    pub session_dir: Option<String>,
+    pub question_reasoning_packet: Option<Value>,
+}
+
 /// Outcome from a background curator task (success or error).
 enum CuratorOutcome {
     Done(CuratorResult),
@@ -330,6 +339,56 @@ fn safe_prefix(text: &str, max_chars: usize) -> &str {
     &text[..end]
 }
 
+fn build_initial_user_message(
+    objective: &str,
+    config: &AgentConfig,
+    initial_context: Option<&SolveInitialContext>,
+) -> Result<String, serde_json::Error> {
+    let Some(initial_context) = initial_context else {
+        return Ok(objective.to_string());
+    };
+
+    let mut payload = Map::new();
+    payload.insert(
+        "timestamp".to_string(),
+        Value::String(Utc::now().to_rfc3339()),
+    );
+    payload.insert(
+        "objective".to_string(),
+        Value::String(objective.to_string()),
+    );
+    payload.insert(
+        "max_steps_per_call".to_string(),
+        Value::from(config.max_steps_per_call),
+    );
+    payload.insert(
+        "workspace".to_string(),
+        Value::String(config.workspace.display().to_string()),
+    );
+    if let Some(session_id) = initial_context
+        .session_id
+        .as_ref()
+        .filter(|value| !value.trim().is_empty())
+    {
+        payload.insert("session_id".to_string(), Value::String(session_id.clone()));
+    }
+    if let Some(session_dir) = initial_context
+        .session_dir
+        .as_ref()
+        .filter(|value| !value.trim().is_empty())
+    {
+        payload.insert(
+            "session_dir".to_string(),
+            Value::String(session_dir.clone()),
+        );
+    }
+    if let Some(packet) = initial_context.question_reasoning_packet.clone() {
+        payload.insert("question_reasoning_packet".to_string(), packet);
+    }
+
+    serde_json::to_string(&payload)
+}
+
 /// Compact conversation context when it grows too large.
 ///
 /// Keeps the system prompt, user objective, and the most recent messages
@@ -560,6 +619,17 @@ pub async fn solve(
     config: &AgentConfig,
     emitter: &dyn SolveEmitter,
     cancel: CancellationToken,
+) {
+    solve_with_initial_context(objective, config, emitter, cancel, None).await;
+}
+
+/// Real solve flow with optional initial structured context.
+pub async fn solve_with_initial_context(
+    objective: &str,
+    config: &AgentConfig,
+    emitter: &dyn SolveEmitter,
+    cancel: CancellationToken,
+    initial_context: Option<SolveInitialContext>,
 ) {
     if config.demo {
         return demo_solve(objective, emitter, cancel).await;
@@ -583,12 +653,25 @@ pub async fn solve(
 
     let system_prompt =
         build_system_prompt(config.recursive, config.acceptance_criteria, config.demo);
+    let initial_user_message = match build_initial_user_message(
+        objective,
+        config,
+        initial_context.as_ref(),
+    ) {
+        Ok(message) => message,
+        Err(err) => {
+            emitter.emit_trace(&format!(
+                "[solve] failed to serialize initial context; falling back to plain objective: {err}"
+            ));
+            objective.to_string()
+        }
+    };
     let mut messages = vec![
         Message::System {
             content: system_prompt,
         },
         Message::User {
-            content: objective.to_string(),
+            content: initial_user_message,
         },
     ];
 
@@ -1166,6 +1249,80 @@ mod tests {
         assert_eq!(tokens, 1004);
     }
 
+    #[test]
+    fn test_build_initial_user_message_preserves_plain_objective_without_context() {
+        let config = AgentConfig::default();
+        let message = build_initial_user_message("just objective", &config, None).unwrap();
+        assert_eq!(message, "just objective");
+    }
+
+    #[test]
+    fn test_build_initial_user_message_includes_context_payload() {
+        let config = AgentConfig::default();
+        let message = build_initial_user_message(
+            "investigate",
+            &config,
+            Some(&SolveInitialContext {
+                session_id: Some("session-1".to_string()),
+                session_dir: Some("/tmp/session-1".to_string()),
+                question_reasoning_packet: Some(serde_json::json!({
+                    "reasoning_mode": "question_centric",
+                    "focus_question_ids": ["q_1"],
+                    "findings": {
+                        "supported": [],
+                        "contested": [],
+                        "unresolved": [],
+                    },
+                    "contradictions": [],
+                    "evidence_index": {},
+                })),
+            }),
+        )
+        .unwrap();
+
+        let parsed: Value = serde_json::from_str(&message).unwrap();
+        assert_eq!(
+            parsed["objective"],
+            Value::String("investigate".to_string())
+        );
+        assert_eq!(parsed["session_id"], Value::String("session-1".to_string()));
+        assert_eq!(
+            parsed["session_dir"],
+            Value::String("/tmp/session-1".to_string())
+        );
+        assert_eq!(
+            parsed["question_reasoning_packet"]["focus_question_ids"],
+            serde_json::json!(["q_1"])
+        );
+        assert!(parsed.get("timestamp").is_some());
+        assert_eq!(
+            parsed["max_steps_per_call"],
+            Value::from(config.max_steps_per_call)
+        );
+    }
+
+    #[test]
+    fn test_build_initial_user_message_omits_packet_when_empty() {
+        let config = AgentConfig::default();
+        let message = build_initial_user_message(
+            "investigate",
+            &config,
+            Some(&SolveInitialContext {
+                session_id: Some("session-1".to_string()),
+                session_dir: Some("/tmp/session-1".to_string()),
+                question_reasoning_packet: None,
+            }),
+        )
+        .unwrap();
+
+        let parsed: Value = serde_json::from_str(&message).unwrap();
+        assert!(parsed.get("question_reasoning_packet").is_none());
+        assert_eq!(
+            parsed["objective"],
+            Value::String("investigate".to_string())
+        );
+    }
+
     #[test]
     fn test_compact_messages_no_op_when_under_limit() {
         let mut messages = vec![
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
index d251af51..c811417c 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
@@ -1,13 +1,46 @@
+use std::path::Path;
+
 use tauri::{AppHandle, Emitter, State};
 use tokio_util::sync::CancellationToken;
 
 use crate::bridge::{LoggingEmitter, TauriEmitter};
 use crate::commands::session::sessions_dir;
 use crate::state::AppState;
-use op_core::engine::SolveEmitter;
+use op_core::engine::context::load_or_migrate_investigation_state;
+use op_core::engine::investigation_state::{
+    build_question_reasoning_packet, has_reasoning_content,
+};
+use op_core::engine::{SolveEmitter, SolveInitialContext};
 use op_core::session::replay::{ReplayEntry, ReplayLogger};
 use op_core::workspace_init;
 
+async fn build_solve_initial_context(
+    session_dir: &Path,
+    session_id: &str,
+) -> (SolveInitialContext, Option<String>) {
+    let mut initial_context = SolveInitialContext {
+        session_id: Some(session_id.to_string()),
+        session_dir: Some(session_dir.display().to_string()),
+        question_reasoning_packet: None,
+    };
+
+    match load_or_migrate_investigation_state(session_dir).await {
+        Ok(state) => {
+            let packet = build_question_reasoning_packet(&state, 8, 6);
+            if has_reasoning_content(&packet) {
+                initial_context.question_reasoning_packet = Some(packet);
+            }
+            (initial_context, None)
+        }
+        Err(err) => (
+            initial_context,
+            Some(format!(
+                "[solve] failed to load investigation state for reasoning packet; continuing without packet: {err}"
+            )),
+        ),
+    }
+}
+
 /// Start solving an objective. Result streamed via events.
 #[tauri::command]
 pub async fn solve(
@@ -82,10 +115,22 @@ pub async fn solve(
         session_id
     ));
     emitter.emit_trace(&format!("[startup:info] {}", state.startup_trace()));
+    let (initial_context, initial_context_warning) =
+        build_solve_initial_context(&session_dir, &session_id).await;
+    if let Some(warning) = initial_context_warning.as_deref() {
+        emitter.emit_trace(warning);
+    }
 
     tokio::spawn(async move {
         let result = tokio::spawn(async move {
-            op_core::engine::solve(&objective, &cfg, &emitter, token).await;
+            op_core::engine::solve_with_initial_context(
+                &objective,
+                &cfg,
+                &emitter,
+                token,
+                Some(initial_context),
+            )
+            .await;
         })
         .await;
 
@@ -120,3 +165,50 @@ pub async fn debug_log(msg: String) -> Result<(), String> {
     eprintln!("[frontend] {msg}");
     Ok(())
 }
+
+#[cfg(test)]
+mod tests {
+    use super::*;
+    use tempfile::tempdir;
+    use tokio::fs;
+
+    #[tokio::test]
+    async fn test_build_solve_initial_context_includes_packet_when_state_has_reasoning() {
+        let tmp = tempdir().unwrap();
+        fs::write(
+            tmp.path().join("investigation_state.json"),
+            r#"{
+                "schema_version":"1.0.0",
+                "session_id":"sid",
+                "questions":{"q_1":{"id":"q_1","question_text":"Open question","status":"open","priority":"high","claim_ids":["cl_1"]}},
+                "claims":{"cl_1":{"id":"cl_1","claim_text":"Needs support","status":"unresolved","evidence_ids":["ev_1"]}},
+                "evidence":{"ev_1":{"id":"ev_1","evidence_type":"web_fetch","source_uri":"https://example.test","provenance_ids":["pv_1"]}}
+            }"#,
+        )
+        .await
+        .unwrap();
+
+        let (context, warning) = build_solve_initial_context(tmp.path(), "sid").await;
+        assert!(warning.is_none());
+        let packet = context
+            .question_reasoning_packet
+            .expect("packet should be present");
+        assert_eq!(packet["focus_question_ids"], serde_json::json!(["q_1"]));
+        assert_eq!(context.session_id, Some("sid".to_string()));
+        assert_eq!(context.session_dir, Some(tmp.path().display().to_string()));
+    }
+
+    #[tokio::test]
+    async fn test_build_solve_initial_context_degrades_to_no_packet_on_load_failure() {
+        let tmp = tempdir().unwrap();
+        fs::write(tmp.path().join("investigation_state.json"), "{not-json")
+            .await
+            .unwrap();
+
+        let (context, warning) = build_solve_initial_context(tmp.path(), "sid").await;
+        assert!(warning.is_some());
+        assert!(context.question_reasoning_packet.is_none());
+        assert_eq!(context.session_id, Some("sid".to_string()));
+        assert_eq!(context.session_dir, Some(tmp.path().display().to_string()));
+    }
+}
diff --git a/tests/test_replay_log.py b/tests/test_replay_log.py
index 9b08762b..fad6033f 100644
--- a/tests/test_replay_log.py
+++ b/tests/test_replay_log.py
@@ -178,6 +178,32 @@ def test_child_logger(self) -> None:
             self.assertEqual(records[3]["seq"], 1)
             self.assertIn("messages_snapshot", records[3])
 
+    def test_child_logger_owner_suffix_keeps_ids_unique(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            p = Path(tmpdir) / "replay.jsonl"
+            parent = ReplayLogger(path=p)
+
+            left = parent.child(depth=0, step=2, owner="call_subtask:0")
+            right = parent.child(depth=0, step=2, owner="call_subtask:1")
+
+            self.assertNotEqual(left.conversation_id, right.conversation_id)
+            self.assertRegex(left.conversation_id, r"^root/d0s2/o[A-Za-z0-9._-]+_[0-9a-f]{8}$")
+            self.assertRegex(right.conversation_id, r"^root/d0s2/o[A-Za-z0-9._-]+_[0-9a-f]{8}$")
+
+    def test_child_logger_owner_suffix_normalizes_and_hashes(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            p = Path(tmpdir) / "replay.jsonl"
+            parent = ReplayLogger(path=p)
+
+            same_left = parent.child(depth=0, step=2, owner="  odd owner/with spaces?  ")
+            same_right = parent.child(depth=0, step=2, owner="  odd owner/with spaces?  ")
+            collided_slug_a = parent.child(depth=0, step=2, owner="abc/def")
+            collided_slug_b = parent.child(depth=0, step=2, owner="abc:def")
+
+            self.assertEqual(same_left.conversation_id, same_right.conversation_id)
+            self.assertIn("/oodd_owner_with_spaces_", same_left.conversation_id)
+            self.assertNotEqual(collided_slug_a.conversation_id, collided_slug_b.conversation_id)
+
     def test_creates_parent_dirs(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             p = Path(tmpdir) / "deep" / "nested" / "replay.jsonl"
@@ -419,6 +445,69 @@ def test_subtask_logged_with_child_conversation(self) -> None:
             self.assertEqual(len(child_calls), 1)
             self.assertEqual(child_calls[0]["depth"], 1)
 
+    def test_parallel_subtasks_log_distinct_child_conversations_for_same_step(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(
+                workspace=root,
+                max_depth=3,
+                max_steps_per_call=6,
+                recursive=True,
+                acceptance_criteria=False,
+            )
+            tools = WorkspaceTools(root=root)
+            model = ScriptedModel(
+                scripted_turns=[
+                    ModelTurn(tool_calls=[
+                        _tc("subtask", objective="task A", model="worker-a"),
+                        _tc("subtask", objective="task B", model="worker-b"),
+                    ]),
+                    ModelTurn(text="root done", stop_reason="end_turn"),
+                ]
+            )
+
+            def factory(model_name: str, _effort: str | None) -> ScriptedModel:
+                objective = "task A" if model_name == "worker-a" else "task B"
+                return ScriptedModel(
+                    scripted_turns=[
+                        ModelTurn(text=f"{objective} done", stop_reason="end_turn"),
+                    ]
+                )
+
+            engine = RLMEngine(model=model, tools=tools, config=cfg, model_factory=factory)
+            replay_path = root / "replay.jsonl"
+            replay_logger = ReplayLogger(path=replay_path)
+
+            result, _ = engine.solve_with_context(
+                objective="top level",
+                replay_logger=replay_logger,
+            )
+            self.assertEqual(result, "root done")
+
+            records = self._read_records(replay_path)
+            headers = [r for r in records if r["type"] == "header"]
+            calls = [r for r in records if r["type"] == "call"]
+
+            child_ids = sorted(
+                {
+                    record["conversation_id"]
+                    for record in headers
+                    if record["conversation_id"].startswith("root/d0s1/o")
+                }
+            )
+            self.assertEqual(len(child_ids), 2)
+            self.assertNotEqual(child_ids[0], child_ids[1])
+
+            root_calls = [c for c in calls if c["conversation_id"] == "root"]
+            self.assertEqual(len(root_calls), 2)
+            for child_id in child_ids:
+                child_headers = [h for h in headers if h["conversation_id"] == child_id]
+                child_calls = [c for c in calls if c["conversation_id"] == child_id]
+                self.assertEqual(len(child_headers), 1)
+                self.assertEqual(len(child_calls), 1)
+                self.assertEqual(child_calls[0]["depth"], 1)
+                self.assertIn("messages_snapshot", child_calls[0])
+
     def test_replay_log_via_runtime(self) -> None:
         """SessionRuntime.solve() creates replay.jsonl in session dir."""
         with tempfile.TemporaryDirectory() as tmpdir:

From 21bb94af97e12a551d8858b4877227cba4c500da Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Fri, 13 Mar 2026 21:16:06 -0400
Subject: [PATCH 29/58] Redesign curator as checkpointed synthesizer

---
 README.md                                     |   2 +-
 agent/prompts.py                              |  11 +-
 .../crates/op-core/src/engine/curator.rs      | 353 ++++++++--------
 .../crates/op-core/src/engine/mod.rs          | 384 ++++++------------
 .../crates/op-core/src/events.rs              |   2 +-
 .../crates/op-core/src/prompts.rs             |  11 +-
 .../op-core/tests/test_model_streaming.rs     |  20 +-
 openplanter-desktop/frontend/src/main.ts      |  22 +-
 8 files changed, 340 insertions(+), 465 deletions(-)

diff --git a/README.md b/README.md
index f00e7e84..d8e16d38 100644
--- a/README.md
+++ b/README.md
@@ -27,7 +27,7 @@ The desktop app (`openplanter-desktop/`) is a Tauri 2 application with a three-p
 - **Live knowledge graph** — Entities and connections render in real time as the agent works. Switch between force-directed, hierarchical, and circular layouts. Search and filter by category.
 - **Wiki source drawer** — Click any source node to read the full markdown document in a slide-out panel. Internal wiki links navigate between documents and focus the corresponding graph node.
 - **Session persistence** — Investigations are saved automatically. Resume previous sessions or start new ones from the sidebar.
-- **Background wiki curator** — A lightweight agent runs in the background to keep wiki documents consistent and cross-linked.
+- **Checkpointed wiki curator synthesizer** — A focused synthesizer runs at explicit loop phase boundaries and projects typed state deltas into concise, provenance-aware wiki updates.
 - **Multi-provider support** — Switch between OpenAI, Anthropic, OpenRouter, Cerebras, and Ollama (local) from the sidebar.
 
 ### Building from Source
diff --git a/agent/prompts.py b/agent/prompts.py
index 8687453e..b9bee9db 100644
--- a/agent/prompts.py
+++ b/agent/prompts.py
@@ -418,9 +418,14 @@
 data sources are documented. Each entry describes access methods, schemas,
 coverage, and cross-reference potential.
 
-When you discover new information about a data source — updated URLs, new fields,
-cross-reference joins, data quality issues, or entirely new sources — update the
-relevant entry or create a new one using .openplanter/wiki/template.md.
+Treat the wiki as a derived knowledge surface, not your primary memory store.
+Primary continuity comes from {session_dir}/investigation_state.json and explicit
+evidence/provenance IDs.
+
+When you discover durable, non-duplicative information about a data source —
+updated URLs, new fields, cross-reference joins, data quality issues, or
+entirely new sources — update the relevant entry or create a new one using
+.openplanter/wiki/template.md. Avoid noisy repeat edits that do not add facts.
 
 === MANDATORY WIKI INDEXING ===
 For EVERY investigation, you MUST maintain the wiki as a living knowledge map:
diff --git a/openplanter-desktop/crates/op-core/src/engine/curator.rs b/openplanter-desktop/crates/op-core/src/engine/curator.rs
index ea683acd..610fa8c0 100644
--- a/openplanter-desktop/crates/op-core/src/engine/curator.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/curator.rs
@@ -1,12 +1,15 @@
-/// Background wiki curator agent.
+/// Checkpointed wiki curator synthesizer.
 ///
-/// Runs as a non-blocking background task after each main agent step.
-/// Reads the latest step context, decides if wiki updates are needed,
-/// and writes to `.openplanter/wiki/` using a restricted tool set.
+/// Runs at explicit solve-loop phase boundaries and updates wiki files from
+/// typed state deltas rather than raw transcript slices.
+use std::collections::BTreeSet;
+
+use serde::{Deserialize, Serialize};
 use tokio_util::sync::CancellationToken;
 
 use crate::builder::build_model;
 use crate::config::AgentConfig;
+use crate::events::LoopPhase;
 use crate::model::Message;
 use crate::tools::WorkspaceTools;
 use crate::tools::defs::build_curator_tool_defs;
@@ -18,22 +21,49 @@ pub struct CuratorResult {
     pub files_changed: u32,
 }
 
-const CURATOR_SYSTEM_PROMPT: &str = r#"You are the Wiki Curator, a background agent that maintains the investigation wiki.
+#[derive(Debug, Clone, Serialize, Deserialize)]
+pub struct CuratorToolObservation {
+    pub tool_call_id: String,
+    pub tool_name: String,
+    pub arguments_json: String,
+    pub output_excerpt: String,
+    pub is_error: bool,
+}
+
+#[derive(Debug, Clone, Serialize, Deserialize)]
+pub struct CuratorStateDelta {
+    pub step: u32,
+    pub phase: LoopPhase,
+    pub objective: String,
+    pub observations: Vec<CuratorToolObservation>,
+}
+
+#[derive(Debug, Clone, Serialize, Deserialize)]
+pub struct CuratorCheckpoint {
+    pub boundary: String,
+    pub deltas: Vec<CuratorStateDelta>,
+}
+
+const CURATOR_SYSTEM_PROMPT: &str = r#"You are the Wiki Curator Synthesizer.
+
+You run ONLY at explicit solve-loop phase boundaries and receive typed checkpoint
+deltas rather than raw transcript slices.
 
-Your ONLY job is to update the wiki at .openplanter/wiki/ based on the main agent's latest step.
+The wiki at `.openplanter/wiki/` is a DERIVED knowledge surface. It is not the
+agent's primary memory store.
 
 == RULES ==
-1. You may ONLY modify files under .openplanter/wiki/
-2. Read .openplanter/wiki/index.md first to understand existing entries
-3. If the main agent discovered a new data source, create a wiki entry using the template format
-4. If the main agent found new information about an existing source, update the relevant entry
-5. Update .openplanter/wiki/index.md to link any new entries in the correct category table
-6. Use EXACT source names in Cross-Reference sections to power the knowledge graph
-7. If nothing in the step context is wiki-relevant, respond with ONLY: "No wiki updates needed"
-8. Keep entries factual and concise — document what was found, not speculation
-9. Never modify files outside .openplanter/wiki/ — this is enforced at runtime
-10. Only use write_file or edit_file for mutations
-11. Maximum 8 tool calls — be efficient
+1. You may ONLY modify files under `.openplanter/wiki/`.
+2. Read `.openplanter/wiki/index.md` before writing so links and exact source names stay consistent.
+3. Use ONLY tool-grounded facts from the checkpoint payload. Do not invent or infer unsupported details.
+4. Preserve provenance. When adding facts, keep concise evidence anchors using the originating step, tool name, and tool call ID.
+5. Eliminate duplicate and noisy updates. Prefer a no-op over restating facts already captured in the wiki.
+6. Ignore low-information operational traces unless they reveal durable source facts worth documenting.
+7. If the checkpoint contains no wiki-relevant net-new knowledge, respond with EXACTLY: "No wiki updates needed".
+8. Keep entries factual and concise. Document what was learned, not speculation.
+9. Prefer `edit_file` over whole-file rewrites when possible.
+10. Only use `write_file` or `edit_file` for mutations.
+11. Maximum 8 tool calls.
 
 == WIKI ENTRY TEMPLATE ==
 When creating a new entry, use this format:
@@ -61,63 +91,67 @@ Brief description of what this data source provides.
 - [Other Source Name]: how they connect
 - [Another Source]: join key or relationship
 
-== STEP CONTEXT ==
-Below is the main agent's latest step. Analyze it for wiki-relevant discoveries."#;
+== CHECKPOINT PAYLOAD ==
+Below is a typed checkpoint payload with per-step tool observations. Analyze it
+for durable wiki-relevant discoveries."#;
 
 /// Maximum number of tool-call steps for the curator.
 const MAX_CURATOR_STEPS: usize = 8;
+const MAX_TOOL_OUTPUT_EXCERPT: usize = 1_200;
 
-/// Maximum chars of context to extract from the main agent's messages.
-const MAX_CONTEXT_CHARS: usize = 8_000;
-
-/// Extract the latest step context from the main conversation.
-///
-/// Walks backwards from the end to find the last Assistant message,
-/// then collects it plus any subsequent Tool messages.
-pub fn extract_step_context(messages: &[Message]) -> String {
-    let mut context = String::new();
+fn trim_excerpt(raw: &str) -> String {
+    if raw.len() <= MAX_TOOL_OUTPUT_EXCERPT {
+        return raw.to_string();
+    }
 
-    // Find last Assistant message index
-    let assistant_idx = messages
-        .iter()
-        .rposition(|m| matches!(m, Message::Assistant { .. }));
-    let start = match assistant_idx {
-        Some(idx) => idx,
-        None => return context,
+    let end = if raw.is_char_boundary(MAX_TOOL_OUTPUT_EXCERPT) {
+        MAX_TOOL_OUTPUT_EXCERPT
+    } else {
+        raw.char_indices()
+            .map(|(idx, _)| idx)
+            .take_while(|idx| *idx < MAX_TOOL_OUTPUT_EXCERPT)
+            .last()
+            .unwrap_or(0)
     };
 
-    for msg in &messages[start..] {
-        match msg {
-            Message::Assistant {
-                content,
-                tool_calls,
-            } => {
-                context.push_str("=== Assistant ===\n");
-                context.push_str(content);
-                context.push('\n');
-                if let Some(tcs) = tool_calls {
-                    for tc in tcs {
-                        context.push_str(&format!("[Tool call: {}]\n", tc.name));
-                    }
-                }
-            }
-            Message::Tool { content, .. } => {
-                context.push_str("=== Tool Result ===\n");
-                context.push_str(content);
-                context.push('\n');
+    let mut trimmed = raw[..end].to_string();
+    trimmed.push_str("\n...[truncated]");
+    trimmed
+}
+
+pub fn build_state_delta(
+    step: u32,
+    phase: LoopPhase,
+    objective: &str,
+    tools: &[(String, String, String, String, bool)],
+) -> Option<CuratorStateDelta> {
+    let observations = tools
+        .iter()
+        .filter_map(|(id, name, args, content, is_error)| {
+            if content.trim().is_empty() && !*is_error {
+                return None;
             }
-            _ => {}
-        }
-    }
 
-    // Truncate to budget
-    if context.len() > MAX_CONTEXT_CHARS {
-        let end = context.floor_char_boundary(MAX_CONTEXT_CHARS);
-        context.truncate(end);
-        context.push_str("\n...[truncated]");
+            Some(CuratorToolObservation {
+                tool_call_id: id.clone(),
+                tool_name: name.clone(),
+                arguments_json: args.clone(),
+                output_excerpt: trim_excerpt(content),
+                is_error: *is_error,
+            })
+        })
+        .collect::<Vec<_>>();
+
+    if observations.is_empty() {
+        return None;
     }
 
-    context
+    Some(CuratorStateDelta {
+        step,
+        phase,
+        objective: objective.to_string(),
+        observations,
+    })
 }
 
 /// Curator tool names — the subset of tools the curator is allowed to use.
@@ -130,25 +164,51 @@ pub const CURATOR_TOOL_NAMES: &[&str] = &[
     "think",
 ];
 
-/// Run the curator agent with the given step context.
-///
-/// Creates its own model instance and tool set, runs a mini agentic loop
-/// with restricted tools, and returns a summary of changes made.
+/// Legacy context entry point retained for migration and initialization flows.
 pub async fn run_curator(
     context: &str,
     config: &AgentConfig,
     cancel: CancellationToken,
 ) -> Result<CuratorResult, String> {
-    if context.is_empty() {
+    if context.trim().is_empty() {
         return Ok(CuratorResult {
-            summary: "No context to curate".into(),
+            summary: "No checkpoint deltas to curate".into(),
             files_changed: 0,
         });
     }
 
-    // Build model
-    let model = build_model(config).map_err(|e| e.to_string())?;
+    let checkpoint = CuratorCheckpoint {
+        boundary: "migration_context".to_string(),
+        deltas: vec![CuratorStateDelta {
+            step: 0,
+            phase: LoopPhase::Iterate,
+            objective: "workspace initialization wiki rewrite".to_string(),
+            observations: vec![CuratorToolObservation {
+                tool_call_id: "migration_context".to_string(),
+                tool_name: "workspace_init".to_string(),
+                arguments_json: "{}".to_string(),
+                output_excerpt: trim_excerpt(context),
+                is_error: false,
+            }],
+        }],
+    };
+    run_curator_checkpoint(&checkpoint, config, cancel).await
+}
+
+/// Run the curator agent with an explicit checkpoint payload.
+pub async fn run_curator_checkpoint(
+    checkpoint: &CuratorCheckpoint,
+    config: &AgentConfig,
+    cancel: CancellationToken,
+) -> Result<CuratorResult, String> {
+    if checkpoint.deltas.is_empty() {
+        return Ok(CuratorResult {
+            summary: "No checkpoint deltas to curate".into(),
+            files_changed: 0,
+        });
+    }
 
+    let model = build_model(config).map_err(|e| e.to_string())?;
     let provider = model.provider_name().to_string();
     let tool_defs = build_curator_tool_defs(&provider);
     let mut tools = WorkspaceTools::new_curator(config);
@@ -158,29 +218,28 @@ pub async fn run_curator(
             content: CURATOR_SYSTEM_PROMPT.to_string(),
         },
         Message::User {
-            content: context.to_string(),
+            content: serde_json::to_string_pretty(checkpoint)
+                .map_err(|e| format!("failed to serialize checkpoint: {e}"))?,
         },
     ];
 
-    let mut files_changed: u32 = 0;
-    let mut summary_parts: Vec<String> = Vec::new();
+    let mut touched_paths = BTreeSet::new();
+    let mut summary_parts = Vec::new();
 
-    // Mini agentic loop
-    for _step in 1..=MAX_CURATOR_STEPS {
+    for _ in 1..=MAX_CURATOR_STEPS {
         if cancel.is_cancelled() {
+            tools.cleanup();
             return Ok(CuratorResult {
                 summary: "Curator cancelled".into(),
-                files_changed,
+                files_changed: touched_paths.len() as u32,
             });
         }
 
-        // Call model (non-streaming — curator runs silently)
         let turn = model
             .chat(&messages, &tool_defs)
             .await
             .map_err(|e| e.to_string())?;
 
-        // Append assistant message
         let tool_calls_opt = if turn.tool_calls.is_empty() {
             None
         } else {
@@ -191,30 +250,29 @@ pub async fn run_curator(
             tool_calls: tool_calls_opt,
         });
 
-        // No tool calls → curator is done
         if turn.tool_calls.is_empty() {
-            if turn.text.contains("No wiki updates needed") {
+            if turn.text.trim() == "No wiki updates needed" {
+                tools.cleanup();
                 return Ok(CuratorResult {
                     summary: "No wiki updates needed".into(),
                     files_changed: 0,
                 });
             }
-            if !turn.text.is_empty() && summary_parts.is_empty() {
-                summary_parts.push(turn.text.clone());
+            if !turn.text.trim().is_empty() {
+                summary_parts.push(turn.text.trim().to_string());
             }
             break;
         }
 
-        // Execute tool calls
         for tc in &turn.tool_calls {
             if cancel.is_cancelled() {
+                tools.cleanup();
                 return Ok(CuratorResult {
                     summary: "Curator cancelled".into(),
-                    files_changed,
+                    files_changed: touched_paths.len() as u32,
                 });
             }
 
-            // Validate tool is in allowed set
             if !CURATOR_TOOL_NAMES.contains(&tc.name.as_str()) {
                 messages.push(Message::Tool {
                     tool_call_id: tc.id.clone(),
@@ -224,14 +282,10 @@ pub async fn run_curator(
             }
 
             let result = tools.execute(&tc.name, &tc.arguments).await;
-
-            // Track file modifications
             if matches!(tc.name.as_str(), "write_file" | "edit_file") && !result.is_error {
-                files_changed += 1;
-                // Extract path for summary
                 if let Ok(args) = serde_json::from_str::<serde_json::Value>(&tc.arguments) {
-                    if let Some(path) = args.get("path").and_then(|p| p.as_str()) {
-                        summary_parts.push(format!("Updated {}", path));
+                    if let Some(path) = args.get("path").and_then(|value| value.as_str()) {
+                        touched_paths.insert(path.to_string());
                     }
                 }
             }
@@ -245,6 +299,10 @@ pub async fn run_curator(
 
     tools.cleanup();
 
+    if !touched_paths.is_empty() {
+        summary_parts.push(format!("Updated {} wiki file(s)", touched_paths.len()));
+    }
+
     let summary = if summary_parts.is_empty() {
         "Curator completed with no changes".into()
     } else {
@@ -253,101 +311,44 @@ pub async fn run_curator(
 
     Ok(CuratorResult {
         summary,
-        files_changed,
+        files_changed: touched_paths.len() as u32,
     })
 }
 
 #[cfg(test)]
 mod tests {
     use super::*;
-    use crate::model::ToolCall;
-
-    #[test]
-    fn test_extract_step_context_empty() {
-        let messages: Vec<Message> = vec![];
-        assert_eq!(extract_step_context(&messages), "");
-    }
-
-    #[test]
-    fn test_extract_step_context_no_assistant() {
-        let messages = vec![
-            Message::System {
-                content: "sys".into(),
-            },
-            Message::User {
-                content: "hello".into(),
-            },
-        ];
-        assert_eq!(extract_step_context(&messages), "");
-    }
-
-    #[test]
-    fn test_extract_step_context_with_tool_calls() {
-        let messages = vec![
-            Message::System {
-                content: "sys".into(),
-            },
-            Message::User {
-                content: "investigate".into(),
-            },
-            Message::Assistant {
-                content: "I'll search for data.".into(),
-                tool_calls: Some(vec![ToolCall {
-                    id: "t1".into(),
-                    name: "web_search".into(),
-                    arguments: r#"{"query":"test"}"#.into(),
-                }]),
-            },
-            Message::Tool {
-                tool_call_id: "t1".into(),
-                content: "Search results here".into(),
-            },
-        ];
-        let ctx = extract_step_context(&messages);
-        assert!(ctx.contains("I'll search for data"));
-        assert!(ctx.contains("web_search"));
-        assert!(ctx.contains("Search results here"));
-    }
 
     #[test]
-    fn test_extract_step_context_truncation() {
-        let big_content = "x".repeat(MAX_CONTEXT_CHARS + 1000);
-        let messages = vec![Message::Assistant {
-            content: big_content,
-            tool_calls: None,
-        }];
-        let ctx = extract_step_context(&messages);
-        assert!(ctx.len() <= MAX_CONTEXT_CHARS + 50); // +50 for prefix/suffix
-        assert!(ctx.contains("[truncated]"));
+    fn test_build_state_delta_trims_tool_output() {
+        let tools = vec![(
+            "call-1".to_string(),
+            "read_file".to_string(),
+            "{\"path\":\"a.md\"}".to_string(),
+            "x".repeat(MAX_TOOL_OUTPUT_EXCERPT + 64),
+            false,
+        )];
+
+        let delta =
+            build_state_delta(3, LoopPhase::Investigate, "Investigate sources", &tools).unwrap();
+
+        assert_eq!(delta.step, 3);
+        assert_eq!(delta.phase, LoopPhase::Investigate);
+        assert_eq!(delta.observations.len(), 1);
+        assert!(delta.observations[0].output_excerpt.contains("[truncated]"));
     }
 
     #[test]
-    fn test_extract_step_context_last_assistant_only() {
-        let messages = vec![
-            Message::Assistant {
-                content: "old step".into(),
-                tool_calls: None,
-            },
-            Message::User {
-                content: "continue".into(),
-            },
-            Message::Assistant {
-                content: "new step".into(),
-                tool_calls: Some(vec![ToolCall {
-                    id: "t2".into(),
-                    name: "read_file".into(),
-                    arguments: "{}".into(),
-                }]),
-            },
-            Message::Tool {
-                tool_call_id: "t2".into(),
-                content: "file contents".into(),
-            },
-        ];
-        let ctx = extract_step_context(&messages);
-        assert!(!ctx.contains("old step"));
-        assert!(ctx.contains("new step"));
-        assert!(ctx.contains("file contents"));
+    fn test_build_state_delta_skips_empty_success_observations() {
+        let tools = vec![(
+            "call-1".to_string(),
+            "read_file".to_string(),
+            "{}".to_string(),
+            String::new(),
+            false,
+        )];
+
+        assert!(build_state_delta(1, LoopPhase::Investigate, "Investigate", &tools).is_none());
     }
 
     #[test]
diff --git a/openplanter-desktop/crates/op-core/src/engine/mod.rs b/openplanter-desktop/crates/op-core/src/engine/mod.rs
index 9dc2f3e4..4f8b62f3 100644
--- a/openplanter-desktop/crates/op-core/src/engine/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/mod.rs
@@ -13,8 +13,6 @@ use std::time::Duration;
 use anyhow::anyhow;
 use chrono::Utc;
 use serde_json::{Map, Value};
-use tokio::sync::mpsc;
-use tokio::task::JoinHandle;
 use tokio_util::sync::CancellationToken;
 
 use crate::builder::build_model;
@@ -25,7 +23,9 @@ use crate::prompts::build_system_prompt;
 use crate::tools::WorkspaceTools;
 use crate::tools::defs::build_tool_defs;
 
-use self::curator::{CuratorResult, extract_step_context, run_curator};
+use self::curator::{
+    CuratorCheckpoint, CuratorStateDelta, build_state_delta, run_curator_checkpoint,
+};
 
 #[derive(Debug, Clone, Default)]
 pub struct SolveInitialContext {
@@ -34,179 +34,71 @@ pub struct SolveInitialContext {
     pub question_reasoning_packet: Option<Value>,
 }
 
-/// Outcome from a background curator task (success or error).
-enum CuratorOutcome {
-    Done(CuratorResult),
-    Error(String),
-}
-
-fn spawn_curator_task(
-    context: String,
-    tx: mpsc::UnboundedSender<CuratorOutcome>,
-    config: AgentConfig,
-    cancel: CancellationToken,
-) -> JoinHandle<()> {
-    tokio::spawn(async move {
-        let outcome = match run_curator(&context, &config, cancel).await {
-            Ok(result) => CuratorOutcome::Done(result),
-            Err(err) => CuratorOutcome::Error(err),
-        };
-        let _ = tx.send(outcome);
-    })
-}
-
-fn schedule_curator_context(
-    has_running_curator: bool,
-    queued_context: &mut Option<String>,
-    context: String,
-) -> Option<String> {
-    if has_running_curator {
-        *queued_context = Some(context);
-        None
-    } else {
-        Some(context)
-    }
-}
+fn take_curator_phase_checkpoint(
+    pending_deltas: &mut Vec<CuratorStateDelta>,
+    active_phase: &mut Option<LoopPhase>,
+    next_phase: LoopPhase,
+) -> Option<CuratorCheckpoint> {
+    let checkpoint = match active_phase.as_ref() {
+        Some(previous_phase) if previous_phase != &next_phase && !pending_deltas.is_empty() => {
+            Some(CuratorCheckpoint {
+                boundary: format!("phase_transition:{previous_phase:?}->{next_phase:?}"),
+                deltas: std::mem::take(pending_deltas),
+            })
+        }
+        _ => None,
+    };
 
-fn take_queued_context_if_idle(
-    has_running_curator: bool,
-    queued_context: &mut Option<String>,
-) -> Option<String> {
-    if has_running_curator {
-        None
-    } else {
-        queued_context.take()
-    }
+    *active_phase = Some(next_phase);
+    checkpoint
 }
 
-/// Abort any active curator and clear pending work.
-fn abort_curators(running: &mut Option<JoinHandle<()>>, queued_context: &mut Option<String>) {
-    queued_context.take();
-    if let Some(handle) = running.take() {
-        handle.abort();
+fn take_pending_curator_checkpoint(
+    pending_deltas: &mut Vec<CuratorStateDelta>,
+    boundary: &str,
+) -> Option<CuratorCheckpoint> {
+    if pending_deltas.is_empty() {
+        return None;
     }
-}
 
-/// Drain completed curator results from the channel, inject system messages
-/// and emit events for any that changed files.
-fn drain_curator_results(
-    rx: &mut mpsc::UnboundedReceiver<CuratorOutcome>,
-    messages: &mut Vec<Message>,
-    emitter: &dyn SolveEmitter,
-) {
-    while let Ok(outcome) = rx.try_recv() {
-        match outcome {
-            CuratorOutcome::Done(result) => {
-                if result.files_changed > 0 {
-                    emitter.emit_trace(&format!(
-                        "[curator] wiki updated: {} ({} files)",
-                        result.summary, result.files_changed
-                    ));
-                    messages.push(Message::System {
-                        content: format!("[Wiki Curator] {}", result.summary),
-                    });
-                    emitter.emit_curator_update(&result.summary, result.files_changed);
-                }
-            }
-            CuratorOutcome::Error(e) => {
-                emitter.emit_trace(&format!("[curator] error: {e}"));
-            }
-        }
-    }
+    Some(CuratorCheckpoint {
+        boundary: boundary.to_string(),
+        deltas: std::mem::take(pending_deltas),
+    })
 }
 
-/// Wait for in-flight curators (up to timeout), drain final results, abort rest.
-async fn finish_curators(
-    running: &mut Option<JoinHandle<()>>,
-    queued_context: &mut Option<String>,
-    tx: &mpsc::UnboundedSender<CuratorOutcome>,
+async fn emit_curator_checkpoint(
+    checkpoint: CuratorCheckpoint,
     config: &AgentConfig,
     cancel: &CancellationToken,
-    rx: &mut mpsc::UnboundedReceiver<CuratorOutcome>,
-    messages: &mut Vec<Message>,
     emitter: &dyn SolveEmitter,
 ) {
-    if running.is_none() && queued_context.is_none() {
-        return;
-    }
     emitter.emit_trace(&format!(
-        "[curator] waiting for {} pending curator task(s)...",
-        usize::from(running.is_some()) + usize::from(queued_context.is_some())
+        "[curator] synthesizing checkpoint at {} ({} deltas)",
+        checkpoint.boundary,
+        checkpoint.deltas.len()
     ));
 
-    // Wait up to 30 seconds total for all curators to finish
-    let deadline = tokio::time::Instant::now() + std::time::Duration::from_secs(30);
-    loop {
-        if running.is_none() {
-            if let Some(context) = take_queued_context_if_idle(false, queued_context) {
-                emitter.emit_trace("[curator] spawning queued update");
-                *running = Some(spawn_curator_task(
-                    context,
-                    tx.clone(),
-                    config.clone(),
-                    cancel.clone(),
-                ));
-            } else {
-                break;
-            }
-        }
-
-        let remaining = deadline.saturating_duration_since(tokio::time::Instant::now());
-        if remaining.is_zero() {
-            break;
+    match run_curator_checkpoint(&checkpoint, config, cancel.clone()).await {
+        Ok(result) if result.files_changed > 0 => {
+            emitter.emit_trace(&format!(
+                "[curator] wiki updated: {} ({} files)",
+                result.summary, result.files_changed
+            ));
+            emitter.emit_curator_update(&result.summary, result.files_changed);
         }
-
-        if let Some(mut handle) = running.take() {
-            match tokio::time::timeout(remaining, &mut handle).await {
-                Ok(_) => {
-                    drain_curator_results(rx, messages, emitter);
-                }
-                Err(_) => {
-                    *running = Some(handle);
-                    break;
-                }
-            }
+        Ok(_) => {
+            emitter.emit_trace(&format!(
+                "[curator] no net wiki updates at {}",
+                checkpoint.boundary
+            ));
         }
-    }
-
-    // Final drain
-    drain_curator_results(rx, messages, emitter);
-
-    // Abort any still running
-    abort_curators(running, queued_context);
-}
-
-async fn poll_curator_state(
-    running: &mut Option<JoinHandle<()>>,
-    queued_context: &mut Option<String>,
-    tx: &mpsc::UnboundedSender<CuratorOutcome>,
-    config: &AgentConfig,
-    cancel: &CancellationToken,
-    rx: &mut mpsc::UnboundedReceiver<CuratorOutcome>,
-    messages: &mut Vec<Message>,
-    emitter: &dyn SolveEmitter,
-) {
-    drain_curator_results(rx, messages, emitter);
-
-    let should_join = running
-        .as_ref()
-        .map(|handle| handle.is_finished())
-        .unwrap_or(false);
-    if should_join {
-        if let Some(mut handle) = running.take() {
-            let _ = (&mut handle).await;
+        Err(err) => {
+            emitter.emit_trace(&format!(
+                "[curator] checkpoint {} error: {err}",
+                checkpoint.boundary
+            ));
         }
-        drain_curator_results(rx, messages, emitter);
-    }
-
-    if let Some(context) = take_queued_context_if_idle(running.is_some(), queued_context) {
-        emitter.emit_trace("[curator] spawning queued update");
-        *running = Some(spawn_curator_task(
-            context,
-            tx.clone(),
-            config.clone(),
-            cancel.clone(),
-        ));
     }
 }
 
@@ -229,7 +121,7 @@ pub trait SolveEmitter: Send + Sync {
         _is_final: bool,
     ) {
     }
-    /// Called when a background curator finishes updating wiki files.
+    /// Called when a checkpointed curator finishes updating wiki files.
     /// Default no-op — override in TauriEmitter/LoggingEmitter.
     fn emit_curator_update(&self, _summary: &str, _files_changed: u32) {}
 }
@@ -678,33 +570,17 @@ pub async fn solve_with_initial_context(
     let max_steps = config.max_steps_per_call as usize;
     let mut loop_metrics = LoopMetrics::default();
     let mut last_guardrail_streak = 0u32;
-
-    // 3. Background curator channel
-    let (curator_tx, mut curator_rx) = mpsc::unbounded_channel::<CuratorOutcome>();
-    let mut running_curator: Option<JoinHandle<()>> = None;
-    let mut queued_curator_context: Option<String> = None;
+    let mut active_curator_phase: Option<LoopPhase> = None;
+    let mut pending_curator_deltas: Vec<CuratorStateDelta> = Vec::new();
 
     // 4. Agentic loop
     for step in 1..=max_steps {
         if cancel.is_cancelled() {
             emitter.emit_error("Cancelled");
             tools.cleanup();
-            abort_curators(&mut running_curator, &mut queued_curator_context);
             return;
         }
 
-        poll_curator_state(
-            &mut running_curator,
-            &mut queued_curator_context,
-            &curator_tx,
-            config,
-            &cancel,
-            &mut curator_rx,
-            &mut messages,
-            emitter,
-        )
-        .await;
-
         let step_start = std::time::Instant::now();
 
         // Compact context if it's grown too large (~100k token budget)
@@ -727,7 +603,6 @@ pub async fn solve_with_initial_context(
             Err(e) => {
                 let msg = e.to_string();
                 tools.cleanup();
-                abort_curators(&mut running_curator, &mut queued_curator_context);
                 if msg == "Cancelled" {
                     emitter.emit_error("Cancelled");
                 } else {
@@ -790,51 +665,66 @@ pub async fn solve_with_initial_context(
                 loop_metrics: Some(loop_metrics.clone()),
             });
             emitter.emit_complete(&turn.text, Some(loop_metrics.clone()));
+            if let Some(checkpoint) =
+                take_pending_curator_checkpoint(&mut pending_curator_deltas, "finalize")
+            {
+                emit_curator_checkpoint(checkpoint, config, &cancel, emitter).await;
+            }
             tools.cleanup();
-            // Wait for in-flight curators before exiting
-            finish_curators(
-                &mut running_curator,
-                &mut queued_curator_context,
-                &curator_tx,
-                config,
-                &cancel,
-                &mut curator_rx,
-                &mut messages,
-                emitter,
-            )
-            .await;
             return;
         }
 
         loop_metrics.tool_calls += turn.tool_calls.len() as u32;
 
         // Execute each tool call and collect results
+        let mut tool_observations: Vec<(String, String, String, String, bool)> = Vec::new();
         for tc in &turn.tool_calls {
             if cancel.is_cancelled() {
                 emitter.emit_error("Cancelled");
                 tools.cleanup();
-                abort_curators(&mut running_curator, &mut queued_curator_context);
                 return;
             }
 
             emitter.emit_trace(&format!("Executing tool: {} ({})", tc.name, tc.id));
             let result = tools.execute(&tc.name, &tc.arguments).await;
+            let result_content = result.content;
+            let result_is_error = result.is_error;
 
-            if result.is_error {
+            if result_is_error {
                 emitter.emit_trace(&format!(
                     "Tool {} error: {}",
                     tc.name,
-                    safe_prefix(&result.content, 200)
+                    safe_prefix(&result_content, 200)
                 ));
             }
 
             messages.push(Message::Tool {
                 tool_call_id: tc.id.clone(),
-                content: result.content,
+                content: result_content.clone(),
             });
+            tool_observations.push((
+                tc.id.clone(),
+                tc.name.clone(),
+                tc.arguments.clone(),
+                result_content,
+                result_is_error,
+            ));
         }
 
         let phase = classify_loop_phase(&turn.tool_calls, false);
+        if let Some(checkpoint) = take_curator_phase_checkpoint(
+            &mut pending_curator_deltas,
+            &mut active_curator_phase,
+            phase.clone(),
+        ) {
+            emit_curator_checkpoint(checkpoint, config, &cancel, emitter).await;
+        }
+
+        if let Some(delta) =
+            build_state_delta(step as u32, phase.clone(), objective, &tool_observations)
+        {
+            pending_curator_deltas.push(delta);
+        }
         if matches!(phase, LoopPhase::Investigate) {
             loop_metrics.recon_streak += 1;
         } else {
@@ -875,26 +765,6 @@ pub async fn solve_with_initial_context(
             loop_metrics: Some(loop_metrics.clone()),
         });
 
-        // Spawn background curator after each non-final step
-        let context = extract_step_context(&messages);
-        if !context.is_empty() {
-            if let Some(context_to_spawn) = schedule_curator_context(
-                running_curator.is_some(),
-                &mut queued_curator_context,
-                context,
-            ) {
-                emitter.emit_trace(&format!("[curator] spawning for step {step}"));
-                running_curator = Some(spawn_curator_task(
-                    context_to_spawn,
-                    curator_tx.clone(),
-                    config.clone(),
-                    cancel.clone(),
-                ));
-            } else {
-                emitter.emit_trace(&format!("[curator] queued latest refresh from step {step}"));
-            }
-        }
-
         // Budget warnings
         let remaining = max_steps - step;
         if remaining == max_steps / 2 {
@@ -910,17 +780,11 @@ pub async fn solve_with_initial_context(
 
     // Budget exhausted
     tools.cleanup();
-    finish_curators(
-        &mut running_curator,
-        &mut queued_curator_context,
-        &curator_tx,
-        config,
-        &cancel,
-        &mut curator_rx,
-        &mut messages,
-        emitter,
-    )
-    .await;
+    if let Some(checkpoint) =
+        take_pending_curator_checkpoint(&mut pending_curator_deltas, "budget_exhausted")
+    {
+        emit_curator_checkpoint(checkpoint, config, &cancel, emitter).await;
+    }
     emitter.emit_error(&format!(
         "Step budget exhausted after {max_steps} steps. \
          The model did not produce a final answer within the allowed steps."
@@ -1190,44 +1054,48 @@ mod tests {
     }
 
     #[test]
-    fn test_schedule_curator_context_spawns_when_idle() {
-        let mut queued = None;
-        let spawn = schedule_curator_context(false, &mut queued, "ctx-1".to_string());
-        assert_eq!(spawn, Some("ctx-1".to_string()));
-        assert!(queued.is_none());
+    fn test_take_curator_phase_checkpoint_flushes_previous_phase_only() {
+        let mut pending = vec![CuratorStateDelta {
+            step: 1,
+            phase: LoopPhase::Investigate,
+            objective: "Investigate sources".to_string(),
+            observations: vec![crate::engine::curator::CuratorToolObservation {
+                tool_call_id: "call-1".to_string(),
+                tool_name: "read_file".to_string(),
+                arguments_json: "{}".to_string(),
+                output_excerpt: "source details".to_string(),
+                is_error: false,
+            }],
+        }];
+        let mut active_phase = Some(LoopPhase::Investigate);
+
+        let checkpoint =
+            take_curator_phase_checkpoint(&mut pending, &mut active_phase, LoopPhase::Build)
+                .expect("phase transition should flush checkpoint");
+
+        assert_eq!(checkpoint.boundary, "phase_transition:Investigate->Build");
+        assert_eq!(checkpoint.deltas.len(), 1);
+        assert_eq!(checkpoint.deltas[0].phase, LoopPhase::Investigate);
+        assert!(pending.is_empty());
+        assert_eq!(active_phase, Some(LoopPhase::Build));
     }
 
     #[test]
-    fn test_schedule_curator_context_keeps_latest_when_busy() {
-        let mut queued = Some("older".to_string());
-        let spawn = schedule_curator_context(true, &mut queued, "newer".to_string());
-        assert!(spawn.is_none());
-        assert_eq!(queued, Some("newer".to_string()));
-    }
+    fn test_take_curator_phase_checkpoint_initializes_without_flush() {
+        let mut pending = Vec::new();
+        let mut active_phase = None;
 
-    #[test]
-    fn test_take_queued_context_if_idle_only_releases_when_idle() {
-        let mut queued = Some("latest".to_string());
-        assert_eq!(take_queued_context_if_idle(true, &mut queued), None);
-        assert_eq!(queued, Some("latest".to_string()));
-        assert_eq!(
-            take_queued_context_if_idle(false, &mut queued),
-            Some("latest".to_string())
-        );
-        assert!(queued.is_none());
-    }
-
-    #[tokio::test]
-    async fn test_abort_curators_clears_running_and_queue() {
-        let mut running = Some(tokio::spawn(async {
-            tokio::time::sleep(std::time::Duration::from_secs(30)).await;
-        }));
-        let mut queued = Some("queued".to_string());
+        let checkpoint =
+            take_curator_phase_checkpoint(&mut pending, &mut active_phase, LoopPhase::Investigate);
 
-        abort_curators(&mut running, &mut queued);
+        assert!(checkpoint.is_none());
+        assert_eq!(active_phase, Some(LoopPhase::Investigate));
+    }
 
-        assert!(running.is_none());
-        assert!(queued.is_none());
+    #[test]
+    fn test_take_pending_curator_checkpoint_returns_none_when_empty() {
+        let mut pending = Vec::new();
+        assert!(take_pending_curator_checkpoint(&mut pending, "finalize").is_none());
     }
 
     #[test]
diff --git a/openplanter-desktop/crates/op-core/src/events.rs b/openplanter-desktop/crates/op-core/src/events.rs
index a5c8a834..d0e89fe6 100644
--- a/openplanter-desktop/crates/op-core/src/events.rs
+++ b/openplanter-desktop/crates/op-core/src/events.rs
@@ -99,7 +99,7 @@ pub struct ErrorEvent {
     pub message: String,
 }
 
-/// Background wiki curator completed an update.
+/// Checkpointed wiki curator completed an update.
 #[derive(Debug, Clone, Serialize, Deserialize)]
 pub struct CuratorUpdateEvent {
     pub summary: String,
diff --git a/openplanter-desktop/crates/op-core/src/prompts.rs b/openplanter-desktop/crates/op-core/src/prompts.rs
index 2cdd5962..ba3874fc 100644
--- a/openplanter-desktop/crates/op-core/src/prompts.rs
+++ b/openplanter-desktop/crates/op-core/src/prompts.rs
@@ -280,9 +280,14 @@ Read .openplanter/wiki/index.md at the start of any investigation to see what
 data sources are documented. Each entry describes access methods, schemas,
 coverage, and cross-reference potential.
 
-When you discover new information about a data source — updated URLs, new fields,
-cross-reference joins, data quality issues, or entirely new sources — update the
-relevant entry or create a new one using .openplanter/wiki/template.md.
+Treat the wiki as a derived knowledge surface, not your primary memory store.
+Primary continuity comes from {session_dir}/investigation_state.json and explicit
+evidence/provenance IDs.
+
+When you discover durable, non-duplicative information about a data source —
+updated URLs, new fields, cross-reference joins, data quality issues, or
+entirely new sources — update the relevant entry or create a new one using
+.openplanter/wiki/template.md. Avoid noisy repeat edits that do not add facts.
 
 === MANDATORY WIKI INDEXING ===
 For EVERY investigation, you MUST maintain the wiki as a living knowledge map:
diff --git a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
index a22cf1da..33a208af 100644
--- a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
+++ b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
@@ -1412,7 +1412,7 @@ async fn test_solve_rejects_meta_final_until_concrete_completion() {
 #[tokio::test]
 async fn test_solve_allows_structural_meta_for_plan_objectives() {
     use op_core::config::AgentConfig;
-    use op_core::engine::{solve, SolveEmitter};
+    use op_core::engine::{SolveEmitter, solve};
     use op_core::events::{LoopMetrics, StepEvent};
 
     let addr = start_stateful_mock_server(vec![ANTHROPIC_SSE_META_FINAL]).await;
@@ -1477,7 +1477,13 @@ async fn test_solve_allows_structural_meta_for_plan_objectives() {
     };
 
     let cancel = CancellationToken::new();
-    solve("Write a plan for finishing the task", &cfg, &emitter, cancel).await;
+    solve(
+        "Write a plan for finishing the task",
+        &cfg,
+        &emitter,
+        cancel,
+    )
+    .await;
 
     let recorded = events.lock().unwrap().clone();
     assert!(
@@ -1505,7 +1511,7 @@ async fn test_solve_allows_structural_meta_for_plan_objectives() {
 #[tokio::test]
 async fn test_solve_rejects_process_meta_even_for_plan_objectives() {
     use op_core::config::AgentConfig;
-    use op_core::engine::{solve, SolveEmitter};
+    use op_core::engine::{SolveEmitter, solve};
     use op_core::events::{LoopMetrics, StepEvent};
 
     let addr = start_stateful_mock_server(vec![
@@ -1574,7 +1580,13 @@ async fn test_solve_rejects_process_meta_even_for_plan_objectives() {
     };
 
     let cancel = CancellationToken::new();
-    solve("Write a plan for finishing the task", &cfg, &emitter, cancel).await;
+    solve(
+        "Write a plan for finishing the task",
+        &cfg,
+        &emitter,
+        cancel,
+    )
+    .await;
 
     let recorded = events.lock().unwrap().clone();
     assert!(
diff --git a/openplanter-desktop/frontend/src/main.ts b/openplanter-desktop/frontend/src/main.ts
index c5b61f9a..271954c4 100644
--- a/openplanter-desktop/frontend/src/main.ts
+++ b/openplanter-desktop/frontend/src/main.ts
@@ -118,9 +118,7 @@ async function init() {
     }));
 
     // Dispatch to ChatPane for rich step summary rendering
-    window.dispatchEvent(
-      new CustomEvent("agent-step", { detail: event })
-    );
+    window.dispatchEvent(new CustomEvent("agent-step", { detail: event }));
   });
 
   await onAgentDelta((event) => {
@@ -179,25 +177,11 @@ async function init() {
     window.dispatchEvent(detail);
   });
 
-  await onCuratorUpdate((event) => {
-    appState.update((s) => ({
-      ...s,
-      messages: [
-        ...s.messages,
-        {
-          id: crypto.randomUUID(),
-          role: "system" as const,
-          content: `[Wiki Curator] ${event.summary}`,
-          timestamp: Date.now(),
-        },
-      ],
-    }));
-
+  await onCuratorUpdate(() => {
     // Notify graph pane to refresh with curator's wiki changes
     window.dispatchEvent(new CustomEvent("curator-done"));
   });
 
-
   await onLoopHealth((event) => {
     appState.update((s) => ({
       ...s,
@@ -222,7 +206,7 @@ function processQueue() {
     appState.update((s) => ({ ...s, inputQueue: rest }));
     // Dispatch queued-submit event for InputBar to pick up
     window.dispatchEvent(
-      new CustomEvent("queued-submit", { detail: { text: next } })
+      new CustomEvent("queued-submit", { detail: { text: next } }),
     );
   }
 }

From 6a79a3fbb7a4cbb4581af6ccbd046a004442a99e Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Sat, 14 Mar 2026 10:31:46 -0400
Subject: [PATCH 30/58] Patch pre-stage-9 runtime and repo-readiness gaps

---
 agent/runtime.py                              |  81 +++-
 .../crates/op-core/src/engine/mod.rs          |  65 +++-
 .../op-core/tests/test_model_streaming.rs     | 367 ++++++++++++++++++
 pyproject.toml                                |   3 +
 tests/test_session.py                         | 148 +++++++
 uv.lock                                       | 156 ++++++++
 6 files changed, 788 insertions(+), 32 deletions(-)

diff --git a/agent/runtime.py b/agent/runtime.py
index 0a8d867c..7282bc5f 100644
--- a/agent/runtime.py
+++ b/agent/runtime.py
@@ -4,7 +4,7 @@
 import re
 import secrets
 import shutil
-from dataclasses import dataclass
+from dataclasses import dataclass, field
 from datetime import datetime, timezone
 from pathlib import Path
 from typing import Any, Callable
@@ -58,6 +58,7 @@ def _has_reasoning_content(packet: dict[str, Any]) -> bool:
 class SessionStore:
     workspace: Path
     session_root_dir: str = ".openplanter"
+    _warnings: list[str] = field(default_factory=list, init=False, repr=False)
 
     def __post_init__(self) -> None:
         self.workspace = self.workspace.expanduser().resolve()
@@ -158,16 +159,37 @@ def open_session(
         state = self.load_state(sid)
         return sid, state, created_new
 
+    def _warn(self, message: str) -> None:
+        self._warnings.append(message)
+
+    def drain_warnings(self) -> list[str]:
+        warnings = list(self._warnings)
+        self._warnings.clear()
+        return warnings
+
+    def _try_load_investigation_state(
+        self,
+        investigation_path: Path,
+        *,
+        on_invalid: str,
+    ) -> dict[str, Any] | None:
+        try:
+            return load_investigation_state(investigation_path)
+        except json.JSONDecodeError:
+            self._warn(
+                f"Session investigation state is invalid JSON: {investigation_path}; {on_invalid}."
+            )
+            return None
+
     def load_state(self, session_id: str) -> dict[str, Any]:
         investigation_path = self._investigation_state_path(session_id)
         if investigation_path.exists():
-            try:
-                typed_state = load_investigation_state(investigation_path)
-            except json.JSONDecodeError as exc:
-                raise SessionError(
-                    f"Session investigation state is invalid JSON: {investigation_path}"
-                ) from exc
-            return state_to_legacy_projection(typed_state, session_id=session_id)
+            typed_state = self._try_load_investigation_state(
+                investigation_path,
+                on_invalid="falling back to legacy state",
+            )
+            if typed_state is not None:
+                return state_to_legacy_projection(typed_state, session_id=session_id)
 
         state_path = self._state_path(session_id)
         if not state_path.exists():
@@ -187,12 +209,12 @@ def load_state(self, session_id: str) -> dict[str, Any]:
     def load_typed_state(self, session_id: str) -> dict[str, Any]:
         investigation_path = self._investigation_state_path(session_id)
         if investigation_path.exists():
-            try:
-                return load_investigation_state(investigation_path)
-            except json.JSONDecodeError as exc:
-                raise SessionError(
-                    f"Session investigation state is invalid JSON: {investigation_path}"
-                ) from exc
+            typed_state = self._try_load_investigation_state(
+                investigation_path,
+                on_invalid="continuing without typed reasoning state",
+            )
+            if typed_state is not None:
+                return typed_state
 
         state_path = self._state_path(session_id)
         if not state_path.exists():
@@ -212,12 +234,13 @@ def save_state(self, session_id: str, state: dict[str, Any]) -> None:
 
         investigation_path = self._investigation_state_path(session_id)
         if investigation_path.exists():
-            try:
-                typed_state = load_investigation_state(investigation_path)
-            except json.JSONDecodeError as exc:
-                raise SessionError(
-                    f"Session investigation state is invalid JSON: {investigation_path}"
-                ) from exc
+            typed_state = self._try_load_investigation_state(
+                investigation_path,
+                on_invalid="preserving the corrupt typed state file and writing legacy state only",
+            )
+            if typed_state is None:
+                self._touch_metadata(session_id)
+                return
         else:
             typed_state = migrate_legacy_state(session_id=session_id, legacy_state=normalized_legacy)
 
@@ -323,6 +346,20 @@ class SessionRuntime:
     max_turn_summaries: int = 50
     loop_metrics: dict[str, Any] | None = None
 
+    def _flush_store_warnings(self, emit: EventCallback | None = None) -> None:
+        for message in self.store.drain_warnings():
+            if emit is not None:
+                emit(message)
+                continue
+            try:
+                self.store.append_event(
+                    self.session_id,
+                    "trace",
+                    {"message": message},
+                )
+            except OSError:
+                pass
+
     @classmethod
     def bootstrap(
         cls,
@@ -391,10 +428,12 @@ def bootstrap(
             )
         except OSError:
             pass
+        runtime._flush_store_warnings()
         try:
             runtime._persist_state()
         except OSError:
             pass
+        runtime._flush_store_warnings()
         return runtime
 
     def solve(
@@ -471,6 +510,7 @@ def _combined_on_step(step_event: dict[str, Any]) -> None:
         replay_seq_start = replay_logger.current_seq
 
         typed_state = self.store.load_typed_state(self.session_id)
+        self._flush_store_warnings(_on_event)
         question_reasoning_packet = build_question_reasoning_packet(typed_state)
         if not _has_reasoning_content(question_reasoning_packet):
             question_reasoning_packet = None
@@ -545,6 +585,7 @@ def _combined_on_step(step_event: dict[str, Any]) -> None:
             self._persist_state()
         except OSError:
             pass
+        self._flush_store_warnings(_on_event)
         return result
 
     def _persist_state(self) -> None:
diff --git a/openplanter-desktop/crates/op-core/src/engine/mod.rs b/openplanter-desktop/crates/op-core/src/engine/mod.rs
index 4f8b62f3..d6ba5f1b 100644
--- a/openplanter-desktop/crates/op-core/src/engine/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/mod.rs
@@ -102,6 +102,18 @@ async fn emit_curator_checkpoint(
     }
 }
 
+async fn flush_pending_curator_checkpoint(
+    pending_deltas: &mut Vec<CuratorStateDelta>,
+    boundary: &str,
+    config: &AgentConfig,
+    emitter: &dyn SolveEmitter,
+) {
+    if let Some(checkpoint) = take_pending_curator_checkpoint(pending_deltas, boundary) {
+        let checkpoint_cancel = CancellationToken::new();
+        emit_curator_checkpoint(checkpoint, config, &checkpoint_cancel, emitter).await;
+    }
+}
+
 // Abstraction for emitting solve events.
 //
 // Implemented by TauriEmitter (op-tauri) for real event emission
@@ -576,8 +588,15 @@ pub async fn solve_with_initial_context(
     // 4. Agentic loop
     for step in 1..=max_steps {
         if cancel.is_cancelled() {
-            emitter.emit_error("Cancelled");
             tools.cleanup();
+            flush_pending_curator_checkpoint(
+                &mut pending_curator_deltas,
+                "cancelled",
+                config,
+                emitter,
+            )
+            .await;
+            emitter.emit_error("Cancelled");
             return;
         }
 
@@ -603,6 +622,17 @@ pub async fn solve_with_initial_context(
             Err(e) => {
                 let msg = e.to_string();
                 tools.cleanup();
+                flush_pending_curator_checkpoint(
+                    &mut pending_curator_deltas,
+                    if msg == "Cancelled" {
+                        "cancelled"
+                    } else {
+                        "model_error"
+                    },
+                    config,
+                    emitter,
+                )
+                .await;
                 if msg == "Cancelled" {
                     emitter.emit_error("Cancelled");
                 } else {
@@ -664,12 +694,14 @@ pub async fn solve_with_initial_context(
                 loop_phase: Some(phase),
                 loop_metrics: Some(loop_metrics.clone()),
             });
+            flush_pending_curator_checkpoint(
+                &mut pending_curator_deltas,
+                "finalize",
+                config,
+                emitter,
+            )
+            .await;
             emitter.emit_complete(&turn.text, Some(loop_metrics.clone()));
-            if let Some(checkpoint) =
-                take_pending_curator_checkpoint(&mut pending_curator_deltas, "finalize")
-            {
-                emit_curator_checkpoint(checkpoint, config, &cancel, emitter).await;
-            }
             tools.cleanup();
             return;
         }
@@ -680,8 +712,15 @@ pub async fn solve_with_initial_context(
         let mut tool_observations: Vec<(String, String, String, String, bool)> = Vec::new();
         for tc in &turn.tool_calls {
             if cancel.is_cancelled() {
-                emitter.emit_error("Cancelled");
                 tools.cleanup();
+                flush_pending_curator_checkpoint(
+                    &mut pending_curator_deltas,
+                    "cancelled",
+                    config,
+                    emitter,
+                )
+                .await;
+                emitter.emit_error("Cancelled");
                 return;
             }
 
@@ -780,11 +819,13 @@ pub async fn solve_with_initial_context(
 
     // Budget exhausted
     tools.cleanup();
-    if let Some(checkpoint) =
-        take_pending_curator_checkpoint(&mut pending_curator_deltas, "budget_exhausted")
-    {
-        emit_curator_checkpoint(checkpoint, config, &cancel, emitter).await;
-    }
+    flush_pending_curator_checkpoint(
+        &mut pending_curator_deltas,
+        "budget_exhausted",
+        config,
+        emitter,
+    )
+    .await;
     emitter.emit_error(&format!(
         "Step budget exhausted after {max_steps} steps. \
          The model did not produce a final answer within the allowed steps."
diff --git a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
index 33a208af..5e02d0ee 100644
--- a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
+++ b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
@@ -1040,6 +1040,20 @@ event: content_block_stop\ndata: {\"type\":\"content_block_stop\",\"index\":1}\n
 event: message_delta\ndata: {\"type\":\"message_delta\",\"delta\":{\"stop_reason\":\"tool_use\"},\"usage\":{\"output_tokens\":12}}\n\n\
 event: message_stop\ndata: {\"type\":\"message_stop\"}\n\n";
 
+const ANTHROPIC_SSE_TWO_TOOL_LIST: &str = "\
+event: message_start\ndata: {\"type\":\"message_start\",\"message\":{\"id\":\"msg_loop_multi\",\"type\":\"message\",\"role\":\"assistant\",\"content\":[],\"usage\":{\"input_tokens\":60}}}\n\n\
+event: content_block_start\ndata: {\"type\":\"content_block_start\",\"index\":0,\"content_block\":{\"type\":\"text\",\"text\":\"\"}}\n\n\
+event: content_block_delta\ndata: {\"type\":\"content_block_delta\",\"index\":0,\"delta\":{\"type\":\"text_delta\",\"text\":\"Let me inspect that twice.\"}}\n\n\
+event: content_block_stop\ndata: {\"type\":\"content_block_stop\",\"index\":0}\n\n\
+event: content_block_start\ndata: {\"type\":\"content_block_start\",\"index\":1,\"content_block\":{\"type\":\"tool_use\",\"id\":\"toolu_loop_multi_1\",\"name\":\"list_files\",\"input\":{}}}\n\n\
+event: content_block_delta\ndata: {\"type\":\"content_block_delta\",\"index\":1,\"delta\":{\"type\":\"input_json_delta\",\"partial_json\":\"{}\"}}\n\n\
+event: content_block_stop\ndata: {\"type\":\"content_block_stop\",\"index\":1}\n\n\
+event: content_block_start\ndata: {\"type\":\"content_block_start\",\"index\":2,\"content_block\":{\"type\":\"tool_use\",\"id\":\"toolu_loop_multi_2\",\"name\":\"list_files\",\"input\":{}}}\n\n\
+event: content_block_delta\ndata: {\"type\":\"content_block_delta\",\"index\":2,\"delta\":{\"type\":\"input_json_delta\",\"partial_json\":\"{}\"}}\n\n\
+event: content_block_stop\ndata: {\"type\":\"content_block_stop\",\"index\":2}\n\n\
+event: message_delta\ndata: {\"type\":\"message_delta\",\"delta\":{\"stop_reason\":\"tool_use\"},\"usage\":{\"output_tokens\":18}}\n\n\
+event: message_stop\ndata: {\"type\":\"message_stop\"}\n\n";
+
 /// SSE body for the follow-up Anthropic response (final text answer after tool result).
 const ANTHROPIC_SSE_FINAL_ANSWER: &str = "\
 event: message_start\ndata: {\"type\":\"message_start\",\"message\":{\"id\":\"msg_loop2\",\"type\":\"message\",\"role\":\"assistant\",\"content\":[],\"usage\":{\"input_tokens\":80}}}\n\n\
@@ -1049,6 +1063,14 @@ event: content_block_stop\ndata: {\"type\":\"content_block_stop\",\"index\":0}\n
 event: message_delta\ndata: {\"type\":\"message_delta\",\"delta\":{\"stop_reason\":\"end_turn\"},\"usage\":{\"output_tokens\":10}}\n\n\
 event: message_stop\ndata: {\"type\":\"message_stop\"}\n\n";
 
+const ANTHROPIC_SSE_CURATOR_NOOP: &str = "\
+event: message_start\ndata: {\"type\":\"message_start\",\"message\":{\"id\":\"msg_curator_1\",\"type\":\"message\",\"role\":\"assistant\",\"content\":[],\"usage\":{\"input_tokens\":20}}}\n\n\
+event: content_block_start\ndata: {\"type\":\"content_block_start\",\"index\":0,\"content_block\":{\"type\":\"text\",\"text\":\"\"}}\n\n\
+event: content_block_delta\ndata: {\"type\":\"content_block_delta\",\"index\":0,\"delta\":{\"type\":\"text_delta\",\"text\":\"No wiki updates needed\"}}\n\n\
+event: content_block_stop\ndata: {\"type\":\"content_block_stop\",\"index\":0}\n\n\
+event: message_delta\ndata: {\"type\":\"message_delta\",\"delta\":{\"stop_reason\":\"end_turn\"},\"usage\":{\"output_tokens\":5}}\n\n\
+event: message_stop\ndata: {\"type\":\"message_stop\"}\n\n";
+
 /// Start a stateful mock server that returns different SSE bodies on successive calls.
 async fn start_stateful_mock_server(responses: Vec<&'static str>) -> SocketAddr {
     let counter = Arc::new(Mutex::new(0usize));
@@ -1269,6 +1291,351 @@ async fn test_solve_multi_step_agentic_loop() {
     );
 }
 
+#[tokio::test]
+async fn test_solve_flushes_final_curator_checkpoint_before_complete() {
+    use op_core::config::AgentConfig;
+    use op_core::engine::{SolveEmitter, solve};
+    use op_core::events::LoopMetrics;
+
+    let addr = start_stateful_mock_server(vec![
+        ANTHROPIC_SSE_TOOL_LIST,
+        ANTHROPIC_SSE_FINAL_ANSWER,
+        ANTHROPIC_SSE_CURATOR_NOOP,
+    ])
+    .await;
+
+    #[derive(Debug, Clone)]
+    #[allow(dead_code)]
+    enum Ev {
+        Trace(String),
+        Complete(String),
+        Error(String),
+    }
+
+    struct TestEmitter {
+        events: Arc<Mutex<Vec<Ev>>>,
+    }
+
+    impl SolveEmitter for TestEmitter {
+        fn emit_trace(&self, message: &str) {
+            self.events.lock().unwrap().push(Ev::Trace(message.to_string()));
+        }
+
+        fn emit_delta(&self, _: DeltaEvent) {}
+
+        fn emit_step(&self, _: op_core::events::StepEvent) {}
+
+        fn emit_complete(&self, result: &str, _: Option<LoopMetrics>) {
+            self.events.lock().unwrap().push(Ev::Complete(result.to_string()));
+        }
+
+        fn emit_error(&self, message: &str) {
+            self.events.lock().unwrap().push(Ev::Error(message.to_string()));
+        }
+    }
+
+    let events = Arc::new(Mutex::new(Vec::new()));
+    let emitter = TestEmitter {
+        events: events.clone(),
+    };
+    let tmp = tempfile::TempDir::new().unwrap();
+    std::fs::write(tmp.path().join("hello.txt"), "world").unwrap();
+
+    let cfg = AgentConfig {
+        provider: "anthropic".into(),
+        model: "claude-sonnet-4-5".into(),
+        anthropic_api_key: Some("test-key".into()),
+        anthropic_base_url: format!("http://{addr}"),
+        demo: false,
+        workspace: tmp.path().to_path_buf(),
+        ..Default::default()
+    };
+
+    solve(
+        "List the files in this directory",
+        &cfg,
+        &emitter,
+        CancellationToken::new(),
+    )
+    .await;
+
+    let recorded = events.lock().unwrap().clone();
+    let finalize_trace = recorded
+        .iter()
+        .position(|event| matches!(event, Ev::Trace(message) if message.contains("checkpoint at finalize")))
+        .expect("expected finalize curator trace");
+    let complete = recorded
+        .iter()
+        .position(|event| matches!(event, Ev::Complete(_)))
+        .expect("expected complete event");
+    assert!(
+        finalize_trace < complete,
+        "finalize checkpoint should be flushed before complete: {recorded:?}"
+    );
+    assert!(
+        !recorded.iter().any(|event| matches!(event, Ev::Error(_))),
+        "did not expect errors, got: {recorded:?}"
+    );
+}
+
+#[tokio::test]
+async fn test_solve_flushes_cancelled_checkpoint_before_error() {
+    use op_core::config::AgentConfig;
+    use op_core::engine::{SolveEmitter, solve};
+    use op_core::events::{LoopMetrics, StepEvent};
+
+    let addr =
+        start_stateful_mock_server(vec![ANTHROPIC_SSE_TOOL_LIST, ANTHROPIC_SSE_CURATOR_NOOP]).await;
+
+    #[derive(Debug, Clone)]
+    #[allow(dead_code)]
+    enum Ev {
+        Trace(String),
+        Error(String),
+    }
+
+    struct TestEmitter {
+        events: Arc<Mutex<Vec<Ev>>>,
+        cancel: CancellationToken,
+    }
+
+    impl SolveEmitter for TestEmitter {
+        fn emit_trace(&self, message: &str) {
+            self.events.lock().unwrap().push(Ev::Trace(message.to_string()));
+        }
+
+        fn emit_delta(&self, _: DeltaEvent) {}
+
+        fn emit_step(&self, event: StepEvent) {
+            if !event.is_final {
+                self.cancel.cancel();
+            }
+        }
+
+        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>) {}
+
+        fn emit_error(&self, message: &str) {
+            self.events.lock().unwrap().push(Ev::Error(message.to_string()));
+        }
+    }
+
+    let events = Arc::new(Mutex::new(Vec::new()));
+    let cancel = CancellationToken::new();
+    let emitter = TestEmitter {
+        events: events.clone(),
+        cancel: cancel.clone(),
+    };
+    let tmp = tempfile::TempDir::new().unwrap();
+    std::fs::write(tmp.path().join("hello.txt"), "world").unwrap();
+
+    let cfg = AgentConfig {
+        provider: "anthropic".into(),
+        model: "claude-sonnet-4-5".into(),
+        anthropic_api_key: Some("test-key".into()),
+        anthropic_base_url: format!("http://{addr}"),
+        demo: false,
+        workspace: tmp.path().to_path_buf(),
+        ..Default::default()
+    };
+
+    solve("List the files in this directory", &cfg, &emitter, cancel).await;
+
+    let recorded = events.lock().unwrap().clone();
+    let cancelled_trace = recorded
+        .iter()
+        .position(|event| matches!(event, Ev::Trace(message) if message.contains("checkpoint at cancelled")))
+        .expect("expected cancelled curator trace");
+    let error = recorded
+        .iter()
+        .position(|event| matches!(event, Ev::Error(message) if message == "Cancelled"))
+        .expect("expected cancelled error");
+    assert!(
+        cancelled_trace < error,
+        "cancelled checkpoint should flush before error: {recorded:?}"
+    );
+}
+
+#[tokio::test]
+async fn test_solve_flushes_model_error_checkpoint_before_error() {
+    use op_core::config::AgentConfig;
+    use op_core::engine::{SolveEmitter, solve};
+    use op_core::events::LoopMetrics;
+
+    let addr = start_stateful_http_server(vec![
+        MockHttpResponse {
+            status: 200,
+            content_type: "text/event-stream",
+            body: ANTHROPIC_SSE_TOOL_LIST,
+            headers: vec![("cache-control", "no-cache")],
+        },
+        MockHttpResponse {
+            status: 500,
+            content_type: "application/json",
+            body: "{\"error\":{\"message\":\"boom\"}}",
+            headers: vec![],
+        },
+        MockHttpResponse {
+            status: 200,
+            content_type: "text/event-stream",
+            body: ANTHROPIC_SSE_CURATOR_NOOP,
+            headers: vec![("cache-control", "no-cache")],
+        },
+    ])
+    .await;
+
+    #[derive(Debug, Clone)]
+    #[allow(dead_code)]
+    enum Ev {
+        Trace(String),
+        Error(String),
+    }
+
+    struct TestEmitter {
+        events: Arc<Mutex<Vec<Ev>>>,
+    }
+
+    impl SolveEmitter for TestEmitter {
+        fn emit_trace(&self, message: &str) {
+            self.events.lock().unwrap().push(Ev::Trace(message.to_string()));
+        }
+
+        fn emit_delta(&self, _: DeltaEvent) {}
+
+        fn emit_step(&self, _: op_core::events::StepEvent) {}
+
+        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>) {}
+
+        fn emit_error(&self, message: &str) {
+            self.events.lock().unwrap().push(Ev::Error(message.to_string()));
+        }
+    }
+
+    let events = Arc::new(Mutex::new(Vec::new()));
+    let emitter = TestEmitter {
+        events: events.clone(),
+    };
+    let tmp = tempfile::TempDir::new().unwrap();
+    std::fs::write(tmp.path().join("hello.txt"), "world").unwrap();
+
+    let cfg = AgentConfig {
+        provider: "anthropic".into(),
+        model: "claude-sonnet-4-5".into(),
+        anthropic_api_key: Some("test-key".into()),
+        anthropic_base_url: format!("http://{addr}"),
+        demo: false,
+        workspace: tmp.path().to_path_buf(),
+        ..Default::default()
+    };
+
+    solve(
+        "List the files in this directory",
+        &cfg,
+        &emitter,
+        CancellationToken::new(),
+    )
+    .await;
+
+    let recorded = events.lock().unwrap().clone();
+    let model_error_trace = recorded
+        .iter()
+        .position(|event| matches!(event, Ev::Trace(message) if message.contains("checkpoint at model_error")))
+        .expect("expected model_error curator trace");
+    let error = recorded
+        .iter()
+        .position(|event| matches!(event, Ev::Error(_)))
+        .expect("expected error event");
+    assert!(
+        model_error_trace < error,
+        "model_error checkpoint should flush before error: {recorded:?}"
+    );
+}
+
+#[tokio::test]
+async fn test_solve_flushes_tool_loop_cancel_checkpoint_before_error() {
+    use op_core::config::AgentConfig;
+    use op_core::engine::{SolveEmitter, solve};
+    use op_core::events::LoopMetrics;
+
+    let addr = start_stateful_mock_server(vec![
+        ANTHROPIC_SSE_TOOL_LIST,
+        ANTHROPIC_SSE_TWO_TOOL_LIST,
+        ANTHROPIC_SSE_CURATOR_NOOP,
+    ])
+    .await;
+
+    #[derive(Debug, Clone)]
+    #[allow(dead_code)]
+    enum Ev {
+        Trace(String),
+        Error(String),
+    }
+
+    struct TestEmitter {
+        events: Arc<Mutex<Vec<Ev>>>,
+        cancel: CancellationToken,
+        tool_exec_traces: Arc<Mutex<u32>>,
+    }
+
+    impl SolveEmitter for TestEmitter {
+        fn emit_trace(&self, message: &str) {
+            if message.contains("Executing tool: list_files") {
+                let mut count = self.tool_exec_traces.lock().unwrap();
+                *count += 1;
+                if *count == 2 {
+                    self.cancel.cancel();
+                }
+            }
+            self.events.lock().unwrap().push(Ev::Trace(message.to_string()));
+        }
+
+        fn emit_delta(&self, _: DeltaEvent) {}
+
+        fn emit_step(&self, _: op_core::events::StepEvent) {}
+
+        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>) {}
+
+        fn emit_error(&self, message: &str) {
+            self.events.lock().unwrap().push(Ev::Error(message.to_string()));
+        }
+    }
+
+    let events = Arc::new(Mutex::new(Vec::new()));
+    let cancel = CancellationToken::new();
+    let emitter = TestEmitter {
+        events: events.clone(),
+        cancel: cancel.clone(),
+        tool_exec_traces: Arc::new(Mutex::new(0)),
+    };
+    let tmp = tempfile::TempDir::new().unwrap();
+    std::fs::write(tmp.path().join("hello.txt"), "world").unwrap();
+
+    let cfg = AgentConfig {
+        provider: "anthropic".into(),
+        model: "claude-sonnet-4-5".into(),
+        anthropic_api_key: Some("test-key".into()),
+        anthropic_base_url: format!("http://{addr}"),
+        demo: false,
+        workspace: tmp.path().to_path_buf(),
+        ..Default::default()
+    };
+
+    solve("List the files in this directory", &cfg, &emitter, cancel).await;
+
+    let recorded = events.lock().unwrap().clone();
+    let cancelled_trace = recorded
+        .iter()
+        .position(|event| matches!(event, Ev::Trace(message) if message.contains("checkpoint at cancelled")))
+        .expect("expected cancelled curator trace");
+    let error = recorded
+        .iter()
+        .position(|event| matches!(event, Ev::Error(message) if message == "Cancelled"))
+        .expect("expected cancelled error");
+    assert!(
+        cancelled_trace < error,
+        "tool-loop cancel checkpoint should flush before error: {recorded:?}"
+    );
+}
+
 const ANTHROPIC_SSE_META_FINAL: &str = "\
 event: message_start\ndata: {\"type\":\"message_start\",\"message\":{\"id\":\"msg_meta_1\",\"type\":\"message\",\"role\":\"assistant\",\"content\":[],\"usage\":{\"input_tokens\":40}}}\n\n\
 event: content_block_start\ndata: {\"type\":\"content_block_start\",\"index\":0,\"content_block\":{\"type\":\"text\",\"text\":\"\"}}\n\n\
diff --git a/pyproject.toml b/pyproject.toml
index abd778c3..b145e35b 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -18,10 +18,13 @@ dependencies = [
 dev = [
     "pytest>=8.0",
     "pytest-asyncio>=0.23",
+    "networkx>=3.2",
+    "numpy>=1.26",
 ]
 textual = [
     "textual>=0.89",
     "networkx>=3.2",
+    "numpy>=1.26",
 ]
 
 [project.scripts]
diff --git a/tests/test_session.py b/tests/test_session.py
index 19e0c76c..87f30426 100644
--- a/tests/test_session.py
+++ b/tests/test_session.py
@@ -128,6 +128,154 @@ def create_conversation(self, system_prompt: str, initial_user_message: str):
             self.assertEqual(packet["focus_question_ids"], ["q_1"])
             self.assertEqual(packet["findings"]["unresolved"][0]["id"], "cl_1")
 
+    def test_runtime_resume_falls_back_to_legacy_state_when_typed_state_is_invalid(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(
+                workspace=root,
+                max_depth=1,
+                max_steps_per_call=2,
+                session_root_dir=".openplanter",
+                max_persisted_observations=50,
+            )
+            session_id = "session-invalid-typed-resume"
+
+            engine1 = RLMEngine(
+                model=ScriptedModel(scripted_turns=[ModelTurn(text="ok", stop_reason="end_turn")]),
+                tools=WorkspaceTools(root=root),
+                config=cfg,
+            )
+            SessionRuntime.bootstrap(
+                engine=engine1,
+                config=cfg,
+                session_id=session_id,
+                resume=False,
+            )
+
+            session_dir = root / ".openplanter" / "sessions" / session_id
+            state_path = session_dir / "state.json"
+            typed_state_path = session_dir / "investigation_state.json"
+            events_path = session_dir / "events.jsonl"
+
+            legacy_state = json.loads(state_path.read_text(encoding="utf-8"))
+            legacy_state["external_observations"] = ["legacy fallback observation"]
+            state_path.write_text(json.dumps(legacy_state), encoding="utf-8")
+            typed_state_path.write_text("{not-json", encoding="utf-8")
+
+            engine2 = RLMEngine(
+                model=ScriptedModel(scripted_turns=[ModelTurn(text="ok", stop_reason="end_turn")]),
+                tools=WorkspaceTools(root=root),
+                config=cfg,
+            )
+            runtime = SessionRuntime.bootstrap(
+                engine=engine2,
+                config=cfg,
+                session_id=session_id,
+                resume=True,
+            )
+
+            self.assertIn("legacy fallback observation", runtime.context.observations)
+            self.assertEqual(typed_state_path.read_text(encoding="utf-8"), "{not-json")
+
+            traces = [
+                json.loads(line)["payload"]["message"]
+                for line in events_path.read_text(encoding="utf-8").splitlines()
+                if line.strip() and json.loads(line).get("type") == "trace"
+            ]
+            self.assertTrue(
+                any("falling back to legacy state" in trace for trace in traces),
+                traces,
+            )
+            self.assertTrue(
+                any("preserving the corrupt typed state file" in trace for trace in traces),
+                traces,
+            )
+
+    def test_runtime_solve_continues_without_reasoning_packet_when_typed_state_is_invalid(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(
+                workspace=root,
+                max_depth=1,
+                max_steps_per_call=2,
+                session_root_dir=".openplanter",
+                max_persisted_observations=50,
+            )
+
+            captured: list[str] = []
+
+            class CapturingModel(ScriptedModel):
+                def create_conversation(self, system_prompt: str, initial_user_message: str):
+                    captured.append(initial_user_message)
+                    return super().create_conversation(system_prompt, initial_user_message)
+
+            model = CapturingModel(scripted_turns=[ModelTurn(text="ok", stop_reason="end_turn")])
+            engine = RLMEngine(model=model, tools=WorkspaceTools(root=root), config=cfg)
+            runtime = SessionRuntime.bootstrap(
+                engine=engine,
+                config=cfg,
+                session_id="session-invalid-typed-solve",
+                resume=False,
+            )
+
+            session_dir = root / ".openplanter" / "sessions" / "session-invalid-typed-solve"
+            typed_state_path = session_dir / "investigation_state.json"
+            typed_state_path.write_text("{not-json", encoding="utf-8")
+
+            events: list[str] = []
+            result = runtime.solve("continue", on_event=events.append)
+
+            self.assertEqual(result, "ok")
+            self.assertEqual(typed_state_path.read_text(encoding="utf-8"), "{not-json")
+            self.assertTrue(
+                any("continuing without typed reasoning state" in message for message in events),
+                events,
+            )
+
+            parsed = json.loads(captured[0])
+            self.assertNotIn("question_reasoning_packet", parsed)
+
+    def test_runtime_persist_preserves_corrupt_typed_state_file(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(
+                workspace=root,
+                max_depth=1,
+                max_steps_per_call=2,
+                session_root_dir=".openplanter",
+                max_persisted_observations=50,
+            )
+
+            engine = RLMEngine(
+                model=ScriptedModel(scripted_turns=[ModelTurn(text="ok", stop_reason="end_turn")]),
+                tools=WorkspaceTools(root=root),
+                config=cfg,
+            )
+            runtime = SessionRuntime.bootstrap(
+                engine=engine,
+                config=cfg,
+                session_id="session-invalid-typed-persist",
+                resume=False,
+            )
+
+            session_dir = root / ".openplanter" / "sessions" / "session-invalid-typed-persist"
+            state_path = session_dir / "state.json"
+            typed_state_path = session_dir / "investigation_state.json"
+            typed_state_path.write_text("{not-json", encoding="utf-8")
+
+            runtime.context.observations.append("fresh observation")
+            runtime._persist_state()
+
+            persisted = json.loads(state_path.read_text(encoding="utf-8"))
+            self.assertIn("fresh observation", persisted["external_observations"])
+            self.assertEqual(typed_state_path.read_text(encoding="utf-8"), "{not-json")
+            self.assertTrue(
+                any(
+                    "preserving the corrupt typed state file" in warning
+                    for warning in runtime.store.drain_warnings()
+                )
+            )
+
     def test_patch_artifact_saved(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)
diff --git a/uv.lock b/uv.lock
index 6b6d4eb7..c4b747eb 100644
--- a/uv.lock
+++ b/uv.lock
@@ -119,6 +119,153 @@ wheels = [
     { url = "https://files.pythonhosted.org/packages/9e/c9/b2622292ea83fbb4ec318f5b9ab867d0a28ab43c5717bb85b0a5f6b3b0a4/networkx-3.6.1-py3-none-any.whl", hash = "sha256:d47fbf302e7d9cbbb9e2555a0d267983d2aa476bac30e90dfbe5669bd57f3762", size = 2068504, upload-time = "2025-12-08T17:02:38.159Z" },
 ]
 
+[[package]]
+name = "numpy"
+version = "2.2.6"
+source = { registry = "https://pypi.org/simple" }
+resolution-markers = [
+    "python_full_version < '3.11'",
+]
+sdist = { url = "https://files.pythonhosted.org/packages/76/21/7d2a95e4bba9dc13d043ee156a356c0a8f0c6309dff6b21b4d71a073b8a8/numpy-2.2.6.tar.gz", hash = "sha256:e29554e2bef54a90aa5cc07da6ce955accb83f21ab5de01a62c8478897b264fd", size = 20276440, upload-time = "2025-05-17T22:38:04.611Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/9a/3e/ed6db5be21ce87955c0cbd3009f2803f59fa08df21b5df06862e2d8e2bdd/numpy-2.2.6-cp310-cp310-macosx_10_9_x86_64.whl", hash = "sha256:b412caa66f72040e6d268491a59f2c43bf03eb6c96dd8f0307829feb7fa2b6fb", size = 21165245, upload-time = "2025-05-17T21:27:58.555Z" },
+    { url = "https://files.pythonhosted.org/packages/22/c2/4b9221495b2a132cc9d2eb862e21d42a009f5a60e45fc44b00118c174bff/numpy-2.2.6-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:8e41fd67c52b86603a91c1a505ebaef50b3314de0213461c7a6e99c9a3beff90", size = 14360048, upload-time = "2025-05-17T21:28:21.406Z" },
+    { url = "https://files.pythonhosted.org/packages/fd/77/dc2fcfc66943c6410e2bf598062f5959372735ffda175b39906d54f02349/numpy-2.2.6-cp310-cp310-macosx_14_0_arm64.whl", hash = "sha256:37e990a01ae6ec7fe7fa1c26c55ecb672dd98b19c3d0e1d1f326fa13cb38d163", size = 5340542, upload-time = "2025-05-17T21:28:30.931Z" },
+    { url = "https://files.pythonhosted.org/packages/7a/4f/1cb5fdc353a5f5cc7feb692db9b8ec2c3d6405453f982435efc52561df58/numpy-2.2.6-cp310-cp310-macosx_14_0_x86_64.whl", hash = "sha256:5a6429d4be8ca66d889b7cf70f536a397dc45ba6faeb5f8c5427935d9592e9cf", size = 6878301, upload-time = "2025-05-17T21:28:41.613Z" },
+    { url = "https://files.pythonhosted.org/packages/eb/17/96a3acd228cec142fcb8723bd3cc39c2a474f7dcf0a5d16731980bcafa95/numpy-2.2.6-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:efd28d4e9cd7d7a8d39074a4d44c63eda73401580c5c76acda2ce969e0a38e83", size = 14297320, upload-time = "2025-05-17T21:29:02.78Z" },
+    { url = "https://files.pythonhosted.org/packages/b4/63/3de6a34ad7ad6646ac7d2f55ebc6ad439dbbf9c4370017c50cf403fb19b5/numpy-2.2.6-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:fc7b73d02efb0e18c000e9ad8b83480dfcd5dfd11065997ed4c6747470ae8915", size = 16801050, upload-time = "2025-05-17T21:29:27.675Z" },
+    { url = "https://files.pythonhosted.org/packages/07/b6/89d837eddef52b3d0cec5c6ba0456c1bf1b9ef6a6672fc2b7873c3ec4e2e/numpy-2.2.6-cp310-cp310-musllinux_1_2_aarch64.whl", hash = "sha256:74d4531beb257d2c3f4b261bfb0fc09e0f9ebb8842d82a7b4209415896adc680", size = 15807034, upload-time = "2025-05-17T21:29:51.102Z" },
+    { url = "https://files.pythonhosted.org/packages/01/c8/dc6ae86e3c61cfec1f178e5c9f7858584049b6093f843bca541f94120920/numpy-2.2.6-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:8fc377d995680230e83241d8a96def29f204b5782f371c532579b4f20607a289", size = 18614185, upload-time = "2025-05-17T21:30:18.703Z" },
+    { url = "https://files.pythonhosted.org/packages/5b/c5/0064b1b7e7c89137b471ccec1fd2282fceaae0ab3a9550f2568782d80357/numpy-2.2.6-cp310-cp310-win32.whl", hash = "sha256:b093dd74e50a8cba3e873868d9e93a85b78e0daf2e98c6797566ad8044e8363d", size = 6527149, upload-time = "2025-05-17T21:30:29.788Z" },
+    { url = "https://files.pythonhosted.org/packages/a3/dd/4b822569d6b96c39d1215dbae0582fd99954dcbcf0c1a13c61783feaca3f/numpy-2.2.6-cp310-cp310-win_amd64.whl", hash = "sha256:f0fd6321b839904e15c46e0d257fdd101dd7f530fe03fd6359c1ea63738703f3", size = 12904620, upload-time = "2025-05-17T21:30:48.994Z" },
+    { url = "https://files.pythonhosted.org/packages/da/a8/4f83e2aa666a9fbf56d6118faaaf5f1974d456b1823fda0a176eff722839/numpy-2.2.6-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:f9f1adb22318e121c5c69a09142811a201ef17ab257a1e66ca3025065b7f53ae", size = 21176963, upload-time = "2025-05-17T21:31:19.36Z" },
+    { url = "https://files.pythonhosted.org/packages/b3/2b/64e1affc7972decb74c9e29e5649fac940514910960ba25cd9af4488b66c/numpy-2.2.6-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:c820a93b0255bc360f53eca31a0e676fd1101f673dda8da93454a12e23fc5f7a", size = 14406743, upload-time = "2025-05-17T21:31:41.087Z" },
+    { url = "https://files.pythonhosted.org/packages/4a/9f/0121e375000b5e50ffdd8b25bf78d8e1a5aa4cca3f185d41265198c7b834/numpy-2.2.6-cp311-cp311-macosx_14_0_arm64.whl", hash = "sha256:3d70692235e759f260c3d837193090014aebdf026dfd167834bcba43e30c2a42", size = 5352616, upload-time = "2025-05-17T21:31:50.072Z" },
+    { url = "https://files.pythonhosted.org/packages/31/0d/b48c405c91693635fbe2dcd7bc84a33a602add5f63286e024d3b6741411c/numpy-2.2.6-cp311-cp311-macosx_14_0_x86_64.whl", hash = "sha256:481b49095335f8eed42e39e8041327c05b0f6f4780488f61286ed3c01368d491", size = 6889579, upload-time = "2025-05-17T21:32:01.712Z" },
+    { url = "https://files.pythonhosted.org/packages/52/b8/7f0554d49b565d0171eab6e99001846882000883998e7b7d9f0d98b1f934/numpy-2.2.6-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:b64d8d4d17135e00c8e346e0a738deb17e754230d7e0810ac5012750bbd85a5a", size = 14312005, upload-time = "2025-05-17T21:32:23.332Z" },
+    { url = "https://files.pythonhosted.org/packages/b3/dd/2238b898e51bd6d389b7389ffb20d7f4c10066d80351187ec8e303a5a475/numpy-2.2.6-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:ba10f8411898fc418a521833e014a77d3ca01c15b0c6cdcce6a0d2897e6dbbdf", size = 16821570, upload-time = "2025-05-17T21:32:47.991Z" },
+    { url = "https://files.pythonhosted.org/packages/83/6c/44d0325722cf644f191042bf47eedad61c1e6df2432ed65cbe28509d404e/numpy-2.2.6-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:bd48227a919f1bafbdda0583705e547892342c26fb127219d60a5c36882609d1", size = 15818548, upload-time = "2025-05-17T21:33:11.728Z" },
+    { url = "https://files.pythonhosted.org/packages/ae/9d/81e8216030ce66be25279098789b665d49ff19eef08bfa8cb96d4957f422/numpy-2.2.6-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:9551a499bf125c1d4f9e250377c1ee2eddd02e01eac6644c080162c0c51778ab", size = 18620521, upload-time = "2025-05-17T21:33:39.139Z" },
+    { url = "https://files.pythonhosted.org/packages/6a/fd/e19617b9530b031db51b0926eed5345ce8ddc669bb3bc0044b23e275ebe8/numpy-2.2.6-cp311-cp311-win32.whl", hash = "sha256:0678000bb9ac1475cd454c6b8c799206af8107e310843532b04d49649c717a47", size = 6525866, upload-time = "2025-05-17T21:33:50.273Z" },
+    { url = "https://files.pythonhosted.org/packages/31/0a/f354fb7176b81747d870f7991dc763e157a934c717b67b58456bc63da3df/numpy-2.2.6-cp311-cp311-win_amd64.whl", hash = "sha256:e8213002e427c69c45a52bbd94163084025f533a55a59d6f9c5b820774ef3303", size = 12907455, upload-time = "2025-05-17T21:34:09.135Z" },
+    { url = "https://files.pythonhosted.org/packages/82/5d/c00588b6cf18e1da539b45d3598d3557084990dcc4331960c15ee776ee41/numpy-2.2.6-cp312-cp312-macosx_10_13_x86_64.whl", hash = "sha256:41c5a21f4a04fa86436124d388f6ed60a9343a6f767fced1a8a71c3fbca038ff", size = 20875348, upload-time = "2025-05-17T21:34:39.648Z" },
+    { url = "https://files.pythonhosted.org/packages/66/ee/560deadcdde6c2f90200450d5938f63a34b37e27ebff162810f716f6a230/numpy-2.2.6-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:de749064336d37e340f640b05f24e9e3dd678c57318c7289d222a8a2f543e90c", size = 14119362, upload-time = "2025-05-17T21:35:01.241Z" },
+    { url = "https://files.pythonhosted.org/packages/3c/65/4baa99f1c53b30adf0acd9a5519078871ddde8d2339dc5a7fde80d9d87da/numpy-2.2.6-cp312-cp312-macosx_14_0_arm64.whl", hash = "sha256:894b3a42502226a1cac872f840030665f33326fc3dac8e57c607905773cdcde3", size = 5084103, upload-time = "2025-05-17T21:35:10.622Z" },
+    { url = "https://files.pythonhosted.org/packages/cc/89/e5a34c071a0570cc40c9a54eb472d113eea6d002e9ae12bb3a8407fb912e/numpy-2.2.6-cp312-cp312-macosx_14_0_x86_64.whl", hash = "sha256:71594f7c51a18e728451bb50cc60a3ce4e6538822731b2933209a1f3614e9282", size = 6625382, upload-time = "2025-05-17T21:35:21.414Z" },
+    { url = "https://files.pythonhosted.org/packages/f8/35/8c80729f1ff76b3921d5c9487c7ac3de9b2a103b1cd05e905b3090513510/numpy-2.2.6-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:f2618db89be1b4e05f7a1a847a9c1c0abd63e63a1607d892dd54668dd92faf87", size = 14018462, upload-time = "2025-05-17T21:35:42.174Z" },
+    { url = "https://files.pythonhosted.org/packages/8c/3d/1e1db36cfd41f895d266b103df00ca5b3cbe965184df824dec5c08c6b803/numpy-2.2.6-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:fd83c01228a688733f1ded5201c678f0c53ecc1006ffbc404db9f7a899ac6249", size = 16527618, upload-time = "2025-05-17T21:36:06.711Z" },
+    { url = "https://files.pythonhosted.org/packages/61/c6/03ed30992602c85aa3cd95b9070a514f8b3c33e31124694438d88809ae36/numpy-2.2.6-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:37c0ca431f82cd5fa716eca9506aefcabc247fb27ba69c5062a6d3ade8cf8f49", size = 15505511, upload-time = "2025-05-17T21:36:29.965Z" },
+    { url = "https://files.pythonhosted.org/packages/b7/25/5761d832a81df431e260719ec45de696414266613c9ee268394dd5ad8236/numpy-2.2.6-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:fe27749d33bb772c80dcd84ae7e8df2adc920ae8297400dabec45f0dedb3f6de", size = 18313783, upload-time = "2025-05-17T21:36:56.883Z" },
+    { url = "https://files.pythonhosted.org/packages/57/0a/72d5a3527c5ebffcd47bde9162c39fae1f90138c961e5296491ce778e682/numpy-2.2.6-cp312-cp312-win32.whl", hash = "sha256:4eeaae00d789f66c7a25ac5f34b71a7035bb474e679f410e5e1a94deb24cf2d4", size = 6246506, upload-time = "2025-05-17T21:37:07.368Z" },
+    { url = "https://files.pythonhosted.org/packages/36/fa/8c9210162ca1b88529ab76b41ba02d433fd54fecaf6feb70ef9f124683f1/numpy-2.2.6-cp312-cp312-win_amd64.whl", hash = "sha256:c1f9540be57940698ed329904db803cf7a402f3fc200bfe599334c9bd84a40b2", size = 12614190, upload-time = "2025-05-17T21:37:26.213Z" },
+    { url = "https://files.pythonhosted.org/packages/f9/5c/6657823f4f594f72b5471f1db1ab12e26e890bb2e41897522d134d2a3e81/numpy-2.2.6-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:0811bb762109d9708cca4d0b13c4f67146e3c3b7cf8d34018c722adb2d957c84", size = 20867828, upload-time = "2025-05-17T21:37:56.699Z" },
+    { url = "https://files.pythonhosted.org/packages/dc/9e/14520dc3dadf3c803473bd07e9b2bd1b69bc583cb2497b47000fed2fa92f/numpy-2.2.6-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:287cc3162b6f01463ccd86be154f284d0893d2b3ed7292439ea97eafa8170e0b", size = 14143006, upload-time = "2025-05-17T21:38:18.291Z" },
+    { url = "https://files.pythonhosted.org/packages/4f/06/7e96c57d90bebdce9918412087fc22ca9851cceaf5567a45c1f404480e9e/numpy-2.2.6-cp313-cp313-macosx_14_0_arm64.whl", hash = "sha256:f1372f041402e37e5e633e586f62aa53de2eac8d98cbfb822806ce4bbefcb74d", size = 5076765, upload-time = "2025-05-17T21:38:27.319Z" },
+    { url = "https://files.pythonhosted.org/packages/73/ed/63d920c23b4289fdac96ddbdd6132e9427790977d5457cd132f18e76eae0/numpy-2.2.6-cp313-cp313-macosx_14_0_x86_64.whl", hash = "sha256:55a4d33fa519660d69614a9fad433be87e5252f4b03850642f88993f7b2ca566", size = 6617736, upload-time = "2025-05-17T21:38:38.141Z" },
+    { url = "https://files.pythonhosted.org/packages/85/c5/e19c8f99d83fd377ec8c7e0cf627a8049746da54afc24ef0a0cb73d5dfb5/numpy-2.2.6-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:f92729c95468a2f4f15e9bb94c432a9229d0d50de67304399627a943201baa2f", size = 14010719, upload-time = "2025-05-17T21:38:58.433Z" },
+    { url = "https://files.pythonhosted.org/packages/19/49/4df9123aafa7b539317bf6d342cb6d227e49f7a35b99c287a6109b13dd93/numpy-2.2.6-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:1bc23a79bfabc5d056d106f9befb8d50c31ced2fbc70eedb8155aec74a45798f", size = 16526072, upload-time = "2025-05-17T21:39:22.638Z" },
+    { url = "https://files.pythonhosted.org/packages/b2/6c/04b5f47f4f32f7c2b0e7260442a8cbcf8168b0e1a41ff1495da42f42a14f/numpy-2.2.6-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:e3143e4451880bed956e706a3220b4e5cf6172ef05fcc397f6f36a550b1dd868", size = 15503213, upload-time = "2025-05-17T21:39:45.865Z" },
+    { url = "https://files.pythonhosted.org/packages/17/0a/5cd92e352c1307640d5b6fec1b2ffb06cd0dabe7d7b8227f97933d378422/numpy-2.2.6-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:b4f13750ce79751586ae2eb824ba7e1e8dba64784086c98cdbbcc6a42112ce0d", size = 18316632, upload-time = "2025-05-17T21:40:13.331Z" },
+    { url = "https://files.pythonhosted.org/packages/f0/3b/5cba2b1d88760ef86596ad0f3d484b1cbff7c115ae2429678465057c5155/numpy-2.2.6-cp313-cp313-win32.whl", hash = "sha256:5beb72339d9d4fa36522fc63802f469b13cdbe4fdab4a288f0c441b74272ebfd", size = 6244532, upload-time = "2025-05-17T21:43:46.099Z" },
+    { url = "https://files.pythonhosted.org/packages/cb/3b/d58c12eafcb298d4e6d0d40216866ab15f59e55d148a5658bb3132311fcf/numpy-2.2.6-cp313-cp313-win_amd64.whl", hash = "sha256:b0544343a702fa80c95ad5d3d608ea3599dd54d4632df855e4c8d24eb6ecfa1c", size = 12610885, upload-time = "2025-05-17T21:44:05.145Z" },
+    { url = "https://files.pythonhosted.org/packages/6b/9e/4bf918b818e516322db999ac25d00c75788ddfd2d2ade4fa66f1f38097e1/numpy-2.2.6-cp313-cp313t-macosx_10_13_x86_64.whl", hash = "sha256:0bca768cd85ae743b2affdc762d617eddf3bcf8724435498a1e80132d04879e6", size = 20963467, upload-time = "2025-05-17T21:40:44Z" },
+    { url = "https://files.pythonhosted.org/packages/61/66/d2de6b291507517ff2e438e13ff7b1e2cdbdb7cb40b3ed475377aece69f9/numpy-2.2.6-cp313-cp313t-macosx_11_0_arm64.whl", hash = "sha256:fc0c5673685c508a142ca65209b4e79ed6740a4ed6b2267dbba90f34b0b3cfda", size = 14225144, upload-time = "2025-05-17T21:41:05.695Z" },
+    { url = "https://files.pythonhosted.org/packages/e4/25/480387655407ead912e28ba3a820bc69af9adf13bcbe40b299d454ec011f/numpy-2.2.6-cp313-cp313t-macosx_14_0_arm64.whl", hash = "sha256:5bd4fc3ac8926b3819797a7c0e2631eb889b4118a9898c84f585a54d475b7e40", size = 5200217, upload-time = "2025-05-17T21:41:15.903Z" },
+    { url = "https://files.pythonhosted.org/packages/aa/4a/6e313b5108f53dcbf3aca0c0f3e9c92f4c10ce57a0a721851f9785872895/numpy-2.2.6-cp313-cp313t-macosx_14_0_x86_64.whl", hash = "sha256:fee4236c876c4e8369388054d02d0e9bb84821feb1a64dd59e137e6511a551f8", size = 6712014, upload-time = "2025-05-17T21:41:27.321Z" },
+    { url = "https://files.pythonhosted.org/packages/b7/30/172c2d5c4be71fdf476e9de553443cf8e25feddbe185e0bd88b096915bcc/numpy-2.2.6-cp313-cp313t-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:e1dda9c7e08dc141e0247a5b8f49cf05984955246a327d4c48bda16821947b2f", size = 14077935, upload-time = "2025-05-17T21:41:49.738Z" },
+    { url = "https://files.pythonhosted.org/packages/12/fb/9e743f8d4e4d3c710902cf87af3512082ae3d43b945d5d16563f26ec251d/numpy-2.2.6-cp313-cp313t-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:f447e6acb680fd307f40d3da4852208af94afdfab89cf850986c3ca00562f4fa", size = 16600122, upload-time = "2025-05-17T21:42:14.046Z" },
+    { url = "https://files.pythonhosted.org/packages/12/75/ee20da0e58d3a66f204f38916757e01e33a9737d0b22373b3eb5a27358f9/numpy-2.2.6-cp313-cp313t-musllinux_1_2_aarch64.whl", hash = "sha256:389d771b1623ec92636b0786bc4ae56abafad4a4c513d36a55dce14bd9ce8571", size = 15586143, upload-time = "2025-05-17T21:42:37.464Z" },
+    { url = "https://files.pythonhosted.org/packages/76/95/bef5b37f29fc5e739947e9ce5179ad402875633308504a52d188302319c8/numpy-2.2.6-cp313-cp313t-musllinux_1_2_x86_64.whl", hash = "sha256:8e9ace4a37db23421249ed236fdcdd457d671e25146786dfc96835cd951aa7c1", size = 18385260, upload-time = "2025-05-17T21:43:05.189Z" },
+    { url = "https://files.pythonhosted.org/packages/09/04/f2f83279d287407cf36a7a8053a5abe7be3622a4363337338f2585e4afda/numpy-2.2.6-cp313-cp313t-win32.whl", hash = "sha256:038613e9fb8c72b0a41f025a7e4c3f0b7a1b5d768ece4796b674c8f3fe13efff", size = 6377225, upload-time = "2025-05-17T21:43:16.254Z" },
+    { url = "https://files.pythonhosted.org/packages/67/0e/35082d13c09c02c011cf21570543d202ad929d961c02a147493cb0c2bdf5/numpy-2.2.6-cp313-cp313t-win_amd64.whl", hash = "sha256:6031dd6dfecc0cf9f668681a37648373bddd6421fff6c66ec1624eed0180ee06", size = 12771374, upload-time = "2025-05-17T21:43:35.479Z" },
+    { url = "https://files.pythonhosted.org/packages/9e/3b/d94a75f4dbf1ef5d321523ecac21ef23a3cd2ac8b78ae2aac40873590229/numpy-2.2.6-pp310-pypy310_pp73-macosx_10_15_x86_64.whl", hash = "sha256:0b605b275d7bd0c640cad4e5d30fa701a8d59302e127e5f79138ad62762c3e3d", size = 21040391, upload-time = "2025-05-17T21:44:35.948Z" },
+    { url = "https://files.pythonhosted.org/packages/17/f4/09b2fa1b58f0fb4f7c7963a1649c64c4d315752240377ed74d9cd878f7b5/numpy-2.2.6-pp310-pypy310_pp73-macosx_14_0_x86_64.whl", hash = "sha256:7befc596a7dc9da8a337f79802ee8adb30a552a94f792b9c9d18c840055907db", size = 6786754, upload-time = "2025-05-17T21:44:47.446Z" },
+    { url = "https://files.pythonhosted.org/packages/af/30/feba75f143bdc868a1cc3f44ccfa6c4b9ec522b36458e738cd00f67b573f/numpy-2.2.6-pp310-pypy310_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:ce47521a4754c8f4593837384bd3424880629f718d87c5d44f8ed763edd63543", size = 16643476, upload-time = "2025-05-17T21:45:11.871Z" },
+    { url = "https://files.pythonhosted.org/packages/37/48/ac2a9584402fb6c0cd5b5d1a91dcf176b15760130dd386bbafdbfe3640bf/numpy-2.2.6-pp310-pypy310_pp73-win_amd64.whl", hash = "sha256:d042d24c90c41b54fd506da306759e06e568864df8ec17ccc17e9e884634fd00", size = 12812666, upload-time = "2025-05-17T21:45:31.426Z" },
+]
+
+[[package]]
+name = "numpy"
+version = "2.4.3"
+source = { registry = "https://pypi.org/simple" }
+resolution-markers = [
+    "python_full_version >= '3.11'",
+]
+sdist = { url = "https://files.pythonhosted.org/packages/10/8b/c265f4823726ab832de836cdd184d0986dcf94480f81e8739692a7ac7af2/numpy-2.4.3.tar.gz", hash = "sha256:483a201202b73495f00dbc83796c6ae63137a9bdade074f7648b3e32613412dd", size = 20727743, upload-time = "2026-03-09T07:58:53.426Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/f9/51/5093a2df15c4dc19da3f79d1021e891f5dcf1d9d1db6ba38891d5590f3fe/numpy-2.4.3-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:33b3bf58ee84b172c067f56aeadc7ee9ab6de69c5e800ab5b10295d54c581adb", size = 16957183, upload-time = "2026-03-09T07:55:57.774Z" },
+    { url = "https://files.pythonhosted.org/packages/b5/7c/c061f3de0630941073d2598dc271ac2f6cbcf5c83c74a5870fea07488333/numpy-2.4.3-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:8ba7b51e71c05aa1f9bc3641463cd82308eab40ce0d5c7e1fd4038cbf9938147", size = 14968734, upload-time = "2026-03-09T07:56:00.494Z" },
+    { url = "https://files.pythonhosted.org/packages/ef/27/d26c85cbcd86b26e4f125b0668e7a7c0542d19dd7d23ee12e87b550e95b5/numpy-2.4.3-cp311-cp311-macosx_14_0_arm64.whl", hash = "sha256:a1988292870c7cb9d0ebb4cc96b4d447513a9644801de54606dc7aabf2b7d920", size = 5475288, upload-time = "2026-03-09T07:56:02.857Z" },
+    { url = "https://files.pythonhosted.org/packages/2b/09/3c4abbc1dcd8010bf1a611d174c7aa689fc505585ec806111b4406f6f1b1/numpy-2.4.3-cp311-cp311-macosx_14_0_x86_64.whl", hash = "sha256:23b46bb6d8ecb68b58c09944483c135ae5f0e9b8d8858ece5e4ead783771d2a9", size = 6805253, upload-time = "2026-03-09T07:56:04.53Z" },
+    { url = "https://files.pythonhosted.org/packages/21/bc/e7aa3f6817e40c3f517d407742337cbb8e6fc4b83ce0b55ab780c829243b/numpy-2.4.3-cp311-cp311-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:a016db5c5dba78fa8fe9f5d80d6708f9c42ab087a739803c0ac83a43d686a470", size = 15969479, upload-time = "2026-03-09T07:56:06.638Z" },
+    { url = "https://files.pythonhosted.org/packages/78/51/9f5d7a41f0b51649ddf2f2320595e15e122a40610b233d51928dd6c92353/numpy-2.4.3-cp311-cp311-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:715de7f82e192e8cae5a507a347d97ad17598f8e026152ca97233e3666daaa71", size = 16901035, upload-time = "2026-03-09T07:56:09.405Z" },
+    { url = "https://files.pythonhosted.org/packages/64/6e/b221dd847d7181bc5ee4857bfb026182ef69499f9305eb1371cbb1aea626/numpy-2.4.3-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:2ddb7919366ee468342b91dea2352824c25b55814a987847b6c52003a7c97f15", size = 17325657, upload-time = "2026-03-09T07:56:12.067Z" },
+    { url = "https://files.pythonhosted.org/packages/eb/b8/8f3fd2da596e1063964b758b5e3c970aed1949a05200d7e3d46a9d46d643/numpy-2.4.3-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:a315e5234d88067f2d97e1f2ef670a7569df445d55400f1e33d117418d008d52", size = 18635512, upload-time = "2026-03-09T07:56:14.629Z" },
+    { url = "https://files.pythonhosted.org/packages/5c/24/2993b775c37e39d2f8ab4125b44337ab0b2ba106c100980b7c274a22bee7/numpy-2.4.3-cp311-cp311-win32.whl", hash = "sha256:2b3f8d2c4589b1a2028d2a770b0fc4d1f332fb5e01521f4de3199a896d158ddd", size = 6238100, upload-time = "2026-03-09T07:56:17.243Z" },
+    { url = "https://files.pythonhosted.org/packages/76/1d/edccf27adedb754db7c4511d5eac8b83f004ae948fe2d3509e8b78097d4c/numpy-2.4.3-cp311-cp311-win_amd64.whl", hash = "sha256:77e76d932c49a75617c6d13464e41203cd410956614d0a0e999b25e9e8d27eec", size = 12609816, upload-time = "2026-03-09T07:56:19.089Z" },
+    { url = "https://files.pythonhosted.org/packages/92/82/190b99153480076c8dce85f4cfe7d53ea84444145ffa54cb58dcd460d66b/numpy-2.4.3-cp311-cp311-win_arm64.whl", hash = "sha256:eb610595dd91560905c132c709412b512135a60f1851ccbd2c959e136431ff67", size = 10485757, upload-time = "2026-03-09T07:56:21.753Z" },
+    { url = "https://files.pythonhosted.org/packages/a9/ed/6388632536f9788cea23a3a1b629f25b43eaacd7d7377e5d6bc7b9deb69b/numpy-2.4.3-cp312-cp312-macosx_10_13_x86_64.whl", hash = "sha256:61b0cbabbb6126c8df63b9a3a0c4b1f44ebca5e12ff6997b80fcf267fb3150ef", size = 16669628, upload-time = "2026-03-09T07:56:24.252Z" },
+    { url = "https://files.pythonhosted.org/packages/74/1b/ee2abfc68e1ce728b2958b6ba831d65c62e1b13ce3017c13943f8f9b5b2e/numpy-2.4.3-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:7395e69ff32526710748f92cd8c9849b361830968ea3e24a676f272653e8983e", size = 14696872, upload-time = "2026-03-09T07:56:26.991Z" },
+    { url = "https://files.pythonhosted.org/packages/ba/d1/780400e915ff5638166f11ca9dc2c5815189f3d7cf6f8759a1685e586413/numpy-2.4.3-cp312-cp312-macosx_14_0_arm64.whl", hash = "sha256:abdce0f71dcb4a00e4e77f3faf05e4616ceccfe72ccaa07f47ee79cda3b7b0f4", size = 5203489, upload-time = "2026-03-09T07:56:29.414Z" },
+    { url = "https://files.pythonhosted.org/packages/0b/bb/baffa907e9da4cc34a6e556d6d90e032f6d7a75ea47968ea92b4858826c4/numpy-2.4.3-cp312-cp312-macosx_14_0_x86_64.whl", hash = "sha256:48da3a4ee1336454b07497ff7ec83903efa5505792c4e6d9bf83d99dc07a1e18", size = 6550814, upload-time = "2026-03-09T07:56:32.225Z" },
+    { url = "https://files.pythonhosted.org/packages/7b/12/8c9f0c6c95f76aeb20fc4a699c33e9f827fa0d0f857747c73bb7b17af945/numpy-2.4.3-cp312-cp312-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:32e3bef222ad6b052280311d1d60db8e259e4947052c3ae7dd6817451fc8a4c5", size = 15666601, upload-time = "2026-03-09T07:56:34.461Z" },
+    { url = "https://files.pythonhosted.org/packages/bd/79/cc665495e4d57d0aa6fbcc0aa57aa82671dfc78fbf95fe733ed86d98f52a/numpy-2.4.3-cp312-cp312-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:e7dd01a46700b1967487141a66ac1a3cf0dd8ebf1f08db37d46389401512ca97", size = 16621358, upload-time = "2026-03-09T07:56:36.852Z" },
+    { url = "https://files.pythonhosted.org/packages/a8/40/b4ecb7224af1065c3539f5ecfff879d090de09608ad1008f02c05c770cb3/numpy-2.4.3-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:76f0f283506c28b12bba319c0fab98217e9f9b54e6160e9c79e9f7348ba32e9c", size = 17016135, upload-time = "2026-03-09T07:56:39.337Z" },
+    { url = "https://files.pythonhosted.org/packages/f7/b1/6a88e888052eed951afed7a142dcdf3b149a030ca59b4c71eef085858e43/numpy-2.4.3-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:737f630a337364665aba3b5a77e56a68cc42d350edd010c345d65a3efa3addcc", size = 18345816, upload-time = "2026-03-09T07:56:42.31Z" },
+    { url = "https://files.pythonhosted.org/packages/f3/8f/103a60c5f8c3d7fc678c19cd7b2476110da689ccb80bc18050efbaeae183/numpy-2.4.3-cp312-cp312-win32.whl", hash = "sha256:26952e18d82a1dbbc2f008d402021baa8d6fc8e84347a2072a25e08b46d698b9", size = 5960132, upload-time = "2026-03-09T07:56:44.851Z" },
+    { url = "https://files.pythonhosted.org/packages/d7/7c/f5ee1bf6ed888494978046a809df2882aad35d414b622893322df7286879/numpy-2.4.3-cp312-cp312-win_amd64.whl", hash = "sha256:65f3c2455188f09678355f5cae1f959a06b778bc66d535da07bf2ef20cd319d5", size = 12316144, upload-time = "2026-03-09T07:56:47.057Z" },
+    { url = "https://files.pythonhosted.org/packages/71/46/8d1cb3f7a00f2fb6394140e7e6623696e54c6318a9d9691bb4904672cf42/numpy-2.4.3-cp312-cp312-win_arm64.whl", hash = "sha256:2abad5c7fef172b3377502bde47892439bae394a71bc329f31df0fd829b41a9e", size = 10220364, upload-time = "2026-03-09T07:56:49.849Z" },
+    { url = "https://files.pythonhosted.org/packages/b6/d0/1fe47a98ce0df229238b77611340aff92d52691bcbc10583303181abf7fc/numpy-2.4.3-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:b346845443716c8e542d54112966383b448f4a3ba5c66409771b8c0889485dd3", size = 16665297, upload-time = "2026-03-09T07:56:52.296Z" },
+    { url = "https://files.pythonhosted.org/packages/27/d9/4e7c3f0e68dfa91f21c6fb6cf839bc829ec920688b1ce7ec722b1a6202fb/numpy-2.4.3-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:2629289168f4897a3c4e23dc98d6f1731f0fc0fe52fb9db19f974041e4cc12b9", size = 14691853, upload-time = "2026-03-09T07:56:54.992Z" },
+    { url = "https://files.pythonhosted.org/packages/3a/66/bd096b13a87549683812b53ab211e6d413497f84e794fb3c39191948da97/numpy-2.4.3-cp313-cp313-macosx_14_0_arm64.whl", hash = "sha256:bb2e3cf95854233799013779216c57e153c1ee67a0bf92138acca0e429aefaee", size = 5198435, upload-time = "2026-03-09T07:56:57.184Z" },
+    { url = "https://files.pythonhosted.org/packages/a2/2f/687722910b5a5601de2135c891108f51dfc873d8e43c8ed9f4ebb440b4a2/numpy-2.4.3-cp313-cp313-macosx_14_0_x86_64.whl", hash = "sha256:7f3408ff897f8ab07a07fbe2823d7aee6ff644c097cc1f90382511fe982f647f", size = 6546347, upload-time = "2026-03-09T07:56:59.531Z" },
+    { url = "https://files.pythonhosted.org/packages/bf/ec/7971c4e98d86c564750393fab8d7d83d0a9432a9d78bb8a163a6dc59967a/numpy-2.4.3-cp313-cp313-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:decb0eb8a53c3b009b0962378065589685d66b23467ef5dac16cbe818afde27f", size = 15664626, upload-time = "2026-03-09T07:57:01.385Z" },
+    { url = "https://files.pythonhosted.org/packages/7e/eb/7daecbea84ec935b7fc732e18f532073064a3816f0932a40a17f3349185f/numpy-2.4.3-cp313-cp313-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:d5f51900414fc9204a0e0da158ba2ac52b75656e7dce7e77fb9f84bfa343b4cc", size = 16608916, upload-time = "2026-03-09T07:57:04.008Z" },
+    { url = "https://files.pythonhosted.org/packages/df/58/2a2b4a817ffd7472dca4421d9f0776898b364154e30c95f42195041dc03b/numpy-2.4.3-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:6bd06731541f89cdc01b261ba2c9e037f1543df7472517836b78dfb15bd6e476", size = 17015824, upload-time = "2026-03-09T07:57:06.347Z" },
+    { url = "https://files.pythonhosted.org/packages/4a/ca/627a828d44e78a418c55f82dd4caea8ea4a8ef24e5144d9e71016e52fb40/numpy-2.4.3-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:22654fe6be0e5206f553a9250762c653d3698e46686eee53b399ab90da59bd92", size = 18334581, upload-time = "2026-03-09T07:57:09.114Z" },
+    { url = "https://files.pythonhosted.org/packages/cd/c0/76f93962fc79955fcba30a429b62304332345f22d4daec1cb33653425643/numpy-2.4.3-cp313-cp313-win32.whl", hash = "sha256:d71e379452a2f670ccb689ec801b1218cd3983e253105d6e83780967e899d687", size = 5958618, upload-time = "2026-03-09T07:57:11.432Z" },
+    { url = "https://files.pythonhosted.org/packages/b1/3c/88af0040119209b9b5cb59485fa48b76f372c73068dbf9254784b975ac53/numpy-2.4.3-cp313-cp313-win_amd64.whl", hash = "sha256:0a60e17a14d640f49146cb38e3f105f571318db7826d9b6fef7e4dce758faecd", size = 12312824, upload-time = "2026-03-09T07:57:13.586Z" },
+    { url = "https://files.pythonhosted.org/packages/58/ce/3d07743aced3d173f877c3ef6a454c2174ba42b584ab0b7e6d99374f51ed/numpy-2.4.3-cp313-cp313-win_arm64.whl", hash = "sha256:c9619741e9da2059cd9c3f206110b97583c7152c1dc9f8aafd4beb450ac1c89d", size = 10221218, upload-time = "2026-03-09T07:57:16.183Z" },
+    { url = "https://files.pythonhosted.org/packages/62/09/d96b02a91d09e9d97862f4fc8bfebf5400f567d8eb1fe4b0cc4795679c15/numpy-2.4.3-cp313-cp313t-macosx_11_0_arm64.whl", hash = "sha256:7aa4e54f6469300ebca1d9eb80acd5253cdfa36f2c03d79a35883687da430875", size = 14819570, upload-time = "2026-03-09T07:57:18.564Z" },
+    { url = "https://files.pythonhosted.org/packages/b5/ca/0b1aba3905fdfa3373d523b2b15b19029f4f3031c87f4066bd9d20ef6c6b/numpy-2.4.3-cp313-cp313t-macosx_14_0_arm64.whl", hash = "sha256:d1b90d840b25874cf5cd20c219af10bac3667db3876d9a495609273ebe679070", size = 5326113, upload-time = "2026-03-09T07:57:21.052Z" },
+    { url = "https://files.pythonhosted.org/packages/c0/63/406e0fd32fcaeb94180fd6a4c41e55736d676c54346b7efbce548b94a914/numpy-2.4.3-cp313-cp313t-macosx_14_0_x86_64.whl", hash = "sha256:a749547700de0a20a6718293396ec237bb38218049cfce788e08fcb716e8cf73", size = 6646370, upload-time = "2026-03-09T07:57:22.804Z" },
+    { url = "https://files.pythonhosted.org/packages/b6/d0/10f7dc157d4b37af92720a196be6f54f889e90dcd30dce9dc657ed92c257/numpy-2.4.3-cp313-cp313t-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:94f3c4a151a2e529adf49c1d54f0f57ff8f9b233ee4d44af623a81553ab86368", size = 15723499, upload-time = "2026-03-09T07:57:24.693Z" },
+    { url = "https://files.pythonhosted.org/packages/66/f1/d1c2bf1161396629701bc284d958dc1efa3a5a542aab83cf11ee6eb4cba5/numpy-2.4.3-cp313-cp313t-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:22c31dc07025123aedf7f2db9e91783df13f1776dc52c6b22c620870dc0fab22", size = 16657164, upload-time = "2026-03-09T07:57:27.676Z" },
+    { url = "https://files.pythonhosted.org/packages/1a/be/cca19230b740af199ac47331a21c71e7a3d0ba59661350483c1600d28c37/numpy-2.4.3-cp313-cp313t-musllinux_1_2_aarch64.whl", hash = "sha256:148d59127ac95979d6f07e4d460f934ebdd6eed641db9c0db6c73026f2b2101a", size = 17081544, upload-time = "2026-03-09T07:57:30.664Z" },
+    { url = "https://files.pythonhosted.org/packages/b9/c5/9602b0cbb703a0936fb40f8a95407e8171935b15846de2f0776e08af04c7/numpy-2.4.3-cp313-cp313t-musllinux_1_2_x86_64.whl", hash = "sha256:a97cbf7e905c435865c2d939af3d93f99d18eaaa3cabe4256f4304fb51604349", size = 18380290, upload-time = "2026-03-09T07:57:33.763Z" },
+    { url = "https://files.pythonhosted.org/packages/ed/81/9f24708953cd30be9ee36ec4778f4b112b45165812f2ada4cc5ea1c1f254/numpy-2.4.3-cp313-cp313t-win32.whl", hash = "sha256:be3b8487d725a77acccc9924f65fd8bce9af7fac8c9820df1049424a2115af6c", size = 6082814, upload-time = "2026-03-09T07:57:36.491Z" },
+    { url = "https://files.pythonhosted.org/packages/e2/9e/52f6eaa13e1a799f0ab79066c17f7016a4a8ae0c1aefa58c82b4dab690b4/numpy-2.4.3-cp313-cp313t-win_amd64.whl", hash = "sha256:1ec84fd7c8e652b0f4aaaf2e6e9cc8eaa9b1b80a537e06b2e3a2fb176eedcb26", size = 12452673, upload-time = "2026-03-09T07:57:38.281Z" },
+    { url = "https://files.pythonhosted.org/packages/c4/04/b8cece6ead0b30c9fbd99bb835ad7ea0112ac5f39f069788c5558e3b1ab2/numpy-2.4.3-cp313-cp313t-win_arm64.whl", hash = "sha256:120df8c0a81ebbf5b9020c91439fccd85f5e018a927a39f624845be194a2be02", size = 10290907, upload-time = "2026-03-09T07:57:40.747Z" },
+    { url = "https://files.pythonhosted.org/packages/70/ae/3936f79adebf8caf81bd7a599b90a561334a658be4dcc7b6329ebf4ee8de/numpy-2.4.3-cp314-cp314-macosx_10_15_x86_64.whl", hash = "sha256:5884ce5c7acfae1e4e1b6fde43797d10aa506074d25b531b4f54bde33c0c31d4", size = 16664563, upload-time = "2026-03-09T07:57:43.817Z" },
+    { url = "https://files.pythonhosted.org/packages/9b/62/760f2b55866b496bb1fa7da2a6db076bef908110e568b02fcfc1422e2a3a/numpy-2.4.3-cp314-cp314-macosx_11_0_arm64.whl", hash = "sha256:297837823f5bc572c5f9379b0c9f3a3365f08492cbdc33bcc3af174372ebb168", size = 14702161, upload-time = "2026-03-09T07:57:46.169Z" },
+    { url = "https://files.pythonhosted.org/packages/32/af/a7a39464e2c0a21526fb4fb76e346fb172ebc92f6d1c7a07c2c139cc17b1/numpy-2.4.3-cp314-cp314-macosx_14_0_arm64.whl", hash = "sha256:a111698b4a3f8dcbe54c64a7708f049355abd603e619013c346553c1fd4ca90b", size = 5208738, upload-time = "2026-03-09T07:57:48.506Z" },
+    { url = "https://files.pythonhosted.org/packages/29/8c/2a0cf86a59558fa078d83805589c2de490f29ed4fb336c14313a161d358a/numpy-2.4.3-cp314-cp314-macosx_14_0_x86_64.whl", hash = "sha256:4bd4741a6a676770e0e97fe9ab2e51de01183df3dcbcec591d26d331a40de950", size = 6543618, upload-time = "2026-03-09T07:57:50.591Z" },
+    { url = "https://files.pythonhosted.org/packages/aa/b8/612ce010c0728b1c363fa4ea3aa4c22fe1c5da1de008486f8c2f5cb92fae/numpy-2.4.3-cp314-cp314-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:54f29b877279d51e210e0c80709ee14ccbbad647810e8f3d375561c45ef613dd", size = 15680676, upload-time = "2026-03-09T07:57:52.34Z" },
+    { url = "https://files.pythonhosted.org/packages/a9/7e/4f120ecc54ba26ddf3dc348eeb9eb063f421de65c05fc961941798feea18/numpy-2.4.3-cp314-cp314-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:679f2a834bae9020f81534671c56fd0cc76dd7e5182f57131478e23d0dc59e24", size = 16613492, upload-time = "2026-03-09T07:57:54.91Z" },
+    { url = "https://files.pythonhosted.org/packages/2c/86/1b6020db73be330c4b45d5c6ee4295d59cfeef0e3ea323959d053e5a6909/numpy-2.4.3-cp314-cp314-musllinux_1_2_aarch64.whl", hash = "sha256:d84f0f881cb2225c2dfd7f78a10a5645d487a496c6668d6cc39f0f114164f3d0", size = 17031789, upload-time = "2026-03-09T07:57:57.641Z" },
+    { url = "https://files.pythonhosted.org/packages/07/3a/3b90463bf41ebc21d1b7e06079f03070334374208c0f9a1f05e4ae8455e7/numpy-2.4.3-cp314-cp314-musllinux_1_2_x86_64.whl", hash = "sha256:d213c7e6e8d211888cc359bab7199670a00f5b82c0978b9d1c75baf1eddbeac0", size = 18339941, upload-time = "2026-03-09T07:58:00.577Z" },
+    { url = "https://files.pythonhosted.org/packages/a8/74/6d736c4cd962259fd8bae9be27363eb4883a2f9069763747347544c2a487/numpy-2.4.3-cp314-cp314-win32.whl", hash = "sha256:52077feedeff7c76ed7c9f1a0428558e50825347b7545bbb8523da2cd55c547a", size = 6007503, upload-time = "2026-03-09T07:58:03.331Z" },
+    { url = "https://files.pythonhosted.org/packages/48/39/c56ef87af669364356bb011922ef0734fc49dad51964568634c72a009488/numpy-2.4.3-cp314-cp314-win_amd64.whl", hash = "sha256:0448e7f9caefb34b4b7dd2b77f21e8906e5d6f0365ad525f9f4f530b13df2afc", size = 12444915, upload-time = "2026-03-09T07:58:06.353Z" },
+    { url = "https://files.pythonhosted.org/packages/9d/1f/ab8528e38d295fd349310807496fabb7cf9fe2e1f70b97bc20a483ea9d4a/numpy-2.4.3-cp314-cp314-win_arm64.whl", hash = "sha256:b44fd60341c4d9783039598efadd03617fa28d041fc37d22b62d08f2027fa0e7", size = 10494875, upload-time = "2026-03-09T07:58:08.734Z" },
+    { url = "https://files.pythonhosted.org/packages/e6/ef/b7c35e4d5ef141b836658ab21a66d1a573e15b335b1d111d31f26c8ef80f/numpy-2.4.3-cp314-cp314t-macosx_11_0_arm64.whl", hash = "sha256:0a195f4216be9305a73c0e91c9b026a35f2161237cf1c6de9b681637772ea657", size = 14822225, upload-time = "2026-03-09T07:58:11.034Z" },
+    { url = "https://files.pythonhosted.org/packages/cd/8d/7730fa9278cf6648639946cc816e7cc89f0d891602584697923375f801ed/numpy-2.4.3-cp314-cp314t-macosx_14_0_arm64.whl", hash = "sha256:cd32fbacb9fd1bf041bf8e89e4576b6f00b895f06d00914820ae06a616bdfef7", size = 5328769, upload-time = "2026-03-09T07:58:13.67Z" },
+    { url = "https://files.pythonhosted.org/packages/47/01/d2a137317c958b074d338807c1b6a383406cdf8b8e53b075d804cc3d211d/numpy-2.4.3-cp314-cp314t-macosx_14_0_x86_64.whl", hash = "sha256:2e03c05abaee1f672e9d67bc858f300b5ccba1c21397211e8d77d98350972093", size = 6649461, upload-time = "2026-03-09T07:58:15.912Z" },
+    { url = "https://files.pythonhosted.org/packages/5c/34/812ce12bc0f00272a4b0ec0d713cd237cb390666eb6206323d1cc9cedbb2/numpy-2.4.3-cp314-cp314t-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:7d1ce23cce91fcea443320a9d0ece9b9305d4368875bab09538f7a5b4131938a", size = 15725809, upload-time = "2026-03-09T07:58:17.787Z" },
+    { url = "https://files.pythonhosted.org/packages/25/c0/2aed473a4823e905e765fee3dc2cbf504bd3e68ccb1150fbdabd5c39f527/numpy-2.4.3-cp314-cp314t-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:c59020932feb24ed49ffd03704fbab89f22aa9c0d4b180ff45542fe8918f5611", size = 16655242, upload-time = "2026-03-09T07:58:20.476Z" },
+    { url = "https://files.pythonhosted.org/packages/f2/c8/7e052b2fc87aa0e86de23f20e2c42bd261c624748aa8efd2c78f7bb8d8c6/numpy-2.4.3-cp314-cp314t-musllinux_1_2_aarch64.whl", hash = "sha256:9684823a78a6cd6ad7511fc5e25b07947d1d5b5e2812c93fe99d7d4195130720", size = 17080660, upload-time = "2026-03-09T07:58:23.067Z" },
+    { url = "https://files.pythonhosted.org/packages/f3/3d/0876746044db2adcb11549f214d104f2e1be00f07a67edbb4e2812094847/numpy-2.4.3-cp314-cp314t-musllinux_1_2_x86_64.whl", hash = "sha256:0200b25c687033316fb39f0ff4e3e690e8957a2c3c8d22499891ec58c37a3eb5", size = 18380384, upload-time = "2026-03-09T07:58:25.839Z" },
+    { url = "https://files.pythonhosted.org/packages/07/12/8160bea39da3335737b10308df4f484235fd297f556745f13092aa039d3b/numpy-2.4.3-cp314-cp314t-win32.whl", hash = "sha256:5e10da9e93247e554bb1d22f8edc51847ddd7dde52d85ce31024c1b4312bfba0", size = 6154547, upload-time = "2026-03-09T07:58:28.289Z" },
+    { url = "https://files.pythonhosted.org/packages/42/f3/76534f61f80d74cc9cdf2e570d3d4eeb92c2280a27c39b0aaf471eda7b48/numpy-2.4.3-cp314-cp314t-win_amd64.whl", hash = "sha256:45f003dbdffb997a03da2d1d0cb41fbd24a87507fb41605c0420a3db5bd4667b", size = 12633645, upload-time = "2026-03-09T07:58:30.384Z" },
+    { url = "https://files.pythonhosted.org/packages/1f/b6/7c0d4334c15983cec7f92a69e8ce9b1e6f31857e5ee3a413ac424e6bd63d/numpy-2.4.3-cp314-cp314t-win_arm64.whl", hash = "sha256:4d382735cecd7bcf090172489a525cd7d4087bc331f7df9f60ddc9a296cf208e", size = 10565454, upload-time = "2026-03-09T07:58:33.031Z" },
+    { url = "https://files.pythonhosted.org/packages/64/e4/4dab9fb43c83719c29241c535d9e07be73bea4bc0c6686c5816d8e1b6689/numpy-2.4.3-pp311-pypy311_pp73-macosx_10_15_x86_64.whl", hash = "sha256:c6b124bfcafb9e8d3ed09130dbee44848c20b3e758b6bbf006e641778927c028", size = 16834892, upload-time = "2026-03-09T07:58:35.334Z" },
+    { url = "https://files.pythonhosted.org/packages/c9/29/f8b6d4af90fed3dfda84ebc0df06c9833d38880c79ce954e5b661758aa31/numpy-2.4.3-pp311-pypy311_pp73-macosx_11_0_arm64.whl", hash = "sha256:76dbb9d4e43c16cf9aa711fcd8de1e2eeb27539dcefb60a1d5e9f12fae1d1ed8", size = 14893070, upload-time = "2026-03-09T07:58:37.7Z" },
+    { url = "https://files.pythonhosted.org/packages/9a/04/a19b3c91dbec0a49269407f15d5753673a09832daed40c45e8150e6fa558/numpy-2.4.3-pp311-pypy311_pp73-macosx_14_0_arm64.whl", hash = "sha256:29363fbfa6f8ee855d7569c96ce524845e3d726d6c19b29eceec7dd555dab152", size = 5399609, upload-time = "2026-03-09T07:58:39.853Z" },
+    { url = "https://files.pythonhosted.org/packages/79/34/4d73603f5420eab89ea8a67097b31364bf7c30f811d4dd84b1659c7476d9/numpy-2.4.3-pp311-pypy311_pp73-macosx_14_0_x86_64.whl", hash = "sha256:bc71942c789ef415a37f0d4eab90341425a00d538cd0642445d30b41023d3395", size = 6714355, upload-time = "2026-03-09T07:58:42.365Z" },
+    { url = "https://files.pythonhosted.org/packages/58/ad/1100d7229bb248394939a12a8074d485b655e8ed44207d328fdd7fcebc7b/numpy-2.4.3-pp311-pypy311_pp73-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:7e58765ad74dcebd3ef0208a5078fba32dc8ec3578fe84a604432950cd043d79", size = 15800434, upload-time = "2026-03-09T07:58:44.837Z" },
+    { url = "https://files.pythonhosted.org/packages/0c/fd/16d710c085d28ba4feaf29ac60c936c9d662e390344f94a6beaa2ac9899b/numpy-2.4.3-pp311-pypy311_pp73-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:8e236dbda4e1d319d681afcbb136c0c4a8e0f1a5c58ceec2adebb547357fe857", size = 16729409, upload-time = "2026-03-09T07:58:47.972Z" },
+    { url = "https://files.pythonhosted.org/packages/57/a7/b35835e278c18b85206834b3aa3abe68e77a98769c59233d1f6300284781/numpy-2.4.3-pp311-pypy311_pp73-win_amd64.whl", hash = "sha256:4b42639cdde6d24e732ff823a3fa5b701d8acad89c4142bc1d0bd6dc85200ba5", size = 12504685, upload-time = "2026-03-09T07:58:50.525Z" },
+]
+
 [[package]]
 name = "openplanter-agent"
 version = "0.1.0"
@@ -131,18 +278,27 @@ dependencies = [
 
 [package.optional-dependencies]
 dev = [
+    { name = "networkx", version = "3.4.2", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version < '3.11'" },
+    { name = "networkx", version = "3.6.1", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version >= '3.11'" },
+    { name = "numpy", version = "2.2.6", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version < '3.11'" },
+    { name = "numpy", version = "2.4.3", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version >= '3.11'" },
     { name = "pytest" },
     { name = "pytest-asyncio" },
 ]
 textual = [
     { name = "networkx", version = "3.4.2", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version < '3.11'" },
     { name = "networkx", version = "3.6.1", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version >= '3.11'" },
+    { name = "numpy", version = "2.2.6", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version < '3.11'" },
+    { name = "numpy", version = "2.4.3", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version >= '3.11'" },
     { name = "textual" },
 ]
 
 [package.metadata]
 requires-dist = [
+    { name = "networkx", marker = "extra == 'dev'", specifier = ">=3.2" },
     { name = "networkx", marker = "extra == 'textual'", specifier = ">=3.2" },
+    { name = "numpy", marker = "extra == 'dev'", specifier = ">=1.26" },
+    { name = "numpy", marker = "extra == 'textual'", specifier = ">=1.26" },
     { name = "prompt-toolkit", specifier = ">=3.0" },
     { name = "pyfiglet", specifier = ">=1.0" },
     { name = "pytest", marker = "extra == 'dev'", specifier = ">=8.0" },

From b366061727c63aaf9287de11a4847e5afecd8bc4 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Sat, 14 Mar 2026 14:23:13 -0400
Subject: [PATCH 31/58] Add structured next-step candidate actions

---
 agent/investigation_state.py                  | 698 +++++++++++-
 agent/prompts.py                              |   7 +-
 agent/runtime.py                              |   2 +
 .../op-core/src/engine/investigation_state.rs | 989 +++++++++++++++++-
 .../crates/op-core/src/engine/mod.rs          |   9 +
 .../crates/op-core/src/prompts.rs             |   7 +
 .../crates/op-tauri/src/commands/agent.rs     |   4 +
 tests/test_engine.py                          |  10 +
 tests/test_investigation_state.py             |  96 ++
 tests/test_session.py                         |  15 +-
 10 files changed, 1813 insertions(+), 24 deletions(-)

diff --git a/agent/investigation_state.py b/agent/investigation_state.py
index 534da606..2a94813d 100644
--- a/agent/investigation_state.py
+++ b/agent/investigation_state.py
@@ -9,6 +9,15 @@
 SCHEMA_VERSION = "1.0.0"
 ONTOLOGY_NAMESPACE = "openplanter.core"
 ONTOLOGY_VERSION = "2026-03"
+LOW_CONFIDENCE_THRESHOLD = 0.60
+VERY_LOW_CONFIDENCE_THRESHOLD = 0.40
+MAX_CANDIDATE_ACTIONS = 24
+REQUIRED_EVIDENCE_COUNT = 1
+_PRIORITY_RANK = {"critical": 0, "high": 1, "medium": 2, "low": 3}
+_SUGGESTED_TOOLS = {
+    "search": ["web_search", "fetch_url", "search_files", "read_file"],
+    "verify_claim": ["web_search", "fetch_url", "read_file", "search_files"],
+}
 _LEGACY_KNOWN_KEYS = {
     "session_id",
     "saved_at",
@@ -234,27 +243,37 @@ def build_question_reasoning_packet(
     questions = state.get("questions") if isinstance(state.get("questions"), dict) else {}
     claims = state.get("claims") if isinstance(state.get("claims"), dict) else {}
     evidence = state.get("evidence") if isinstance(state.get("evidence"), dict) else {}
+    provenance_nodes = state.get("provenance_nodes") if isinstance(state.get("provenance_nodes"), dict) else {}
+    entities = state.get("entities") if isinstance(state.get("entities"), dict) else {}
+    links = state.get("links") if isinstance(state.get("links"), dict) else {}
 
     unresolved_questions: list[dict[str, Any]] = []
+    question_records: dict[str, dict[str, Any]] = {}
     for question_id, raw_question in questions.items():
         if not isinstance(raw_question, dict):
             continue
+        origin = raw_question.get("origin") if isinstance(raw_question.get("origin"), dict) else {}
         status = str(raw_question.get("status") or "open").lower()
         if status in {"resolved", "closed", "wont_fix", "won't_fix"}:
             continue
 
-        unresolved_questions.append(
-            {
-                "id": str(raw_question.get("id") or question_id),
-                "question": str(raw_question.get("question_text") or raw_question.get("question") or ""),
-                "status": status,
-                "priority": str(raw_question.get("priority") or "medium").lower(),
-                "claim_ids": _id_list(raw_question.get("claim_ids") or raw_question.get("claims")),
-                "evidence_ids": _id_list(raw_question.get("evidence_ids"))[:max_evidence_per_item],
-                "triggers": _id_list(raw_question.get("trigger") or raw_question.get("triggers")),
-                "updated_at": str(raw_question.get("updated_at") or ""),
-            }
-        )
+        normalized_question = {
+            "id": str(raw_question.get("id") or question_id),
+            "question": str(raw_question.get("question_text") or raw_question.get("question") or ""),
+            "status": status,
+            "priority": str(raw_question.get("priority") or "medium").lower(),
+            "claim_ids": _id_list(raw_question.get("claim_ids") or raw_question.get("claims") or origin.get("claim_ids")),
+            "evidence_ids": _id_list(raw_question.get("evidence_ids") or origin.get("evidence_ids"))[:max_evidence_per_item],
+            "triggers": _id_list(
+                raw_question.get("trigger")
+                or raw_question.get("triggers")
+                or origin.get("trigger")
+                or origin.get("triggers")
+            ),
+            "updated_at": str(raw_question.get("updated_at") or ""),
+        }
+        unresolved_questions.append(normalized_question)
+        question_records[normalized_question["id"]] = raw_question
 
     unresolved_questions.sort(key=_question_priority_sort_key)
     focus_questions = unresolved_questions[: max(1, max_questions)]
@@ -263,32 +282,43 @@ def build_question_reasoning_packet(
     contested: list[dict[str, Any]] = []
     unresolved: list[dict[str, Any]] = []
     contradictions: list[dict[str, Any]] = []
+    claim_records: dict[str, dict[str, Any]] = {}
+    claim_summaries: dict[str, dict[str, Any]] = {}
 
     for claim_id, raw_claim in claims.items():
         if not isinstance(raw_claim, dict):
             continue
+        normalized_claim_id = str(raw_claim.get("id") or claim_id)
         claim_status = str(raw_claim.get("status") or "unresolved").lower()
-        support_ids = _id_list(raw_claim.get("support_evidence_ids") or raw_claim.get("evidence_ids"))
+        support_ids = _id_list(
+            raw_claim.get("support_evidence_ids")
+            or raw_claim.get("evidence_support_ids")
+            or raw_claim.get("evidence_ids")
+        )
         contradiction_ids = _id_list(
-            raw_claim.get("contradiction_evidence_ids") or raw_claim.get("contradict_evidence_ids")
+            raw_claim.get("contradiction_evidence_ids")
+            or raw_claim.get("evidence_contra_ids")
+            or raw_claim.get("contradict_evidence_ids")
         )
         confidence = raw_claim.get("confidence")
         if confidence is None:
             confidence = raw_claim.get("confidence_score")
 
         claim_summary = {
-            "id": str(raw_claim.get("id") or claim_id),
+            "id": normalized_claim_id,
             "claim": str(raw_claim.get("claim_text") or raw_claim.get("text") or ""),
             "status": claim_status,
             "confidence": confidence,
             "support_evidence_ids": support_ids[:max_evidence_per_item],
             "contradiction_evidence_ids": contradiction_ids[:max_evidence_per_item],
         }
+        claim_records[normalized_claim_id] = raw_claim
+        claim_summaries[normalized_claim_id] = claim_summary
 
         if contradiction_ids:
             contradictions.append(
                 {
-                    "claim_id": str(raw_claim.get("id") or claim_id),
+                    "claim_id": normalized_claim_id,
                     "support_evidence_ids": support_ids[:max_evidence_per_item],
                     "contradiction_evidence_ids": contradiction_ids[:max_evidence_per_item],
                 }
@@ -313,6 +343,26 @@ def build_question_reasoning_packet(
             "confidence_id": record.get("confidence_id"),
         }
 
+    question_ids_by_claim: dict[str, list[str]] = {}
+    for question in unresolved_questions:
+        for claim_id in question["claim_ids"]:
+            question_ids_by_claim.setdefault(claim_id, []).append(question["id"])
+
+    candidate_actions = _build_candidate_actions(
+        focus_questions=focus_questions,
+        unresolved_questions=unresolved_questions,
+        question_records=question_records,
+        question_ids_by_claim=question_ids_by_claim,
+        claim_records=claim_records,
+        claim_summaries=claim_summaries,
+        evidence=evidence,
+        evidence_index=evidence_index,
+        provenance_nodes=provenance_nodes,
+        entities=entities,
+        links=links,
+        max_evidence_per_item=max_evidence_per_item,
+    )
+
     return {
         "reasoning_mode": "question_centric",
         "loop": [
@@ -331,6 +381,7 @@ def build_question_reasoning_packet(
         },
         "contradictions": contradictions,
         "evidence_index": evidence_index,
+        "candidate_actions": candidate_actions,
     }
 
 
@@ -359,10 +410,621 @@ def _id_list(value: Any) -> list[str]:
 
 
 def _question_priority_sort_key(question: dict[str, Any]) -> tuple[int, str]:
-    rank = {"critical": 0, "high": 1, "medium": 2, "low": 3}
     priority = str(question.get("priority") or "medium").lower()
     question_id = str(question.get("id") or "")
-    return (rank.get(priority, 9), question_id)
+    return (_PRIORITY_RANK.get(priority, 9), question_id)
+
+
+def _build_candidate_actions(
+    *,
+    focus_questions: list[dict[str, Any]],
+    unresolved_questions: list[dict[str, Any]],
+    question_records: dict[str, dict[str, Any]],
+    question_ids_by_claim: dict[str, list[str]],
+    claim_records: dict[str, dict[str, Any]],
+    claim_summaries: dict[str, dict[str, Any]],
+    evidence: dict[str, Any],
+    evidence_index: dict[str, dict[str, Any]],
+    provenance_nodes: dict[str, Any],
+    entities: dict[str, Any],
+    links: dict[str, Any],
+    max_evidence_per_item: int,
+) -> list[dict[str, Any]]:
+    actions: list[dict[str, Any]] = []
+    seen_ids: set[str] = set()
+
+    for question in focus_questions:
+        question_id = question["id"]
+        linked_claim_ids = [claim_id for claim_id in question["claim_ids"] if claim_id in claim_summaries]
+        action_type = "verify_claim" if linked_claim_ids else "search"
+        evidence_ids = _limit_unique_ids(
+            question["evidence_ids"]
+            + [
+                evidence_id
+                for claim_id in linked_claim_ids
+                for evidence_id in _claim_evidence_ids(claim_summaries[claim_id])
+            ],
+            max_evidence_per_item,
+        )
+        claim_statuses = [str(claim_summaries[claim_id]["status"]) for claim_id in linked_claim_ids]
+        reason_codes = ["question_unresolved"]
+        if any(status in {"unresolved", "proposed"} for status in claim_statuses):
+            reason_codes.append("claim_unresolved")
+        if any(_claim_is_low_confidence(claim_summaries[claim_id]) for claim_id in linked_claim_ids):
+            reason_codes.append("claim_low_confidence")
+        action = {
+            "id": f"ca_q_{question_id}",
+            "action_type": action_type,
+            "status": "proposed",
+            "priority": _normalize_priority(question.get("priority")),
+            "opened_by_question_id": question_id,
+            "target_question_ids": [question_id],
+            "target_claim_ids": linked_claim_ids,
+            "rationale": {
+                "reason_codes": _dedupe_strings(reason_codes),
+                "question_status": question.get("status"),
+                "claim_statuses": sorted(set(claim_statuses)),
+                "current_evidence_count": len(evidence_ids),
+                "blocking": True,
+            },
+            "required_inputs": {
+                "question_ids": [question_id],
+                "claim_ids": linked_claim_ids,
+                "evidence_ids": evidence_ids,
+                "entity_ids": _limit_unique_ids(
+                    _collect_related_entity_ids(
+                        question_records.get(question_id, {}),
+                        *[claim_records.get(claim_id, {}) for claim_id in linked_claim_ids],
+                    ),
+                    max_evidence_per_item,
+                ),
+                "external_dependencies": [],
+            },
+            "required_sources": _collect_required_sources(
+                question_records.get(question_id, {}),
+                *[claim_records.get(claim_id, {}) for claim_id in linked_claim_ids],
+                evidence_ids=evidence_ids,
+                evidence=evidence,
+                provenance_nodes=provenance_nodes,
+            ),
+            "suggested_tools": list(_SUGGESTED_TOOLS[action_type]),
+            "expected_payoff": _build_expected_payoff(action_type, _normalize_priority(question.get("priority"))),
+            "evidence_gap_refs": _dedupe_gap_refs(
+                _build_question_gap_refs(question_id, evidence_ids)
+                + [
+                    gap
+                    for claim_id in linked_claim_ids
+                    for gap in _build_claim_gap_refs(
+                        claim_id=claim_id,
+                        opened_by_question_id=question_id,
+                        claim_summary=claim_summaries[claim_id],
+                    )
+                ]
+            ),
+            "ontology_object_refs": _dedupe_object_refs(
+                _build_ontology_object_refs(
+                    question_ids=[question_id],
+                    claim_ids=linked_claim_ids,
+                    evidence_ids=evidence_ids,
+                    question_records=question_records,
+                    claim_records=claim_records,
+                    evidence=evidence,
+                    provenance_nodes=provenance_nodes,
+                    entities=entities,
+                    links=links,
+                )
+            ),
+        }
+        if action["id"] not in seen_ids:
+            seen_ids.add(action["id"])
+            actions.append(action)
+
+    for claim_id, claim_summary in claim_summaries.items():
+        claim_status = str(claim_summary.get("status") or "unresolved").lower()
+        confidence = _parse_confidence(claim_summary.get("confidence"))
+        if claim_status in {"retracted", "resolved", "closed"}:
+            continue
+        if not (
+            claim_status in {"unresolved", "proposed"}
+            or confidence is None
+            or confidence < LOW_CONFIDENCE_THRESHOLD
+        ):
+            continue
+        opened_by_question_id = next(iter(question_ids_by_claim.get(claim_id, [])), None)
+        question_priority = None
+        if opened_by_question_id is not None:
+            question_priority = _question_priority(unresolved_questions, opened_by_question_id)
+        priority = _merge_priority(_claim_priority(claim_status, confidence), question_priority)
+        evidence_ids = _claim_evidence_ids(claim_summary)
+        action = {
+            "id": f"ca_c_{claim_id}",
+            "action_type": "verify_claim",
+            "status": "proposed",
+            "priority": priority,
+            "opened_by_question_id": opened_by_question_id,
+            "target_question_ids": [opened_by_question_id] if opened_by_question_id else [],
+            "target_claim_ids": [claim_id],
+            "rationale": {
+                "reason_codes": _dedupe_strings(
+                    _claim_reason_codes(claim_status, confidence)
+                    + (["question_unresolved"] if opened_by_question_id else [])
+                ),
+                "claim_status": claim_status,
+                "confidence": confidence,
+                "current_evidence_count": len(evidence_ids),
+                "blocking": True,
+            },
+            "required_inputs": {
+                "question_ids": [opened_by_question_id] if opened_by_question_id else [],
+                "claim_ids": [claim_id],
+                "evidence_ids": evidence_ids,
+                "entity_ids": _limit_unique_ids(
+                    _collect_related_entity_ids(
+                        claim_records.get(claim_id, {}),
+                        question_records.get(opened_by_question_id, {}) if opened_by_question_id else {},
+                    ),
+                    max_evidence_per_item,
+                ),
+                "external_dependencies": [],
+            },
+            "required_sources": _collect_required_sources(
+                claim_records.get(claim_id, {}),
+                question_records.get(opened_by_question_id, {}) if opened_by_question_id else {},
+                evidence_ids=evidence_ids,
+                evidence=evidence,
+                provenance_nodes=provenance_nodes,
+            ),
+            "suggested_tools": list(_SUGGESTED_TOOLS["verify_claim"]),
+            "expected_payoff": _build_expected_payoff("verify_claim", priority),
+            "evidence_gap_refs": _dedupe_gap_refs(
+                _build_claim_gap_refs(
+                    claim_id=claim_id,
+                    opened_by_question_id=opened_by_question_id,
+                    claim_summary=claim_summary,
+                )
+            ),
+            "ontology_object_refs": _dedupe_object_refs(
+                _build_ontology_object_refs(
+                    question_ids=[opened_by_question_id] if opened_by_question_id else [],
+                    claim_ids=[claim_id],
+                    evidence_ids=evidence_ids,
+                    question_records=question_records,
+                    claim_records=claim_records,
+                    evidence=evidence,
+                    provenance_nodes=provenance_nodes,
+                    entities=entities,
+                    links=links,
+                )
+            ),
+        }
+        if action["id"] not in seen_ids:
+            seen_ids.add(action["id"])
+            actions.append(action)
+
+    actions.sort(key=_candidate_action_sort_key)
+    return actions[:MAX_CANDIDATE_ACTIONS]
+
+
+def _normalize_priority(priority: Any) -> str:
+    value = str(priority or "medium").lower()
+    return value if value in _PRIORITY_RANK else "medium"
+
+
+def _question_priority(questions: list[dict[str, Any]], question_id: str) -> str | None:
+    for question in questions:
+        if question.get("id") == question_id:
+            return _normalize_priority(question.get("priority"))
+    return None
+
+
+def _merge_priority(*priorities: str | None) -> str:
+    normalized = [_normalize_priority(priority) for priority in priorities if priority]
+    if not normalized:
+        return "medium"
+    return min(normalized, key=lambda value: (_PRIORITY_RANK.get(value, 9), value))
+
+
+def _claim_priority(claim_status: str, confidence: float | None) -> str:
+    if claim_status in {"unresolved", "proposed"}:
+        return "high"
+    if confidence is None:
+        return "high"
+    if confidence <= VERY_LOW_CONFIDENCE_THRESHOLD:
+        return "high"
+    if confidence < LOW_CONFIDENCE_THRESHOLD:
+        return "medium"
+    return "low"
+
+
+def _parse_confidence(value: Any) -> float | None:
+    if value is None or isinstance(value, bool):
+        return None
+    if isinstance(value, (int, float)):
+        parsed = float(value)
+    elif isinstance(value, str):
+        try:
+            parsed = float(value.strip())
+        except ValueError:
+            return None
+    else:
+        return None
+    return max(0.0, min(1.0, parsed))
+
+
+def _claim_evidence_ids(claim_summary: dict[str, Any]) -> list[str]:
+    return _limit_unique_ids(
+        _id_list(claim_summary.get("support_evidence_ids"))
+        + _id_list(claim_summary.get("contradiction_evidence_ids")),
+        10_000,
+    )
+
+
+def _claim_reason_codes(claim_status: str, confidence: float | None) -> list[str]:
+    reason_codes: list[str] = []
+    if claim_status in {"unresolved", "proposed"}:
+        reason_codes.append("claim_unresolved")
+    if confidence is None:
+        reason_codes.append("claim_missing_confidence")
+    elif confidence < LOW_CONFIDENCE_THRESHOLD:
+        reason_codes.append("claim_low_confidence")
+    return reason_codes
+
+
+def _claim_is_low_confidence(claim_summary: dict[str, Any]) -> bool:
+    confidence = _parse_confidence(claim_summary.get("confidence"))
+    return confidence is None or confidence < LOW_CONFIDENCE_THRESHOLD
+
+
+def _limit_unique_ids(values: list[str], max_items: int) -> list[str]:
+    out: list[str] = []
+    seen: set[str] = set()
+    for value in values:
+        normalized = str(value)
+        if not normalized or normalized in seen:
+            continue
+        seen.add(normalized)
+        out.append(normalized)
+        if len(out) >= max_items:
+            break
+    return out
+
+
+def _dedupe_strings(values: list[str]) -> list[str]:
+    return _limit_unique_ids(values, len(values) or 1)
+
+
+def _build_expected_payoff(action_type: str, priority: str) -> dict[str, float]:
+    base = {
+        "critical": 0.90,
+        "high": 0.75,
+        "medium": 0.55,
+        "low": 0.35,
+    }.get(priority, 0.55)
+    graph_expansion_value = 0.40 if action_type == "search" else 0.30
+    payoff_score = round((0.45 * base) + (0.35 * base) + (0.20 * graph_expansion_value), 4)
+    return {
+        "uncertainty_reduction": round(base, 4),
+        "decision_impact": round(base, 4),
+        "graph_expansion_value": round(graph_expansion_value, 4),
+        "payoff_score": payoff_score,
+    }
+
+
+def _build_question_gap_refs(question_id: str, evidence_ids: list[str]) -> list[dict[str, Any]]:
+    if evidence_ids:
+        return []
+    return [
+        {
+            "gap_id": f"gap:question:{question_id}:missing_evidence",
+            "kind": "missing_evidence",
+            "scope": "question",
+            "question_id": question_id,
+            "current_evidence_ids": [],
+            "current_evidence_count": 0,
+            "required_evidence_count": REQUIRED_EVIDENCE_COUNT,
+            "blocking": True,
+        }
+    ]
+
+
+def _build_claim_gap_refs(
+    *,
+    claim_id: str,
+    opened_by_question_id: str | None,
+    claim_summary: dict[str, Any],
+) -> list[dict[str, Any]]:
+    support_ids = _id_list(claim_summary.get("support_evidence_ids"))
+    contradiction_ids = _id_list(claim_summary.get("contradiction_evidence_ids"))
+    evidence_ids = _limit_unique_ids(support_ids + contradiction_ids, 10_000)
+    confidence = _parse_confidence(claim_summary.get("confidence"))
+    claim_status = str(claim_summary.get("status") or "unresolved").lower()
+    refs: list[dict[str, Any]] = []
+    if not evidence_ids:
+        refs.append(
+            {
+                "gap_id": f"gap:claim:{claim_id}:missing_evidence",
+                "kind": "missing_evidence",
+                "scope": "claim",
+                "question_id": opened_by_question_id,
+                "claim_id": claim_id,
+                "current_evidence_ids": [],
+                "current_evidence_count": 0,
+                "required_evidence_count": REQUIRED_EVIDENCE_COUNT,
+                "blocking": True,
+            }
+        )
+    if claim_status in {"unresolved", "contested", "proposed"} and evidence_ids and (not support_ids or not contradiction_ids):
+        refs.append(
+            {
+                "gap_id": f"gap:claim:{claim_id}:missing_counter_evidence",
+                "kind": "missing_counter_evidence",
+                "scope": "claim",
+                "question_id": opened_by_question_id,
+                "claim_id": claim_id,
+                "current_evidence_ids": evidence_ids,
+                "current_evidence_count": len(evidence_ids),
+                "required_evidence_count": REQUIRED_EVIDENCE_COUNT,
+                "blocking": True,
+            }
+        )
+    if confidence is None:
+        refs.append(
+            {
+                "gap_id": f"gap:claim:{claim_id}:missing_confidence",
+                "kind": "missing_confidence",
+                "scope": "claim",
+                "question_id": opened_by_question_id,
+                "claim_id": claim_id,
+                "current_evidence_ids": evidence_ids,
+                "current_evidence_count": len(evidence_ids),
+                "required_evidence_count": REQUIRED_EVIDENCE_COUNT,
+                "blocking": True,
+            }
+        )
+    elif confidence < LOW_CONFIDENCE_THRESHOLD:
+        refs.append(
+            {
+                "gap_id": f"gap:claim:{claim_id}:low_confidence",
+                "kind": "low_confidence",
+                "scope": "claim",
+                "question_id": opened_by_question_id,
+                "claim_id": claim_id,
+                "current_evidence_ids": evidence_ids,
+                "current_evidence_count": len(evidence_ids),
+                "required_evidence_count": REQUIRED_EVIDENCE_COUNT,
+                "blocking": True,
+            }
+        )
+    return refs
+
+
+def _dedupe_gap_refs(refs: list[dict[str, Any]]) -> list[dict[str, Any]]:
+    out: list[dict[str, Any]] = []
+    seen: set[str] = set()
+    for ref in refs:
+        gap_id = str(ref.get("gap_id") or "")
+        if not gap_id or gap_id in seen:
+            continue
+        seen.add(gap_id)
+        out.append(ref)
+    return out
+
+
+def _build_ontology_object_refs(
+    *,
+    question_ids: list[str],
+    claim_ids: list[str],
+    evidence_ids: list[str],
+    question_records: dict[str, dict[str, Any]],
+    claim_records: dict[str, dict[str, Any]],
+    evidence: dict[str, Any],
+    provenance_nodes: dict[str, Any],
+    entities: dict[str, Any],
+    links: dict[str, Any],
+) -> list[dict[str, Any]]:
+    refs: list[dict[str, Any]] = []
+    for question_id in question_ids:
+        record = question_records.get(question_id, {})
+        refs.append(
+            _object_ref(
+                object_id=question_id,
+                object_type="question",
+                relation="opened_by",
+                label=str(record.get("question_text") or record.get("question") or question_id),
+            )
+        )
+        refs.extend(_entity_and_link_refs(record, entities=entities, links=links))
+    for claim_id in claim_ids:
+        record = claim_records.get(claim_id, {})
+        refs.append(
+            _object_ref(
+                object_id=claim_id,
+                object_type="claim",
+                relation="targets",
+                label=str(record.get("claim_text") or record.get("text") or claim_id),
+            )
+        )
+        refs.extend(_entity_and_link_refs(record, entities=entities, links=links))
+    for evidence_id in evidence_ids:
+        record = evidence.get(evidence_id)
+        if not isinstance(record, dict):
+            continue
+        refs.append(
+            _object_ref(
+                object_id=evidence_id,
+                object_type="evidence",
+                relation="depends_on",
+                label=str(record.get("source_uri") or record.get("evidence_type") or evidence_id),
+            )
+        )
+        refs.extend(_entity_and_link_refs(record, entities=entities, links=links))
+        for provenance_id in _id_list(record.get("provenance_ids")):
+            provenance = provenance_nodes.get(provenance_id) if isinstance(provenance_nodes.get(provenance_id), dict) else {}
+            refs.append(
+                _object_ref(
+                    object_id=provenance_id,
+                    object_type="provenance_node",
+                    relation="supported_by",
+                    label=str(
+                        provenance.get("title")
+                        or provenance.get("name")
+                        or provenance.get("source_uri")
+                        or provenance_id
+                    ),
+                )
+            )
+        confidence_id = record.get("confidence_id")
+        if confidence_id is not None:
+            refs.append(
+                _object_ref(
+                    object_id=str(confidence_id),
+                    object_type="confidence_profile",
+                    relation="depends_on",
+                )
+            )
+    return refs
+
+
+def _entity_and_link_refs(
+    record: dict[str, Any],
+    *,
+    entities: dict[str, Any],
+    links: dict[str, Any],
+) -> list[dict[str, Any]]:
+    refs: list[dict[str, Any]] = []
+    for entity_id in _collect_related_entity_ids(record):
+        entity = entities.get(entity_id) if isinstance(entities.get(entity_id), dict) else {}
+        refs.append(
+            _object_ref(
+                object_id=entity_id,
+                object_type="entity",
+                relation="about",
+                label=str(entity.get("name") or entity.get("label") or entity_id),
+            )
+        )
+    for link_id in _collect_related_link_ids(record):
+        link = links.get(link_id) if isinstance(links.get(link_id), dict) else {}
+        refs.append(
+            _object_ref(
+                object_id=link_id,
+                object_type="link",
+                relation="about",
+                label=str(link.get("label") or link.get("type") or link_id),
+            )
+        )
+    return refs
+
+
+def _object_ref(
+    *,
+    object_id: str,
+    object_type: str,
+    relation: str,
+    label: str | None = None,
+) -> dict[str, Any]:
+    ref = {
+        "object_id": object_id,
+        "object_type": object_type,
+        "relation": relation,
+    }
+    if label:
+        ref["label"] = label
+    return ref
+
+
+def _dedupe_object_refs(refs: list[dict[str, Any]]) -> list[dict[str, Any]]:
+    out: list[dict[str, Any]] = []
+    seen: set[tuple[str, str]] = set()
+    for ref in refs:
+        object_id = str(ref.get("object_id") or "")
+        relation = str(ref.get("relation") or "")
+        if not object_id:
+            continue
+        key = (object_id, relation)
+        if key in seen:
+            continue
+        seen.add(key)
+        out.append(ref)
+    return out
+
+
+def _collect_related_entity_ids(*records: dict[str, Any]) -> list[str]:
+    keys = (
+        "subject_refs",
+        "related_entity_ids",
+        "entity_ids",
+        "entities",
+        "about_entity_ids",
+        "subject_entity_ids",
+        "object_entity_ids",
+        "target_entity_ids",
+    )
+    return _collect_nested_ids(keys, *records)
+
+
+def _collect_related_link_ids(*records: dict[str, Any]) -> list[str]:
+    return _collect_nested_ids(("link_ids", "links"), *records)
+
+
+def _collect_nested_ids(keys: tuple[str, ...], *records: dict[str, Any]) -> list[str]:
+    values: list[str] = []
+    for record in records:
+        if not isinstance(record, dict):
+            continue
+        for key in keys:
+            raw_value = record.get(key)
+            if isinstance(raw_value, list):
+                values.extend(str(item) for item in raw_value if item is not None)
+            elif raw_value is not None and not isinstance(raw_value, dict):
+                values.append(str(raw_value))
+    return _limit_unique_ids(values, 10_000)
+
+
+def _collect_required_sources(
+    *records: dict[str, Any],
+    evidence_ids: list[str],
+    evidence: dict[str, Any],
+    provenance_nodes: dict[str, Any],
+) -> list[str]:
+    sources: list[str] = []
+    for record in records:
+        if not isinstance(record, dict):
+            continue
+        sources.extend(_extract_source_values(record))
+        for provenance_id in _id_list(record.get("provenance_ids")):
+            provenance = provenance_nodes.get(provenance_id)
+            if isinstance(provenance, dict):
+                sources.extend(_extract_source_values(provenance))
+    for evidence_id in evidence_ids:
+        record = evidence.get(evidence_id)
+        if not isinstance(record, dict):
+            continue
+        sources.extend(_extract_source_values(record))
+        for provenance_id in _id_list(record.get("provenance_ids")):
+            provenance = provenance_nodes.get(provenance_id)
+            if isinstance(provenance, dict):
+                sources.extend(_extract_source_values(provenance))
+    return _limit_unique_ids(sources, 32)
+
+
+def _extract_source_values(record: dict[str, Any]) -> list[str]:
+    values: list[str] = []
+    for key in ("source_uri", "canonical_source_uri", "url"):
+        value = record.get(key)
+        if value:
+            values.append(str(value))
+    for key in ("source_uris", "required_sources", "sources", "urls"):
+        value = record.get(key)
+        if isinstance(value, list):
+            values.extend(str(item) for item in value if item)
+    return _limit_unique_ids(values, 32)
+
+
+def _candidate_action_sort_key(action: dict[str, Any]) -> tuple[int, int, str]:
+    action_id = str(action.get("id") or "")
+    kind_rank = 0 if action_id.startswith("ca_q_") else 1
+    priority = _normalize_priority(action.get("priority"))
+    return (_PRIORITY_RANK.get(priority, 9), kind_rank, action_id)
 
 
 def _collect_evidence_ids(*collections: list[dict[str, Any]]) -> list[str]:
diff --git a/agent/prompts.py b/agent/prompts.py
index b9bee9db..b58ccf6c 100644
--- a/agent/prompts.py
+++ b/agent/prompts.py
@@ -397,7 +397,12 @@
 
 Rules:
 - Ground reasoning in typed state references, not raw transcript quotes. Prefer
-  question IDs, claim IDs, evidence IDs, and provenance IDs.
+  question IDs, claim IDs, evidence IDs, provenance IDs, and candidate action IDs.
+- Treat question_reasoning_packet.candidate_actions as machine-readable, read-only
+  planner suggestions. Use them to prioritize next steps, but do not assume they
+  were persisted as canonical tasks/actions.
+- Prefer the highest-priority, highest-payoff candidate actions when choosing what
+  to do next.
 - Do not mark a claim supported without support evidence IDs.
 - Do not resolve a question without explicit claim/evidence linkage.
 - Prefer provenance-backed evidence over uncited notes.
diff --git a/agent/runtime.py b/agent/runtime.py
index 7282bc5f..75894485 100644
--- a/agent/runtime.py
+++ b/agent/runtime.py
@@ -49,6 +49,8 @@ def _has_reasoning_content(packet: dict[str, Any]) -> bool:
         return True
     if packet.get("contradictions"):
         return True
+    if packet.get("candidate_actions"):
+        return True
     if not isinstance(findings, dict):
         return False
     return any(findings.get(key) for key in ("supported", "contested", "unresolved"))
diff --git a/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs b/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs
index 4c01e639..e2fa9594 100644
--- a/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs
@@ -6,6 +6,11 @@ use std::collections::{BTreeMap, BTreeSet};
 const SCHEMA_VERSION: &str = "1.0.0";
 const ONTOLOGY_NAMESPACE: &str = "openplanter.core";
 const ONTOLOGY_VERSION: &str = "2026-03";
+const LOW_CONFIDENCE_THRESHOLD: f64 = 0.60;
+const VERY_LOW_CONFIDENCE_THRESHOLD: f64 = 0.40;
+const MAX_CANDIDATE_ACTIONS: usize = 24;
+const REQUIRED_EVIDENCE_COUNT: usize = 1;
+const PLANNER_GENERATED_BY: &str = "question_reasoning_packet.v1";
 const LEGACY_KNOWN_KEYS: &[&str] = &[
     "session_id",
     "saved_at",
@@ -372,6 +377,14 @@ pub fn build_question_reasoning_packet(
         .collect();
     unresolved_questions.sort_by(question_priority_sort_key);
     unresolved_questions.truncate(std::cmp::max(1, max_questions));
+    let focus_question_ids = unresolved_questions
+        .iter()
+        .filter_map(|item| {
+            item.get("id")
+                .and_then(Value::as_str)
+                .map(ToString::to_string)
+        })
+        .collect::<Vec<_>>();
 
     let mut supported = Vec::new();
     let mut contested = Vec::new();
@@ -452,6 +465,12 @@ pub fn build_question_reasoning_packet(
             }),
         );
     }
+    let candidate_actions = build_candidate_actions(
+        state,
+        &unresolved_questions,
+        &focus_question_ids,
+        max_evidence_per_item,
+    );
 
     serde_json::json!({
         "reasoning_mode": "question_centric",
@@ -462,10 +481,7 @@ pub fn build_question_reasoning_packet(
             "record_contradictions",
             "synthesize_supported_contested_unresolved",
         ],
-        "focus_question_ids": unresolved_questions
-            .iter()
-            .filter_map(|item| item.get("id").and_then(Value::as_str).map(ToString::to_string))
-            .collect::<Vec<_>>(),
+        "focus_question_ids": focus_question_ids,
         "unresolved_questions": unresolved_questions,
         "findings": {
             "supported": supported,
@@ -474,6 +490,7 @@ pub fn build_question_reasoning_packet(
         },
         "contradictions": contradictions,
         "evidence_index": evidence_index,
+        "candidate_actions": candidate_actions,
     })
 }
 
@@ -481,6 +498,13 @@ pub fn has_reasoning_content(packet: &Value) -> bool {
     let Some(obj) = packet.as_object() else {
         return false;
     };
+    if obj
+        .get("candidate_actions")
+        .and_then(Value::as_array)
+        .is_some_and(|items| !items.is_empty())
+    {
+        return true;
+    }
     if obj
         .get("focus_question_ids")
         .and_then(Value::as_array)
@@ -507,6 +531,857 @@ pub fn has_reasoning_content(packet: &Value) -> bool {
         })
 }
 
+fn build_candidate_actions(
+    state: &InvestigationState,
+    focus_questions: &[Value],
+    focus_question_ids: &[String],
+    max_evidence_per_item: usize,
+) -> Vec<Value> {
+    let mut actions = Vec::new();
+    let mut seen = BTreeSet::new();
+
+    for question in focus_questions {
+        let Some(question_obj) = question.as_object() else {
+            continue;
+        };
+        let question_id = question_obj
+            .get("id")
+            .and_then(Value::as_str)
+            .unwrap_or_default();
+        if question_id.is_empty() {
+            continue;
+        }
+        let question_record = find_question_record(state, question_id).unwrap_or(question_obj);
+        let claim_ids = question_claim_ids(question_obj);
+        let question_evidence_ids = question_evidence_ids(question_obj, max_evidence_per_item);
+        let linked_claim_evidence_ids = claim_ids
+            .iter()
+            .flat_map(|claim_id| claim_evidence_ids(state, claim_id, max_evidence_per_item))
+            .collect::<Vec<_>>();
+        let evidence_ids = dedupe_strings(
+            question_evidence_ids
+                .iter()
+                .chain(linked_claim_evidence_ids.iter())
+                .cloned()
+                .collect(),
+        );
+        let entity_ids = question_entity_ids(state, question_record, &claim_ids, &evidence_ids);
+        let mut reason_codes = vec!["question_unresolved".to_string()];
+        for claim_id in &claim_ids {
+            for code in claim_reason_codes(state, claim_id) {
+                if !reason_codes.contains(&code) {
+                    reason_codes.push(code);
+                }
+            }
+        }
+        let evidence_gap_refs = build_question_gap_refs(
+            state,
+            question_id,
+            question_record,
+            &claim_ids,
+            &question_evidence_ids,
+            max_evidence_per_item,
+        );
+        let dependency_refs = gap_ids(&evidence_gap_refs);
+        let ontology_object_refs = build_ontology_object_refs(
+            state,
+            Some(question_id),
+            &claim_ids,
+            &evidence_ids,
+            &entity_ids,
+            &dependency_refs,
+        );
+        let mut source_records = vec![question_record];
+        for claim_id in &claim_ids {
+            let Some(claim) = state.claims.get(claim_id).and_then(Value::as_object) else {
+                continue;
+            };
+            source_records.push(claim);
+        }
+        let required_sources = collect_required_sources(state, &source_records, &evidence_ids);
+        let action_type = if claim_ids.is_empty() {
+            "search"
+        } else {
+            "verify_claim"
+        };
+        let priority = normalize_priority(
+            question_obj
+                .get("priority")
+                .and_then(Value::as_str)
+                .unwrap_or("medium"),
+        );
+        let action_id = format!("ca_q_{question_id}");
+        if seen.insert(action_id.clone()) {
+            actions.push(serde_json::json!({
+                "id": action_id,
+                "action_type": action_type,
+                "status": "proposed",
+                "priority": priority,
+                "title": format!("Resolve question {question_id}"),
+                "description": format!("Advance question {question_id} using discriminating evidence tied to canonical state refs."),
+                "opened_by_question_id": question_id,
+                "target_question_ids": [question_id],
+                "target_claim_ids": claim_ids,
+                "reason_codes": reason_codes.clone(),
+                "rationale": {
+                    "summary": "question_unresolved",
+                    "reason_codes": reason_codes,
+                    "blocking_gap_ids": dependency_refs,
+                },
+                "required_sources": required_sources,
+                "required_inputs": {
+                    "question_ids": [question_id],
+                    "claim_ids": claim_ids,
+                    "evidence_ids": evidence_ids,
+                    "entity_ids": entity_ids,
+                    "external_dependencies": Vec::<String>::new(),
+                },
+                "expected_payoff": payoff_for_priority(priority, action_type),
+                "suggested_tools": suggested_tools(action_type),
+                "evidence_gap_refs": evidence_gap_refs,
+                "ontology_object_refs": ontology_object_refs,
+                "generated_by": PLANNER_GENERATED_BY,
+            }));
+        }
+    }
+
+    for (claim_id, raw_claim) in &state.claims {
+        let Some(claim) = raw_claim.as_object() else {
+            continue;
+        };
+        let claim_status = claim_status(claim);
+        if claim_status == "retracted" {
+            continue;
+        }
+        let confidence = claim_confidence(claim);
+        let reason_codes = claim_reason_codes(state, claim_id);
+        if reason_codes.is_empty() {
+            continue;
+        }
+        let evidence_ids = claim_evidence_ids(state, claim_id, max_evidence_per_item);
+        let entity_ids = claim_entity_ids(state, claim, &evidence_ids);
+        let evidence_gap_refs = build_claim_gap_refs(
+            state,
+            claim_id,
+            &claim_status,
+            confidence,
+            &evidence_ids,
+            max_evidence_per_item,
+        );
+        let dependency_refs = gap_ids(&evidence_gap_refs);
+        let opened_by_question_id = focus_questions
+            .iter()
+            .filter_map(Value::as_object)
+            .find(|question| {
+                question_claim_ids(question)
+                    .iter()
+                    .any(|candidate| candidate == claim_id)
+            })
+            .and_then(|question| question.get("id").and_then(Value::as_str))
+            .map(ToString::to_string);
+        let target_question_ids = opened_by_question_id
+            .clone()
+            .into_iter()
+            .filter(|question_id| {
+                focus_question_ids
+                    .iter()
+                    .any(|candidate| candidate == question_id)
+            })
+            .collect::<Vec<_>>();
+        let ontology_object_refs = build_ontology_object_refs(
+            state,
+            opened_by_question_id.as_deref(),
+            &[claim_id.clone()],
+            &evidence_ids,
+            &entity_ids,
+            &dependency_refs,
+        );
+        let mut source_records = vec![claim];
+        if let Some(question_id) = opened_by_question_id.as_deref() {
+            if let Some(question) = find_question_record(state, question_id) {
+                source_records.push(question);
+            }
+        }
+        let required_sources = collect_required_sources(state, &source_records, &evidence_ids);
+        let priority = claim_candidate_priority(&claim_status, confidence);
+        let action_id = format!("ca_c_{claim_id}");
+        if seen.insert(action_id.clone()) {
+            actions.push(serde_json::json!({
+                "id": action_id,
+                "action_type": "verify_claim",
+                "status": "proposed",
+                "priority": priority,
+                "title": format!("Verify claim {claim_id}"),
+                "description": format!("Raise confidence for claim {claim_id} with additional cited evidence and contradiction tracking."),
+                "opened_by_question_id": opened_by_question_id,
+                "target_question_ids": target_question_ids,
+                "target_claim_ids": [claim_id],
+                "reason_codes": reason_codes.clone(),
+                "rationale": {
+                    "summary": "claim_requires_verification",
+                    "reason_codes": reason_codes,
+                    "blocking_gap_ids": dependency_refs,
+                },
+                "required_sources": required_sources,
+                "required_inputs": {
+                    "question_ids": target_question_ids,
+                    "claim_ids": [claim_id],
+                    "evidence_ids": evidence_ids,
+                    "entity_ids": entity_ids,
+                    "external_dependencies": Vec::<String>::new(),
+                },
+                "expected_payoff": payoff_for_priority(priority, "verify_claim"),
+                "suggested_tools": suggested_tools("verify_claim"),
+                "evidence_gap_refs": evidence_gap_refs,
+                "ontology_object_refs": ontology_object_refs,
+                "generated_by": PLANNER_GENERATED_BY,
+            }));
+        }
+    }
+
+    actions.sort_by(candidate_action_sort_key);
+    actions.truncate(MAX_CANDIDATE_ACTIONS);
+    actions
+}
+
+fn candidate_action_sort_key(left: &Value, right: &Value) -> std::cmp::Ordering {
+    let left_priority = question_priority_rank(left.get("priority").and_then(Value::as_str));
+    let right_priority = question_priority_rank(right.get("priority").and_then(Value::as_str));
+    left_priority
+        .cmp(&right_priority)
+        .then_with(|| candidate_action_origin_rank(left).cmp(&candidate_action_origin_rank(right)))
+        .then_with(|| {
+            left.get("id")
+                .and_then(Value::as_str)
+                .unwrap_or_default()
+                .cmp(right.get("id").and_then(Value::as_str).unwrap_or_default())
+        })
+}
+
+fn candidate_action_origin_rank(action: &Value) -> u8 {
+    match action
+        .get("id")
+        .and_then(Value::as_str)
+        .unwrap_or_default()
+        .starts_with("ca_q_")
+    {
+        true => 0,
+        false => 1,
+    }
+}
+
+fn normalize_priority(priority: &str) -> &'static str {
+    match priority.to_ascii_lowercase().as_str() {
+        "critical" => "critical",
+        "high" => "high",
+        "medium" => "medium",
+        "low" => "low",
+        _ => "medium",
+    }
+}
+
+fn claim_candidate_priority(claim_status: &str, confidence: Option<f64>) -> &'static str {
+    if matches!(claim_status, "unresolved" | "proposed") {
+        "high"
+    } else if confidence.is_some_and(|value| value <= VERY_LOW_CONFIDENCE_THRESHOLD) {
+        "high"
+    } else {
+        "medium"
+    }
+}
+
+fn claim_status(claim: &Map<String, Value>) -> String {
+    claim
+        .get("status")
+        .and_then(Value::as_str)
+        .unwrap_or("unresolved")
+        .to_ascii_lowercase()
+}
+
+fn claim_confidence(claim: &Map<String, Value>) -> Option<f64> {
+    parse_confidence(
+        claim
+            .get("confidence")
+            .or_else(|| claim.get("confidence_score")),
+    )
+}
+
+fn find_question_record<'a>(
+    state: &'a InvestigationState,
+    question_id: &str,
+) -> Option<&'a Map<String, Value>> {
+    state
+        .questions
+        .get(question_id)
+        .and_then(Value::as_object)
+        .or_else(|| {
+            state
+                .questions
+                .values()
+                .filter_map(Value::as_object)
+                .find(|record| record.get("id").and_then(Value::as_str) == Some(question_id))
+        })
+}
+
+fn question_claim_ids(question: &Map<String, Value>) -> Vec<String> {
+    id_list(
+        question
+            .get("claim_ids")
+            .or_else(|| question.get("claims"))
+            .or_else(|| {
+                question
+                    .get("origin")
+                    .and_then(Value::as_object)
+                    .and_then(|origin| origin.get("claim_ids"))
+            }),
+    )
+}
+
+fn question_evidence_ids(
+    question: &Map<String, Value>,
+    max_evidence_per_item: usize,
+) -> Vec<String> {
+    limit_ids(
+        question.get("evidence_ids").or_else(|| {
+            question
+                .get("origin")
+                .and_then(Value::as_object)
+                .and_then(|origin| origin.get("evidence_ids"))
+        }),
+        max_evidence_per_item,
+    )
+}
+
+fn claim_evidence_ids(
+    state: &InvestigationState,
+    claim_id: &str,
+    max_evidence_per_item: usize,
+) -> Vec<String> {
+    let Some(claim) = state.claims.get(claim_id).and_then(Value::as_object) else {
+        return Vec::new();
+    };
+    dedupe_strings(
+        limit_ids(
+            claim
+                .get("support_evidence_ids")
+                .or_else(|| claim.get("evidence_support_ids"))
+                .or_else(|| claim.get("evidence_ids")),
+            max_evidence_per_item,
+        )
+        .into_iter()
+        .chain(limit_ids(
+            claim
+                .get("contradiction_evidence_ids")
+                .or_else(|| claim.get("evidence_contra_ids"))
+                .or_else(|| claim.get("contradict_evidence_ids")),
+            max_evidence_per_item,
+        ))
+        .collect(),
+    )
+}
+
+fn claim_reason_codes(state: &InvestigationState, claim_id: &str) -> Vec<String> {
+    let Some(claim) = state.claims.get(claim_id).and_then(Value::as_object) else {
+        return Vec::new();
+    };
+    let claim_status = claim_status(claim);
+    let confidence = claim_confidence(claim);
+    let mut reason_codes = Vec::new();
+    if matches!(claim_status.as_str(), "unresolved" | "proposed") {
+        reason_codes.push("claim_unresolved".to_string());
+    }
+    if confidence.is_none() {
+        reason_codes.push("claim_missing_confidence".to_string());
+    } else if confidence.is_some_and(|value| value < LOW_CONFIDENCE_THRESHOLD) {
+        reason_codes.push("claim_low_confidence".to_string());
+    }
+    reason_codes
+}
+
+fn build_question_gap_refs(
+    state: &InvestigationState,
+    question_id: &str,
+    question: &Map<String, Value>,
+    claim_ids: &[String],
+    question_evidence_ids: &[String],
+    max_evidence_per_item: usize,
+) -> Vec<Value> {
+    let mut refs = Vec::new();
+    if question_evidence_ids.is_empty() {
+        refs.push(serde_json::json!({
+            "gap_id": format!("gap:question:{question_id}:missing_evidence"),
+            "kind": "missing_evidence",
+            "scope": "question",
+            "question_id": question_id,
+            "claim_id": Value::Null,
+            "current_evidence_ids": [],
+            "current_evidence_count": 0,
+            "required_evidence_count": REQUIRED_EVIDENCE_COUNT,
+            "blocking": true,
+        }));
+    }
+    let related_entity_ids = id_list(question.get("related_entity_ids"));
+    if !related_entity_ids.is_empty() && question_evidence_ids.is_empty() {
+        refs.push(serde_json::json!({
+            "gap_id": format!("gap:question:{question_id}:missing_entity_evidence"),
+            "kind": "missing_evidence",
+            "scope": "question",
+            "question_id": question_id,
+            "claim_id": Value::Null,
+            "current_evidence_ids": question_evidence_ids,
+            "current_evidence_count": question_evidence_ids.len(),
+            "required_evidence_count": REQUIRED_EVIDENCE_COUNT,
+            "blocking": true,
+        }));
+    }
+    for claim_id in claim_ids {
+        refs.extend(build_claim_gap_refs(
+            state,
+            claim_id,
+            &state
+                .claims
+                .get(claim_id)
+                .and_then(Value::as_object)
+                .map(claim_status)
+                .unwrap_or_else(|| "unresolved".to_string()),
+            state
+                .claims
+                .get(claim_id)
+                .and_then(Value::as_object)
+                .and_then(claim_confidence),
+            &claim_evidence_ids(state, claim_id, max_evidence_per_item),
+            max_evidence_per_item,
+        ));
+    }
+    dedupe_objects_by_id(refs, "gap_id")
+}
+
+fn build_claim_gap_refs(
+    state: &InvestigationState,
+    claim_id: &str,
+    claim_status: &str,
+    confidence: Option<f64>,
+    evidence_ids: &[String],
+    max_evidence_per_item: usize,
+) -> Vec<Value> {
+    let Some(claim) = state.claims.get(claim_id).and_then(Value::as_object) else {
+        return Vec::new();
+    };
+    let support_ids = limit_ids(
+        claim
+            .get("support_evidence_ids")
+            .or_else(|| claim.get("evidence_support_ids"))
+            .or_else(|| claim.get("evidence_ids")),
+        max_evidence_per_item,
+    );
+    let contradiction_ids = limit_ids(
+        claim
+            .get("contradiction_evidence_ids")
+            .or_else(|| claim.get("evidence_contra_ids"))
+            .or_else(|| claim.get("contradict_evidence_ids")),
+        max_evidence_per_item,
+    );
+    let mut refs = Vec::new();
+    if evidence_ids.is_empty() {
+        refs.push(serde_json::json!({
+            "gap_id": format!("gap:claim:{claim_id}:missing_evidence"),
+            "kind": "missing_evidence",
+            "scope": "claim",
+            "question_id": Value::Null,
+            "claim_id": claim_id,
+            "current_evidence_ids": [],
+            "current_evidence_count": 0,
+            "required_evidence_count": REQUIRED_EVIDENCE_COUNT,
+            "blocking": true,
+        }));
+    }
+    if matches!(
+        claim_status.to_ascii_lowercase().as_str(),
+        "unresolved" | "contested"
+    ) && (!support_ids.is_empty() || !contradiction_ids.is_empty())
+        && (support_ids.is_empty() || contradiction_ids.is_empty())
+    {
+        refs.push(serde_json::json!({
+            "gap_id": format!("gap:claim:{claim_id}:missing_counter_evidence"),
+            "kind": "missing_counter_evidence",
+            "scope": "claim",
+            "question_id": Value::Null,
+            "claim_id": claim_id,
+            "current_evidence_ids": evidence_ids,
+            "current_evidence_count": evidence_ids.len(),
+            "required_evidence_count": REQUIRED_EVIDENCE_COUNT,
+            "blocking": true,
+        }));
+    }
+    if confidence.is_none() {
+        refs.push(serde_json::json!({
+            "gap_id": format!("gap:claim:{claim_id}:missing_confidence"),
+            "kind": "missing_confidence",
+            "scope": "claim",
+            "question_id": Value::Null,
+            "claim_id": claim_id,
+            "current_evidence_ids": evidence_ids,
+            "current_evidence_count": evidence_ids.len(),
+            "required_evidence_count": REQUIRED_EVIDENCE_COUNT,
+            "blocking": true,
+        }));
+    } else if confidence.is_some_and(|value| value < LOW_CONFIDENCE_THRESHOLD) {
+        refs.push(serde_json::json!({
+            "gap_id": format!("gap:claim:{claim_id}:low_confidence"),
+            "kind": "low_confidence",
+            "scope": "claim",
+            "question_id": Value::Null,
+            "claim_id": claim_id,
+            "current_evidence_ids": evidence_ids,
+            "current_evidence_count": evidence_ids.len(),
+            "required_evidence_count": REQUIRED_EVIDENCE_COUNT,
+            "blocking": true,
+        }));
+    }
+    refs
+}
+
+fn gap_ids(gap_refs: &[Value]) -> Vec<String> {
+    gap_refs
+        .iter()
+        .filter_map(|item| {
+            item.get("gap_id")
+                .and_then(Value::as_str)
+                .map(ToString::to_string)
+        })
+        .collect()
+}
+
+fn suggested_tools(action_type: &str) -> Vec<&'static str> {
+    match action_type {
+        "search" => vec!["web_search", "fetch_url", "search_files", "read_file"],
+        _ => vec!["web_search", "fetch_url", "read_file", "search_files"],
+    }
+}
+
+fn payoff_for_priority(priority: &str, action_type: &str) -> Value {
+    let base = match priority {
+        "critical" => 0.90,
+        "high" => 0.75,
+        "medium" => 0.55,
+        "low" => 0.35,
+        _ => 0.55,
+    };
+    let graph_expansion_value = if action_type == "search" { 0.40 } else { 0.30 };
+    let estimated_cost = 0.0;
+    let payoff_score =
+        (0.45 * base) + (0.35 * base) + (0.20 * graph_expansion_value) - estimated_cost;
+    serde_json::json!({
+        "uncertainty_reduction": base,
+        "decision_impact": base,
+        "graph_expansion_value": graph_expansion_value,
+        "estimated_cost": estimated_cost,
+        "payoff_score": payoff_score,
+    })
+}
+
+fn collect_required_sources(
+    state: &InvestigationState,
+    records: &[&Map<String, Value>],
+    evidence_ids: &[String],
+) -> Vec<String> {
+    let mut sources = BTreeSet::new();
+    for record in records {
+        for candidate in source_values_from_record(record) {
+            sources.insert(candidate);
+        }
+        for provenance_id in id_list(record.get("provenance_ids")) {
+            let Some(provenance) = state
+                .provenance_nodes
+                .get(&provenance_id)
+                .and_then(Value::as_object)
+            else {
+                continue;
+            };
+            for candidate in source_values_from_record(provenance) {
+                sources.insert(candidate);
+            }
+        }
+    }
+    for evidence_id in evidence_ids {
+        let Some(record) = state.evidence.get(evidence_id).and_then(Value::as_object) else {
+            continue;
+        };
+        for candidate in source_values_from_record(record) {
+            sources.insert(candidate);
+        }
+        for provenance_id in id_list(record.get("provenance_ids")) {
+            let Some(provenance) = state
+                .provenance_nodes
+                .get(&provenance_id)
+                .and_then(Value::as_object)
+            else {
+                continue;
+            };
+            for candidate in source_values_from_record(provenance) {
+                sources.insert(candidate);
+            }
+        }
+    }
+    sources.into_iter().collect()
+}
+
+fn source_values_from_record(record: &Map<String, Value>) -> Vec<String> {
+    let mut values = Vec::new();
+    for key in ["source_uri", "canonical_source_uri", "url"] {
+        if let Some(source) = record.get(key).and_then(Value::as_str) {
+            if !source.trim().is_empty() {
+                values.push(source.to_string());
+            }
+        }
+    }
+    for key in ["source_uris", "required_sources", "sources", "urls"] {
+        values.extend(id_list(record.get(key)));
+    }
+    values
+}
+
+fn build_ontology_object_refs(
+    state: &InvestigationState,
+    question_id: Option<&str>,
+    claim_ids: &[String],
+    evidence_ids: &[String],
+    entity_ids: &[String],
+    dependency_refs: &[String],
+) -> Vec<Value> {
+    let mut refs = Vec::new();
+    let mut seen = BTreeSet::new();
+    if let Some(question_id) = question_id {
+        add_object_ref(
+            &mut refs,
+            &mut seen,
+            question_id,
+            "question",
+            "opened_by",
+            state.questions.get(question_id),
+        );
+    }
+    for claim_id in claim_ids {
+        add_object_ref(
+            &mut refs,
+            &mut seen,
+            claim_id,
+            "claim",
+            "targets",
+            state.claims.get(claim_id),
+        );
+    }
+    for evidence_id in evidence_ids {
+        add_object_ref(
+            &mut refs,
+            &mut seen,
+            evidence_id,
+            "evidence",
+            "depends_on",
+            state.evidence.get(evidence_id),
+        );
+        let Some(record) = state.evidence.get(evidence_id).and_then(Value::as_object) else {
+            continue;
+        };
+        for provenance_id in id_list(record.get("provenance_ids")) {
+            add_object_ref(
+                &mut refs,
+                &mut seen,
+                &provenance_id,
+                "provenance_node",
+                "supported_by",
+                state.provenance_nodes.get(&provenance_id),
+            );
+        }
+        if let Some(confidence_id) = record.get("confidence_id").and_then(Value::as_str) {
+            add_object_ref(
+                &mut refs,
+                &mut seen,
+                confidence_id,
+                "confidence_profile",
+                "scored_by",
+                state.confidence_profiles.get(confidence_id),
+            );
+        }
+    }
+    for entity_id in entity_ids {
+        add_object_ref(
+            &mut refs,
+            &mut seen,
+            entity_id,
+            "entity",
+            "about",
+            state.entities.get(entity_id),
+        );
+    }
+    for dependency_ref in dependency_refs {
+        add_object_ref(
+            &mut refs,
+            &mut seen,
+            dependency_ref,
+            "evidence_gap",
+            "blocked_by",
+            None,
+        );
+    }
+    refs
+}
+
+fn add_object_ref(
+    refs: &mut Vec<Value>,
+    seen: &mut BTreeSet<String>,
+    object_id: &str,
+    object_type: &str,
+    relation: &str,
+    record: Option<&Value>,
+) {
+    let key = format!("{object_type}:{object_id}:{relation}");
+    if !seen.insert(key) {
+        return;
+    }
+    refs.push(serde_json::json!({
+        "object_id": object_id,
+        "object_type": object_type,
+        "relation": relation,
+        "label": record.and_then(object_label),
+    }));
+}
+
+fn object_label(record: &Value) -> Option<String> {
+    let obj = record.as_object()?;
+    for key in [
+        "title",
+        "label",
+        "name",
+        "question_text",
+        "question",
+        "claim_text",
+        "text",
+        "content",
+    ] {
+        if let Some(value) = obj.get(key).and_then(Value::as_str) {
+            if !value.trim().is_empty() {
+                return Some(safe_label(value));
+            }
+        }
+    }
+    obj.get("source_uri")
+        .and_then(Value::as_str)
+        .map(safe_label)
+}
+
+fn safe_label(value: &str) -> String {
+    let trimmed = value.trim();
+    let end = trimmed.floor_char_boundary(trimmed.len().min(96));
+    trimmed[..end].to_string()
+}
+
+fn question_entity_ids(
+    state: &InvestigationState,
+    question: &Map<String, Value>,
+    claim_ids: &[String],
+    evidence_ids: &[String],
+) -> Vec<String> {
+    let mut ids = collect_related_object_ids(
+        question,
+        &[
+            "related_entity_ids",
+            "entity_ids",
+            "entities",
+            "target_entity_ids",
+        ],
+    );
+    for claim_id in claim_ids {
+        let Some(claim) = state.claims.get(claim_id).and_then(Value::as_object) else {
+            continue;
+        };
+        ids.extend(claim_entity_ids(state, claim, evidence_ids));
+    }
+    dedupe_strings(ids)
+}
+
+fn claim_entity_ids(
+    state: &InvestigationState,
+    claim: &Map<String, Value>,
+    evidence_ids: &[String],
+) -> Vec<String> {
+    let mut ids = collect_related_object_ids(
+        claim,
+        &[
+            "subject_refs",
+            "related_entity_ids",
+            "entity_ids",
+            "entities",
+            "subject_entity_ids",
+            "object_entity_ids",
+            "about_entity_ids",
+        ],
+    );
+    for evidence_id in evidence_ids {
+        let Some(evidence) = state.evidence.get(evidence_id).and_then(Value::as_object) else {
+            continue;
+        };
+        ids.extend(collect_related_object_ids(
+            evidence,
+            &[
+                "related_entity_ids",
+                "entity_ids",
+                "entities",
+                "subject_entity_ids",
+                "object_entity_ids",
+                "about_entity_ids",
+            ],
+        ));
+    }
+    dedupe_strings(ids)
+}
+
+fn collect_related_object_ids(record: &Map<String, Value>, keys: &[&str]) -> Vec<String> {
+    let mut ids = Vec::new();
+    for key in keys {
+        ids.extend(id_list(record.get(*key)));
+    }
+    ids
+}
+
+fn dedupe_strings(items: Vec<String>) -> Vec<String> {
+    let mut seen = BTreeSet::new();
+    let mut out = Vec::new();
+    for item in items {
+        if item.trim().is_empty() || !seen.insert(item.clone()) {
+            continue;
+        }
+        out.push(item);
+    }
+    out
+}
+
+fn dedupe_objects_by_id(items: Vec<Value>, key: &str) -> Vec<Value> {
+    let mut seen = BTreeSet::new();
+    let mut out = Vec::new();
+    for item in items {
+        let Some(id) = item.get(key).and_then(Value::as_str) else {
+            continue;
+        };
+        if seen.insert(id.to_string()) {
+            out.push(item);
+        }
+    }
+    out
+}
+
+fn parse_confidence(value: Option<&Value>) -> Option<f64> {
+    let value = value?;
+    let parsed = if let Some(number) = value.as_f64() {
+        Some(number)
+    } else {
+        value
+            .as_str()
+            .and_then(|text| text.trim().parse::<f64>().ok())
+    }?;
+    Some(parsed.clamp(0.0, 1.0))
+}
+
 fn default_schema_version() -> String {
     SCHEMA_VERSION.to_string()
 }
@@ -807,9 +1682,98 @@ mod tests {
             Value::String("cl_2".to_string())
         );
         assert!(packet["evidence_index"].get("ev_3").is_some());
+        assert_eq!(
+            packet["candidate_actions"][0]["id"],
+            Value::String("ca_q_q_1".to_string())
+        );
+        assert_eq!(
+            packet["candidate_actions"][0]["required_sources"],
+            serde_json::json!(["s1", "s3"])
+        );
+        assert_eq!(
+            packet["candidate_actions"][1]["id"],
+            Value::String("ca_q_q_2".to_string())
+        );
+        assert_eq!(
+            packet["candidate_actions"][2]["reason_codes"],
+            serde_json::json!(["claim_low_confidence"])
+        );
+        assert_eq!(
+            packet["candidate_actions"][2]["evidence_gap_refs"][0]["kind"],
+            Value::String("low_confidence".to_string())
+        );
+        assert_eq!(
+            packet["candidate_actions"][3]["id"],
+            Value::String("ca_c_cl_3".to_string())
+        );
+        assert_eq!(
+            packet["candidate_actions"][3]["evidence_gap_refs"][0]["kind"],
+            Value::String("missing_counter_evidence".to_string())
+        );
         assert!(has_reasoning_content(&packet));
     }
 
+    #[test]
+    fn candidate_actions_keep_entity_inputs_entity_only_and_collect_question_sources() {
+        let mut state = InvestigationState::new("sid");
+        state.questions.insert(
+            "q_1".to_string(),
+            serde_json::json!({
+                "id": "q_1",
+                "question_text": "What source confirms the claim?",
+                "status": "open",
+                "priority": "high",
+                "claim_ids": ["cl_1"],
+                "resolution_claim_id": "cl_resolution",
+                "provenance_ids": ["pv_q_1"],
+            }),
+        );
+        state.claims.insert(
+            "cl_1".to_string(),
+            serde_json::json!({
+                "id": "cl_1",
+                "claim_text": "Needs evidence",
+                "status": "proposed",
+                "evidence_ids": [],
+                "confidence": 0.2,
+            }),
+        );
+        state.provenance_nodes.insert(
+            "pv_q_1".to_string(),
+            serde_json::json!({
+                "id": "pv_q_1",
+                "source_uri": "https://question-source.test",
+            }),
+        );
+
+        let packet = build_question_reasoning_packet(&state, 8, 6);
+        let action = packet["candidate_actions"]
+            .as_array()
+            .and_then(|items| {
+                items
+                    .iter()
+                    .find(|item| item.get("id") == Some(&Value::String("ca_q_q_1".to_string())))
+            })
+            .expect("question action");
+
+        assert_eq!(
+            action["required_inputs"]["entity_ids"],
+            serde_json::json!([])
+        );
+        assert_eq!(
+            action["required_sources"],
+            serde_json::json!(["https://question-source.test"])
+        );
+        assert!(
+            !action["ontology_object_refs"]
+                .as_array()
+                .is_some_and(|refs| refs
+                    .iter()
+                    .any(|item| item.get("object_type")
+                        == Some(&Value::String("entity".to_string()))))
+        );
+    }
+
     #[test]
     fn has_reasoning_content_returns_false_for_empty_packet() {
         let packet = serde_json::json!({
@@ -823,4 +1787,21 @@ mod tests {
         });
         assert!(!has_reasoning_content(&packet));
     }
+
+    #[test]
+    fn has_reasoning_content_returns_true_for_candidate_actions_only() {
+        let packet = serde_json::json!({
+            "focus_question_ids": [],
+            "findings": {
+                "supported": [],
+                "contested": [],
+                "unresolved": [],
+            },
+            "contradictions": [],
+            "candidate_actions": [
+                {"id": "ca_c_cl_9", "action_type": "verify_claim", "status": "proposed"}
+            ],
+        });
+        assert!(has_reasoning_content(&packet));
+    }
 }
diff --git a/openplanter-desktop/crates/op-core/src/engine/mod.rs b/openplanter-desktop/crates/op-core/src/engine/mod.rs
index d6ba5f1b..a80846fb 100644
--- a/openplanter-desktop/crates/op-core/src/engine/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/mod.rs
@@ -1177,6 +1177,11 @@ mod tests {
                 question_reasoning_packet: Some(serde_json::json!({
                     "reasoning_mode": "question_centric",
                     "focus_question_ids": ["q_1"],
+                    "candidate_actions": [{
+                        "id": "ca_q_q_1",
+                        "action_type": "verify_claim",
+                        "status": "proposed",
+                    }],
                     "findings": {
                         "supported": [],
                         "contested": [],
@@ -1203,6 +1208,10 @@ mod tests {
             parsed["question_reasoning_packet"]["focus_question_ids"],
             serde_json::json!(["q_1"])
         );
+        assert_eq!(
+            parsed["question_reasoning_packet"]["candidate_actions"][0]["id"],
+            serde_json::json!("ca_q_q_1")
+        );
         assert!(parsed.get("timestamp").is_some());
         assert_eq!(
             parsed["max_steps_per_call"],
diff --git a/openplanter-desktop/crates/op-core/src/prompts.rs b/openplanter-desktop/crates/op-core/src/prompts.rs
index ba3874fc..8cb3faea 100644
--- a/openplanter-desktop/crates/op-core/src/prompts.rs
+++ b/openplanter-desktop/crates/op-core/src/prompts.rs
@@ -265,6 +265,12 @@ Rules:
 - Do not mark a claim supported without support evidence IDs.
 - Do not resolve a question without explicit claim/evidence linkage.
 - Prefer provenance-backed evidence over uncited notes.
+- `question_reasoning_packet.candidate_actions` is a machine-readable, read-only
+  planner surface. Use it to prioritize next steps, but do not assume those
+  actions were persisted as canonical tasks or executed actions yet.
+- Keep any use of `candidate_actions` structured: preserve rationale,
+  required_sources, expected_payoff, evidence_gap_refs, and ontology_object_refs
+  instead of turning them into prose recommendations.
 
 Final deliverables MUST separate findings into three sections:
 - Supported Findings
@@ -455,6 +461,7 @@ mod tests {
         assert!(prompt.contains("SESSION LOGS AND TRANSCRIPTS"));
         assert!(prompt.contains("TURN HISTORY"));
         assert!(prompt.contains("QUESTION-CENTRIC REASONING"));
+        assert!(prompt.contains("candidate_actions"));
         assert!(prompt.contains("DATA SOURCES WIKI"));
         assert!(!prompt.contains("REPL STRUCTURE"));
         assert!(!prompt.contains("ACCEPTANCE CRITERIA"));
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
index c811417c..0bf58ff4 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
@@ -194,6 +194,10 @@ mod tests {
             .question_reasoning_packet
             .expect("packet should be present");
         assert_eq!(packet["focus_question_ids"], serde_json::json!(["q_1"]));
+        assert_eq!(
+            packet["candidate_actions"][0]["id"],
+            serde_json::json!("ca_q_q_1")
+        );
         assert_eq!(context.session_id, Some("sid".to_string()));
         assert_eq!(context.session_dir, Some(tmp.path().display().to_string()));
     }
diff --git a/tests/test_engine.py b/tests/test_engine.py
index fe11db07..4e8c58bc 100644
--- a/tests/test_engine.py
+++ b/tests/test_engine.py
@@ -269,6 +269,8 @@ def test_prompt_includes_question_centric_reasoning_rules(self) -> None:
         self.assertIn("QUESTION-CENTRIC REASONING", prompt)
         self.assertIn("supported / contested / unresolved", prompt)
         self.assertIn("Supported Findings", prompt)
+        self.assertIn("candidate_actions", prompt)
+        self.assertIn("machine-readable, read-only", prompt)
 
     def test_recursive_initial_message_has_repl_hint(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
@@ -341,6 +343,14 @@ def create_conversation(self, system_prompt: str, initial_user_message: str):
                 "findings": {"supported": [], "contested": [], "unresolved": []},
                 "contradictions": [],
                 "evidence_index": {},
+                "candidate_actions": [
+                    {
+                        "id": "ca_q_q_1",
+                        "action_type": "search",
+                        "status": "proposed",
+                        "priority": "high",
+                    }
+                ],
             }
 
             engine.solve_with_context("test objective", question_reasoning_packet=packet)
diff --git a/tests/test_investigation_state.py b/tests/test_investigation_state.py
index 0c97dbc7..73e4404a 100644
--- a/tests/test_investigation_state.py
+++ b/tests/test_investigation_state.py
@@ -269,6 +269,102 @@ def test_build_question_reasoning_packet_groups_findings_and_contradictions(self
         self.assertEqual(packet["findings"]["unresolved"][0]["id"], "cl_3")
         self.assertEqual(packet["contradictions"][0]["claim_id"], "cl_2")
         self.assertIn("ev_3", packet["evidence_index"])
+        self.assertEqual(
+            [action["id"] for action in packet["candidate_actions"]],
+            ["ca_q_q_1", "ca_q_q_2", "ca_c_cl_2", "ca_c_cl_3"],
+        )
+        self.assertEqual(packet["candidate_actions"][0]["required_sources"], ["s1", "s3"])
+        self.assertEqual(
+            packet["candidate_actions"][1]["rationale"]["reason_codes"],
+            ["question_unresolved", "claim_low_confidence"],
+        )
+        self.assertEqual(
+            packet["candidate_actions"][2]["evidence_gap_refs"][0]["kind"],
+            "low_confidence",
+        )
+        self.assertEqual(
+            packet["candidate_actions"][3]["evidence_gap_refs"][0]["kind"],
+            "missing_counter_evidence",
+        )
+        self.assertEqual(packet["candidate_actions"][3]["required_sources"], ["s4"])
+        self.assertTrue(packet["candidate_actions"][0]["ontology_object_refs"])
+
+    def test_build_question_reasoning_packet_emits_candidate_actions_for_missing_evidence(self) -> None:
+        state = {
+            "questions": {
+                "q_1": {
+                    "id": "q_1",
+                    "question_text": "What source confirms the claim?",
+                    "status": "open",
+                    "priority": "high",
+                    "claim_ids": ["cl_1"],
+                    "evidence_ids": [],
+                }
+            },
+            "claims": {
+                "cl_1": {
+                    "id": "cl_1",
+                    "claim_text": "Needs evidence",
+                    "status": "proposed",
+                    "evidence_ids": [],
+                    "confidence": "0.20",
+                }
+            },
+            "evidence": {},
+        }
+
+        packet = build_question_reasoning_packet(state)
+
+        self.assertEqual(packet["candidate_actions"][0]["id"], "ca_q_q_1")
+        self.assertEqual(packet["candidate_actions"][0]["evidence_gap_refs"][0]["kind"], "missing_evidence")
+        self.assertEqual(packet["candidate_actions"][1]["id"], "ca_c_cl_1")
+        self.assertEqual(
+            packet["candidate_actions"][1]["rationale"]["reason_codes"],
+            ["claim_unresolved", "claim_low_confidence", "question_unresolved"],
+        )
+        self.assertEqual(packet["candidate_actions"][1]["required_sources"], [])
+
+    def test_build_question_reasoning_packet_keeps_entity_inputs_entity_only_and_collects_question_sources(
+        self,
+    ) -> None:
+        state = {
+            "questions": {
+                "q_1": {
+                    "id": "q_1",
+                    "question_text": "What source confirms the claim?",
+                    "status": "open",
+                    "priority": "high",
+                    "claim_ids": ["cl_1"],
+                    "resolution_claim_id": "cl_resolution",
+                    "provenance_ids": ["pv_q_1"],
+                }
+            },
+            "claims": {
+                "cl_1": {
+                    "id": "cl_1",
+                    "claim_text": "Needs evidence",
+                    "status": "proposed",
+                    "evidence_ids": [],
+                    "confidence": 0.2,
+                }
+            },
+            "provenance_nodes": {
+                "pv_q_1": {
+                    "id": "pv_q_1",
+                    "source_uri": "https://question-source.test",
+                }
+            },
+            "evidence": {},
+        }
+
+        packet = build_question_reasoning_packet(state)
+        question_action = next(action for action in packet["candidate_actions"] if action["id"] == "ca_q_q_1")
+
+        self.assertEqual(question_action["required_inputs"]["entity_ids"], [])
+        self.assertEqual(question_action["required_sources"], ["https://question-source.test"])
+        self.assertFalse(
+            any(ref.get("object_type") == "entity" for ref in question_action["ontology_object_refs"])
+        )
 
 
 if __name__ == "__main__":
diff --git a/tests/test_session.py b/tests/test_session.py
index 87f30426..3a3b5f7e 100644
--- a/tests/test_session.py
+++ b/tests/test_session.py
@@ -9,7 +9,7 @@
 from agent.config import AgentConfig
 from agent.engine import RLMEngine
 from agent.model import ModelTurn, ScriptedModel
-from agent.runtime import SessionRuntime
+from agent.runtime import SessionRuntime, _has_reasoning_content
 from agent.tools import WorkspaceTools
 
 
@@ -127,6 +127,19 @@ def create_conversation(self, system_prompt: str, initial_user_message: str):
             self.assertEqual(packet["reasoning_mode"], "question_centric")
             self.assertEqual(packet["focus_question_ids"], ["q_1"])
             self.assertEqual(packet["findings"]["unresolved"][0]["id"], "cl_1")
+            self.assertEqual(packet["candidate_actions"][0]["id"], "ca_q_q_1")
+            self.assertEqual(packet["candidate_actions"][1]["id"], "ca_c_cl_1")
+            self.assertEqual(packet["candidate_actions"][1]["required_sources"], ["https://example.test"])
+
+    def test_runtime_reasoning_gate_accepts_candidate_actions_only(self) -> None:
+        packet = {
+            "focus_question_ids": [],
+            "findings": {"supported": [], "contested": [], "unresolved": []},
+            "contradictions": [],
+            "candidate_actions": [{"id": "ca_q_q_1"}],
+        }
+
+        self.assertTrue(_has_reasoning_content(packet))
 
     def test_runtime_resume_falls_back_to_legacy_state_when_typed_state_is_invalid(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:

From ea9e7f1dc0a958810c0e02b58240a7cb6bc5ab87 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Sat, 14 Mar 2026 14:24:00 -0400
Subject: [PATCH 32/58] Format model streaming test emitters

---
 .../op-core/tests/test_model_streaming.rs     | 45 +++++++++++++++----
 1 file changed, 36 insertions(+), 9 deletions(-)

diff --git a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
index 5e02d0ee..7756b434 100644
--- a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
+++ b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
@@ -1318,7 +1318,10 @@ async fn test_solve_flushes_final_curator_checkpoint_before_complete() {
 
     impl SolveEmitter for TestEmitter {
         fn emit_trace(&self, message: &str) {
-            self.events.lock().unwrap().push(Ev::Trace(message.to_string()));
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev::Trace(message.to_string()));
         }
 
         fn emit_delta(&self, _: DeltaEvent) {}
@@ -1326,11 +1329,17 @@ async fn test_solve_flushes_final_curator_checkpoint_before_complete() {
         fn emit_step(&self, _: op_core::events::StepEvent) {}
 
         fn emit_complete(&self, result: &str, _: Option<LoopMetrics>) {
-            self.events.lock().unwrap().push(Ev::Complete(result.to_string()));
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev::Complete(result.to_string()));
         }
 
         fn emit_error(&self, message: &str) {
-            self.events.lock().unwrap().push(Ev::Error(message.to_string()));
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev::Error(message.to_string()));
         }
     }
 
@@ -1401,7 +1410,10 @@ async fn test_solve_flushes_cancelled_checkpoint_before_error() {
 
     impl SolveEmitter for TestEmitter {
         fn emit_trace(&self, message: &str) {
-            self.events.lock().unwrap().push(Ev::Trace(message.to_string()));
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev::Trace(message.to_string()));
         }
 
         fn emit_delta(&self, _: DeltaEvent) {}
@@ -1415,7 +1427,10 @@ async fn test_solve_flushes_cancelled_checkpoint_before_error() {
         fn emit_complete(&self, _: &str, _: Option<LoopMetrics>) {}
 
         fn emit_error(&self, message: &str) {
-            self.events.lock().unwrap().push(Ev::Error(message.to_string()));
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev::Error(message.to_string()));
         }
     }
 
@@ -1496,7 +1511,10 @@ async fn test_solve_flushes_model_error_checkpoint_before_error() {
 
     impl SolveEmitter for TestEmitter {
         fn emit_trace(&self, message: &str) {
-            self.events.lock().unwrap().push(Ev::Trace(message.to_string()));
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev::Trace(message.to_string()));
         }
 
         fn emit_delta(&self, _: DeltaEvent) {}
@@ -1506,7 +1524,10 @@ async fn test_solve_flushes_model_error_checkpoint_before_error() {
         fn emit_complete(&self, _: &str, _: Option<LoopMetrics>) {}
 
         fn emit_error(&self, message: &str) {
-            self.events.lock().unwrap().push(Ev::Error(message.to_string()));
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev::Error(message.to_string()));
         }
     }
 
@@ -1585,7 +1606,10 @@ async fn test_solve_flushes_tool_loop_cancel_checkpoint_before_error() {
                     self.cancel.cancel();
                 }
             }
-            self.events.lock().unwrap().push(Ev::Trace(message.to_string()));
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev::Trace(message.to_string()));
         }
 
         fn emit_delta(&self, _: DeltaEvent) {}
@@ -1595,7 +1619,10 @@ async fn test_solve_flushes_tool_loop_cancel_checkpoint_before_error() {
         fn emit_complete(&self, _: &str, _: Option<LoopMetrics>) {}
 
         fn emit_error(&self, message: &str) {
-            self.events.lock().unwrap().push(Ev::Error(message.to_string()));
+            self.events
+                .lock()
+                .unwrap()
+                .push(Ev::Error(message.to_string()));
         }
     }
 

From fc7c0c0078c12a7b43ee102eba821aaf7da79f99 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Sat, 14 Mar 2026 15:19:02 -0400
Subject: [PATCH 33/58] fix: harden desktop state fallback and curator
 cancellation

---
 .../crates/op-core/src/engine/context.rs      | 223 +++++++++++++-----
 .../crates/op-core/src/engine/mod.rs          |   9 +-
 .../op-core/tests/test_model_streaming.rs     |  30 ++-
 3 files changed, 198 insertions(+), 64 deletions(-)

diff --git a/openplanter-desktop/crates/op-core/src/engine/context.rs b/openplanter-desktop/crates/op-core/src/engine/context.rs
index cbf44d6e..85fa1fb2 100644
--- a/openplanter-desktop/crates/op-core/src/engine/context.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/context.rs
@@ -7,6 +7,11 @@ use tokio::fs;
 
 use super::investigation_state::InvestigationState;
 
+struct ResolvedInvestigationState {
+    state: InvestigationState,
+    legacy_rust_observations: Option<Vec<Observation>>,
+}
+
 /// Summary of a completed turn for inclusion in subsequent prompts.
 #[derive(Debug, Clone, Serialize, Deserialize)]
 pub struct TurnSummary {
@@ -50,53 +55,26 @@ impl ExternalContext {
 
     /// Load external context from canonical investigation_state.json or legacy state.json.
     pub async fn load(session_dir: &Path) -> std::io::Result<Self> {
-        let typed_path = session_dir.join("investigation_state.json");
-        if typed_path.exists() {
-            let content = fs::read_to_string(&typed_path).await?;
-            let state: InvestigationState = serde_json::from_str(&content)
-                .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
-            return Ok(Self {
-                observations: state
-                    .legacy_observations()
-                    .into_iter()
-                    .map(|content| Observation {
-                        source: "legacy".to_string(),
-                        timestamp: String::new(),
-                        content,
-                    })
-                    .collect(),
-            });
-        }
-
-        let legacy_path = session_dir.join("state.json");
-        if !legacy_path.exists() {
-            return Ok(Self::new());
-        }
-        let content = fs::read_to_string(&legacy_path).await?;
-        let value: Value = serde_json::from_str(&content)
-            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
-
-        if let Some(observations) = legacy_python_observations(&value) {
-            return Ok(Self {
-                observations: observations
-                    .into_iter()
-                    .map(|content| Observation {
-                        source: "legacy".to_string(),
-                        timestamp: String::new(),
-                        content,
-                    })
-                    .collect(),
-            });
-        }
-
-        if let Some(observations) = legacy_rust_observations(&value) {
+        let session_id = session_dir
+            .file_name()
+            .and_then(|value| value.to_str())
+            .unwrap_or_default();
+        let resolved = resolve_investigation_state(session_dir, session_id).await?;
+        if let Some(observations) = resolved.legacy_rust_observations {
             return Ok(Self { observations });
         }
-
-        Err(std::io::Error::new(
-            std::io::ErrorKind::InvalidData,
-            "state.json format not recognized",
-        ))
+        Ok(Self {
+            observations: resolved
+                .state
+                .legacy_observations()
+                .into_iter()
+                .map(|content| Observation {
+                    source: "legacy".to_string(),
+                    timestamp: String::new(),
+                    content,
+                })
+                .collect(),
+        })
     }
 
     /// Save external context to additive investigation_state.json and legacy state.json.
@@ -149,16 +127,29 @@ async fn load_existing_investigation_state(
     session_dir: &Path,
     session_id: &str,
 ) -> std::io::Result<InvestigationState> {
+    Ok(resolve_investigation_state(session_dir, session_id)
+        .await?
+        .state)
+}
+
+async fn resolve_investigation_state(
+    session_dir: &Path,
+    session_id: &str,
+) -> std::io::Result<ResolvedInvestigationState> {
     let typed_path = session_dir.join("investigation_state.json");
-    if typed_path.exists() {
-        let content = fs::read_to_string(&typed_path).await?;
-        return serde_json::from_str(&content)
-            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e));
+    if let Some(state) = try_load_typed_state(&typed_path).await? {
+        return Ok(ResolvedInvestigationState {
+            state,
+            legacy_rust_observations: None,
+        });
     }
 
     let legacy_path = session_dir.join("state.json");
     if !legacy_path.exists() {
-        return Ok(InvestigationState::new(session_id));
+        return Ok(ResolvedInvestigationState {
+            state: InvestigationState::new(session_id),
+            legacy_rust_observations: None,
+        });
     }
 
     let content = fs::read_to_string(&legacy_path).await?;
@@ -166,14 +157,16 @@ async fn load_existing_investigation_state(
         .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
 
     if legacy_python_observations(&value).is_some() {
-        return Ok(InvestigationState::from_legacy_python_state(
-            session_id, &value,
-        ));
+        return Ok(ResolvedInvestigationState {
+            state: InvestigationState::from_legacy_python_state(session_id, &value),
+            legacy_rust_observations: None,
+        });
     }
-    if legacy_rust_observations(&value).is_some() {
-        return Ok(InvestigationState::from_legacy_rust_state(
-            session_id, &value,
-        ));
+    if let Some(observations) = legacy_rust_observations(&value) {
+        return Ok(ResolvedInvestigationState {
+            state: InvestigationState::from_legacy_rust_state(session_id, &value),
+            legacy_rust_observations: Some(observations),
+        });
     }
 
     Err(std::io::Error::new(
@@ -182,6 +175,23 @@ async fn load_existing_investigation_state(
     ))
 }
 
+async fn try_load_typed_state(path: &Path) -> std::io::Result<Option<InvestigationState>> {
+    if !path.exists() {
+        return Ok(None);
+    }
+
+    let content = match fs::read_to_string(path).await {
+        Ok(content) => content,
+        Err(err) if err.kind() == std::io::ErrorKind::InvalidData => return Ok(None),
+        Err(err) => return Err(err),
+    };
+
+    match serde_json::from_str(&content) {
+        Ok(state) => Ok(Some(state)),
+        Err(_) => Ok(None),
+    }
+}
+
 fn legacy_python_observations(value: &Value) -> Option<Vec<String>> {
     value
         .as_object()?
@@ -356,6 +366,105 @@ mod tests {
         assert_eq!(ctx.observations[1].content, "two");
     }
 
+    #[tokio::test]
+    async fn test_invalid_typed_state_falls_back_to_legacy_python_state() {
+        let tmp = tempdir().unwrap();
+        let typed_path = tmp.path().join("investigation_state.json");
+        let corrupt_typed = "{not-json";
+        fs::write(&typed_path, corrupt_typed).await.unwrap();
+        fs::write(
+            tmp.path().join("state.json"),
+            r#"{"session_id":"sid","external_observations":["legacy fallback"]}"#,
+        )
+        .await
+        .unwrap();
+
+        let ctx = ExternalContext::load(tmp.path()).await.unwrap();
+        assert_eq!(ctx.observations.len(), 1);
+        assert_eq!(ctx.observations[0].content, "legacy fallback");
+
+        let state = load_or_migrate_investigation_state(tmp.path())
+            .await
+            .unwrap();
+        assert_eq!(state.legacy.external_observations, vec!["legacy fallback"]);
+        assert_eq!(
+            state.evidence["ev_legacy_000001"]["content"],
+            Value::String("legacy fallback".to_string())
+        );
+        assert_eq!(
+            fs::read_to_string(&typed_path).await.unwrap(),
+            corrupt_typed
+        );
+    }
+
+    #[tokio::test]
+    async fn test_invalid_typed_state_falls_back_to_legacy_rust_observations() {
+        let tmp = tempdir().unwrap();
+        let typed_path = tmp.path().join("investigation_state.json");
+        fs::write(&typed_path, "{not-json").await.unwrap();
+        fs::write(
+            tmp.path().join("state.json"),
+            r#"{"observations":[{"source":"wiki","timestamp":"2026-03-13T00:00:00Z","content":"one"},{"source":"tool","timestamp":"2026-03-13T00:00:01Z","content":"two"}]}"#,
+        )
+        .await
+        .unwrap();
+
+        let ctx = ExternalContext::load(tmp.path()).await.unwrap();
+        assert_eq!(ctx.observations.len(), 2);
+        assert_eq!(ctx.observations[0].source, "wiki");
+        assert_eq!(ctx.observations[0].timestamp, "2026-03-13T00:00:00Z");
+        assert_eq!(ctx.observations[1].content, "two");
+
+        let state = load_or_migrate_investigation_state(tmp.path())
+            .await
+            .unwrap();
+        assert_eq!(state.legacy.external_observations, vec!["one", "two"]);
+        assert_eq!(fs::read_to_string(&typed_path).await.unwrap(), "{not-json");
+    }
+
+    #[tokio::test]
+    async fn test_invalid_typed_state_without_legacy_returns_empty_state() {
+        let tmp = tempdir().unwrap();
+        let typed_path = tmp.path().join("investigation_state.json");
+        fs::write(&typed_path, "{not-json").await.unwrap();
+
+        let ctx = ExternalContext::load(tmp.path()).await.unwrap();
+        assert!(ctx.observations.is_empty());
+
+        let state = load_or_migrate_investigation_state(tmp.path())
+            .await
+            .unwrap();
+        assert_eq!(
+            state.session_id,
+            tmp.path()
+                .file_name()
+                .and_then(|value| value.to_str())
+                .unwrap_or_default()
+        );
+        assert!(state.legacy.external_observations.is_empty());
+        assert!(state.evidence.is_empty());
+        assert_eq!(fs::read_to_string(&typed_path).await.unwrap(), "{not-json");
+    }
+
+    #[tokio::test]
+    async fn test_invalid_typed_state_with_malformed_legacy_remains_error() {
+        let tmp = tempdir().unwrap();
+        fs::write(tmp.path().join("investigation_state.json"), "{not-json")
+            .await
+            .unwrap();
+        fs::write(tmp.path().join("state.json"), "{still-not-json")
+            .await
+            .unwrap();
+
+        let ctx_err = ExternalContext::load(tmp.path()).await.unwrap_err();
+        assert_eq!(ctx_err.kind(), std::io::ErrorKind::InvalidData);
+
+        let state_err = load_or_migrate_investigation_state(tmp.path())
+            .await
+            .unwrap_err();
+        assert_eq!(state_err.kind(), std::io::ErrorKind::InvalidData);
+    }
+
     #[tokio::test]
     async fn test_save_preserves_existing_typed_fields_and_extra_fields() {
         let tmp = tempdir().unwrap();
diff --git a/openplanter-desktop/crates/op-core/src/engine/mod.rs b/openplanter-desktop/crates/op-core/src/engine/mod.rs
index a80846fb..00dbb1f7 100644
--- a/openplanter-desktop/crates/op-core/src/engine/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/mod.rs
@@ -106,11 +106,11 @@ async fn flush_pending_curator_checkpoint(
     pending_deltas: &mut Vec<CuratorStateDelta>,
     boundary: &str,
     config: &AgentConfig,
+    cancel: &CancellationToken,
     emitter: &dyn SolveEmitter,
 ) {
     if let Some(checkpoint) = take_pending_curator_checkpoint(pending_deltas, boundary) {
-        let checkpoint_cancel = CancellationToken::new();
-        emit_curator_checkpoint(checkpoint, config, &checkpoint_cancel, emitter).await;
+        emit_curator_checkpoint(checkpoint, config, cancel, emitter).await;
     }
 }
 
@@ -593,6 +593,7 @@ pub async fn solve_with_initial_context(
                 &mut pending_curator_deltas,
                 "cancelled",
                 config,
+                &cancel,
                 emitter,
             )
             .await;
@@ -630,6 +631,7 @@ pub async fn solve_with_initial_context(
                         "model_error"
                     },
                     config,
+                    &cancel,
                     emitter,
                 )
                 .await;
@@ -698,6 +700,7 @@ pub async fn solve_with_initial_context(
                 &mut pending_curator_deltas,
                 "finalize",
                 config,
+                &cancel,
                 emitter,
             )
             .await;
@@ -717,6 +720,7 @@ pub async fn solve_with_initial_context(
                     &mut pending_curator_deltas,
                     "cancelled",
                     config,
+                    &cancel,
                     emitter,
                 )
                 .await;
@@ -823,6 +827,7 @@ pub async fn solve_with_initial_context(
         &mut pending_curator_deltas,
         "budget_exhausted",
         config,
+        &cancel,
         emitter,
     )
     .await;
diff --git a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
index 7756b434..df7df723 100644
--- a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
+++ b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
@@ -1073,13 +1073,20 @@ event: message_stop\ndata: {\"type\":\"message_stop\"}\n\n";
 
 /// Start a stateful mock server that returns different SSE bodies on successive calls.
 async fn start_stateful_mock_server(responses: Vec<&'static str>) -> SocketAddr {
+    start_stateful_mock_server_with_counter(responses).await.0
+}
+
+async fn start_stateful_mock_server_with_counter(
+    responses: Vec<&'static str>,
+) -> (SocketAddr, Arc<Mutex<usize>>) {
     let counter = Arc::new(Mutex::new(0usize));
+    let counter_for_app = counter.clone();
     let responses = Arc::new(responses);
 
     let app = Router::new().route(
         "/{*path}",
         post(move || {
-            let counter = counter.clone();
+            let counter = counter_for_app.clone();
             let responses = responses.clone();
             async move {
                 let mut idx = counter.lock().unwrap();
@@ -1104,7 +1111,7 @@ async fn start_stateful_mock_server(responses: Vec<&'static str>) -> SocketAddr
     tokio::spawn(async move {
         axum::serve(listener, app).await.unwrap();
     });
-    addr
+    (addr, counter)
 }
 
 #[tokio::test]
@@ -1393,8 +1400,11 @@ async fn test_solve_flushes_cancelled_checkpoint_before_error() {
     use op_core::engine::{SolveEmitter, solve};
     use op_core::events::{LoopMetrics, StepEvent};
 
-    let addr =
-        start_stateful_mock_server(vec![ANTHROPIC_SSE_TOOL_LIST, ANTHROPIC_SSE_CURATOR_NOOP]).await;
+    let (addr, request_count) = start_stateful_mock_server_with_counter(vec![
+        ANTHROPIC_SSE_TOOL_LIST,
+        ANTHROPIC_SSE_CURATOR_NOOP,
+    ])
+    .await;
 
     #[derive(Debug, Clone)]
     #[allow(dead_code)]
@@ -1468,6 +1478,11 @@ async fn test_solve_flushes_cancelled_checkpoint_before_error() {
         cancelled_trace < error,
         "cancelled checkpoint should flush before error: {recorded:?}"
     );
+    assert_eq!(
+        *request_count.lock().unwrap(),
+        1,
+        "cancelled solve should not issue a curator model request"
+    );
 }
 
 #[tokio::test]
@@ -1577,7 +1592,7 @@ async fn test_solve_flushes_tool_loop_cancel_checkpoint_before_error() {
     use op_core::engine::{SolveEmitter, solve};
     use op_core::events::LoopMetrics;
 
-    let addr = start_stateful_mock_server(vec![
+    let (addr, request_count) = start_stateful_mock_server_with_counter(vec![
         ANTHROPIC_SSE_TOOL_LIST,
         ANTHROPIC_SSE_TWO_TOOL_LIST,
         ANTHROPIC_SSE_CURATOR_NOOP,
@@ -1661,6 +1676,11 @@ async fn test_solve_flushes_tool_loop_cancel_checkpoint_before_error() {
         cancelled_trace < error,
         "tool-loop cancel checkpoint should flush before error: {recorded:?}"
     );
+    assert_eq!(
+        *request_count.lock().unwrap(),
+        2,
+        "tool-loop cancellation should not issue a curator model request"
+    );
 }
 
 const ANTHROPIC_SSE_META_FINAL: &str = "\

From 35c4041b4b503f1ba63fc0a63bb07a2e7f75c0a9 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Sat, 14 Mar 2026 16:02:46 -0400
Subject: [PATCH 34/58] fix: align rust reasoning packet with python parity

---
 .../op-core/src/engine/investigation_state.rs | 263 +++++++++++++++---
 1 file changed, 219 insertions(+), 44 deletions(-)

diff --git a/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs b/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs
index e2fa9594..744957d3 100644
--- a/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs
@@ -400,18 +400,8 @@ pub fn build_question_reasoning_packet(
             .and_then(Value::as_str)
             .unwrap_or("unresolved")
             .to_ascii_lowercase();
-        let support_ids = limit_ids(
-            claim
-                .get("support_evidence_ids")
-                .or_else(|| claim.get("evidence_ids")),
-            max_evidence_per_item,
-        );
-        let contradiction_ids = limit_ids(
-            claim
-                .get("contradiction_evidence_ids")
-                .or_else(|| claim.get("contradict_evidence_ids")),
-            max_evidence_per_item,
-        );
+        let support_ids = claim_support_evidence_ids(claim, max_evidence_per_item);
+        let contradiction_ids = claim_contradiction_evidence_ids(claim, max_evidence_per_item);
         let has_contradictions = !contradiction_ids.is_empty();
         let confidence = claim
             .get("confidence")
@@ -650,7 +640,7 @@ fn build_candidate_actions(
             continue;
         };
         let claim_status = claim_status(claim);
-        if claim_status == "retracted" {
+        if matches!(claim_status.as_str(), "retracted" | "resolved" | "closed") {
             continue;
         }
         let confidence = claim_confidence(claim);
@@ -861,22 +851,39 @@ fn claim_evidence_ids(
         return Vec::new();
     };
     dedupe_strings(
-        limit_ids(
-            claim
-                .get("support_evidence_ids")
-                .or_else(|| claim.get("evidence_support_ids"))
-                .or_else(|| claim.get("evidence_ids")),
-            max_evidence_per_item,
-        )
-        .into_iter()
-        .chain(limit_ids(
-            claim
-                .get("contradiction_evidence_ids")
-                .or_else(|| claim.get("evidence_contra_ids"))
-                .or_else(|| claim.get("contradict_evidence_ids")),
-            max_evidence_per_item,
-        ))
-        .collect(),
+        claim_support_evidence_ids(claim, max_evidence_per_item)
+            .into_iter()
+            .chain(claim_contradiction_evidence_ids(
+                claim,
+                max_evidence_per_item,
+            ))
+            .collect(),
+    )
+}
+
+fn claim_support_evidence_ids(
+    claim: &Map<String, Value>,
+    max_evidence_per_item: usize,
+) -> Vec<String> {
+    limit_ids(
+        claim
+            .get("support_evidence_ids")
+            .or_else(|| claim.get("evidence_support_ids"))
+            .or_else(|| claim.get("evidence_ids")),
+        max_evidence_per_item,
+    )
+}
+
+fn claim_contradiction_evidence_ids(
+    claim: &Map<String, Value>,
+    max_evidence_per_item: usize,
+) -> Vec<String> {
+    limit_ids(
+        claim
+            .get("contradiction_evidence_ids")
+            .or_else(|| claim.get("evidence_contra_ids"))
+            .or_else(|| claim.get("contradict_evidence_ids")),
+        max_evidence_per_item,
     )
 }
 
@@ -967,20 +974,8 @@ fn build_claim_gap_refs(
     let Some(claim) = state.claims.get(claim_id).and_then(Value::as_object) else {
         return Vec::new();
     };
-    let support_ids = limit_ids(
-        claim
-            .get("support_evidence_ids")
-            .or_else(|| claim.get("evidence_support_ids"))
-            .or_else(|| claim.get("evidence_ids")),
-        max_evidence_per_item,
-    );
-    let contradiction_ids = limit_ids(
-        claim
-            .get("contradiction_evidence_ids")
-            .or_else(|| claim.get("evidence_contra_ids"))
-            .or_else(|| claim.get("contradict_evidence_ids")),
-        max_evidence_per_item,
-    );
+    let support_ids = claim_support_evidence_ids(claim, max_evidence_per_item);
+    let contradiction_ids = claim_contradiction_evidence_ids(claim, max_evidence_per_item);
     let mut refs = Vec::new();
     if evidence_ids.is_empty() {
         refs.push(serde_json::json!({
@@ -997,7 +992,7 @@ fn build_claim_gap_refs(
     }
     if matches!(
         claim_status.to_ascii_lowercase().as_str(),
-        "unresolved" | "contested"
+        "unresolved" | "contested" | "proposed"
     ) && (!support_ids.is_empty() || !contradiction_ids.is_empty())
         && (support_ids.is_empty() || contradiction_ids.is_empty())
     {
@@ -1774,6 +1769,186 @@ mod tests {
         );
     }
 
+    #[test]
+    fn reasoning_packet_uses_canonical_claim_evidence_aliases_in_findings_and_sources() {
+        let mut state = InvestigationState::new("sid");
+        state.questions.insert(
+            "q_alias".to_string(),
+            serde_json::json!({
+                "id": "q_alias",
+                "question_text": "What evidence supports the alias-backed claim?",
+                "status": "open",
+                "priority": "high",
+                "claim_ids": ["cl_alias"],
+                "evidence_ids": [],
+            }),
+        );
+        state.claims.insert(
+            "cl_alias".to_string(),
+            serde_json::json!({
+                "id": "cl_alias",
+                "claim_text": "Alias-backed claim",
+                "status": "contested",
+                "evidence_support_ids": ["ev_support_alias"],
+                "evidence_contra_ids": ["ev_contra_alias"],
+                "confidence": 0.4,
+            }),
+        );
+        state.evidence.insert(
+            "ev_support_alias".to_string(),
+            serde_json::json!({
+                "evidence_type": "doc",
+                "source_uri": "https://support.test",
+            }),
+        );
+        state.evidence.insert(
+            "ev_contra_alias".to_string(),
+            serde_json::json!({
+                "evidence_type": "doc",
+                "source_uri": "https://contra.test",
+            }),
+        );
+
+        let packet = build_question_reasoning_packet(&state, 8, 6);
+
+        assert_eq!(
+            packet["findings"]["contested"][0]["support_evidence_ids"],
+            serde_json::json!(["ev_support_alias"])
+        );
+        assert_eq!(
+            packet["findings"]["contested"][0]["contradiction_evidence_ids"],
+            serde_json::json!(["ev_contra_alias"])
+        );
+        assert_eq!(
+            packet["contradictions"][0]["support_evidence_ids"],
+            serde_json::json!(["ev_support_alias"])
+        );
+        assert_eq!(
+            packet["contradictions"][0]["contradiction_evidence_ids"],
+            serde_json::json!(["ev_contra_alias"])
+        );
+        assert!(packet["evidence_index"].get("ev_support_alias").is_some());
+        assert!(packet["evidence_index"].get("ev_contra_alias").is_some());
+
+        let actions = packet["candidate_actions"]
+            .as_array()
+            .expect("candidate actions");
+        let question_action = actions
+            .iter()
+            .find(|action| action.get("id") == Some(&Value::String("ca_q_q_alias".to_string())))
+            .expect("question action");
+        let claim_action = actions
+            .iter()
+            .find(|action| action.get("id") == Some(&Value::String("ca_c_cl_alias".to_string())))
+            .expect("claim action");
+
+        assert_eq!(
+            question_action["required_sources"],
+            serde_json::json!(["https://contra.test", "https://support.test"])
+        );
+        assert_eq!(
+            claim_action["required_sources"],
+            serde_json::json!(["https://contra.test", "https://support.test"])
+        );
+    }
+
+    #[test]
+    fn candidate_actions_skip_resolved_and_closed_claims() {
+        let mut state = InvestigationState::new("sid");
+        state.claims.insert(
+            "cl_resolved".to_string(),
+            serde_json::json!({
+                "id": "cl_resolved",
+                "claim_text": "Resolved claim",
+                "status": "resolved",
+                "confidence": 0.2,
+                "support_evidence_ids": ["ev_resolved"],
+            }),
+        );
+        state.claims.insert(
+            "cl_closed".to_string(),
+            serde_json::json!({
+                "id": "cl_closed",
+                "claim_text": "Closed claim",
+                "status": "closed",
+                "support_evidence_ids": ["ev_closed"],
+            }),
+        );
+        state.claims.insert(
+            "cl_retracted".to_string(),
+            serde_json::json!({
+                "id": "cl_retracted",
+                "claim_text": "Retracted claim",
+                "status": "retracted",
+                "confidence": 0.1,
+            }),
+        );
+        state.claims.insert(
+            "cl_control".to_string(),
+            serde_json::json!({
+                "id": "cl_control",
+                "claim_text": "Low-confidence supported claim",
+                "status": "supported",
+                "confidence": 0.2,
+                "support_evidence_ids": ["ev_control"],
+            }),
+        );
+
+        let packet = build_question_reasoning_packet(&state, 8, 6);
+        let ids = packet["candidate_actions"]
+            .as_array()
+            .expect("candidate actions")
+            .iter()
+            .filter_map(|action| action.get("id").and_then(Value::as_str))
+            .map(ToString::to_string)
+            .collect::<Vec<_>>();
+
+        assert!(ids.contains(&"ca_c_cl_control".to_string()));
+        assert!(!ids.contains(&"ca_c_cl_resolved".to_string()));
+        assert!(!ids.contains(&"ca_c_cl_closed".to_string()));
+        assert!(!ids.contains(&"ca_c_cl_retracted".to_string()));
+    }
+
+    #[test]
+    fn proposed_claims_emit_missing_counter_evidence_gap() {
+        let mut state = InvestigationState::new("sid");
+        state.claims.insert(
+            "cl_proposed".to_string(),
+            serde_json::json!({
+                "id": "cl_proposed",
+                "claim_text": "Proposed claim",
+                "status": "proposed",
+                "support_evidence_ids": ["ev_proposed"],
+                "confidence": 0.2,
+            }),
+        );
+        state.evidence.insert(
+            "ev_proposed".to_string(),
+            serde_json::json!({
+                "evidence_type": "doc",
+                "source_uri": "https://proposed.test",
+            }),
+        );
+
+        let packet = build_question_reasoning_packet(&state, 8, 6);
+        let claim_action = packet["candidate_actions"]
+            .as_array()
+            .and_then(|items| {
+                items.iter().find(|item| {
+                    item.get("id") == Some(&Value::String("ca_c_cl_proposed".to_string()))
+                })
+            })
+            .expect("proposed claim action");
+
+        assert!(
+            claim_action["evidence_gap_refs"]
+                .as_array()
+                .is_some_and(|refs| refs.iter().any(|gap| {
+                    gap.get("kind") == Some(&Value::String("missing_counter_evidence".to_string()))
+                }))
+        );
+    }
+
     #[test]
     fn has_reasoning_content_returns_false_for_empty_packet() {
         let packet = serde_json::json!({

From d0607a79d126c52df489c88e07f62acdf26749b3 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Sat, 14 Mar 2026 18:07:11 -0400
Subject: [PATCH 35/58] fix: align rust question normalization with python

---
 .../op-core/src/engine/investigation_state.rs | 311 ++++++++++++++++--
 1 file changed, 290 insertions(+), 21 deletions(-)

diff --git a/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs b/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs
index 744957d3..c4e80d2b 100644
--- a/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/investigation_state.rs
@@ -352,27 +352,12 @@ pub fn build_question_reasoning_packet(
                 return None;
             }
 
-            Some(serde_json::json!({
-                "id": question.get("id").and_then(Value::as_str).unwrap_or(question_id),
-                "question": question
-                    .get("question_text")
-                    .and_then(Value::as_str)
-                    .or_else(|| question.get("question").and_then(Value::as_str))
-                    .unwrap_or_default(),
-                "status": status,
-                "priority": question
-                    .get("priority")
-                    .and_then(Value::as_str)
-                    .unwrap_or("medium")
-                    .to_ascii_lowercase(),
-                "claim_ids": id_list(question.get("claim_ids").or_else(|| question.get("claims"))),
-                "evidence_ids": limit_ids(question.get("evidence_ids"), max_evidence_per_item),
-                "triggers": id_list(question.get("trigger").or_else(|| question.get("triggers"))),
-                "updated_at": question
-                    .get("updated_at")
-                    .and_then(Value::as_str)
-                    .unwrap_or_default(),
-            }))
+            Some(normalize_unresolved_question(
+                question_id,
+                question,
+                &status,
+                max_evidence_per_item,
+            ))
         })
         .collect();
     unresolved_questions.sort_by(question_priority_sort_key);
@@ -827,6 +812,17 @@ fn question_claim_ids(question: &Map<String, Value>) -> Vec<String> {
     )
 }
 
+fn question_trigger_ids(question: &Map<String, Value>) -> Vec<String> {
+    let origin = question.get("origin").and_then(Value::as_object);
+    id_list(
+        question
+            .get("trigger")
+            .or_else(|| question.get("triggers"))
+            .or_else(|| origin.and_then(|origin| origin.get("trigger")))
+            .or_else(|| origin.and_then(|origin| origin.get("triggers"))),
+    )
+}
+
 fn question_evidence_ids(
     question: &Map<String, Value>,
     max_evidence_per_item: usize,
@@ -842,6 +838,35 @@ fn question_evidence_ids(
     )
 }
 
+fn normalize_unresolved_question(
+    question_id: &str,
+    question: &Map<String, Value>,
+    status: &str,
+    max_evidence_per_item: usize,
+) -> Value {
+    serde_json::json!({
+        "id": question.get("id").and_then(Value::as_str).unwrap_or(question_id),
+        "question": question
+            .get("question_text")
+            .and_then(Value::as_str)
+            .or_else(|| question.get("question").and_then(Value::as_str))
+            .unwrap_or_default(),
+        "status": status,
+        "priority": question
+            .get("priority")
+            .and_then(Value::as_str)
+            .unwrap_or("medium")
+            .to_ascii_lowercase(),
+        "claim_ids": question_claim_ids(question),
+        "evidence_ids": question_evidence_ids(question, max_evidence_per_item),
+        "triggers": question_trigger_ids(question),
+        "updated_at": question
+            .get("updated_at")
+            .and_then(Value::as_str)
+            .unwrap_or_default(),
+    })
+}
+
 fn claim_evidence_ids(
     state: &InvestigationState,
     claim_id: &str,
@@ -1769,6 +1794,250 @@ mod tests {
         );
     }
 
+    #[test]
+    fn question_normalization_falls_back_to_origin_claims_and_evidence() {
+        let mut state = InvestigationState::new("sid");
+        state.questions.insert(
+            "q_origin".to_string(),
+            serde_json::json!({
+                "id": "q_origin",
+                "question_text": "Origin-backed question",
+                "status": "open",
+                "priority": "high",
+                "origin": {
+                    "claim_ids": ["cl_origin"],
+                    "evidence_ids": ["ev_origin_1", "ev_origin_2"],
+                },
+            }),
+        );
+        state.claims.insert(
+            "cl_origin".to_string(),
+            serde_json::json!({
+                "id": "cl_origin",
+                "claim_text": "Origin-backed claim",
+                "status": "supported",
+                "support_evidence_ids": ["ev_claim"],
+                "confidence": 0.8,
+            }),
+        );
+        state.evidence.insert(
+            "ev_origin_1".to_string(),
+            serde_json::json!({
+                "evidence_type": "doc",
+                "source_uri": "https://origin-question-1.test",
+            }),
+        );
+        state.evidence.insert(
+            "ev_origin_2".to_string(),
+            serde_json::json!({
+                "evidence_type": "doc",
+                "source_uri": "https://origin-question-2.test",
+            }),
+        );
+        state.evidence.insert(
+            "ev_claim".to_string(),
+            serde_json::json!({
+                "evidence_type": "doc",
+                "source_uri": "https://origin-claim.test",
+            }),
+        );
+
+        let packet = build_question_reasoning_packet(&state, 8, 1);
+        let normalized_question = packet["unresolved_questions"]
+            .as_array()
+            .and_then(|items| items.first())
+            .expect("normalized question");
+        let question_action = packet["candidate_actions"]
+            .as_array()
+            .and_then(|items| {
+                items.iter().find(|item| {
+                    item.get("id") == Some(&Value::String("ca_q_q_origin".to_string()))
+                })
+            })
+            .expect("question action");
+
+        assert_eq!(
+            packet["focus_question_ids"],
+            serde_json::json!(["q_origin"])
+        );
+        assert_eq!(
+            normalized_question["claim_ids"],
+            serde_json::json!(["cl_origin"])
+        );
+        assert_eq!(
+            normalized_question["evidence_ids"],
+            serde_json::json!(["ev_origin_1"])
+        );
+        assert_eq!(
+            question_action["target_claim_ids"],
+            serde_json::json!(["cl_origin"])
+        );
+        assert_eq!(
+            question_action["required_inputs"]["evidence_ids"],
+            serde_json::json!(["ev_origin_1", "ev_claim"])
+        );
+        assert!(packet["evidence_index"].get("ev_origin_1").is_some());
+        assert!(packet["evidence_index"].get("ev_claim").is_some());
+        assert!(packet["evidence_index"].get("ev_origin_2").is_none());
+    }
+
+    #[test]
+    fn question_normalization_uses_origin_trigger_aliases() {
+        let mut state = InvestigationState::new("sid");
+        state.questions.insert(
+            "q_origin_trigger".to_string(),
+            serde_json::json!({
+                "id": "q_origin_trigger",
+                "question_text": "Origin trigger question",
+                "status": "open",
+                "priority": "high",
+                "origin": {
+                    "trigger": ["trigger_a"],
+                },
+            }),
+        );
+        state.questions.insert(
+            "q_origin_triggers".to_string(),
+            serde_json::json!({
+                "id": "q_origin_triggers",
+                "question_text": "Origin triggers question",
+                "status": "open",
+                "priority": "medium",
+                "origin": {
+                    "triggers": ["trigger_b", "trigger_c"],
+                },
+            }),
+        );
+
+        let packet = build_question_reasoning_packet(&state, 8, 6);
+        let questions = packet["unresolved_questions"]
+            .as_array()
+            .expect("unresolved questions");
+        let trigger_question = questions
+            .iter()
+            .find(|item| item.get("id") == Some(&Value::String("q_origin_trigger".to_string())))
+            .expect("origin trigger question");
+        let triggers_question = questions
+            .iter()
+            .find(|item| item.get("id") == Some(&Value::String("q_origin_triggers".to_string())))
+            .expect("origin triggers question");
+
+        assert_eq!(
+            trigger_question["triggers"],
+            serde_json::json!(["trigger_a"])
+        );
+        assert_eq!(
+            triggers_question["triggers"],
+            serde_json::json!(["trigger_b", "trigger_c"])
+        );
+    }
+
+    #[test]
+    fn question_normalization_prefers_top_level_values_over_origin() {
+        let mut state = InvestigationState::new("sid");
+        state.questions.insert(
+            "q_override".to_string(),
+            serde_json::json!({
+                "id": "q_override",
+                "question_text": "Override question",
+                "status": "open",
+                "priority": "high",
+                "claim_ids": ["cl_top"],
+                "evidence_ids": ["ev_top"],
+                "trigger": ["trigger_top"],
+                "origin": {
+                    "claim_ids": ["cl_origin"],
+                    "evidence_ids": ["ev_origin"],
+                    "trigger": ["trigger_origin"],
+                    "triggers": ["trigger_origin_fallback"],
+                },
+            }),
+        );
+        state.claims.insert(
+            "cl_top".to_string(),
+            serde_json::json!({
+                "id": "cl_top",
+                "claim_text": "Top-level claim",
+                "status": "supported",
+                "support_evidence_ids": ["ev_claim_top"],
+                "confidence": 0.9,
+            }),
+        );
+        state.claims.insert(
+            "cl_origin".to_string(),
+            serde_json::json!({
+                "id": "cl_origin",
+                "claim_text": "Origin claim",
+                "status": "supported",
+                "support_evidence_ids": ["ev_claim_origin"],
+                "confidence": 0.9,
+            }),
+        );
+        state.evidence.insert(
+            "ev_top".to_string(),
+            serde_json::json!({
+                "evidence_type": "doc",
+                "source_uri": "https://top-level-question.test",
+            }),
+        );
+        state.evidence.insert(
+            "ev_claim_top".to_string(),
+            serde_json::json!({
+                "evidence_type": "doc",
+                "source_uri": "https://top-level-claim.test",
+            }),
+        );
+        state.evidence.insert(
+            "ev_claim_origin".to_string(),
+            serde_json::json!({
+                "evidence_type": "doc",
+                "source_uri": "https://origin-claim.test",
+            }),
+        );
+
+        let packet = build_question_reasoning_packet(&state, 8, 6);
+        let normalized_question = packet["unresolved_questions"]
+            .as_array()
+            .and_then(|items| items.first())
+            .expect("normalized question");
+        let question_action = packet["candidate_actions"]
+            .as_array()
+            .and_then(|items| {
+                items.iter().find(|item| {
+                    item.get("id") == Some(&Value::String("ca_q_q_override".to_string()))
+                })
+            })
+            .expect("question action");
+
+        assert_eq!(
+            normalized_question["claim_ids"],
+            serde_json::json!(["cl_top"])
+        );
+        assert_eq!(
+            normalized_question["evidence_ids"],
+            serde_json::json!(["ev_top"])
+        );
+        assert_eq!(
+            normalized_question["triggers"],
+            serde_json::json!(["trigger_top"])
+        );
+        assert_eq!(
+            question_action["target_claim_ids"],
+            serde_json::json!(["cl_top"])
+        );
+        assert_eq!(
+            question_action["required_inputs"]["evidence_ids"],
+            serde_json::json!(["ev_top", "ev_claim_top"])
+        );
+        assert_eq!(
+            question_action["required_sources"],
+            serde_json::json!([
+                "https://top-level-claim.test",
+                "https://top-level-question.test"
+            ])
+        );
+    }
+
     #[test]
     fn reasoning_packet_uses_canonical_claim_evidence_aliases_in_findings_and_sources() {
         let mut state = InvestigationState::new("sid");

From 32d657617c333ef0c121011129117720cca47bd2 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Sun, 15 Mar 2026 19:05:29 -0400
Subject: [PATCH 36/58] Enforce workspace startup guardrails

---
 README.md                                     |  26 +-
 agent/__main__.py                             |  28 +-
 agent/credentials.py                          |  29 +--
 agent/workspace_resolution.py                 | 135 ++++++++++
 .../crates/op-core/src/credentials.rs         |  42 ++-
 .../crates/op-tauri/src/main.rs               |   8 +-
 .../crates/op-tauri/src/state.rs              | 246 +++++++++++++++---
 tests/test_credentials.py                     |  32 ++-
 tests/test_workspace_resolution.py            | 155 +++++++++++
 9 files changed, 642 insertions(+), 59 deletions(-)
 create mode 100644 agent/workspace_resolution.py
 create mode 100644 tests/test_workspace_resolution.py

diff --git a/README.md b/README.md
index d8e16d38..ed538e98 100644
--- a/README.md
+++ b/README.md
@@ -63,8 +63,11 @@ pip install -e .
 # Configure API keys (interactive prompt)
 openplanter-agent --configure-keys
 
+# In this repo, point OpenPlanter at the live workspace from the repo-root .env
+echo 'OPENPLANTER_WORKSPACE=workspace' >> .env
+
 # Launch the TUI
-openplanter-agent --workspace /path/to/your/project
+openplanter-agent
 ```
 
 Or run a single task headlessly:
@@ -181,11 +184,28 @@ openplanter-agent [options]
 
 | Flag | Description |
 |------|-------------|
-| `--workspace DIR` | Workspace root (default: `.`) |
+| `--workspace DIR` | Explicit non-root workspace override. Repo root is rejected. |
 | `--session-id ID` | Use a specific session ID |
 | `--resume` | Resume the latest (or specified) session |
 | `--list-sessions` | List saved sessions and exit |
 
+### Startup Workspace Resolution
+
+Startup resolves the runtime workspace in this order:
+
+1. Explicit CLI `--workspace` for the Python agent, if provided
+2. Process env `OPENPLANTER_WORKSPACE`
+3. `OPENPLANTER_WORKSPACE` from the nearest ancestor `.env`
+4. Entry-point fallback, followed by repo-root guardrails
+
+Both the CLI and the desktop app refuse to operate directly in repo root. If startup would land on repo root and `<repo>/workspace` exists, OpenPlanter redirects there. Otherwise it exits with an actionable error.
+
+For this repository, the intended local setup is:
+
+```dotenv
+OPENPLANTER_WORKSPACE=workspace
+```
+
 ### Model Selection
 
 | Flag | Description |
@@ -226,7 +246,7 @@ Keys are resolved in this priority order (highest wins):
 
 1. CLI flags (`--openai-api-key`, etc.)
 2. Environment variables (`OPENAI_API_KEY` or `OPENPLANTER_OPENAI_API_KEY`)
-3. `.env` file in the workspace
+3. Nearest ancestor `.env` discovered from the resolved workspace path
 4. Workspace credential store (`.openplanter/credentials.json`)
 5. User credential store (`~/.openplanter/credentials.json`)
 
diff --git a/agent/__main__.py b/agent/__main__.py
index 41678c0b..ce8b19ad 100644
--- a/agent/__main__.py
+++ b/agent/__main__.py
@@ -4,6 +4,7 @@
 import os
 import sys
 from datetime import datetime, timezone
+from pathlib import Path
 
 from .builder import _fetch_models_for_provider, build_engine, infer_provider_for_model
 from .config import (
@@ -26,6 +27,7 @@
 from .runtime import SessionError, SessionRuntime, SessionStore
 from .settings import PersistentSettings, SettingsStore, normalize_reasoning_effort
 from .tui import ChatContext, _clip_event, _get_model_display_name, dispatch_slash_command, run_rich_repl
+from .workspace_resolution import WorkspaceResolutionError, resolve_startup_workspace
 
 VALID_REASONING_FLAGS = ["low", "medium", "high", "none"]
 
@@ -571,9 +573,15 @@ def _has_non_interactive_command(args: argparse.Namespace) -> bool:
     return False
 
 
+def _workspace_flag_explicit(argv: list[str]) -> bool:
+    return any(token == "--workspace" or token.startswith("--workspace=") for token in argv)
+
+
 def main() -> None:
+    argv = sys.argv[1:]
     parser = build_parser()
-    args = parser.parse_args()
+    args = parser.parse_args(argv)
+    workspace_flag_explicit = _workspace_flag_explicit(argv)
 
     if args.resume and args.session_id is None and args.session_id_positional:
         args.session_id = args.session_id_positional
@@ -584,7 +592,20 @@ def main() -> None:
     if (args.headless or non_tty) and not args.textual:
         args.no_tui = True
 
-    cfg = AgentConfig.from_env(args.workspace)
+    try:
+        workspace_resolution = resolve_startup_workspace(
+            cli_workspace=args.workspace,
+            cli_workspace_explicit=workspace_flag_explicit,
+            cwd=Path.cwd(),
+        )
+    except WorkspaceResolutionError as exc:
+        print(f"Workspace error: {exc}")
+        raise SystemExit(2)
+
+    for warning in workspace_resolution.warnings:
+        print(f"[workspace] {warning}")
+
+    cfg = AgentConfig.from_env(workspace_resolution.workspace)
     settings_store = SettingsStore(workspace=cfg.workspace, session_root_dir=cfg.session_root_dir)
     settings = _apply_persistent_settings(cfg, args, settings_store)
 
@@ -686,6 +707,9 @@ def main() -> None:
         startup_info["Reasoning"] = cfg.reasoning_effort
     startup_info["Mode"] = "recursive" if cfg.recursive else "flat"
     startup_info["Workspace"] = str(cfg.workspace)
+    startup_info["WorkspaceSource"] = workspace_resolution.source
+    if workspace_resolution.guardrail_action != "none":
+        startup_info["WorkspaceGuardrail"] = workspace_resolution.guardrail_action
     startup_info["Session"] = runtime.session_id
 
     ctx = ChatContext(runtime=runtime, cfg=cfg, settings_store=settings_store)
diff --git a/agent/credentials.py b/agent/credentials.py
index a79e428e..a145c4e4 100644
--- a/agent/credentials.py
+++ b/agent/credentials.py
@@ -114,13 +114,13 @@ def _strip_quotes(value: str) -> str:
     return value
 
 
-def parse_env_file(path: Path) -> CredentialBundle:
+def parse_env_assignments(path: Path) -> dict[str, str]:
     if not path.exists() or not path.is_file():
-        return CredentialBundle()
+        return {}
     try:
         lines = path.read_text(encoding="utf-8", errors="replace").splitlines()
     except OSError:
-        return CredentialBundle()
+        return {}
 
     env: dict[str, str] = {}
     for raw in lines:
@@ -135,7 +135,11 @@ def parse_env_file(path: Path) -> CredentialBundle:
         key = key.strip()
         value = _strip_quotes(value.strip())
         env[key] = value
+    return env
+
 
+def parse_env_file(path: Path) -> CredentialBundle:
+    env = parse_env_assignments(path)
     return CredentialBundle(
         openai_api_key=(env.get("OPENAI_API_KEY") or env.get("OPENPLANTER_OPENAI_API_KEY") or "").strip() or None,
         openai_oauth_token=(
@@ -199,18 +203,13 @@ def credentials_from_env() -> CredentialBundle:
 
 def discover_env_candidates(workspace: Path) -> list[Path]:
     ws = workspace.expanduser().resolve()
-    candidates: list[Path] = [
-        ws / ".env",
-    ]
-    seen: set[str] = set()
-    unique: list[Path] = []
-    for path in candidates:
-        key = str(path.resolve()) if path.exists() else str(path)
-        if key in seen:
-            continue
-        seen.add(key)
-        unique.append(path)
-    return unique
+    current: Path | None = ws
+    while current is not None:
+        env_path = current / ".env"
+        if env_path.exists():
+            return [env_path]
+        current = current.parent if current.parent != current else None
+    return []
 
 
 @dataclass(slots=True)
diff --git a/agent/workspace_resolution.py b/agent/workspace_resolution.py
new file mode 100644
index 00000000..772efab3
--- /dev/null
+++ b/agent/workspace_resolution.py
@@ -0,0 +1,135 @@
+from __future__ import annotations
+
+import os
+from dataclasses import dataclass, field
+from pathlib import Path
+from typing import Literal
+
+from .credentials import discover_env_candidates, parse_env_assignments
+
+WORKSPACE_ENV_KEY = "OPENPLANTER_WORKSPACE"
+
+WorkspaceSource = Literal["cli_arg", "env", "dotenv", "cwd"]
+GuardrailAction = Literal["none", "redirected_to_workspace"]
+
+
+class WorkspaceResolutionError(RuntimeError):
+    """Raised when startup would use an unsafe workspace path."""
+
+
+@dataclass(slots=True)
+class WorkspaceResolution:
+    workspace: Path
+    source: WorkspaceSource
+    env_path: Path | None = None
+    invalid_env_override: str | None = None
+    invalid_dotenv_value: str | None = None
+    guardrail_action: GuardrailAction = "none"
+    warnings: list[str] = field(default_factory=list)
+
+
+def resolve_startup_workspace(
+    cli_workspace: str,
+    cli_workspace_explicit: bool,
+    cwd: Path,
+) -> WorkspaceResolution:
+    cwd = _normalize_path(cwd)
+    warnings: list[str] = []
+    invalid_env_override: str | None = None
+    invalid_dotenv_value: str | None = None
+
+    if cli_workspace_explicit:
+        candidate = _resolve_candidate(cli_workspace, cwd)
+        if candidate.exists() and not candidate.is_dir():
+            raise WorkspaceResolutionError(
+                f"Refusing to use a file as the workspace: {candidate}. "
+                "Pass --workspace to a directory path instead."
+            )
+        workspace, guardrail_action = _apply_repo_root_guardrail(candidate, allow_redirect=False)
+        return WorkspaceResolution(
+            workspace=workspace,
+            source="cli_arg",
+            guardrail_action=guardrail_action,
+        )
+
+    env_override = (os.getenv(WORKSPACE_ENV_KEY) or "").strip()
+    if env_override:
+        candidate = _resolve_candidate(env_override, cwd)
+        if candidate.is_dir():
+            workspace, guardrail_action = _apply_repo_root_guardrail(candidate, allow_redirect=True)
+            return WorkspaceResolution(
+                workspace=workspace,
+                source="env",
+                guardrail_action=guardrail_action,
+            )
+        invalid_env_override = env_override
+        warnings.append(
+            f"Ignoring {WORKSPACE_ENV_KEY} from process environment because it does not resolve to an existing directory: {env_override}"
+        )
+
+    env_path = next(iter(discover_env_candidates(cwd)), None)
+    if env_path is not None:
+        raw_value = (parse_env_assignments(env_path).get(WORKSPACE_ENV_KEY) or "").strip()
+        if raw_value:
+            candidate = _resolve_candidate(raw_value, env_path.parent)
+            if candidate.is_dir():
+                workspace, guardrail_action = _apply_repo_root_guardrail(candidate, allow_redirect=True)
+                return WorkspaceResolution(
+                    workspace=workspace,
+                    source="dotenv",
+                    env_path=env_path,
+                    invalid_env_override=invalid_env_override,
+                    guardrail_action=guardrail_action,
+                    warnings=warnings,
+                )
+            invalid_dotenv_value = raw_value
+            warnings.append(
+                f"Ignoring {WORKSPACE_ENV_KEY} from {env_path} because it does not resolve to an existing directory: {raw_value}"
+            )
+
+    workspace, guardrail_action = _apply_repo_root_guardrail(cwd, allow_redirect=True)
+    return WorkspaceResolution(
+        workspace=workspace,
+        source="cwd",
+        env_path=env_path,
+        invalid_env_override=invalid_env_override,
+        invalid_dotenv_value=invalid_dotenv_value,
+        guardrail_action=guardrail_action,
+        warnings=warnings,
+    )
+
+
+def _resolve_candidate(raw_value: str, base_dir: Path) -> Path:
+    candidate = Path(raw_value).expanduser()
+    if not candidate.is_absolute():
+        candidate = base_dir / candidate
+    return _normalize_path(candidate)
+
+
+def _normalize_path(path: Path) -> Path:
+    return Path(os.path.realpath(os.fspath(path.expanduser())))
+
+
+def _find_repo_root(start: Path) -> Path | None:
+    current = _normalize_path(start)
+    while True:
+        if current.joinpath(".git").exists():
+            return current
+        parent = current.parent
+        if parent == current:
+            return None
+        current = parent
+
+
+def _apply_repo_root_guardrail(candidate: Path, allow_redirect: bool) -> tuple[Path, GuardrailAction]:
+    candidate = _normalize_path(candidate)
+    repo_root = _find_repo_root(candidate)
+    if repo_root is not None and repo_root == candidate:
+        workspace_dir = repo_root / "workspace"
+        if allow_redirect and workspace_dir.is_dir():
+            return (_normalize_path(workspace_dir), "redirected_to_workspace")
+        raise WorkspaceResolutionError(
+            f"Refusing to use repository root as the workspace: {repo_root}. "
+            f"Set {WORKSPACE_ENV_KEY} in the nearest .env or pass --workspace to a non-root directory."
+        )
+    return (candidate, "none")
diff --git a/openplanter-desktop/crates/op-core/src/credentials.rs b/openplanter-desktop/crates/op-core/src/credentials.rs
index 5ec9aa49..2ca43579 100644
--- a/openplanter-desktop/crates/op-core/src/credentials.rs
+++ b/openplanter-desktop/crates/op-core/src/credentials.rs
@@ -128,11 +128,10 @@ fn strip_quotes(s: &str) -> &str {
     trimmed
 }
 
-/// Parse a `.env` file and extract credential keys.
-pub fn parse_env_file(path: &Path) -> CredentialBundle {
+pub fn parse_env_assignments(path: &Path) -> HashMap<String, String> {
     let content = match fs::read_to_string(path) {
         Ok(c) => c,
-        Err(_) => return CredentialBundle::default(),
+        Err(_) => return HashMap::new(),
     };
 
     let mut env_map: HashMap<String, String> = HashMap::new();
@@ -149,6 +148,13 @@ pub fn parse_env_file(path: &Path) -> CredentialBundle {
         }
     }
 
+    env_map
+}
+
+/// Parse a `.env` file and extract credential keys.
+pub fn parse_env_file(path: &Path) -> CredentialBundle {
+    let env_map = parse_env_assignments(path);
+
     fn get_key(map: &HashMap<String, String>, primary: &str, secondary: &str) -> Option<String> {
         map.get(primary)
             .or_else(|| map.get(secondary))
@@ -433,6 +439,36 @@ UNRELATED_VAR=foo
         assert!(bundle.cerebras_api_key.is_none());
     }
 
+    #[test]
+    fn test_parse_env_assignments_preserves_generic_workspace_keys() {
+        let dir = tempfile::tempdir().unwrap();
+        let env_path = dir.path().join(".env");
+        fs::write(
+            &env_path,
+            "OPENPLANTER_WORKSPACE=workspace\nOPENAI_API_KEY=sk-from-env\n",
+        )
+        .unwrap();
+
+        let env_map = parse_env_assignments(&env_path);
+        assert_eq!(
+            env_map.get("OPENPLANTER_WORKSPACE"),
+            Some(&"workspace".to_string())
+        );
+        assert_eq!(env_map.get("OPENAI_API_KEY"), Some(&"sk-from-env".to_string()));
+    }
+
+    #[test]
+    fn test_discover_env_candidates_returns_nearest_ancestor_env() {
+        let dir = tempfile::tempdir().unwrap();
+        let repo = dir.path().join("repo");
+        let nested = repo.join("workspace").join("deep");
+        fs::create_dir_all(&nested).unwrap();
+        fs::write(repo.join(".env"), "OPENPLANTER_WORKSPACE=workspace\n").unwrap();
+
+        let candidates = discover_env_candidates(&nested);
+        assert_eq!(candidates, vec![repo.join(".env").canonicalize().unwrap()]);
+    }
+
     #[test]
     fn test_credential_store_save_load() {
         let dir = tempfile::tempdir().unwrap();
diff --git a/openplanter-desktop/crates/op-tauri/src/main.rs b/openplanter-desktop/crates/op-tauri/src/main.rs
index 49cefe20..f19df808 100644
--- a/openplanter-desktop/crates/op-tauri/src/main.rs
+++ b/openplanter-desktop/crates/op-tauri/src/main.rs
@@ -8,7 +8,13 @@ mod state;
 use state::AppState;
 
 fn main() {
-    let state = AppState::new();
+    let state = match AppState::try_new() {
+        Ok(state) => state,
+        Err(err) => {
+            eprintln!("[startup:error] {err}");
+            std::process::exit(2);
+        }
+    };
     eprintln!("[startup:info] {}", state.startup_trace());
 
     tauri::Builder::default()
diff --git a/openplanter-desktop/crates/op-tauri/src/state.rs b/openplanter-desktop/crates/op-tauri/src/state.rs
index 6a649dda..30bca6ca 100644
--- a/openplanter-desktop/crates/op-tauri/src/state.rs
+++ b/openplanter-desktop/crates/op-tauri/src/state.rs
@@ -1,12 +1,15 @@
 use op_core::config::AgentConfig;
 use op_core::config_hydration::{apply_settings_to_config, merge_credentials_into_config};
 use op_core::credentials::CredentialBundle;
-use op_core::credentials::{credentials_from_env, discover_env_candidates, parse_env_file};
+use op_core::credentials::{
+    credentials_from_env, discover_env_candidates, parse_env_assignments, parse_env_file,
+};
 #[cfg(test)]
 use op_core::settings::PersistentSettings;
 use op_core::settings::SettingsStore;
 use op_core::workspace_init;
 use std::env;
+use std::fmt;
 use std::fs;
 use std::path::{Path, PathBuf};
 use std::sync::Arc;
@@ -18,15 +21,25 @@ const WORKSPACE_ENV_KEY: &str = "OPENPLANTER_WORKSPACE";
 #[derive(Debug, Clone, PartialEq, Eq)]
 enum WorkspaceSource {
     EnvOverride,
+    DotEnv,
     GitRoot,
     CurrentDir,
 }
 
+#[derive(Debug, Clone, PartialEq, Eq)]
+enum GuardrailAction {
+    None,
+    RedirectedToWorkspace,
+}
+
 #[derive(Debug, Clone, PartialEq, Eq)]
 struct ResolvedWorkspace {
     path: PathBuf,
     source: WorkspaceSource,
+    dotenv_path: Option<PathBuf>,
     invalid_override: Option<String>,
+    invalid_dotenv_value: Option<String>,
+    guardrail_action: GuardrailAction,
 }
 
 #[derive(Debug, Clone, Default, PartialEq, Eq)]
@@ -37,6 +50,24 @@ struct LegacyMigrationReport {
     errors: Vec<String>,
 }
 
+#[derive(Debug, Clone, PartialEq, Eq)]
+pub enum StartupWorkspaceError {
+    RepoRootDisallowed { repo_root: PathBuf },
+}
+
+impl fmt::Display for StartupWorkspaceError {
+    fn fmt(&self, f: &mut fmt::Formatter<'_>) -> fmt::Result {
+        match self {
+            StartupWorkspaceError::RepoRootDisallowed { repo_root } => write!(
+                f,
+                "Refusing to use repository root as the workspace: {}. Set {} in the nearest .env or use a non-root workspace override.",
+                repo_root.display(),
+                WORKSPACE_ENV_KEY
+            ),
+        }
+    }
+}
+
 fn canonicalize_or_self(path: &Path) -> PathBuf {
     path.canonicalize().unwrap_or_else(|_| path.to_path_buf())
 }
@@ -52,43 +83,108 @@ fn find_git_root(start: &Path) -> Option<PathBuf> {
     None
 }
 
+fn resolve_candidate_path(raw_value: &str, base_dir: &Path) -> PathBuf {
+    let candidate = PathBuf::from(raw_value.trim());
+    let joined = if candidate.is_absolute() {
+        candidate
+    } else {
+        base_dir.join(candidate)
+    };
+    canonicalize_or_self(&joined)
+}
+
+fn apply_repo_root_guardrail(
+    candidate: &Path,
+) -> Result<(PathBuf, GuardrailAction), StartupWorkspaceError> {
+    let candidate = canonicalize_or_self(candidate);
+    if candidate.join(".git").exists() {
+        let workspace_dir = candidate.join("workspace");
+        if workspace_dir.is_dir() {
+            return Ok((
+                canonicalize_or_self(&workspace_dir),
+                GuardrailAction::RedirectedToWorkspace,
+            ));
+        }
+        return Err(StartupWorkspaceError::RepoRootDisallowed { repo_root: candidate });
+    }
+
+    Ok((candidate, GuardrailAction::None))
+}
+
 fn resolve_startup_workspace_from(
     current_dir: &Path,
     env_override: Option<&str>,
-) -> ResolvedWorkspace {
+) -> Result<ResolvedWorkspace, StartupWorkspaceError> {
+    let dotenv_path = discover_env_candidates(current_dir).into_iter().next();
     let mut invalid_override = None;
+    let mut invalid_dotenv_value = None;
 
     if let Some(raw_override) = env_override
         .map(str::trim)
         .filter(|value| !value.is_empty())
     {
-        let candidate = PathBuf::from(raw_override);
-        if candidate.exists() {
-            return ResolvedWorkspace {
-                path: canonicalize_or_self(&candidate),
+        let candidate = resolve_candidate_path(raw_override, current_dir);
+        if candidate.is_dir() {
+            let (path, guardrail_action) = apply_repo_root_guardrail(&candidate)?;
+            return Ok(ResolvedWorkspace {
+                path,
                 source: WorkspaceSource::EnvOverride,
+                dotenv_path: None,
                 invalid_override: None,
-            };
+                invalid_dotenv_value: None,
+                guardrail_action,
+            });
         }
         invalid_override = Some(raw_override.to_string());
     }
 
+    if let Some(path) = dotenv_path.as_ref() {
+        let env_map = parse_env_assignments(path);
+        if let Some(raw_value) = env_map
+            .get(WORKSPACE_ENV_KEY)
+            .map(|value| value.trim())
+            .filter(|value| !value.is_empty())
+        {
+            let candidate = resolve_candidate_path(raw_value, path.parent().unwrap_or(current_dir));
+            if candidate.is_dir() {
+                let (path, guardrail_action) = apply_repo_root_guardrail(&candidate)?;
+                return Ok(ResolvedWorkspace {
+                    path,
+                    source: WorkspaceSource::DotEnv,
+                    dotenv_path,
+                    invalid_override,
+                    invalid_dotenv_value: None,
+                    guardrail_action,
+                });
+            }
+            invalid_dotenv_value = Some(raw_value.to_string());
+        }
+    }
+
     if let Some(git_root) = find_git_root(current_dir) {
-        return ResolvedWorkspace {
-            path: git_root,
+        let (path, guardrail_action) = apply_repo_root_guardrail(&git_root)?;
+        return Ok(ResolvedWorkspace {
+            path,
             source: WorkspaceSource::GitRoot,
+            dotenv_path,
             invalid_override,
-        };
+            invalid_dotenv_value,
+            guardrail_action,
+        });
     }
 
-    ResolvedWorkspace {
-        path: canonicalize_or_self(current_dir),
+    let (path, guardrail_action) = apply_repo_root_guardrail(current_dir)?;
+    Ok(ResolvedWorkspace {
+        path,
         source: WorkspaceSource::CurrentDir,
+        dotenv_path,
         invalid_override,
-    }
+        invalid_dotenv_value,
+        guardrail_action,
+    })
 }
 
-fn resolve_desktop_workspace() -> ResolvedWorkspace {
+fn resolve_desktop_workspace() -> Result<ResolvedWorkspace, StartupWorkspaceError> {
     let current_dir = env::current_dir().unwrap_or_else(|_| PathBuf::from("."));
     let env_override = env::var(WORKSPACE_ENV_KEY).ok();
     resolve_startup_workspace_from(&current_dir, env_override.as_deref())
@@ -225,10 +321,21 @@ fn format_startup_trace(
 ) -> String {
     let source = match resolved.source {
         WorkspaceSource::EnvOverride => "env_override",
+        WorkspaceSource::DotEnv => "dotenv",
         WorkspaceSource::GitRoot => "git_root",
         WorkspaceSource::CurrentDir => "current_dir",
     };
+    let dotenv_path = resolved
+        .dotenv_path
+        .as_ref()
+        .map(|path| path.display().to_string())
+        .unwrap_or_else(|| "<none>".to_string());
     let invalid_override = resolved.invalid_override.as_deref().unwrap_or("<none>");
+    let invalid_dotenv_value = resolved.invalid_dotenv_value.as_deref().unwrap_or("<none>");
+    let guardrail_action = match resolved.guardrail_action {
+        GuardrailAction::None => "none",
+        GuardrailAction::RedirectedToWorkspace => "redirected_to_workspace",
+    };
     let migration_source = migration
         .source
         .as_ref()
@@ -236,12 +343,15 @@ fn format_startup_trace(
         .unwrap_or_else(|| "<none>".to_string());
 
     format!(
-        "pid={} cwd={} workspace={} source={} invalid_override={} migration_source={} migration_copied={} migration_skipped={} migration_errors={}",
+        "pid={} cwd={} workspace={} source={} dotenv_path={} invalid_override={} invalid_dotenv_value={} guardrail_action={} migration_source={} migration_copied={} migration_skipped={} migration_errors={}",
         std::process::id(),
         current_dir.display(),
         resolved.path.display(),
         source,
+        dotenv_path,
         invalid_override,
+        invalid_dotenv_value,
+        guardrail_action,
         migration_source,
         migration.copied_files,
         migration.skipped_existing,
@@ -260,9 +370,9 @@ pub struct AppState {
 }
 
 impl AppState {
-    pub fn new() -> Self {
+    pub fn try_new() -> Result<Self, StartupWorkspaceError> {
         let current_dir = env::current_dir().unwrap_or_else(|_| PathBuf::from("."));
-        let resolved_workspace = resolve_desktop_workspace();
+        let resolved_workspace = resolve_desktop_workspace()?;
         let mut cfg = AgentConfig::from_env(&resolved_workspace.path);
         let migration = migrate_legacy_desktop_state(&cfg.workspace, &cfg.session_root_dir);
         if let Err(err) =
@@ -288,14 +398,14 @@ impl AppState {
         let settings = SettingsStore::new(&cfg.workspace, &cfg.session_root_dir).load();
         apply_settings_to_config(&mut cfg, &settings);
 
-        Self {
+        Ok(Self {
             config: Arc::new(Mutex::new(cfg)),
             session_id: Arc::new(Mutex::new(None)),
             cancel_token: Arc::new(Mutex::new(CancellationToken::new())),
             agent_running: Arc::new(Mutex::new(false)),
             init_lock: Arc::new(Mutex::new(())),
             startup_trace: format_startup_trace(&current_dir, &resolved_workspace, &migration),
-        }
+        })
     }
 
     pub fn startup_trace(&self) -> &str {
@@ -473,45 +583,113 @@ mod tests {
         let override_dir = temp.path().join("override");
         fs::create_dir_all(&override_dir).unwrap();
 
-        let resolved = resolve_startup_workspace_from(&repo, Some(override_dir.to_str().unwrap()));
+        let resolved =
+            resolve_startup_workspace_from(&repo, Some(override_dir.to_str().unwrap())).unwrap();
 
         assert_eq!(resolved.source, WorkspaceSource::EnvOverride);
         assert_eq!(resolved.path, canonicalize_or_self(&override_dir));
         assert!(resolved.invalid_override.is_none());
+        assert_eq!(resolved.guardrail_action, GuardrailAction::None);
     }
 
     #[test]
-    fn test_resolve_startup_workspace_finds_git_root_from_nested_dir() {
+    fn test_resolve_startup_workspace_prefers_dotenv_before_git_root() {
         let temp = tempdir().unwrap();
         let repo = temp.path().join("repo");
+        let workspace = repo.join("workspace");
+        let nested = repo
+            .join("openplanter-desktop")
+            .join("crates")
+            .join("op-tauri");
         fs::create_dir_all(repo.join(".git")).unwrap();
+        fs::create_dir_all(&workspace).unwrap();
+        fs::create_dir_all(&nested).unwrap();
+        fs::write(repo.join(".env"), "OPENPLANTER_WORKSPACE=workspace\n").unwrap();
+
+        let resolved = resolve_startup_workspace_from(&nested, None).unwrap();
+
+        assert_eq!(resolved.source, WorkspaceSource::DotEnv);
+        assert_eq!(resolved.path, canonicalize_or_self(&workspace));
+        assert_eq!(
+            resolved.dotenv_path,
+            Some(canonicalize_or_self(&repo.join(".env")))
+        );
+    }
+
+    #[test]
+    fn test_resolve_startup_workspace_redirects_repo_root_to_workspace() {
+        let temp = tempdir().unwrap();
+        let repo = temp.path().join("repo");
+        let workspace = repo.join("workspace");
         let nested = repo
             .join("openplanter-desktop")
             .join("crates")
             .join("op-tauri");
+        fs::create_dir_all(repo.join(".git")).unwrap();
+        fs::create_dir_all(&workspace).unwrap();
         fs::create_dir_all(&nested).unwrap();
 
-        let resolved = resolve_startup_workspace_from(&nested, None);
+        let resolved = resolve_startup_workspace_from(&nested, None).unwrap();
 
         assert_eq!(resolved.source, WorkspaceSource::GitRoot);
-        assert_eq!(resolved.path, canonicalize_or_self(&repo));
+        assert_eq!(resolved.path, canonicalize_or_self(&workspace));
+        assert_eq!(
+            resolved.guardrail_action,
+            GuardrailAction::RedirectedToWorkspace
+        );
     }
 
     #[test]
-    fn test_resolve_startup_workspace_falls_back_to_current_dir() {
+    fn test_resolve_startup_workspace_rejects_repo_root_when_workspace_dir_missing() {
         let temp = tempdir().unwrap();
+        let repo = temp.path().join("repo");
+        fs::create_dir_all(repo.join(".git")).unwrap();
 
-        let resolved =
-            resolve_startup_workspace_from(temp.path(), Some("/definitely/missing/path"));
+        let err = resolve_startup_workspace_from(&repo, None).unwrap_err();
 
-        assert_eq!(resolved.source, WorkspaceSource::CurrentDir);
-        assert_eq!(resolved.path, canonicalize_or_self(temp.path()));
         assert_eq!(
-            resolved.invalid_override,
-            Some("/definitely/missing/path".to_string())
+            err,
+            StartupWorkspaceError::RepoRootDisallowed {
+                repo_root: canonicalize_or_self(&repo),
+            }
         );
     }
 
+    #[test]
+    fn test_resolve_startup_workspace_invalid_override_falls_back_cleanly() {
+        let temp = tempdir().unwrap();
+        let repo = temp.path().join("repo");
+        let workspace = repo.join("workspace");
+        let invalid = temp.path().join("missing");
+        fs::create_dir_all(repo.join(".git")).unwrap();
+        fs::create_dir_all(&workspace).unwrap();
+
+        let resolved =
+            resolve_startup_workspace_from(&repo, Some(invalid.to_str().unwrap())).unwrap();
+
+        assert_eq!(resolved.source, WorkspaceSource::GitRoot);
+        assert_eq!(resolved.path, canonicalize_or_self(&workspace));
+        assert_eq!(resolved.invalid_override, Some(invalid.display().to_string()));
+    }
+
+    #[test]
+    fn test_resolve_startup_workspace_file_override_is_treated_as_invalid() {
+        let temp = tempdir().unwrap();
+        let repo = temp.path().join("repo");
+        let workspace = repo.join("workspace");
+        let invalid = repo.join("workspace.txt");
+        fs::create_dir_all(repo.join(".git")).unwrap();
+        fs::create_dir_all(&workspace).unwrap();
+        fs::write(&invalid, "not a directory\n").unwrap();
+
+        let resolved =
+            resolve_startup_workspace_from(&repo, Some(invalid.to_str().unwrap())).unwrap();
+
+        assert_eq!(resolved.source, WorkspaceSource::GitRoot);
+        assert_eq!(resolved.path, canonicalize_or_self(&workspace));
+        assert_eq!(resolved.invalid_override, Some(invalid.display().to_string()));
+    }
+
     #[test]
     fn test_migrate_legacy_desktop_state_copies_missing_and_preserves_existing() {
         let temp = tempdir().unwrap();
@@ -575,7 +753,10 @@ mod tests {
         fs::create_dir_all(workspace.join(".git")).unwrap();
         fs::create_dir_all(&current_dir).unwrap();
 
-        let resolved = resolve_startup_workspace_from(&current_dir, None);
+        let workspace_dir = workspace.join("workspace");
+        fs::create_dir_all(&workspace_dir).unwrap();
+
+        let resolved = resolve_startup_workspace_from(&current_dir, None).unwrap();
         let migration = LegacyMigrationReport {
             source: Some(workspace.join("legacy-state")),
             copied_files: 2,
@@ -589,7 +770,10 @@ mod tests {
         assert!(trace.contains(&format!("cwd={}", current_dir.display())));
         assert!(trace.contains(&format!("workspace={}", resolved.path.display())));
         assert!(trace.contains("source=git_root"));
+        assert!(trace.contains("dotenv_path=<none>"));
         assert!(trace.contains("invalid_override=<none>"));
+        assert!(trace.contains("invalid_dotenv_value=<none>"));
+        assert!(trace.contains("guardrail_action=redirected_to_workspace"));
         assert!(trace.contains(&format!(
             "migration_source={}",
             workspace.join("legacy-state").display()
diff --git a/tests/test_credentials.py b/tests/test_credentials.py
index 161b66cb..fc89a87e 100644
--- a/tests/test_credentials.py
+++ b/tests/test_credentials.py
@@ -7,6 +7,7 @@
 from agent.credentials import (
     CredentialBundle,
     CredentialStore,
+    parse_env_assignments,
     discover_env_candidates,
     parse_env_file,
 )
@@ -43,6 +44,22 @@ def test_parse_env_file_extracts_supported_keys(self) -> None:
             self.assertEqual(creds.brave_api_key, "brave-key")
             self.assertEqual(creds.tavily_api_key, "tavily-key")
 
+    def test_parse_env_assignments_preserves_generic_workspace_keys(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            env_path = Path(tmpdir) / ".env"
+            env_path.write_text(
+                "\n".join(
+                    [
+                        "OPENPLANTER_WORKSPACE=workspace",
+                        "OPENAI_API_KEY=oa-key",
+                    ]
+                ),
+                encoding="utf-8",
+            )
+            env_map = parse_env_assignments(env_path)
+            self.assertEqual(env_map["OPENPLANTER_WORKSPACE"], "workspace")
+            self.assertEqual(env_map["OPENAI_API_KEY"], "oa-key")
+
     def test_store_roundtrip(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)
@@ -62,13 +79,20 @@ def test_store_roundtrip(self) -> None:
             loaded = store.load()
             self.assertEqual(loaded, creds)
 
-    def test_discover_env_candidates_includes_workspace_env(self) -> None:
+    def test_discover_env_candidates_returns_nearest_ancestor_env(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            repo = Path(tmpdir) / "repo"
+            nested = repo / "workspace" / "deep"
+            nested.mkdir(parents=True, exist_ok=True)
+            (repo / ".env").write_text("OPENPLANTER_WORKSPACE=workspace\n", encoding="utf-8")
+            candidates = discover_env_candidates(nested)
+            self.assertEqual(candidates, [(repo / ".env").resolve()])
+
+    def test_discover_env_candidates_returns_empty_when_no_env_exists(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             workspace = Path(tmpdir) / "RLMCode"
             workspace.mkdir(parents=True, exist_ok=True)
-            candidates = discover_env_candidates(workspace)
-            self.assertGreaterEqual(len(candidates), 1)
-            self.assertEqual(candidates[0].resolve(), (workspace / ".env").resolve())
+            self.assertEqual(discover_env_candidates(workspace), [])
 
 
 if __name__ == "__main__":
diff --git a/tests/test_workspace_resolution.py b/tests/test_workspace_resolution.py
new file mode 100644
index 00000000..ca53ac5c
--- /dev/null
+++ b/tests/test_workspace_resolution.py
@@ -0,0 +1,155 @@
+from __future__ import annotations
+
+import os
+import tempfile
+import unittest
+from pathlib import Path
+from unittest.mock import patch
+
+from agent.workspace_resolution import (
+    WorkspaceResolutionError,
+    resolve_startup_workspace,
+)
+
+
+class WorkspaceResolutionTests(unittest.TestCase):
+    def test_explicit_non_root_workspace_overrides_dotenv(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            repo = Path(tmpdir) / "repo"
+            explicit = repo / "custom-workspace"
+            default = repo / "workspace"
+            repo.mkdir()
+            explicit.mkdir()
+            default.mkdir()
+            (repo / ".git").mkdir()
+            (repo / ".env").write_text("OPENPLANTER_WORKSPACE=workspace\n", encoding="utf-8")
+
+            with patch.dict(os.environ, {}, clear=True):
+                resolved = resolve_startup_workspace(str(explicit), True, repo)
+
+            self.assertEqual(resolved.workspace, explicit.resolve())
+            self.assertEqual(resolved.source, "cli_arg")
+            self.assertEqual(resolved.guardrail_action, "none")
+
+    def test_explicit_repo_root_workspace_fails(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            repo = Path(tmpdir) / "repo"
+            repo.mkdir()
+            (repo / ".git").mkdir()
+            (repo / "workspace").mkdir()
+
+            with patch.dict(os.environ, {}, clear=True):
+                with self.assertRaises(WorkspaceResolutionError):
+                    resolve_startup_workspace(str(repo), True, repo)
+
+    def test_explicit_file_workspace_fails(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            repo = Path(tmpdir) / "repo"
+            repo.mkdir()
+            bogus_target = repo / "workspace.txt"
+            bogus_target.write_text("not a directory\n", encoding="utf-8")
+
+            with patch.dict(os.environ, {}, clear=True):
+                with self.assertRaises(WorkspaceResolutionError):
+                    resolve_startup_workspace(str(bogus_target), True, repo)
+
+    def test_nearest_ancestor_dotenv_wins(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            outer = root / "outer"
+            repo = outer / "repo"
+            nested = repo / "subdir" / "deeper"
+            outer_workspace = outer / "outer-ws"
+            repo_workspace = repo / "inner-ws"
+            nested.mkdir(parents=True)
+            outer_workspace.mkdir()
+            repo_workspace.mkdir()
+            (outer / ".env").write_text("OPENPLANTER_WORKSPACE=outer-ws\n", encoding="utf-8")
+            (repo / ".env").write_text("OPENPLANTER_WORKSPACE=inner-ws\n", encoding="utf-8")
+
+            with patch.dict(os.environ, {}, clear=True):
+                resolved = resolve_startup_workspace(".", False, nested)
+
+            self.assertEqual(resolved.workspace, repo_workspace.resolve())
+            self.assertEqual(resolved.source, "dotenv")
+            self.assertEqual(resolved.env_path, (repo / ".env").resolve())
+
+    def test_dotenv_relative_workspace_is_resolved_from_env_file_directory(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            repo = Path(tmpdir) / "repo"
+            nested = repo / "agent" / "inner"
+            workspace = repo / "workspace"
+            nested.mkdir(parents=True)
+            workspace.mkdir()
+            (repo / ".env").write_text("OPENPLANTER_WORKSPACE=workspace\n", encoding="utf-8")
+
+            with patch.dict(os.environ, {}, clear=True):
+                resolved = resolve_startup_workspace(".", False, nested)
+
+            self.assertEqual(resolved.workspace, workspace.resolve())
+            self.assertEqual(resolved.source, "dotenv")
+
+    def test_missing_workspace_key_redirects_repo_root_to_workspace(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            repo = Path(tmpdir) / "repo"
+            repo.mkdir()
+            (repo / ".git").mkdir()
+            workspace = repo / "workspace"
+            workspace.mkdir()
+            (repo / ".env").write_text("OPENPLANTER_PROVIDER=zai\n", encoding="utf-8")
+
+            with patch.dict(os.environ, {}, clear=True):
+                resolved = resolve_startup_workspace(".", False, repo)
+
+            self.assertEqual(resolved.workspace, workspace.resolve())
+            self.assertEqual(resolved.source, "cwd")
+            self.assertEqual(resolved.guardrail_action, "redirected_to_workspace")
+
+    def test_missing_workspace_key_fails_when_repo_root_has_no_workspace_dir(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            repo = Path(tmpdir) / "repo"
+            repo.mkdir()
+            (repo / ".git").mkdir()
+            (repo / ".env").write_text("OPENPLANTER_PROVIDER=zai\n", encoding="utf-8")
+
+            with patch.dict(os.environ, {}, clear=True):
+                with self.assertRaises(WorkspaceResolutionError):
+                    resolve_startup_workspace(".", False, repo)
+
+    def test_invalid_process_env_override_falls_back_to_guardrail_redirect(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            repo = Path(tmpdir) / "repo"
+            repo.mkdir()
+            (repo / ".git").mkdir()
+            workspace = repo / "workspace"
+            workspace.mkdir()
+
+            with patch.dict(os.environ, {"OPENPLANTER_WORKSPACE": str(repo / "missing")}, clear=True):
+                resolved = resolve_startup_workspace(".", False, repo)
+
+            self.assertEqual(resolved.workspace, workspace.resolve())
+            self.assertEqual(resolved.source, "cwd")
+            self.assertEqual(resolved.invalid_env_override, str(repo / "missing"))
+            self.assertEqual(resolved.guardrail_action, "redirected_to_workspace")
+
+    def test_file_path_workspace_override_is_treated_as_invalid(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            repo = Path(tmpdir) / "repo"
+            repo.mkdir()
+            (repo / ".git").mkdir()
+            workspace = repo / "workspace"
+            workspace.mkdir()
+            bogus_target = repo / "workspace.txt"
+            bogus_target.write_text("not a directory\n", encoding="utf-8")
+
+            with patch.dict(os.environ, {"OPENPLANTER_WORKSPACE": str(bogus_target)}, clear=True):
+                resolved = resolve_startup_workspace(".", False, repo)
+
+            self.assertEqual(resolved.workspace, workspace.resolve())
+            self.assertEqual(resolved.source, "cwd")
+            self.assertEqual(resolved.invalid_env_override, str(bogus_target))
+            self.assertEqual(resolved.guardrail_action, "redirected_to_workspace")
+
+
+if __name__ == "__main__":
+    unittest.main()

From 654ca80d3b9318f35b87d40dc23048acf1b3a405 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 07:36:17 -0400
Subject: [PATCH 37/58] Add bounded budget auto-continuation

---
 agent/config.py                               |  15 +
 agent/engine.py                               | 322 ++++++++++-
 agent/runtime.py                              |  15 +
 .../crates/op-core/src/config.rs              |  23 +
 .../crates/op-core/src/engine/mod.rs          | 510 +++++++++++++++++-
 .../crates/op-core/src/events.rs              |  40 ++
 .../op-core/tests/test_model_streaming.rs     |  30 +-
 .../crates/op-tauri/src/bridge.rs             |  25 +-
 .../frontend/src/api/events.test.ts           |  10 +
 openplanter-desktop/frontend/src/api/types.ts |  18 +-
 .../frontend/src/commands/slash.ts            |   1 +
 .../frontend/src/components/App.ts            |   2 +
 .../frontend/src/components/InputBar.ts       |   2 +
 .../frontend/src/components/StatusBar.test.ts |   5 +
 openplanter-desktop/frontend/src/main.ts      |  13 +
 .../frontend/src/state/store.ts               |   3 +
 tests/test_boundary_conditions.py             |   2 +-
 tests/test_coverage_gaps.py                   |   9 +
 tests/test_engine_complex.py                  |  85 ++-
 tests/test_user_stories.py                    |   7 +-
 20 files changed, 1087 insertions(+), 50 deletions(-)

diff --git a/agent/config.py b/agent/config.py
index fc00d408..8f219a34 100644
--- a/agent/config.py
+++ b/agent/config.py
@@ -127,6 +127,9 @@ class AgentConfig:
     voyage_api_key: str | None = None
     max_depth: int = 4
     max_steps_per_call: int = 100
+    budget_extension_enabled: bool = True
+    budget_extension_block_steps: int = 20
+    budget_extension_max_blocks: int = 2
     max_observation_chars: int = 6000
     command_timeout_sec: int = 45
     shell: str = "/bin/sh"
@@ -213,6 +216,15 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
         web_search_provider = (os.getenv("OPENPLANTER_WEB_SEARCH_PROVIDER", "exa").strip().lower() or "exa")
         if web_search_provider not in {"exa", "firecrawl", "brave", "tavily"}:
             web_search_provider = "exa"
+        budget_extension_enabled = (os.getenv("OPENPLANTER_BUDGET_EXTENSION_ENABLED", "true").strip().lower() in {"1", "true", "yes"})
+        budget_extension_block_steps = max(
+            1,
+            int(os.getenv("OPENPLANTER_BUDGET_EXTENSION_BLOCK_STEPS", "20")),
+        )
+        budget_extension_max_blocks = max(
+            0,
+            int(os.getenv("OPENPLANTER_BUDGET_EXTENSION_MAX_BLOCKS", "2")),
+        )
         return cls(
             workspace=ws,
             provider=os.getenv("OPENPLANTER_PROVIDER", "auto").strip().lower() or "auto",
@@ -247,6 +259,9 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             voyage_api_key=voyage_api_key,
             max_depth=int(os.getenv("OPENPLANTER_MAX_DEPTH", "4")),
             max_steps_per_call=int(os.getenv("OPENPLANTER_MAX_STEPS", "100")),
+            budget_extension_enabled=budget_extension_enabled,
+            budget_extension_block_steps=budget_extension_block_steps,
+            budget_extension_max_blocks=budget_extension_max_blocks,
             max_observation_chars=int(os.getenv("OPENPLANTER_MAX_OBS_CHARS", "6000")),
             command_timeout_sec=int(os.getenv("OPENPLANTER_CMD_TIMEOUT", "45")),
             shell=os.getenv("OPENPLANTER_SHELL", "/bin/sh"),
diff --git a/agent/engine.py b/agent/engine.py
index 317077c0..33ff033c 100644
--- a/agent/engine.py
+++ b/agent/engine.py
@@ -94,6 +94,10 @@ def _summarize_observation(text: str, max_len: int = 200) -> str:
 }
 _DEFAULT_CONTEXT_WINDOW = 128_000
 _CONDENSATION_THRESHOLD = 0.75
+_BUDGET_EXTENSION_WINDOW = 12
+_MIN_EXTENSION_PROGRESS_SIGNALS = 2
+_MIN_MEANINGFUL_RESULT_CHARS = 24
+_NON_PROGRESS_TOOL_NAMES = _RECON_TOOL_NAMES | {"think"}
 
 
 def _model_tier(model_name: str, reasoning_effort: str | None = None) -> int:
@@ -184,6 +188,224 @@ def from_dict(cls, payload: dict[str, object]) -> "TurnSummary":
         )
 
 
+@dataclass
+class StepProgressRecord:
+    step: int
+    phase: str
+    step_signature: str
+    tool_count: int
+    failed_tool_step: bool
+    successful_action_signatures: set[str] = field(default_factory=set)
+    state_delta_signatures: set[str] = field(default_factory=set)
+    completed_previews: list[str] = field(default_factory=list)
+
+
+def _normalize_progress_fragment(text: str, max_len: int = 120) -> str:
+    collapsed = re.sub(r"\s+", " ", text.strip().lower())
+    collapsed = re.sub(r"^(?:\[[^\]]+\]\s*)+", "", collapsed)
+    if len(collapsed) > max_len:
+        collapsed = collapsed[: max_len - 3] + "..."
+    return collapsed
+
+
+def _action_signature(name: str, args: dict[str, Any]) -> str:
+    payload = json.dumps(args, sort_keys=True, separators=(",", ":"), ensure_ascii=True)
+    payload = payload[:160]
+    return f"{name}|{payload}"
+
+
+def _looks_like_failed_tool_result(name: str, result: ToolResult) -> bool:
+    if result.is_error:
+        return True
+    content = result.content.strip()
+    normalized = _normalize_progress_fragment(content, max_len=200)
+    exit_match = re.search(r"\[exit_code=(-?\d+)\]", content)
+    if exit_match:
+        try:
+            if int(exit_match.group(1)) != 0:
+                return True
+        except ValueError:
+            pass
+    failure_prefixes = (
+        "file not found:",
+        "path is a directory, not a file:",
+        "failed to ",
+        "blocked:",
+        "blocked by policy:",
+        "unsupported image format:",
+        "image too large:",
+        "max recursion depth reached;",
+        "cannot delegate to higher-tier model",
+        "task cancelled.",
+        "tool ",
+    )
+    if normalized.startswith(failure_prefixes):
+        return True
+    if normalized.startswith("search_files requires ") or normalized.startswith("read_file requires "):
+        return True
+    if normalized.startswith("run_shell requires ") or normalized.startswith("apply_patch requires "):
+        return True
+    return " crashed:" in normalized
+
+
+def _build_step_progress_record(
+    step: int,
+    phase: str,
+    tool_calls: list[ToolCall],
+    results: list[ToolResult],
+) -> StepProgressRecord:
+    tool_names = [tc.name for tc in tool_calls]
+    has_artifact = any(name in _ARTIFACT_TOOL_NAMES for name in tool_names)
+    failed_results = [
+        _looks_like_failed_tool_result(tool_call.name, result)
+        for tool_call, result in zip(tool_calls, results)
+    ]
+    has_error = any(failed_results)
+    record = StepProgressRecord(
+        step=step,
+        phase=phase,
+        step_signature=f"{','.join(sorted(tool_names))}|artifact={int(has_artifact)}|error={int(has_error)}",
+        tool_count=len(tool_calls),
+        failed_tool_step=has_error,
+    )
+    for tool_call, result, failed_result in zip(tool_calls, results, failed_results):
+        if failed_result or tool_call.name in _NON_PROGRESS_TOOL_NAMES:
+            continue
+        normalized_result = _normalize_progress_fragment(result.content)
+        if len(normalized_result) < _MIN_MEANINGFUL_RESULT_CHARS:
+            continue
+        record.successful_action_signatures.add(_action_signature(tool_call.name, tool_call.arguments))
+        record.state_delta_signatures.add(f"{tool_call.name}|{normalized_result}")
+        preview = _summarize_observation(result.content)
+        if preview not in record.completed_previews:
+            record.completed_previews.append(preview)
+    return record
+
+
+def _evaluate_budget_extension(
+    records: list[StepProgressRecord],
+    *,
+    recon_streak: int,
+) -> dict[str, Any]:
+    window = records[-_BUDGET_EXTENSION_WINDOW:]
+    tool_steps = sum(1 for record in window if record.tool_count > 0)
+    failed_steps = sum(1 for record in window if record.failed_tool_step)
+    failure_ratio = (failed_steps / tool_steps) if tool_steps else 0.0
+
+    repeated_signature_streak = 1
+    current_streak = 1
+    previous_signature: str | None = None
+    for record in window:
+        if previous_signature is not None and record.step_signature == previous_signature:
+            current_streak += 1
+        else:
+            current_streak = 1
+            previous_signature = record.step_signature
+        repeated_signature_streak = max(repeated_signature_streak, current_streak)
+
+    prior_action_signatures: set[str] = set()
+    for record in records[: max(0, len(records) - len(window))]:
+        prior_action_signatures.update(record.successful_action_signatures)
+
+    recent_action_signatures: set[str] = set()
+    recent_state_delta_signatures: set[str] = set()
+    has_build_or_finalize = False
+    for record in window:
+        recent_action_signatures.update(record.successful_action_signatures)
+        recent_state_delta_signatures.update(record.state_delta_signatures)
+        has_build_or_finalize = has_build_or_finalize or record.phase in {"build", "finalize"}
+
+    novel_action_signatures = recent_action_signatures - prior_action_signatures
+    positive_signals = 0
+    if len(novel_action_signatures) >= 2:
+        positive_signals += 1
+    if len(recent_state_delta_signatures) >= 2:
+        positive_signals += 1
+    if has_build_or_finalize:
+        positive_signals += 1
+
+    blockers: list[str] = []
+    if repeated_signature_streak >= 3:
+        blockers.append("repeated_signatures")
+    if failure_ratio > 0.6:
+        blockers.append("high_failure_ratio")
+    if recon_streak >= 4:
+        blockers.append("recon_streak")
+
+    return {
+        "eligible": not blockers and positive_signals >= _MIN_EXTENSION_PROGRESS_SIGNALS,
+        "window_size": len(window),
+        "repeated_signature_streak": repeated_signature_streak,
+        "failure_ratio": failure_ratio,
+        "novel_action_count": len(novel_action_signatures),
+        "state_delta_count": len(recent_state_delta_signatures),
+        "has_build_or_finalize": has_build_or_finalize,
+        "positive_signals": positive_signals,
+        "blockers": blockers,
+    }
+
+
+def _suggest_next_actions(
+    objective: str,
+    evaluation: dict[str, Any],
+    recent_previews: list[str],
+) -> list[str]:
+    actions: list[str] = []
+    blockers = set(evaluation.get("blockers", []))
+    if "repeated_signatures" in blockers:
+        actions.append("Stop retrying the same command pattern and switch to a different source or tactic.")
+    if "high_failure_ratio" in blockers:
+        actions.append("Triage the failing tool calls first so the next run is not dominated by avoidable errors.")
+    if "recon_streak" in blockers:
+        actions.append("Move from exploration into artifact-building or synthesis before doing more reconnaissance.")
+    if recent_previews:
+        actions.append("Turn the completed findings below into a concrete artifact or summary before resuming deeper work.")
+    actions.append(f"Resume the objective with a narrower next slice: {objective}")
+    return actions[:4]
+
+
+def _render_partial_completion(
+    objective: str,
+    loop_metrics: dict[str, Any],
+    evaluation: dict[str, Any],
+    records: list[StepProgressRecord],
+) -> str:
+    recent_previews: list[str] = []
+    for record in reversed(records[-_BUDGET_EXTENSION_WINDOW:]):
+        for preview in record.completed_previews:
+            if preview not in recent_previews:
+                recent_previews.append(preview)
+            if len(recent_previews) >= 3:
+                break
+        if len(recent_previews) >= 3:
+            break
+    next_actions = _suggest_next_actions(objective, evaluation, recent_previews)
+    completed = recent_previews or ["The run gathered additional context but did not converge on a final artifact before the bounded limit."]
+    remaining = (
+        "Finish the deliverable using the completed work below and avoid repeating the stalled loop."
+        if recent_previews
+        else "Finish the deliverable with a narrower plan or a different tactic."
+    )
+    reason = str(loop_metrics.get("termination_reason", "budget_no_progress"))
+    header = (
+        f"Partial completion for objective: {objective}\n"
+        f"Stopped after {int(loop_metrics.get('steps', 0))} steps "
+        f"with {int(loop_metrics.get('extensions_granted', 0))} budget extension(s). "
+        f"Termination reason: {reason}."
+    )
+    completed_block = "\n".join(f"- {item}" for item in completed)
+    next_actions_block = "\n".join(f"- {item}" for item in next_actions)
+    return (
+        f"{header}\n\n"
+        "Completed work:\n"
+        f"{completed_block}\n\n"
+        "Remaining work:\n"
+        f"- {remaining}\n\n"
+        "Suggested next actions:\n"
+        f"{next_actions_block}"
+    )
+
+
 @dataclass
 class RLMEngine:
     model: BaseModel
@@ -414,7 +636,22 @@ def _solve_recursive(
             "guardrail_warnings": 0,
             "final_rejections": 0,
             "last_guardrail_streak": 0,
+            "budget_extension_enabled": bool(self.config.budget_extension_enabled),
+            "budget_extension_block_steps": int(self.config.budget_extension_block_steps),
+            "budget_extension_max_blocks": int(self.config.budget_extension_max_blocks),
+            "extensions_granted": 0,
+            "extension_eligible_checks": 0,
+            "extension_denials_no_progress": 0,
+            "extension_denials_cap": 0,
+            "termination_reason": "",
         }
+        step_records: list[StepProgressRecord] = []
+        active_step_budget = self.config.max_steps_per_call
+        max_total_steps = self.config.max_steps_per_call + (
+            self.config.budget_extension_block_steps * self.config.budget_extension_max_blocks
+            if self.config.budget_extension_enabled
+            else 0
+        )
 
         self.last_loop_metrics = loop_metrics
 
@@ -429,13 +666,15 @@ def _solve_recursive(
                 temperature=getattr(model, "temperature", None),
             )
 
-        for step in range(1, self.config.max_steps_per_call + 1):
+        for step in range(1, max_total_steps + 1):
             if self._cancel.is_set():
                 self._emit(f"[d{depth}] cancelled by user", on_event)
+                loop_metrics["termination_reason"] = "cancelled"
                 self.last_loop_metrics = loop_metrics
                 return "Task cancelled."
             if deadline and time.monotonic() > deadline:
                 self._emit(f"[d{depth}] wall-clock limit reached", on_event)
+                loop_metrics["termination_reason"] = "time_limit"
                 self.last_loop_metrics = loop_metrics
                 return "Time limit exceeded. Try a more focused objective."
             self._emit(f"[d{depth}/s{step}] calling model...", on_event)
@@ -456,6 +695,7 @@ def _solve_recursive(
                     except RateLimitError as exc:
                         if rate_limit_retries >= self.config.rate_limit_max_retries:
                             self._emit(f"[d{depth}/s{step}] model error: {exc}", on_event)
+                            loop_metrics["termination_reason"] = "model_error"
                             self.last_loop_metrics = loop_metrics
                             return f"Model error at depth {depth}, step {step}: {exc}"
                         rate_limit_retries += 1
@@ -471,6 +711,7 @@ def _solve_recursive(
                         delay = min(delay, self.config.rate_limit_backoff_max_sec)
                         if deadline and (time.monotonic() + delay) > deadline:
                             self._emit(f"[d{depth}] wall-clock limit reached", on_event)
+                            loop_metrics["termination_reason"] = "time_limit"
                             self.last_loop_metrics = loop_metrics
                             return "Time limit exceeded. Try a more focused objective."
                         provider_code = f" ({exc.provider_code})" if exc.provider_code is not None else ""
@@ -483,6 +724,7 @@ def _solve_recursive(
                             time.sleep(delay)
             except ModelError as exc:
                 self._emit(f"[d{depth}/s{step}] model error: {exc}", on_event)
+                loop_metrics["termination_reason"] = "model_error"
                 self.last_loop_metrics = loop_metrics
                 return f"Model error at depth {depth}, step {step}: {exc}"
             finally:
@@ -566,6 +808,7 @@ def _solve_recursive(
                     model.append_tool_results(conversation, [rejection_result])
                     continue
                 loop_metrics["phase_counts"]["finalize"] += 1
+                loop_metrics["termination_reason"] = "success"
                 preview = turn.text[:200] + "..." if len(turn.text) > 200 else turn.text
                 self._emit(
                     f"[d{depth}/s{step}] final answer ({len(turn.text)} chars, {elapsed:.1f}s): {preview}",
@@ -692,7 +935,7 @@ def _solve_recursive(
 
             # Timestamp + step budget + context usage awareness
             if final_answer is None and results:
-                budget_total = self.config.max_steps_per_call
+                budget_total = active_step_budget
                 remaining = budget_total - step
                 ts_tag = f"[{datetime.now(timezone.utc).strftime('%Y-%m-%dT%H:%M:%SZ')}]"
                 budget_tag = f"[Step {step}/{budget_total}]"
@@ -729,6 +972,22 @@ def _solve_recursive(
                         image=rl.image,
                     )
 
+            phase_name = (
+                "build"
+                if has_artifact
+                else "investigate"
+                if has_recon and all(name in _RECON_TOOL_NAMES for name in tc_names)
+                else "iterate"
+            )
+            step_records.append(
+                _build_step_progress_record(
+                    step=step,
+                    phase=phase_name,
+                    tool_calls=turn.tool_calls,
+                    results=results,
+                )
+            )
+
             if (
                 final_answer is None
                 and results
@@ -781,16 +1040,69 @@ def _solve_recursive(
 
             if final_answer is not None:
                 self._emit(f"[d{depth}] completed in {step} step(s)", on_event)
+                loop_metrics["termination_reason"] = "success"
                 self.last_loop_metrics = loop_metrics
                 return final_answer
 
             for r in results:
                 context.add(f"[depth {depth} step {step}]\n{r.content}")
 
+            if step >= active_step_budget:
+                evaluation = _evaluate_budget_extension(
+                    step_records,
+                    recon_streak=int(loop_metrics.get("recon_streak", 0)),
+                )
+                loop_metrics["extension_eligible_checks"] = int(
+                    loop_metrics.get("extension_eligible_checks", 0)
+                ) + 1
+                loop_metrics["last_budget_extension_eval"] = evaluation
+                can_extend = (
+                    self.config.budget_extension_enabled
+                    and int(loop_metrics.get("extensions_granted", 0)) < self.config.budget_extension_max_blocks
+                    and bool(evaluation.get("eligible"))
+                )
+                if can_extend:
+                    loop_metrics["extensions_granted"] = int(loop_metrics.get("extensions_granted", 0)) + 1
+                    active_step_budget += self.config.budget_extension_block_steps
+                    extension_notice = ToolResult(
+                        tool_call_id="budget-extension",
+                        name="system",
+                        content=(
+                            "Progress-based budget extension granted. You have a small number of extra steps. "
+                            "Finish the deliverable now and avoid repeating the same loop."
+                        ),
+                    )
+                    model.append_tool_results(conversation, [extension_notice])
+                    continue
+
+                if int(loop_metrics.get("extensions_granted", 0)) >= self.config.budget_extension_max_blocks:
+                    loop_metrics["extension_denials_cap"] = int(loop_metrics.get("extension_denials_cap", 0)) + 1
+                    loop_metrics["termination_reason"] = "budget_cap"
+                else:
+                    loop_metrics["extension_denials_no_progress"] = int(
+                        loop_metrics.get("extension_denials_no_progress", 0)
+                    ) + 1
+                    loop_metrics["termination_reason"] = "budget_no_progress"
+                self.last_loop_metrics = loop_metrics
+                return _render_partial_completion(objective, loop_metrics, evaluation, step_records)
+
+        loop_metrics["termination_reason"] = "budget_cap"
         self.last_loop_metrics = loop_metrics
-        return (
-            f"Step budget exhausted at depth {depth} for objective: {objective}\n"
-            "Please try with a more specific task, higher step budget, or deeper recursion."
+        return _render_partial_completion(
+            objective,
+            loop_metrics,
+            {
+                "eligible": False,
+                "window_size": 0,
+                "repeated_signature_streak": 0,
+                "failure_ratio": 0.0,
+                "novel_action_count": 0,
+                "state_delta_count": 0,
+                "has_build_or_finalize": False,
+                "positive_signals": 0,
+                "blockers": ["max_total_steps"],
+            },
+            step_records,
         )
 
     def _run_one_tool(
diff --git a/agent/runtime.py b/agent/runtime.py
index 75894485..415d0232 100644
--- a/agent/runtime.py
+++ b/agent/runtime.py
@@ -406,6 +406,11 @@ def bootstrap(
         loop_metrics.setdefault("tool_calls", 0)
         loop_metrics.setdefault("guardrail_warnings", 0)
         loop_metrics.setdefault("final_rejections", 0)
+        loop_metrics.setdefault("extensions_granted", 0)
+        loop_metrics.setdefault("extension_eligible_checks", 0)
+        loop_metrics.setdefault("extension_denials_no_progress", 0)
+        loop_metrics.setdefault("extension_denials_cap", 0)
+        loop_metrics.setdefault("termination_reason", "")
         loop_metrics.setdefault("phase_counts", {})
         if not isinstance(loop_metrics["phase_counts"], dict):
             loop_metrics["phase_counts"] = {}
@@ -538,6 +543,11 @@ def _combined_on_step(step_event: dict[str, Any]) -> None:
                 "tool_calls": 0,
                 "guardrail_warnings": 0,
                 "final_rejections": 0,
+                "extensions_granted": 0,
+                "extension_eligible_checks": 0,
+                "extension_denials_no_progress": 0,
+                "extension_denials_cap": 0,
+                "termination_reason": "",
                 "phase_counts": {"investigate": 0, "build": 0, "iterate": 0, "finalize": 0},
             }
         self.loop_metrics["turns"] = int(self.loop_metrics.get("turns", 0)) + 1
@@ -546,6 +556,11 @@ def _combined_on_step(step_event: dict[str, Any]) -> None:
         self.loop_metrics["tool_calls"] = int(self.loop_metrics.get("tool_calls", 0)) + int(latest_loop_metrics.get("tool_calls", 0))
         self.loop_metrics["guardrail_warnings"] = int(self.loop_metrics.get("guardrail_warnings", 0)) + int(latest_loop_metrics.get("guardrail_warnings", 0))
         self.loop_metrics["final_rejections"] = int(self.loop_metrics.get("final_rejections", 0)) + int(latest_loop_metrics.get("final_rejections", 0))
+        self.loop_metrics["extensions_granted"] = int(self.loop_metrics.get("extensions_granted", 0)) + int(latest_loop_metrics.get("extensions_granted", 0))
+        self.loop_metrics["extension_eligible_checks"] = int(self.loop_metrics.get("extension_eligible_checks", 0)) + int(latest_loop_metrics.get("extension_eligible_checks", 0))
+        self.loop_metrics["extension_denials_no_progress"] = int(self.loop_metrics.get("extension_denials_no_progress", 0)) + int(latest_loop_metrics.get("extension_denials_no_progress", 0))
+        self.loop_metrics["extension_denials_cap"] = int(self.loop_metrics.get("extension_denials_cap", 0)) + int(latest_loop_metrics.get("extension_denials_cap", 0))
+        self.loop_metrics["termination_reason"] = str(latest_loop_metrics.get("termination_reason", ""))
         phase_counts = self.loop_metrics.setdefault("phase_counts", {})
         latest_phase_counts = latest_loop_metrics.get("phase_counts", {})
         if not isinstance(phase_counts, dict):
diff --git a/openplanter-desktop/crates/op-core/src/config.rs b/openplanter-desktop/crates/op-core/src/config.rs
index b2a0a847..96701b7d 100644
--- a/openplanter-desktop/crates/op-core/src/config.rs
+++ b/openplanter-desktop/crates/op-core/src/config.rs
@@ -214,6 +214,9 @@ pub struct AgentConfig {
     // Limits
     pub max_depth: i64,
     pub max_steps_per_call: i64,
+    pub budget_extension_enabled: bool,
+    pub budget_extension_block_steps: i64,
+    pub budget_extension_max_blocks: i64,
     pub max_observation_chars: i64,
     pub command_timeout_sec: i64,
     pub shell: String,
@@ -273,6 +276,9 @@ impl Default for AgentConfig {
             voyage_api_key: None,
             max_depth: 4,
             max_steps_per_call: 100,
+            budget_extension_enabled: true,
+            budget_extension_block_steps: 20,
+            budget_extension_max_blocks: 2,
             max_observation_chars: 6000,
             command_timeout_sec: 45,
             shell: "/bin/sh".into(),
@@ -408,6 +414,11 @@ impl AgentConfig {
             voyage_api_key,
             max_depth: env_int("OPENPLANTER_MAX_DEPTH", 4),
             max_steps_per_call: env_int("OPENPLANTER_MAX_STEPS", 100),
+            budget_extension_enabled: env_bool("OPENPLANTER_BUDGET_EXTENSION_ENABLED", true),
+            budget_extension_block_steps: env_int("OPENPLANTER_BUDGET_EXTENSION_BLOCK_STEPS", 20)
+                .max(1),
+            budget_extension_max_blocks: env_int("OPENPLANTER_BUDGET_EXTENSION_MAX_BLOCKS", 2)
+                .max(0),
             max_observation_chars: env_int("OPENPLANTER_MAX_OBS_CHARS", 6000),
             command_timeout_sec: env_int("OPENPLANTER_CMD_TIMEOUT", 45),
             shell: env_or("OPENPLANTER_SHELL", "/bin/sh"),
@@ -538,6 +549,9 @@ mod tests {
             "OPENPLANTER_ZAI_API_KEY",
             "ZAI_API_KEY",
             "OPENPLANTER_MAX_DEPTH",
+            "OPENPLANTER_BUDGET_EXTENSION_ENABLED",
+            "OPENPLANTER_BUDGET_EXTENSION_BLOCK_STEPS",
+            "OPENPLANTER_BUDGET_EXTENSION_MAX_BLOCKS",
             "OPENPLANTER_RECURSIVE",
             "OPENPLANTER_DEMO",
             "OPENPLANTER_WEB_SEARCH_PROVIDER",
@@ -571,6 +585,9 @@ mod tests {
         assert_eq!(cfg.model, "anthropic-foundry/claude-opus-4-6");
         assert_eq!(cfg.reasoning_effort, Some("high".into()));
         assert_eq!(cfg.max_depth, 4);
+        assert!(cfg.budget_extension_enabled);
+        assert_eq!(cfg.budget_extension_block_steps, 20);
+        assert_eq!(cfg.budget_extension_max_blocks, 2);
         assert!(cfg.recursive);
         assert!(!cfg.demo);
         assert_eq!(
@@ -598,6 +615,9 @@ mod tests {
             env::set_var("OPENPLANTER_MODEL", "azure-foundry/gpt-5.4");
             env::set_var("OPENPLANTER_REASONING_EFFORT", "low");
             env::set_var("OPENPLANTER_MAX_DEPTH", "8");
+            env::set_var("OPENPLANTER_BUDGET_EXTENSION_ENABLED", "false");
+            env::set_var("OPENPLANTER_BUDGET_EXTENSION_BLOCK_STEPS", "9");
+            env::set_var("OPENPLANTER_BUDGET_EXTENSION_MAX_BLOCKS", "1");
             env::set_var("OPENPLANTER_RECURSIVE", "false");
             env::set_var("OPENPLANTER_DEMO", "true");
             env::set_var("OPENAI_API_KEY", "sk-test123");
@@ -619,6 +639,9 @@ mod tests {
         assert_eq!(cfg.model, "azure-foundry/gpt-5.4");
         assert_eq!(cfg.reasoning_effort, Some("low".into()));
         assert_eq!(cfg.max_depth, 8);
+        assert!(!cfg.budget_extension_enabled);
+        assert_eq!(cfg.budget_extension_block_steps, 9);
+        assert_eq!(cfg.budget_extension_max_blocks, 1);
         assert!(!cfg.recursive);
         assert!(cfg.demo);
         assert_eq!(cfg.openai_api_key, Some("sk-test123".into()));
diff --git a/openplanter-desktop/crates/op-core/src/engine/mod.rs b/openplanter-desktop/crates/op-core/src/engine/mod.rs
index 00dbb1f7..85057ef2 100644
--- a/openplanter-desktop/crates/op-core/src/engine/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/mod.rs
@@ -8,6 +8,7 @@ pub mod curator;
 pub mod investigation_state;
 pub mod judge;
 
+use std::collections::HashSet;
 use std::time::Duration;
 
 use anyhow::anyhow;
@@ -17,7 +18,9 @@ use tokio_util::sync::CancellationToken;
 
 use crate::builder::build_model;
 use crate::config::AgentConfig;
-use crate::events::{DeltaEvent, DeltaKind, LoopMetrics, LoopPhase, StepEvent, TokenUsage};
+use crate::events::{
+    CompletionMeta, DeltaEvent, DeltaKind, LoopMetrics, LoopPhase, StepEvent, TokenUsage,
+};
 use crate::model::{BaseModel, Message, ModelTurn, RateLimitError};
 use crate::prompts::build_system_prompt;
 use crate::tools::WorkspaceTools;
@@ -122,7 +125,12 @@ pub trait SolveEmitter: Send + Sync {
     fn emit_trace(&self, message: &str);
     fn emit_delta(&self, event: DeltaEvent);
     fn emit_step(&self, event: StepEvent);
-    fn emit_complete(&self, result: &str, loop_metrics: Option<LoopMetrics>);
+    fn emit_complete(
+        &self,
+        result: &str,
+        loop_metrics: Option<LoopMetrics>,
+        completion: Option<CompletionMeta>,
+    );
     fn emit_error(&self, message: &str);
     fn emit_loop_health(
         &self,
@@ -191,6 +199,11 @@ pub async fn demo_solve(objective: &str, emitter: &dyn SolveEmitter, cancel: Can
         max_recon_streak: 0,
         guardrail_warnings: 0,
         final_rejections: 0,
+        extensions_granted: 0,
+        extension_eligible_checks: 0,
+        extension_denials_no_progress: 0,
+        extension_denials_cap: 0,
+        termination_reason: "success".into(),
     };
     emitter.emit_loop_health(0, 1, LoopPhase::Finalize, loop_metrics.clone(), true);
 
@@ -209,7 +222,7 @@ pub async fn demo_solve(objective: &str, emitter: &dyn SolveEmitter, cancel: Can
         loop_metrics: Some(loop_metrics.clone()),
     });
 
-    emitter.emit_complete(&response, Some(loop_metrics));
+    emitter.emit_complete(&response, Some(loop_metrics), None);
 }
 
 /// Rough token estimate: ~4 chars per token.
@@ -511,6 +524,253 @@ fn should_emit_recon_guardrail(recon_streak: u32, last_guardrail_streak: u32) ->
     recon_streak >= 3 && last_guardrail_streak == 0
 }
 
+const BUDGET_EXTENSION_WINDOW: usize = 12;
+const MIN_MEANINGFUL_RESULT_CHARS: usize = 24;
+const MIN_EXTENSION_PROGRESS_SIGNALS: usize = 2;
+
+#[derive(Debug, Clone)]
+struct StepProgressRecord {
+    phase: LoopPhase,
+    step_signature: String,
+    tool_count: usize,
+    failed_tool_step: bool,
+    successful_action_signatures: HashSet<String>,
+    state_delta_signatures: HashSet<String>,
+    completed_previews: Vec<String>,
+}
+
+fn normalize_progress_fragment(text: &str, max_len: usize) -> String {
+    let mut normalized = text.split_whitespace().collect::<Vec<_>>().join(" ");
+    normalized = normalized.to_lowercase();
+    while normalized.starts_with('[') {
+        if let Some(idx) = normalized.find(']') {
+            normalized = normalized[idx + 1..].trim_start().to_string();
+        } else {
+            break;
+        }
+    }
+    if normalized.len() > max_len {
+        normalized.truncate(max_len);
+    }
+    normalized
+}
+
+fn summarize_observation(text: &str, max_len: usize) -> String {
+    let first = text.lines().next().unwrap_or("").trim();
+    if first.len() > max_len {
+        format!("{}...", &first[..max_len.saturating_sub(3)])
+    } else {
+        first.to_string()
+    }
+}
+
+fn is_non_progress_tool(name: &str) -> bool {
+    is_recon_tool(name) || name == "think"
+}
+
+fn action_signature(name: &str, args: &str) -> String {
+    format!("{}|{}", name, normalize_progress_fragment(args, 160))
+}
+
+fn build_step_progress_record(
+    tool_calls: &[crate::model::ToolCall],
+    observations: &[(String, String, String, String, bool)],
+    phase: LoopPhase,
+) -> StepProgressRecord {
+    let tool_names: Vec<&str> = tool_calls.iter().map(|tc| tc.name.as_str()).collect();
+    let has_artifact = tool_names.iter().any(|name| is_artifact_tool(name));
+    let has_error = observations.iter().any(|(_, _, _, _, is_error)| *is_error);
+    let mut record = StepProgressRecord {
+        phase,
+        step_signature: format!(
+            "{}|artifact={}|error={}",
+            tool_names.join(","),
+            if has_artifact { 1 } else { 0 },
+            if has_error { 1 } else { 0 }
+        ),
+        tool_count: tool_calls.len(),
+        failed_tool_step: has_error,
+        successful_action_signatures: HashSet::new(),
+        state_delta_signatures: HashSet::new(),
+        completed_previews: Vec::new(),
+    };
+    for (_, name, args, content, is_error) in observations {
+        if *is_error || is_non_progress_tool(name) {
+            continue;
+        }
+        let normalized = normalize_progress_fragment(content, 120);
+        if normalized.len() < MIN_MEANINGFUL_RESULT_CHARS {
+            continue;
+        }
+        record
+            .successful_action_signatures
+            .insert(action_signature(name, args));
+        record
+            .state_delta_signatures
+            .insert(format!("{}|{}", name, normalized));
+        let preview = summarize_observation(content, 120);
+        if !preview.is_empty() && !record.completed_previews.contains(&preview) {
+            record.completed_previews.push(preview);
+        }
+    }
+    record
+}
+
+fn evaluate_budget_extension(
+    records: &[StepProgressRecord],
+    recon_streak: u32,
+) -> (bool, Map<String, Value>) {
+    let start = records.len().saturating_sub(BUDGET_EXTENSION_WINDOW);
+    let window = &records[start..];
+
+    let tool_steps = window.iter().filter(|record| record.tool_count > 0).count();
+    let failed_steps = window.iter().filter(|record| record.failed_tool_step).count();
+    let failure_ratio = if tool_steps == 0 {
+        0.0
+    } else {
+        failed_steps as f64 / tool_steps as f64
+    };
+
+    let mut repeated_signature_streak = 1usize;
+    let mut current_streak = 1usize;
+    let mut previous_signature: Option<&str> = None;
+    for record in window {
+        match previous_signature {
+            Some(previous) if previous == record.step_signature => {
+                current_streak += 1;
+            }
+            _ => {
+                current_streak = 1;
+                previous_signature = Some(record.step_signature.as_str());
+            }
+        }
+        repeated_signature_streak = repeated_signature_streak.max(current_streak);
+    }
+
+    let mut prior_action_signatures = HashSet::new();
+    for record in &records[..start] {
+        prior_action_signatures.extend(record.successful_action_signatures.iter().cloned());
+    }
+
+    let mut recent_action_signatures = HashSet::new();
+    let mut recent_state_delta_signatures = HashSet::new();
+    let mut has_build_or_finalize = false;
+    for record in window {
+        recent_action_signatures.extend(record.successful_action_signatures.iter().cloned());
+        recent_state_delta_signatures.extend(record.state_delta_signatures.iter().cloned());
+        has_build_or_finalize |= matches!(record.phase, LoopPhase::Build | LoopPhase::Finalize);
+    }
+
+    let novel_action_count = recent_action_signatures
+        .difference(&prior_action_signatures)
+        .count();
+    let state_delta_count = recent_state_delta_signatures.len();
+    let positive_signals = usize::from(novel_action_count >= 2)
+        + usize::from(state_delta_count >= 2)
+        + usize::from(has_build_or_finalize);
+
+    let mut blockers = Vec::new();
+    if repeated_signature_streak >= 3 {
+        blockers.push("repeated_signatures");
+    }
+    if failure_ratio > 0.6 {
+        blockers.push("high_failure_ratio");
+    }
+    if recon_streak >= 4 {
+        blockers.push("recon_streak");
+    }
+
+    let mut payload = Map::new();
+    payload.insert("window_size".into(), Value::from(window.len() as u64));
+    payload.insert(
+        "repeated_signature_streak".into(),
+        Value::from(repeated_signature_streak as u64),
+    );
+    payload.insert("failure_ratio".into(), Value::from(failure_ratio));
+    payload.insert("novel_action_count".into(), Value::from(novel_action_count as u64));
+    payload.insert("state_delta_count".into(), Value::from(state_delta_count as u64));
+    payload.insert("has_build_or_finalize".into(), Value::from(has_build_or_finalize));
+    payload.insert("positive_signals".into(), Value::from(positive_signals as u64));
+    payload.insert(
+        "blockers".into(),
+        Value::Array(
+            blockers
+                .iter()
+                .map(|blocker| Value::from((*blocker).to_string()))
+                .collect(),
+        ),
+    );
+
+    (
+        blockers.is_empty() && positive_signals >= MIN_EXTENSION_PROGRESS_SIGNALS,
+        payload,
+    )
+}
+
+fn build_partial_completion_text(
+    objective: &str,
+    loop_metrics: &LoopMetrics,
+    records: &[StepProgressRecord],
+) -> String {
+    let mut completed_previews = Vec::new();
+    for record in records.iter().rev().take(BUDGET_EXTENSION_WINDOW) {
+        for preview in &record.completed_previews {
+            if !completed_previews.contains(preview) {
+                completed_previews.push(preview.clone());
+            }
+            if completed_previews.len() >= 3 {
+                break;
+            }
+        }
+        if completed_previews.len() >= 3 {
+            break;
+        }
+    }
+
+    let completed_block = if completed_previews.is_empty() {
+        "- The run gathered additional context but did not converge on a final artifact before the bounded limit.".to_string()
+    } else {
+        completed_previews
+            .iter()
+            .map(|item| format!("- {item}"))
+            .collect::<Vec<_>>()
+            .join("\n")
+    };
+
+    let mut next_actions = Vec::new();
+    if loop_metrics.termination_reason == "budget_no_progress" {
+        next_actions.push(
+            "Stop repeating the stalled loop and resume with a narrower next slice or a different tactic."
+                .to_string(),
+        );
+    }
+    if loop_metrics.termination_reason == "budget_cap" {
+        next_actions.push(
+            "Resume from the saved state and focus on finishing the deliverable instead of reopening the full search space."
+                .to_string(),
+        );
+    }
+    next_actions.push(format!("Continue the objective with the strongest completed lead: {objective}"));
+    next_actions.push(
+        "Turn the completed work below into a concrete artifact or summary before doing more exploration."
+            .to_string(),
+    );
+
+    format!(
+        "Partial completion for objective: {objective}\nStopped after {} steps with {} budget extension(s). Termination reason: {}.\n\nCompleted work:\n{}\n\nRemaining work:\n- Finish the deliverable using the completed work below and avoid repeating the stalled loop.\n\nSuggested next actions:\n{}",
+        loop_metrics.steps,
+        loop_metrics.extensions_granted,
+        loop_metrics.termination_reason,
+        completed_block,
+        next_actions
+            .iter()
+            .take(4)
+            .map(|item| format!("- {item}"))
+            .collect::<Vec<_>>()
+            .join("\n")
+    )
+}
+
 /// Real solve flow with a multi-step agentic loop.
 ///
 /// Calls the model with tool definitions. If the model returns tool calls,
@@ -579,16 +839,25 @@ pub async fn solve_with_initial_context(
         },
     ];
 
-    let max_steps = config.max_steps_per_call as usize;
     let mut loop_metrics = LoopMetrics::default();
     let mut last_guardrail_streak = 0u32;
     let mut active_curator_phase: Option<LoopPhase> = None;
     let mut pending_curator_deltas: Vec<CuratorStateDelta> = Vec::new();
+    let mut step_records: Vec<StepProgressRecord> = Vec::new();
+    let mut active_step_budget = config.max_steps_per_call.max(1) as usize;
+    let max_total_steps = active_step_budget
+        + if config.budget_extension_enabled {
+            (config.budget_extension_block_steps.max(1) * config.budget_extension_max_blocks.max(0))
+                as usize
+        } else {
+            0
+        };
 
     // 4. Agentic loop
-    for step in 1..=max_steps {
+    for step in 1..=max_total_steps {
         if cancel.is_cancelled() {
             tools.cleanup();
+            loop_metrics.termination_reason = "cancelled".into();
             flush_pending_curator_checkpoint(
                 &mut pending_curator_deltas,
                 "cancelled",
@@ -623,6 +892,11 @@ pub async fn solve_with_initial_context(
             Err(e) => {
                 let msg = e.to_string();
                 tools.cleanup();
+                loop_metrics.termination_reason = if msg == "Cancelled" {
+                    "cancelled".into()
+                } else {
+                    "model_error".into()
+                };
                 flush_pending_curator_checkpoint(
                     &mut pending_curator_deltas,
                     if msg == "Cancelled" {
@@ -681,6 +955,7 @@ pub async fn solve_with_initial_context(
             }
             let phase = LoopPhase::Finalize;
             increment_phase(&mut loop_metrics, &phase);
+            loop_metrics.termination_reason = "success".into();
             emitter.emit_loop_health(0, step as u32, phase.clone(), loop_metrics.clone(), true);
             let tool_name = None;
             emitter.emit_step(StepEvent {
@@ -704,7 +979,7 @@ pub async fn solve_with_initial_context(
                 emitter,
             )
             .await;
-            emitter.emit_complete(&turn.text, Some(loop_metrics.clone()));
+            emitter.emit_complete(&turn.text, Some(loop_metrics.clone()), None);
             tools.cleanup();
             return;
         }
@@ -789,6 +1064,11 @@ pub async fn solve_with_initial_context(
                 content: "Soft guardrail: you've spent multiple consecutive steps in read/list/search mode without producing artifacts. Move to implementation now: edit files, run targeted validation, and return concrete outputs.".to_string(),
             });
         }
+        step_records.push(build_step_progress_record(
+            &turn.tool_calls,
+            &tool_observations,
+            phase.clone(),
+        ));
         emitter.emit_loop_health(0, step as u32, phase.clone(), loop_metrics.clone(), false);
 
         // Emit step (non-final) AFTER tools execute so the frontend
@@ -809,20 +1089,75 @@ pub async fn solve_with_initial_context(
         });
 
         // Budget warnings
-        let remaining = max_steps - step;
-        if remaining == max_steps / 2 {
+        let remaining = active_step_budget.saturating_sub(step);
+        if remaining == active_step_budget / 2 {
             emitter.emit_trace(&format!(
-                "Step budget: {remaining}/{max_steps} steps remaining (50%)"
+                "Step budget: {remaining}/{active_step_budget} steps remaining (50%)"
             ));
-        } else if remaining == max_steps / 4 {
+        } else if remaining == active_step_budget / 4 {
             emitter.emit_trace(&format!(
-                "Step budget: {remaining}/{max_steps} steps remaining (25%)"
+                "Step budget: {remaining}/{active_step_budget} steps remaining (25%)"
             ));
         }
+
+        if step >= active_step_budget {
+            let (eligible, evaluation) =
+                evaluate_budget_extension(&step_records, loop_metrics.recon_streak);
+            loop_metrics.extension_eligible_checks += 1;
+            emitter.emit_trace(&format!(
+                "[d0/s{step}] budget boundary reached: eligible={} evaluation={}",
+                eligible,
+                Value::Object(evaluation.clone())
+            ));
+            let can_extend = config.budget_extension_enabled
+                && loop_metrics.extensions_granted < config.budget_extension_max_blocks as u32
+                && eligible;
+            if can_extend {
+                loop_metrics.extensions_granted += 1;
+                active_step_budget += config.budget_extension_block_steps.max(1) as usize;
+                messages.push(Message::User {
+                    content: "Progress-based budget extension granted. You have a small number of extra steps. Finish the deliverable now and avoid repeating the same loop.".to_string(),
+                });
+                continue;
+            }
+
+            if loop_metrics.extensions_granted >= config.budget_extension_max_blocks as u32 {
+                loop_metrics.extension_denials_cap += 1;
+                loop_metrics.termination_reason = "budget_cap".into();
+            } else {
+                loop_metrics.extension_denials_no_progress += 1;
+                loop_metrics.termination_reason = "budget_no_progress".into();
+            }
+
+            tools.cleanup();
+            flush_pending_curator_checkpoint(
+                &mut pending_curator_deltas,
+                "budget_exhausted",
+                config,
+                &cancel,
+                emitter,
+            )
+            .await;
+            emitter.emit_complete(
+                &build_partial_completion_text(objective, &loop_metrics, &step_records),
+                Some(loop_metrics.clone()),
+                Some(CompletionMeta {
+                    kind: "partial".into(),
+                    reason: loop_metrics.termination_reason.clone(),
+                    steps_used: loop_metrics.steps,
+                    max_steps: active_step_budget as u32,
+                    extensions_granted: loop_metrics.extensions_granted,
+                    extension_block_steps: config.budget_extension_block_steps.max(1) as u32,
+                    extension_max_blocks: config.budget_extension_max_blocks.max(0) as u32,
+                }),
+            );
+            return;
+        }
     }
 
     // Budget exhausted
     tools.cleanup();
+    loop_metrics.termination_reason = "budget_cap".into();
     flush_pending_curator_checkpoint(
         &mut pending_curator_deltas,
         "budget_exhausted",
@@ -831,10 +1166,19 @@ pub async fn solve_with_initial_context(
         emitter,
     )
     .await;
-    emitter.emit_error(&format!(
-        "Step budget exhausted after {max_steps} steps. \
-         The model did not produce a final answer within the allowed steps."
-    ));
+    emitter.emit_complete(
+        &build_partial_completion_text(objective, &loop_metrics, &step_records),
+        Some(loop_metrics.clone()),
+        Some(CompletionMeta {
+            kind: "partial".into(),
+            reason: loop_metrics.termination_reason.clone(),
+            steps_used: loop_metrics.steps,
+            max_steps: active_step_budget as u32,
+            extensions_granted: loop_metrics.extensions_granted,
+            extension_block_steps: config.budget_extension_block_steps.max(1) as u32,
+            extension_max_blocks: config.budget_extension_max_blocks.max(0) as u32,
+        }),
+    );
 }
 
 #[cfg(test)]
@@ -850,6 +1194,25 @@ mod tests {
         }
     }
 
+    fn progress_record(
+        phase: LoopPhase,
+        step_signature: &str,
+        action_sigs: &[&str],
+        delta_sigs: &[&str],
+        previews: &[&str],
+        failed_tool_step: bool,
+    ) -> StepProgressRecord {
+        StepProgressRecord {
+            phase,
+            step_signature: step_signature.to_string(),
+            tool_count: 1,
+            failed_tool_step,
+            successful_action_signatures: action_sigs.iter().map(|s| (*s).to_string()).collect(),
+            state_delta_signatures: delta_sigs.iter().map(|s| (*s).to_string()).collect(),
+            completed_previews: previews.iter().map(|s| (*s).to_string()).collect(),
+        }
+    }
+
     #[derive(Debug, Clone)]
     #[allow(dead_code)]
     enum RecordedEvent {
@@ -895,7 +1258,12 @@ mod tests {
             self.events.lock().unwrap().push(RecordedEvent::Step(event));
         }
 
-        fn emit_complete(&self, result: &str, _loop_metrics: Option<LoopMetrics>) {
+        fn emit_complete(
+            &self,
+            result: &str,
+            _loop_metrics: Option<LoopMetrics>,
+            _completion: Option<CompletionMeta>,
+        ) {
             self.events
                 .lock()
                 .unwrap()
@@ -1060,6 +1428,116 @@ mod tests {
         );
     }
 
+    #[test]
+    fn test_evaluate_budget_extension_grants_on_real_progress() {
+        let records = vec![
+            progress_record(
+                LoopPhase::Build,
+                "write_file|artifact=1|error=0",
+                &["write_file|{\"path\":\"a.txt\"}"],
+                &["write_file|wrote a.txt"],
+                &["Wrote a.txt"],
+                false,
+            ),
+            progress_record(
+                LoopPhase::Build,
+                "write_file|artifact=1|error=0",
+                &["write_file|{\"path\":\"b.txt\"}"],
+                &["write_file|wrote b.txt"],
+                &["Wrote b.txt"],
+                false,
+            ),
+        ];
+
+        let (eligible, payload) = evaluate_budget_extension(&records, 0);
+        assert!(eligible, "expected progress window to earn an extension");
+        assert_eq!(payload.get("novel_action_count"), Some(&Value::from(2u64)));
+        assert_eq!(payload.get("state_delta_count"), Some(&Value::from(2u64)));
+        assert_eq!(
+            payload.get("blockers"),
+            Some(&Value::Array(Vec::new()))
+        );
+    }
+
+    #[test]
+    fn test_evaluate_budget_extension_blocks_repeated_signatures() {
+        let records = vec![
+            progress_record(
+                LoopPhase::Investigate,
+                "run_shell|artifact=0|error=0",
+                &["run_shell|{\"command\":\"echo a\"}"],
+                &["run_shell|echo a"],
+                &["echo a"],
+                false,
+            ),
+            progress_record(
+                LoopPhase::Investigate,
+                "run_shell|artifact=0|error=0",
+                &["run_shell|{\"command\":\"echo b\"}"],
+                &["run_shell|echo b"],
+                &["echo b"],
+                false,
+            ),
+            progress_record(
+                LoopPhase::Investigate,
+                "run_shell|artifact=0|error=0",
+                &["run_shell|{\"command\":\"echo c\"}"],
+                &["run_shell|echo c"],
+                &["echo c"],
+                false,
+            ),
+        ];
+
+        let (eligible, payload) = evaluate_budget_extension(&records, 0);
+        assert!(!eligible, "repeated signatures should block extension");
+        let blockers = payload
+            .get("blockers")
+            .and_then(Value::as_array)
+            .cloned()
+            .unwrap_or_default();
+        assert!(blockers.contains(&Value::from("repeated_signatures")));
+    }
+
+    #[test]
+    fn test_build_partial_completion_text_mentions_budget_reason_and_preview() {
+        let records = vec![progress_record(
+            LoopPhase::Build,
+            "write_file|artifact=1|error=0",
+            &["write_file|{\"path\":\"artifact.txt\"}"],
+            &["write_file|wrote artifact"],
+            &["Wrote 8 chars to artifact.txt"],
+            false,
+        )];
+        let loop_metrics = LoopMetrics {
+            steps: 4,
+            model_turns: 4,
+            tool_calls: 2,
+            investigate_steps: 0,
+            build_steps: 1,
+            iterate_steps: 0,
+            finalize_steps: 0,
+            recon_streak: 0,
+            max_recon_streak: 0,
+            guardrail_warnings: 0,
+            final_rejections: 0,
+            extensions_granted: 1,
+            extension_eligible_checks: 2,
+            extension_denials_no_progress: 0,
+            extension_denials_cap: 1,
+            termination_reason: "budget_cap".into(),
+        };
+
+        let text = build_partial_completion_text(
+            "finish the artifact",
+            &loop_metrics,
+            &records,
+        );
+
+        assert!(text.contains("Partial completion for objective: finish the artifact"));
+        assert!(text.contains("Termination reason: budget_cap"));
+        assert!(text.contains("Wrote 8 chars to artifact.txt"));
+    }
+
     #[tokio::test]
     async fn test_demo_solve_spawned_task_completes() {
         // Simulates the exact pattern used in agent.rs:
diff --git a/openplanter-desktop/crates/op-core/src/events.rs b/openplanter-desktop/crates/op-core/src/events.rs
index d0e89fe6..326c6d0b 100644
--- a/openplanter-desktop/crates/op-core/src/events.rs
+++ b/openplanter-desktop/crates/op-core/src/events.rs
@@ -49,6 +49,11 @@ pub struct LoopMetrics {
     pub max_recon_streak: u32,
     pub guardrail_warnings: u32,
     pub final_rejections: u32,
+    pub extensions_granted: u32,
+    pub extension_eligible_checks: u32,
+    pub extension_denials_no_progress: u32,
+    pub extension_denials_cap: u32,
+    pub termination_reason: String,
 }
 
 /// Token usage counters.
@@ -75,12 +80,42 @@ pub enum DeltaKind {
     ToolCallArgs,
 }
 
+/// Agent solve completed successfully.
+#[derive(Debug, Clone, Serialize, Deserialize, PartialEq, Eq)]
+#[serde(rename_all = "snake_case")]
+pub enum CompletionKind {
+    Final,
+    Partial,
+}
+
+#[derive(Debug, Clone, Serialize, Deserialize, PartialEq, Eq)]
+#[serde(rename_all = "snake_case")]
+pub enum CompletionReason {
+    FinalAnswer,
+    BudgetNoProgress,
+    BudgetCap,
+}
+
+#[derive(Debug, Clone, Default, Serialize, Deserialize, PartialEq, Eq)]
+#[serde(default)]
+pub struct CompletionMeta {
+    pub kind: String,
+    pub reason: String,
+    pub steps_used: u32,
+    pub max_steps: u32,
+    pub extensions_granted: u32,
+    pub extension_block_steps: u32,
+    pub extension_max_blocks: u32,
+}
+
 /// Agent solve completed successfully.
 #[derive(Debug, Clone, Serialize, Deserialize)]
 pub struct CompleteEvent {
     pub result: String,
     #[serde(default, skip_serializing_if = "Option::is_none")]
     pub loop_metrics: Option<LoopMetrics>,
+    #[serde(default, skip_serializing_if = "Option::is_none")]
+    pub completion: Option<CompletionMeta>,
 }
 
 /// Periodic loop health telemetry event.
@@ -451,6 +486,11 @@ mod tests {
                 max_recon_streak: 1,
                 guardrail_warnings: 0,
                 final_rejections: 1,
+                extensions_granted: 0,
+                extension_eligible_checks: 0,
+                extension_denials_no_progress: 0,
+                extension_denials_cap: 0,
+                termination_reason: String::new(),
             }
         );
     }
diff --git a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
index df7df723..8543afff 100644
--- a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
+++ b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
@@ -549,7 +549,7 @@ async fn test_solve_with_mock_anthropic() {
         fn emit_step(&self, event: StepEvent) {
             self.events.lock().unwrap().push(Ev::Step(event));
         }
-        fn emit_complete(&self, result: &str, _loop_metrics: Option<op_core::events::LoopMetrics>) {
+        fn emit_complete(&self, result: &str, _loop_metrics: Option<op_core::events::LoopMetrics>, _completion: Option<op_core::events::CompletionMeta>) {
             self.events
                 .lock()
                 .unwrap()
@@ -657,7 +657,7 @@ async fn test_solve_with_mock_openai() {
         fn emit_step(&self, event: StepEvent) {
             self.events.lock().unwrap().push(Ev2::Step(event));
         }
-        fn emit_complete(&self, result: &str, _loop_metrics: Option<op_core::events::LoopMetrics>) {
+        fn emit_complete(&self, result: &str, _loop_metrics: Option<op_core::events::LoopMetrics>, _completion: Option<op_core::events::CompletionMeta>) {
             self.events
                 .lock()
                 .unwrap()
@@ -754,7 +754,7 @@ async fn test_solve_http_error_emits_error() {
         fn emit_trace(&self, _: &str) {}
         fn emit_delta(&self, _: DeltaEvent) {}
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, _: &str, _: Option<op_core::events::LoopMetrics>) {}
+        fn emit_complete(&self, _: &str, _: Option<op_core::events::LoopMetrics>, _: Option<op_core::events::CompletionMeta>) {}
         fn emit_error(&self, msg: &str) {
             self.errors.lock().unwrap().push(msg.to_string());
         }
@@ -812,7 +812,7 @@ async fn test_solve_rate_limit_retry_eventually_completes() {
 
         fn emit_step(&self, _: StepEvent) {}
 
-        fn emit_complete(&self, result: &str, _loop_metrics: Option<op_core::events::LoopMetrics>) {
+        fn emit_complete(&self, result: &str, _loop_metrics: Option<op_core::events::LoopMetrics>, _completion: Option<op_core::events::CompletionMeta>) {
             self.events
                 .lock()
                 .unwrap()
@@ -902,7 +902,7 @@ async fn test_solve_cancel_emits_cancelled() {
         fn emit_trace(&self, _: &str) {}
         fn emit_delta(&self, _: DeltaEvent) {}
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, _: &str, _: Option<op_core::events::LoopMetrics>) {}
+        fn emit_complete(&self, _: &str, _: Option<op_core::events::LoopMetrics>, _: Option<op_core::events::CompletionMeta>) {}
         fn emit_error(&self, msg: &str) {
             self.events.lock().unwrap().push(msg.to_string());
         }
@@ -947,7 +947,7 @@ async fn test_solve_demo_mode_bypasses_llm() {
         fn emit_trace(&self, _: &str) {}
         fn emit_delta(&self, _: DeltaEvent) {}
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, result: &str, _loop_metrics: Option<op_core::events::LoopMetrics>) {
+        fn emit_complete(&self, result: &str, _loop_metrics: Option<op_core::events::LoopMetrics>, _completion: Option<op_core::events::CompletionMeta>) {
             self.events.lock().unwrap().push(result.to_string());
         }
         fn emit_error(&self, msg: &str) {
@@ -988,7 +988,7 @@ async fn test_solve_missing_key_emits_error() {
         fn emit_trace(&self, _: &str) {}
         fn emit_delta(&self, _: DeltaEvent) {}
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, _: &str, _: Option<op_core::events::LoopMetrics>) {}
+        fn emit_complete(&self, _: &str, _: Option<op_core::events::LoopMetrics>, _: Option<op_core::events::CompletionMeta>) {}
         fn emit_error(&self, msg: &str) {
             self.errors.lock().unwrap().push(msg.to_string());
         }
@@ -1153,7 +1153,7 @@ async fn test_solve_multi_step_agentic_loop() {
         fn emit_step(&self, event: StepEvent) {
             self.events.lock().unwrap().push(Ev3::Step(event));
         }
-        fn emit_complete(&self, result: &str, loop_metrics: Option<op_core::events::LoopMetrics>) {
+        fn emit_complete(&self, result: &str, loop_metrics: Option<op_core::events::LoopMetrics>, _completion: Option<op_core::events::CompletionMeta>) {
             self.events.lock().unwrap().push(Ev3::Complete {
                 result: result.to_string(),
                 loop_metrics,
@@ -1335,7 +1335,7 @@ async fn test_solve_flushes_final_curator_checkpoint_before_complete() {
 
         fn emit_step(&self, _: op_core::events::StepEvent) {}
 
-        fn emit_complete(&self, result: &str, _: Option<LoopMetrics>) {
+        fn emit_complete(&self, result: &str, _: Option<LoopMetrics>, _: Option<op_core::events::CompletionMeta>) {
             self.events
                 .lock()
                 .unwrap()
@@ -1434,7 +1434,7 @@ async fn test_solve_flushes_cancelled_checkpoint_before_error() {
             }
         }
 
-        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>) {}
+        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>, _: Option<op_core::events::CompletionMeta>) {}
 
         fn emit_error(&self, message: &str) {
             self.events
@@ -1536,7 +1536,7 @@ async fn test_solve_flushes_model_error_checkpoint_before_error() {
 
         fn emit_step(&self, _: op_core::events::StepEvent) {}
 
-        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>) {}
+        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>, _: Option<op_core::events::CompletionMeta>) {}
 
         fn emit_error(&self, message: &str) {
             self.events
@@ -1631,7 +1631,7 @@ async fn test_solve_flushes_tool_loop_cancel_checkpoint_before_error() {
 
         fn emit_step(&self, _: op_core::events::StepEvent) {}
 
-        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>) {}
+        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>, _: Option<op_core::events::CompletionMeta>) {}
 
         fn emit_error(&self, message: &str) {
             self.events
@@ -1747,7 +1747,7 @@ async fn test_solve_rejects_meta_final_until_concrete_completion() {
             self.events.lock().unwrap().push(Ev4::Step(event));
         }
 
-        fn emit_complete(&self, result: &str, loop_metrics: Option<LoopMetrics>) {
+        fn emit_complete(&self, result: &str, loop_metrics: Option<LoopMetrics>, _completion: Option<op_core::events::CompletionMeta>) {
             self.events.lock().unwrap().push(Ev4::Complete {
                 result: result.to_string(),
                 loop_metrics,
@@ -1861,7 +1861,7 @@ async fn test_solve_allows_structural_meta_for_plan_objectives() {
             self.events.lock().unwrap().push(Ev5::Step(event));
         }
 
-        fn emit_complete(&self, result: &str, loop_metrics: Option<LoopMetrics>) {
+        fn emit_complete(&self, result: &str, loop_metrics: Option<LoopMetrics>, _completion: Option<op_core::events::CompletionMeta>) {
             self.events.lock().unwrap().push(Ev5::Complete {
                 result: result.to_string(),
                 loop_metrics,
@@ -1964,7 +1964,7 @@ async fn test_solve_rejects_process_meta_even_for_plan_objectives() {
             self.events.lock().unwrap().push(Ev6::Step(event));
         }
 
-        fn emit_complete(&self, result: &str, loop_metrics: Option<LoopMetrics>) {
+        fn emit_complete(&self, result: &str, loop_metrics: Option<LoopMetrics>, _completion: Option<op_core::events::CompletionMeta>) {
             self.events.lock().unwrap().push(Ev6::Complete {
                 result: result.to_string(),
                 loop_metrics,
diff --git a/openplanter-desktop/crates/op-tauri/src/bridge.rs b/openplanter-desktop/crates/op-tauri/src/bridge.rs
index 4a436e59..ec7294f2 100644
--- a/openplanter-desktop/crates/op-tauri/src/bridge.rs
+++ b/openplanter-desktop/crates/op-tauri/src/bridge.rs
@@ -11,8 +11,8 @@ use tauri::{AppHandle, Emitter};
 
 use op_core::engine::SolveEmitter;
 use op_core::events::{
-    CompleteEvent, CuratorUpdateEvent, DeltaEvent, DeltaKind, ErrorEvent, LoopHealthEvent,
-    LoopMetrics, LoopPhase, StepEvent, TraceEvent,
+    CompleteEvent, CompletionMeta, CuratorUpdateEvent, DeltaEvent, DeltaKind, ErrorEvent,
+    LoopHealthEvent, LoopMetrics, LoopPhase, StepEvent, TraceEvent,
 };
 use op_core::session::replay::{ReplayEntry, ReplayLogger, StepToolCallEntry};
 
@@ -108,13 +108,19 @@ impl SolveEmitter for TauriEmitter {
         let _ = self.handle.emit("agent:step", event);
     }
 
-    fn emit_complete(&self, result: &str, loop_metrics: Option<LoopMetrics>) {
+    fn emit_complete(
+        &self,
+        result: &str,
+        loop_metrics: Option<LoopMetrics>,
+        completion: Option<CompletionMeta>,
+    ) {
         eprintln!("[bridge] complete: {result}");
         let _ = self.handle.emit(
             "agent:complete",
             CompleteEvent {
                 result: result.to_string(),
                 loop_metrics,
+                completion,
             },
         );
     }
@@ -330,7 +336,12 @@ impl<E: SolveEmitter> SolveEmitter for LoggingEmitter<E> {
         self.inner.emit_step(event);
     }
 
-    fn emit_complete(&self, result: &str, loop_metrics: Option<LoopMetrics>) {
+    fn emit_complete(
+        &self,
+        result: &str,
+        loop_metrics: Option<LoopMetrics>,
+        completion: Option<CompletionMeta>,
+    ) {
         let entry = ReplayEntry {
             seq: 0,
             timestamp: String::new(),
@@ -356,7 +367,7 @@ impl<E: SolveEmitter> SolveEmitter for LoggingEmitter<E> {
             });
         });
 
-        self.inner.emit_complete(result, loop_metrics);
+        self.inner.emit_complete(result, loop_metrics, completion);
     }
 
     fn emit_error(&self, message: &str) {
@@ -420,7 +431,7 @@ mod tests {
         fn emit_trace(&self, _: &str) {}
         fn emit_delta(&self, _: DeltaEvent) {}
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>) {}
+        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>, _: Option<CompletionMeta>) {}
         fn emit_error(&self, _: &str) {}
     }
 
@@ -537,7 +548,7 @@ mod tests {
             self.deltas.lock().unwrap().push(event);
         }
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>) {}
+        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>, _: Option<CompletionMeta>) {}
         fn emit_error(&self, _: &str) {}
     }
 
diff --git a/openplanter-desktop/frontend/src/api/events.test.ts b/openplanter-desktop/frontend/src/api/events.test.ts
index eaca9324..8e7618bb 100644
--- a/openplanter-desktop/frontend/src/api/events.test.ts
+++ b/openplanter-desktop/frontend/src/api/events.test.ts
@@ -102,6 +102,11 @@ describe("event listeners", () => {
         max_recon_streak: 1,
         guardrail_warnings: 0,
         final_rejections: 1,
+        extensions_granted: 0,
+        extension_eligible_checks: 0,
+        extension_denials_no_progress: 0,
+        extension_denials_cap: 0,
+        termination_reason: "success",
       },
     };
     handler({ payload });
@@ -166,6 +171,11 @@ describe("event listeners", () => {
         max_recon_streak: 2,
         guardrail_warnings: 1,
         final_rejections: 1,
+        extensions_granted: 0,
+        extension_eligible_checks: 1,
+        extension_denials_no_progress: 1,
+        extension_denials_cap: 0,
+        termination_reason: "budget_no_progress",
       },
       is_final: false,
     };
diff --git a/openplanter-desktop/frontend/src/api/types.ts b/openplanter-desktop/frontend/src/api/types.ts
index 2f13046b..d0114632 100644
--- a/openplanter-desktop/frontend/src/api/types.ts
+++ b/openplanter-desktop/frontend/src/api/types.ts
@@ -23,6 +23,11 @@ export interface LoopMetrics {
   max_recon_streak: number;
   guardrail_warnings: number;
   final_rejections: number;
+  extensions_granted: number;
+  extension_eligible_checks: number;
+  extension_denials_no_progress: number;
+  extension_denials_cap: number;
+  termination_reason: string;
 }
 
 export interface StepEvent {
@@ -43,9 +48,20 @@ export interface DeltaEvent {
   text: string;
 }
 
+export interface CompletionMeta {
+  kind: string;
+  reason: string;
+  steps_used: number;
+  max_steps: number;
+  extensions_granted: number;
+  extension_block_steps: number;
+  extension_max_blocks: number;
+}
+
 export interface CompleteEvent {
   result: string;
   loop_metrics?: LoopMetrics;
+  completion?: CompletionMeta;
 }
 
 export interface LoopHealthEvent {
@@ -252,7 +268,7 @@ export type AgentEvent =
       loop_metrics?: LoopMetrics;
     }
   | { type: "delta"; kind: DeltaKind; text: string }
-  | { type: "complete"; result: string; loop_metrics?: LoopMetrics }
+  | { type: "complete"; result: string; loop_metrics?: LoopMetrics; completion?: CompletionMeta }
   | { type: "error"; message: string }
   | { type: "wiki_updated"; nodes: GraphNode[]; edges: GraphEdge[] }
   | { type: "loop_health"; depth: number; step: number; phase: LoopPhase; metrics: LoopMetrics; is_final: boolean };
diff --git a/openplanter-desktop/frontend/src/commands/slash.ts b/openplanter-desktop/frontend/src/commands/slash.ts
index 99118010..67d1a584 100644
--- a/openplanter-desktop/frontend/src/commands/slash.ts
+++ b/openplanter-desktop/frontend/src/commands/slash.ts
@@ -58,6 +58,7 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
           currentDepth: 0,
           loopHealth: null,
           lastLoopMetrics: null,
+          lastCompletion: null,
           inputQueue: [],
         }));
         window.dispatchEvent(new CustomEvent("session-changed", { detail: { isNew: true } }));
diff --git a/openplanter-desktop/frontend/src/components/App.ts b/openplanter-desktop/frontend/src/components/App.ts
index ea84d5b9..c31e9bb9 100644
--- a/openplanter-desktop/frontend/src/components/App.ts
+++ b/openplanter-desktop/frontend/src/components/App.ts
@@ -107,6 +107,7 @@ async function switchToNewSession(sessionList: HTMLElement): Promise<void> {
       currentDepth: 0,
       loopHealth: null,
       lastLoopMetrics: null,
+      lastCompletion: null,
       inputQueue: [],
     }));
     // Dispatch event to clear ChatPane DOM
@@ -166,6 +167,7 @@ async function switchToSession(sessionId: string, sessionList: HTMLElement): Pro
       currentDepth: 0,
       loopHealth: null,
       lastLoopMetrics: null,
+      lastCompletion: null,
       inputQueue: [],
     }));
     // Dispatch event to clear ChatPane DOM
diff --git a/openplanter-desktop/frontend/src/components/InputBar.ts b/openplanter-desktop/frontend/src/components/InputBar.ts
index 3b39aa84..80420ff5 100644
--- a/openplanter-desktop/frontend/src/components/InputBar.ts
+++ b/openplanter-desktop/frontend/src/components/InputBar.ts
@@ -116,6 +116,7 @@ export function createInputBar(): HTMLElement {
       currentDepth: 0,
       loopHealth: null,
       lastLoopMetrics: null,
+      lastCompletion: null,
       messages: [
         ...s.messages,
         {
@@ -248,6 +249,7 @@ export function createInputBar(): HTMLElement {
       currentDepth: 0,
       loopHealth: null,
       lastLoopMetrics: null,
+      lastCompletion: null,
       messages: [
         ...s.messages,
         {
diff --git a/openplanter-desktop/frontend/src/components/StatusBar.test.ts b/openplanter-desktop/frontend/src/components/StatusBar.test.ts
index 8e83288d..8b495eaa 100644
--- a/openplanter-desktop/frontend/src/components/StatusBar.test.ts
+++ b/openplanter-desktop/frontend/src/components/StatusBar.test.ts
@@ -119,6 +119,11 @@ describe("createStatusBar", () => {
           max_recon_streak: 3,
           guardrail_warnings: 1,
           final_rejections: 2,
+          extensions_granted: 1,
+          extension_eligible_checks: 1,
+          extension_denials_no_progress: 0,
+          extension_denials_cap: 0,
+          termination_reason: "success",
         },
         is_final: false,
       },
diff --git a/openplanter-desktop/frontend/src/main.ts b/openplanter-desktop/frontend/src/main.ts
index 271954c4..fb13670b 100644
--- a/openplanter-desktop/frontend/src/main.ts
+++ b/openplanter-desktop/frontend/src/main.ts
@@ -134,6 +134,7 @@ async function init() {
       currentDepth: 0,
       loopHealth: null,
       lastLoopMetrics: event.loop_metrics ?? s.lastLoopMetrics,
+      lastCompletion: event.completion ?? null,
       messages: [
         ...s.messages,
         {
@@ -143,6 +144,17 @@ async function init() {
           timestamp: Date.now(),
           isRendered: true,
         },
+        ...(event.completion?.kind === "partial"
+          ? [
+              {
+                id: crypto.randomUUID(),
+                role: "system" as const,
+                content:
+                  "Partial completion: the run used its bounded step budget and stopped cleanly. Resume to continue from the saved state.",
+                timestamp: Date.now(),
+              },
+            ]
+          : []),
       ],
     }));
 
@@ -157,6 +169,7 @@ async function init() {
       currentStep: 0,
       currentDepth: 0,
       loopHealth: null,
+      lastCompletion: null,
       messages: [
         ...s.messages,
         {
diff --git a/openplanter-desktop/frontend/src/state/store.ts b/openplanter-desktop/frontend/src/state/store.ts
index bf21d516..4fa1eeca 100644
--- a/openplanter-desktop/frontend/src/state/store.ts
+++ b/openplanter-desktop/frontend/src/state/store.ts
@@ -1,5 +1,6 @@
 /** Simple observable state store. */
 import type {
+  CompletionMeta,
   InitStatusView,
   LoopMetrics,
   LoopHealthEvent,
@@ -85,6 +86,7 @@ export interface AppState {
   currentDepth: number;
   loopHealth: LoopHealthEvent | null;
   lastLoopMetrics: LoopMetrics | null;
+  lastCompletion: CompletionMeta | null;
   inputHistory: string[];
   inputQueue: string[];
   initGateState: "ready" | "requires_action" | "blocked";
@@ -115,6 +117,7 @@ export const appState = new Store<AppState>({
   currentDepth: 0,
   loopHealth: null,
   lastLoopMetrics: null,
+  lastCompletion: null,
   inputHistory: [],
   inputQueue: [],
   initGateState: "ready",
diff --git a/tests/test_boundary_conditions.py b/tests/test_boundary_conditions.py
index ab1d1714..17c452f9 100644
--- a/tests/test_boundary_conditions.py
+++ b/tests/test_boundary_conditions.py
@@ -145,7 +145,7 @@ def test_single_step_exhaustion(self) -> None:
             ])
             engine = _make_engine(root, model, max_steps_per_call=1)
             result = engine.solve("one step only")
-            self.assertIn("Step budget exhausted", result)
+            self.assertIn("Partial completion for objective", result)
 
 
 # ---------------------------------------------------------------------------
diff --git a/tests/test_coverage_gaps.py b/tests/test_coverage_gaps.py
index 25675a90..7ab3444e 100644
--- a/tests/test_coverage_gaps.py
+++ b/tests/test_coverage_gaps.py
@@ -181,6 +181,9 @@ def test_defaults_from_clean_env(self) -> None:
         self.assertEqual(cfg.reasoning_effort, "high")
         self.assertEqual(cfg.max_depth, 4)
         self.assertEqual(cfg.max_steps_per_call, 100)
+        self.assertTrue(cfg.budget_extension_enabled)
+        self.assertEqual(cfg.budget_extension_block_steps, 20)
+        self.assertEqual(cfg.budget_extension_max_blocks, 2)
         self.assertEqual(cfg.shell, "/bin/sh")
         self.assertEqual(
             cfg.openai_base_url,
@@ -200,6 +203,9 @@ def test_custom_env_overrides(self) -> None:
             "OPENPLANTER_REASONING_EFFORT": "low",
             "OPENPLANTER_MAX_DEPTH": "5",
             "OPENPLANTER_MAX_STEPS": "20",
+            "OPENPLANTER_BUDGET_EXTENSION_ENABLED": "false",
+            "OPENPLANTER_BUDGET_EXTENSION_BLOCK_STEPS": "7",
+            "OPENPLANTER_BUDGET_EXTENSION_MAX_BLOCKS": "1",
             "OPENPLANTER_SHELL": "/bin/bash",
             "OPENPLANTER_WEB_SEARCH_PROVIDER": "tavily",
             "OPENPLANTER_TAVILY_BASE_URL": "https://tavily.example",
@@ -211,6 +217,9 @@ def test_custom_env_overrides(self) -> None:
         self.assertEqual(cfg.reasoning_effort, "low")
         self.assertEqual(cfg.max_depth, 5)
         self.assertEqual(cfg.max_steps_per_call, 20)
+        self.assertFalse(cfg.budget_extension_enabled)
+        self.assertEqual(cfg.budget_extension_block_steps, 7)
+        self.assertEqual(cfg.budget_extension_max_blocks, 1)
         self.assertEqual(cfg.shell, "/bin/bash")
         self.assertEqual(cfg.web_search_provider, "tavily")
         self.assertEqual(cfg.tavily_base_url, "https://tavily.example")
diff --git a/tests/test_engine_complex.py b/tests/test_engine_complex.py
index a2e0f2de..2bed324f 100644
--- a/tests/test_engine_complex.py
+++ b/tests/test_engine_complex.py
@@ -33,7 +33,88 @@ def test_step_budget_exhaustion(self) -> None:
             )
             engine = RLMEngine(model=model, tools=tools, config=cfg)
             result = engine.solve("infinite thinking")
-            self.assertIn("Step budget exhausted", result)
+            self.assertIn("Partial completion for objective", result)
+            self.assertEqual(engine.last_loop_metrics.get("termination_reason"), "budget_no_progress")
+
+    def test_budget_extension_granted_on_real_progress(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(
+                workspace=root,
+                max_depth=1,
+                max_steps_per_call=2,
+                budget_extension_enabled=True,
+                budget_extension_block_steps=2,
+                budget_extension_max_blocks=1,
+            )
+            tools = WorkspaceTools(root=root)
+            model = ScriptedModel(
+                scripted_turns=[
+                    ModelTurn(tool_calls=[_tc("run_shell", command="printf 'alpha\\n'")]),
+                    ModelTurn(tool_calls=[_tc("write_file", path="artifact.txt", content="artifact")]),
+                    ModelTurn(text="done after extension", stop_reason="end_turn"),
+                ]
+            )
+            engine = RLMEngine(model=model, tools=tools, config=cfg)
+            result = engine.solve("real progress")
+            self.assertEqual(result, "done after extension")
+            self.assertEqual(engine.last_loop_metrics.get("extensions_granted"), 1)
+            self.assertEqual(engine.last_loop_metrics.get("termination_reason"), "success")
+
+    def test_budget_extension_denied_on_high_failure_ratio(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(
+                workspace=root,
+                max_depth=1,
+                max_steps_per_call=3,
+                budget_extension_enabled=True,
+                budget_extension_block_steps=2,
+                budget_extension_max_blocks=1,
+            )
+            tools = WorkspaceTools(root=root)
+            model = ScriptedModel(
+                scripted_turns=[
+                    ModelTurn(tool_calls=[_tc("read_file", path="missing-a.txt")]),
+                    ModelTurn(tool_calls=[_tc("read_file", path="missing-b.txt")]),
+                    ModelTurn(tool_calls=[_tc("run_shell", command="printf 'ok\\n'")]),
+                ]
+            )
+            engine = RLMEngine(model=model, tools=tools, config=cfg)
+            result = engine.solve("failure-heavy objective")
+            self.assertIn("Partial completion for objective", result)
+            blockers = engine.last_loop_metrics.get("last_budget_extension_eval", {}).get("blockers", [])
+            self.assertIn("high_failure_ratio", blockers)
+
+    def test_budget_extension_cap_produces_partial_completion(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(
+                workspace=root,
+                max_depth=1,
+                max_steps_per_call=2,
+                budget_extension_enabled=True,
+                budget_extension_block_steps=2,
+                budget_extension_max_blocks=1,
+            )
+            tools = WorkspaceTools(root=root)
+            model = ScriptedModel(
+                scripted_turns=[
+                    ModelTurn(tool_calls=[_tc("write_file", path="one.txt", content="one")]),
+                    ModelTurn(tool_calls=[_tc("write_file", path="two.txt", content="two")]),
+                    ModelTurn(tool_calls=[_tc("write_file", path="three.txt", content="three")]),
+                    ModelTurn(tool_calls=[_tc("write_file", path="four.txt", content="four")]),
+                ]
+            )
+            engine = RLMEngine(model=model, tools=tools, config=cfg)
+            result = engine.solve("cap objective")
+            self.assertIn("Partial completion for objective", result)
+            self.assertEqual(engine.last_loop_metrics.get("termination_reason"), "budget_cap")
+            self.assertEqual(engine.last_loop_metrics.get("extensions_granted"), 1)
+            self.assertLessEqual(
+                int(engine.last_loop_metrics.get("steps", 0)),
+                cfg.max_steps_per_call + cfg.budget_extension_block_steps * cfg.budget_extension_max_blocks,
+            )
 
     # ------------------------------------------------------------------
     # 2. Nested subtasks at depth 2 (3-level recursion)
@@ -617,7 +698,7 @@ def test_step_budget_message_includes_objective(self) -> None:
             )
             engine = RLMEngine(model=model, tools=tools, config=cfg)
             result = engine.solve("my specific objective")
-            self.assertIn("Step budget exhausted", result)
+            self.assertIn("Partial completion for objective", result)
             self.assertIn("my specific objective", result)
 
     # ------------------------------------------------------------------
diff --git a/tests/test_user_stories.py b/tests/test_user_stories.py
index 9e79f60b..528e0c27 100644
--- a/tests/test_user_stories.py
+++ b/tests/test_user_stories.py
@@ -1044,8 +1044,8 @@ def test_multiple_errors_then_success(self) -> None:
             )
             self.assertGreaterEqual(error_count, 2)
 
-    def test_all_steps_fail_then_budget_exhausted(self) -> None:
-        """Every step errors; budget exhausted message still includes objective."""
+    def test_all_steps_fail_then_returns_partial_completion(self) -> None:
+        """Every step errors; partial completion still includes objective."""
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)
             cfg = _make_config(root, max_steps_per_call=3)
@@ -1060,8 +1060,9 @@ def test_all_steps_fail_then_budget_exhausted(self) -> None:
             runtime = _make_runtime(root, cfg, turns, "all-fail")
             result = runtime.solve("attempt impossible reads")
 
-            self.assertIn("Step budget exhausted", result)
+            self.assertIn("Partial completion for objective", result)
             self.assertIn("attempt impossible reads", result)
+            self.assertEqual(runtime.loop_metrics.get("termination_reason"), "budget_no_progress")
 
 
 # ===================================================================

From b97242765660153ecc6efd3a9beb855b00ecae9b Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 08:10:45 -0400
Subject: [PATCH 38/58] Fix UTF-8 truncation in budget helpers

---
 .../crates/op-core/src/engine/mod.rs          | 28 +++++++++++++++++--
 1 file changed, 26 insertions(+), 2 deletions(-)

diff --git a/openplanter-desktop/crates/op-core/src/engine/mod.rs b/openplanter-desktop/crates/op-core/src/engine/mod.rs
index 85057ef2..ea3b1517 100644
--- a/openplanter-desktop/crates/op-core/src/engine/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/mod.rs
@@ -550,7 +550,7 @@ fn normalize_progress_fragment(text: &str, max_len: usize) -> String {
         }
     }
     if normalized.len() > max_len {
-        normalized.truncate(max_len);
+        normalized = safe_prefix(&normalized, max_len).to_string();
     }
     normalized
 }
@@ -558,7 +558,7 @@ fn normalize_progress_fragment(text: &str, max_len: usize) -> String {
 fn summarize_observation(text: &str, max_len: usize) -> String {
     let first = text.lines().next().unwrap_or("").trim();
     if first.len() > max_len {
-        format!("{}...", &first[..max_len.saturating_sub(3)])
+        format!("{}...", safe_prefix(first, max_len.saturating_sub(3)))
     } else {
         first.to_string()
     }
@@ -1498,6 +1498,30 @@ mod tests {
         assert!(blockers.contains(&Value::from("repeated_signatures")));
     }
 
+    #[test]
+    fn test_normalize_progress_fragment_truncates_on_utf8_boundary() {
+        let normalized =
+            normalize_progress_fragment("[Step 1/100] [Context 10/20] 日本語テスト", 7);
+
+        assert_eq!(normalized, "日本");
+        assert!(normalized.len() <= 7);
+    }
+
+    #[test]
+    fn test_summarize_observation_truncates_on_utf8_boundary() {
+        let summary = summarize_observation("abc日本語の長い説明\nsecond line", 8);
+
+        assert_eq!(summary, "abc...");
+        assert!(summary.ends_with("..."));
+    }
+
+    #[test]
+    fn test_summarize_observation_small_limit_still_returns_ellipsis() {
+        let summary = summarize_observation("日本語の長い説明", 2);
+
+        assert_eq!(summary, "...");
+    }
+
     #[test]
     fn test_build_partial_completion_text_mentions_budget_reason_and_preview() {
         let records = vec![progress_record(

From b2088403108a3d1f584413178dae40188e29994b Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 09:06:05 -0400
Subject: [PATCH 39/58] feat: add long-form mistral transcription chunking

---
 README.md                                     |   51 +-
 agent/__main__.py                             |    6 +
 agent/builder.py                              |    9 +
 agent/config.py                               |   62 +
 agent/credentials.py                          |   34 +
 agent/engine.py                               |   75 +
 agent/tool_defs.py                            |   66 +
 agent/tools.py                                |  887 +++++++++++
 agent/tui.py                                  |    1 +
 openplanter-desktop/Cargo.lock                |   17 +
 openplanter-desktop/crates/op-core/Cargo.toml |    2 +-
 .../crates/op-core/src/builder.rs             |   11 +
 .../crates/op-core/src/config.rs              |  152 ++
 .../crates/op-core/src/config_hydration.rs    |    1 +
 .../crates/op-core/src/credentials.rs         |   45 +-
 .../crates/op-core/src/engine/mod.rs          |    1 +
 .../crates/op-core/src/tools/audio.rs         | 1419 +++++++++++++++++
 .../crates/op-core/src/tools/defs.rs          |   63 +
 .../crates/op-core/src/tools/mod.rs           |  126 ++
 .../crates/op-tauri/src/commands/agent.rs     |    4 +-
 .../crates/op-tauri/src/commands/config.rs    |   18 +-
 .../crates/op-tauri/src/state.rs              |   14 +-
 .../frontend/src/api/invoke.test.ts           |    2 +
 .../frontend/src/commands/model.test.ts       |    5 +
 .../frontend/src/components/App.test.ts       |    4 +-
 .../frontend/src/components/App.ts            |    2 +-
 tests/test_audio_transcribe.py                |  391 +++++
 tests/test_credentials.py                     |    3 +
 tests/test_settings.py                        |    8 +
 tests/test_tool_defs.py                       |    2 +-
 30 files changed, 3465 insertions(+), 16 deletions(-)
 create mode 100644 openplanter-desktop/crates/op-core/src/tools/audio.rs
 create mode 100644 tests/test_audio_transcribe.py

diff --git a/README.md b/README.md
index ed538e98..34ed5aa5 100644
--- a/README.md
+++ b/README.md
@@ -155,14 +155,59 @@ export OPENPLANTER_RATE_LIMIT_RETRY_AFTER_CAP_SEC=120.0
 export OPENPLANTER_ZAI_STREAM_MAX_RETRIES=10
 ```
 
-Additional service keys: `EXA_API_KEY`, `FIRECRAWL_API_KEY`, `BRAVE_API_KEY`, `TAVILY_API_KEY` (web search), `VOYAGE_API_KEY` (embeddings).
+Additional service keys: `EXA_API_KEY`, `FIRECRAWL_API_KEY`, `BRAVE_API_KEY`, `TAVILY_API_KEY` (web search), `VOYAGE_API_KEY` (embeddings), `MISTRAL_TRANSCRIPTION_API_KEY` or `MISTRAL_API_KEY` (audio transcription).
+
+### Audio Transcription
+
+OpenPlanter includes an `audio_transcribe` tool backed by Mistral's offline transcription API. It uploads local workspace audio files to `POST /v1/audio/transcriptions`, defaults to `voxtral-mini-latest`, and returns transcript text plus any timestamp or diarization metadata that Mistral includes.
+
+Long-form recordings can now be chunked automatically. When `chunking` is left at its default of `auto`, OpenPlanter keeps the current single-upload path for smaller files and switches to overlapping chunked transcription when the upload would exceed the configured Mistral size cap. `chunking: "force"` always chunks, and `chunking: "off"` keeps the single-upload path.
+
+Configure it with:
+
+```bash
+export MISTRAL_API_KEY=...
+# Optional overrides
+export OPENPLANTER_MISTRAL_TRANSCRIPTION_BASE_URL=https://api.mistral.ai
+export OPENPLANTER_MISTRAL_TRANSCRIPTION_MODEL=voxtral-mini-latest
+export OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_BYTES=104857600
+export OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS=900
+export OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS=2.0
+export OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_CHUNKS=48
+export OPENPLANTER_MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC=180
+```
+
+Example tool call:
+
+```json
+{
+  "name": "audio_transcribe",
+  "arguments": {
+    "path": "recordings/interview.wav",
+    "chunking": "auto",
+    "chunk_max_seconds": 900,
+    "chunk_overlap_seconds": 2.0,
+    "diarize": true,
+    "timestamp_granularities": ["segment"]
+  }
+}
+```
+
+Notes:
+- The tool only accepts local workspace files.
+- Long-form chunking requires `ffmpeg` and `ffprobe` to be available at runtime.
+- Video inputs (`.mp4`, `.webm`, `.mov`, `.mkv`, `.avi`, `.m4v`) are audio-extracted with `ffmpeg` before transcription.
+- `language` cannot be combined with `timestamp_granularities`.
+- `context_bias` is normalized to up to 100 phrases before upload.
+- Chunked diarization uses chunk-local speaker labels (for example `c1_speaker_a`) and does not attempt cross-chunk speaker identity merging.
+- If `continue_on_chunk_error` is `true`, the tool can return partial chunked output with warnings instead of failing immediately.
 
 All keys can also be set with an `OPENPLANTER_` prefix (e.g. `OPENPLANTER_OPENAI_API_KEY`), via `.env` files in the workspace, or via CLI flags.
 Provider base URLs can also be overridden with `OPENPLANTER_*_BASE_URL`, including `OPENPLANTER_TAVILY_BASE_URL`.
 
 ## Agent Tools
 
-The agent has access to 19 tools, organized around its investigation workflow:
+The agent has access to 20 tools, organized around its investigation workflow:
 
 **Dataset ingestion & workspace** — `list_files`, `search_files`, `repo_map`, `read_file`, `write_file`, `edit_file`, `hashline_edit`, `apply_patch` — load, inspect, and transform source datasets; write structured findings.
 
@@ -170,6 +215,8 @@ The agent has access to 19 tools, organized around its investigation workflow:
 
 **Web** — `web_search` (Exa, Firecrawl, Brave, or Tavily), `fetch_url` — pull public records, verify entities, and retrieve supplementary data.
 
+**Audio** — `audio_transcribe` — transcribe local audio/video with Mistral, including optional timestamps, diarization, and automatic chunking for long recordings.
+
 **Planning & delegation** — `think`, `subtask`, `execute`, `list_artifacts`, `read_artifact` — decompose investigations into focused sub-tasks, each with acceptance criteria and independent verification.
 
 In **recursive mode** (the default), the agent spawns sub-agents via `subtask` and `execute` to parallelize entity resolution, cross-dataset linking, and evidence-chain construction across large investigations.
diff --git a/agent/__main__.py b/agent/__main__.py
index ce8b19ad..849d1cd3 100644
--- a/agent/__main__.py
+++ b/agent/__main__.py
@@ -253,6 +253,7 @@ def _load_credentials(
         brave_api_key=user_creds.brave_api_key,
         tavily_api_key=user_creds.tavily_api_key,
         voyage_api_key=user_creds.voyage_api_key,
+        mistral_transcription_api_key=user_creds.mistral_transcription_api_key,
     )
 
     store = CredentialStore(workspace=cfg.workspace, session_root_dir=cfg.session_root_dir)
@@ -279,6 +280,8 @@ def _load_credentials(
         creds.tavily_api_key = stored.tavily_api_key
     if stored.voyage_api_key:
         creds.voyage_api_key = stored.voyage_api_key
+    if stored.mistral_transcription_api_key:
+        creds.mistral_transcription_api_key = stored.mistral_transcription_api_key
 
     env_creds = credentials_from_env()
     if env_creds.openai_api_key:
@@ -303,6 +306,8 @@ def _load_credentials(
         creds.tavily_api_key = env_creds.tavily_api_key
     if env_creds.voyage_api_key:
         creds.voyage_api_key = env_creds.voyage_api_key
+    if env_creds.mistral_transcription_api_key:
+        creds.mistral_transcription_api_key = env_creds.mistral_transcription_api_key
 
     for env_path in discover_env_candidates(cfg.workspace):
         file_creds = parse_env_file(env_path)
@@ -386,6 +391,7 @@ def _apply_runtime_overrides(cfg: AgentConfig, args: argparse.Namespace, creds:
     cfg.brave_api_key = creds.brave_api_key
     cfg.tavily_api_key = creds.tavily_api_key
     cfg.voyage_api_key = creds.voyage_api_key
+    cfg.mistral_transcription_api_key = creds.mistral_transcription_api_key
     cfg.api_key = cfg.openai_api_key
 
     if args.zai_plan:
diff --git a/agent/builder.py b/agent/builder.py
index 146d53f9..2675b128 100644
--- a/agent/builder.py
+++ b/agent/builder.py
@@ -251,6 +251,15 @@ def build_engine(cfg: AgentConfig) -> RLMEngine:
         brave_base_url=cfg.brave_base_url,
         tavily_api_key=cfg.tavily_api_key,
         tavily_base_url=cfg.tavily_base_url,
+        mistral_transcription_api_key=cfg.mistral_transcription_api_key,
+        mistral_transcription_base_url=cfg.mistral_transcription_base_url,
+        mistral_transcription_model=cfg.mistral_transcription_model,
+        mistral_transcription_max_bytes=cfg.mistral_transcription_max_bytes,
+        mistral_transcription_chunk_max_seconds=cfg.mistral_transcription_chunk_max_seconds,
+        mistral_transcription_chunk_overlap_seconds=cfg.mistral_transcription_chunk_overlap_seconds,
+        mistral_transcription_max_chunks=cfg.mistral_transcription_max_chunks,
+        mistral_transcription_request_timeout_sec=cfg.mistral_transcription_request_timeout_sec,
+        max_observation_chars=cfg.max_observation_chars,
     )
 
     try:
diff --git a/agent/config.py b/agent/config.py
index 8f219a34..6d0fadcc 100644
--- a/agent/config.py
+++ b/agent/config.py
@@ -12,6 +12,12 @@
 FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER = "dont-worry-it-will-be-injected"
 ZAI_PAYGO_BASE_URL = "https://api.z.ai/api/paas/v4"
 ZAI_CODING_BASE_URL = "https://api.z.ai/api/coding/paas/v4"
+MISTRAL_TRANSCRIPTION_BASE_URL = "https://api.mistral.ai"
+MISTRAL_TRANSCRIPTION_DEFAULT_MODEL = "voxtral-mini-latest"
+MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS = 900
+MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS = 2.0
+MISTRAL_TRANSCRIPTION_MAX_CHUNKS = 48
+MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC = 180
 
 PROVIDER_DEFAULT_MODELS: dict[str, str] = {
     "openai": "azure-foundry/gpt-5.4",
@@ -113,6 +119,7 @@ class AgentConfig:
     firecrawl_base_url: str = "https://api.firecrawl.dev/v1"
     brave_base_url: str = "https://api.search.brave.com/res/v1"
     tavily_base_url: str = "https://api.tavily.com"
+    mistral_transcription_base_url: str = MISTRAL_TRANSCRIPTION_BASE_URL
     openai_api_key: str | None = None
     openai_oauth_token: str | None = None
     anthropic_api_key: str | None = None
@@ -125,6 +132,17 @@ class AgentConfig:
     tavily_api_key: str | None = None
     web_search_provider: str = "exa"
     voyage_api_key: str | None = None
+    mistral_transcription_api_key: str | None = None
+    mistral_transcription_model: str = MISTRAL_TRANSCRIPTION_DEFAULT_MODEL
+    mistral_transcription_max_bytes: int = 100 * 1024 * 1024
+    mistral_transcription_chunk_max_seconds: int = MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS
+    mistral_transcription_chunk_overlap_seconds: float = (
+        MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS
+    )
+    mistral_transcription_max_chunks: int = MISTRAL_TRANSCRIPTION_MAX_CHUNKS
+    mistral_transcription_request_timeout_sec: int = (
+        MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC
+    )
     max_depth: int = 4
     max_steps_per_call: int = 100
     budget_extension_enabled: bool = True
@@ -187,6 +205,11 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
         brave_api_key = os.getenv("OPENPLANTER_BRAVE_API_KEY") or os.getenv("BRAVE_API_KEY")
         tavily_api_key = os.getenv("OPENPLANTER_TAVILY_API_KEY") or os.getenv("TAVILY_API_KEY")
         voyage_api_key = os.getenv("OPENPLANTER_VOYAGE_API_KEY") or os.getenv("VOYAGE_API_KEY")
+        mistral_transcription_api_key = (
+            os.getenv("OPENPLANTER_MISTRAL_TRANSCRIPTION_API_KEY")
+            or os.getenv("MISTRAL_TRANSCRIPTION_API_KEY")
+            or os.getenv("MISTRAL_API_KEY")
+        )
         openai_base_url = os.getenv("OPENPLANTER_OPENAI_BASE_URL") or os.getenv(
             "OPENPLANTER_BASE_URL",
             FOUNDRY_OPENAI_BASE_URL,
@@ -245,6 +268,12 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             firecrawl_base_url=os.getenv("OPENPLANTER_FIRECRAWL_BASE_URL", "https://api.firecrawl.dev/v1"),
             brave_base_url=os.getenv("OPENPLANTER_BRAVE_BASE_URL", "https://api.search.brave.com/res/v1"),
             tavily_base_url=os.getenv("OPENPLANTER_TAVILY_BASE_URL", "https://api.tavily.com"),
+            mistral_transcription_base_url=os.getenv(
+                "OPENPLANTER_MISTRAL_TRANSCRIPTION_BASE_URL",
+                os.getenv("MISTRAL_TRANSCRIPTION_BASE_URL")
+                or os.getenv("MISTRAL_BASE_URL")
+                or MISTRAL_TRANSCRIPTION_BASE_URL,
+            ),
             openai_api_key=openai_api_key,
             openai_oauth_token=(openai_oauth_token or "").strip() or None,
             anthropic_api_key=anthropic_api_key,
@@ -257,6 +286,39 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             tavily_api_key=tavily_api_key,
             web_search_provider=web_search_provider,
             voyage_api_key=voyage_api_key,
+            mistral_transcription_api_key=(mistral_transcription_api_key or "").strip() or None,
+            mistral_transcription_model=(
+                os.getenv("OPENPLANTER_MISTRAL_TRANSCRIPTION_MODEL")
+                or os.getenv("MISTRAL_TRANSCRIPTION_MODEL")
+                or MISTRAL_TRANSCRIPTION_DEFAULT_MODEL
+            ),
+            mistral_transcription_max_bytes=int(
+                os.getenv("OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_BYTES", "104857600")
+            ),
+            mistral_transcription_chunk_max_seconds=int(
+                os.getenv(
+                    "OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS",
+                    str(MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS),
+                )
+            ),
+            mistral_transcription_chunk_overlap_seconds=float(
+                os.getenv(
+                    "OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS",
+                    str(MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS),
+                )
+            ),
+            mistral_transcription_max_chunks=int(
+                os.getenv(
+                    "OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_CHUNKS",
+                    str(MISTRAL_TRANSCRIPTION_MAX_CHUNKS),
+                )
+            ),
+            mistral_transcription_request_timeout_sec=int(
+                os.getenv(
+                    "OPENPLANTER_MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC",
+                    str(MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC),
+                )
+            ),
             max_depth=int(os.getenv("OPENPLANTER_MAX_DEPTH", "4")),
             max_steps_per_call=int(os.getenv("OPENPLANTER_MAX_STEPS", "100")),
             budget_extension_enabled=budget_extension_enabled,
diff --git a/agent/credentials.py b/agent/credentials.py
index a145c4e4..95ee01d9 100644
--- a/agent/credentials.py
+++ b/agent/credentials.py
@@ -22,6 +22,7 @@ class CredentialBundle:
     brave_api_key: str | None = None
     tavily_api_key: str | None = None
     voyage_api_key: str | None = None
+    mistral_transcription_api_key: str | None = None
 
     def has_any(self) -> bool:
         return bool(
@@ -36,6 +37,10 @@ def has_any(self) -> bool:
             or (self.brave_api_key and self.brave_api_key.strip())
             or (self.tavily_api_key and self.tavily_api_key.strip())
             or (self.voyage_api_key and self.voyage_api_key.strip())
+            or (
+                self.mistral_transcription_api_key
+                and self.mistral_transcription_api_key.strip()
+            )
         )
 
     def merge_missing(self, other: "CredentialBundle") -> None:
@@ -61,6 +66,11 @@ def merge_missing(self, other: "CredentialBundle") -> None:
             self.tavily_api_key = other.tavily_api_key
         if not self.voyage_api_key and other.voyage_api_key:
             self.voyage_api_key = other.voyage_api_key
+        if (
+            not self.mistral_transcription_api_key
+            and other.mistral_transcription_api_key
+        ):
+            self.mistral_transcription_api_key = other.mistral_transcription_api_key
 
     def to_json(self) -> dict[str, str]:
         out: dict[str, str] = {}
@@ -86,6 +96,8 @@ def to_json(self) -> dict[str, str]:
             out["tavily_api_key"] = self.tavily_api_key
         if self.voyage_api_key:
             out["voyage_api_key"] = self.voyage_api_key
+        if self.mistral_transcription_api_key:
+            out["mistral_transcription_api_key"] = self.mistral_transcription_api_key
         return out
 
     @classmethod
@@ -104,6 +116,10 @@ def from_json(cls, payload: dict[str, str] | None) -> "CredentialBundle":
             brave_api_key=(payload.get("brave_api_key") or "").strip() or None,
             tavily_api_key=(payload.get("tavily_api_key") or "").strip() or None,
             voyage_api_key=(payload.get("voyage_api_key") or "").strip() or None,
+            mistral_transcription_api_key=(
+                payload.get("mistral_transcription_api_key") or ""
+            ).strip()
+            or None,
         )
 
 
@@ -159,6 +175,13 @@ def parse_env_file(path: Path) -> CredentialBundle:
         brave_api_key=(env.get("BRAVE_API_KEY") or env.get("OPENPLANTER_BRAVE_API_KEY") or "").strip() or None,
         tavily_api_key=(env.get("TAVILY_API_KEY") or env.get("OPENPLANTER_TAVILY_API_KEY") or "").strip() or None,
         voyage_api_key=(env.get("VOYAGE_API_KEY") or env.get("OPENPLANTER_VOYAGE_API_KEY") or "").strip() or None,
+        mistral_transcription_api_key=(
+            env.get("OPENPLANTER_MISTRAL_TRANSCRIPTION_API_KEY")
+            or env.get("MISTRAL_TRANSCRIPTION_API_KEY")
+            or env.get("MISTRAL_API_KEY")
+            or ""
+        ).strip()
+        or None,
     )
 
 
@@ -198,6 +221,13 @@ def credentials_from_env() -> CredentialBundle:
         brave_api_key=(os.getenv("OPENPLANTER_BRAVE_API_KEY") or os.getenv("BRAVE_API_KEY") or "").strip() or None,
         tavily_api_key=(os.getenv("OPENPLANTER_TAVILY_API_KEY") or os.getenv("TAVILY_API_KEY") or "").strip() or None,
         voyage_api_key=(os.getenv("OPENPLANTER_VOYAGE_API_KEY") or os.getenv("VOYAGE_API_KEY") or "").strip() or None,
+        mistral_transcription_api_key=(
+            os.getenv("OPENPLANTER_MISTRAL_TRANSCRIPTION_API_KEY")
+            or os.getenv("MISTRAL_TRANSCRIPTION_API_KEY")
+            or os.getenv("MISTRAL_API_KEY")
+            or ""
+        ).strip()
+        or None,
     )
 
 
@@ -293,6 +323,7 @@ def prompt_for_credentials(
         brave_api_key=existing.brave_api_key,
         tavily_api_key=existing.tavily_api_key,
         voyage_api_key=existing.voyage_api_key,
+        mistral_transcription_api_key=existing.mistral_transcription_api_key,
     )
 
     should_prompt = force or not current.has_any()
@@ -331,6 +362,9 @@ def _ask(label: str, existing_value: str | None) -> str | None:
     current.brave_api_key = _ask("Brave", current.brave_api_key)
     current.tavily_api_key = _ask("Tavily", current.tavily_api_key)
     current.voyage_api_key = _ask("Voyage", current.voyage_api_key)
+    current.mistral_transcription_api_key = _ask(
+        "Mistral Transcription", current.mistral_transcription_api_key
+    )
     if not force and current.has_any() and not existing.has_any():
         changed = True
     return current, changed
diff --git a/agent/engine.py b/agent/engine.py
index 33ff033c..1e4f4de1 100644
--- a/agent/engine.py
+++ b/agent/engine.py
@@ -32,6 +32,7 @@
     "fetch_url",
     "read_file",
     "read_image",
+    "audio_transcribe",
     "list_artifacts",
     "read_artifact",
 }
@@ -1261,6 +1262,80 @@ def _apply_tool_call(
                 self._pending_image.data = (b64, media_type)
             return False, text
 
+        if name == "audio_transcribe":
+            path = str(args.get("path", "")).strip()
+            if not path:
+                return False, "audio_transcribe requires path"
+            diarize = args.get("diarize")
+            diarize = diarize if isinstance(diarize, bool) else None
+            raw_timestamps = args.get("timestamp_granularities")
+            if isinstance(raw_timestamps, list):
+                timestamp_granularities = [
+                    str(v).strip() for v in raw_timestamps if str(v).strip()
+                ]
+            elif isinstance(raw_timestamps, str) and raw_timestamps.strip():
+                timestamp_granularities = [raw_timestamps.strip()]
+            else:
+                timestamp_granularities = None
+            raw_context_bias = args.get("context_bias")
+            if isinstance(raw_context_bias, list):
+                context_bias = [
+                    str(v).strip() for v in raw_context_bias if str(v).strip()
+                ]
+            elif isinstance(raw_context_bias, str) and raw_context_bias.strip():
+                context_bias = [
+                    part.strip()
+                    for part in raw_context_bias.split(",")
+                    if part.strip()
+                ]
+            else:
+                context_bias = None
+            language = str(args.get("language", "")).strip() or None
+            model = str(args.get("model", "")).strip() or None
+            raw_temperature = args.get("temperature")
+            temperature = None
+            if isinstance(raw_temperature, (int, float)) and not isinstance(
+                raw_temperature, bool
+            ):
+                temperature = float(raw_temperature)
+            chunking = str(args.get("chunking", "")).strip().lower() or None
+            raw_chunk_max_seconds = args.get("chunk_max_seconds")
+            chunk_max_seconds = None
+            if isinstance(raw_chunk_max_seconds, int) and not isinstance(
+                raw_chunk_max_seconds, bool
+            ):
+                chunk_max_seconds = raw_chunk_max_seconds
+            raw_chunk_overlap_seconds = args.get("chunk_overlap_seconds")
+            chunk_overlap_seconds = None
+            if isinstance(raw_chunk_overlap_seconds, (int, float)) and not isinstance(
+                raw_chunk_overlap_seconds, bool
+            ):
+                chunk_overlap_seconds = float(raw_chunk_overlap_seconds)
+            raw_max_chunks = args.get("max_chunks")
+            max_chunks = None
+            if isinstance(raw_max_chunks, int) and not isinstance(raw_max_chunks, bool):
+                max_chunks = raw_max_chunks
+            raw_continue_on_chunk_error = args.get("continue_on_chunk_error")
+            continue_on_chunk_error = (
+                raw_continue_on_chunk_error
+                if isinstance(raw_continue_on_chunk_error, bool)
+                else None
+            )
+            return False, self.tools.audio_transcribe(
+                path=path,
+                diarize=diarize,
+                timestamp_granularities=timestamp_granularities,
+                context_bias=context_bias,
+                language=language,
+                model=model,
+                temperature=temperature,
+                chunking=chunking,
+                chunk_max_seconds=chunk_max_seconds,
+                chunk_overlap_seconds=chunk_overlap_seconds,
+                max_chunks=max_chunks,
+                continue_on_chunk_error=continue_on_chunk_error,
+            )
+
         if name == "write_file":
             path = str(args.get("path", "")).strip()
             if not path:
diff --git a/agent/tool_defs.py b/agent/tool_defs.py
index 73ef01ed..50f7a9cb 100644
--- a/agent/tool_defs.py
+++ b/agent/tool_defs.py
@@ -134,6 +134,72 @@
             "additionalProperties": False,
         },
     },
+    {
+        "name": "audio_transcribe",
+        "description": (
+            "Transcribe a local audio file with Mistral's offline transcription API. "
+            "Supports diarization, timestamp granularity, context bias, language, "
+            "model override, temperature, and optional chunking for long-form audio/video."
+        ),
+        "parameters": {
+            "type": "object",
+            "properties": {
+                "path": {
+                    "type": "string",
+                    "description": "Relative or absolute path to the audio file within the workspace.",
+                },
+                "diarize": {
+                    "type": "boolean",
+                    "description": "Whether to request speaker diarization.",
+                },
+                "timestamp_granularities": {
+                    "type": "array",
+                    "items": {"type": "string"},
+                    "description": "Optional timestamp granularity values such as 'segment' or 'word'.",
+                },
+                "context_bias": {
+                    "type": "array",
+                    "items": {"type": "string"},
+                    "description": "Optional bias phrases to steer transcription toward expected terms.",
+                },
+                "language": {
+                    "type": "string",
+                    "description": "Optional ISO language hint. Cannot be combined with timestamp_granularities.",
+                },
+                "model": {
+                    "type": "string",
+                    "description": "Optional transcription model override.",
+                },
+                "temperature": {
+                    "type": "number",
+                    "description": "Optional decoding temperature.",
+                },
+                "chunking": {
+                    "type": "string",
+                    "description": "Long-form handling mode: 'auto', 'off', or 'force'.",
+                    "enum": ["auto", "off", "force"],
+                },
+                "chunk_max_seconds": {
+                    "type": "integer",
+                    "description": "Maximum chunk duration in seconds for chunked transcription.",
+                },
+                "chunk_overlap_seconds": {
+                    "type": "number",
+                    "description": "Overlap between adjacent chunks in seconds.",
+                },
+                "max_chunks": {
+                    "type": "integer",
+                    "description": "Maximum number of chunks allowed for a transcription run.",
+                },
+                "continue_on_chunk_error": {
+                    "type": "boolean",
+                    "description": "Continue remaining chunks and return partial output if a chunk fails.",
+                },
+            },
+            "required": ["path"],
+            "additionalProperties": False,
+        },
+    },
     {
         "name": "write_file",
         "description": "Create or overwrite a file in the workspace with the given content.",
diff --git a/agent/tools.py b/agent/tools.py
index e626d140..3c49c899 100644
--- a/agent/tools.py
+++ b/agent/tools.py
@@ -2,9 +2,11 @@
 
 import ast
 import base64
+import copy
 import fnmatch
 import html as _html
 import json
+import mimetypes
 import os
 import signal
 import shutil
@@ -14,6 +16,7 @@
 import urllib.error
 import urllib.parse
 import urllib.request
+import uuid
 import re as _re
 import zlib
 from contextlib import contextmanager
@@ -37,6 +40,7 @@
 _HASHLINE_PREFIX_RE = _re.compile(r"^\d+:[0-9a-f]{2}\|")
 _HEREDOC_RE = _re.compile(r"<<-?\s*['\"]?\w+['\"]?")
 _INTERACTIVE_RE = _re.compile(r"(^|[;&|]\s*)(vim|nano|less|more|top|htop|man)\b")
+_TOKEN_NORMALIZE_RE = _re.compile(r"[^a-z0-9]+")
 
 
 class _HTMLTextExtractor(HTMLParser):
@@ -115,6 +119,7 @@ class WorkspaceTools:
     command_timeout_sec: int = 45
     max_shell_output_chars: int = 16000
     max_file_chars: int = 20000
+    max_observation_chars: int = 6000
     max_files_listed: int = 400
     max_search_hits: int = 200
     web_search_provider: str = "exa"
@@ -126,6 +131,14 @@ class WorkspaceTools:
     brave_base_url: str = "https://api.search.brave.com/res/v1"
     tavily_api_key: str | None = None
     tavily_base_url: str = "https://api.tavily.com"
+    mistral_transcription_api_key: str | None = None
+    mistral_transcription_base_url: str = "https://api.mistral.ai"
+    mistral_transcription_model: str = "voxtral-mini-latest"
+    mistral_transcription_max_bytes: int = 100 * 1024 * 1024
+    mistral_transcription_chunk_max_seconds: int = 900
+    mistral_transcription_chunk_overlap_seconds: float = 2.0
+    mistral_transcription_max_chunks: int = 48
+    mistral_transcription_request_timeout_sec: int = 180
 
     def __post_init__(self) -> None:
         self.root = self.root.expanduser().resolve()
@@ -618,6 +631,880 @@ def read_image(self, path: str) -> tuple[str, str | None, str | None]:
         text = f"Image {rel} ({len(raw):,} bytes, {media_type})"
         return text, b64, media_type
 
+    _AUDIO_EXTENSIONS = {
+        ".aac",
+        ".flac",
+        ".m4a",
+        ".mp3",
+        ".mpeg",
+        ".mpga",
+        ".oga",
+        ".ogg",
+        ".opus",
+        ".wav",
+    }
+    _VIDEO_EXTENSIONS = {
+        ".avi",
+        ".m4v",
+        ".mkv",
+        ".mov",
+        ".mp4",
+        ".webm",
+    }
+    _TIMESTAMP_GRANULARITIES = {"segment", "word"}
+    _AUDIO_CHUNKING_MODES = {"auto", "force", "off"}
+    _AUDIO_CHUNK_TARGET_FILL_RATIO = 0.85
+    _AUDIO_CHUNK_BYTES_PER_SECOND = 32000
+    _AUDIO_MIN_CHUNK_SECONDS = 30.0
+    _AUDIO_MAX_CHUNK_SECONDS = 1800.0
+    _AUDIO_MAX_CHUNK_OVERLAP_SECONDS = 15.0
+    _AUDIO_MAX_CHUNKS = 200
+    _AUDIO_SPEAKER_FIELDS = {"speaker", "speaker_id", "speaker_label"}
+
+    def _mistral_transcription_url(self) -> str:
+        base = self.mistral_transcription_base_url.rstrip("/")
+        if base.endswith("/v1"):
+            return f"{base}/audio/transcriptions"
+        return f"{base}/v1/audio/transcriptions"
+
+    def _encode_multipart_form_data(
+        self,
+        *,
+        fields: list[tuple[str, str]],
+        file_field_name: str,
+        file_name: str,
+        file_bytes: bytes,
+        media_type: str,
+    ) -> tuple[bytes, str]:
+        boundary = f"----OpenPlanter{uuid.uuid4().hex}"
+        chunks: list[bytes] = []
+        for key, value in fields:
+            chunks.append(f"--{boundary}\r\n".encode("utf-8"))
+            chunks.append(
+                f'Content-Disposition: form-data; name="{key}"\r\n\r\n'.encode(
+                    "utf-8"
+                )
+            )
+            chunks.append(value.encode("utf-8"))
+            chunks.append(b"\r\n")
+        safe_name = Path(file_name).name.replace('"', "")
+        chunks.append(f"--{boundary}\r\n".encode("utf-8"))
+        chunks.append(
+            (
+                f'Content-Disposition: form-data; name="{file_field_name}"; '
+                f'filename="{safe_name}"\r\n'
+            ).encode("utf-8")
+        )
+        chunks.append(f"Content-Type: {media_type}\r\n\r\n".encode("utf-8"))
+        chunks.append(file_bytes)
+        chunks.append(b"\r\n")
+        chunks.append(f"--{boundary}--\r\n".encode("utf-8"))
+        return b"".join(chunks), boundary
+
+    def _mistral_transcription_request(
+        self,
+        *,
+        resolved: Path,
+        model: str,
+        diarize: bool | None,
+        timestamp_granularities: list[str] | None,
+        context_bias: list[str] | None,
+        language: str | None,
+        temperature: float | None,
+    ) -> dict[str, Any]:
+        if not (
+            self.mistral_transcription_api_key
+            and self.mistral_transcription_api_key.strip()
+        ):
+            raise ToolError("Mistral transcription API key not configured")
+        try:
+            size = resolved.stat().st_size
+        except OSError as exc:
+            raise ToolError(f"Failed to inspect audio file {resolved.name}: {exc}") from exc
+        if size > self.mistral_transcription_max_bytes:
+            raise ToolError(
+                f"Audio file too large: {size:,} bytes "
+                f"(max {self.mistral_transcription_max_bytes:,} bytes)"
+            )
+        try:
+            file_bytes = resolved.read_bytes()
+        except OSError as exc:
+            raise ToolError(f"Failed to read audio file {resolved.name}: {exc}") from exc
+
+        media_type = mimetypes.guess_type(resolved.name)[0] or "application/octet-stream"
+        fields: list[tuple[str, str]] = [
+            ("model", model),
+            ("stream", "false"),
+        ]
+        if diarize is not None:
+            fields.append(("diarize", "true" if diarize else "false"))
+        if language:
+            fields.append(("language", language))
+        if temperature is not None:
+            fields.append(("temperature", str(temperature)))
+        for granularity in timestamp_granularities or []:
+            fields.append(("timestamp_granularities", granularity))
+        for phrase in context_bias or []:
+            fields.append(("context_bias", phrase))
+
+        body, boundary = self._encode_multipart_form_data(
+            fields=fields,
+            file_field_name="file",
+            file_name=resolved.name,
+            file_bytes=file_bytes,
+            media_type=media_type,
+        )
+        req = urllib.request.Request(
+            url=self._mistral_transcription_url(),
+            data=body,
+            headers={
+                "Authorization": f"Bearer {self.mistral_transcription_api_key}",
+                "Content-Type": f"multipart/form-data; boundary={boundary}",
+            },
+            method="POST",
+        )
+        try:
+            with urllib.request.urlopen(
+                req, timeout=self.mistral_transcription_request_timeout_sec
+            ) as resp:
+                raw = resp.read().decode("utf-8", errors="replace")
+        except urllib.error.HTTPError as exc:
+            body = exc.read().decode("utf-8", errors="replace")
+            raise ToolError(f"Mistral transcription HTTP {exc.code}: {body}") from exc
+        except urllib.error.URLError as exc:
+            raise ToolError(f"Mistral transcription connection error: {exc}") from exc
+        except OSError as exc:
+            raise ToolError(f"Mistral transcription network error: {exc}") from exc
+
+        try:
+            parsed = json.loads(raw)
+        except json.JSONDecodeError as exc:
+            raise ToolError(
+                f"Mistral transcription returned non-JSON payload: {raw[:500]}"
+            ) from exc
+        if not isinstance(parsed, dict):
+            raise ToolError(
+                f"Mistral transcription returned non-object response: {type(parsed)!r}"
+            )
+        return parsed
+
+    def _audio_transcribe_max_chars(self) -> int:
+        return min(self.max_file_chars, self.max_observation_chars)
+
+    def _audio_transcribe_options(
+        self,
+        *,
+        diarize: bool | None,
+        timestamp_granularities: list[str] | None,
+        context_bias: list[str] | None,
+        language: str | None,
+        temperature: float | None,
+        chunking: str,
+        chunk_max_seconds: int | None,
+        chunk_overlap_seconds: float | None,
+        max_chunks: int | None,
+        continue_on_chunk_error: bool | None,
+    ) -> dict[str, Any]:
+        options: dict[str, Any] = {"chunking": chunking}
+        if diarize is not None:
+            options["diarize"] = diarize
+        if timestamp_granularities:
+            options["timestamp_granularities"] = timestamp_granularities
+        if context_bias:
+            options["context_bias"] = context_bias
+        if language:
+            options["language"] = language
+        if temperature is not None:
+            options["temperature"] = temperature
+        if chunk_max_seconds is not None:
+            options["chunk_max_seconds"] = chunk_max_seconds
+        if chunk_overlap_seconds is not None:
+            options["chunk_overlap_seconds"] = chunk_overlap_seconds
+        if max_chunks is not None:
+            options["max_chunks"] = max_chunks
+        if continue_on_chunk_error is not None:
+            options["continue_on_chunk_error"] = continue_on_chunk_error
+        return options
+
+    def _ensure_media_tools(self) -> None:
+        missing = [
+            name for name in ("ffmpeg", "ffprobe") if shutil.which(name) is None
+        ]
+        if missing:
+            joined = ", ".join(missing)
+            raise ToolError(
+                f"Long-form transcription requires {joined}. Install ffmpeg/ffprobe and retry."
+            )
+
+    def _run_media_command(self, argv: list[str]) -> str:
+        try:
+            completed = subprocess.run(
+                argv,
+                capture_output=True,
+                text=True,
+                timeout=self.command_timeout_sec,
+                check=False,
+            )
+        except FileNotFoundError as exc:
+            raise ToolError(f"Media tooling not available: {argv[0]}") from exc
+        except subprocess.TimeoutExpired as exc:
+            raise ToolError(f"{argv[0]} timed out after {self.command_timeout_sec}s") from exc
+        if completed.returncode != 0:
+            stderr = completed.stderr.strip() or completed.stdout.strip()
+            raise ToolError(f"{argv[0]} failed: {stderr or 'unknown error'}")
+        return completed.stdout
+
+    def _probe_media_duration(self, source: Path) -> float:
+        raw = self._run_media_command(
+            [
+                "ffprobe",
+                "-v",
+                "error",
+                "-print_format",
+                "json",
+                "-show_format",
+                str(source),
+            ]
+        )
+        try:
+            parsed = json.loads(raw)
+        except json.JSONDecodeError as exc:
+            raise ToolError(f"ffprobe returned invalid JSON for {source.name}") from exc
+        duration_value = (
+            parsed.get("format", {}).get("duration")
+            if isinstance(parsed, dict)
+            else None
+        )
+        try:
+            duration = float(duration_value)
+        except (TypeError, ValueError) as exc:
+            raise ToolError(f"ffprobe did not return a valid duration for {source.name}") from exc
+        if duration <= 0:
+            raise ToolError(f"ffprobe reported non-positive duration for {source.name}")
+        return duration
+
+    def _extract_audio_source(self, source: Path, output: Path) -> None:
+        self._run_media_command(
+            [
+                "ffmpeg",
+                "-nostdin",
+                "-y",
+                "-i",
+                str(source),
+                "-vn",
+                "-ac",
+                "1",
+                "-ar",
+                "16000",
+                "-c:a",
+                "pcm_s16le",
+                str(output),
+            ]
+        )
+
+    def _extract_audio_chunk(
+        self,
+        source: Path,
+        output: Path,
+        *,
+        start_sec: float,
+        duration_sec: float,
+    ) -> None:
+        self._run_media_command(
+            [
+                "ffmpeg",
+                "-nostdin",
+                "-y",
+                "-ss",
+                f"{start_sec:.3f}",
+                "-i",
+                str(source),
+                "-t",
+                f"{duration_sec:.3f}",
+                "-vn",
+                "-ac",
+                "1",
+                "-ar",
+                "16000",
+                "-c:a",
+                "pcm_s16le",
+                str(output),
+            ]
+        )
+
+    def _audio_chunk_seconds_budget(self, requested_seconds: float) -> float:
+        safe_seconds = (
+            self.mistral_transcription_max_bytes
+            * self._AUDIO_CHUNK_TARGET_FILL_RATIO
+            / self._AUDIO_CHUNK_BYTES_PER_SECOND
+        )
+        if safe_seconds <= 0:
+            raise ToolError("Mistral transcription max-bytes budget is too small to chunk audio")
+        return min(requested_seconds, safe_seconds)
+
+    def _plan_audio_chunks(
+        self,
+        *,
+        duration_sec: float,
+        chunk_seconds: float,
+        overlap_seconds: float,
+        max_chunks: int,
+    ) -> list[dict[str, float]]:
+        if duration_sec <= 0:
+            raise ToolError("Cannot chunk media with non-positive duration")
+        chunk_seconds = max(1.0, chunk_seconds)
+        overlap_seconds = min(max(0.0, overlap_seconds), max(0.0, chunk_seconds - 0.001))
+        chunks: list[dict[str, float]] = []
+        start = 0.0
+        while start < duration_sec - 1e-6:
+            end = min(duration_sec, start + chunk_seconds)
+            index = len(chunks)
+            chunks.append(
+                {
+                    "index": float(index),
+                    "start_sec": round(start, 3),
+                    "end_sec": round(end, 3),
+                    "duration_sec": round(end - start, 3),
+                    "leading_overlap_sec": 0.0 if index == 0 else round(overlap_seconds, 3),
+                }
+            )
+            if len(chunks) > max_chunks:
+                raise ToolError(
+                    f"Chunk plan would create {len(chunks)} chunks (max {max_chunks})"
+                )
+            if end >= duration_sec - 1e-6:
+                break
+            next_start = end - overlap_seconds
+            if next_start <= start + 1e-6:
+                next_start = end
+            start = next_start
+        return chunks
+
+    def _is_video_extension(self, ext: str) -> bool:
+        return ext in self._VIDEO_EXTENSIONS
+
+    def _normalized_audio_token(self, token: str) -> str:
+        return _TOKEN_NORMALIZE_RE.sub("", token.lower())
+
+    def _dedupe_audio_overlap_text(self, existing_text: str, incoming_text: str) -> str:
+        if not existing_text.strip():
+            return incoming_text.strip()
+        current_tokens = incoming_text.split()
+        if not current_tokens:
+            return ""
+        previous_tokens = existing_text.split()
+        max_window = min(len(previous_tokens), len(current_tokens), 80)
+        if max_window < 5:
+            return incoming_text.strip()
+        previous_norm = [
+            self._normalized_audio_token(token)
+            for token in previous_tokens[-max_window:]
+        ]
+        current_norm = [
+            self._normalized_audio_token(token)
+            for token in current_tokens[:max_window]
+        ]
+        for match_len in range(max_window, 4, -1):
+            if previous_norm[-match_len:] == current_norm[:match_len]:
+                return " ".join(current_tokens[match_len:]).strip()
+        return incoming_text.strip()
+
+    def _entry_time_bounds(self, entry: dict[str, Any]) -> tuple[float, float] | None:
+        start = entry.get("start")
+        end = entry.get("end")
+        if isinstance(start, (int, float)) and isinstance(end, (int, float)):
+            return float(start), float(end)
+        timestamps = entry.get("timestamps")
+        if (
+            isinstance(timestamps, list)
+            and len(timestamps) >= 2
+            and isinstance(timestamps[0], (int, float))
+            and isinstance(timestamps[1], (int, float))
+        ):
+            return float(timestamps[0]), float(timestamps[1])
+        return None
+
+    def _set_entry_time_bounds(
+        self,
+        entry: dict[str, Any],
+        *,
+        start: float,
+        end: float,
+    ) -> None:
+        if "start" in entry or "end" in entry:
+            entry["start"] = round(start, 3)
+            entry["end"] = round(end, 3)
+        elif isinstance(entry.get("timestamps"), list):
+            timestamps = list(entry.get("timestamps", []))
+            while len(timestamps) < 2:
+                timestamps.append(0.0)
+            timestamps[0] = round(start, 3)
+            timestamps[1] = round(end, 3)
+            entry["timestamps"] = timestamps
+
+    def _prefix_audio_speakers(self, value: Any, prefix: str) -> Any:
+        if isinstance(value, list):
+            return [self._prefix_audio_speakers(item, prefix) for item in value]
+        if isinstance(value, dict):
+            copied: dict[str, Any] = {}
+            for key, item in value.items():
+                if (
+                    key in self._AUDIO_SPEAKER_FIELDS
+                    and isinstance(item, str)
+                    and item.strip()
+                ):
+                    copied[key] = f"{prefix}{item.strip()}"
+                else:
+                    copied[key] = self._prefix_audio_speakers(item, prefix)
+            return copied
+        return value
+
+    def _shift_audio_items(
+        self,
+        items: list[Any],
+        *,
+        chunk_start_sec: float,
+        leading_overlap_sec: float,
+        speaker_prefix: str,
+    ) -> list[Any]:
+        shifted: list[Any] = []
+        for item in items:
+            copied = self._prefix_audio_speakers(copy.deepcopy(item), speaker_prefix)
+            if isinstance(copied, dict):
+                bounds = self._entry_time_bounds(copied)
+                if bounds is not None:
+                    start, end = bounds
+                    if end <= leading_overlap_sec + 1e-6:
+                        continue
+                    if start < leading_overlap_sec:
+                        start = leading_overlap_sec
+                    self._set_entry_time_bounds(
+                        copied,
+                        start=start + chunk_start_sec,
+                        end=end + chunk_start_sec,
+                    )
+            shifted.append(copied)
+        return shifted
+
+    def _collect_chunk_metadata(
+        self,
+        parsed: dict[str, Any],
+        *,
+        chunk_start_sec: float,
+        leading_overlap_sec: float,
+        speaker_prefix: str,
+    ) -> dict[str, list[Any]]:
+        aggregated: dict[str, list[Any]] = {}
+        if isinstance(parsed.get("segments"), list):
+            aggregated["segments"] = self._shift_audio_items(
+                parsed["segments"],
+                chunk_start_sec=chunk_start_sec,
+                leading_overlap_sec=leading_overlap_sec,
+                speaker_prefix=speaker_prefix,
+            )
+        elif isinstance(parsed.get("chunks"), list):
+            aggregated["segments"] = self._shift_audio_items(
+                parsed["chunks"],
+                chunk_start_sec=chunk_start_sec,
+                leading_overlap_sec=leading_overlap_sec,
+                speaker_prefix=speaker_prefix,
+            )
+        if isinstance(parsed.get("words"), list):
+            aggregated["words"] = self._shift_audio_items(
+                parsed["words"],
+                chunk_start_sec=chunk_start_sec,
+                leading_overlap_sec=leading_overlap_sec,
+                speaker_prefix=speaker_prefix,
+            )
+        if isinstance(parsed.get("diarization"), list):
+            aggregated["diarization"] = self._shift_audio_items(
+                parsed["diarization"],
+                chunk_start_sec=chunk_start_sec,
+                leading_overlap_sec=leading_overlap_sec,
+                speaker_prefix=speaker_prefix,
+            )
+        return aggregated
+
+    def _audio_json_length(self, payload: dict[str, Any]) -> int:
+        return len(json.dumps(payload, indent=2, ensure_ascii=True))
+
+    def _truncate_audio_text(
+        self,
+        payload: dict[str, Any],
+        *,
+        max_chars: int,
+    ) -> None:
+        text = str(payload.get("text", ""))
+        if not text:
+            return
+        base = copy.deepcopy(payload)
+        base["text"] = ""
+        if self._audio_json_length(base) > max_chars:
+            payload["text"] = ""
+            payload.setdefault("truncation", {})["text_truncated_chars"] = len(text)
+            return
+        low = 0
+        high = len(text)
+        while low < high:
+            mid = (low + high + 1) // 2
+            base["text"] = text[:mid]
+            if self._audio_json_length(base) <= max_chars:
+                low = mid
+            else:
+                high = mid - 1
+        payload["text"] = text[:low]
+        omitted = len(text) - low
+        if omitted > 0:
+            payload.setdefault("truncation", {})["text_truncated_chars"] = omitted
+
+    def _serialize_audio_envelope(
+        self,
+        envelope: dict[str, Any],
+        *,
+        max_chars: int,
+    ) -> str:
+        payload = copy.deepcopy(envelope)
+        payload.setdefault("truncation", {"applied": False})
+        if self._audio_json_length(payload) <= max_chars:
+            return json.dumps(payload, indent=2, ensure_ascii=True)
+
+        truncation = payload.setdefault("truncation", {})
+        truncation["applied"] = True
+        response = payload.get("response")
+        omitted_response_fields: dict[str, int] = {}
+
+        if isinstance(response, dict):
+            removal_order = ["words", "diarization", "segments"]
+            if payload.get("mode") != "chunked":
+                removal_order.append("chunks")
+            for key in removal_order:
+                value = response.get(key)
+                if isinstance(value, list) and value:
+                    omitted_response_fields[key] = len(value)
+                    response.pop(key, None)
+                    if self._audio_json_length(payload) <= max_chars:
+                        break
+            if omitted_response_fields:
+                truncation["omitted_response_fields"] = omitted_response_fields
+            if (
+                payload.get("mode") == "chunked"
+                and isinstance(response.get("chunks"), list)
+                and self._audio_json_length(payload) > max_chars
+            ):
+                chunk_summaries = response["chunks"]
+                keep = min(len(chunk_summaries), 12)
+                omitted = len(chunk_summaries) - keep
+                if omitted > 0:
+                    response["chunks"] = chunk_summaries[:keep]
+                    truncation["omitted_chunk_statuses"] = omitted
+
+        if self._audio_json_length(payload) > max_chars:
+            self._truncate_audio_text(payload, max_chars=max_chars)
+
+        if (
+            isinstance(payload.get("response"), dict)
+            and isinstance(payload["response"].get("chunks"), list)
+            and self._audio_json_length(payload) > max_chars
+        ):
+            while (
+                len(payload["response"]["chunks"]) > 3
+                and self._audio_json_length(payload) > max_chars
+            ):
+                payload["response"]["chunks"].pop()
+                truncation["omitted_chunk_statuses"] = truncation.get(
+                    "omitted_chunk_statuses", 0
+                ) + 1
+
+        if self._audio_json_length(payload) > max_chars and isinstance(
+            payload.get("options"), dict
+        ):
+            if isinstance(payload["options"].get("context_bias"), list):
+                truncation["omitted_context_bias_phrases"] = len(
+                    payload["options"]["context_bias"]
+                )
+                payload["options"].pop("context_bias", None)
+
+        return json.dumps(payload, indent=2, ensure_ascii=True)
+
+    def audio_transcribe(
+        self,
+        path: str,
+        diarize: bool | None = None,
+        timestamp_granularities: list[str] | None = None,
+        context_bias: list[str] | None = None,
+        language: str | None = None,
+        model: str | None = None,
+        temperature: float | None = None,
+        chunking: str | None = None,
+        chunk_max_seconds: int | None = None,
+        chunk_overlap_seconds: float | None = None,
+        max_chunks: int | None = None,
+        continue_on_chunk_error: bool | None = None,
+    ) -> str:
+        resolved = self._resolve_path(path)
+        if not resolved.exists():
+            return f"File not found: {path}"
+        if resolved.is_dir():
+            return f"Path is a directory, not a file: {path}"
+        ext = resolved.suffix.lower()
+        if ext not in self._AUDIO_EXTENSIONS and ext not in self._VIDEO_EXTENSIONS:
+            return (
+                f"Unsupported audio format: {ext or '(none)'}. "
+                f"Supported: {', '.join(sorted(self._AUDIO_EXTENSIONS | self._VIDEO_EXTENSIONS))}"
+            )
+        if language and timestamp_granularities:
+            return (
+                "language cannot be combined with timestamp_granularities for "
+                "Mistral offline transcription"
+            )
+        chunk_mode = (chunking or "auto").strip().lower()
+        if chunk_mode not in self._AUDIO_CHUNKING_MODES:
+            return "chunking must be one of auto, off, or force"
+        if chunk_max_seconds is not None and not (
+            self._AUDIO_MIN_CHUNK_SECONDS
+            <= float(chunk_max_seconds)
+            <= self._AUDIO_MAX_CHUNK_SECONDS
+        ):
+            return (
+                "chunk_max_seconds must be between "
+                f"{int(self._AUDIO_MIN_CHUNK_SECONDS)} and {int(self._AUDIO_MAX_CHUNK_SECONDS)}"
+            )
+        if chunk_overlap_seconds is not None and not (
+            0.0 <= float(chunk_overlap_seconds) <= self._AUDIO_MAX_CHUNK_OVERLAP_SECONDS
+        ):
+            return (
+                "chunk_overlap_seconds must be between 0 and "
+                f"{int(self._AUDIO_MAX_CHUNK_OVERLAP_SECONDS)}"
+            )
+        if max_chunks is not None and not (1 <= max_chunks <= self._AUDIO_MAX_CHUNKS):
+            return f"max_chunks must be between 1 and {self._AUDIO_MAX_CHUNKS}"
+        normalized_timestamps: list[str] | None = None
+        if timestamp_granularities:
+            seen: set[str] = set()
+            normalized_timestamps = []
+            for item in timestamp_granularities:
+                value = item.strip().lower()
+                if not value:
+                    continue
+                if value not in self._TIMESTAMP_GRANULARITIES:
+                    return (
+                        "timestamp_granularities must be drawn from "
+                        f"{', '.join(sorted(self._TIMESTAMP_GRANULARITIES))}"
+                    )
+                if value not in seen:
+                    normalized_timestamps.append(value)
+                    seen.add(value)
+        normalized_bias = [item.strip() for item in (context_bias or []) if item.strip()]
+        if len(normalized_bias) > 100:
+            return "context_bias supports at most 100 phrases"
+        chosen_model = (model or self.mistral_transcription_model or "").strip()
+        if not chosen_model:
+            return "No Mistral transcription model configured"
+        self._files_read.add(resolved)
+        rel = resolved.relative_to(self.root).as_posix()
+        options = self._audio_transcribe_options(
+            diarize=diarize,
+            timestamp_granularities=normalized_timestamps,
+            context_bias=normalized_bias,
+            language=language,
+            temperature=temperature,
+            chunking=chunk_mode,
+            chunk_max_seconds=chunk_max_seconds,
+            chunk_overlap_seconds=chunk_overlap_seconds,
+            max_chunks=max_chunks,
+            continue_on_chunk_error=continue_on_chunk_error,
+        )
+
+        try:
+            with tempfile.TemporaryDirectory(prefix="openplanter-audio-") as temp_root:
+                temp_dir = Path(temp_root)
+                upload_source = resolved
+                if self._is_video_extension(ext):
+                    self._ensure_media_tools()
+                    upload_source = temp_dir / "video-source.wav"
+                    self._extract_audio_source(resolved, upload_source)
+
+                try:
+                    upload_size = upload_source.stat().st_size
+                except OSError as exc:
+                    raise ToolError(
+                        f"Failed to inspect audio file {upload_source.name}: {exc}"
+                    ) from exc
+
+                chunk_requested = chunk_mode == "force" or (
+                    chunk_mode == "auto"
+                    and upload_size > self.mistral_transcription_max_bytes
+                )
+
+                if not chunk_requested:
+                    parsed = self._mistral_transcription_request(
+                        resolved=upload_source,
+                        model=chosen_model,
+                        diarize=diarize,
+                        timestamp_granularities=normalized_timestamps,
+                        context_bias=normalized_bias,
+                        language=language,
+                        temperature=temperature,
+                    )
+                    envelope = {
+                        "provider": "mistral",
+                        "service": "transcription",
+                        "path": rel,
+                        "model": chosen_model,
+                        "options": options,
+                        "text": str(parsed.get("text", "")),
+                        "response": parsed,
+                    }
+                    return self._serialize_audio_envelope(
+                        envelope, max_chars=self._audio_transcribe_max_chars()
+                    )
+
+                self._ensure_media_tools()
+                duration_sec = self._probe_media_duration(upload_source)
+                requested_chunk_seconds = float(
+                    chunk_max_seconds or self.mistral_transcription_chunk_max_seconds
+                )
+                requested_chunk_seconds = min(
+                    requested_chunk_seconds, self._AUDIO_MAX_CHUNK_SECONDS
+                )
+                effective_chunk_seconds = self._audio_chunk_seconds_budget(
+                    requested_chunk_seconds
+                )
+                if duration_sec > self._AUDIO_MIN_CHUNK_SECONDS:
+                    effective_chunk_seconds = max(
+                        min(duration_sec, effective_chunk_seconds),
+                        min(duration_sec, self._AUDIO_MIN_CHUNK_SECONDS),
+                    )
+                effective_overlap_seconds = min(
+                    float(
+                        chunk_overlap_seconds
+                        if chunk_overlap_seconds is not None
+                        else self.mistral_transcription_chunk_overlap_seconds
+                    ),
+                    max(0.0, effective_chunk_seconds - 0.001),
+                )
+                effective_max_chunks = max_chunks or self.mistral_transcription_max_chunks
+                chunk_plan = self._plan_audio_chunks(
+                    duration_sec=duration_sec,
+                    chunk_seconds=effective_chunk_seconds,
+                    overlap_seconds=effective_overlap_seconds,
+                    max_chunks=effective_max_chunks,
+                )
+                warnings: list[str] = []
+                chunk_statuses: list[dict[str, Any]] = []
+                stitched_text = ""
+                partial = False
+                aggregated_response: dict[str, Any] = {
+                    "speaker_scope": (
+                        "chunk_local_prefixed" if diarize else "not_requested"
+                    ),
+                    "chunks": chunk_statuses,
+                }
+
+                for plan_entry in chunk_plan:
+                    index = int(plan_entry["index"])
+                    start_sec = float(plan_entry["start_sec"])
+                    end_sec = float(plan_entry["end_sec"])
+                    duration_value = float(plan_entry["duration_sec"])
+                    leading_overlap_sec = float(plan_entry["leading_overlap_sec"])
+                    chunk_path = temp_dir / f"chunk-{index:03d}.wav"
+                    try:
+                        self._extract_audio_chunk(
+                            upload_source,
+                            chunk_path,
+                            start_sec=start_sec,
+                            duration_sec=duration_value,
+                        )
+                        parsed = self._mistral_transcription_request(
+                            resolved=chunk_path,
+                            model=chosen_model,
+                            diarize=diarize,
+                            timestamp_granularities=normalized_timestamps,
+                            context_bias=normalized_bias,
+                            language=language,
+                            temperature=temperature,
+                        )
+                    except ToolError as exc:
+                        partial = True
+                        message = f"chunk {index} failed: {exc}"
+                        chunk_statuses.append(
+                            {
+                                "index": index,
+                                "start_sec": start_sec,
+                                "end_sec": end_sec,
+                                "status": "error",
+                                "error": str(exc),
+                            }
+                        )
+                        if continue_on_chunk_error:
+                            warnings.append(message)
+                            continue
+                        return f"audio_transcribe failed in chunk {index}: {exc}"
+
+                    chunk_text = str(parsed.get("text", "")).strip()
+                    deduped_text = self._dedupe_audio_overlap_text(
+                        stitched_text, chunk_text
+                    )
+                    if deduped_text:
+                        stitched_text = (
+                            f"{stitched_text} {deduped_text}".strip()
+                            if stitched_text
+                            else deduped_text
+                        )
+
+                    metadata = self._collect_chunk_metadata(
+                        parsed,
+                        chunk_start_sec=start_sec,
+                        leading_overlap_sec=leading_overlap_sec,
+                        speaker_prefix=f"c{index}_",
+                    )
+                    for key, values in metadata.items():
+                        if values:
+                            aggregated_response.setdefault(key, []).extend(values)
+
+                    chunk_statuses.append(
+                        {
+                            "index": index,
+                            "start_sec": start_sec,
+                            "end_sec": end_sec,
+                            "status": "ok",
+                            "text_chars": len(chunk_text),
+                        }
+                    )
+
+                if not any(
+                    chunk.get("status") == "ok" for chunk in chunk_statuses
+                ):
+                    return "audio_transcribe failed: no chunk completed successfully"
+
+                envelope = {
+                    "provider": "mistral",
+                    "service": "transcription",
+                    "mode": "chunked",
+                    "path": rel,
+                    "model": chosen_model,
+                    "options": options,
+                    "chunking": {
+                        "strategy": "overlap_window",
+                        "chunk_seconds": round(effective_chunk_seconds, 3),
+                        "overlap_seconds": round(effective_overlap_seconds, 3),
+                        "total_chunks": len(chunk_plan),
+                        "failed_chunks": sum(
+                            1 for chunk in chunk_statuses if chunk["status"] != "ok"
+                        ),
+                        "partial": partial,
+                    },
+                    "text": stitched_text,
+                    "response": aggregated_response,
+                }
+                if warnings:
+                    envelope["warnings"] = warnings
+                return self._serialize_audio_envelope(
+                    envelope, max_chars=self._audio_transcribe_max_chars()
+                )
+        except ToolError as exc:
+            return str(exc)
+
     def write_file(self, path: str, content: str) -> str:
         resolved = self._resolve_path(path)
         if resolved.exists() and resolved.is_file() and resolved not in self._files_read:
diff --git a/agent/tui.py b/agent/tui.py
index e5f37152..f7283088 100644
--- a/agent/tui.py
+++ b/agent/tui.py
@@ -436,6 +436,7 @@ def _clip_event(text: str) -> str:
 _KEY_ARGS: dict[str, str] = {
     "read_file": "path",
     "read_image": "path",
+    "audio_transcribe": "path",
     "write_file": "path",
     "edit_file": "path",
     "hashline_edit": "path",
diff --git a/openplanter-desktop/Cargo.lock b/openplanter-desktop/Cargo.lock
index 503aecf9..7cfac50f 100644
--- a/openplanter-desktop/Cargo.lock
+++ b/openplanter-desktop/Cargo.lock
@@ -2026,6 +2026,16 @@ version = "0.3.17"
 source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "6877bb514081ee2a7ff5ef9de3281f14a4dd4bceac4c09388074a6b5df8a139a"
 
+[[package]]
+name = "mime_guess"
+version = "2.0.5"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "f7c44f8e672c00fe5308fa235f821cb4198414e1c77935c1ab6948d3fd78550e"
+dependencies = [
+ "mime",
+ "unicase",
+]
+
 [[package]]
 name = "minimal-lexical"
 version = "0.2.1"
@@ -3112,6 +3122,7 @@ dependencies = [
  "js-sys",
  "log",
  "mime",
+ "mime_guess",
  "native-tls",
  "percent-encoding",
  "pin-project-lite",
@@ -4579,6 +4590,12 @@ dependencies = [
  "unic-common",
 ]
 
+[[package]]
+name = "unicase"
+version = "2.9.0"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "dbc4bc3a9f746d862c45cb89d705aa10f187bb96c76001afab07a0d35ce60142"
+
 [[package]]
 name = "unicode-ident"
 version = "1.0.24"
diff --git a/openplanter-desktop/crates/op-core/Cargo.toml b/openplanter-desktop/crates/op-core/Cargo.toml
index eaf10099..08671359 100644
--- a/openplanter-desktop/crates/op-core/Cargo.toml
+++ b/openplanter-desktop/crates/op-core/Cargo.toml
@@ -15,7 +15,7 @@ uuid = { workspace = true }
 regex = { workspace = true }
 async-trait = "0.1"
 tokio-util = { workspace = true }
-reqwest = { version = "0.12", features = ["json", "stream"] }
+reqwest = { version = "0.12", features = ["json", "multipart", "stream"] }
 reqwest-eventsource = "0.6"
 futures = "0.3"
 petgraph = { version = "0.7", features = ["serde-1"] }
diff --git a/openplanter-desktop/crates/op-core/src/builder.rs b/openplanter-desktop/crates/op-core/src/builder.rs
index 6bfab8a1..40bdf724 100644
--- a/openplanter-desktop/crates/op-core/src/builder.rs
+++ b/openplanter-desktop/crates/op-core/src/builder.rs
@@ -459,6 +459,17 @@ mod tests {
         assert_eq!(resolve_provider(&cfg).unwrap(), "anthropic");
     }
 
+    #[test]
+    fn test_resolve_provider_auto_ignores_mistral_transcription_key() {
+        let cfg = AgentConfig {
+            provider: "auto".into(),
+            model: "some-unknown-model".into(),
+            mistral_transcription_api_key: Some("mistral-test".into()),
+            ..Default::default()
+        };
+        assert_eq!(resolve_provider(&cfg).unwrap(), "anthropic");
+    }
+
     #[test]
     fn test_resolve_provider_anthropic_key_preferred_first() {
         let cfg = AgentConfig {
diff --git a/openplanter-desktop/crates/op-core/src/config.rs b/openplanter-desktop/crates/op-core/src/config.rs
index 96701b7d..3b8f8289 100644
--- a/openplanter-desktop/crates/op-core/src/config.rs
+++ b/openplanter-desktop/crates/op-core/src/config.rs
@@ -16,6 +16,12 @@ pub const ZAI_PAYGO_BASE_URL: &str = "https://api.z.ai/api/paas/v4";
 pub const ZAI_CODING_BASE_URL: &str = "https://api.z.ai/api/coding/paas/v4";
 pub const BRAVE_BASE_URL: &str = "https://api.search.brave.com/res/v1";
 pub const TAVILY_BASE_URL: &str = "https://api.tavily.com";
+pub const MISTRAL_TRANSCRIPTION_BASE_URL: &str = "https://api.mistral.ai";
+pub const MISTRAL_TRANSCRIPTION_DEFAULT_MODEL: &str = "voxtral-mini-latest";
+pub const MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS: i64 = 900;
+pub const MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS: f64 = 2.0;
+pub const MISTRAL_TRANSCRIPTION_MAX_CHUNKS: i64 = 48;
+pub const MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC: i64 = 180;
 
 /// Default model for each supported provider.
 pub static PROVIDER_DEFAULT_MODELS: LazyLock<HashMap<&'static str, &'static str>> =
@@ -195,6 +201,7 @@ pub struct AgentConfig {
     pub firecrawl_base_url: String,
     pub brave_base_url: String,
     pub tavily_base_url: String,
+    pub mistral_transcription_base_url: String,
 
     // API keys
     pub api_key: Option<String>,
@@ -210,6 +217,13 @@ pub struct AgentConfig {
     pub tavily_api_key: Option<String>,
     pub web_search_provider: String,
     pub voyage_api_key: Option<String>,
+    pub mistral_transcription_api_key: Option<String>,
+    pub mistral_transcription_model: String,
+    pub mistral_transcription_max_bytes: i64,
+    pub mistral_transcription_chunk_max_seconds: i64,
+    pub mistral_transcription_chunk_overlap_seconds: f64,
+    pub mistral_transcription_max_chunks: i64,
+    pub mistral_transcription_request_timeout_sec: i64,
 
     // Limits
     pub max_depth: i64,
@@ -261,6 +275,7 @@ impl Default for AgentConfig {
             firecrawl_base_url: "https://api.firecrawl.dev/v1".into(),
             brave_base_url: BRAVE_BASE_URL.into(),
             tavily_base_url: TAVILY_BASE_URL.into(),
+            mistral_transcription_base_url: MISTRAL_TRANSCRIPTION_BASE_URL.into(),
             api_key: Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.into()),
             openai_api_key: Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.into()),
             openai_oauth_token: None,
@@ -274,6 +289,14 @@ impl Default for AgentConfig {
             tavily_api_key: None,
             web_search_provider: "exa".into(),
             voyage_api_key: None,
+            mistral_transcription_api_key: None,
+            mistral_transcription_model: MISTRAL_TRANSCRIPTION_DEFAULT_MODEL.into(),
+            mistral_transcription_max_bytes: 100 * 1024 * 1024,
+            mistral_transcription_chunk_max_seconds: MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS,
+            mistral_transcription_chunk_overlap_seconds:
+                MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS,
+            mistral_transcription_max_chunks: MISTRAL_TRANSCRIPTION_MAX_CHUNKS,
+            mistral_transcription_request_timeout_sec: MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC,
             max_depth: 4,
             max_steps_per_call: 100,
             budget_extension_enabled: true,
@@ -336,6 +359,9 @@ impl AgentConfig {
 
         let voyage_api_key =
             env_opt("OPENPLANTER_VOYAGE_API_KEY").or_else(|| env_opt("VOYAGE_API_KEY"));
+        let mistral_transcription_api_key = env_opt("OPENPLANTER_MISTRAL_TRANSCRIPTION_API_KEY")
+            .or_else(|| env_opt("MISTRAL_TRANSCRIPTION_API_KEY"))
+            .or_else(|| env_opt("MISTRAL_API_KEY"));
 
         let openai_base_url = env_opt("OPENPLANTER_OPENAI_BASE_URL")
             .or_else(|| env_opt("OPENPLANTER_BASE_URL"))
@@ -400,6 +426,10 @@ impl AgentConfig {
             ),
             brave_base_url: env_or("OPENPLANTER_BRAVE_BASE_URL", BRAVE_BASE_URL),
             tavily_base_url: env_or("OPENPLANTER_TAVILY_BASE_URL", TAVILY_BASE_URL),
+            mistral_transcription_base_url: env_opt("OPENPLANTER_MISTRAL_TRANSCRIPTION_BASE_URL")
+                .or_else(|| env_opt("MISTRAL_TRANSCRIPTION_BASE_URL"))
+                .or_else(|| env_opt("MISTRAL_BASE_URL"))
+                .unwrap_or_else(|| MISTRAL_TRANSCRIPTION_BASE_URL.into()),
             openai_api_key,
             openai_oauth_token,
             anthropic_api_key,
@@ -412,6 +442,30 @@ impl AgentConfig {
             tavily_api_key,
             web_search_provider,
             voyage_api_key,
+            mistral_transcription_api_key,
+            mistral_transcription_model: env_opt("OPENPLANTER_MISTRAL_TRANSCRIPTION_MODEL")
+                .or_else(|| env_opt("MISTRAL_TRANSCRIPTION_MODEL"))
+                .unwrap_or_else(|| MISTRAL_TRANSCRIPTION_DEFAULT_MODEL.into()),
+            mistral_transcription_max_bytes: env_int(
+                "OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_BYTES",
+                100 * 1024 * 1024,
+            ),
+            mistral_transcription_chunk_max_seconds: env_int(
+                "OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS",
+                MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS,
+            ),
+            mistral_transcription_chunk_overlap_seconds: env_float(
+                "OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS",
+                MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS,
+            ),
+            mistral_transcription_max_chunks: env_int(
+                "OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_CHUNKS",
+                MISTRAL_TRANSCRIPTION_MAX_CHUNKS,
+            ),
+            mistral_transcription_request_timeout_sec: env_int(
+                "OPENPLANTER_MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC",
+                MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC,
+            ),
             max_depth: env_int("OPENPLANTER_MAX_DEPTH", 4),
             max_steps_per_call: env_int("OPENPLANTER_MAX_STEPS", 100),
             budget_extension_enabled: env_bool("OPENPLANTER_BUDGET_EXTENSION_ENABLED", true),
@@ -498,6 +552,31 @@ mod tests {
         assert!(cfg.brave_api_key.is_none());
         assert_eq!(cfg.tavily_base_url, TAVILY_BASE_URL);
         assert!(cfg.tavily_api_key.is_none());
+        assert_eq!(
+            cfg.mistral_transcription_base_url,
+            MISTRAL_TRANSCRIPTION_BASE_URL
+        );
+        assert!(cfg.mistral_transcription_api_key.is_none());
+        assert_eq!(
+            cfg.mistral_transcription_model,
+            MISTRAL_TRANSCRIPTION_DEFAULT_MODEL
+        );
+        assert_eq!(
+            cfg.mistral_transcription_chunk_max_seconds,
+            MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS
+        );
+        assert_eq!(
+            cfg.mistral_transcription_chunk_overlap_seconds,
+            MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS
+        );
+        assert_eq!(
+            cfg.mistral_transcription_max_chunks,
+            MISTRAL_TRANSCRIPTION_MAX_CHUNKS
+        );
+        assert_eq!(
+            cfg.mistral_transcription_request_timeout_sec,
+            MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC
+        );
         assert_eq!(cfg.rate_limit_max_retries, 12);
         assert_eq!(cfg.rate_limit_backoff_base_sec, 1.0);
         assert_eq!(cfg.rate_limit_backoff_max_sec, 60.0);
@@ -561,6 +640,19 @@ mod tests {
             "OPENPLANTER_TAVILY_API_KEY",
             "TAVILY_API_KEY",
             "OPENPLANTER_TAVILY_BASE_URL",
+            "OPENPLANTER_MISTRAL_TRANSCRIPTION_API_KEY",
+            "MISTRAL_TRANSCRIPTION_API_KEY",
+            "MISTRAL_API_KEY",
+            "OPENPLANTER_MISTRAL_TRANSCRIPTION_BASE_URL",
+            "MISTRAL_TRANSCRIPTION_BASE_URL",
+            "MISTRAL_BASE_URL",
+            "OPENPLANTER_MISTRAL_TRANSCRIPTION_MODEL",
+            "MISTRAL_TRANSCRIPTION_MODEL",
+            "OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_BYTES",
+            "OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS",
+            "OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS",
+            "OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_CHUNKS",
+            "OPENPLANTER_MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC",
             "OPENPLANTER_ZAI_PLAN",
             "OPENPLANTER_ZAI_BASE_URL",
             "OPENPLANTER_RATE_LIMIT_MAX_RETRIES",
@@ -601,8 +693,34 @@ mod tests {
         assert!(cfg.zai_api_key.is_none());
         assert!(cfg.brave_api_key.is_none());
         assert!(cfg.tavily_api_key.is_none());
+        assert!(cfg.mistral_transcription_api_key.is_none());
         assert_eq!(cfg.openai_base_url, FOUNDRY_OPENAI_BASE_URL);
         assert_eq!(cfg.anthropic_base_url, FOUNDRY_ANTHROPIC_BASE_URL);
+        assert_eq!(
+            cfg.mistral_transcription_base_url,
+            MISTRAL_TRANSCRIPTION_BASE_URL
+        );
+        assert_eq!(
+            cfg.mistral_transcription_model,
+            MISTRAL_TRANSCRIPTION_DEFAULT_MODEL
+        );
+        assert_eq!(cfg.mistral_transcription_max_bytes, 100 * 1024 * 1024);
+        assert_eq!(
+            cfg.mistral_transcription_chunk_max_seconds,
+            MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS
+        );
+        assert_eq!(
+            cfg.mistral_transcription_chunk_overlap_seconds,
+            MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS
+        );
+        assert_eq!(
+            cfg.mistral_transcription_max_chunks,
+            MISTRAL_TRANSCRIPTION_MAX_CHUNKS
+        );
+        assert_eq!(
+            cfg.mistral_transcription_request_timeout_sec,
+            MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC
+        );
         assert_eq!(cfg.web_search_provider, "exa");
         assert_eq!(cfg.rate_limit_max_retries, 12);
         assert_eq!(cfg.rate_limit_backoff_base_sec, 1.0);
@@ -624,7 +742,27 @@ mod tests {
             env::set_var("ZAI_API_KEY", "zai-test123");
             env::set_var("BRAVE_API_KEY", "brave-test123");
             env::set_var("TAVILY_API_KEY", "tavily-test123");
+            env::set_var("MISTRAL_API_KEY", "mistral-test123");
             env::set_var("OPENPLANTER_WEB_SEARCH_PROVIDER", "tavily");
+            env::set_var(
+                "OPENPLANTER_MISTRAL_TRANSCRIPTION_BASE_URL",
+                "https://mistral.example",
+            );
+            env::set_var(
+                "OPENPLANTER_MISTRAL_TRANSCRIPTION_MODEL",
+                "voxtral-mini-2508",
+            );
+            env::set_var("OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_BYTES", "2048");
+            env::set_var("OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS", "600");
+            env::set_var(
+                "OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS",
+                "3.5",
+            );
+            env::set_var("OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_CHUNKS", "24");
+            env::set_var(
+                "OPENPLANTER_MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC",
+                "240",
+            );
             env::set_var("OPENPLANTER_RATE_LIMIT_MAX_RETRIES", "5");
             env::set_var("OPENPLANTER_RATE_LIMIT_BACKOFF_BASE_SEC", "2.5");
             env::set_var("OPENPLANTER_RATE_LIMIT_BACKOFF_MAX_SEC", "30.0");
@@ -648,6 +786,20 @@ mod tests {
         assert_eq!(cfg.zai_api_key, Some("zai-test123".into()));
         assert_eq!(cfg.brave_api_key, Some("brave-test123".into()));
         assert_eq!(cfg.tavily_api_key, Some("tavily-test123".into()));
+        assert_eq!(
+            cfg.mistral_transcription_api_key,
+            Some("mistral-test123".into())
+        );
+        assert_eq!(
+            cfg.mistral_transcription_base_url,
+            "https://mistral.example"
+        );
+        assert_eq!(cfg.mistral_transcription_model, "voxtral-mini-2508");
+        assert_eq!(cfg.mistral_transcription_max_bytes, 2048);
+        assert_eq!(cfg.mistral_transcription_chunk_max_seconds, 600);
+        assert_eq!(cfg.mistral_transcription_chunk_overlap_seconds, 3.5);
+        assert_eq!(cfg.mistral_transcription_max_chunks, 24);
+        assert_eq!(cfg.mistral_transcription_request_timeout_sec, 240);
         assert_eq!(cfg.zai_plan, "coding");
         assert_eq!(cfg.zai_base_url, ZAI_CODING_BASE_URL);
         assert_eq!(cfg.zai_stream_max_retries, 7);
diff --git a/openplanter-desktop/crates/op-core/src/config_hydration.rs b/openplanter-desktop/crates/op-core/src/config_hydration.rs
index 90177523..e1e81c36 100644
--- a/openplanter-desktop/crates/op-core/src/config_hydration.rs
+++ b/openplanter-desktop/crates/op-core/src/config_hydration.rs
@@ -73,6 +73,7 @@ pub fn merge_credentials_into_config(
     merge!(brave_api_key);
     merge!(tavily_api_key);
     merge!(voyage_api_key);
+    merge!(mistral_transcription_api_key);
 }
 
 pub fn apply_settings_to_config(cfg: &mut AgentConfig, settings: &PersistentSettings) {
diff --git a/openplanter-desktop/crates/op-core/src/credentials.rs b/openplanter-desktop/crates/op-core/src/credentials.rs
index 2ca43579..9dccc7a2 100644
--- a/openplanter-desktop/crates/op-core/src/credentials.rs
+++ b/openplanter-desktop/crates/op-core/src/credentials.rs
@@ -23,6 +23,7 @@ pub struct CredentialBundle {
     pub brave_api_key: Option<String>,
     pub tavily_api_key: Option<String>,
     pub voyage_api_key: Option<String>,
+    pub mistral_transcription_api_key: Option<String>,
 }
 
 impl CredentialBundle {
@@ -40,6 +41,7 @@ impl CredentialBundle {
             &self.brave_api_key,
             &self.tavily_api_key,
             &self.voyage_api_key,
+            &self.mistral_transcription_api_key,
         ];
         keys.iter()
             .any(|k| k.as_ref().map(|v| !v.trim().is_empty()).unwrap_or(false))
@@ -65,6 +67,7 @@ impl CredentialBundle {
         fill!(brave_api_key);
         fill!(tavily_api_key);
         fill!(voyage_api_key);
+        fill!(mistral_transcription_api_key);
     }
 
     /// Serialize to JSON map, omitting `None` values.
@@ -88,6 +91,10 @@ impl CredentialBundle {
         add!(brave_api_key, "brave_api_key");
         add!(tavily_api_key, "tavily_api_key");
         add!(voyage_api_key, "voyage_api_key");
+        add!(
+            mistral_transcription_api_key,
+            "mistral_transcription_api_key"
+        );
         out
     }
 
@@ -111,6 +118,7 @@ impl CredentialBundle {
             brave_api_key: get_str(payload, "brave_api_key"),
             tavily_api_key: get_str(payload, "tavily_api_key"),
             voyage_api_key: get_str(payload, "voyage_api_key"),
+            mistral_transcription_api_key: get_str(payload, "mistral_transcription_api_key"),
         }
     }
 }
@@ -190,6 +198,12 @@ pub fn parse_env_file(path: &Path) -> CredentialBundle {
         brave_api_key: get_key(&env_map, "BRAVE_API_KEY", "OPENPLANTER_BRAVE_API_KEY"),
         tavily_api_key: get_key(&env_map, "TAVILY_API_KEY", "OPENPLANTER_TAVILY_API_KEY"),
         voyage_api_key: get_key(&env_map, "VOYAGE_API_KEY", "OPENPLANTER_VOYAGE_API_KEY"),
+        mistral_transcription_api_key: env_map
+            .get("OPENPLANTER_MISTRAL_TRANSCRIPTION_API_KEY")
+            .or_else(|| env_map.get("MISTRAL_TRANSCRIPTION_API_KEY"))
+            .or_else(|| env_map.get("MISTRAL_API_KEY"))
+            .map(|s| s.trim().to_string())
+            .filter(|s| !s.is_empty()),
     }
 }
 
@@ -215,6 +229,12 @@ pub fn credentials_from_env() -> CredentialBundle {
         brave_api_key: env_key("OPENPLANTER_BRAVE_API_KEY", "BRAVE_API_KEY"),
         tavily_api_key: env_key("OPENPLANTER_TAVILY_API_KEY", "TAVILY_API_KEY"),
         voyage_api_key: env_key("OPENPLANTER_VOYAGE_API_KEY", "VOYAGE_API_KEY"),
+        mistral_transcription_api_key: env::var("OPENPLANTER_MISTRAL_TRANSCRIPTION_API_KEY")
+            .ok()
+            .or_else(|| env::var("MISTRAL_TRANSCRIPTION_API_KEY").ok())
+            .or_else(|| env::var("MISTRAL_API_KEY").ok())
+            .map(|s| s.trim().to_string())
+            .filter(|s| !s.is_empty()),
     }
 }
 
@@ -370,6 +390,15 @@ mod tests {
         assert!(!bundle.has_any());
     }
 
+    #[test]
+    fn test_credential_bundle_has_any_with_mistral_transcription_key() {
+        let bundle = CredentialBundle {
+            mistral_transcription_api_key: Some("mistral-test".into()),
+            ..Default::default()
+        };
+        assert!(bundle.has_any());
+    }
+
     #[test]
     fn test_credential_bundle_merge_missing() {
         let mut a = CredentialBundle {
@@ -406,6 +435,7 @@ mod tests {
         assert_eq!(json.get("firecrawl_api_key").unwrap(), "fc-789");
         assert_eq!(json.get("brave_api_key").unwrap(), "brave-101");
         assert_eq!(json.get("tavily_api_key").unwrap(), "tavily-202");
+        assert!(!json.contains_key("mistral_transcription_api_key"));
     }
 
     #[test]
@@ -423,6 +453,7 @@ ZAI_API_KEY=zai-from-env
 OPENPLANTER_FIRECRAWL_API_KEY="firecrawl-quoted"
 BRAVE_API_KEY=brave-from-env
 OPENPLANTER_TAVILY_API_KEY=tavily-from-env
+MISTRAL_API_KEY=mistral-from-env
 UNRELATED_VAR=foo
 "#,
         )
@@ -436,6 +467,10 @@ UNRELATED_VAR=foo
         assert_eq!(bundle.firecrawl_api_key, Some("firecrawl-quoted".into()));
         assert_eq!(bundle.brave_api_key, Some("brave-from-env".into()));
         assert_eq!(bundle.tavily_api_key, Some("tavily-from-env".into()));
+        assert_eq!(
+            bundle.mistral_transcription_api_key,
+            Some("mistral-from-env".into())
+        );
         assert!(bundle.cerebras_api_key.is_none());
     }
 
@@ -454,7 +489,10 @@ UNRELATED_VAR=foo
             env_map.get("OPENPLANTER_WORKSPACE"),
             Some(&"workspace".to_string())
         );
-        assert_eq!(env_map.get("OPENAI_API_KEY"), Some(&"sk-from-env".to_string()));
+        assert_eq!(
+            env_map.get("OPENAI_API_KEY"),
+            Some(&"sk-from-env".to_string())
+        );
     }
 
     #[test]
@@ -479,6 +517,7 @@ UNRELATED_VAR=foo
             zai_api_key: Some("zai-test".into()),
             brave_api_key: Some("brave-test".into()),
             tavily_api_key: Some("tavily-test".into()),
+            mistral_transcription_api_key: Some("mistral-test".into()),
             ..Default::default()
         };
         store.save(&bundle).unwrap();
@@ -488,6 +527,10 @@ UNRELATED_VAR=foo
         assert_eq!(loaded.zai_api_key, Some("zai-test".into()));
         assert_eq!(loaded.brave_api_key, Some("brave-test".into()));
         assert_eq!(loaded.tavily_api_key, Some("tavily-test".into()));
+        assert_eq!(
+            loaded.mistral_transcription_api_key,
+            Some("mistral-test".into())
+        );
     }
 
     #[test]
diff --git a/openplanter-desktop/crates/op-core/src/engine/mod.rs b/openplanter-desktop/crates/op-core/src/engine/mod.rs
index ea3b1517..4b6faa18 100644
--- a/openplanter-desktop/crates/op-core/src/engine/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/mod.rs
@@ -481,6 +481,7 @@ fn is_recon_tool(name: &str) -> bool {
             | "fetch_url"
             | "read_file"
             | "read_image"
+            | "audio_transcribe"
             | "list_artifacts"
             | "read_artifact"
     )
diff --git a/openplanter-desktop/crates/op-core/src/tools/audio.rs b/openplanter-desktop/crates/op-core/src/tools/audio.rs
new file mode 100644
index 00000000..75619c01
--- /dev/null
+++ b/openplanter-desktop/crates/op-core/src/tools/audio.rs
@@ -0,0 +1,1419 @@
+use std::collections::HashSet;
+use std::path::{Path, PathBuf};
+use std::process::Stdio;
+use std::time::Duration;
+
+use reqwest::multipart::{Form, Part};
+use serde_json::{Map, Value, json};
+use tokio::process::Command;
+use tokio::time::timeout;
+use uuid::Uuid;
+
+use super::{ToolResult, filesystem};
+
+const AUDIO_EXTENSIONS: &[&str] = &[
+    ".aac", ".flac", ".m4a", ".mp3", ".mpeg", ".mpga", ".oga", ".ogg", ".opus", ".wav",
+];
+const VIDEO_EXTENSIONS: &[&str] = &[".avi", ".m4v", ".mkv", ".mov", ".mp4", ".webm"];
+const TIMESTAMP_GRANULARITIES: &[&str] = &["segment", "word"];
+const CHUNKING_MODES: &[&str] = &["auto", "force", "off"];
+const AUDIO_CHUNK_TARGET_FILL_RATIO: f64 = 0.85;
+const AUDIO_CHUNK_BYTES_PER_SECOND: f64 = 32_000.0;
+const AUDIO_MIN_CHUNK_SECONDS: f64 = 30.0;
+const AUDIO_MAX_CHUNK_SECONDS: f64 = 1800.0;
+const AUDIO_MAX_CHUNK_OVERLAP_SECONDS: f64 = 15.0;
+const AUDIO_MAX_CHUNKS: i64 = 200;
+const SPEAKER_FIELDS: &[&str] = &["speaker", "speaker_id", "speaker_label"];
+
+#[derive(Debug, Clone)]
+struct ChunkPlan {
+    index: usize,
+    start_sec: f64,
+    end_sec: f64,
+    duration_sec: f64,
+    leading_overlap_sec: f64,
+}
+
+struct TempAudioDir {
+    path: PathBuf,
+}
+
+impl TempAudioDir {
+    fn new() -> Result<Self, String> {
+        let path = std::env::temp_dir().join(format!("openplanter-audio-{}", Uuid::new_v4()));
+        std::fs::create_dir_all(&path)
+            .map_err(|error| format!("Failed to create temp audio directory: {error}"))?;
+        Ok(Self { path })
+    }
+}
+
+impl Drop for TempAudioDir {
+    fn drop(&mut self) {
+        let _ = std::fs::remove_dir_all(&self.path);
+    }
+}
+
+fn transcription_endpoint(base_url: &str) -> String {
+    let trimmed = base_url.trim().trim_end_matches('/');
+    if trimmed.ends_with("/v1") {
+        format!("{trimmed}/audio/transcriptions")
+    } else {
+        format!("{trimmed}/v1/audio/transcriptions")
+    }
+}
+
+fn audio_media_type(path: &Path) -> &'static str {
+    match path
+        .extension()
+        .and_then(|value| value.to_str())
+        .map(|value| value.to_ascii_lowercase())
+        .as_deref()
+    {
+        Some("aac") => "audio/aac",
+        Some("flac") => "audio/flac",
+        Some("m4a") => "audio/mp4",
+        Some("mp3") | Some("mpga") => "audio/mpeg",
+        Some("mpeg") => "audio/mpeg",
+        Some("oga") | Some("ogg") | Some("opus") => "audio/ogg",
+        Some("wav") => "audio/wav",
+        _ => "application/octet-stream",
+    }
+}
+
+fn rel_path(root: &Path, path: &Path) -> String {
+    let canon_root = std::fs::canonicalize(root).unwrap_or_else(|_| root.to_path_buf());
+    path.strip_prefix(&canon_root)
+        .unwrap_or(path)
+        .to_string_lossy()
+        .replace('\\', "/")
+}
+
+fn is_video_extension(ext: &str) -> bool {
+    VIDEO_EXTENSIONS.iter().any(|value| *value == ext)
+}
+
+fn is_supported_extension(ext: &str) -> bool {
+    AUDIO_EXTENSIONS.iter().any(|value| *value == ext) || is_video_extension(ext)
+}
+
+fn json_length(payload: &Value) -> usize {
+    serde_json::to_string_pretty(payload)
+        .unwrap_or_else(|_| payload.to_string())
+        .len()
+}
+
+fn build_options(
+    diarize: Option<bool>,
+    timestamp_granularities: Option<&[String]>,
+    context_bias: Option<&[String]>,
+    language: Option<&str>,
+    temperature: Option<f64>,
+    chunking: &str,
+    chunk_max_seconds: Option<i64>,
+    chunk_overlap_seconds: Option<f64>,
+    max_chunks: Option<i64>,
+    continue_on_chunk_error: Option<bool>,
+) -> Value {
+    let mut options = Map::new();
+    options.insert("chunking".into(), Value::String(chunking.to_string()));
+    if let Some(value) = diarize {
+        options.insert("diarize".into(), Value::Bool(value));
+    }
+    if let Some(values) = timestamp_granularities.filter(|values| !values.is_empty()) {
+        options.insert(
+            "timestamp_granularities".into(),
+            Value::Array(values.iter().cloned().map(Value::String).collect()),
+        );
+    }
+    if let Some(values) = context_bias.filter(|values| !values.is_empty()) {
+        options.insert(
+            "context_bias".into(),
+            Value::Array(values.iter().cloned().map(Value::String).collect()),
+        );
+    }
+    if let Some(value) = language.filter(|value| !value.trim().is_empty()) {
+        options.insert("language".into(), Value::String(value.to_string()));
+    }
+    if let Some(value) = temperature {
+        if let Some(number) = serde_json::Number::from_f64(value) {
+            options.insert("temperature".into(), Value::Number(number));
+        }
+    }
+    if let Some(value) = chunk_max_seconds {
+        options.insert("chunk_max_seconds".into(), Value::Number(value.into()));
+    }
+    if let Some(value) = chunk_overlap_seconds {
+        if let Some(number) = serde_json::Number::from_f64(value) {
+            options.insert("chunk_overlap_seconds".into(), Value::Number(number));
+        }
+    }
+    if let Some(value) = max_chunks {
+        options.insert("max_chunks".into(), Value::Number(value.into()));
+    }
+    if let Some(value) = continue_on_chunk_error {
+        options.insert("continue_on_chunk_error".into(), Value::Bool(value));
+    }
+    Value::Object(options)
+}
+
+fn normalize_audio_token(token: &str) -> String {
+    token
+        .chars()
+        .filter(|ch| ch.is_ascii_alphanumeric())
+        .flat_map(char::to_lowercase)
+        .collect()
+}
+
+fn dedupe_audio_overlap_text(existing: &str, incoming: &str) -> String {
+    if existing.trim().is_empty() {
+        return incoming.trim().to_string();
+    }
+    let current_tokens: Vec<&str> = incoming.split_whitespace().collect();
+    if current_tokens.is_empty() {
+        return String::new();
+    }
+    let previous_tokens: Vec<&str> = existing.split_whitespace().collect();
+    let max_window = previous_tokens.len().min(current_tokens.len()).min(80);
+    if max_window < 5 {
+        return incoming.trim().to_string();
+    }
+    let previous_norm: Vec<String> = previous_tokens[previous_tokens.len() - max_window..]
+        .iter()
+        .map(|token| normalize_audio_token(token))
+        .collect();
+    let current_norm: Vec<String> = current_tokens[..max_window]
+        .iter()
+        .map(|token| normalize_audio_token(token))
+        .collect();
+    for match_len in (5..=max_window).rev() {
+        if previous_norm[max_window - match_len..] == current_norm[..match_len] {
+            return current_tokens[match_len..].join(" ").trim().to_string();
+        }
+    }
+    incoming.trim().to_string()
+}
+
+fn which_binary(name: &str) -> bool {
+    std::env::var_os("PATH")
+        .map(|paths| {
+            std::env::split_paths(&paths).any(|path| {
+                let candidate = path.join(name);
+                let executable = candidate.is_file();
+                if executable {
+                    return true;
+                }
+                #[cfg(windows)]
+                {
+                    return path.join(format!("{name}.exe")).is_file();
+                }
+                #[cfg(not(windows))]
+                {
+                    false
+                }
+            })
+        })
+        .unwrap_or(false)
+}
+
+fn ensure_media_tools() -> Result<(), String> {
+    let missing: Vec<&str> = ["ffmpeg", "ffprobe"]
+        .into_iter()
+        .filter(|name| !which_binary(name))
+        .collect();
+    if missing.is_empty() {
+        Ok(())
+    } else {
+        Err(format!(
+            "Long-form transcription requires {}. Install ffmpeg/ffprobe and retry.",
+            missing.join(", ")
+        ))
+    }
+}
+
+async fn run_media_command(
+    program: &str,
+    args: &[String],
+    timeout_sec: u64,
+) -> Result<String, String> {
+    let mut command = Command::new(program);
+    command
+        .args(args)
+        .stdout(Stdio::piped())
+        .stderr(Stdio::piped())
+        .stdin(Stdio::null());
+    let output = timeout(Duration::from_secs(timeout_sec), command.output())
+        .await
+        .map_err(|_| format!("{program} timed out after {timeout_sec}s"))?
+        .map_err(|error| format!("Media tooling not available: {program}: {error}"))?;
+    if !output.status.success() {
+        let stderr = String::from_utf8_lossy(&output.stderr).trim().to_string();
+        let stdout = String::from_utf8_lossy(&output.stdout).trim().to_string();
+        return Err(format!(
+            "{program} failed: {}",
+            if !stderr.is_empty() {
+                stderr
+            } else if !stdout.is_empty() {
+                stdout
+            } else {
+                "unknown error".to_string()
+            }
+        ));
+    }
+    Ok(String::from_utf8_lossy(&output.stdout).to_string())
+}
+
+async fn probe_media_duration(path: &Path, timeout_sec: u64) -> Result<f64, String> {
+    let stdout = run_media_command(
+        "ffprobe",
+        &[
+            "-v".to_string(),
+            "error".to_string(),
+            "-print_format".to_string(),
+            "json".to_string(),
+            "-show_format".to_string(),
+            path.display().to_string(),
+        ],
+        timeout_sec,
+    )
+    .await?;
+    let parsed: Value = serde_json::from_str(&stdout)
+        .map_err(|error| format!("ffprobe returned invalid JSON: {error}"))?;
+    let duration_value = parsed
+        .get("format")
+        .and_then(Value::as_object)
+        .and_then(|format| format.get("duration"))
+        .cloned()
+        .ok_or_else(|| {
+            format!(
+                "ffprobe did not return a valid duration for {}",
+                path.display()
+            )
+        })?;
+    let parsed_duration = match duration_value {
+        Value::String(value) => value
+            .parse::<f64>()
+            .map_err(|error| format!("ffprobe did not return a valid duration: {error}"))?,
+        Value::Number(value) => value
+            .as_f64()
+            .ok_or_else(|| "ffprobe did not return a valid numeric duration".to_string())?,
+        _ => {
+            return Err(format!(
+                "ffprobe did not return a valid duration for {}",
+                path.display()
+            ));
+        }
+    };
+    if parsed_duration <= 0.0 {
+        return Err(format!(
+            "ffprobe reported non-positive duration for {}",
+            path.display()
+        ));
+    }
+    Ok(parsed_duration)
+}
+
+async fn extract_audio_source(
+    source: &Path,
+    output: &Path,
+    timeout_sec: u64,
+) -> Result<(), String> {
+    run_media_command(
+        "ffmpeg",
+        &[
+            "-nostdin".to_string(),
+            "-y".to_string(),
+            "-i".to_string(),
+            source.display().to_string(),
+            "-vn".to_string(),
+            "-ac".to_string(),
+            "1".to_string(),
+            "-ar".to_string(),
+            "16000".to_string(),
+            "-c:a".to_string(),
+            "pcm_s16le".to_string(),
+            output.display().to_string(),
+        ],
+        timeout_sec,
+    )
+    .await
+    .map(|_| ())
+}
+
+async fn extract_audio_chunk(
+    source: &Path,
+    output: &Path,
+    start_sec: f64,
+    duration_sec: f64,
+    timeout_sec: u64,
+) -> Result<(), String> {
+    run_media_command(
+        "ffmpeg",
+        &[
+            "-nostdin".to_string(),
+            "-y".to_string(),
+            "-ss".to_string(),
+            format!("{start_sec:.3}"),
+            "-i".to_string(),
+            source.display().to_string(),
+            "-t".to_string(),
+            format!("{duration_sec:.3}"),
+            "-vn".to_string(),
+            "-ac".to_string(),
+            "1".to_string(),
+            "-ar".to_string(),
+            "16000".to_string(),
+            "-c:a".to_string(),
+            "pcm_s16le".to_string(),
+            output.display().to_string(),
+        ],
+        timeout_sec,
+    )
+    .await
+    .map(|_| ())
+}
+
+fn audio_chunk_seconds_budget(max_bytes: usize, requested_seconds: f64) -> Result<f64, String> {
+    let safe_seconds =
+        (max_bytes as f64 * AUDIO_CHUNK_TARGET_FILL_RATIO) / AUDIO_CHUNK_BYTES_PER_SECOND;
+    if safe_seconds <= 0.0 {
+        return Err("Mistral transcription max-bytes budget is too small to chunk audio".into());
+    }
+    Ok(requested_seconds.min(safe_seconds))
+}
+
+fn plan_audio_chunks(
+    duration_sec: f64,
+    chunk_seconds: f64,
+    overlap_seconds: f64,
+    max_chunks: i64,
+) -> Result<Vec<ChunkPlan>, String> {
+    if duration_sec <= 0.0 {
+        return Err("Cannot chunk media with non-positive duration".into());
+    }
+    let chunk_seconds = chunk_seconds.max(1.0);
+    let overlap_seconds = overlap_seconds
+        .max(0.0)
+        .min((chunk_seconds - 0.001).max(0.0));
+    let mut chunks = Vec::new();
+    let mut start = 0.0;
+    while start < duration_sec - 1e-6 {
+        let end = (start + chunk_seconds).min(duration_sec);
+        let index = chunks.len();
+        chunks.push(ChunkPlan {
+            index,
+            start_sec: (start * 1000.0).round() / 1000.0,
+            end_sec: (end * 1000.0).round() / 1000.0,
+            duration_sec: ((end - start) * 1000.0).round() / 1000.0,
+            leading_overlap_sec: if index == 0 {
+                0.0
+            } else {
+                (overlap_seconds * 1000.0).round() / 1000.0
+            },
+        });
+        if chunks.len() as i64 > max_chunks {
+            return Err(format!(
+                "Chunk plan would create {} chunks (max {max_chunks})",
+                chunks.len()
+            ));
+        }
+        if end >= duration_sec - 1e-6 {
+            break;
+        }
+        let mut next_start = end - overlap_seconds;
+        if next_start <= start + 1e-6 {
+            next_start = end;
+        }
+        start = next_start;
+    }
+    Ok(chunks)
+}
+
+fn entry_time_bounds(entry: &Map<String, Value>) -> Option<(f64, f64)> {
+    if let (Some(start), Some(end)) = (
+        entry.get("start").and_then(Value::as_f64),
+        entry.get("end").and_then(Value::as_f64),
+    ) {
+        return Some((start, end));
+    }
+    let timestamps = entry.get("timestamps")?.as_array()?;
+    if timestamps.len() < 2 {
+        return None;
+    }
+    Some((timestamps[0].as_f64()?, timestamps[1].as_f64()?))
+}
+
+fn set_entry_time_bounds(entry: &mut Map<String, Value>, start: f64, end: f64) {
+    if entry.contains_key("start") || entry.contains_key("end") {
+        entry.insert("start".into(), json!(((start * 1000.0).round() / 1000.0)));
+        entry.insert("end".into(), json!(((end * 1000.0).round() / 1000.0)));
+    } else if let Some(timestamps) = entry.get_mut("timestamps").and_then(Value::as_array_mut) {
+        while timestamps.len() < 2 {
+            timestamps.push(json!(0.0));
+        }
+        timestamps[0] = json!(((start * 1000.0).round() / 1000.0));
+        timestamps[1] = json!(((end * 1000.0).round() / 1000.0));
+    }
+}
+
+fn prefix_audio_speakers(value: &Value, prefix: &str) -> Value {
+    match value {
+        Value::Array(items) => Value::Array(
+            items
+                .iter()
+                .map(|item| prefix_audio_speakers(item, prefix))
+                .collect(),
+        ),
+        Value::Object(object) => Value::Object(
+            object
+                .iter()
+                .map(|(key, item)| {
+                    let value = if SPEAKER_FIELDS.contains(&key.as_str()) {
+                        item.as_str()
+                            .map(|speaker| Value::String(format!("{prefix}{speaker}")))
+                            .unwrap_or_else(|| prefix_audio_speakers(item, prefix))
+                    } else {
+                        prefix_audio_speakers(item, prefix)
+                    };
+                    (key.clone(), value)
+                })
+                .collect(),
+        ),
+        _ => value.clone(),
+    }
+}
+
+fn shift_audio_items(
+    items: &[Value],
+    chunk_start_sec: f64,
+    leading_overlap_sec: f64,
+    speaker_prefix: &str,
+) -> Vec<Value> {
+    let mut shifted = Vec::new();
+    for item in items {
+        let mut copied = prefix_audio_speakers(item, speaker_prefix);
+        if let Some(object) = copied.as_object_mut() {
+            if let Some((mut start, end)) = entry_time_bounds(object) {
+                if end <= leading_overlap_sec + 1e-6 {
+                    continue;
+                }
+                if start < leading_overlap_sec {
+                    start = leading_overlap_sec;
+                }
+                set_entry_time_bounds(object, start + chunk_start_sec, end + chunk_start_sec);
+            }
+        }
+        shifted.push(copied);
+    }
+    shifted
+}
+
+fn collect_chunk_metadata(
+    parsed: &Value,
+    chunk_start_sec: f64,
+    leading_overlap_sec: f64,
+    speaker_prefix: &str,
+) -> Map<String, Value> {
+    let mut aggregated = Map::new();
+    if let Some(items) = parsed.get("segments").and_then(Value::as_array) {
+        aggregated.insert(
+            "segments".into(),
+            Value::Array(shift_audio_items(
+                items,
+                chunk_start_sec,
+                leading_overlap_sec,
+                speaker_prefix,
+            )),
+        );
+    } else if let Some(items) = parsed.get("chunks").and_then(Value::as_array) {
+        aggregated.insert(
+            "segments".into(),
+            Value::Array(shift_audio_items(
+                items,
+                chunk_start_sec,
+                leading_overlap_sec,
+                speaker_prefix,
+            )),
+        );
+    }
+    if let Some(items) = parsed.get("words").and_then(Value::as_array) {
+        aggregated.insert(
+            "words".into(),
+            Value::Array(shift_audio_items(
+                items,
+                chunk_start_sec,
+                leading_overlap_sec,
+                speaker_prefix,
+            )),
+        );
+    }
+    if let Some(items) = parsed.get("diarization").and_then(Value::as_array) {
+        aggregated.insert(
+            "diarization".into(),
+            Value::Array(shift_audio_items(
+                items,
+                chunk_start_sec,
+                leading_overlap_sec,
+                speaker_prefix,
+            )),
+        );
+    }
+    aggregated
+}
+
+fn truncate_audio_text(payload: &mut Value, max_chars: usize) {
+    let original = payload
+        .get("text")
+        .and_then(Value::as_str)
+        .unwrap_or_default()
+        .to_string();
+    if original.is_empty() {
+        return;
+    }
+    let mut base = payload.clone();
+    base["text"] = Value::String(String::new());
+    if json_length(&base) > max_chars {
+        payload["text"] = Value::String(String::new());
+        payload["truncation"]["text_truncated_chars"] = json!(original.len());
+        return;
+    }
+
+    let mut low = 0usize;
+    let mut high = original.len();
+    while low < high {
+        let mid = (low + high + 1) / 2;
+        let idx = original.floor_char_boundary(mid);
+        base["text"] = Value::String(original[..idx].to_string());
+        if json_length(&base) <= max_chars {
+            low = idx;
+        } else if idx == 0 {
+            high = 0;
+        } else {
+            high = idx - 1;
+        }
+    }
+    let final_idx = original.floor_char_boundary(low);
+    payload["text"] = Value::String(original[..final_idx].to_string());
+    let omitted = original.len().saturating_sub(final_idx);
+    if omitted > 0 {
+        payload["truncation"]["text_truncated_chars"] = json!(omitted);
+    }
+}
+
+fn serialize_audio_envelope(mut payload: Value, max_chars: usize) -> String {
+    if payload.get("truncation").is_none() {
+        payload["truncation"] = json!({"applied": false});
+    }
+    if json_length(&payload) <= max_chars {
+        return serde_json::to_string_pretty(&payload).unwrap_or_else(|_| payload.to_string());
+    }
+
+    payload["truncation"]["applied"] = Value::Bool(true);
+    let mode = payload
+        .get("mode")
+        .and_then(Value::as_str)
+        .unwrap_or("")
+        .to_string();
+
+    let mut omitted_response_fields = Map::new();
+    let mut removal_order = vec!["words", "diarization", "segments"];
+    if mode != "chunked" {
+        removal_order.push("chunks");
+    }
+    for key in removal_order {
+        let removed = payload
+            .get_mut("response")
+            .and_then(Value::as_object_mut)
+            .and_then(|response| response.remove(key));
+        if let Some(value) = removed {
+            if let Some(items) = value.as_array() {
+                if !items.is_empty() {
+                    omitted_response_fields.insert(key.into(), json!(items.len()));
+                }
+            }
+            if json_length(&payload) <= max_chars {
+                break;
+            }
+        }
+    }
+    if !omitted_response_fields.is_empty() {
+        payload["truncation"]["omitted_response_fields"] = Value::Object(omitted_response_fields);
+    }
+
+    if mode == "chunked" && json_length(&payload) > max_chars {
+        let omitted = payload
+            .get_mut("response")
+            .and_then(Value::as_object_mut)
+            .and_then(|response| response.get_mut("chunks"))
+            .and_then(Value::as_array_mut)
+            .map(|chunks| {
+                let keep = chunks.len().min(12);
+                let omitted = chunks.len().saturating_sub(keep);
+                if omitted > 0 {
+                    chunks.truncate(keep);
+                }
+                omitted
+            })
+            .unwrap_or(0);
+        if omitted > 0 {
+            payload["truncation"]["omitted_chunk_statuses"] = json!(omitted);
+        }
+    }
+
+    if json_length(&payload) > max_chars {
+        truncate_audio_text(&mut payload, max_chars);
+    }
+
+    if json_length(&payload) > max_chars {
+        while json_length(&payload) > max_chars {
+            let popped = payload
+                .get_mut("response")
+                .and_then(Value::as_object_mut)
+                .and_then(|response| response.get_mut("chunks"))
+                .and_then(Value::as_array_mut)
+                .map(|chunks| {
+                    if chunks.len() > 3 {
+                        chunks.pop();
+                        true
+                    } else {
+                        false
+                    }
+                })
+                .unwrap_or(false);
+            if !popped {
+                break;
+            }
+            let current = payload["truncation"]
+                .get("omitted_chunk_statuses")
+                .and_then(Value::as_u64)
+                .unwrap_or(0);
+            payload["truncation"]["omitted_chunk_statuses"] = json!(current + 1);
+        }
+    }
+
+    if json_length(&payload) > max_chars {
+        if let Some(options) = payload.get_mut("options").and_then(Value::as_object_mut) {
+            if let Some(context_bias) = options.remove("context_bias") {
+                if let Some(items) = context_bias.as_array() {
+                    payload["truncation"]["omitted_context_bias_phrases"] = json!(items.len());
+                }
+            }
+        }
+    }
+
+    serde_json::to_string_pretty(&payload).unwrap_or_else(|_| payload.to_string())
+}
+
+async fn mistral_transcription_request(
+    api_key: &str,
+    base_url: &str,
+    resolved: &Path,
+    model: &str,
+    diarize: Option<bool>,
+    timestamp_granularities: Option<&[String]>,
+    context_bias: Option<&[String]>,
+    language: Option<&str>,
+    temperature: Option<f64>,
+    max_bytes: usize,
+    request_timeout_sec: u64,
+) -> Result<Value, String> {
+    let metadata = std::fs::metadata(resolved).map_err(|error| {
+        format!(
+            "Failed to inspect audio file {}: {error}",
+            resolved.display()
+        )
+    })?;
+    if metadata.len() as usize > max_bytes {
+        return Err(format!(
+            "Audio file too large: {} bytes (max {} bytes)",
+            metadata.len(),
+            max_bytes
+        ));
+    }
+    let bytes = std::fs::read(resolved)
+        .map_err(|error| format!("Failed to read audio file {}: {error}", resolved.display()))?;
+    let filename = resolved
+        .file_name()
+        .and_then(|value| value.to_str())
+        .unwrap_or("audio");
+    let mut form = Form::new()
+        .text("model", model.to_string())
+        .text("stream", "false")
+        .part(
+            "file",
+            Part::bytes(bytes)
+                .file_name(filename.to_string())
+                .mime_str(audio_media_type(resolved))
+                .expect("audio_media_type always returns a valid MIME type"),
+        );
+    if let Some(value) = diarize {
+        form = form.text("diarize", if value { "true" } else { "false" });
+    }
+    if let Some(value) = language.filter(|value| !value.trim().is_empty()) {
+        form = form.text("language", value.to_string());
+    }
+    if let Some(value) = temperature {
+        form = form.text("temperature", value.to_string());
+    }
+    if let Some(values) = timestamp_granularities {
+        for value in values {
+            form = form.text("timestamp_granularities", value.clone());
+        }
+    }
+    if let Some(values) = context_bias {
+        for value in values {
+            form = form.text("context_bias", value.clone());
+        }
+    }
+
+    let client = reqwest::Client::new();
+    let response = client
+        .post(transcription_endpoint(base_url))
+        .bearer_auth(api_key)
+        .timeout(Duration::from_secs(request_timeout_sec))
+        .multipart(form)
+        .send()
+        .await
+        .map_err(|error| format!("Mistral transcription request failed: {error}"))?;
+    let status = response.status();
+    let raw = response
+        .text()
+        .await
+        .map_err(|error| format!("Mistral transcription returned unreadable body: {error}"))?;
+    if !status.is_success() {
+        return Err(format!(
+            "Mistral transcription HTTP {}: {}",
+            status.as_u16(),
+            raw
+        ));
+    }
+    serde_json::from_str(&raw).map_err(|error| {
+        format!(
+            "Mistral transcription returned non-JSON payload: {error}: {}",
+            filesystem::clip(&raw, 500)
+        )
+    })
+}
+
+#[allow(clippy::too_many_arguments)]
+pub async fn audio_transcribe(
+    root: &Path,
+    api_key: Option<&str>,
+    base_url: &str,
+    default_model: &str,
+    max_bytes: usize,
+    default_chunk_max_seconds: i64,
+    default_chunk_overlap_seconds: f64,
+    default_max_chunks: i64,
+    path: &str,
+    diarize: Option<bool>,
+    timestamp_granularities: Option<&[String]>,
+    context_bias: Option<&[String]>,
+    language: Option<&str>,
+    model: Option<&str>,
+    temperature: Option<f64>,
+    chunking: Option<&str>,
+    chunk_max_seconds: Option<i64>,
+    chunk_overlap_seconds: Option<f64>,
+    max_chunks: Option<i64>,
+    continue_on_chunk_error: Option<bool>,
+    max_chars: usize,
+    command_timeout_sec: u64,
+    request_timeout_sec: u64,
+    files_read: &mut HashSet<PathBuf>,
+) -> ToolResult {
+    let resolved = match filesystem::resolve_path(root, path) {
+        Ok(value) => value,
+        Err(error) => return ToolResult::error(error),
+    };
+    if !resolved.exists() {
+        return ToolResult::error(format!("File not found: {path}"));
+    }
+    if resolved.is_dir() {
+        return ToolResult::error(format!("Path is a directory, not a file: {path}"));
+    }
+    let ext = resolved
+        .extension()
+        .and_then(|value| value.to_str())
+        .map(|value| format!(".{}", value.to_ascii_lowercase()))
+        .unwrap_or_default();
+    if !is_supported_extension(&ext) {
+        let mut supported: Vec<&str> = AUDIO_EXTENSIONS.iter().copied().collect();
+        supported.extend(VIDEO_EXTENSIONS.iter().copied());
+        supported.sort_unstable();
+        return ToolResult::error(format!(
+            "Unsupported audio format: {}. Supported: {}",
+            if ext.is_empty() { "(none)" } else { &ext },
+            supported.join(", ")
+        ));
+    }
+    if language.is_some() && timestamp_granularities.is_some() {
+        return ToolResult::error(
+            "language cannot be combined with timestamp_granularities for Mistral offline transcription"
+                .into(),
+        );
+    }
+    let chunk_mode = chunking.unwrap_or("auto").trim().to_ascii_lowercase();
+    if !CHUNKING_MODES.iter().any(|value| *value == chunk_mode) {
+        return ToolResult::error("chunking must be one of auto, off, or force".into());
+    }
+    if chunk_max_seconds
+        .map(|value| {
+            !(AUDIO_MIN_CHUNK_SECONDS as i64..=AUDIO_MAX_CHUNK_SECONDS as i64).contains(&value)
+        })
+        .unwrap_or(false)
+    {
+        return ToolResult::error(format!(
+            "chunk_max_seconds must be between {} and {}",
+            AUDIO_MIN_CHUNK_SECONDS as i64, AUDIO_MAX_CHUNK_SECONDS as i64
+        ));
+    }
+    if chunk_overlap_seconds
+        .map(|value| !(0.0..=AUDIO_MAX_CHUNK_OVERLAP_SECONDS).contains(&value))
+        .unwrap_or(false)
+    {
+        return ToolResult::error(format!(
+            "chunk_overlap_seconds must be between 0 and {}",
+            AUDIO_MAX_CHUNK_OVERLAP_SECONDS as i64
+        ));
+    }
+    if max_chunks
+        .map(|value| !(1..=AUDIO_MAX_CHUNKS).contains(&value))
+        .unwrap_or(false)
+    {
+        return ToolResult::error(format!(
+            "max_chunks must be between 1 and {AUDIO_MAX_CHUNKS}"
+        ));
+    }
+
+    let api_key = match api_key {
+        Some(value) if !value.trim().is_empty() => value,
+        _ => return ToolResult::error("Mistral transcription API key not configured".into()),
+    };
+    let chosen_model = model.unwrap_or(default_model).trim();
+    if chosen_model.is_empty() {
+        return ToolResult::error("No Mistral transcription model configured".into());
+    }
+    let normalized_timestamps = timestamp_granularities.map(|values| {
+        values
+            .iter()
+            .map(|value| value.trim().to_ascii_lowercase())
+            .filter(|value| !value.is_empty())
+            .collect::<Vec<_>>()
+    });
+    if normalized_timestamps.as_ref().is_some_and(|values| {
+        values
+            .iter()
+            .any(|value| !TIMESTAMP_GRANULARITIES.contains(&value.as_str()))
+    }) {
+        return ToolResult::error(format!(
+            "timestamp_granularities must be drawn from {}",
+            TIMESTAMP_GRANULARITIES.join(", ")
+        ));
+    }
+    let normalized_bias = context_bias.map(|values| {
+        values
+            .iter()
+            .map(|value| value.trim().to_string())
+            .filter(|value| !value.is_empty())
+            .collect::<Vec<_>>()
+    });
+    if normalized_bias
+        .as_ref()
+        .is_some_and(|values| values.len() > 100)
+    {
+        return ToolResult::error("context_bias supports at most 100 phrases".into());
+    }
+
+    let options = build_options(
+        diarize,
+        normalized_timestamps.as_deref(),
+        normalized_bias.as_deref(),
+        language,
+        temperature,
+        &chunk_mode,
+        chunk_max_seconds,
+        chunk_overlap_seconds,
+        max_chunks,
+        continue_on_chunk_error,
+    );
+
+    let temp_dir = match TempAudioDir::new() {
+        Ok(value) => value,
+        Err(error) => return ToolResult::error(error),
+    };
+    let mut upload_source = resolved.clone();
+    if is_video_extension(&ext) {
+        if let Err(error) = ensure_media_tools() {
+            return ToolResult::error(error);
+        }
+        let extracted = temp_dir.path.join("video-source.wav");
+        if let Err(error) = extract_audio_source(&resolved, &extracted, command_timeout_sec).await {
+            return ToolResult::error(error);
+        }
+        upload_source = extracted;
+    }
+
+    let upload_size = match std::fs::metadata(&upload_source) {
+        Ok(value) => value.len() as usize,
+        Err(error) => {
+            return ToolResult::error(format!(
+                "Failed to inspect audio file {}: {error}",
+                upload_source.display()
+            ));
+        }
+    };
+    files_read.insert(resolved.clone());
+
+    let chunk_requested =
+        chunk_mode == "force" || (chunk_mode == "auto" && upload_size > max_bytes);
+
+    if !chunk_requested {
+        let parsed = match mistral_transcription_request(
+            api_key,
+            base_url,
+            &upload_source,
+            chosen_model,
+            diarize,
+            normalized_timestamps.as_deref(),
+            normalized_bias.as_deref(),
+            language,
+            temperature,
+            max_bytes,
+            request_timeout_sec,
+        )
+        .await
+        {
+            Ok(value) => value,
+            Err(error) => return ToolResult::error(error),
+        };
+        let envelope = json!({
+            "provider": "mistral",
+            "service": "transcription",
+            "path": rel_path(root, &resolved),
+            "model": chosen_model,
+            "options": options,
+            "text": parsed.get("text").and_then(Value::as_str).unwrap_or_default(),
+            "response": parsed,
+        });
+        return ToolResult::ok(serialize_audio_envelope(envelope, max_chars));
+    }
+
+    if let Err(error) = ensure_media_tools() {
+        return ToolResult::error(error);
+    }
+
+    let duration_sec = match probe_media_duration(&upload_source, command_timeout_sec).await {
+        Ok(value) => value,
+        Err(error) => return ToolResult::error(error),
+    };
+    let requested_chunk_seconds = (chunk_max_seconds.unwrap_or(default_chunk_max_seconds) as f64)
+        .min(AUDIO_MAX_CHUNK_SECONDS);
+    let mut effective_chunk_seconds =
+        match audio_chunk_seconds_budget(max_bytes, requested_chunk_seconds) {
+            Ok(value) => value,
+            Err(error) => return ToolResult::error(error),
+        };
+    if duration_sec > AUDIO_MIN_CHUNK_SECONDS {
+        effective_chunk_seconds =
+            effective_chunk_seconds.max(duration_sec.min(AUDIO_MIN_CHUNK_SECONDS));
+    }
+    let effective_overlap_seconds = chunk_overlap_seconds
+        .unwrap_or(default_chunk_overlap_seconds)
+        .min((effective_chunk_seconds - 0.001).max(0.0));
+    let effective_max_chunks = max_chunks.unwrap_or(default_max_chunks);
+    let chunk_plan = match plan_audio_chunks(
+        duration_sec,
+        effective_chunk_seconds,
+        effective_overlap_seconds,
+        effective_max_chunks,
+    ) {
+        Ok(value) => value,
+        Err(error) => return ToolResult::error(error),
+    };
+
+    let mut chunk_statuses: Vec<Value> = Vec::new();
+    let mut warnings: Vec<String> = Vec::new();
+    let mut stitched_text = String::new();
+    let mut aggregated_response = Map::new();
+    aggregated_response.insert(
+        "speaker_scope".into(),
+        Value::String(if diarize.unwrap_or(false) {
+            "chunk_local_prefixed".into()
+        } else {
+            "not_requested".into()
+        }),
+    );
+    aggregated_response.insert("chunks".into(), Value::Array(Vec::new()));
+    let mut partial = false;
+    let continue_on_chunk_error = continue_on_chunk_error.unwrap_or(false);
+
+    for chunk in &chunk_plan {
+        let chunk_path = temp_dir.path.join(format!("chunk-{:03}.wav", chunk.index));
+        if let Err(error) = extract_audio_chunk(
+            &upload_source,
+            &chunk_path,
+            chunk.start_sec,
+            chunk.duration_sec,
+            command_timeout_sec,
+        )
+        .await
+        {
+            partial = true;
+            chunk_statuses.push(json!({
+                "index": chunk.index,
+                "start_sec": chunk.start_sec,
+                "end_sec": chunk.end_sec,
+                "status": "error",
+                "error": error,
+            }));
+            if continue_on_chunk_error {
+                warnings.push(format!("chunk {} failed: {error}", chunk.index));
+                continue;
+            }
+            return ToolResult::error(format!(
+                "audio_transcribe failed in chunk {}: {error}",
+                chunk.index
+            ));
+        }
+
+        let parsed = match mistral_transcription_request(
+            api_key,
+            base_url,
+            &chunk_path,
+            chosen_model,
+            diarize,
+            normalized_timestamps.as_deref(),
+            normalized_bias.as_deref(),
+            language,
+            temperature,
+            max_bytes,
+            request_timeout_sec,
+        )
+        .await
+        {
+            Ok(value) => value,
+            Err(error) => {
+                partial = true;
+                chunk_statuses.push(json!({
+                    "index": chunk.index,
+                    "start_sec": chunk.start_sec,
+                    "end_sec": chunk.end_sec,
+                    "status": "error",
+                    "error": error,
+                }));
+                if continue_on_chunk_error {
+                    warnings.push(format!("chunk {} failed: {error}", chunk.index));
+                    continue;
+                }
+                return ToolResult::error(format!(
+                    "audio_transcribe failed in chunk {}: {error}",
+                    chunk.index
+                ));
+            }
+        };
+
+        let chunk_text = parsed
+            .get("text")
+            .and_then(Value::as_str)
+            .unwrap_or_default();
+        let deduped_text = dedupe_audio_overlap_text(&stitched_text, chunk_text);
+        if !deduped_text.is_empty() {
+            if stitched_text.is_empty() {
+                stitched_text = deduped_text;
+            } else {
+                stitched_text = format!("{stitched_text} {deduped_text}");
+            }
+        }
+
+        let metadata = collect_chunk_metadata(
+            &parsed,
+            chunk.start_sec,
+            chunk.leading_overlap_sec,
+            &format!("c{}_", chunk.index),
+        );
+        for (key, value) in metadata {
+            if let Some(existing) = aggregated_response
+                .get_mut(&key)
+                .and_then(Value::as_array_mut)
+            {
+                if let Some(items) = value.as_array() {
+                    existing.extend(items.iter().cloned());
+                }
+            } else {
+                aggregated_response.insert(key, value);
+            }
+        }
+
+        chunk_statuses.push(json!({
+            "index": chunk.index,
+            "start_sec": chunk.start_sec,
+            "end_sec": chunk.end_sec,
+            "status": "ok",
+            "text_chars": chunk_text.len(),
+        }));
+    }
+
+    if !chunk_statuses
+        .iter()
+        .any(|chunk| chunk.get("status").and_then(Value::as_str) == Some("ok"))
+    {
+        return ToolResult::error(
+            "audio_transcribe failed: no chunk completed successfully".into(),
+        );
+    }
+
+    aggregated_response.insert("chunks".into(), Value::Array(chunk_statuses.clone()));
+    let mut envelope = json!({
+        "provider": "mistral",
+        "service": "transcription",
+        "mode": "chunked",
+        "path": rel_path(root, &resolved),
+        "model": chosen_model,
+        "options": options,
+        "chunking": {
+            "strategy": "overlap_window",
+            "chunk_seconds": ((effective_chunk_seconds * 1000.0).round() / 1000.0),
+            "overlap_seconds": ((effective_overlap_seconds * 1000.0).round() / 1000.0),
+            "total_chunks": chunk_plan.len(),
+            "failed_chunks": chunk_statuses.iter().filter(|chunk| {
+                chunk.get("status").and_then(Value::as_str) != Some("ok")
+            }).count(),
+            "partial": partial,
+        },
+        "text": stitched_text.trim(),
+        "response": Value::Object(aggregated_response),
+    });
+    if !warnings.is_empty() {
+        envelope["warnings"] = Value::Array(warnings.into_iter().map(Value::String).collect());
+    }
+    ToolResult::ok(serialize_audio_envelope(envelope, max_chars))
+}
+
+#[cfg(test)]
+mod tests {
+    use super::*;
+    use axum::{Json, Router, body::Bytes, routing::post};
+    use std::sync::{Arc, Mutex};
+    use tempfile::tempdir;
+    use tokio::net::TcpListener;
+
+    async fn capture_transcription(body: Bytes) -> Json<Value> {
+        Json(json!({
+            "text": "hello world",
+            "chunks": [{"text": "hello world", "timestamps": [0.0, 1.0]}],
+            "raw_body": String::from_utf8_lossy(&body).to_string(),
+        }))
+    }
+
+    async fn spawn_server() -> String {
+        let app = Router::new().route("/v1/audio/transcriptions", post(capture_transcription));
+        let listener = TcpListener::bind("127.0.0.1:0").await.unwrap();
+        let addr = listener.local_addr().unwrap();
+        tokio::spawn(async move {
+            axum::serve(listener, app).await.unwrap();
+        });
+        format!("http://{}", addr)
+    }
+
+    fn install_fake_media_tools(root: &Path) {
+        let ffprobe = root.join("ffprobe");
+        let ffmpeg = root.join("ffmpeg");
+        std::fs::write(
+            &ffprobe,
+            "#!/bin/sh\nprintf '{\"format\":{\"duration\":\"58.0\"}}'\n",
+        )
+        .unwrap();
+        std::fs::write(
+            &ffmpeg,
+            "#!/bin/sh\nout=\"\"\nfor arg in \"$@\"; do out=\"$arg\"; done\nprintf 'chunk' > \"$out\"\n",
+        )
+        .unwrap();
+        #[cfg(unix)]
+        {
+            use std::os::unix::fs::PermissionsExt;
+            std::fs::set_permissions(&ffprobe, std::fs::Permissions::from_mode(0o755)).unwrap();
+            std::fs::set_permissions(&ffmpeg, std::fs::Permissions::from_mode(0o755)).unwrap();
+        }
+    }
+
+    #[tokio::test]
+    async fn test_audio_transcribe_success() {
+        let dir = tempdir().unwrap();
+        let audio = dir.path().join("clip.wav");
+        std::fs::write(&audio, b"RIFF\x00\x00\x00\x00WAVEfmt ").unwrap();
+        let root = dir.path().to_path_buf();
+        let base_url = spawn_server().await;
+        let mut files_read = HashSet::new();
+
+        let result = audio_transcribe(
+            &root,
+            Some("mistral-key"),
+            &base_url,
+            "voxtral-mini-latest",
+            1024 * 1024,
+            900,
+            2.0,
+            48,
+            "clip.wav",
+            Some(true),
+            Some(&["segment".to_string()]),
+            Some(&["OpenPlanter".to_string()]),
+            None,
+            None,
+            Some(0.2),
+            None,
+            None,
+            None,
+            None,
+            None,
+            20_000,
+            5,
+            5,
+            &mut files_read,
+        )
+        .await;
+
+        assert!(!result.is_error, "unexpected error: {}", result.content);
+        let parsed: Value = serde_json::from_str(&result.content).unwrap();
+        assert_eq!(parsed["provider"], "mistral");
+        assert_eq!(parsed["path"], "clip.wav");
+        assert_eq!(parsed["text"], "hello world");
+        assert_eq!(parsed["options"]["diarize"], true);
+        let raw_body = parsed["response"]["raw_body"].as_str().unwrap();
+        assert!(raw_body.contains("name=\"model\""));
+        assert!(raw_body.contains("name=\"timestamp_granularities\""));
+        assert!(raw_body.contains("name=\"context_bias\""));
+    }
+
+    #[tokio::test]
+    async fn test_audio_transcribe_rejects_language_and_timestamps() {
+        let dir = tempdir().unwrap();
+        let audio = dir.path().join("clip.wav");
+        std::fs::write(&audio, b"RIFF\x00\x00\x00\x00WAVEfmt ").unwrap();
+        let root = dir.path().to_path_buf();
+        let mut files_read = HashSet::new();
+
+        let result = audio_transcribe(
+            &root,
+            Some("mistral-key"),
+            "https://api.mistral.ai",
+            "voxtral-mini-latest",
+            1024 * 1024,
+            900,
+            2.0,
+            48,
+            "clip.wav",
+            None,
+            Some(&["word".to_string()]),
+            None,
+            Some("en"),
+            None,
+            None,
+            None,
+            None,
+            None,
+            None,
+            None,
+            20_000,
+            5,
+            5,
+            &mut files_read,
+        )
+        .await;
+
+        assert!(result.is_error);
+        assert!(result.content.contains("cannot be combined"));
+    }
+
+    #[tokio::test]
+    async fn test_audio_transcribe_chunks_oversize_audio() {
+        let dir = tempdir().unwrap();
+        install_fake_media_tools(dir.path());
+        let original_path = std::env::var_os("PATH");
+        unsafe {
+            let mut parts = vec![dir.path().to_path_buf()];
+            if let Some(existing) = &original_path {
+                parts.extend(std::env::split_paths(existing));
+            }
+            std::env::set_var("PATH", std::env::join_paths(parts).unwrap());
+        }
+
+        let counter = Arc::new(Mutex::new(0usize));
+        let counter_clone = counter.clone();
+        let app = Router::new().route(
+            "/v1/audio/transcriptions",
+            post(move |_body: Bytes| {
+                let counter = counter_clone.clone();
+                async move {
+                    let mut state = counter.lock().unwrap();
+                    let response = if *state == 0 {
+                        json!({
+                            "text": "hello there general kenobi from tatooine",
+                            "segments": [{"text":"hello there general kenobi from tatooine","start":0.0,"end":4.0,"speaker":"speaker_a"}]
+                        })
+                    } else {
+                        json!({
+                            "text": "there general kenobi from tatooine today",
+                            "segments": [{"text":"there general kenobi from tatooine today","start":0.0,"end":4.0,"speaker":"speaker_a"}]
+                        })
+                    };
+                    *state += 1;
+                    Json(response)
+                }
+            }),
+        );
+        let listener = TcpListener::bind("127.0.0.1:0").await.unwrap();
+        let addr = listener.local_addr().unwrap();
+        tokio::spawn(async move {
+            axum::serve(listener, app).await.unwrap();
+        });
+
+        let audio = dir.path().join("clip.wav");
+        std::fs::write(&audio, vec![b'x'; 512]).unwrap();
+        let root = dir.path().to_path_buf();
+        let mut files_read = HashSet::new();
+
+        let result = audio_transcribe(
+            &root,
+            Some("mistral-key"),
+            &format!("http://{}", addr),
+            "voxtral-mini-latest",
+            64,
+            900,
+            2.0,
+            48,
+            "clip.wav",
+            Some(true),
+            None,
+            None,
+            None,
+            None,
+            None,
+            Some("auto"),
+            Some(30),
+            Some(2.0),
+            None,
+            None,
+            20_000,
+            5,
+            5,
+            &mut files_read,
+        )
+        .await;
+
+        if let Some(value) = original_path {
+            unsafe { std::env::set_var("PATH", value) };
+        }
+
+        assert!(!result.is_error, "unexpected error: {}", result.content);
+        let parsed: Value = serde_json::from_str(&result.content).unwrap();
+        assert_eq!(parsed["mode"], "chunked");
+        assert_eq!(
+            parsed["text"],
+            "hello there general kenobi from tatooine today"
+        );
+        assert_eq!(parsed["chunking"]["total_chunks"], 2);
+        assert_eq!(parsed["response"]["segments"][0]["speaker"], "c0_speaker_a");
+        assert_eq!(parsed["response"]["segments"][1]["speaker"], "c1_speaker_a");
+    }
+}
diff --git a/openplanter-desktop/crates/op-core/src/tools/defs.rs b/openplanter-desktop/crates/op-core/src/tools/defs.rs
index 88b268e5..b8c3f91c 100644
--- a/openplanter-desktop/crates/op-core/src/tools/defs.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/defs.rs
@@ -66,6 +66,68 @@ fn mvp_tool_defs() -> Vec<ToolDef> {
                 "additionalProperties": false
             }),
         },
+        ToolDef {
+            name: "audio_transcribe",
+            description: "Transcribe a local audio file with Mistral's offline transcription API. Supports diarization, timestamp granularity, context bias, language, model override, temperature, and optional chunking for long-form audio/video.",
+            parameters: json!({
+                "type": "object",
+                "properties": {
+                    "path": {
+                        "type": "string",
+                        "description": "Relative or absolute path to the audio file within the workspace."
+                    },
+                    "diarize": {
+                        "type": "boolean",
+                        "description": "Whether to request speaker diarization."
+                    },
+                    "timestamp_granularities": {
+                        "type": "array",
+                        "items": { "type": "string" },
+                        "description": "Optional timestamp granularity values such as 'segment' or 'word'."
+                    },
+                    "context_bias": {
+                        "type": "array",
+                        "items": { "type": "string" },
+                        "description": "Optional bias phrases to steer transcription toward expected terms."
+                    },
+                    "language": {
+                        "type": "string",
+                        "description": "Optional ISO language hint. Cannot be combined with timestamp_granularities."
+                    },
+                    "model": {
+                        "type": "string",
+                        "description": "Optional transcription model override."
+                    },
+                    "temperature": {
+                        "type": "number",
+                        "description": "Optional decoding temperature."
+                    },
+                    "chunking": {
+                        "type": "string",
+                        "description": "Long-form handling mode: 'auto', 'off', or 'force'.",
+                        "enum": ["auto", "off", "force"]
+                    },
+                    "chunk_max_seconds": {
+                        "type": "integer",
+                        "description": "Maximum chunk duration in seconds for chunked transcription."
+                    },
+                    "chunk_overlap_seconds": {
+                        "type": "number",
+                        "description": "Overlap between adjacent chunks in seconds."
+                    },
+                    "max_chunks": {
+                        "type": "integer",
+                        "description": "Maximum number of chunks allowed for a transcription run."
+                    },
+                    "continue_on_chunk_error": {
+                        "type": "boolean",
+                        "description": "Continue remaining chunks and return partial output if a chunk fails."
+                    }
+                },
+                "required": ["path"],
+                "additionalProperties": false
+            }),
+        },
         ToolDef {
             name: "write_file",
             description: "Create or overwrite a file in the workspace with the given content.",
@@ -504,6 +566,7 @@ mod tests {
     fn test_tool_names() {
         let names = tool_names();
         assert!(names.contains(&"read_file"));
+        assert!(names.contains(&"audio_transcribe"));
         assert!(names.contains(&"run_shell"));
         assert!(names.contains(&"web_search"));
         assert!(names.contains(&"think"));
diff --git a/openplanter-desktop/crates/op-core/src/tools/mod.rs b/openplanter-desktop/crates/op-core/src/tools/mod.rs
index 693eb00e..fba6bed8 100644
--- a/openplanter-desktop/crates/op-core/src/tools/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/mod.rs
@@ -2,6 +2,7 @@
 ///
 /// The `WorkspaceTools` struct is the central dispatcher that owns tool state
 /// (files-read set, background jobs) and routes tool calls to the appropriate module.
+pub mod audio;
 pub mod defs;
 pub mod filesystem;
 pub mod patching;
@@ -62,6 +63,14 @@ pub struct WorkspaceTools {
     brave_base_url: String,
     tavily_api_key: Option<String>,
     tavily_base_url: String,
+    mistral_transcription_api_key: Option<String>,
+    mistral_transcription_base_url: String,
+    mistral_transcription_model: String,
+    mistral_transcription_max_bytes: usize,
+    mistral_transcription_chunk_max_seconds: i64,
+    mistral_transcription_chunk_overlap_seconds: f64,
+    mistral_transcription_max_chunks: i64,
+    mistral_transcription_request_timeout_sec: u64,
     files_read: HashSet<PathBuf>,
     bg_jobs: shell::BgJobs,
 }
@@ -96,6 +105,17 @@ impl WorkspaceTools {
             brave_base_url: config.brave_base_url.clone(),
             tavily_api_key: config.tavily_api_key.clone(),
             tavily_base_url: config.tavily_base_url.clone(),
+            mistral_transcription_api_key: config.mistral_transcription_api_key.clone(),
+            mistral_transcription_base_url: config.mistral_transcription_base_url.clone(),
+            mistral_transcription_model: config.mistral_transcription_model.clone(),
+            mistral_transcription_max_bytes: config.mistral_transcription_max_bytes as usize,
+            mistral_transcription_chunk_max_seconds: config.mistral_transcription_chunk_max_seconds,
+            mistral_transcription_chunk_overlap_seconds: config
+                .mistral_transcription_chunk_overlap_seconds,
+            mistral_transcription_max_chunks: config.mistral_transcription_max_chunks,
+            mistral_transcription_request_timeout_sec: config
+                .mistral_transcription_request_timeout_sec
+                as u64,
             files_read: HashSet::new(),
             bg_jobs: shell::BgJobs::new(),
         }
@@ -126,6 +146,17 @@ impl WorkspaceTools {
             brave_base_url: config.brave_base_url.clone(),
             tavily_api_key: config.tavily_api_key.clone(),
             tavily_base_url: config.tavily_base_url.clone(),
+            mistral_transcription_api_key: config.mistral_transcription_api_key.clone(),
+            mistral_transcription_base_url: config.mistral_transcription_base_url.clone(),
+            mistral_transcription_model: config.mistral_transcription_model.clone(),
+            mistral_transcription_max_bytes: config.mistral_transcription_max_bytes as usize,
+            mistral_transcription_chunk_max_seconds: config.mistral_transcription_chunk_max_seconds,
+            mistral_transcription_chunk_overlap_seconds: config
+                .mistral_transcription_chunk_overlap_seconds,
+            mistral_transcription_max_chunks: config.mistral_transcription_max_chunks,
+            mistral_transcription_request_timeout_sec: config
+                .mistral_transcription_request_timeout_sec
+                as u64,
             files_read: HashSet::new(),
             bg_jobs: shell::BgJobs::new(),
         }
@@ -207,6 +238,101 @@ impl WorkspaceTools {
                     self.command_timeout_sec,
                 )
             }
+            "audio_transcribe" => {
+                let path = args.get("path").and_then(|v| v.as_str()).unwrap_or("");
+                let diarize = args.get("diarize").and_then(|v| v.as_bool());
+                let timestamp_granularities: Option<Vec<String>> = args
+                    .get("timestamp_granularities")
+                    .and_then(|v| {
+                        if let Some(values) = v.as_array() {
+                            Some(
+                                values
+                                    .iter()
+                                    .filter_map(|value| {
+                                        value.as_str().map(|s| s.trim().to_string())
+                                    })
+                                    .filter(|value| !value.is_empty())
+                                    .collect::<Vec<_>>(),
+                            )
+                        } else {
+                            v.as_str().map(|value| vec![value.trim().to_string()])
+                        }
+                    })
+                    .filter(|values| !values.is_empty());
+                let context_bias: Option<Vec<String>> = args
+                    .get("context_bias")
+                    .and_then(|v| {
+                        if let Some(values) = v.as_array() {
+                            Some(
+                                values
+                                    .iter()
+                                    .filter_map(|value| {
+                                        value.as_str().map(|s| s.trim().to_string())
+                                    })
+                                    .filter(|value| !value.is_empty())
+                                    .collect::<Vec<_>>(),
+                            )
+                        } else {
+                            v.as_str().map(|value| {
+                                value
+                                    .split(',')
+                                    .map(str::trim)
+                                    .filter(|part| !part.is_empty())
+                                    .map(ToString::to_string)
+                                    .collect::<Vec<_>>()
+                            })
+                        }
+                    })
+                    .filter(|values| !values.is_empty());
+                let language = args
+                    .get("language")
+                    .and_then(|v| v.as_str())
+                    .filter(|value| !value.trim().is_empty());
+                let model = args
+                    .get("model")
+                    .and_then(|v| v.as_str())
+                    .filter(|value| !value.trim().is_empty());
+                let temperature = args.get("temperature").and_then(|v| v.as_f64());
+                let chunking = args
+                    .get("chunking")
+                    .and_then(|v| v.as_str())
+                    .map(str::trim)
+                    .filter(|value| !value.is_empty());
+                let chunk_max_seconds = args.get("chunk_max_seconds").and_then(|v| v.as_i64());
+                let chunk_overlap_seconds =
+                    args.get("chunk_overlap_seconds").and_then(|v| v.as_f64());
+                let max_chunks = args.get("max_chunks").and_then(|v| v.as_i64());
+                let continue_on_chunk_error = args
+                    .get("continue_on_chunk_error")
+                    .and_then(|v| v.as_bool());
+                audio::audio_transcribe(
+                    &self.root,
+                    self.mistral_transcription_api_key.as_deref(),
+                    &self.mistral_transcription_base_url,
+                    &self.mistral_transcription_model,
+                    self.mistral_transcription_max_bytes,
+                    self.mistral_transcription_chunk_max_seconds,
+                    self.mistral_transcription_chunk_overlap_seconds,
+                    self.mistral_transcription_max_chunks,
+                    path,
+                    diarize,
+                    timestamp_granularities.as_deref(),
+                    context_bias.as_deref(),
+                    language,
+                    model,
+                    temperature,
+                    chunking,
+                    chunk_max_seconds,
+                    chunk_overlap_seconds,
+                    max_chunks,
+                    continue_on_chunk_error,
+                    self.max_file_chars.min(self.max_observation_chars),
+                    self.command_timeout_sec,
+                    self.mistral_transcription_request_timeout_sec,
+                    &mut self.files_read,
+                )
+                .await
+            }
 
             // Shell
             "run_shell" => {
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
index 0bf58ff4..d3eeb81f 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
@@ -203,14 +203,14 @@ mod tests {
     }
 
     #[tokio::test]
-    async fn test_build_solve_initial_context_degrades_to_no_packet_on_load_failure() {
+    async fn test_build_solve_initial_context_ignores_invalid_typed_state_without_warning() {
         let tmp = tempdir().unwrap();
         fs::write(tmp.path().join("investigation_state.json"), "{not-json")
             .await
             .unwrap();
 
         let (context, warning) = build_solve_initial_context(tmp.path(), "sid").await;
-        assert!(warning.is_some());
+        assert!(warning.is_none());
         assert!(context.question_reasoning_packet.is_none());
         assert_eq!(context.session_id, Some("sid".to_string()));
         assert_eq!(context.session_dir, Some(tmp.path().display().to_string()));
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/config.rs b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
index 4d331489..0ceecc7e 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/config.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
@@ -212,6 +212,10 @@ pub fn build_credential_status(cfg: &op_core::config::AgentConfig) -> HashMap<St
     status.insert("brave".to_string(), cfg.brave_api_key.is_some());
     status.insert("tavily".to_string(), cfg.tavily_api_key.is_some());
     status.insert("voyage".to_string(), cfg.voyage_api_key.is_some());
+    status.insert(
+        "mistral_transcription".to_string(),
+        cfg.mistral_transcription_api_key.is_some(),
+    );
     status
 }
 
@@ -271,6 +275,11 @@ pub async fn get_credentials_status(
         "voyage".to_string(),
         cfg.voyage_api_key.is_some() || env_creds.voyage_api_key.is_some(),
     );
+    status.insert(
+        "mistral_transcription".to_string(),
+        cfg.mistral_transcription_api_key.is_some()
+            || env_creds.mistral_transcription_api_key.is_some(),
+    );
     Ok(status)
 }
 
@@ -379,6 +388,7 @@ mod tests {
         cfg.brave_api_key = None;
         cfg.tavily_api_key = None;
         cfg.voyage_api_key = None;
+        cfg.mistral_transcription_api_key = None;
         let status = build_credential_status(&cfg);
         assert_eq!(status["openai"], false);
         assert_eq!(status["anthropic"], false);
@@ -389,6 +399,7 @@ mod tests {
         assert_eq!(status["brave"], false);
         assert_eq!(status["tavily"], false);
         assert_eq!(status["voyage"], false);
+        assert_eq!(status["mistral_transcription"], false);
     }
 
     #[test]
@@ -445,6 +456,7 @@ mod tests {
         cfg.brave_api_key = Some("k8".to_string());
         cfg.tavily_api_key = Some("k9".to_string());
         cfg.voyage_api_key = Some("k10".to_string());
+        cfg.mistral_transcription_api_key = Some("k11".to_string());
         let status = build_credential_status(&cfg);
         for (provider, has_key) in &status {
             assert!(has_key, "{} should be true when key is set", provider);
@@ -452,13 +464,13 @@ mod tests {
     }
 
     #[test]
-    fn test_cred_status_has_eleven_entries() {
+    fn test_cred_status_has_twelve_entries() {
         let cfg = op_core::config::AgentConfig::from_env("/nonexistent");
         let status = build_credential_status(&cfg);
         assert_eq!(
             status.len(),
-            11,
-            "should have 11 entries (6 providers + 5 services)"
+            12,
+            "should have 12 entries (6 providers + 6 services)"
         );
     }
 
diff --git a/openplanter-desktop/crates/op-tauri/src/state.rs b/openplanter-desktop/crates/op-tauri/src/state.rs
index 30bca6ca..5b9521c8 100644
--- a/openplanter-desktop/crates/op-tauri/src/state.rs
+++ b/openplanter-desktop/crates/op-tauri/src/state.rs
@@ -105,7 +105,9 @@ fn apply_repo_root_guardrail(
                 GuardrailAction::RedirectedToWorkspace,
             ));
         }
-        return Err(StartupWorkspaceError::RepoRootDisallowed { repo_root: candidate });
+        return Err(StartupWorkspaceError::RepoRootDisallowed {
+            repo_root: candidate,
+        });
     }
 
     Ok((candidate, GuardrailAction::None))
@@ -669,7 +671,10 @@ mod tests {
 
         assert_eq!(resolved.source, WorkspaceSource::GitRoot);
         assert_eq!(resolved.path, canonicalize_or_self(&workspace));
-        assert_eq!(resolved.invalid_override, Some(invalid.display().to_string()));
+        assert_eq!(
+            resolved.invalid_override,
+            Some(invalid.display().to_string())
+        );
     }
 
     #[test]
@@ -687,7 +692,10 @@ mod tests {
 
         assert_eq!(resolved.source, WorkspaceSource::GitRoot);
         assert_eq!(resolved.path, canonicalize_or_self(&workspace));
-        assert_eq!(resolved.invalid_override, Some(invalid.display().to_string()));
+        assert_eq!(
+            resolved.invalid_override,
+            Some(invalid.display().to_string())
+        );
     }
 
     #[test]
diff --git a/openplanter-desktop/frontend/src/api/invoke.test.ts b/openplanter-desktop/frontend/src/api/invoke.test.ts
index 62a2f232..ad980cf2 100644
--- a/openplanter-desktop/frontend/src/api/invoke.test.ts
+++ b/openplanter-desktop/frontend/src/api/invoke.test.ts
@@ -133,6 +133,7 @@ describe("invoke wrappers", () => {
       brave: false,
       tavily: true,
       voyage: true,
+      mistral_transcription: true,
     }));
     const status = await getCredentialsStatus();
     expect(status.openai).toBe(true);
@@ -142,6 +143,7 @@ describe("invoke wrappers", () => {
     expect(status.brave).toBe(false);
     expect(status.tavily).toBe(true);
     expect(status.voyage).toBe(true);
+    expect(status.mistral_transcription).toBe(true);
   });
 
   it("listSessions sends limit", async () => {
diff --git a/openplanter-desktop/frontend/src/commands/model.test.ts b/openplanter-desktop/frontend/src/commands/model.test.ts
index c8aa27c9..efa2e572 100644
--- a/openplanter-desktop/frontend/src/commands/model.test.ts
+++ b/openplanter-desktop/frontend/src/commands/model.test.ts
@@ -32,6 +32,11 @@ describe("inferProvider", () => {
     expect(inferProvider("llama3.2")).toBe("ollama");
   });
 
+  it("mistral chat models stay ollama while voxtral stays tool-only", () => {
+    expect(inferProvider("mistral")).toBe("ollama");
+    expect(inferProvider("voxtral-mini-latest")).toBeNull();
+  });
+
   it("qwen-3 returns cerebras", () => {
     expect(inferProvider("qwen-3-235b-a22b-instruct-2507")).toBe("cerebras");
   });
diff --git a/openplanter-desktop/frontend/src/components/App.test.ts b/openplanter-desktop/frontend/src/components/App.test.ts
index 19d87533..7838f044 100644
--- a/openplanter-desktop/frontend/src/components/App.test.ts
+++ b/openplanter-desktop/frontend/src/components/App.test.ts
@@ -58,7 +58,7 @@ describe("createApp", () => {
     __setHandler("list_sessions", () => [SESSION_B, SESSION_A]);
     __setHandler("get_credentials_status", () => ({
       openai: true, anthropic: true, openrouter: false,
-      cerebras: false, zai: true, ollama: true, exa: false, firecrawl: true, brave: false, tavily: true, voyage: true,
+      cerebras: false, zai: true, ollama: true, exa: false, firecrawl: true, brave: false, tavily: true, voyage: true, mistral_transcription: true,
     }));
     __setHandler("open_session", () => ({
       id: "20260227-120000-cccc3333",
@@ -113,7 +113,7 @@ describe("createApp", () => {
 
     await vi.waitFor(() => {
       const creds = root.querySelector(".cred-status");
-      expect(creds!.children.length).toBe(11);
+      expect(creds!.children.length).toBe(12);
       expect(creds!.querySelector(".cred-ok")!.textContent).toContain("openai");
       expect(creds!.querySelector(".cred-missing")!.textContent).toContain("openrouter");
     });
diff --git a/openplanter-desktop/frontend/src/components/App.ts b/openplanter-desktop/frontend/src/components/App.ts
index c31e9bb9..f8ddab4d 100644
--- a/openplanter-desktop/frontend/src/components/App.ts
+++ b/openplanter-desktop/frontend/src/components/App.ts
@@ -313,7 +313,7 @@ async function loadCredentials(container: HTMLElement): Promise<void> {
   try {
     const status = await getCredentialsStatus();
     container.innerHTML = "";
-    const providers = ["openai", "anthropic", "openrouter", "cerebras", "zai", "ollama", "exa", "firecrawl", "brave", "tavily", "voyage"];
+    const providers = ["openai", "anthropic", "openrouter", "cerebras", "zai", "ollama", "exa", "firecrawl", "brave", "tavily", "voyage", "mistral_transcription"];
     for (const p of providers) {
       const row = document.createElement("div");
       const hasKey = status[p] ?? false;
diff --git a/tests/test_audio_transcribe.py b/tests/test_audio_transcribe.py
new file mode 100644
index 00000000..be70f572
--- /dev/null
+++ b/tests/test_audio_transcribe.py
@@ -0,0 +1,391 @@
+from __future__ import annotations
+
+import json
+from pathlib import Path
+
+import pytest
+
+from agent.tool_defs import TOOL_DEFINITIONS
+from agent.tools import ToolError, WorkspaceTools
+
+
+def _write_audio(path: Path, payload: bytes = b"RIFF\x00\x00\x00\x00WAVEfmt ") -> None:
+    path.write_bytes(payload)
+
+
+def _make_tools(tmp_path: Path, **overrides: object) -> WorkspaceTools:
+    defaults: dict[str, object] = {
+        "root": tmp_path,
+        "mistral_transcription_api_key": "mistral-key",
+        "max_file_chars": 20_000,
+        "max_observation_chars": 20_000,
+    }
+    defaults.update(overrides)
+    return WorkspaceTools(**defaults)
+
+
+class TestAudioTranscribeTool:
+    def test_audio_transcribe_success_returns_wrapped_response(self, tmp_path: Path) -> None:
+        audio = tmp_path / "clip.wav"
+        _write_audio(audio)
+        tools = _make_tools(tmp_path)
+        mocked = {
+            "text": "hello world",
+            "chunks": [{"text": "hello world", "timestamps": [0.0, 1.0]}],
+        }
+
+        with pytest.MonkeyPatch.context() as mp:
+            mp.setattr(
+                tools,
+                "_mistral_transcription_request",
+                lambda **_: mocked,
+            )
+            raw = tools.audio_transcribe(
+                "clip.wav",
+                diarize=True,
+                timestamp_granularities=["segment"],
+                context_bias=["OpenPlanter", "Mistral"],
+                model="voxtral-mini-latest",
+                temperature=0.2,
+            )
+
+        parsed = json.loads(raw)
+        assert parsed["provider"] == "mistral"
+        assert parsed["path"] == "clip.wav"
+        assert parsed["text"] == "hello world"
+        assert parsed["options"]["diarize"] is True
+        assert parsed["options"]["timestamp_granularities"] == ["segment"]
+        assert parsed["options"]["context_bias"] == ["OpenPlanter", "Mistral"]
+        assert parsed["response"]["chunks"][0]["text"] == "hello world"
+
+    def test_audio_transcribe_requires_key(self, tmp_path: Path) -> None:
+        audio = tmp_path / "clip.wav"
+        _write_audio(audio)
+        tools = WorkspaceTools(root=tmp_path)
+        out = tools.audio_transcribe("clip.wav")
+        assert "Mistral transcription API key not configured" in out
+
+    def test_audio_transcribe_rejects_language_with_timestamps(self, tmp_path: Path) -> None:
+        audio = tmp_path / "clip.wav"
+        _write_audio(audio)
+        tools = _make_tools(tmp_path)
+        out = tools.audio_transcribe(
+            "clip.wav",
+            language="en",
+            timestamp_granularities=["word"],
+        )
+        assert "cannot be combined" in out
+
+    def test_audio_transcribe_rejects_non_audio_extension(self, tmp_path: Path) -> None:
+        note = tmp_path / "notes.txt"
+        note.write_text("hello", encoding="utf-8")
+        tools = _make_tools(tmp_path)
+        out = tools.audio_transcribe("notes.txt")
+        assert "Unsupported audio format" in out
+
+    def test_audio_transcribe_path_escape_blocked(self, tmp_path: Path) -> None:
+        tools = _make_tools(tmp_path)
+        with pytest.raises(ToolError, match="escapes workspace"):
+            tools.audio_transcribe("../../etc/passwd.wav")
+
+    def test_audio_transcribe_auto_chunks_oversize_files(self, tmp_path: Path) -> None:
+        audio = tmp_path / "clip.wav"
+        _write_audio(audio, payload=b"x" * 512)
+        tools = _make_tools(
+            tmp_path,
+            mistral_transcription_max_bytes=64,
+        )
+
+        with pytest.MonkeyPatch.context() as mp:
+            mp.setattr(tools, "_ensure_media_tools", lambda: None)
+            mp.setattr(tools, "_probe_media_duration", lambda _: 58.0)
+
+            def fake_extract(
+                source: Path,
+                output: Path,
+                *,
+                start_sec: float,
+                duration_sec: float,
+            ) -> None:
+                output.write_bytes(b"chunk")
+
+            responses = iter(
+                [
+                    {
+                        "text": "hello there general kenobi from tatooine",
+                        "segments": [
+                            {
+                                "text": "hello there general kenobi from tatooine",
+                                "start": 0.0,
+                                "end": 4.0,
+                                "speaker": "speaker_a",
+                            }
+                        ],
+                    },
+                    {
+                        "text": "there general kenobi from tatooine today",
+                        "segments": [
+                            {
+                                "text": "there general kenobi from tatooine today",
+                                "start": 0.0,
+                                "end": 4.0,
+                                "speaker": "speaker_a",
+                            }
+                        ],
+                    },
+                ]
+            )
+            mp.setattr(tools, "_extract_audio_chunk", fake_extract)
+            mp.setattr(
+                tools,
+                "_mistral_transcription_request",
+                lambda **_: next(responses),
+            )
+
+            raw = tools.audio_transcribe(
+                "clip.wav",
+                diarize=True,
+                chunk_max_seconds=30,
+                chunk_overlap_seconds=2,
+            )
+
+        parsed = json.loads(raw)
+        assert parsed["mode"] == "chunked"
+        assert parsed["text"] == "hello there general kenobi from tatooine today"
+        assert parsed["chunking"]["total_chunks"] == 2
+        assert parsed["response"]["segments"][0]["speaker"] == "c0_speaker_a"
+        assert parsed["response"]["segments"][1]["speaker"] == "c1_speaker_a"
+        assert parsed["response"]["segments"][1]["start"] == 30.0
+        assert parsed["response"]["segments"][1]["end"] == 32.0
+
+    def test_audio_transcribe_off_keeps_oversize_rejection(self, tmp_path: Path) -> None:
+        audio = tmp_path / "clip.wav"
+        _write_audio(audio, payload=b"x" * 512)
+        tools = _make_tools(
+            tmp_path,
+            mistral_transcription_max_bytes=64,
+        )
+        out = tools.audio_transcribe("clip.wav", chunking="off")
+        assert "Audio file too large" in out
+
+    def test_audio_transcribe_force_chunks_even_when_under_limit(self, tmp_path: Path) -> None:
+        audio = tmp_path / "clip.wav"
+        _write_audio(audio, payload=b"x" * 32)
+        tools = _make_tools(tmp_path)
+
+        with pytest.MonkeyPatch.context() as mp:
+            mp.setattr(tools, "_ensure_media_tools", lambda: None)
+            mp.setattr(tools, "_probe_media_duration", lambda _: 58.0)
+            mp.setattr(
+                tools,
+                "_extract_audio_chunk",
+                lambda *args, **kwargs: kwargs["output"].write_bytes(b"chunk"),
+                raising=False,
+            )
+            responses = iter(
+                [
+                    {"text": "one two three four five"},
+                    {"text": "three four five six"},
+                ]
+            )
+
+            def fake_chunk(
+                source: Path,
+                output: Path,
+                *,
+                start_sec: float,
+                duration_sec: float,
+            ) -> None:
+                output.write_bytes(b"chunk")
+
+            mp.setattr(tools, "_extract_audio_chunk", fake_chunk)
+            mp.setattr(
+                tools,
+                "_mistral_transcription_request",
+                lambda **_: next(responses),
+            )
+            raw = tools.audio_transcribe(
+                "clip.wav",
+                chunking="force",
+                chunk_max_seconds=30,
+                chunk_overlap_seconds=2,
+            )
+
+        parsed = json.loads(raw)
+        assert parsed["mode"] == "chunked"
+        assert parsed["options"]["chunking"] == "force"
+
+    def test_audio_transcribe_reports_missing_media_tools(self, tmp_path: Path) -> None:
+        audio = tmp_path / "clip.wav"
+        _write_audio(audio, payload=b"x" * 512)
+        tools = _make_tools(
+            tmp_path,
+            mistral_transcription_max_bytes=64,
+        )
+        with pytest.MonkeyPatch.context() as mp:
+            mp.setattr(
+                tools,
+                "_ensure_media_tools",
+                lambda: (_ for _ in ()).throw(
+                    ToolError(
+                        "Long-form transcription requires ffmpeg, ffprobe. Install ffmpeg/ffprobe and retry."
+                    )
+                ),
+            )
+            out = tools.audio_transcribe("clip.wav")
+        assert "ffmpeg" in out and "ffprobe" in out
+
+    def test_audio_transcribe_extracts_video_before_upload(self, tmp_path: Path) -> None:
+        video = tmp_path / "clip.mp4"
+        video.write_bytes(b"video")
+        tools = _make_tools(tmp_path)
+        extracted: dict[str, str] = {}
+
+        with pytest.MonkeyPatch.context() as mp:
+            mp.setattr(tools, "_ensure_media_tools", lambda: None)
+
+            def fake_extract(source: Path, output: Path) -> None:
+                extracted["source"] = source.name
+                output.write_bytes(b"wav")
+
+            def fake_request(*, resolved: Path, **_: object) -> dict[str, object]:
+                extracted["uploaded_suffix"] = resolved.suffix
+                return {"text": "video transcript"}
+
+            mp.setattr(tools, "_extract_audio_source", fake_extract)
+            mp.setattr(tools, "_mistral_transcription_request", fake_request)
+            raw = tools.audio_transcribe("clip.mp4", chunking="off")
+
+        parsed = json.loads(raw)
+        assert extracted["source"] == "clip.mp4"
+        assert extracted["uploaded_suffix"] == ".wav"
+        assert parsed["text"] == "video transcript"
+
+    def test_audio_transcribe_fail_fast_on_chunk_error(self, tmp_path: Path) -> None:
+        audio = tmp_path / "clip.wav"
+        _write_audio(audio, payload=b"x" * 512)
+        tools = _make_tools(
+            tmp_path,
+            mistral_transcription_max_bytes=64,
+        )
+
+        with pytest.MonkeyPatch.context() as mp:
+            mp.setattr(tools, "_ensure_media_tools", lambda: None)
+            mp.setattr(tools, "_probe_media_duration", lambda _: 58.0)
+
+            def fake_extract(
+                source: Path,
+                output: Path,
+                *,
+                start_sec: float,
+                duration_sec: float,
+            ) -> None:
+                output.write_bytes(b"chunk")
+
+            calls = {"count": 0}
+
+            def fake_request(**_: object) -> dict[str, object]:
+                calls["count"] += 1
+                if calls["count"] == 2:
+                    raise ToolError("boom")
+                return {"text": "alpha beta gamma delta epsilon"}
+
+            mp.setattr(tools, "_extract_audio_chunk", fake_extract)
+            mp.setattr(tools, "_mistral_transcription_request", fake_request)
+            out = tools.audio_transcribe(
+                "clip.wav",
+                chunk_max_seconds=30,
+                chunk_overlap_seconds=2,
+            )
+
+        assert "audio_transcribe failed in chunk 1" in out
+
+    def test_audio_transcribe_can_return_partial_chunked_output(self, tmp_path: Path) -> None:
+        audio = tmp_path / "clip.wav"
+        _write_audio(audio, payload=b"x" * 512)
+        tools = _make_tools(
+            tmp_path,
+            mistral_transcription_max_bytes=64,
+        )
+
+        with pytest.MonkeyPatch.context() as mp:
+            mp.setattr(tools, "_ensure_media_tools", lambda: None)
+            mp.setattr(tools, "_probe_media_duration", lambda _: 86.0)
+
+            def fake_extract(
+                source: Path,
+                output: Path,
+                *,
+                start_sec: float,
+                duration_sec: float,
+            ) -> None:
+                output.write_bytes(b"chunk")
+
+            calls = {"count": 0}
+
+            def fake_request(**_: object) -> dict[str, object]:
+                calls["count"] += 1
+                if calls["count"] == 2:
+                    raise ToolError("boom")
+                return {"text": f"chunk {calls['count']} transcript words words words"}
+
+            mp.setattr(tools, "_extract_audio_chunk", fake_extract)
+            mp.setattr(tools, "_mistral_transcription_request", fake_request)
+            raw = tools.audio_transcribe(
+                "clip.wav",
+                chunk_max_seconds=30,
+                chunk_overlap_seconds=1,
+                continue_on_chunk_error=True,
+            )
+
+        parsed = json.loads(raw)
+        assert parsed["chunking"]["partial"] is True
+        assert parsed["chunking"]["failed_chunks"] == 1
+        assert parsed["warnings"][0].startswith("chunk 1 failed")
+
+    def test_audio_transcribe_structured_truncation_keeps_valid_json(
+        self,
+        tmp_path: Path,
+    ) -> None:
+        audio = tmp_path / "clip.wav"
+        _write_audio(audio)
+        tools = _make_tools(
+            tmp_path,
+            max_file_chars=400,
+            max_observation_chars=400,
+        )
+        mocked = {
+            "text": "word " * 200,
+            "segments": [
+                {"text": "segment", "start": 0.0, "end": 1.0, "speaker": "speaker_a"}
+                for _ in range(30)
+            ],
+            "words": [
+                {"text": "word", "start": 0.0, "end": 0.1, "speaker": "speaker_a"}
+                for _ in range(60)
+            ],
+        }
+
+        with pytest.MonkeyPatch.context() as mp:
+            mp.setattr(tools, "_mistral_transcription_request", lambda **_: mocked)
+            raw = tools.audio_transcribe("clip.wav")
+
+        parsed = json.loads(raw)
+        assert parsed["truncation"]["applied"] is True
+        assert "text_truncated_chars" in parsed["truncation"]
+
+
+class TestAudioTranscribeToolDef:
+    def test_audio_transcribe_in_tool_definitions(self) -> None:
+        names = [d["name"] for d in TOOL_DEFINITIONS]
+        assert "audio_transcribe" in names
+
+    def test_audio_transcribe_definition_schema(self) -> None:
+        defn = next(d for d in TOOL_DEFINITIONS if d["name"] == "audio_transcribe")
+        assert defn["parameters"]["required"] == ["path"]
+        props = defn["parameters"]["properties"]
+        assert "context_bias" in props
+        assert props["context_bias"]["type"] == "array"
+        assert props["chunking"]["enum"] == ["auto", "off", "force"]
+        assert props["chunk_max_seconds"]["type"] == "integer"
+        assert props["continue_on_chunk_error"]["type"] == "boolean"
diff --git a/tests/test_credentials.py b/tests/test_credentials.py
index fc89a87e..6a610320 100644
--- a/tests/test_credentials.py
+++ b/tests/test_credentials.py
@@ -29,6 +29,7 @@ def test_parse_env_file_extracts_supported_keys(self) -> None:
                         "FIRECRAWL_API_KEY=fc-key",
                         "BRAVE_API_KEY=brave-key",
                         "OPENPLANTER_TAVILY_API_KEY=tavily-key",
+                        "MISTRAL_API_KEY=mistral-key",
                     ]
                 ),
                 encoding="utf-8",
@@ -43,6 +44,7 @@ def test_parse_env_file_extracts_supported_keys(self) -> None:
             self.assertEqual(creds.firecrawl_api_key, "fc-key")
             self.assertEqual(creds.brave_api_key, "brave-key")
             self.assertEqual(creds.tavily_api_key, "tavily-key")
+            self.assertEqual(creds.mistral_transcription_api_key, "mistral-key")
 
     def test_parse_env_assignments_preserves_generic_workspace_keys(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
@@ -74,6 +76,7 @@ def test_store_roundtrip(self) -> None:
                 firecrawl_api_key="fc",
                 brave_api_key="brave",
                 tavily_api_key="tavily",
+                mistral_transcription_api_key="mistral",
             )
             store.save(creds)
             loaded = store.load()
diff --git a/tests/test_settings.py b/tests/test_settings.py
index c01e1a41..6a645a98 100644
--- a/tests/test_settings.py
+++ b/tests/test_settings.py
@@ -4,7 +4,9 @@
 import unittest
 from pathlib import Path
 
+from agent.__main__ import _resolve_provider
 from agent.builder import _validate_model_provider, infer_provider_for_model
+from agent.credentials import CredentialBundle
 from agent.model import ModelError
 from agent.settings import PersistentSettings, SettingsStore, normalize_reasoning_effort
 from agent.tui import SLASH_COMMANDS, _compute_suggestions
@@ -240,5 +242,11 @@ def test_unknown_model_passes(self) -> None:
         _validate_model_provider("some-random-model", "anthropic")
 
 
+class ResolveProviderTests(unittest.TestCase):
+    def test_mistral_transcription_key_does_not_change_chat_provider(self) -> None:
+        creds = CredentialBundle(mistral_transcription_api_key="mistral-test")
+        self.assertEqual(_resolve_provider("auto", creds), "anthropic")
+
+
 if __name__ == "__main__":
     unittest.main()
diff --git a/tests/test_tool_defs.py b/tests/test_tool_defs.py
index 5efccd53..a985725b 100644
--- a/tests/test_tool_defs.py
+++ b/tests/test_tool_defs.py
@@ -30,7 +30,7 @@ def test_tool_count(self) -> None:
         self.assertEqual(len(names), len(TOOL_DEFINITIONS))
         expected = {
             "list_files", "search_files", "repo_map", "web_search", "fetch_url",
-            "read_file", "read_image", "write_file", "apply_patch", "edit_file",
+            "read_file", "read_image", "audio_transcribe", "write_file", "apply_patch", "edit_file",
             "hashline_edit",
             "run_shell", "run_shell_bg", "check_shell_bg", "kill_shell_bg",
             "think", "subtask", "execute",

From 2edd482ff645893937468d959cd3a4e92eee29a0 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 09:07:20 -0400
Subject: [PATCH 40/58] docs: add vision document

---
 VISION.md | 728 ++++++++++++++++++++++++++++++++++++++++++++++++++++++
 1 file changed, 728 insertions(+)
 create mode 100644 VISION.md

diff --git a/VISION.md b/VISION.md
new file mode 100644
index 00000000..d35d7ccc
--- /dev/null
+++ b/VISION.md
@@ -0,0 +1,728 @@
+# OpenPlanter: Vision Document
+
+**An Open-Source Intelligence & Data Operations Platform**
+
+*Version 0.1 -- February 2026*
+
+---
+
+## Table of Contents
+
+1. [Executive Summary](#1-executive-summary)
+2. [Understanding the Landscape: What Palantir Does](#2-understanding-the-landscape-what-palantir-does)
+3. [Existing Alternatives and Gaps](#3-existing-alternatives-and-gaps)
+4. [Mission Statement](#4-mission-statement)
+5. [Core Feature Set](#5-core-feature-set)
+6. [Architecture Ideas](#6-architecture-ideas)
+7. [What Makes OpenPlanter Different](#7-what-makes-openplanter-different)
+8. [Potential Use Cases](#8-potential-use-cases)
+9. [Phased Roadmap](#9-phased-roadmap)
+10. [Existing Open-Source Building Blocks](#10-existing-open-source-building-blocks)
+11. [Research Sources](#11-research-sources)
+
+---
+
+## 1. Executive Summary
+
+Palantir Technologies has built a multi-billion dollar business around a deceptively simple insight: organizations drown in data not because they lack storage or compute, but because they lack a **unified semantic layer** that connects disparate data sources into a coherent model of reality -- and then lets humans and AI agents **act** on that model.
+
+Palantir's moat is not any single algorithm. It is the *integration* -- the ontology layer that turns raw tables into entities and relationships, the visualization tools that let analysts explore those relationships across graphs, maps, and timelines, the action framework that lets decisions flow back into operational systems, and the deployment machinery that makes all of this work in sensitive, air-gapped environments.
+
+No single open-source project replicates this today. But the building blocks exist. **OpenPlanter** is a vision for composing those building blocks into a coherent, open-source platform that delivers Palantir-class capabilities to organizations that cannot afford Palantir, do not want vendor lock-in, or need the transparency that only open source provides.
+
+---
+
+## 2. Understanding the Landscape: What Palantir Does
+
+### 2.1 Palantir Gotham (Intelligence & Defense)
+
+Gotham is Palantir's original product, built for intelligence agencies and military organizations. Its core capabilities include:
+
+- **Data Integration**: Connectors to structured sources (databases, ERP, CRM), semi-structured (logs, XML), and unstructured (PDFs, emails, imagery), with heavy investment in deduplication and entity resolution.
+- **Ontology / Entity Graph**: A dynamic ontology that tags entities (persons, phone numbers, addresses, organizations, assets) and places links between them. This is the "digital twin" of the intelligence domain.
+- **Link Analysis (Graph)**: A network analysis canvas where analysts create visual representations of networked data. Users can view aggregated property statistics, organize and style graphs, and annotate them as part of collaborative workflows.
+- **Geospatial Analysis**: Map layers showing entity locations, event timelines, and movement patterns.
+- **Object Explorer**: Top-down analysis enabling users to find entities with similar characteristics and visualize relationships across millions of records.
+- **Collaboration**: Real-time concurrent analysis within Graph and other applications. Shared canvases, annotations, and presentation workflows.
+
+### 2.2 Palantir Foundry (Commercial & Government Operations)
+
+Foundry is the commercial platform -- a "data operating system" for enterprises:
+
+- **Data Integration**: Pipeline-based ingestion from any source, with data transformation and cleaning.
+- **Ontology Layer**: The signature feature. The Foundry Ontology sits on top of datasets and models, connecting them to their real-world counterparts (factories, equipment, products, orders, transactions). It contains both semantic elements (objects, properties, links) and kinetic elements (actions, functions, dynamic security).
+- **Ontology Architecture**: A microservices backend with the Ontology Metadata Service (OMS) defining object types, link types, and action types; the Object Data Funnel orchestrating data writes and indexing; and Object Storage V2 separating indexing from querying for horizontal scalability.
+- **Application Building**: Low-code/no-code tools for building operational applications on top of the ontology.
+- **Workshop & Quiver**: Drag-and-drop application builders for dashboards and operational workflows.
+
+### 2.3 Palantir AIP (Artificial Intelligence Platform)
+
+AIP integrates LLMs and AI agents into the ontology:
+
+- **Ontology-Grounded AI**: AI agents reason over the ontology's entities, relationships, and business logic rather than raw data. The ontology provides "the nouns" (entities) and "the verbs" (actions) of the enterprise.
+- **AIP Agent Studio**: Build, test, and deploy AI agents that can read from and write to the ontology. Agents are sandboxed with specific permissions on data and tools.
+- **AIP Logic**: A no-code environment for building LLM-powered functions that leverage the ontology.
+- **Agents as Functions**: Agents can be published as Functions, making them composable and reusable across the platform.
+
+### 2.4 Palantir Apollo (Continuous Delivery & Operations)
+
+Apollo is the deployment and operations layer:
+
+- **Hub and Spoke Architecture**: A central Apollo Hub manages multiple Spoke environments, each running a Spoke Control Plane that reports telemetry and executes deployment plans.
+- **Pull-Based Deployment**: Instead of pushing code, environments pull updates via subscriptions to Release Channels.
+- **Air-Gapped Support**: Manages software across connected and disconnected environments, critical for defense and regulated industries.
+- **Compliance-Aware**: Built-in controls for FedRAMP, IL5, IL6 accreditation frameworks.
+
+### 2.5 The Palantir "Secret Sauce"
+
+The real power is not any individual product but their integration:
+
+1. **Data goes in** (any format, any source)
+2. **Ontology maps it** to real-world entities and relationships
+3. **Humans explore it** via graphs, maps, timelines, dashboards
+4. **AI reasons over it** grounded in the ontology
+5. **Actions flow back** into operational systems
+6. **Apollo deploys it** anywhere, including air-gapped environments
+7. **Security governs it** at every layer with fine-grained access control
+
+---
+
+## 3. Existing Alternatives and Gaps
+
+### 3.1 Commercial Alternatives
+
+| Product | Strengths | Gaps vs. Palantir |
+|---------|-----------|-------------------|
+| **Databricks** | Unified analytics, Delta Lake, MLflow | No ontology layer, no link analysis, no investigative UI |
+| **Snowflake** | Data warehousing, data sharing | Pure storage/compute, no semantic layer |
+| **Dataiku** | End-to-end data science | Weaker on ontology and operational applications |
+| **d.AP (digetiers)** | Ontology-grounded on RDF/OWL open standards | Newer, smaller ecosystem |
+| **DataWalk** | Link analysis, investigative analysis | Proprietary, narrower scope |
+| **Siren** | Investigative intelligence, link analysis | Proprietary, Elasticsearch-based |
+| **C3 AI** | Enterprise AI applications | Proprietary, expensive |
+
+### 3.2 Open-Source Landscape
+
+**What exists today:**
+
+- **Data Integration/ETL**: Apache Airflow, Apache NiFi, Apache Hop, Apache Kafka, Apache Beam, Airbyte, dbt
+- **Data Catalogs/Metadata**: OpenMetadata, DataHub (LinkedIn), Amundsen (Lyft), Apache Atlas
+- **Graph Databases**: Neo4j (Community Edition), JanusGraph, Apache TinkerPop, Apache AGE (Postgres extension)
+- **Entity Resolution**: Zingg (ML-based), Splink (probabilistic), Dedupe (Python)
+- **Knowledge Graphs**: WhyHow Knowledge Graph Studio, Graphiti, KBpedia
+- **Visualization**: Apache Superset (dashboards), Grafana (monitoring), Kepler.gl (geospatial), Gephi (graph), Sigma.js (graph/web)
+- **AI/LLM Frameworks**: LangChain, LlamaIndex, LangGraph, CrewAI, Dify
+- **Authorization**: Casbin, Ory Keto, Permify (Zanzibar-inspired RBAC)
+- **Deployment**: ArgoCD, Flux, Kubernetes
+
+**The critical gap:** No single open-source project or composition of projects provides the **ontology-as-operating-system** experience -- the unified semantic layer that sits between raw data and applications/AI, with integrated entity resolution, link analysis visualization, and action frameworks. Projects exist in silos. The integration *is* the product, and that integration does not exist in open source.
+
+### 3.3 The Closest Attempts
+
+- **Dashjoin**: An open-source low-code platform that establishes a linked data graph over data sources with browsing, searching, editing, AI integration, and GitOps delivery. The closest thing to an integrated Palantir alternative in open source, but significantly smaller in scope and community.
+- **Apache Atlas + JanusGraph + Superset**: A common open-source stack for metadata governance and visualization, but lacks the ontology-driven application layer and investigative UI.
+
+---
+
+## 4. Mission Statement
+
+### The Problem
+
+Organizations of all sizes face the same fundamental challenge that Palantir solves for the world's largest governments and enterprises: **their data is fragmented across dozens of systems, in incompatible formats, with no unified way to understand what the data represents in the real world, explore relationships, or act on insights.**
+
+Today, solving this problem requires either (a) paying millions for Palantir, (b) assembling a bespoke stack from dozens of open-source tools with no integration layer, or (c) going without.
+
+### The Mission
+
+**OpenPlanter is a free, open-source data operations platform that unifies data integration, semantic modeling, entity resolution, visual analysis, AI reasoning, and operational action into a single coherent system.**
+
+OpenPlanter makes it possible for any organization -- investigative journalists, humanitarian NGOs, academic researchers, mid-sized enterprises, local governments, open-source intelligence analysts -- to turn fragmented data into an entity-relationship model of their domain, explore it visually, reason over it with AI, and take action.
+
+### Core Principles
+
+1. **Open Source, Always**: Apache 2.0 or similar permissive license. No open-core bait-and-switch.
+2. **Ontology-First**: The semantic model is the core abstraction. Everything else -- ingestion, visualization, AI, actions -- operates through the ontology.
+3. **Composable**: Built as a set of well-defined services with clean APIs. Use the whole platform or individual components.
+4. **AI-Native**: LLM and agent integration is not an afterthought -- it is a first-class capability grounded in the ontology.
+5. **Security by Design**: Fine-grained access control (RBAC + ABAC), audit logging, and data provenance from day one.
+6. **Deploy Anywhere**: Cloud, on-premise, air-gapped, edge. Kubernetes-native with support for disconnected environments.
+
+---
+
+## 5. Core Feature Set
+
+### 5.1 Data Integration & Ingestion
+
+**Goal**: Connect to any data source and bring data into the platform with minimal friction.
+
+| Capability | Description | Priority |
+|-----------|-------------|----------|
+| Connectors | Pre-built connectors for databases (Postgres, MySQL, SQL Server, Oracle), cloud storage (S3, GCS, Azure Blob), APIs (REST, GraphQL), files (CSV, JSON, Parquet, XML), messaging (Kafka, RabbitMQ) | MVP |
+| Custom Connectors | SDK for building custom connectors | v1.0 |
+| Stream Ingestion | Real-time data ingestion from streaming sources | v1.0 |
+| Data Transformation | Pipeline-based transformation with versioning | MVP |
+| Incremental Sync | Change data capture and incremental updates | v1.0 |
+| Unstructured Ingestion | PDF, email, document, and image ingestion with AI-powered extraction | v1.5 |
+
+### 5.2 Data Modeling & Ontology
+
+**Goal**: Provide a semantic layer that maps raw data to real-world entities and relationships.
+
+This is the heart of OpenPlanter and the primary differentiator from "just another data tool."
+
+| Capability | Description | Priority |
+|-----------|-------------|----------|
+| Object Types | Define entity types (Person, Organization, Vehicle, Transaction, Event, etc.) with typed properties | MVP |
+| Link Types | Define relationship types between object types (employs, owns, communicated_with, located_at) with properties | MVP |
+| Ontology Editor | Visual and code-based tools for defining and editing the ontology schema | MVP |
+| Data Mapping | Map raw dataset columns to ontology object properties, with transformation rules | MVP |
+| Entity Resolution | ML-assisted deduplication and entity resolution across data sources | MVP |
+| Interface Types | Polymorphic interfaces (like Palantir's) for consistent modeling across object types that share common shapes | v1.0 |
+| Ontology Versioning | Schema versioning with migration support | v1.0 |
+| Derived Properties | Computed properties based on linked objects, aggregations, or functions | v1.0 |
+| Temporal Modeling | First-class support for time-varying properties and historical states | v1.5 |
+
+**Ontology Data Model (Conceptual)**:
+
+```
+ObjectType
+  - id: UUID
+  - name: string (e.g., "Person", "Organization")
+  - properties: PropertyDefinition[]
+  - interfaces: InterfaceType[]
+  - datasource_mappings: DataSourceMapping[]
+
+LinkType
+  - id: UUID
+  - name: string (e.g., "employed_by", "called")
+  - source_type: ObjectType
+  - target_type: ObjectType
+  - properties: PropertyDefinition[]
+  - cardinality: ONE_TO_ONE | ONE_TO_MANY | MANY_TO_MANY
+
+Object (instance)
+  - id: UUID
+  - type: ObjectType
+  - properties: { [key]: value }
+  - provenance: DataSource[]  -- which sources contributed to this object
+  - confidence: float          -- entity resolution confidence
+  - timestamps: { created, modified, valid_from, valid_to }
+
+Link (instance)
+  - id: UUID
+  - type: LinkType
+  - source: Object
+  - target: Object
+  - properties: { [key]: value }
+  - provenance: DataSource[]
+```
+
+### 5.3 Search & Discovery
+
+**Goal**: Find any entity, relationship, or pattern across the entire ontology.
+
+| Capability | Description | Priority |
+|-----------|-------------|----------|
+| Full-Text Search | Search across all object properties with relevance ranking | MVP |
+| Faceted Search | Filter by object type, property values, date ranges, data source | MVP |
+| Graph Traversal Search | "Find all entities within N hops of entity X" | MVP |
+| Saved Searches | Save and share search queries | v1.0 |
+| Natural Language Search | AI-powered "ask a question in plain English" search | v1.0 |
+| Pattern Search | Find subgraph patterns (e.g., "person connected to organization through phone number") | v1.5 |
+
+### 5.4 Visualization & Analytics
+
+**Goal**: Multiple visual paradigms for exploring the ontology -- because different questions require different views.
+
+| Capability | Description | Priority |
+|-----------|-------------|----------|
+| **Graph View** | Interactive link analysis canvas. Expand entities, explore connections, filter, cluster, style nodes/edges. The primary investigative interface. | MVP |
+| **Table View** | Spreadsheet-like view of object collections with sorting, filtering, grouping | MVP |
+| **Map View** | Geospatial visualization of entities with location properties. Layers, clustering, heatmaps. | MVP |
+| **Timeline View** | Temporal visualization of events and entity activity | v1.0 |
+| **Dashboard Builder** | Drag-and-drop dashboard composition from charts, tables, maps, and graphs | v1.0 |
+| **Object Profile** | Detailed view of a single entity with all properties, linked entities, activity timeline, and source provenance | MVP |
+| **Histogram / Charts** | Bar, line, pie, scatter, and other statistical visualizations over ontology data | v1.0 |
+| **Notebook Integration** | Jupyter-style notebook for ad-hoc analysis with access to ontology APIs | v1.5 |
+
+### 5.5 Collaboration
+
+**Goal**: Multiple users working together on investigations, analyses, and operational workflows.
+
+| Capability | Description | Priority |
+|-----------|-------------|----------|
+| Workspaces | Shared project spaces for team collaboration | MVP |
+| Annotations | Add notes, tags, and assessments to any entity or relationship | MVP |
+| Canvas Sharing | Share and co-edit graph, map, and timeline canvases | v1.0 |
+| Comments | Threaded comments on any object, link, or analysis artifact | v1.0 |
+| Activity Feed | See what teammates have been exploring, annotating, or modifying | v1.0 |
+| Audit Trail | Full history of who viewed, modified, or exported what data | MVP |
+
+### 5.6 AI / ML Integration
+
+**Goal**: AI agents that can reason over the ontology, answer questions, and take actions -- grounded in real data, not hallucinations.
+
+| Capability | Description | Priority |
+|-----------|-------------|----------|
+| Ontology-Grounded RAG | LLM queries answered using ontology entities and relationships as context | MVP |
+| Natural Language Query | "Show me all transactions over $10K between Company A and any entity flagged as high-risk" | v1.0 |
+| Entity Extraction (NER) | AI-powered extraction of entities and relationships from unstructured text | v1.0 |
+| AI Agent Framework | Agents with tool-calling that can search the ontology, traverse graphs, create annotations, and suggest actions | v1.0 |
+| Anomaly Detection | ML models that identify unusual patterns in entity behavior or relationships | v1.5 |
+| Agent Sandboxing | Fine-grained permissions for what data and actions agents can access | v1.0 |
+| Model Registry | Register and version ML models, connect outputs to ontology | v1.5 |
+| Bring Your Own LLM | Support for OpenAI, Anthropic, local models (Ollama, vLLM), or any OpenAI-compatible API | MVP |
+
+### 5.7 Actions & Operational Integration
+
+**Goal**: Move from insight to action -- write changes back to source systems, trigger workflows, and automate operational responses.
+
+| Capability | Description | Priority |
+|-----------|-------------|----------|
+| Action Types | Define typed actions (approve, escalate, flag, update, notify) with input/output schemas | v1.0 |
+| Action Execution | Execute actions that write back to source systems via connectors | v1.0 |
+| Workflow Engine | Multi-step workflows triggered by events, schedules, or human decisions | v1.5 |
+| Webhooks | Outbound webhooks on ontology events (entity created, link added, property changed) | v1.0 |
+| Notifications | Alerts and notifications based on ontology events or AI agent findings | v1.0 |
+
+### 5.8 Access Control & Security
+
+**Goal**: Enterprise-grade security that operates at the ontology level, not just the data level.
+
+| Capability | Description | Priority |
+|-----------|-------------|----------|
+| Authentication | SSO (SAML, OIDC), local accounts, API keys | MVP |
+| RBAC | Role-based access control (admin, analyst, viewer, etc.) | MVP |
+| Object-Level Permissions | Control who can see/edit specific object types | MVP |
+| Property-Level Masking | Mask sensitive properties (SSN, financial data) based on role | v1.0 |
+| Row-Level Security | Filter visible objects based on user attributes (department, clearance, geography) | v1.0 |
+| Marking/Classification | Apply classification markings to data and enforce handling rules | v1.5 |
+| Audit Logging | Immutable audit log of all data access, modifications, and exports | MVP |
+| Data Provenance | Track which source contributed each property value, with lineage | MVP |
+
+---
+
+## 6. Architecture Ideas
+
+### 6.1 High-Level Architecture
+
+```
++------------------------------------------------------------------+
+|                        OpenPlanter Platform                       |
++------------------------------------------------------------------+
+|                                                                    |
+|  +-------------------+  +-------------------+  +----------------+ |
+|  |   Web UI (SPA)    |  |   CLI / SDK       |  |  REST/GraphQL  | |
+|  |   React + D3/     |  |   Python / TS     |  |  API Gateway   | |
+|  |   Sigma.js/Deck.gl|  |                   |  |                | |
+|  +--------+----------+  +--------+----------+  +-------+--------+ |
+|           |                       |                      |         |
+|  +--------v-----------------------v----------------------v------+  |
+|  |                    API Layer (Gateway)                        |  |
+|  |             Authentication | Rate Limiting | Routing          |  |
+|  +---+----------+----------+----------+----------+-----------+--+  |
+|      |          |          |          |          |           |      |
+|  +---v---+ +---v----+ +--v----+ +---v----+ +---v-----+ +--v---+  |
+|  |Ontology| |Search  | |Visual | |  AI    | |Actions  | |Auth  |  |
+|  |Service | |Service | |Service| |Service | |Service  | |Svc   |  |
+|  +---+---+ +---+----+ +--+----+ +---+----+ +---+-----+ +--+---+  |
+|      |         |          |          |          |           |      |
+|  +---v---------v----------v----------v----------v-----------v---+  |
+|  |              Ontology Storage Layer                           |  |
+|  |  +-------------+  +------------+  +-----------------------+  |  |
+|  |  | Graph DB     |  | Search     |  | Object/Relational    |  |  |
+|  |  | (Neo4j/      |  | (Elastic/  |  | Store (Postgres)     |  |  |
+|  |  |  JanusGraph)  |  |  Typesense)|  |                      |  |  |
+|  |  +-------------+  +------------+  +-----------------------+  |  |
+|  +--------------------------------------------------------------+  |
+|                                                                    |
+|  +--------------------------------------------------------------+  |
+|  |              Data Integration Layer                           |  |
+|  |  +----------+  +----------+  +----------+  +-------------+  |  |
+|  |  | Connectors|  | Transform|  | Entity   |  | Pipeline    |  |  |
+|  |  | (Airbyte) |  | (dbt)    |  | Resolver |  | Orchestrator|  |  |
+|  |  |           |  |          |  | (Zingg/  |  | (Airflow/   |  |  |
+|  |  |           |  |          |  |  Splink) |  |  Temporal)  |  |  |
+|  |  +----------+  +----------+  +----------+  +-------------+  |  |
+|  +--------------------------------------------------------------+  |
+|                                                                    |
+|  +--------------------------------------------------------------+  |
+|  |              Infrastructure Layer                             |  |
+|  |  Kubernetes | Helm Charts | Monitoring (Prometheus/Grafana)   |  |
+|  |  Object Storage (MinIO/S3) | Message Queue (Kafka/NATS)      |  |
+|  +--------------------------------------------------------------+  |
++------------------------------------------------------------------+
+```
+
+### 6.2 Key Architectural Decisions
+
+**Decision 1: Ontology Storage -- Polyglot Persistence**
+
+The ontology needs to be queryable in multiple ways simultaneously:
+- **Graph traversals** (follow relationships N hops) --> Graph database
+- **Full-text search** (find entities by keyword) --> Search engine
+- **Aggregations and analytics** (count, sum, group) --> Relational/columnar database
+- **High-volume writes** (ingest pipelines) --> Write-optimized store
+
+Rather than picking one database, use a **polyglot persistence** approach with an Ontology Storage Layer that writes to multiple backends and keeps them in sync via an event bus:
+
+- **PostgreSQL** (with Apache AGE extension for graph queries): Primary store of record for object and link instances. Proven, reliable, rich ecosystem. AGE adds Cypher query support directly in Postgres.
+- **Elasticsearch or Typesense**: Full-text search index, kept in sync via change data capture.
+- **Neo4j Community Edition or JanusGraph**: Dedicated graph store for deep traversal queries. Neo4j CE for simpler deployments; JanusGraph for distributed scale.
+
+**Decision 2: Ontology Service -- The Central Nervous System**
+
+A dedicated Ontology Service acts as the single API for reading and writing ontology data. All other services (search, visualization, AI, actions) interact with the ontology through this service. This ensures:
+- Consistent schema enforcement
+- Centralized access control
+- Event emission for all mutations (enabling downstream sync and audit)
+
+**Decision 3: Event-Driven Architecture**
+
+All ontology mutations produce events on a message bus (Kafka or NATS):
+- `object.created`, `object.updated`, `object.deleted`
+- `link.created`, `link.updated`, `link.deleted`
+- `action.executed`
+
+This enables:
+- Search index updates
+- Graph database sync
+- Audit logging
+- Webhook delivery
+- AI agent triggers
+- Real-time UI updates via WebSockets
+
+**Decision 4: Frontend -- React with Specialized Visualization Libraries**
+
+- **Core Framework**: React (TypeScript)
+- **Graph Visualization**: Sigma.js (WebGL-based, handles large graphs) or Cytoscape.js
+- **Geospatial**: Deck.gl (WebGL, large-scale) or Leaflet (simpler)
+- **Charts/Dashboards**: Apache ECharts or Recharts
+- **Timeline**: vis-timeline or custom D3-based
+- **Layout**: A workspace model (like VS Code) where users can arrange panels
+
+**Decision 5: AI Integration -- Plugin Architecture**
+
+Rather than hardcoding LLM providers:
+- Define an **LLM Provider Interface** that abstracts model calls
+- Ship adapters for OpenAI, Anthropic, Ollama (local), vLLM
+- Use LangChain or LlamaIndex internally for RAG pipeline
+- Agents use a **Tool** abstraction that maps to ontology operations (search, traverse, annotate, execute action)
+
+### 6.3 Proposed Tech Stack
+
+| Layer | Technology | License | Rationale |
+|-------|-----------|---------|-----------|
+| **Frontend** | React + TypeScript | MIT | Industry standard, massive ecosystem |
+| **Graph Viz** | Sigma.js | MIT | WebGL performance for large graphs |
+| **Geo Viz** | Deck.gl | MIT | High-performance geospatial |
+| **Charts** | Apache ECharts | Apache 2.0 | Rich chart types, good performance |
+| **API Gateway** | Kong or Traefik | Apache 2.0 | API management, auth, rate limiting |
+| **Backend Services** | Python (FastAPI) or Go | MIT / BSD | FastAPI for rapid development; Go for performance-critical services |
+| **Primary DB** | PostgreSQL + Apache AGE | PostgreSQL / Apache 2.0 | Relational + graph in one, proven at scale |
+| **Search** | Typesense or Elasticsearch | GPL-3 / SSPL | Typesense is simpler and truly open; Elasticsearch has larger ecosystem |
+| **Graph DB** (optional) | Neo4j CE or JanusGraph | GPL-3 / Apache 2.0 | Deep traversal queries; optional if AGE suffices |
+| **Message Bus** | NATS or Apache Kafka | Apache 2.0 | NATS for simplicity; Kafka for scale |
+| **Object Storage** | MinIO | AGPL-3.0 | S3-compatible, for documents and files |
+| **Pipeline Orchestration** | Apache Airflow or Temporal | Apache 2.0 / MIT | Airflow for batch; Temporal for event-driven workflows |
+| **Data Connectors** | Airbyte | MIT (Elv2 for some) | 300+ pre-built connectors |
+| **Entity Resolution** | Zingg or Splink | AGPL-3.0 / MIT | ML-based dedup and entity resolution |
+| **AI/RAG** | LangChain + LlamaIndex | MIT | RAG pipeline and agent framework |
+| **Auth** | Keycloak + Casbin | Apache 2.0 | SSO + fine-grained policy engine |
+| **Deployment** | Kubernetes + Helm | Apache 2.0 | Standard cloud-native deployment |
+| **Monitoring** | Prometheus + Grafana | Apache 2.0 | Observability |
+
+---
+
+## 7. What Makes OpenPlanter Different
+
+### 7.1 vs. Palantir
+
+| Dimension | Palantir | OpenPlanter |
+|-----------|----------|-------------|
+| **Cost** | Millions per year | Free (self-hosted) |
+| **Transparency** | Proprietary black box | Full source code visibility |
+| **Vendor Lock-in** | Extreme -- data model tied to platform | Open formats, standard APIs, portable ontology |
+| **Customization** | Services engagement required | Fork it, extend it, contribute back |
+| **Community** | Palantir employees only | Open contributor community |
+| **AI Models** | Palantir-selected models | Bring your own -- local, cloud, or any provider |
+| **Deployment** | Palantir-managed | Self-managed with Helm charts, or managed by community providers |
+
+### 7.2 vs. Other Open-Source Tools
+
+| Dimension | Typical OSS Stack | OpenPlanter |
+|-----------|-------------------|-------------|
+| **Integration** | Assemble 10+ tools yourself, build glue code | Integrated platform with shared ontology |
+| **Ontology** | Each tool has its own data model | Single semantic ontology layer across all features |
+| **Entity Resolution** | Run separately, reconcile manually | Built-in, continuous ER feeding the ontology |
+| **Visualization** | Superset for charts, Gephi for graphs, Kepler for maps -- disconnected | Unified workspace with graph, map, timeline, charts sharing one ontology |
+| **AI Grounding** | RAG over raw data | RAG over the ontology -- entities and relationships, not raw tables |
+| **Access Control** | Bolt-on per tool | Ontology-level security that governs all views |
+
+### 7.3 The Core Differentiator
+
+**OpenPlanter's differentiator is the ontology as the universal API.** Every feature -- ingestion, search, visualization, AI, actions, security -- speaks the language of entities and relationships, not tables and columns. This is what makes Palantir powerful, and it is what no open-source project currently provides as a unified, integrated experience.
+
+---
+
+## 8. Potential Use Cases
+
+### 8.1 Investigative Journalism
+
+Journalists investigating financial crime, political corruption, or corporate misconduct need to connect entities (people, companies, addresses, bank accounts) from leaked documents, public records, and proprietary databases. OpenPlanter would provide the graph analysis, entity resolution, and document ingestion to do this -- capabilities currently available only through expensive tools or manual effort.
+
+*Example: A newsroom integrates Panama Papers data, corporate registries, and political donation records. OpenPlanter resolves entities across sources and reveals hidden ownership networks.*
+
+### 8.2 Humanitarian & NGO Operations
+
+Organizations like the UNHCR, Red Cross, or Doctors Without Borders manage operations across fragmented data systems -- beneficiary registries, supply chain databases, field reports, geospatial data. OpenPlanter could unify this into a coherent operational picture.
+
+*Example: An NGO integrates refugee registration data, supply depot inventories, and field incident reports to optimize resource allocation and identify underserved areas.*
+
+### 8.3 Open-Source Intelligence (OSINT)
+
+OSINT analysts -- whether in journalism, civil society, or academic research -- need to collect, structure, and analyze publicly available information. OpenPlanter would provide the entity resolution, link analysis, and geospatial tools that are currently locked in expensive proprietary platforms.
+
+*Example: Researchers tracking the spread of disinformation map social media accounts, websites, and funding sources to reveal coordinated influence networks.*
+
+### 8.4 Academic & Scientific Research
+
+Researchers studying complex systems (epidemiology, climate, social networks, supply chains) need to integrate diverse datasets and explore relationships. OpenPlanter's ontology and visualization tools would serve as a research platform.
+
+*Example: Epidemiologists integrate hospital records, genomic data, and mobility data to model disease transmission networks.*
+
+### 8.5 Small/Medium Enterprise Operations
+
+Mid-sized companies that cannot afford Palantir but need to connect their CRM, ERP, supply chain, and financial systems into a coherent view. OpenPlanter could serve as the "data operating system" for companies with 100-10,000 employees.
+
+*Example: A manufacturing company connects their ERP, IoT sensor data, supplier database, and quality control system to get end-to-end visibility into production issues.*
+
+### 8.6 Local Government & Public Sector
+
+City and county governments managing public safety, infrastructure, permits, and social services across disconnected systems. OpenPlanter could provide the unified view that large federal agencies get from Palantir.
+
+*Example: A city government integrates building permits, code violations, fire inspections, and 311 complaints to identify properties that pose safety risks.*
+
+### 8.7 Fraud Detection & Compliance
+
+Financial institutions, insurance companies, and regulatory bodies that need to detect complex fraud patterns across entity networks.
+
+*Example: A credit union integrates transaction data, account records, and external watchlists. OpenPlanter's entity resolution links related accounts, and graph analysis reveals suspicious transaction patterns.*
+
+---
+
+## 9. Phased Roadmap
+
+### Phase 0: Foundation (Months 1-3)
+
+**Goal**: Core infrastructure and ontology service that proves the concept.
+
+- [ ] Project scaffolding: monorepo, CI/CD, contribution guidelines, governance
+- [ ] **Ontology Service**: Core API for defining object types, link types, and properties
+- [ ] **PostgreSQL + Apache AGE** storage backend for objects, links, and graph queries
+- [ ] **Basic data ingestion**: CSV and JSON file upload, manual data entry
+- [ ] **Basic entity resolution**: Rule-based deduplication (exact match, fuzzy match on key fields)
+- [ ] **REST API**: Full CRUD on ontology schema and instances
+- [ ] **Authentication**: Basic auth and API keys (Keycloak integration in Phase 1)
+- [ ] **Minimal Web UI**: Object type browser, entity list view, single entity detail page
+
+**Deliverable**: A working ontology service with API, basic ingestion, and a minimal UI that lets you define a schema, import data, resolve entities, and browse entities and their relationships.
+
+### Phase 1: Core Visualization & Search (Months 4-8)
+
+**Goal**: The investigative experience -- graph, map, search, and collaboration.
+
+- [ ] **Graph Visualization**: Interactive link analysis canvas (Sigma.js-based)
+  - Expand/collapse nodes, filter by type, layout algorithms, styling
+  - Select entity in list view --> "Explore in Graph"
+- [ ] **Map View**: Geospatial visualization for entities with location properties (Deck.gl)
+- [ ] **Full-Text Search**: Elasticsearch/Typesense integration with faceted search
+- [ ] **Object Profile Page**: Comprehensive entity view with properties, links, timeline, provenance
+- [ ] **Keycloak SSO Integration**: SAML/OIDC authentication
+- [ ] **RBAC**: Role-based access control at the object type level
+- [ ] **Workspace & Annotations**: Shared workspaces, entity annotations, tagging
+- [ ] **Audit Logging**: Immutable log of all data access and modifications
+- [ ] **Connector SDK**: Framework for building data source connectors
+- [ ] **First connectors**: PostgreSQL, MySQL, REST API, S3/file system
+
+**Deliverable**: An analyst can ingest data from multiple sources, search across entities, explore relationships in a graph canvas, view entities on a map, and collaborate with teammates in shared workspaces.
+
+### Phase 2: AI & Advanced Analytics (Months 9-14)
+
+**Goal**: AI-powered analysis and richer visualization.
+
+- [ ] **LLM Integration**: Configurable LLM provider (OpenAI, Anthropic, Ollama)
+- [ ] **Ontology-Grounded RAG**: "Ask a question" interface that retrieves relevant entities/links as context
+- [ ] **Natural Language Query**: Convert natural language to ontology queries
+- [ ] **Entity Extraction (NER)**: Extract entities and relationships from unstructured text documents
+- [ ] **ML Entity Resolution**: Zingg or Splink integration for probabilistic entity resolution
+- [ ] **Timeline View**: Temporal visualization of entity activity and events
+- [ ] **Dashboard Builder**: Drag-and-drop composition of charts, tables, maps, and graphs
+- [ ] **Row-Level Security**: Filter visible objects based on user attributes
+- [ ] **Pipeline Orchestration**: Airflow/Temporal integration for scheduled ingestion pipelines
+- [ ] **Airbyte Integration**: Access to 300+ data source connectors
+- [ ] **Webhook System**: Outbound webhooks on ontology events
+
+**Deliverable**: An analyst can ask questions in natural language, have AI agents traverse the ontology to find answers, ingest and extract entities from documents, build dashboards, and set up automated data pipelines.
+
+### Phase 3: Actions, Agents & Operational Workflows (Months 15-20)
+
+**Goal**: Transform from an analytical platform into an operational one.
+
+- [ ] **Action Framework**: Define typed actions that write back to source systems
+- [ ] **AI Agent Studio**: Build and deploy agents that can read/write the ontology with tool-calling
+- [ ] **Agent Sandboxing**: Fine-grained permissions for AI agents
+- [ ] **Workflow Engine**: Multi-step, event-triggered workflows
+- [ ] **Notification System**: Alerts based on ontology events or anomalies
+- [ ] **Pattern Search**: Find subgraph patterns across the ontology
+- [ ] **Anomaly Detection**: ML-based detection of unusual patterns
+- [ ] **Property-Level Masking**: Column-level security with data masking
+- [ ] **Classification Markings**: Data classification and handling rules
+- [ ] **Notebook Integration**: Jupyter notebook with ontology SDK
+
+**Deliverable**: The platform is operational -- insights lead to actions, workflows automate responses, AI agents work alongside human analysts, and the security model supports sensitive use cases.
+
+### Phase 4: Scale, Deploy Anywhere & Ecosystem (Months 21+)
+
+**Goal**: Production hardening, deployment flexibility, and community ecosystem.
+
+- [ ] **Horizontal Scaling**: Sharded ontology storage for very large datasets
+- [ ] **Air-Gapped Deployment**: Full functionality without internet access
+- [ ] **Edge Deployment**: Lightweight deployment for resource-constrained environments
+- [ ] **Plugin Marketplace**: Community-contributed connectors, visualizations, AI agents
+- [ ] **Multi-Tenancy**: Shared infrastructure with isolated ontologies
+- [ ] **Federated Ontologies**: Connect multiple OpenPlanter instances while respecting access boundaries
+- [ ] **Compliance Frameworks**: FedRAMP, SOC 2, GDPR compliance tooling
+- [ ] **Mobile UI**: Responsive interface for field use
+- [ ] **Real-Time Collaboration**: Google Docs-style concurrent editing of canvases and annotations
+
+---
+
+## 10. Existing Open-Source Building Blocks
+
+One of OpenPlanter's strategic advantages is that it does not need to build everything from scratch. The following projects can serve as foundations:
+
+### 10.1 Data Integration & Pipeline
+
+| Project | What It Provides | How OpenPlanter Uses It | License |
+|---------|------------------|------------------------|---------|
+| **Airbyte** | 300+ pre-built data connectors | Data ingestion from any source | Elv2 (core) / MIT |
+| **Apache Airflow** | Workflow orchestration, DAGs, scheduling | Pipeline orchestration for batch ingestion | Apache 2.0 |
+| **Temporal** | Durable execution, event-driven workflows | Action execution and operational workflows | MIT |
+| **dbt** | SQL-based data transformation | Transform raw data before ontology mapping | Apache 2.0 |
+| **Apache Kafka / NATS** | Event streaming, message bus | Internal event bus for ontology mutations | Apache 2.0 |
+| **Apache NiFi** | Data flow management, visual pipeline builder | Alternative/complement to Airflow for stream processing | Apache 2.0 |
+
+### 10.2 Storage & Search
+
+| Project | What It Provides | How OpenPlanter Uses It | License |
+|---------|------------------|------------------------|---------|
+| **PostgreSQL** | Relational database | Primary store for ontology objects and metadata | PostgreSQL |
+| **Apache AGE** | Graph query extension for PostgreSQL | Graph traversal queries within Postgres | Apache 2.0 |
+| **Neo4j Community** | Native graph database | Deep traversal queries (optional) | GPL-3.0 |
+| **JanusGraph** | Distributed graph database | Large-scale graph workloads (alternative to Neo4j) | Apache 2.0 |
+| **Elasticsearch** | Search engine | Full-text search and faceted filtering | SSPL |
+| **Typesense** | Search engine (simpler, truly open) | Full-text search (alternative to ES) | GPL-3.0 |
+| **MinIO** | S3-compatible object storage | Document and file storage | AGPL-3.0 |
+
+### 10.3 Entity Resolution & Knowledge Graphs
+
+| Project | What It Provides | How OpenPlanter Uses It | License |
+|---------|------------------|------------------------|---------|
+| **Zingg** | ML-based entity resolution at scale | Deduplication and entity matching across sources | AGPL-3.0 |
+| **Splink** | Probabilistic record linkage | Scalable entity resolution (Python, multiple backends) | MIT |
+| **Dedupe** | Python entity resolution library | Lightweight ER for smaller datasets | MIT |
+| **WhyHow KG Studio** | Knowledge graph construction with entity resolution | Reference architecture for ontology management | MIT |
+
+### 10.4 Visualization
+
+| Project | What It Provides | How OpenPlanter Uses It | License |
+|---------|------------------|------------------------|---------|
+| **Sigma.js** | WebGL graph rendering for the web | Link analysis / graph exploration canvas | MIT |
+| **Cytoscape.js** | Graph theory library for visualization | Alternative graph renderer with rich layout algorithms | MIT |
+| **Deck.gl** | WebGL-powered large-scale geospatial visualization | Map view for entities with location data | MIT |
+| **Leaflet** | Lightweight interactive maps | Simpler geospatial view (alternative to Deck.gl) | BSD-2 |
+| **Apache ECharts** | Rich charting library | Dashboard charts and statistical visualizations | Apache 2.0 |
+| **vis-timeline** | Interactive timeline visualization | Timeline view for temporal entity data | MIT/Apache 2.0 |
+| **Gephi** | Desktop graph analysis tool (reference) | Architectural inspiration for graph analysis features | GPL |
+| **Apache Superset** | Dashboard and visualization platform | Reference architecture; possible embed for dashboarding | Apache 2.0 |
+
+### 10.5 AI & ML
+
+| Project | What It Provides | How OpenPlanter Uses It | License |
+|---------|------------------|------------------------|---------|
+| **LangChain** | LLM application framework | RAG pipeline, agent framework, tool integration | MIT |
+| **LlamaIndex** | Data indexing and retrieval for LLMs | Ontology-aware indexing for AI queries | MIT |
+| **LangGraph** | Graph-based agent workflows | Multi-step agent reasoning over ontology | MIT |
+| **Dify** | LLM app development platform | Reference architecture for AI integration | Apache 2.0 |
+| **Ollama** | Local LLM serving | Run models locally for air-gapped deployments | MIT |
+| **vLLM** | High-performance LLM serving | Production LLM inference | Apache 2.0 |
+
+### 10.6 Security & Auth
+
+| Project | What It Provides | How OpenPlanter Uses It | License |
+|---------|------------------|------------------------|---------|
+| **Keycloak** | Identity and access management, SSO | Authentication (SAML, OIDC, LDAP) | Apache 2.0 |
+| **Casbin** | Authorization library (RBAC, ABAC) | Fine-grained policy enforcement | Apache 2.0 |
+| **Permify** | Google Zanzibar-inspired authorization | Relationship-based access control (alternative to Casbin) | Apache 2.0 |
+| **Open Policy Agent (OPA)** | Policy engine | Policy-as-code for complex authorization rules | Apache 2.0 |
+
+### 10.7 Deployment & Operations
+
+| Project | What It Provides | How OpenPlanter Uses It | License |
+|---------|------------------|------------------------|---------|
+| **Kubernetes** | Container orchestration | Deployment platform | Apache 2.0 |
+| **Helm** | Kubernetes package manager | Deployment packaging | Apache 2.0 |
+| **ArgoCD** | GitOps continuous delivery | Automated deployment from Git | Apache 2.0 |
+| **Prometheus + Grafana** | Monitoring and observability | Platform health monitoring | Apache 2.0 |
+
+### 10.8 Data Catalogs (Reference Architecture)
+
+| Project | What It Provides | Relevance |
+|---------|------------------|-----------|
+| **OpenMetadata** | Unified metadata platform | Reference for metadata management and lineage |
+| **DataHub** | Event-driven metadata management | Reference for real-time metadata sync |
+| **Apache Atlas** | Metadata governance for Hadoop | Reference for classification and security integration |
+
+---
+
+## 11. Research Sources
+
+- [Palantir Technologies - Wikipedia](https://en.wikipedia.org/wiki/Palantir_Technologies)
+- [What Is Palantir? - Built In](https://builtin.com/articles/what-is-palantir)
+- [Palantir Ontology Overview](https://www.palantir.com/docs/foundry/ontology/overview)
+- [Palantir Ontology Architecture](https://www.palantir.com/docs/foundry/object-backend/overview)
+- [Palantir Ontology Core Concepts](https://www.palantir.com/docs/foundry/ontology/core-concepts)
+- [Understanding Palantir's Ontology: Semantic, Kinetic, and Dynamic Layers](https://pythonebasta.medium.com/understanding-palantirs-ontology-semantic-kinetic-and-dynamic-layers-explained-c1c25b39ea3c)
+- [Palantir AIP Overview](https://www.palantir.com/docs/foundry/aip/overview)
+- [AIP Agent Studio Overview](https://www.palantir.com/docs/foundry/agent-studio/overview)
+- [Palantir Apollo Platform](https://www.palantir.com/platforms/apollo/)
+- [Palantir Gotham Platform](https://www.palantir.com/platforms/gotham/)
+- [Inside Palantir: Gotham - Golding Research](https://goldingresearch.substack.com/p/inside-palantir-gotham)
+- [Demystifying Palantir: Features and Open Source Alternatives - Dashjoin](https://dashjoin.medium.com/demystifying-palantir-features-and-open-source-alternatives-ed3ed39432f9)
+- [8 Best Alternatives to Palantir Foundry in 2026 - d.AP Blog](https://www.digetiers-dap.com/post/palantir-foundry-alternatives)
+- [Top 5 Alternatives to Palantir Foundry - Orchestra](https://www.getorchestra.io/guides/top-5-alternatives-to-palantir-foundry-a-data-engineering-experts-guide)
+- [Dashjoin Platform - GitHub](https://github.com/dashjoin/platform)
+- [WhyHow Knowledge Graph Studio - GitHub](https://github.com/whyhow-ai/knowledge-graph-studio)
+- [Graphiti - Real-Time Knowledge Graphs - GitHub](https://github.com/getzep/graphiti)
+- [Zingg - Entity Resolution - GitHub](https://github.com/zinggAI/zingg)
+- [10 Best Open Source Graph Databases in 2026](https://www.index.dev/blog/top-10-open-source-graph-databases)
+- [JanusGraph vs Neo4j Comparison](https://www.puppygraph.com/blog/janusgraph-vs-neo4j)
+- [Open Source Data Governance Frameworks Analysis](https://thedataguy.pro/blog/2025/08/open-source-data-governance-frameworks/)
+- [Open Source Data Catalog: 2025 Guide](https://atlan.com/open-source-data-catalog-tools/)
+- [Top Open Source ETL Frameworks in 2026](https://www.integrate.io/blog/open-source-etl-frameworks-revolutionizing-data-integration/)
+- [12 Best Open-Source Data Orchestration Tools in 2026](https://airbyte.com/top-etl-tools-for-sources/data-orchestration-tools)
+- [15 Best Open-Source RAG Frameworks in 2026](https://www.firecrawl.dev/blog/best-open-source-rag-frameworks)
+- [Top 5 Open-Source Agentic AI Frameworks in 2026](https://aimultiple.com/agentic-frameworks)
+- [Best Open Source Data Visualization Tools for 2025](https://implex.dev/blog/top-13-best-open-source-data-visualization-tools-for-2025)
+- [Kepler.gl - Geospatial Data Visualization](https://kepler.gl/)
+- [Open Visualization Foundation](https://www.openvisualization.org/)
+- [Top 10 Open Source RBAC Tools in 2026](https://aimultiple.com/open-source-rbac)
+- [Apache Hop - Orchestration Platform](https://hop.apache.org/)
+- [Apache Beam](https://beam.apache.org/)
+- [Siren: Alternative to Palantir](https://siren.io/siren-the-only-true-alternative-to-palantir/)
+- [DataWalk: Palantir Alternative](https://datawalk.com/palantir-alternative/)
+
+---
+
+*This document is a living artifact. It represents the initial vision for OpenPlanter and should be revised as the project evolves, the community grows, and real-world usage reveals what matters most.*

From 5372b98ef2244ba341ec4250b34a59dc20f2d071 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 09:23:52 -0400
Subject: [PATCH 41/58] fix: preserve byte-safe audio chunk sizes

---
 agent/tools.py                                |   5 -
 .../crates/op-core/src/tools/audio.rs         | 111 ++++++++++++++++--
 tests/test_audio_transcribe.py                |  76 ++++++++++--
 3 files changed, 168 insertions(+), 24 deletions(-)

diff --git a/agent/tools.py b/agent/tools.py
index 3c49c899..c9a457cc 100644
--- a/agent/tools.py
+++ b/agent/tools.py
@@ -1370,11 +1370,6 @@ def audio_transcribe(
                 effective_chunk_seconds = self._audio_chunk_seconds_budget(
                     requested_chunk_seconds
                 )
-                if duration_sec > self._AUDIO_MIN_CHUNK_SECONDS:
-                    effective_chunk_seconds = max(
-                        min(duration_sec, effective_chunk_seconds),
-                        min(duration_sec, self._AUDIO_MIN_CHUNK_SECONDS),
-                    )
                 effective_overlap_seconds = min(
                     float(
                         chunk_overlap_seconds
diff --git a/openplanter-desktop/crates/op-core/src/tools/audio.rs b/openplanter-desktop/crates/op-core/src/tools/audio.rs
index 75619c01..cfee6185 100644
--- a/openplanter-desktop/crates/op-core/src/tools/audio.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/audio.rs
@@ -1008,15 +1008,11 @@ pub async fn audio_transcribe(
     };
     let requested_chunk_seconds = (chunk_max_seconds.unwrap_or(default_chunk_max_seconds) as f64)
         .min(AUDIO_MAX_CHUNK_SECONDS);
-    let mut effective_chunk_seconds =
+    let effective_chunk_seconds =
         match audio_chunk_seconds_budget(max_bytes, requested_chunk_seconds) {
             Ok(value) => value,
             Err(error) => return ToolResult::error(error),
         };
-    if duration_sec > AUDIO_MIN_CHUNK_SECONDS {
-        effective_chunk_seconds =
-            effective_chunk_seconds.max(duration_sec.min(AUDIO_MIN_CHUNK_SECONDS));
-    }
     let effective_overlap_seconds = chunk_overlap_seconds
         .unwrap_or(default_chunk_overlap_seconds)
         .min((effective_chunk_seconds - 0.001).max(0.0));
@@ -1220,7 +1216,7 @@ mod tests {
         let ffmpeg = root.join("ffmpeg");
         std::fs::write(
             &ffprobe,
-            "#!/bin/sh\nprintf '{\"format\":{\"duration\":\"58.0\"}}'\n",
+            "#!/bin/sh\nprintf '{\"format\":{\"duration\":\"50.0\"}}'\n",
         )
         .unwrap();
         std::fs::write(
@@ -1236,6 +1232,27 @@ mod tests {
         }
     }
 
+    fn install_budget_sensitive_media_tools(root: &Path, duration_seconds: f64) {
+        let ffprobe = root.join("ffprobe");
+        let ffmpeg = root.join("ffmpeg");
+        std::fs::write(
+            &ffprobe,
+            format!("#!/bin/sh\nprintf '{{\"format\":{{\"duration\":\"{duration_seconds}\"}}}}'\n"),
+        )
+        .unwrap();
+        std::fs::write(
+            &ffmpeg,
+            "#!/bin/sh\nout=\"\"\nduration=\"\"\nprev=\"\"\nfor arg in \"$@\"; do\n  if [ \"$prev\" = \"-t\" ]; then duration=\"$arg\"; fi\n  prev=\"$arg\"\n  out=\"$arg\"\ndone\nif [ -n \"$duration\" ]; then\n  bytes=$(awk \"BEGIN { printf \\\"%d\\\", $duration * 32000 }\")\n  dd if=/dev/zero of=\"$out\" bs=1 count=\"$bytes\" status=none\nelse\n  printf 'chunk' > \"$out\"\nfi\n",
+        )
+        .unwrap();
+        #[cfg(unix)]
+        {
+            use std::os::unix::fs::PermissionsExt;
+            std::fs::set_permissions(&ffprobe, std::fs::Permissions::from_mode(0o755)).unwrap();
+            std::fs::set_permissions(&ffmpeg, std::fs::Permissions::from_mode(0o755)).unwrap();
+        }
+    }
+
     #[tokio::test]
     async fn test_audio_transcribe_success() {
         let dir = tempdir().unwrap();
@@ -1369,7 +1386,7 @@ mod tests {
         });
 
         let audio = dir.path().join("clip.wav");
-        std::fs::write(&audio, vec![b'x'; 512]).unwrap();
+        std::fs::write(&audio, vec![b'x'; 1_200_000]).unwrap();
         let root = dir.path().to_path_buf();
         let mut files_read = HashSet::new();
 
@@ -1378,7 +1395,7 @@ mod tests {
             Some("mistral-key"),
             &format!("http://{}", addr),
             "voxtral-mini-latest",
-            64,
+            1_100_000,
             900,
             2.0,
             48,
@@ -1416,4 +1433,82 @@ mod tests {
         assert_eq!(parsed["response"]["segments"][0]["speaker"], "c0_speaker_a");
         assert_eq!(parsed["response"]["segments"][1]["speaker"], "c1_speaker_a");
     }
+
+    #[tokio::test]
+    async fn test_audio_transcribe_preserves_byte_budgeted_chunk_size() {
+        let dir = tempdir().unwrap();
+        install_budget_sensitive_media_tools(dir.path(), 35.0);
+        let original_path = std::env::var_os("PATH");
+        unsafe {
+            let mut parts = vec![dir.path().to_path_buf()];
+            if let Some(existing) = &original_path {
+                parts.extend(std::env::split_paths(existing));
+            }
+            std::env::set_var("PATH", std::env::join_paths(parts).unwrap());
+        }
+
+        let counter = Arc::new(Mutex::new(0usize));
+        let counter_clone = counter.clone();
+        let app = Router::new().route(
+            "/v1/audio/transcriptions",
+            post(move |_body: Bytes| {
+                let counter = counter_clone.clone();
+                async move {
+                    let mut state = counter.lock().unwrap();
+                    *state += 1;
+                    Json(json!({
+                        "text": format!("chunk {}", *state),
+                    }))
+                }
+            }),
+        );
+        let listener = TcpListener::bind("127.0.0.1:0").await.unwrap();
+        let addr = listener.local_addr().unwrap();
+        tokio::spawn(async move {
+            axum::serve(listener, app).await.unwrap();
+        });
+
+        let audio = dir.path().join("clip.wav");
+        std::fs::write(&audio, vec![b'x'; 512]).unwrap();
+        let root = dir.path().to_path_buf();
+        let mut files_read = HashSet::new();
+
+        let result = audio_transcribe(
+            &root,
+            Some("mistral-key"),
+            &format!("http://{}", addr),
+            "voxtral-mini-latest",
+            300_000,
+            900,
+            0.0,
+            48,
+            "clip.wav",
+            None,
+            None,
+            None,
+            None,
+            None,
+            None,
+            Some("force"),
+            Some(30),
+            Some(0.0),
+            None,
+            None,
+            20_000,
+            5,
+            5,
+            &mut files_read,
+        )
+        .await;
+
+        if let Some(value) = original_path {
+            unsafe { std::env::set_var("PATH", value) };
+        }
+
+        assert!(!result.is_error, "unexpected error: {}", result.content);
+        let parsed: Value = serde_json::from_str(&result.content).unwrap();
+        assert_eq!(parsed["mode"], "chunked");
+        assert!(parsed["chunking"]["chunk_seconds"].as_f64().unwrap() < 30.0);
+        assert!(parsed["chunking"]["total_chunks"].as_u64().unwrap() >= 5);
+    }
 }
diff --git a/tests/test_audio_transcribe.py b/tests/test_audio_transcribe.py
index be70f572..215a38f3 100644
--- a/tests/test_audio_transcribe.py
+++ b/tests/test_audio_transcribe.py
@@ -90,15 +90,15 @@ def test_audio_transcribe_path_escape_blocked(self, tmp_path: Path) -> None:
 
     def test_audio_transcribe_auto_chunks_oversize_files(self, tmp_path: Path) -> None:
         audio = tmp_path / "clip.wav"
-        _write_audio(audio, payload=b"x" * 512)
+        _write_audio(audio, payload=b"x" * 1_200_000)
         tools = _make_tools(
             tmp_path,
-            mistral_transcription_max_bytes=64,
+            mistral_transcription_max_bytes=1_100_000,
         )
 
         with pytest.MonkeyPatch.context() as mp:
             mp.setattr(tools, "_ensure_media_tools", lambda: None)
-            mp.setattr(tools, "_probe_media_duration", lambda _: 58.0)
+            mp.setattr(tools, "_probe_media_duration", lambda _: 50.0)
 
             def fake_extract(
                 source: Path,
@@ -155,8 +155,12 @@ def fake_extract(
         assert parsed["chunking"]["total_chunks"] == 2
         assert parsed["response"]["segments"][0]["speaker"] == "c0_speaker_a"
         assert parsed["response"]["segments"][1]["speaker"] == "c1_speaker_a"
-        assert parsed["response"]["segments"][1]["start"] == 30.0
-        assert parsed["response"]["segments"][1]["end"] == 32.0
+        assert parsed["response"]["segments"][1]["start"] == pytest.approx(
+            parsed["chunking"]["chunk_seconds"], abs=0.01
+        )
+        assert parsed["response"]["segments"][1]["end"] == pytest.approx(
+            parsed["chunking"]["chunk_seconds"] + 2.0, abs=0.01
+        )
 
     def test_audio_transcribe_off_keeps_oversize_rejection(self, tmp_path: Path) -> None:
         audio = tmp_path / "clip.wav"
@@ -168,6 +172,56 @@ def test_audio_transcribe_off_keeps_oversize_rejection(self, tmp_path: Path) ->
         out = tools.audio_transcribe("clip.wav", chunking="off")
         assert "Audio file too large" in out
 
+    def test_audio_transcribe_preserves_byte_budgeted_chunk_size(
+        self, tmp_path: Path
+    ) -> None:
+        audio = tmp_path / "clip.wav"
+        _write_audio(audio, payload=b"x" * 512)
+        tools = _make_tools(
+            tmp_path,
+            mistral_transcription_max_bytes=300_000,
+        )
+
+        with pytest.MonkeyPatch.context() as mp:
+            mp.setattr(tools, "_ensure_media_tools", lambda: None)
+            mp.setattr(tools, "_probe_media_duration", lambda _: 35.0)
+
+            def fake_extract(
+                source: Path,
+                output: Path,
+                *,
+                start_sec: float,
+                duration_sec: float,
+            ) -> None:
+                output.write_bytes(b"x" * int(duration_sec * 32_000))
+
+            observed_sizes: list[int] = []
+
+            def fake_request(*, resolved: Path, **_: object) -> dict[str, object]:
+                observed_sizes.append(resolved.stat().st_size)
+                if observed_sizes[-1] > tools.mistral_transcription_max_bytes:
+                    raise ToolError(
+                        f"Audio file too large: {observed_sizes[-1]:,} bytes "
+                        f"(max {tools.mistral_transcription_max_bytes:,} bytes)"
+                    )
+                return {"text": f"chunk {len(observed_sizes)}"}
+
+            mp.setattr(tools, "_extract_audio_chunk", fake_extract)
+            mp.setattr(tools, "_mistral_transcription_request", fake_request)
+
+            raw = tools.audio_transcribe(
+                "clip.wav",
+                chunking="force",
+                chunk_max_seconds=30,
+                chunk_overlap_seconds=0,
+            )
+
+        parsed = json.loads(raw)
+        assert parsed["mode"] == "chunked"
+        assert parsed["chunking"]["chunk_seconds"] < 30
+        assert observed_sizes
+        assert max(observed_sizes) <= tools.mistral_transcription_max_bytes
+
     def test_audio_transcribe_force_chunks_even_when_under_limit(self, tmp_path: Path) -> None:
         audio = tmp_path / "clip.wav"
         _write_audio(audio, payload=b"x" * 32)
@@ -263,15 +317,15 @@ def fake_request(*, resolved: Path, **_: object) -> dict[str, object]:
 
     def test_audio_transcribe_fail_fast_on_chunk_error(self, tmp_path: Path) -> None:
         audio = tmp_path / "clip.wav"
-        _write_audio(audio, payload=b"x" * 512)
+        _write_audio(audio, payload=b"x" * 1_200_000)
         tools = _make_tools(
             tmp_path,
-            mistral_transcription_max_bytes=64,
+            mistral_transcription_max_bytes=1_100_000,
         )
 
         with pytest.MonkeyPatch.context() as mp:
             mp.setattr(tools, "_ensure_media_tools", lambda: None)
-            mp.setattr(tools, "_probe_media_duration", lambda _: 58.0)
+            mp.setattr(tools, "_probe_media_duration", lambda _: 50.0)
 
             def fake_extract(
                 source: Path,
@@ -302,15 +356,15 @@ def fake_request(**_: object) -> dict[str, object]:
 
     def test_audio_transcribe_can_return_partial_chunked_output(self, tmp_path: Path) -> None:
         audio = tmp_path / "clip.wav"
-        _write_audio(audio, payload=b"x" * 512)
+        _write_audio(audio, payload=b"x" * 1_200_000)
         tools = _make_tools(
             tmp_path,
-            mistral_transcription_max_bytes=64,
+            mistral_transcription_max_bytes=1_100_000,
         )
 
         with pytest.MonkeyPatch.context() as mp:
             mp.setattr(tools, "_ensure_media_tools", lambda: None)
-            mp.setattr(tools, "_probe_media_duration", lambda _: 86.0)
+            mp.setattr(tools, "_probe_media_duration", lambda _: 60.0)
 
             def fake_extract(
                 source: Path,

From 39825dc6b31a5e56f8b08447c7dea004d5bdddbc Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 12:34:14 -0400
Subject: [PATCH 42/58] Add native Chrome DevTools MCP integration

---
 README.md                                     |  57 +-
 agent/__main__.py                             |  92 +++
 agent/builder.py                              |   6 +
 agent/chrome_mcp.py                           | 572 +++++++++++++++++
 agent/config.py                               |  57 ++
 agent/engine.py                               |  32 +-
 agent/settings.py                             |  76 +++
 agent/tool_defs.py                            |  31 +
 agent/tools.py                                |  63 ++
 agent/tui.py                                  | 104 ++-
 .../crates/op-core/src/config.rs              |  51 ++
 .../crates/op-core/src/config_hydration.rs    |  36 ++
 .../crates/op-core/src/engine/mod.rs          |  38 +-
 .../crates/op-core/src/events.rs              |  14 +
 .../crates/op-core/src/settings.rs            |  62 +-
 .../crates/op-core/src/tools/chrome_mcp.rs    | 596 ++++++++++++++++++
 .../crates/op-core/src/tools/defs.rs          |  58 +-
 .../crates/op-core/src/tools/mod.rs           |  35 +-
 .../crates/op-tauri/src/bridge.rs             |  72 ++-
 .../crates/op-tauri/src/commands/agent.rs     |   4 +-
 .../crates/op-tauri/src/commands/config.rs    |  63 +-
 .../crates/op-tauri/src/state.rs              |  85 +++
 openplanter-desktop/frontend/src/api/types.ts |  20 +
 .../frontend/src/commands/chrome.test.ts      | 128 ++++
 .../frontend/src/commands/chrome.ts           | 136 ++++
 .../src/commands/completionRegistry.test.ts   |  26 +
 .../src/commands/completionRegistry.ts        |  33 +
 .../frontend/src/commands/slash.test.ts       |  26 +
 .../frontend/src/commands/slash.ts            |   7 +
 .../frontend/src/components/App.ts            |   1 +
 .../frontend/src/components/ChatPane.test.ts  |  39 +-
 .../frontend/src/components/ChatPane.ts       |  29 +-
 .../src/components/contentParser.test.ts      |  14 +-
 .../frontend/src/components/contentParser.ts  |  19 +-
 .../frontend/src/components/toolArgs.ts       | 160 +++++
 openplanter-desktop/frontend/src/main.ts      |   9 +
 .../frontend/src/state/store.ts               |  16 +
 tests/test_chrome_mcp.py                      | 207 ++++++
 tests/test_engine.py                          |  48 ++
 tests/test_settings.py                        |  38 +-
 tests/test_tool_defs.py                       |  39 ++
 tests/test_tui_repl.py                        |  47 ++
 42 files changed, 3150 insertions(+), 96 deletions(-)
 create mode 100644 agent/chrome_mcp.py
 create mode 100644 openplanter-desktop/crates/op-core/src/tools/chrome_mcp.rs
 create mode 100644 openplanter-desktop/frontend/src/commands/chrome.test.ts
 create mode 100644 openplanter-desktop/frontend/src/commands/chrome.ts
 create mode 100644 openplanter-desktop/frontend/src/components/toolArgs.ts
 create mode 100644 tests/test_chrome_mcp.py

diff --git a/README.md b/README.md
index 34ed5aa5..2ff7345d 100644
--- a/README.md
+++ b/README.md
@@ -50,6 +50,8 @@ cargo tauri build
 
 Requires: Rust stable, Node.js 20+, the Tauri CLI, and platform-specific Tauri dependencies ([see Tauri prerequisites](https://v2.tauri.app/start/prerequisites/)).
 
+If you want the desktop app to control a live Chrome session through Chrome DevTools MCP, keep a local Node/npm install available at runtime. OpenPlanter shells out to `npx -y chrome-devtools-mcp@latest`; it does not bundle the server or launch Chrome for you.
+
 ## CLI Agent
 
 The Python CLI agent can be used independently of the desktop app.
@@ -76,6 +78,8 @@ Or run a single task headlessly:
 openplanter-agent --task "Cross-reference vendor payments against lobbying disclosures and flag overlaps" --workspace ./data
 ```
 
+Chrome DevTools MCP support in the CLI/TUI also uses local `npx`, so install Node.js 20+ if you want to enable Chrome tools there.
+
 ### Docker
 
 ```bash
@@ -221,6 +225,53 @@ The agent has access to 20 tools, organized around its investigation workflow:
 
 In **recursive mode** (the default), the agent spawns sub-agents via `subtask` and `execute` to parallelize entity resolution, cross-dataset linking, and evidence-chain construction across large investigations.
 
+When Chrome DevTools MCP is enabled, OpenPlanter discovers Chrome's published MCP tools at solve start and appends them natively to the built-in tool set for the main agent, recursive subtasks, and execute flows.
+
+## Chrome DevTools MCP
+
+OpenPlanter can attach to the official Chrome DevTools MCP server and reuse an active Chrome debugging session. The integration is native in both runtimes, but the server itself is still the upstream package started locally through `npx`.
+
+### Requirements
+
+- Node.js and npm available on your `PATH`
+- Chrome 144 or newer
+- Remote debugging enabled in Chrome at `chrome://inspect/#remote-debugging`
+
+### How OpenPlanter Connects
+
+- Auto-connect mode: OpenPlanter starts `chrome-devtools-mcp` with `--autoConnect` and reuses a running Chrome session after you approve Chrome's debugging prompt.
+- Browser URL mode: OpenPlanter passes `--browserUrl <endpoint>` to attach to an existing remote debugging endpoint. This takes precedence over auto-connect when configured.
+- Channel selection: `stable` is the default channel; you can switch to `beta`, `dev`, or `canary` when needed.
+
+If Chrome MCP cannot start because Node/npm is missing, Chrome remote debugging is disabled, or Chrome is not available, OpenPlanter keeps running with its built-in tools and reports Chrome MCP as `unavailable`.
+
+### Desktop Usage
+
+Use the desktop slash command:
+
+```text
+/chrome status
+/chrome on
+/chrome off
+/chrome auto --save
+/chrome url http://127.0.0.1:9222 --save
+/chrome channel beta --save
+```
+
+The sidebar and `/status` output both show the current Chrome MCP runtime state.
+
+### CLI Usage
+
+Use per-run flags:
+
+```bash
+openplanter-agent --chrome-mcp --chrome-auto-connect
+openplanter-agent --chrome-mcp --chrome-browser-url http://127.0.0.1:9222
+openplanter-agent --chrome-mcp --chrome-channel beta
+```
+
+The TUI also supports `/chrome status|on|off|auto|url <endpoint>|channel <stable|beta|dev|canary> [--save]`.
+
 ## CLI Reference
 
 ```
@@ -262,6 +313,10 @@ OPENPLANTER_WORKSPACE=workspace
 | `--openai-oauth-token TOKEN` | ChatGPT Plus/Teams/Pro OAuth bearer token for OpenAI-compatible models |
 | `--zai-plan PLAN` | Z.AI endpoint plan: `paygo` or `coding` |
 | `--reasoning-effort LEVEL` | `low`, `medium`, `high`, or `none` |
+| `--chrome-mcp` / `--no-chrome-mcp` | Enable or disable native Chrome DevTools MCP tools |
+| `--chrome-auto-connect` / `--no-chrome-auto-connect` | Use Chrome MCP auto-connect or require an explicit browser URL |
+| `--chrome-browser-url URL` | Attach Chrome MCP to an existing remote debugging browser URL |
+| `--chrome-channel CHANNEL` | Chrome release channel for auto-connect: `stable`, `beta`, `dev`, `canary` |
 | `--list-models` | Fetch available models from the provider API |
 
 ### Execution
@@ -285,7 +340,7 @@ OPENPLANTER_WORKSPACE=workspace
 
 ### Persistent Defaults
 
-Use `--default-model`, `--default-reasoning-effort`, or per-provider variants like `--default-model-openai` to save workspace defaults to `.openplanter/settings.json`. View them with `--show-settings`.
+Use `--default-model`, `--default-reasoning-effort`, Chrome MCP slash commands with `--save`, or per-provider variants like `--default-model-openai` to save workspace defaults to `.openplanter/settings.json`. View them with `--show-settings`.
 
 ## Configuration
 
diff --git a/agent/__main__.py b/agent/__main__.py
index 849d1cd3..2eb3bc9d 100644
--- a/agent/__main__.py
+++ b/agent/__main__.py
@@ -113,6 +113,40 @@ def build_parser() -> argparse.ArgumentParser:
         choices=["exa", "firecrawl", "brave", "tavily"],
         help="Web search backend provider.",
     )
+    parser.add_argument(
+        "--chrome-mcp",
+        dest="chrome_mcp_enabled",
+        action="store_true",
+        help="Enable native Chrome DevTools MCP tools for this run.",
+    )
+    parser.add_argument(
+        "--no-chrome-mcp",
+        dest="chrome_mcp_enabled",
+        action="store_false",
+        help="Disable native Chrome DevTools MCP tools for this run.",
+    )
+    parser.add_argument(
+        "--chrome-auto-connect",
+        dest="chrome_auto_connect",
+        action="store_true",
+        help="Ask the Chrome DevTools MCP server to auto-connect to a running Chrome instance.",
+    )
+    parser.add_argument(
+        "--no-chrome-auto-connect",
+        dest="chrome_auto_connect",
+        action="store_false",
+        help="Disable Chrome MCP auto-connect and rely on --chrome-browser-url instead.",
+    )
+    parser.add_argument(
+        "--chrome-browser-url",
+        help="Remote debugging browser URL for Chrome DevTools MCP (preferred over auto-connect).",
+    )
+    parser.add_argument(
+        "--chrome-channel",
+        choices=["stable", "beta", "dev", "canary"],
+        help="Chrome channel to target when Chrome MCP auto-connect is used.",
+    )
+    parser.set_defaults(chrome_mcp_enabled=None, chrome_auto_connect=None)
     parser.add_argument("--voyage-api-key", help="Voyage API key override.")
     parser.add_argument(
         "--configure-keys",
@@ -440,6 +474,16 @@ def _apply_runtime_overrides(cfg: AgentConfig, args: argparse.Namespace, creds:
         cfg.web_search_provider = "exa"
     if args.reasoning_effort:
         cfg.reasoning_effort = None if args.reasoning_effort == "none" else args.reasoning_effort
+    if args.chrome_mcp_enabled is not None:
+        cfg.chrome_mcp_enabled = bool(args.chrome_mcp_enabled)
+    if args.chrome_auto_connect is not None:
+        cfg.chrome_mcp_auto_connect = bool(args.chrome_auto_connect)
+    if args.chrome_browser_url is not None:
+        cfg.chrome_mcp_browser_url = args.chrome_browser_url.strip() or None
+        if cfg.chrome_mcp_browser_url:
+            cfg.chrome_mcp_enabled = True
+    if args.chrome_channel:
+        cfg.chrome_mcp_channel = args.chrome_channel
     if args.recursive:
         cfg.recursive = True
     if args.acceptance_criteria:
@@ -533,6 +577,40 @@ def _apply_persistent_settings(
         and settings.default_reasoning_effort
     ):
         cfg.reasoning_effort = settings.default_reasoning_effort
+    if (
+        args.chrome_mcp_enabled is None
+        and os.getenv("OPENPLANTER_CHROME_MCP_ENABLED") is None
+        and settings.chrome_mcp_enabled is not None
+    ):
+        cfg.chrome_mcp_enabled = settings.chrome_mcp_enabled
+    if (
+        args.chrome_auto_connect is None
+        and os.getenv("OPENPLANTER_CHROME_MCP_AUTO_CONNECT") is None
+        and settings.chrome_mcp_auto_connect is not None
+    ):
+        cfg.chrome_mcp_auto_connect = settings.chrome_mcp_auto_connect
+    if (
+        args.chrome_browser_url is None
+        and os.getenv("OPENPLANTER_CHROME_MCP_BROWSER_URL") is None
+        and settings.chrome_mcp_browser_url
+    ):
+        cfg.chrome_mcp_browser_url = settings.chrome_mcp_browser_url
+    if (
+        args.chrome_channel is None
+        and os.getenv("OPENPLANTER_CHROME_MCP_CHANNEL") is None
+        and settings.chrome_mcp_channel
+    ):
+        cfg.chrome_mcp_channel = settings.chrome_mcp_channel
+    if (
+        os.getenv("OPENPLANTER_CHROME_MCP_CONNECT_TIMEOUT_SEC") is None
+        and settings.chrome_mcp_connect_timeout_sec is not None
+    ):
+        cfg.chrome_mcp_connect_timeout_sec = settings.chrome_mcp_connect_timeout_sec
+    if (
+        os.getenv("OPENPLANTER_CHROME_MCP_RPC_TIMEOUT_SEC") is None
+        and settings.chrome_mcp_rpc_timeout_sec is not None
+    ):
+        cfg.chrome_mcp_rpc_timeout_sec = settings.chrome_mcp_rpc_timeout_sec
 
     return settings
 
@@ -547,6 +625,18 @@ def _print_settings(settings: PersistentSettings) -> None:
     print(f"  default_model_cerebras: {settings.default_model_cerebras or '(unset)'}")
     print(f"  default_model_zai: {settings.default_model_zai or '(unset)'}")
     print(f"  default_model_ollama: {settings.default_model_ollama or '(unset)'}")
+    print(f"  chrome_mcp_enabled: {settings.chrome_mcp_enabled if settings.chrome_mcp_enabled is not None else '(unset)'}")
+    print(f"  chrome_mcp_auto_connect: {settings.chrome_mcp_auto_connect if settings.chrome_mcp_auto_connect is not None else '(unset)'}")
+    print(f"  chrome_mcp_browser_url: {settings.chrome_mcp_browser_url or '(unset)'}")
+    print(f"  chrome_mcp_channel: {settings.chrome_mcp_channel or '(unset)'}")
+    print(
+        "  chrome_mcp_connect_timeout_sec: "
+        f"{settings.chrome_mcp_connect_timeout_sec if settings.chrome_mcp_connect_timeout_sec is not None else '(unset)'}"
+    )
+    print(
+        "  chrome_mcp_rpc_timeout_sec: "
+        f"{settings.chrome_mcp_rpc_timeout_sec if settings.chrome_mcp_rpc_timeout_sec is not None else '(unset)'}"
+    )
 
 
 def _has_non_interactive_command(args: argparse.Namespace) -> bool:
@@ -689,6 +779,7 @@ def main() -> None:
 
     engine = build_engine(cfg)
     model_name = _get_model_display_name(engine)
+    chrome_status = engine.tools.chrome_mcp_status()
 
     try:
         runtime = SessionRuntime.bootstrap(
@@ -712,6 +803,7 @@ def main() -> None:
     if cfg.reasoning_effort:
         startup_info["Reasoning"] = cfg.reasoning_effort
     startup_info["Mode"] = "recursive" if cfg.recursive else "flat"
+    startup_info["ChromeMCP"] = f"{chrome_status.status}: {chrome_status.detail}"
     startup_info["Workspace"] = str(cfg.workspace)
     startup_info["WorkspaceSource"] = workspace_resolution.source
     if workspace_resolution.guardrail_action != "none":
diff --git a/agent/builder.py b/agent/builder.py
index 2675b128..8522cc1a 100644
--- a/agent/builder.py
+++ b/agent/builder.py
@@ -259,6 +259,12 @@ def build_engine(cfg: AgentConfig) -> RLMEngine:
         mistral_transcription_chunk_overlap_seconds=cfg.mistral_transcription_chunk_overlap_seconds,
         mistral_transcription_max_chunks=cfg.mistral_transcription_max_chunks,
         mistral_transcription_request_timeout_sec=cfg.mistral_transcription_request_timeout_sec,
+        chrome_mcp_enabled=cfg.chrome_mcp_enabled,
+        chrome_mcp_auto_connect=cfg.chrome_mcp_auto_connect,
+        chrome_mcp_browser_url=cfg.chrome_mcp_browser_url,
+        chrome_mcp_channel=cfg.chrome_mcp_channel,
+        chrome_mcp_connect_timeout_sec=cfg.chrome_mcp_connect_timeout_sec,
+        chrome_mcp_rpc_timeout_sec=cfg.chrome_mcp_rpc_timeout_sec,
         max_observation_chars=cfg.max_observation_chars,
     )
 
diff --git a/agent/chrome_mcp.py b/agent/chrome_mcp.py
new file mode 100644
index 00000000..50112c1b
--- /dev/null
+++ b/agent/chrome_mcp.py
@@ -0,0 +1,572 @@
+from __future__ import annotations
+
+import atexit
+import json
+import os
+import shlex
+import shutil
+import subprocess
+import threading
+import time
+from dataclasses import dataclass
+from typing import Any
+
+from .config import (
+    CHROME_MCP_DEFAULT_CHANNEL,
+    normalize_chrome_mcp_browser_url,
+    normalize_chrome_mcp_channel,
+)
+
+
+class ChromeMcpError(RuntimeError):
+    pass
+
+
+@dataclass(frozen=True)
+class ChromeMcpToolDef:
+    name: str
+    description: str
+    parameters: dict[str, Any]
+
+    def as_tool_definition(self) -> dict[str, Any]:
+        return {
+            "name": self.name,
+            "description": self.description,
+            "parameters": self.parameters,
+        }
+
+
+@dataclass(frozen=True)
+class ChromeMcpImage:
+    base64_data: str
+    media_type: str
+
+
+@dataclass(frozen=True)
+class ChromeMcpCallResult:
+    content: str
+    is_error: bool = False
+    image: ChromeMcpImage | None = None
+
+
+@dataclass(frozen=True)
+class ChromeMcpStatus:
+    status: str
+    detail: str
+    tool_count: int = 0
+    last_refresh_at: float | None = None
+
+
+@dataclass
+class _PendingRequest:
+    event: threading.Event
+    result: dict[str, Any] | None = None
+    error: Exception | None = None
+
+
+def _env_text(name: str, default: str) -> str:
+    value = (os.getenv(name) or "").strip()
+    return value or default
+
+
+def _format_protocol_error(error: object) -> str:
+    if isinstance(error, dict):
+        message = str(error.get("message") or "Unknown MCP error").strip()
+        code = error.get("code")
+        if code is None:
+            return message
+        return f"{message} (code {code})"
+    return str(error or "Unknown MCP error")
+
+
+def _status_detail_from_exception(
+    exc: Exception,
+    *,
+    browser_url: str | None,
+    stderr_tail: list[str],
+) -> str:
+    detail = str(exc).strip() or type(exc).__name__
+    stderr_text = " ".join(line.strip() for line in stderr_tail[-4:] if line.strip())
+    lower = f"{detail} {stderr_text}".lower()
+    hints: list[str] = []
+    if "npx" in lower and ("not found" in lower or "no such file" in lower):
+        hints.append("Install Node.js/npm so `npx` is available locally.")
+    if "timed out" in lower or "timeout" in lower:
+        if browser_url:
+            hints.append("Confirm the remote debugging endpoint is reachable.")
+        else:
+            hints.append(
+                "Enable Chrome remote debugging at chrome://inspect/#remote-debugging "
+                "and allow the Chrome DevTools MCP connection prompt."
+            )
+    if "inspect/#remote-debugging" not in lower and browser_url is None:
+        hints.append(
+            "Chrome 144+ must have remote debugging enabled at chrome://inspect/#remote-debugging."
+        )
+    if stderr_text:
+        detail = f"{detail} stderr: {stderr_text}"
+    if hints:
+        detail = f"{detail} {' '.join(hints)}"
+    return detail.strip()
+
+
+class ChromeMcpManager:
+    def __init__(
+        self,
+        *,
+        enabled: bool,
+        auto_connect: bool,
+        browser_url: str | None,
+        channel: str,
+        connect_timeout_sec: int,
+        rpc_timeout_sec: int,
+    ) -> None:
+        self.enabled = bool(enabled)
+        self.auto_connect = bool(auto_connect)
+        self.browser_url = normalize_chrome_mcp_browser_url(browser_url)
+        self.channel = normalize_chrome_mcp_channel(channel or CHROME_MCP_DEFAULT_CHANNEL)
+        self.connect_timeout_sec = max(1, int(connect_timeout_sec))
+        self.rpc_timeout_sec = max(1, int(rpc_timeout_sec))
+        self._lock = threading.RLock()
+        self._proc: subprocess.Popen[str] | None = None
+        self._reader_thread: threading.Thread | None = None
+        self._stderr_thread: threading.Thread | None = None
+        self._pending: dict[int, _PendingRequest] = {}
+        self._next_id = 1
+        self._tools: list[ChromeMcpToolDef] = []
+        self._last_refresh_at: float | None = None
+        self._status = ChromeMcpStatus(
+            status="disabled" if not self.enabled else "ready",
+            detail=(
+                "Chrome DevTools MCP is disabled."
+                if not self.enabled
+                else "Chrome DevTools MCP will initialize on the next solve."
+            ),
+            tool_count=0,
+        )
+        self._stderr_tail: list[str] = []
+
+    def status_snapshot(self) -> ChromeMcpStatus:
+        with self._lock:
+            return ChromeMcpStatus(
+                status=self._status.status,
+                detail=self._status.detail,
+                tool_count=self._status.tool_count,
+                last_refresh_at=self._status.last_refresh_at,
+            )
+
+    def ensure_connected(self) -> None:
+        if not self.enabled:
+            with self._lock:
+                self._status = ChromeMcpStatus(
+                    status="disabled",
+                    detail="Chrome DevTools MCP is disabled.",
+                    tool_count=len(self._tools),
+                    last_refresh_at=self._last_refresh_at,
+                )
+            return
+        with self._lock:
+            if self._proc is not None and self._proc.poll() is None and self._reader_thread is not None:
+                return
+            if not self.browser_url and not self.auto_connect:
+                detail = (
+                    "Chrome DevTools MCP is enabled but cannot attach: set "
+                    "`chrome_mcp_browser_url` or enable `chrome_mcp_auto_connect`."
+                )
+                self._status = ChromeMcpStatus(
+                    status="unavailable",
+                    detail=detail,
+                    tool_count=len(self._tools),
+                    last_refresh_at=self._last_refresh_at,
+                )
+                raise ChromeMcpError(detail)
+            self._start_process_locked()
+        try:
+            self._initialize_handshake()
+        except Exception as exc:
+            detail = _status_detail_from_exception(
+                exc,
+                browser_url=self.browser_url,
+                stderr_tail=self._stderr_tail,
+            )
+            with self._lock:
+                self._status = ChromeMcpStatus(
+                    status="unavailable",
+                    detail=detail,
+                    tool_count=len(self._tools),
+                    last_refresh_at=self._last_refresh_at,
+                )
+            self.shutdown()
+            raise ChromeMcpError(detail) from exc
+
+    def list_tools(self, *, force_refresh: bool = False) -> list[ChromeMcpToolDef]:
+        if not self.enabled:
+            return []
+        self.ensure_connected()
+        with self._lock:
+            if self._tools and not force_refresh:
+                return list(self._tools)
+        tools: list[ChromeMcpToolDef] = []
+        cursor: str | None = None
+        while True:
+            params: dict[str, Any] = {}
+            if cursor:
+                params["cursor"] = cursor
+            result = self._request_with_reconnect(
+                "tools/list",
+                params=params,
+                timeout_sec=self.rpc_timeout_sec,
+            )
+            raw_tools = result.get("tools")
+            if isinstance(raw_tools, list):
+                for item in raw_tools:
+                    if not isinstance(item, dict):
+                        continue
+                    name = str(item.get("name") or "").strip()
+                    if not name:
+                        continue
+                    description = str(item.get("description") or "").strip()
+                    parameters = item.get("inputSchema")
+                    if not isinstance(parameters, dict):
+                        parameters = {"type": "object", "properties": {}, "required": []}
+                    tools.append(
+                        ChromeMcpToolDef(
+                            name=name,
+                            description=description,
+                            parameters=parameters,
+                        )
+                    )
+            raw_cursor = result.get("nextCursor")
+            cursor = str(raw_cursor).strip() if raw_cursor else None
+            if not cursor:
+                break
+        now = time.time()
+        with self._lock:
+            self._tools = tools
+            self._last_refresh_at = now
+            self._status = ChromeMcpStatus(
+                status="ready",
+                detail=(
+                    f"Chrome DevTools MCP ready with {len(tools)} tool(s) "
+                    f"via {'browser_url' if self.browser_url else 'auto-connect'}."
+                ),
+                tool_count=len(tools),
+                last_refresh_at=now,
+            )
+            return list(self._tools)
+
+    def call_tool(self, name: str, arguments: dict[str, Any]) -> ChromeMcpCallResult:
+        if not self.enabled:
+            raise ChromeMcpError("Chrome DevTools MCP is disabled.")
+        self.ensure_connected()
+        result = self._request_with_reconnect(
+            "tools/call",
+            params={"name": name, "arguments": arguments},
+            timeout_sec=self.rpc_timeout_sec,
+        )
+        return self._parse_call_result(result)
+
+    def shutdown(self) -> None:
+        with self._lock:
+            self._shutdown_locked()
+
+    def _request_with_reconnect(
+        self,
+        method: str,
+        *,
+        params: dict[str, Any],
+        timeout_sec: int,
+    ) -> dict[str, Any]:
+        last_error: Exception | None = None
+        for attempt in range(2):
+            try:
+                return self._request(method, params=params, timeout_sec=timeout_sec)
+            except Exception as exc:
+                last_error = exc
+                with self._lock:
+                    self._shutdown_locked()
+                    self._status = ChromeMcpStatus(
+                        status="unavailable",
+                        detail=_status_detail_from_exception(
+                            exc,
+                            browser_url=self.browser_url,
+                            stderr_tail=self._stderr_tail,
+                        ),
+                        tool_count=len(self._tools),
+                        last_refresh_at=self._last_refresh_at,
+                    )
+                if attempt == 0:
+                    self.ensure_connected()
+                    continue
+                break
+        raise ChromeMcpError(str(last_error or "Chrome DevTools MCP request failed"))
+
+    def _initialize_handshake(self) -> None:
+        init_params = {
+            "protocolVersion": "2025-11-25",
+            "capabilities": {},
+            "clientInfo": {"name": "openplanter-agent", "version": "1.0"},
+        }
+        self._request("initialize", params=init_params, timeout_sec=self.connect_timeout_sec)
+        self._notify("notifications/initialized", {})
+
+    def _request(
+        self,
+        method: str,
+        *,
+        params: dict[str, Any],
+        timeout_sec: int,
+    ) -> dict[str, Any]:
+        with self._lock:
+            proc = self._proc
+            if proc is None or proc.poll() is not None or proc.stdin is None:
+                raise ChromeMcpError("Chrome DevTools MCP process is not running.")
+            request_id = self._next_id
+            self._next_id += 1
+            pending = _PendingRequest(event=threading.Event())
+            self._pending[request_id] = pending
+            payload = {
+                "jsonrpc": "2.0",
+                "id": request_id,
+                "method": method,
+                "params": params,
+            }
+            try:
+                proc.stdin.write(json.dumps(payload, ensure_ascii=True) + "\n")
+                proc.stdin.flush()
+            except Exception as exc:
+                self._pending.pop(request_id, None)
+                raise ChromeMcpError(f"Failed to send MCP request {method}: {exc}") from exc
+        if not pending.event.wait(timeout_sec):
+            with self._lock:
+                self._pending.pop(request_id, None)
+            raise ChromeMcpError(f"Timed out waiting for Chrome DevTools MCP {method} response.")
+        if pending.error is not None:
+            raise ChromeMcpError(str(pending.error))
+        return pending.result or {}
+
+    def _notify(self, method: str, params: dict[str, Any]) -> None:
+        with self._lock:
+            proc = self._proc
+            if proc is None or proc.poll() is not None or proc.stdin is None:
+                raise ChromeMcpError("Chrome DevTools MCP process is not running.")
+            payload = {"jsonrpc": "2.0", "method": method, "params": params}
+            proc.stdin.write(json.dumps(payload, ensure_ascii=True) + "\n")
+            proc.stdin.flush()
+
+    def _start_process_locked(self) -> None:
+        self._shutdown_locked()
+        command = _env_text("OPENPLANTER_CHROME_MCP_COMMAND", "npx")
+        if shutil.which(command) is None:
+            raise ChromeMcpError(f"`{command}` is not installed or not on PATH.")
+        package = _env_text("OPENPLANTER_CHROME_MCP_PACKAGE", "chrome-devtools-mcp@latest")
+        args = [command, "-y", package]
+        if self.browser_url:
+            args.append(f"--browserUrl={self.browser_url}")
+        else:
+            args.append("--autoConnect")
+            args.append(f"--channel={self.channel}")
+        extra_args = (os.getenv("OPENPLANTER_CHROME_MCP_EXTRA_ARGS") or "").strip()
+        if extra_args:
+            args.extend(shlex.split(extra_args))
+        self._proc = subprocess.Popen(
+            args,
+            stdin=subprocess.PIPE,
+            stdout=subprocess.PIPE,
+            stderr=subprocess.PIPE,
+            text=True,
+            encoding="utf-8",
+            bufsize=1,
+            start_new_session=True,
+        )
+        self._reader_thread = threading.Thread(
+            target=self._reader_loop,
+            name="openplanter-chrome-mcp-reader",
+            daemon=True,
+        )
+        self._stderr_thread = threading.Thread(
+            target=self._stderr_loop,
+            name="openplanter-chrome-mcp-stderr",
+            daemon=True,
+        )
+        self._reader_thread.start()
+        self._stderr_thread.start()
+
+    def _reader_loop(self) -> None:
+        proc = self._proc
+        if proc is None or proc.stdout is None:
+            return
+        try:
+            for raw_line in proc.stdout:
+                line = raw_line.strip()
+                if not line:
+                    continue
+                try:
+                    payload = json.loads(line)
+                except json.JSONDecodeError:
+                    continue
+                if not isinstance(payload, dict):
+                    continue
+                request_id = payload.get("id")
+                if not isinstance(request_id, int):
+                    continue
+                with self._lock:
+                    pending = self._pending.pop(request_id, None)
+                if pending is None:
+                    continue
+                if "error" in payload:
+                    pending.error = ChromeMcpError(_format_protocol_error(payload.get("error")))
+                else:
+                    result = payload.get("result")
+                    pending.result = result if isinstance(result, dict) else {}
+                pending.event.set()
+        finally:
+            exit_code = proc.poll()
+            error = ChromeMcpError(
+                f"Chrome DevTools MCP process exited unexpectedly"
+                + (f" with code {exit_code}." if exit_code is not None else ".")
+            )
+            with self._lock:
+                pending = list(self._pending.values())
+                self._pending.clear()
+            for item in pending:
+                item.error = error
+                item.event.set()
+
+    def _stderr_loop(self) -> None:
+        proc = self._proc
+        if proc is None or proc.stderr is None:
+            return
+        for raw_line in proc.stderr:
+            line = raw_line.strip()
+            if not line:
+                continue
+            with self._lock:
+                self._stderr_tail.append(line)
+                self._stderr_tail = self._stderr_tail[-20:]
+
+    def _shutdown_locked(self) -> None:
+        proc = self._proc
+        self._proc = None
+        self._reader_thread = None
+        self._stderr_thread = None
+        pending = list(self._pending.values())
+        self._pending.clear()
+        for item in pending:
+            item.error = ChromeMcpError("Chrome DevTools MCP shut down before responding.")
+            item.event.set()
+        if proc is None:
+            return
+        try:
+            proc.terminate()
+            proc.wait(timeout=2)
+        except Exception:
+            try:
+                proc.kill()
+            except Exception:
+                pass
+
+    def _parse_call_result(self, result: dict[str, Any]) -> ChromeMcpCallResult:
+        content_parts: list[str] = []
+        image: ChromeMcpImage | None = None
+        raw_content = result.get("content")
+        if isinstance(raw_content, list):
+            for item in raw_content:
+                if isinstance(item, str):
+                    if item.strip():
+                        content_parts.append(item.strip())
+                    continue
+                if not isinstance(item, dict):
+                    continue
+                item_type = str(item.get("type") or "").strip().lower()
+                if item_type == "text":
+                    text = item.get("text")
+                    if isinstance(text, str) and text.strip():
+                        content_parts.append(text.strip())
+                    continue
+                if item_type == "image":
+                    data = item.get("data")
+                    media_type = item.get("mimeType") or item.get("mediaType")
+                    if (
+                        image is None
+                        and isinstance(data, str)
+                        and data.strip()
+                        and isinstance(media_type, str)
+                        and media_type.strip()
+                    ):
+                        image = ChromeMcpImage(
+                            base64_data=data.strip(),
+                            media_type=media_type.strip(),
+                        )
+                    media_text = media_type.strip() if isinstance(media_type, str) else "image"
+                    content_parts.append(f"[{media_text} attached]")
+                    continue
+                uri = item.get("uri") or item.get("url")
+                if isinstance(uri, str) and uri.strip():
+                    label = str(item.get("name") or item_type or "resource").strip()
+                    content_parts.append(f"{label}: {uri.strip()}")
+        structured = result.get("structuredContent")
+        if not content_parts and structured is not None:
+            try:
+                content_parts.append(json.dumps(structured, indent=2, ensure_ascii=True))
+            except TypeError:
+                content_parts.append(str(structured))
+        content = "\n".join(part for part in content_parts if part).strip()
+        if not content:
+            content = "Chrome DevTools MCP tool completed with no textual output."
+        is_error = bool(result.get("isError"))
+        if is_error:
+            content = f"Chrome DevTools MCP tool error: {content}"
+        return ChromeMcpCallResult(content=content, is_error=is_error, image=image)
+
+
+_SHARED_MANAGERS: dict[tuple[Any, ...], ChromeMcpManager] = {}
+_SHARED_LOCK = threading.Lock()
+
+
+def acquire_shared_manager(
+    *,
+    enabled: bool,
+    auto_connect: bool,
+    browser_url: str | None,
+    channel: str,
+    connect_timeout_sec: int,
+    rpc_timeout_sec: int,
+) -> ChromeMcpManager | None:
+    if not enabled:
+        return None
+    key = (
+        bool(enabled),
+        bool(auto_connect),
+        normalize_chrome_mcp_browser_url(browser_url),
+        normalize_chrome_mcp_channel(channel),
+        max(1, int(connect_timeout_sec)),
+        max(1, int(rpc_timeout_sec)),
+        _env_text("OPENPLANTER_CHROME_MCP_COMMAND", "npx"),
+        _env_text("OPENPLANTER_CHROME_MCP_PACKAGE", "chrome-devtools-mcp@latest"),
+        (os.getenv("OPENPLANTER_CHROME_MCP_EXTRA_ARGS") or "").strip(),
+    )
+    with _SHARED_LOCK:
+        manager = _SHARED_MANAGERS.get(key)
+        if manager is None:
+            manager = ChromeMcpManager(
+                enabled=enabled,
+                auto_connect=auto_connect,
+                browser_url=browser_url,
+                channel=channel,
+                connect_timeout_sec=connect_timeout_sec,
+                rpc_timeout_sec=rpc_timeout_sec,
+            )
+            _SHARED_MANAGERS[key] = manager
+        return manager
+
+
+def shutdown_all_shared_managers() -> None:
+    with _SHARED_LOCK:
+        managers = list(_SHARED_MANAGERS.values())
+        _SHARED_MANAGERS.clear()
+    for manager in managers:
+        manager.shutdown()
+
+
+atexit.register(shutdown_all_shared_managers)
diff --git a/agent/config.py b/agent/config.py
index 6d0fadcc..9fb9c362 100644
--- a/agent/config.py
+++ b/agent/config.py
@@ -18,6 +18,10 @@
 MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS = 2.0
 MISTRAL_TRANSCRIPTION_MAX_CHUNKS = 48
 MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC = 180
+CHROME_MCP_DEFAULT_CHANNEL = "stable"
+CHROME_MCP_CONNECT_TIMEOUT_SEC = 15
+CHROME_MCP_RPC_TIMEOUT_SEC = 45
+VALID_CHROME_MCP_CHANNELS: set[str] = {"stable", "beta", "dev", "canary"}
 
 PROVIDER_DEFAULT_MODELS: dict[str, str] = {
     "openai": "azure-foundry/gpt-5.4",
@@ -35,6 +39,25 @@ def normalize_zai_plan(value: str | None) -> str:
     return "paygo"
 
 
+def _env_bool(name: str, default: bool) -> bool:
+    raw = os.getenv(name)
+    if raw is None:
+        return default
+    return raw.strip().lower() in {"1", "true", "yes", "on"}
+
+
+def normalize_chrome_mcp_channel(value: str | None) -> str:
+    cleaned = (value or "").strip().lower()
+    if cleaned in VALID_CHROME_MCP_CHANNELS:
+        return cleaned
+    return CHROME_MCP_DEFAULT_CHANNEL
+
+
+def normalize_chrome_mcp_browser_url(value: str | None) -> str | None:
+    cleaned = (value or "").strip()
+    return cleaned or None
+
+
 def resolve_zai_base_url(
     plan: str,
     *,
@@ -143,6 +166,12 @@ class AgentConfig:
     mistral_transcription_request_timeout_sec: int = (
         MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC
     )
+    chrome_mcp_enabled: bool = False
+    chrome_mcp_auto_connect: bool = True
+    chrome_mcp_browser_url: str | None = None
+    chrome_mcp_channel: str = CHROME_MCP_DEFAULT_CHANNEL
+    chrome_mcp_connect_timeout_sec: int = CHROME_MCP_CONNECT_TIMEOUT_SEC
+    chrome_mcp_rpc_timeout_sec: int = CHROME_MCP_RPC_TIMEOUT_SEC
     max_depth: int = 4
     max_steps_per_call: int = 100
     budget_extension_enabled: bool = True
@@ -184,6 +213,12 @@ def __post_init__(self) -> None:
             self.base_url,
             self.openai_oauth_token,
         )
+        self.chrome_mcp_browser_url = normalize_chrome_mcp_browser_url(
+            self.chrome_mcp_browser_url
+        )
+        self.chrome_mcp_channel = normalize_chrome_mcp_channel(self.chrome_mcp_channel)
+        self.chrome_mcp_connect_timeout_sec = max(1, int(self.chrome_mcp_connect_timeout_sec))
+        self.chrome_mcp_rpc_timeout_sec = max(1, int(self.chrome_mcp_rpc_timeout_sec))
 
     @classmethod
     def from_env(cls, workspace: str | Path) -> "AgentConfig":
@@ -248,6 +283,8 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             0,
             int(os.getenv("OPENPLANTER_BUDGET_EXTENSION_MAX_BLOCKS", "2")),
         )
+        chrome_mcp_enabled = _env_bool("OPENPLANTER_CHROME_MCP_ENABLED", False)
+        chrome_mcp_auto_connect = _env_bool("OPENPLANTER_CHROME_MCP_AUTO_CONNECT", True)
         return cls(
             workspace=ws,
             provider=os.getenv("OPENPLANTER_PROVIDER", "auto").strip().lower() or "auto",
@@ -319,6 +356,26 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
                     str(MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC),
                 )
             ),
+            chrome_mcp_enabled=chrome_mcp_enabled,
+            chrome_mcp_auto_connect=chrome_mcp_auto_connect,
+            chrome_mcp_browser_url=normalize_chrome_mcp_browser_url(
+                os.getenv("OPENPLANTER_CHROME_MCP_BROWSER_URL")
+            ),
+            chrome_mcp_channel=normalize_chrome_mcp_channel(
+                os.getenv("OPENPLANTER_CHROME_MCP_CHANNEL", CHROME_MCP_DEFAULT_CHANNEL)
+            ),
+            chrome_mcp_connect_timeout_sec=int(
+                os.getenv(
+                    "OPENPLANTER_CHROME_MCP_CONNECT_TIMEOUT_SEC",
+                    str(CHROME_MCP_CONNECT_TIMEOUT_SEC),
+                )
+            ),
+            chrome_mcp_rpc_timeout_sec=int(
+                os.getenv(
+                    "OPENPLANTER_CHROME_MCP_RPC_TIMEOUT_SEC",
+                    str(CHROME_MCP_RPC_TIMEOUT_SEC),
+                )
+            ),
             max_depth=int(os.getenv("OPENPLANTER_MAX_DEPTH", "4")),
             max_steps_per_call=int(os.getenv("OPENPLANTER_MAX_STEPS", "100")),
             budget_extension_enabled=budget_extension_enabled,
diff --git a/agent/engine.py b/agent/engine.py
index 1e4f4de1..4ff67441 100644
--- a/agent/engine.py
+++ b/agent/engine.py
@@ -431,10 +431,22 @@ def __post_init__(self) -> None:
                 acceptance_criteria=self.config.acceptance_criteria,
                 demo=self.config.demo,
             )
+        self._set_model_tool_defs(self.model, include_subtask=self.config.recursive)
+
+    def _build_tool_defs(self, *, include_subtask: bool) -> list[dict[str, Any]]:
         ac = self.config.acceptance_criteria
-        tool_defs = get_tool_definitions(include_subtask=self.config.recursive, include_acceptance_criteria=ac)
-        if hasattr(self.model, "tool_defs"):
-            self.model.tool_defs = tool_defs
+        dynamic_defs = self.tools.get_chrome_mcp_tool_defs()
+        return get_tool_definitions(
+            include_subtask=include_subtask,
+            include_acceptance_criteria=ac,
+            dynamic_defs=dynamic_defs,
+        )
+
+    def _set_model_tool_defs(self, model: BaseModel, *, include_subtask: bool) -> list[dict[str, Any]]:
+        tool_defs = self._build_tool_defs(include_subtask=include_subtask)
+        if hasattr(model, "tool_defs"):
+            model.tool_defs = tool_defs
+        return tool_defs
 
     def cancel(self) -> None:
         """Signal the engine to stop after the current model call or tool."""
@@ -462,6 +474,7 @@ def solve_with_context(
             self._shell_command_counts.clear()
         active_context = context if context is not None else ExternalContext()
         deadline = (time.monotonic() + self.config.max_solve_seconds) if self.config.max_solve_seconds > 0 else 0
+        self._set_model_tool_defs(self.model, include_subtask=self.config.recursive)
         try:
             result = self._solve_recursive(
                 objective=objective.strip(),
@@ -1491,10 +1504,10 @@ def _apply_tool_call(
             # Give executor full tools (no subtask, no execute).
             _saved_defs = None
             if exec_model and hasattr(exec_model, "tool_defs"):
-                exec_model.tool_defs = get_tool_definitions(include_subtask=False, include_acceptance_criteria=self.config.acceptance_criteria)
+                exec_model.tool_defs = self._build_tool_defs(include_subtask=False)
             elif exec_model is None and hasattr(cur, "tool_defs"):
                 _saved_defs = cur.tool_defs
-                cur.tool_defs = get_tool_definitions(include_subtask=False, include_acceptance_criteria=self.config.acceptance_criteria)
+                cur.tool_defs = self._build_tool_defs(include_subtask=False)
 
             self._emit(f"[d{depth}] >> executing leaf: {objective}", on_event)
             child_logger = (
@@ -1534,6 +1547,15 @@ def _apply_tool_call(
             limit = int(args.get("limit", 100) or 100)
             return False, self._read_artifact(aid, offset, limit)
 
+        dynamic_result = self.tools.try_execute_dynamic_tool(name, args)
+        if dynamic_result is not None:
+            if dynamic_result.image is not None:
+                self._pending_image.data = (
+                    dynamic_result.image.base64_data,
+                    dynamic_result.image.media_type,
+                )
+            return False, dynamic_result.content
+
         return False, f"Unknown action type: {name}"
 
     # ------------------------------------------------------------------
diff --git a/agent/settings.py b/agent/settings.py
index 5b3b4f97..448a211c 100644
--- a/agent/settings.py
+++ b/agent/settings.py
@@ -6,6 +6,7 @@
 
 
 VALID_REASONING_EFFORTS: set[str] = {"low", "medium", "high"}
+VALID_CHROME_MCP_CHANNELS: set[str] = {"stable", "beta", "dev", "canary"}
 
 
 def normalize_reasoning_effort(value: str | None) -> str | None:
@@ -22,6 +23,35 @@ def normalize_reasoning_effort(value: str | None) -> str | None:
     return cleaned
 
 
+def normalize_bool(value: bool | str | None) -> bool | None:
+    if value is None:
+        return None
+    if isinstance(value, bool):
+        return value
+    cleaned = value.strip().lower()
+    if not cleaned:
+        return None
+    if cleaned in {"1", "true", "yes", "on"}:
+        return True
+    if cleaned in {"0", "false", "no", "off"}:
+        return False
+    raise ValueError(f"Invalid boolean value '{value}'.")
+
+
+def normalize_chrome_mcp_channel(value: str | None) -> str | None:
+    if value is None:
+        return None
+    cleaned = value.strip().lower()
+    if not cleaned:
+        return None
+    if cleaned not in VALID_CHROME_MCP_CHANNELS:
+        raise ValueError(
+            f"Invalid Chrome MCP channel '{value}'. Expected one of: "
+            f"{', '.join(sorted(VALID_CHROME_MCP_CHANNELS))}"
+        )
+    return cleaned
+
+
 @dataclass(slots=True)
 class PersistentSettings:
     default_model: str | None = None
@@ -32,6 +62,12 @@ class PersistentSettings:
     default_model_cerebras: str | None = None
     default_model_zai: str | None = None
     default_model_ollama: str | None = None
+    chrome_mcp_enabled: bool | None = None
+    chrome_mcp_auto_connect: bool | None = None
+    chrome_mcp_browser_url: str | None = None
+    chrome_mcp_channel: str | None = None
+    chrome_mcp_connect_timeout_sec: int | None = None
+    chrome_mcp_rpc_timeout_sec: int | None = None
 
     def default_model_for_provider(self, provider: str) -> str | None:
         per_provider = {
@@ -59,6 +95,20 @@ def normalized(self) -> "PersistentSettings":
             default_model_cerebras=(self.default_model_cerebras or "").strip() or None,
             default_model_zai=(self.default_model_zai or "").strip() or None,
             default_model_ollama=(self.default_model_ollama or "").strip() or None,
+            chrome_mcp_enabled=normalize_bool(self.chrome_mcp_enabled),
+            chrome_mcp_auto_connect=normalize_bool(self.chrome_mcp_auto_connect),
+            chrome_mcp_browser_url=(self.chrome_mcp_browser_url or "").strip() or None,
+            chrome_mcp_channel=normalize_chrome_mcp_channel(self.chrome_mcp_channel),
+            chrome_mcp_connect_timeout_sec=(
+                max(1, int(self.chrome_mcp_connect_timeout_sec))
+                if self.chrome_mcp_connect_timeout_sec is not None
+                else None
+            ),
+            chrome_mcp_rpc_timeout_sec=(
+                max(1, int(self.chrome_mcp_rpc_timeout_sec))
+                if self.chrome_mcp_rpc_timeout_sec is not None
+                else None
+            ),
         )
 
     def to_json(self) -> dict[str, str]:
@@ -79,6 +129,18 @@ def to_json(self) -> dict[str, str]:
             payload["default_model_zai"] = self.default_model_zai
         if self.default_model_ollama:
             payload["default_model_ollama"] = self.default_model_ollama
+        if self.chrome_mcp_enabled is not None:
+            payload["chrome_mcp_enabled"] = self.chrome_mcp_enabled
+        if self.chrome_mcp_auto_connect is not None:
+            payload["chrome_mcp_auto_connect"] = self.chrome_mcp_auto_connect
+        if self.chrome_mcp_browser_url:
+            payload["chrome_mcp_browser_url"] = self.chrome_mcp_browser_url
+        if self.chrome_mcp_channel:
+            payload["chrome_mcp_channel"] = self.chrome_mcp_channel
+        if self.chrome_mcp_connect_timeout_sec is not None:
+            payload["chrome_mcp_connect_timeout_sec"] = self.chrome_mcp_connect_timeout_sec
+        if self.chrome_mcp_rpc_timeout_sec is not None:
+            payload["chrome_mcp_rpc_timeout_sec"] = self.chrome_mcp_rpc_timeout_sec
         return payload
 
     @classmethod
@@ -96,6 +158,20 @@ def from_json(cls, payload: dict | None) -> "PersistentSettings":
             default_model_cerebras=(str(payload.get("default_model_cerebras", "")).strip() or None),
             default_model_zai=(str(payload.get("default_model_zai", "")).strip() or None),
             default_model_ollama=(str(payload.get("default_model_ollama", "")).strip() or None),
+            chrome_mcp_enabled=payload.get("chrome_mcp_enabled"),
+            chrome_mcp_auto_connect=payload.get("chrome_mcp_auto_connect"),
+            chrome_mcp_browser_url=(str(payload.get("chrome_mcp_browser_url", "")).strip() or None),
+            chrome_mcp_channel=(str(payload.get("chrome_mcp_channel", "")).strip() or None),
+            chrome_mcp_connect_timeout_sec=(
+                int(payload["chrome_mcp_connect_timeout_sec"])
+                if payload.get("chrome_mcp_connect_timeout_sec") is not None
+                else None
+            ),
+            chrome_mcp_rpc_timeout_sec=(
+                int(payload["chrome_mcp_rpc_timeout_sec"])
+                if payload.get("chrome_mcp_rpc_timeout_sec") is not None
+                else None
+            ),
         ).normalized()
 
 
diff --git a/agent/tool_defs.py b/agent/tool_defs.py
index 50f7a9cb..ce873da4 100644
--- a/agent/tool_defs.py
+++ b/agent/tool_defs.py
@@ -488,6 +488,34 @@
 _DELEGATION_TOOLS = {"subtask", "execute", "list_artifacts", "read_artifact"}
 
 
+def _merge_dynamic_definitions(
+    defs: list[dict[str, Any]],
+    dynamic_defs: list[dict[str, Any]] | None,
+) -> list[dict[str, Any]]:
+    if not dynamic_defs:
+        return defs
+    merged = list(defs)
+    seen = {str(item.get("name", "")).strip() for item in defs}
+    for item in dynamic_defs:
+        if not isinstance(item, dict):
+            continue
+        name = str(item.get("name", "")).strip()
+        if not name or name in seen:
+            continue
+        parameters = item.get("parameters")
+        if not isinstance(parameters, dict):
+            continue
+        merged.append(
+            {
+                "name": name,
+                "description": str(item.get("description", "") or ""),
+                "parameters": parameters,
+            }
+        )
+        seen.add(name)
+    return merged
+
+
 def _strip_acceptance_criteria(defs: list[dict[str, Any]]) -> list[dict[str, Any]]:
     """Remove acceptance_criteria property from subtask/execute schemas."""
     import copy
@@ -507,6 +535,7 @@ def get_tool_definitions(
     include_subtask: bool = True,
     include_artifacts: bool = False,
     include_acceptance_criteria: bool = False,
+    dynamic_defs: list[dict[str, Any]] | None = None,
 ) -> list[dict[str, Any]]:
     """Return tool definitions based on mode.
 
@@ -523,6 +552,8 @@ def get_tool_definitions(
     if include_artifacts:
         defs += [d for d in TOOL_DEFINITIONS if d["name"] in _ARTIFACT_TOOLS]
 
+    defs = _merge_dynamic_definitions(defs, dynamic_defs)
+
     if not include_acceptance_criteria:
         defs = _strip_acceptance_criteria(defs)
     return defs
diff --git a/agent/tools.py b/agent/tools.py
index c9a457cc..d4e29bcd 100644
--- a/agent/tools.py
+++ b/agent/tools.py
@@ -27,6 +27,12 @@
 
 _MAX_WALK_ENTRIES = 50_000
 
+from .chrome_mcp import (
+    ChromeMcpCallResult,
+    ChromeMcpError,
+    ChromeMcpStatus,
+    acquire_shared_manager,
+)
 from .patching import (
     AddFileOp,
     DeleteFileOp,
@@ -139,6 +145,12 @@ class WorkspaceTools:
     mistral_transcription_chunk_overlap_seconds: float = 2.0
     mistral_transcription_max_chunks: int = 48
     mistral_transcription_request_timeout_sec: int = 180
+    chrome_mcp_enabled: bool = False
+    chrome_mcp_auto_connect: bool = True
+    chrome_mcp_browser_url: str | None = None
+    chrome_mcp_channel: str = "stable"
+    chrome_mcp_connect_timeout_sec: int = 15
+    chrome_mcp_rpc_timeout_sec: int = 45
 
     def __post_init__(self) -> None:
         self.root = self.root.expanduser().resolve()
@@ -153,6 +165,14 @@ def __post_init__(self) -> None:
         self._parallel_write_claims: dict[str, dict[Path, str]] = {}
         self._parallel_lock = threading.Lock()
         self._scope_local = threading.local()
+        self._chrome_mcp = acquire_shared_manager(
+            enabled=self.chrome_mcp_enabled,
+            auto_connect=self.chrome_mcp_auto_connect,
+            browser_url=self.chrome_mcp_browser_url,
+            channel=self.chrome_mcp_channel,
+            connect_timeout_sec=self.chrome_mcp_connect_timeout_sec,
+            rpc_timeout_sec=self.chrome_mcp_rpc_timeout_sec,
+        )
 
     def _clip(self, text: str, max_chars: int) -> str:
         if len(text) <= max_chars:
@@ -344,6 +364,49 @@ def cleanup_bg_jobs(self) -> None:
                 pass
         self._bg_jobs.clear()
 
+    def chrome_mcp_status(self) -> ChromeMcpStatus:
+        if not self.chrome_mcp_enabled or self._chrome_mcp is None:
+            return ChromeMcpStatus(
+                status="disabled",
+                detail="Chrome DevTools MCP is disabled.",
+            )
+        return self._chrome_mcp.status_snapshot()
+
+    def get_chrome_mcp_tool_defs(self, *, force_refresh: bool = False) -> list[dict[str, Any]]:
+        if not self.chrome_mcp_enabled or self._chrome_mcp is None:
+            return []
+        try:
+            return [
+                tool.as_tool_definition()
+                for tool in self._chrome_mcp.list_tools(force_refresh=force_refresh)
+            ]
+        except ChromeMcpError:
+            return []
+
+    def try_execute_dynamic_tool(
+        self,
+        name: str,
+        arguments: dict[str, Any],
+    ) -> ChromeMcpCallResult | None:
+        if not self.chrome_mcp_enabled or self._chrome_mcp is None:
+            return None
+        try:
+            known_names = {tool.name for tool in self._chrome_mcp.list_tools()}
+        except ChromeMcpError as exc:
+            return ChromeMcpCallResult(
+                content=f"Chrome DevTools MCP unavailable: {exc}",
+                is_error=True,
+            )
+        if name not in known_names:
+            return None
+        try:
+            return self._chrome_mcp.call_tool(name, arguments)
+        except ChromeMcpError as exc:
+            return ChromeMcpCallResult(
+                content=f"Chrome DevTools MCP unavailable: {exc}",
+                is_error=True,
+            )
+
     def list_files(self, glob: str | None = None) -> str:
         lines: list[str]
         if shutil.which("rg"):
diff --git a/agent/tui.py b/agent/tui.py
index f7283088..af40aa06 100644
--- a/agent/tui.py
+++ b/agent/tui.py
@@ -15,7 +15,16 @@
 from .settings import SettingsStore
 
 
-SLASH_COMMANDS: list[str] = ["/quit", "/exit", "/help", "/status", "/clear", "/model", "/reasoning"]
+SLASH_COMMANDS: list[str] = [
+    "/quit",
+    "/exit",
+    "/help",
+    "/status",
+    "/clear",
+    "/model",
+    "/reasoning",
+    "/chrome",
+]
 
 
 def _queue_prompt_style():
@@ -106,6 +115,7 @@ def _build_splash() -> str:
     "  /model <name> --save  Switch and persist as default",
     "  /model list [all]   List available models",
     "  /reasoning [low|medium|high|off]  Change reasoning effort",
+    "  /chrome status|on|off|auto|url <endpoint>|channel <stable|beta|dev|canary> [--save]",
     "  /status  /clear  /quit  /exit  /help",
 ]
 
@@ -362,6 +372,90 @@ def _get_mode_label(cfg: AgentConfig) -> str:
     return "flat"
 
 
+def _format_chrome_status(ctx: ChatContext) -> list[str]:
+    status = ctx.runtime.engine.tools.chrome_mcp_status()
+    attach_mode = (
+        f"browser_url={ctx.cfg.chrome_mcp_browser_url}"
+        if ctx.cfg.chrome_mcp_browser_url
+        else ("auto-connect" if ctx.cfg.chrome_mcp_auto_connect else "manual-disabled")
+    )
+    lines = [
+        (
+            "Chrome MCP: "
+            f"enabled={ctx.cfg.chrome_mcp_enabled} | attach={attach_mode} | "
+            f"channel={ctx.cfg.chrome_mcp_channel}"
+        ),
+        f"Runtime status: {status.status} | {status.detail}",
+    ]
+    if status.tool_count:
+        lines.append(f"Discovered Chrome tools: {status.tool_count}")
+    return lines
+
+
+def handle_chrome_command(args: str, ctx: ChatContext) -> list[str]:
+    from .builder import build_engine
+
+    parts = [part for part in args.strip().split() if part]
+    save = False
+    if "--save" in parts:
+        save = True
+        parts = [part for part in parts if part != "--save"]
+
+    if not parts or parts[0] == "status":
+        lines = _format_chrome_status(ctx)
+        if not parts:
+            lines.append(
+                "Usage: /chrome status|on|off|auto|url <endpoint>|channel <stable|beta|dev|canary> [--save]"
+            )
+        return lines
+
+    action = parts[0].lower()
+    if action == "on":
+        ctx.cfg.chrome_mcp_enabled = True
+    elif action == "off":
+        ctx.cfg.chrome_mcp_enabled = False
+    elif action == "auto":
+        ctx.cfg.chrome_mcp_enabled = True
+        ctx.cfg.chrome_mcp_auto_connect = True
+        ctx.cfg.chrome_mcp_browser_url = None
+    elif action == "url":
+        if len(parts) < 2:
+            return ["Usage: /chrome url <endpoint> [--save]"]
+        ctx.cfg.chrome_mcp_enabled = True
+        ctx.cfg.chrome_mcp_auto_connect = False
+        ctx.cfg.chrome_mcp_browser_url = parts[1].strip() or None
+    elif action == "channel":
+        if len(parts) < 2:
+            return ["Usage: /chrome channel <stable|beta|dev|canary> [--save]"]
+        channel = parts[1].strip().lower()
+        if channel not in {"stable", "beta", "dev", "canary"}:
+            return [f"Invalid Chrome channel '{channel}'. Use: stable, beta, dev, canary"]
+        ctx.cfg.chrome_mcp_channel = channel
+    else:
+        return [
+            f"Unknown /chrome action '{action}'.",
+            "Usage: /chrome status|on|off|auto|url <endpoint>|channel <stable|beta|dev|canary> [--save]",
+        ]
+
+    try:
+        ctx.runtime.engine = build_engine(ctx.cfg)
+    except ModelError as exc:
+        return [f"Failed to apply Chrome MCP change: {exc}"]
+
+    lines = _format_chrome_status(ctx)
+    if save:
+        settings = ctx.settings_store.load()
+        settings.chrome_mcp_enabled = ctx.cfg.chrome_mcp_enabled
+        settings.chrome_mcp_auto_connect = ctx.cfg.chrome_mcp_auto_connect
+        settings.chrome_mcp_browser_url = ctx.cfg.chrome_mcp_browser_url
+        settings.chrome_mcp_channel = ctx.cfg.chrome_mcp_channel
+        settings.chrome_mcp_connect_timeout_sec = ctx.cfg.chrome_mcp_connect_timeout_sec
+        settings.chrome_mcp_rpc_timeout_sec = ctx.cfg.chrome_mcp_rpc_timeout_sec
+        ctx.settings_store.save(settings)
+        lines.append("Saved as workspace default.")
+    return lines
+
+
 def dispatch_slash_command(
     command: str,
     ctx: ChatContext,
@@ -389,6 +483,8 @@ def dispatch_slash_command(
                 )
         else:
             emit("  Tokens: (none yet)")
+        for line in _format_chrome_status(ctx):
+            emit(f"  {line}")
         return "handled"
     if command == "/clear":
         return "clear"
@@ -404,6 +500,12 @@ def dispatch_slash_command(
         for line in lines:
             emit(line)
         return "handled"
+    if command.startswith("/chrome"):
+        cmd_args = command[len("/chrome"):].strip()
+        lines = handle_chrome_command(cmd_args, ctx)
+        for line in lines:
+            emit(line)
+        return "handled"
     return None
 
 
diff --git a/openplanter-desktop/crates/op-core/src/config.rs b/openplanter-desktop/crates/op-core/src/config.rs
index 3b8f8289..f8698512 100644
--- a/openplanter-desktop/crates/op-core/src/config.rs
+++ b/openplanter-desktop/crates/op-core/src/config.rs
@@ -22,6 +22,9 @@ pub const MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS: i64 = 900;
 pub const MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS: f64 = 2.0;
 pub const MISTRAL_TRANSCRIPTION_MAX_CHUNKS: i64 = 48;
 pub const MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC: i64 = 180;
+pub const CHROME_MCP_DEFAULT_CHANNEL: &str = "stable";
+pub const CHROME_MCP_CONNECT_TIMEOUT_SEC: i64 = 15;
+pub const CHROME_MCP_RPC_TIMEOUT_SEC: i64 = 45;
 
 /// Default model for each supported provider.
 pub static PROVIDER_DEFAULT_MODELS: LazyLock<HashMap<&'static str, &'static str>> =
@@ -89,6 +92,22 @@ pub fn normalize_web_search_provider(value: Option<&str>) -> String {
     }
 }
 
+pub fn normalize_chrome_mcp_channel(value: Option<&str>) -> String {
+    match value.unwrap_or_default().trim().to_lowercase().as_str() {
+        "beta" => "beta".to_string(),
+        "dev" => "dev".to_string(),
+        "canary" => "canary".to_string(),
+        _ => CHROME_MCP_DEFAULT_CHANNEL.to_string(),
+    }
+}
+
+pub fn normalize_chrome_mcp_browser_url(value: Option<&str>) -> Option<String> {
+    value
+        .map(str::trim)
+        .filter(|value| !value.is_empty())
+        .map(str::to_string)
+}
+
 fn normalize_base_url(value: &str) -> String {
     value.trim().trim_end_matches('/').to_string()
 }
@@ -224,6 +243,12 @@ pub struct AgentConfig {
     pub mistral_transcription_chunk_overlap_seconds: f64,
     pub mistral_transcription_max_chunks: i64,
     pub mistral_transcription_request_timeout_sec: i64,
+    pub chrome_mcp_enabled: bool,
+    pub chrome_mcp_auto_connect: bool,
+    pub chrome_mcp_browser_url: Option<String>,
+    pub chrome_mcp_channel: String,
+    pub chrome_mcp_connect_timeout_sec: i64,
+    pub chrome_mcp_rpc_timeout_sec: i64,
 
     // Limits
     pub max_depth: i64,
@@ -297,6 +322,12 @@ impl Default for AgentConfig {
                 MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS,
             mistral_transcription_max_chunks: MISTRAL_TRANSCRIPTION_MAX_CHUNKS,
             mistral_transcription_request_timeout_sec: MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC,
+            chrome_mcp_enabled: false,
+            chrome_mcp_auto_connect: true,
+            chrome_mcp_browser_url: None,
+            chrome_mcp_channel: CHROME_MCP_DEFAULT_CHANNEL.into(),
+            chrome_mcp_connect_timeout_sec: CHROME_MCP_CONNECT_TIMEOUT_SEC,
+            chrome_mcp_rpc_timeout_sec: CHROME_MCP_RPC_TIMEOUT_SEC,
             max_depth: 4,
             max_steps_per_call: 100,
             budget_extension_enabled: true,
@@ -396,6 +427,8 @@ impl AgentConfig {
         });
         let web_search_provider =
             normalize_web_search_provider(env_opt("OPENPLANTER_WEB_SEARCH_PROVIDER").as_deref());
+        let chrome_mcp_enabled = env_bool("OPENPLANTER_CHROME_MCP_ENABLED", false);
+        let chrome_mcp_auto_connect = env_bool("OPENPLANTER_CHROME_MCP_AUTO_CONNECT", true);
 
         Self {
             workspace: ws,
@@ -466,6 +499,24 @@ impl AgentConfig {
                 "OPENPLANTER_MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC",
                 MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC,
             ),
+            chrome_mcp_enabled,
+            chrome_mcp_auto_connect,
+            chrome_mcp_browser_url: normalize_chrome_mcp_browser_url(
+                env_opt("OPENPLANTER_CHROME_MCP_BROWSER_URL").as_deref(),
+            ),
+            chrome_mcp_channel: normalize_chrome_mcp_channel(
+                env_opt("OPENPLANTER_CHROME_MCP_CHANNEL").as_deref(),
+            ),
+            chrome_mcp_connect_timeout_sec: env_int(
+                "OPENPLANTER_CHROME_MCP_CONNECT_TIMEOUT_SEC",
+                CHROME_MCP_CONNECT_TIMEOUT_SEC,
+            )
+            .max(1),
+            chrome_mcp_rpc_timeout_sec: env_int(
+                "OPENPLANTER_CHROME_MCP_RPC_TIMEOUT_SEC",
+                CHROME_MCP_RPC_TIMEOUT_SEC,
+            )
+            .max(1),
             max_depth: env_int("OPENPLANTER_MAX_DEPTH", 4),
             max_steps_per_call: env_int("OPENPLANTER_MAX_STEPS", 100),
             budget_extension_enabled: env_bool("OPENPLANTER_BUDGET_EXTENSION_ENABLED", true),
diff --git a/openplanter-desktop/crates/op-core/src/config_hydration.rs b/openplanter-desktop/crates/op-core/src/config_hydration.rs
index e1e81c36..dd472209 100644
--- a/openplanter-desktop/crates/op-core/src/config_hydration.rs
+++ b/openplanter-desktop/crates/op-core/src/config_hydration.rs
@@ -103,6 +103,42 @@ pub fn apply_settings_to_config(cfg: &mut AgentConfig, settings: &PersistentSett
         }
     }
 
+    if !has_env_value(&["OPENPLANTER_CHROME_MCP_ENABLED"]) {
+        if let Some(enabled) = settings.chrome_mcp_enabled {
+            cfg.chrome_mcp_enabled = enabled;
+        }
+    }
+
+    if !has_env_value(&["OPENPLANTER_CHROME_MCP_AUTO_CONNECT"]) {
+        if let Some(auto_connect) = settings.chrome_mcp_auto_connect {
+            cfg.chrome_mcp_auto_connect = auto_connect;
+        }
+    }
+
+    if !has_env_value(&["OPENPLANTER_CHROME_MCP_BROWSER_URL"]) {
+        if let Some(browser_url) = settings.chrome_mcp_browser_url.as_deref() {
+            cfg.chrome_mcp_browser_url = Some(browser_url.to_string());
+        }
+    }
+
+    if !has_env_value(&["OPENPLANTER_CHROME_MCP_CHANNEL"]) {
+        if let Some(channel) = settings.chrome_mcp_channel.as_deref() {
+            cfg.chrome_mcp_channel = channel.to_string();
+        }
+    }
+
+    if !has_env_value(&["OPENPLANTER_CHROME_MCP_CONNECT_TIMEOUT_SEC"]) {
+        if let Some(timeout) = settings.chrome_mcp_connect_timeout_sec {
+            cfg.chrome_mcp_connect_timeout_sec = timeout.max(1);
+        }
+    }
+
+    if !has_env_value(&["OPENPLANTER_CHROME_MCP_RPC_TIMEOUT_SEC"]) {
+        if let Some(timeout) = settings.chrome_mcp_rpc_timeout_sec {
+            cfg.chrome_mcp_rpc_timeout_sec = timeout.max(1);
+        }
+    }
+
     if !has_env_value(&["OPENPLANTER_MODEL"]) {
         let saved_model = if cfg.provider == "auto" {
             settings.default_model.as_deref()
diff --git a/openplanter-desktop/crates/op-core/src/engine/mod.rs b/openplanter-desktop/crates/op-core/src/engine/mod.rs
index 4b6faa18..be16d40a 100644
--- a/openplanter-desktop/crates/op-core/src/engine/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/mod.rs
@@ -9,6 +9,7 @@ pub mod investigation_state;
 pub mod judge;
 
 use std::collections::HashSet;
+use std::sync::Arc;
 use std::time::Duration;
 
 use anyhow::anyhow;
@@ -795,6 +796,26 @@ pub async fn solve_with_initial_context(
     emitter: &dyn SolveEmitter,
     cancel: CancellationToken,
     initial_context: Option<SolveInitialContext>,
+) {
+    solve_with_initial_context_and_chrome_mcp(
+        objective,
+        config,
+        emitter,
+        cancel,
+        initial_context,
+        None,
+    )
+    .await;
+}
+
+/// Real solve flow with optional initial structured context and shared Chrome MCP manager.
+pub async fn solve_with_initial_context_and_chrome_mcp(
+    objective: &str,
+    config: &AgentConfig,
+    emitter: &dyn SolveEmitter,
+    cancel: CancellationToken,
+    initial_context: Option<SolveInitialContext>,
+    chrome_mcp: Option<Arc<crate::tools::chrome_mcp::ChromeMcpManager>>,
 ) {
     if config.demo {
         return demo_solve(objective, emitter, cancel).await;
@@ -813,8 +834,21 @@ pub async fn solve_with_initial_context(
     emitter.emit_trace(&format!("Solving with {}/{}", provider, model.model_name()));
 
     // 2. Build tools and messages
-    let tool_defs = build_tool_defs(&provider);
-    let mut tools = WorkspaceTools::new(config);
+    let dynamic_tool_defs = if let Some(manager) = chrome_mcp.as_ref() {
+        match manager.list_tools(false).await {
+            Ok(defs) => defs,
+            Err(err) => {
+                emitter.emit_trace(&format!(
+                    "[chrome-mcp] unavailable; continuing with built-in tools only: {err}"
+                ));
+                Vec::new()
+            }
+        }
+    } else {
+        Vec::new()
+    };
+    let tool_defs = build_tool_defs(&provider, &dynamic_tool_defs);
+    let mut tools = WorkspaceTools::new(config, chrome_mcp);
 
     let system_prompt =
         build_system_prompt(config.recursive, config.acceptance_criteria, config.demo);
diff --git a/openplanter-desktop/crates/op-core/src/events.rs b/openplanter-desktop/crates/op-core/src/events.rs
index 326c6d0b..1a49f147 100644
--- a/openplanter-desktop/crates/op-core/src/events.rs
+++ b/openplanter-desktop/crates/op-core/src/events.rs
@@ -201,6 +201,14 @@ pub struct ConfigView {
     pub reasoning_effort: Option<String>,
     pub zai_plan: String,
     pub web_search_provider: String,
+    pub chrome_mcp_enabled: bool,
+    pub chrome_mcp_auto_connect: bool,
+    pub chrome_mcp_browser_url: Option<String>,
+    pub chrome_mcp_channel: String,
+    pub chrome_mcp_connect_timeout_sec: i64,
+    pub chrome_mcp_rpc_timeout_sec: i64,
+    pub chrome_mcp_status: String,
+    pub chrome_mcp_status_detail: String,
     pub workspace: String,
     pub session_id: Option<String>,
     pub recursive: bool,
@@ -217,6 +225,12 @@ pub struct PartialConfig {
     pub reasoning_effort: Option<String>,
     pub zai_plan: Option<String>,
     pub web_search_provider: Option<String>,
+    pub chrome_mcp_enabled: Option<bool>,
+    pub chrome_mcp_auto_connect: Option<bool>,
+    pub chrome_mcp_browser_url: Option<String>,
+    pub chrome_mcp_channel: Option<String>,
+    pub chrome_mcp_connect_timeout_sec: Option<i64>,
+    pub chrome_mcp_rpc_timeout_sec: Option<i64>,
 }
 
 /// Model information for the model list.
diff --git a/openplanter-desktop/crates/op-core/src/settings.rs b/openplanter-desktop/crates/op-core/src/settings.rs
index de0688f6..b250492e 100644
--- a/openplanter-desktop/crates/op-core/src/settings.rs
+++ b/openplanter-desktop/crates/op-core/src/settings.rs
@@ -1,10 +1,12 @@
-use std::collections::HashMap;
 use std::fs;
 use std::path::{Path, PathBuf};
 
 use serde::{Deserialize, Serialize};
 
-use crate::config::{normalize_web_search_provider, normalize_zai_plan};
+use crate::config::{
+    normalize_chrome_mcp_browser_url, normalize_chrome_mcp_channel,
+    normalize_web_search_provider, normalize_zai_plan,
+};
 
 const VALID_REASONING_EFFORTS: &[&str] = &["low", "medium", "high"];
 
@@ -29,6 +31,20 @@ pub fn normalize_reasoning_effort(value: Option<&str>) -> Result<Option<String>,
     }
 }
 
+pub fn normalize_bool(value: Option<&serde_json::Value>) -> Result<Option<bool>, String> {
+    match value {
+        None | Some(serde_json::Value::Null) => Ok(None),
+        Some(serde_json::Value::Bool(value)) => Ok(Some(*value)),
+        Some(serde_json::Value::String(value)) => match value.trim().to_lowercase().as_str() {
+            "" => Ok(None),
+            "1" | "true" | "yes" | "on" => Ok(Some(true)),
+            "0" | "false" | "no" | "off" => Ok(Some(false)),
+            _ => Err(format!("Invalid boolean value '{}'.", value)),
+        },
+        Some(other) => Err(format!("Invalid boolean value '{}'.", other)),
+    }
+}
+
 /// Persistent settings stored per workspace.
 ///
 /// Mirrors the Python `PersistentSettings` dataclass.
@@ -44,6 +60,12 @@ pub struct PersistentSettings {
     pub default_model_ollama: Option<String>,
     pub zai_plan: Option<String>,
     pub web_search_provider: Option<String>,
+    pub chrome_mcp_enabled: Option<bool>,
+    pub chrome_mcp_auto_connect: Option<bool>,
+    pub chrome_mcp_browser_url: Option<String>,
+    pub chrome_mcp_channel: Option<String>,
+    pub chrome_mcp_connect_timeout_sec: Option<i64>,
+    pub chrome_mcp_rpc_timeout_sec: Option<i64>,
 }
 
 impl PersistentSettings {
@@ -102,16 +124,27 @@ impl PersistentSettings {
             default_model_ollama: trim_opt(&self.default_model_ollama),
             zai_plan,
             web_search_provider,
+            chrome_mcp_enabled: self.chrome_mcp_enabled,
+            chrome_mcp_auto_connect: self.chrome_mcp_auto_connect,
+            chrome_mcp_browser_url: normalize_chrome_mcp_browser_url(
+                self.chrome_mcp_browser_url.as_deref(),
+            ),
+            chrome_mcp_channel: self
+                .chrome_mcp_channel
+                .as_deref()
+                .map(|value| normalize_chrome_mcp_channel(Some(value))),
+            chrome_mcp_connect_timeout_sec: self.chrome_mcp_connect_timeout_sec.map(|value| value.max(1)),
+            chrome_mcp_rpc_timeout_sec: self.chrome_mcp_rpc_timeout_sec.map(|value| value.max(1)),
         })
     }
 
     /// Serialize to JSON map, omitting `None` values.
-    pub fn to_json(&self) -> HashMap<String, String> {
-        let mut payload = HashMap::new();
+    pub fn to_json(&self) -> serde_json::Map<String, serde_json::Value> {
+        let mut payload = serde_json::Map::new();
         macro_rules! add {
             ($field:ident, $key:expr) => {
                 if let Some(ref v) = self.$field {
-                    payload.insert($key.to_string(), v.clone());
+                    payload.insert($key.to_string(), serde_json::json!(v));
                 }
             };
         }
@@ -125,6 +158,12 @@ impl PersistentSettings {
         add!(default_model_ollama, "default_model_ollama");
         add!(zai_plan, "zai_plan");
         add!(web_search_provider, "web_search_provider");
+        add!(chrome_mcp_enabled, "chrome_mcp_enabled");
+        add!(chrome_mcp_auto_connect, "chrome_mcp_auto_connect");
+        add!(chrome_mcp_browser_url, "chrome_mcp_browser_url");
+        add!(chrome_mcp_channel, "chrome_mcp_channel");
+        add!(chrome_mcp_connect_timeout_sec, "chrome_mcp_connect_timeout_sec");
+        add!(chrome_mcp_rpc_timeout_sec, "chrome_mcp_rpc_timeout_sec");
         payload
     }
 
@@ -153,6 +192,19 @@ impl PersistentSettings {
             default_model_ollama: get_str(obj, "default_model_ollama"),
             zai_plan: get_str(obj, "zai_plan"),
             web_search_provider: get_str(obj, "web_search_provider"),
+            chrome_mcp_enabled: normalize_bool(obj.get("chrome_mcp_enabled"))?,
+            chrome_mcp_auto_connect: normalize_bool(obj.get("chrome_mcp_auto_connect"))?,
+            chrome_mcp_browser_url: normalize_chrome_mcp_browser_url(
+                get_str(obj, "chrome_mcp_browser_url").as_deref(),
+            ),
+            chrome_mcp_channel: get_str(obj, "chrome_mcp_channel")
+                .map(|value| normalize_chrome_mcp_channel(Some(&value))),
+            chrome_mcp_connect_timeout_sec: obj
+                .get("chrome_mcp_connect_timeout_sec")
+                .and_then(|value| value.as_i64()),
+            chrome_mcp_rpc_timeout_sec: obj
+                .get("chrome_mcp_rpc_timeout_sec")
+                .and_then(|value| value.as_i64()),
         };
         settings.normalized()
     }
diff --git a/openplanter-desktop/crates/op-core/src/tools/chrome_mcp.rs b/openplanter-desktop/crates/op-core/src/tools/chrome_mcp.rs
new file mode 100644
index 00000000..b4e7d14a
--- /dev/null
+++ b/openplanter-desktop/crates/op-core/src/tools/chrome_mcp.rs
@@ -0,0 +1,596 @@
+use std::env;
+use std::process::Stdio;
+use std::sync::Arc;
+use std::time::Duration;
+
+use anyhow::{Context, anyhow};
+use chrono::Utc;
+use serde::{Deserialize, Serialize};
+use serde_json::{Value, json};
+use tokio::io::{AsyncBufReadExt, AsyncWriteExt, BufReader, Lines};
+use tokio::process::{Child, ChildStderr, ChildStdin, ChildStdout, Command};
+use tokio::sync::Mutex;
+use tokio::task::JoinHandle;
+use tokio::time::timeout;
+
+use crate::config::{
+    AgentConfig, normalize_chrome_mcp_browser_url, normalize_chrome_mcp_channel,
+};
+
+#[derive(Debug, Clone, PartialEq, Eq)]
+pub struct ChromeMcpConfigKey {
+    pub enabled: bool,
+    pub auto_connect: bool,
+    pub browser_url: Option<String>,
+    pub channel: String,
+    pub connect_timeout_sec: i64,
+    pub rpc_timeout_sec: i64,
+}
+
+impl ChromeMcpConfigKey {
+    pub fn from_config(config: &AgentConfig) -> Self {
+        Self {
+            enabled: config.chrome_mcp_enabled,
+            auto_connect: config.chrome_mcp_auto_connect,
+            browser_url: normalize_chrome_mcp_browser_url(config.chrome_mcp_browser_url.as_deref()),
+            channel: normalize_chrome_mcp_channel(Some(&config.chrome_mcp_channel)),
+            connect_timeout_sec: config.chrome_mcp_connect_timeout_sec.max(1),
+            rpc_timeout_sec: config.chrome_mcp_rpc_timeout_sec.max(1),
+        }
+    }
+}
+
+#[derive(Debug, Clone, Serialize, Deserialize, PartialEq)]
+pub struct ChromeMcpToolDef {
+    pub name: String,
+    pub description: String,
+    pub parameters: Value,
+}
+
+#[derive(Debug, Clone, Serialize, Deserialize, PartialEq, Eq)]
+pub struct ChromeMcpStatus {
+    pub status: String,
+    pub detail: String,
+    pub tool_count: usize,
+    #[serde(default, skip_serializing_if = "Option::is_none")]
+    pub last_refresh_ms: Option<i64>,
+}
+
+impl ChromeMcpStatus {
+    fn disabled() -> Self {
+        Self {
+            status: "disabled".into(),
+            detail: "Chrome DevTools MCP is disabled.".into(),
+            tool_count: 0,
+            last_refresh_ms: None,
+        }
+    }
+
+    fn pending() -> Self {
+        Self {
+            status: "ready".into(),
+            detail: "Chrome DevTools MCP will initialize on the next solve.".into(),
+            tool_count: 0,
+            last_refresh_ms: None,
+        }
+    }
+}
+
+struct ChromeMcpInner {
+    child: Option<Child>,
+    stdin: Option<ChildStdin>,
+    stdout: Option<Lines<BufReader<ChildStdout>>>,
+    stderr_task: Option<JoinHandle<()>>,
+    stderr_tail: Arc<Mutex<Vec<String>>>,
+    next_request_id: u64,
+    tools: Vec<ChromeMcpToolDef>,
+    last_refresh_ms: Option<i64>,
+    status: ChromeMcpStatus,
+}
+
+impl ChromeMcpInner {
+    fn new(enabled: bool) -> Self {
+        Self {
+            child: None,
+            stdin: None,
+            stdout: None,
+            stderr_task: None,
+            stderr_tail: Arc::new(Mutex::new(Vec::new())),
+            next_request_id: 1,
+            tools: Vec::new(),
+            last_refresh_ms: None,
+            status: if enabled {
+                ChromeMcpStatus::pending()
+            } else {
+                ChromeMcpStatus::disabled()
+            },
+        }
+    }
+}
+
+pub struct ChromeMcpManager {
+    config: ChromeMcpConfigKey,
+    inner: Mutex<ChromeMcpInner>,
+}
+
+impl ChromeMcpManager {
+    pub fn new(config: ChromeMcpConfigKey) -> Self {
+        let enabled = config.enabled;
+        Self {
+            config,
+            inner: Mutex::new(ChromeMcpInner::new(enabled)),
+        }
+    }
+
+    pub async fn status_snapshot(&self) -> ChromeMcpStatus {
+        self.inner.lock().await.status.clone()
+    }
+
+    pub async fn list_tools(&self, force_refresh: bool) -> anyhow::Result<Vec<ChromeMcpToolDef>> {
+        if !self.config.enabled {
+            return Ok(Vec::new());
+        }
+        let mut last_error: Option<anyhow::Error> = None;
+        for attempt in 0..2 {
+            let mut inner = self.inner.lock().await;
+            match self.list_tools_locked(&mut inner, force_refresh).await {
+                Ok(tools) => return Ok(tools),
+                Err(err) => {
+                    last_error = Some(err);
+                    self.shutdown_locked(&mut inner).await;
+                    if attempt == 0 {
+                        continue;
+                    }
+                }
+            }
+        }
+        Err(last_error.unwrap_or_else(|| anyhow!("Chrome DevTools MCP tools/list failed")))
+    }
+
+    pub async fn call_tool(&self, name: &str, arguments: &Value) -> anyhow::Result<String> {
+        if !self.config.enabled {
+            return Err(anyhow!("Chrome DevTools MCP is disabled."));
+        }
+        let mut last_error: Option<anyhow::Error> = None;
+        for attempt in 0..2 {
+            let mut inner = self.inner.lock().await;
+            match self.call_tool_locked(&mut inner, name, arguments).await {
+                Ok(result) => return Ok(result),
+                Err(err) => {
+                    last_error = Some(err);
+                    self.shutdown_locked(&mut inner).await;
+                    if attempt == 0 {
+                        continue;
+                    }
+                }
+            }
+        }
+        Err(last_error.unwrap_or_else(|| anyhow!("Chrome DevTools MCP tools/call failed")))
+    }
+
+    pub async fn shutdown(&self) {
+        let mut inner = self.inner.lock().await;
+        self.shutdown_locked(&mut inner).await;
+    }
+
+    async fn list_tools_locked(
+        &self,
+        inner: &mut ChromeMcpInner,
+        force_refresh: bool,
+    ) -> anyhow::Result<Vec<ChromeMcpToolDef>> {
+        if !force_refresh && !inner.tools.is_empty() {
+            return Ok(inner.tools.clone());
+        }
+        self.ensure_connected_locked(inner).await?;
+        let mut tools = Vec::new();
+        let mut cursor: Option<String> = None;
+        loop {
+            let mut params = serde_json::Map::new();
+            if let Some(current) = cursor.as_deref() {
+                params.insert("cursor".into(), Value::String(current.to_string()));
+            }
+            let result = self
+                .request_locked(
+                    inner,
+                    "tools/list",
+                    Value::Object(params),
+                    self.config.rpc_timeout_sec,
+                )
+                .await?;
+            if let Some(items) = result.get("tools").and_then(|value| value.as_array()) {
+                for item in items {
+                    let Some(name) = item.get("name").and_then(|value| value.as_str()) else {
+                        continue;
+                    };
+                    let description = item
+                        .get("description")
+                        .and_then(|value| value.as_str())
+                        .unwrap_or_default()
+                        .to_string();
+                    let parameters = item
+                        .get("inputSchema")
+                        .cloned()
+                        .unwrap_or_else(|| json!({"type":"object","properties":{},"required":[]}));
+                    tools.push(ChromeMcpToolDef {
+                        name: name.to_string(),
+                        description,
+                        parameters,
+                    });
+                }
+            }
+            cursor = result
+                .get("nextCursor")
+                .and_then(|value| value.as_str())
+                .map(str::to_string);
+            if cursor.is_none() {
+                break;
+            }
+        }
+        let status = ChromeMcpStatus {
+            status: "ready".into(),
+            detail: format!(
+                "Chrome DevTools MCP ready with {} tool(s) via {}.",
+                tools.len(),
+                if self.config.browser_url.is_some() {
+                    "browser_url"
+                } else {
+                    "auto-connect"
+                }
+            ),
+            tool_count: tools.len(),
+            last_refresh_ms: Some(Utc::now().timestamp_millis()),
+        };
+        inner.last_refresh_ms = status.last_refresh_ms;
+        inner.status = status;
+        inner.tools = tools.clone();
+        Ok(tools)
+    }
+
+    async fn call_tool_locked(
+        &self,
+        inner: &mut ChromeMcpInner,
+        name: &str,
+        arguments: &Value,
+    ) -> anyhow::Result<String> {
+        self.ensure_connected_locked(inner).await?;
+        if inner.tools.is_empty() {
+            let _ = self.list_tools_locked(inner, false).await?;
+        }
+        let result = self
+            .request_locked(
+                inner,
+                "tools/call",
+                json!({
+                    "name": name,
+                    "arguments": arguments,
+                }),
+                self.config.rpc_timeout_sec,
+            )
+            .await?;
+        Ok(parse_call_result(&result))
+    }
+
+    async fn ensure_connected_locked(&self, inner: &mut ChromeMcpInner) -> anyhow::Result<()> {
+        if !self.config.enabled {
+            inner.status = ChromeMcpStatus::disabled();
+            return Ok(());
+        }
+        if inner.child.is_some() && inner.stdin.is_some() && inner.stdout.is_some() {
+            return Ok(());
+        }
+        if self.config.browser_url.is_none() && !self.config.auto_connect {
+            let detail = "Chrome DevTools MCP is enabled but cannot attach: set `chrome_mcp_browser_url` or enable `chrome_mcp_auto_connect`.".to_string();
+            inner.status = ChromeMcpStatus {
+                status: "unavailable".into(),
+                detail: detail.clone(),
+                tool_count: inner.tools.len(),
+                last_refresh_ms: inner.last_refresh_ms,
+            };
+            return Err(anyhow!(detail));
+        }
+        self.spawn_locked(inner).await?;
+        if let Err(err) = self
+            .request_locked(
+                inner,
+                "initialize",
+                json!({
+                    "protocolVersion": "2025-11-25",
+                    "capabilities": {},
+                    "clientInfo": { "name": "openplanter-desktop", "version": "1.0" }
+                }),
+                self.config.connect_timeout_sec,
+            )
+            .await
+        {
+            let detail = self.status_detail_from_error(&err, inner).await;
+            inner.status = ChromeMcpStatus {
+                status: "unavailable".into(),
+                detail: detail.clone(),
+                tool_count: inner.tools.len(),
+                last_refresh_ms: inner.last_refresh_ms,
+            };
+            return Err(anyhow!(detail));
+        }
+        self.notify_locked(inner, "notifications/initialized", json!({}))
+            .await?;
+        inner.status = ChromeMcpStatus::pending();
+        Ok(())
+    }
+
+    async fn request_locked(
+        &self,
+        inner: &mut ChromeMcpInner,
+        method: &str,
+        params: Value,
+        timeout_sec: i64,
+    ) -> anyhow::Result<Value> {
+        let request_id = inner.next_request_id;
+        inner.next_request_id += 1;
+        let payload = json!({
+            "jsonrpc": "2.0",
+            "id": request_id,
+            "method": method,
+            "params": params,
+        });
+        let stdin = inner
+            .stdin
+            .as_mut()
+            .ok_or_else(|| anyhow!("Chrome DevTools MCP stdin is unavailable"))?;
+        stdin
+            .write_all(format!("{}\n", payload).as_bytes())
+            .await
+            .with_context(|| format!("failed to write Chrome DevTools MCP request {method}"))?;
+        stdin.flush().await?;
+
+        let stdout = inner
+            .stdout
+            .as_mut()
+            .ok_or_else(|| anyhow!("Chrome DevTools MCP stdout is unavailable"))?;
+        let response = timeout(
+            Duration::from_secs(timeout_sec.max(1) as u64),
+            async {
+                loop {
+                    let maybe_line = stdout.next_line().await?;
+                    let line = maybe_line.ok_or_else(|| anyhow!("Chrome DevTools MCP closed stdout"))?;
+                    let Ok(payload): Result<Value, _> = serde_json::from_str(&line) else {
+                        continue;
+                    };
+                    let Some(id) = payload.get("id").and_then(|value| value.as_u64()) else {
+                        continue;
+                    };
+                    if id == request_id {
+                        return Ok::<Value, anyhow::Error>(payload);
+                    }
+                }
+            },
+        )
+        .await
+        .map_err(|_| anyhow!("Timed out waiting for Chrome DevTools MCP {method} response."))??;
+
+        if let Some(err) = response.get("error") {
+            return Err(anyhow!(format_protocol_error(err)));
+        }
+
+        Ok(response.get("result").cloned().unwrap_or(Value::Null))
+    }
+
+    async fn notify_locked(
+        &self,
+        inner: &mut ChromeMcpInner,
+        method: &str,
+        params: Value,
+    ) -> anyhow::Result<()> {
+        let stdin = inner
+            .stdin
+            .as_mut()
+            .ok_or_else(|| anyhow!("Chrome DevTools MCP stdin is unavailable"))?;
+        let payload = json!({
+            "jsonrpc": "2.0",
+            "method": method,
+            "params": params,
+        });
+        stdin
+            .write_all(format!("{}\n", payload).as_bytes())
+            .await
+            .with_context(|| format!("failed to write Chrome DevTools MCP notification {method}"))?;
+        stdin.flush().await?;
+        Ok(())
+    }
+
+    async fn spawn_locked(&self, inner: &mut ChromeMcpInner) -> anyhow::Result<()> {
+        self.shutdown_locked(inner).await;
+        let command = env::var("OPENPLANTER_CHROME_MCP_COMMAND").unwrap_or_else(|_| "npx".into());
+        let package = env::var("OPENPLANTER_CHROME_MCP_PACKAGE")
+            .unwrap_or_else(|_| "chrome-devtools-mcp@latest".into());
+        let mut args = vec!["-y".to_string(), package];
+        if let Some(browser_url) = self.config.browser_url.as_deref() {
+            args.push(format!("--browserUrl={browser_url}"));
+        } else {
+            args.push("--autoConnect".into());
+            args.push(format!("--channel={}", self.config.channel));
+        }
+        if let Ok(extra_args) = env::var("OPENPLANTER_CHROME_MCP_EXTRA_ARGS") {
+            args.extend(extra_args.split_whitespace().map(str::to_string));
+        }
+        let mut child = Command::new(&command)
+            .args(&args)
+            .stdin(Stdio::piped())
+            .stdout(Stdio::piped())
+            .stderr(Stdio::piped())
+            .spawn()
+            .with_context(|| {
+                format!(
+                    "failed to spawn Chrome DevTools MCP command `{}`. Install Node.js/npm so `npx` is available locally.",
+                    command
+                )
+            })?;
+
+        let stdin = child
+            .stdin
+            .take()
+            .ok_or_else(|| anyhow!("Chrome DevTools MCP stdin pipe is unavailable"))?;
+        let stdout = child
+            .stdout
+            .take()
+            .ok_or_else(|| anyhow!("Chrome DevTools MCP stdout pipe is unavailable"))?;
+        let stderr = child
+            .stderr
+            .take()
+            .ok_or_else(|| anyhow!("Chrome DevTools MCP stderr pipe is unavailable"))?;
+        let stderr_tail = inner.stderr_tail.clone();
+        inner.stderr_task = Some(tokio::spawn(async move {
+            let _ = read_stderr(stderr, stderr_tail).await;
+        }));
+        inner.stdin = Some(stdin);
+        inner.stdout = Some(BufReader::new(stdout).lines());
+        inner.child = Some(child);
+        Ok(())
+    }
+
+    async fn shutdown_locked(&self, inner: &mut ChromeMcpInner) {
+        if let Some(task) = inner.stderr_task.take() {
+            task.abort();
+        }
+        inner.stdin = None;
+        inner.stdout = None;
+        if let Some(mut child) = inner.child.take() {
+            let _ = child.kill().await;
+            let _ = child.wait().await;
+        }
+    }
+
+    async fn status_detail_from_error(
+        &self,
+        error: &anyhow::Error,
+        inner: &ChromeMcpInner,
+    ) -> String {
+        let mut detail = error.to_string();
+        let stderr_tail = inner.stderr_tail.lock().await.clone();
+        let stderr_text = stderr_tail
+            .iter()
+            .rev()
+            .take(4)
+            .cloned()
+            .collect::<Vec<_>>()
+            .into_iter()
+            .rev()
+            .collect::<Vec<_>>()
+            .join(" ");
+        let lower = format!("{detail} {stderr_text}").to_lowercase();
+        if !stderr_text.trim().is_empty() {
+            detail = format!("{detail} stderr: {stderr_text}");
+        }
+        if lower.contains("timed out") || lower.contains("timeout") {
+            if self.config.browser_url.is_some() {
+                detail.push_str(" Confirm the configured browser URL is reachable.");
+            } else {
+                detail.push_str(
+                    " Enable Chrome remote debugging at chrome://inspect/#remote-debugging and allow the connection prompt in Chrome.",
+                );
+            }
+        }
+        if lower.contains("no such file") || lower.contains("not found") || lower.contains("spawn") {
+            detail.push_str(" Install Node.js/npm so `npx` is available locally.");
+        }
+        if self.config.browser_url.is_none() && !lower.contains("inspect/#remote-debugging") {
+            detail.push_str(
+                " Chrome 144+ must have remote debugging enabled at chrome://inspect/#remote-debugging.",
+            );
+        }
+        detail
+    }
+}
+
+async fn read_stderr(stderr: ChildStderr, sink: Arc<Mutex<Vec<String>>>) -> anyhow::Result<()> {
+    let mut lines = BufReader::new(stderr).lines();
+    while let Some(line) = lines.next_line().await? {
+        let mut sink = sink.lock().await;
+        sink.push(line);
+        if sink.len() > 20 {
+            let excess = sink.len() - 20;
+            sink.drain(0..excess);
+        }
+    }
+    Ok(())
+}
+
+fn format_protocol_error(error: &Value) -> String {
+    let message = error
+        .get("message")
+        .and_then(|value| value.as_str())
+        .unwrap_or("Unknown MCP error");
+    match error.get("code").and_then(|value| value.as_i64()) {
+        Some(code) => format!("{message} (code {code})"),
+        None => message.to_string(),
+    }
+}
+
+fn parse_call_result(result: &Value) -> String {
+    let mut content_parts: Vec<String> = Vec::new();
+    if let Some(content) = result.get("content").and_then(|value| value.as_array()) {
+        for item in content {
+            if let Some(text) = item.as_str() {
+                if !text.trim().is_empty() {
+                    content_parts.push(text.trim().to_string());
+                }
+                continue;
+            }
+            let item_type = item
+                .get("type")
+                .and_then(|value| value.as_str())
+                .unwrap_or_default()
+                .to_lowercase();
+            match item_type.as_str() {
+                "text" => {
+                    if let Some(text) = item.get("text").and_then(|value| value.as_str()) {
+                        if !text.trim().is_empty() {
+                            content_parts.push(text.trim().to_string());
+                        }
+                    }
+                }
+                "image" => {
+                    let media_type = item
+                        .get("mimeType")
+                        .or_else(|| item.get("mediaType"))
+                        .and_then(|value| value.as_str())
+                        .unwrap_or("image");
+                    content_parts.push(format!("[{media_type} attached]"));
+                }
+                _ => {
+                    if let Some(uri) = item
+                        .get("uri")
+                        .or_else(|| item.get("url"))
+                        .and_then(|value| value.as_str())
+                    {
+                        let label = item
+                            .get("name")
+                            .and_then(|value| value.as_str())
+                            .unwrap_or("resource");
+                        content_parts.push(format!("{label}: {uri}"));
+                    }
+                }
+            }
+        }
+    }
+    if content_parts.is_empty() {
+        if let Some(structured) = result.get("structuredContent") {
+            content_parts.push(
+                serde_json::to_string_pretty(structured)
+                    .unwrap_or_else(|_| structured.to_string()),
+            );
+        }
+    }
+    let mut content = if content_parts.is_empty() {
+        "Chrome DevTools MCP tool completed with no textual output.".to_string()
+    } else {
+        content_parts.join("\n")
+    };
+    if result
+        .get("isError")
+        .and_then(|value| value.as_bool())
+        .unwrap_or(false)
+    {
+        content = format!("Chrome DevTools MCP tool error: {content}");
+    }
+    content
+}
diff --git a/openplanter-desktop/crates/op-core/src/tools/defs.rs b/openplanter-desktop/crates/op-core/src/tools/defs.rs
index b8c3f91c..ba71eb37 100644
--- a/openplanter-desktop/crates/op-core/src/tools/defs.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/defs.rs
@@ -4,6 +4,8 @@
 /// provider-specific shapes expected by OpenAI and Anthropic APIs.
 use serde_json::{Value, json};
 
+use super::chrome_mcp::ChromeMcpToolDef;
+
 struct ToolDef {
     name: &'static str,
     description: &'static str,
@@ -355,6 +357,27 @@ fn mvp_tool_defs() -> Vec<ToolDef> {
     ]
 }
 
+fn merged_tool_defs(dynamic_defs: &[ChromeMcpToolDef]) -> Vec<(String, String, Value)> {
+    let mut defs: Vec<(String, String, Value)> = mvp_tool_defs()
+        .into_iter()
+        .map(|def| (def.name.to_string(), def.description.to_string(), def.parameters))
+        .collect();
+    let mut existing: std::collections::HashSet<String> =
+        defs.iter().map(|(name, _, _)| name.clone()).collect();
+    for def in dynamic_defs {
+        if existing.contains(&def.name) {
+            continue;
+        }
+        defs.push((
+            def.name.clone(),
+            def.description.clone(),
+            def.parameters.clone(),
+        ));
+        existing.insert(def.name.clone());
+    }
+    defs
+}
+
 /// For OpenAI strict mode: make all properties required, wrapping optional ones
 /// with `anyOf [original, null]`. Recurse into nested objects and array items.
 fn strict_fixup(schema: &mut Value) {
@@ -432,16 +455,20 @@ fn strict_fixup(schema: &mut Value) {
 
 /// Convert to OpenAI tools format: `[{ type: "function", function: { name, description, parameters, strict } }]`
 pub fn to_openai_tools() -> Vec<Value> {
-    mvp_tool_defs()
+    to_openai_tools_with_dynamic(&[])
+}
+
+pub fn to_openai_tools_with_dynamic(dynamic_defs: &[ChromeMcpToolDef]) -> Vec<Value> {
+    merged_tool_defs(dynamic_defs)
         .into_iter()
         .map(|def| {
-            let mut params = def.parameters;
+            let (name, description, mut params) = def;
             strict_fixup(&mut params);
             json!({
                 "type": "function",
                 "function": {
-                    "name": def.name,
-                    "description": def.description,
+                    "name": name,
+                    "description": description,
                     "parameters": params,
                     "strict": true
                 }
@@ -452,23 +479,28 @@ pub fn to_openai_tools() -> Vec<Value> {
 
 /// Convert to Anthropic tools format: `[{ name, description, input_schema }]`
 pub fn to_anthropic_tools() -> Vec<Value> {
-    mvp_tool_defs()
+    to_anthropic_tools_with_dynamic(&[])
+}
+
+pub fn to_anthropic_tools_with_dynamic(dynamic_defs: &[ChromeMcpToolDef]) -> Vec<Value> {
+    merged_tool_defs(dynamic_defs)
         .into_iter()
         .map(|def| {
+            let (name, description, parameters) = def;
             json!({
-                "name": def.name,
-                "description": def.description,
-                "input_schema": def.parameters
+                "name": name,
+                "description": description,
+                "input_schema": parameters
             })
         })
         .collect()
 }
 
 /// Build tool definitions for the given provider.
-pub fn build_tool_defs(provider: &str) -> Vec<Value> {
+pub fn build_tool_defs(provider: &str, dynamic_defs: &[ChromeMcpToolDef]) -> Vec<Value> {
     match provider {
-        "anthropic" => to_anthropic_tools(),
-        _ => to_openai_tools(),
+        "anthropic" => to_anthropic_tools_with_dynamic(dynamic_defs),
+        _ => to_openai_tools_with_dynamic(dynamic_defs),
     }
 }
 
@@ -575,14 +607,14 @@ mod tests {
 
     #[test]
     fn test_build_tool_defs_anthropic() {
-        let tools = build_tool_defs("anthropic");
+        let tools = build_tool_defs("anthropic", &[]);
         assert!(tools[0].get("input_schema").is_some());
         assert!(tools[0].get("type").is_none());
     }
 
     #[test]
     fn test_build_tool_defs_openai() {
-        let tools = build_tool_defs("openai");
+        let tools = build_tool_defs("openai", &[]);
         assert_eq!(tools[0]["type"], "function");
     }
 
diff --git a/openplanter-desktop/crates/op-core/src/tools/mod.rs b/openplanter-desktop/crates/op-core/src/tools/mod.rs
index fba6bed8..f4a0cf78 100644
--- a/openplanter-desktop/crates/op-core/src/tools/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/mod.rs
@@ -3,6 +3,7 @@
 /// The `WorkspaceTools` struct is the central dispatcher that owns tool state
 /// (files-read set, background jobs) and routes tool calls to the appropriate module.
 pub mod audio;
+pub mod chrome_mcp;
 pub mod defs;
 pub mod filesystem;
 pub mod patching;
@@ -11,6 +12,7 @@ pub mod web;
 
 use std::collections::HashSet;
 use std::path::PathBuf;
+use std::sync::Arc;
 
 use crate::config::{AgentConfig, normalize_web_search_provider};
 
@@ -71,6 +73,7 @@ pub struct WorkspaceTools {
     mistral_transcription_chunk_overlap_seconds: f64,
     mistral_transcription_max_chunks: i64,
     mistral_transcription_request_timeout_sec: u64,
+    chrome_mcp: Option<Arc<chrome_mcp::ChromeMcpManager>>,
     files_read: HashSet<PathBuf>,
     bg_jobs: shell::BgJobs,
 }
@@ -85,7 +88,10 @@ fn clip(text: &str, max_chars: usize) -> String {
 }
 
 impl WorkspaceTools {
-    pub fn new(config: &AgentConfig) -> Self {
+    pub fn new(
+        config: &AgentConfig,
+        chrome_mcp: Option<Arc<chrome_mcp::ChromeMcpManager>>,
+    ) -> Self {
         Self {
             root: config.workspace.clone(),
             scope: ToolScope::FullWorkspace,
@@ -116,6 +122,7 @@ impl WorkspaceTools {
             mistral_transcription_request_timeout_sec: config
                 .mistral_transcription_request_timeout_sec
                 as u64,
+            chrome_mcp,
             files_read: HashSet::new(),
             bg_jobs: shell::BgJobs::new(),
         }
@@ -157,6 +164,7 @@ impl WorkspaceTools {
             mistral_transcription_request_timeout_sec: config
                 .mistral_transcription_request_timeout_sec
                 as u64,
+            chrome_mcp: None,
             files_read: HashSet::new(),
             bg_jobs: shell::BgJobs::new(),
         }
@@ -439,7 +447,26 @@ impl WorkspaceTools {
                 ToolResult::ok(format!("Noted: {note}"))
             }
 
-            _ => ToolResult::error(format!("Unknown tool: {name}")),
+            _ => {
+                if let Some(manager) = &self.chrome_mcp {
+                    match manager.list_tools(false).await {
+                        Ok(tools) if tools.iter().any(|tool| tool.name == name) => {
+                            match manager.call_tool(name, &args).await {
+                                Ok(content) => ToolResult::ok(content),
+                                Err(err) => {
+                                    ToolResult::error(format!("Chrome DevTools MCP unavailable: {err}"))
+                                }
+                            }
+                        }
+                        Ok(_) => ToolResult::error(format!("Unknown tool: {name}")),
+                        Err(err) => {
+                            ToolResult::error(format!("Chrome DevTools MCP unavailable: {err}"))
+                        }
+                    }
+                } else {
+                    ToolResult::error(format!("Unknown tool: {name}"))
+                }
+            }
         };
 
         // Clip observation to max_observation_chars
@@ -524,7 +551,7 @@ mod tests {
     async fn test_full_workspace_scope_unchanged() {
         let tmp = tempdir().unwrap();
         let cfg = test_config(tmp.path());
-        let mut tools = WorkspaceTools::new(&cfg);
+        let mut tools = WorkspaceTools::new(&cfg, None);
 
         let result = tools
             .execute("write_file", r#"{"path":"notes.md","content":"allowed"}"#)
@@ -542,7 +569,7 @@ mod tests {
         let tmp = tempdir().unwrap();
         let mut cfg = test_config(tmp.path());
         cfg.max_observation_chars = 6000;
-        let mut tools = WorkspaceTools::new(&cfg);
+        let mut tools = WorkspaceTools::new(&cfg, None);
 
         let mut content = "a".repeat(5999);
         content.push('─');
diff --git a/openplanter-desktop/crates/op-tauri/src/bridge.rs b/openplanter-desktop/crates/op-tauri/src/bridge.rs
index ec7294f2..3b0e696e 100644
--- a/openplanter-desktop/crates/op-tauri/src/bridge.rs
+++ b/openplanter-desktop/crates/op-tauri/src/bridge.rs
@@ -198,17 +198,69 @@ struct PendingToolCall {
 /// Key argument names for tool call display (mirrors frontend KEY_ARGS).
 fn extract_key_arg(tool_name: &str, args_json: &str) -> Option<String> {
     let key_name = match tool_name {
-        "read_file" | "write_file" | "edit_file" | "apply_patch" | "hashline_edit" => "path",
-        "list_files" => "directory",
-        "run_shell" | "run_shell_bg" => "command",
-        "kill_shell_bg" => "pid",
-        "web_search" => "query",
-        "fetch_url" => "url",
-        _ => return None,
+        "read_file" | "write_file" | "edit_file" | "apply_patch" | "hashline_edit" => Some("path"),
+        "list_files" => Some("directory"),
+        "run_shell" | "run_shell_bg" => Some("command"),
+        "kill_shell_bg" => Some("pid"),
+        "web_search" => Some("query"),
+        "fetch_url" => Some("url"),
+        _ => None,
     };
-    let pattern = format!("\"{}\"\\s*:\\s*\"([^\"]*)\"?", regex::escape(key_name));
-    let re = regex::Regex::new(&pattern).ok()?;
-    re.captures(args_json).map(|c| c[1].to_string())
+    if let Ok(value) = serde_json::from_str::<serde_json::Value>(args_json) {
+        if let Some(key) = key_name {
+            if let Some(found) = value
+                .get(key)
+                .and_then(preview_value)
+                .filter(|value| !value.is_empty())
+            {
+                return Some(found);
+            }
+        }
+        return first_informative_value(&value);
+    }
+    if let Some(key) = key_name {
+        let pattern = format!("\"{}\"\\s*:\\s*\"([^\"]*)\"?", regex::escape(key));
+        let re = regex::Regex::new(&pattern).ok()?;
+        if let Some(captures) = re.captures(args_json) {
+            return captures.get(1).map(|capture| capture.as_str().to_string());
+        }
+    }
+    let re = regex::Regex::new(r#""[^"]+"\s*:\s*"([^"]+)""#).ok()?;
+    re.captures(args_json)
+        .and_then(|captures| captures.get(1))
+        .map(|capture| capture.as_str().to_string())
+}
+
+fn preview_value(value: &serde_json::Value) -> Option<String> {
+    match value {
+        serde_json::Value::String(text) => {
+            let trimmed = text.trim();
+            if trimmed.is_empty() {
+                None
+            } else {
+                Some(trimmed.chars().take(60).collect())
+            }
+        }
+        serde_json::Value::Array(items) => {
+            let collected = items
+                .iter()
+                .filter_map(|item| item.as_str().map(str::trim).filter(|text| !text.is_empty()))
+                .take(3)
+                .collect::<Vec<_>>();
+            if collected.is_empty() {
+                None
+            } else {
+                Some(collected.join(", "))
+            }
+        }
+        serde_json::Value::Number(number) => Some(number.to_string()),
+        _ => None,
+    }
+}
+
+fn first_informative_value(value: &serde_json::Value) -> Option<String> {
+    let object = value.as_object()?;
+    object.values().find_map(preview_value)
 }
 
 impl<E: SolveEmitter> LoggingEmitter<E> {
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
index d3eeb81f..36a533bd 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
@@ -50,6 +50,7 @@ pub async fn solve(
     state: State<'_, AppState>,
 ) -> Result<(), String> {
     let cfg = state.config.lock().await.clone();
+    let chrome_mcp = state.chrome_mcp_manager(&cfg).await;
     let init_status = workspace_init::get_init_status(&cfg.workspace, &cfg.session_root_dir)
         .map_err(|e| e.to_string())?;
     if init_status.gate_state != "ready" {
@@ -123,12 +124,13 @@ pub async fn solve(
 
     tokio::spawn(async move {
         let result = tokio::spawn(async move {
-            op_core::engine::solve_with_initial_context(
+            op_core::engine::solve_with_initial_context_and_chrome_mcp(
                 &objective,
                 &cfg,
                 &emitter,
                 token,
                 Some(initial_context),
+                chrome_mcp,
             )
             .await;
         })
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/config.rs b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
index 0ceecc7e..e303b6a3 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/config.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
@@ -1,6 +1,7 @@
 use crate::state::AppState;
 use op_core::config::{
-    has_openai_auth, normalize_web_search_provider, normalize_zai_plan, resolve_zai_base_url,
+    has_openai_auth, normalize_chrome_mcp_browser_url, normalize_chrome_mcp_channel,
+    normalize_web_search_provider, normalize_zai_plan, resolve_zai_base_url,
 };
 use op_core::credentials::credentials_from_env;
 use op_core::events::{ConfigView, ModelInfo, PartialConfig};
@@ -8,13 +9,26 @@ use op_core::settings::{PersistentSettings, SettingsStore};
 use std::collections::HashMap;
 use tauri::State;
 
-fn make_config_view(cfg: &op_core::config::AgentConfig, session_id: Option<String>) -> ConfigView {
+async fn make_config_view(
+    cfg: &op_core::config::AgentConfig,
+    session_id: Option<String>,
+    state: &AppState,
+) -> ConfigView {
+    let chrome_status = state.chrome_mcp_status(cfg).await;
     ConfigView {
         provider: cfg.provider.clone(),
         model: cfg.model.clone(),
         reasoning_effort: cfg.reasoning_effort.clone(),
         zai_plan: cfg.zai_plan.clone(),
         web_search_provider: cfg.web_search_provider.clone(),
+        chrome_mcp_enabled: cfg.chrome_mcp_enabled,
+        chrome_mcp_auto_connect: cfg.chrome_mcp_auto_connect,
+        chrome_mcp_browser_url: cfg.chrome_mcp_browser_url.clone(),
+        chrome_mcp_channel: cfg.chrome_mcp_channel.clone(),
+        chrome_mcp_connect_timeout_sec: cfg.chrome_mcp_connect_timeout_sec,
+        chrome_mcp_rpc_timeout_sec: cfg.chrome_mcp_rpc_timeout_sec,
+        chrome_mcp_status: chrome_status.status,
+        chrome_mcp_status_detail: chrome_status.detail,
         workspace: cfg.workspace.display().to_string(),
         session_id,
         recursive: cfg.recursive,
@@ -53,15 +67,29 @@ fn merge_settings(
         web_search_provider: incoming
             .web_search_provider
             .or(existing.web_search_provider),
+        chrome_mcp_enabled: incoming.chrome_mcp_enabled.or(existing.chrome_mcp_enabled),
+        chrome_mcp_auto_connect: incoming
+            .chrome_mcp_auto_connect
+            .or(existing.chrome_mcp_auto_connect),
+        chrome_mcp_browser_url: incoming
+            .chrome_mcp_browser_url
+            .or(existing.chrome_mcp_browser_url),
+        chrome_mcp_channel: incoming.chrome_mcp_channel.or(existing.chrome_mcp_channel),
+        chrome_mcp_connect_timeout_sec: incoming
+            .chrome_mcp_connect_timeout_sec
+            .or(existing.chrome_mcp_connect_timeout_sec),
+        chrome_mcp_rpc_timeout_sec: incoming
+            .chrome_mcp_rpc_timeout_sec
+            .or(existing.chrome_mcp_rpc_timeout_sec),
     }
 }
 
 /// Get the current configuration.
 #[tauri::command]
 pub async fn get_config(state: State<'_, AppState>) -> Result<ConfigView, String> {
-    let cfg = state.config.lock().await;
-    let session_id = state.session_id.lock().await;
-    Ok(make_config_view(&cfg, session_id.clone()))
+    let cfg = state.config.lock().await.clone();
+    let session_id = state.session_id.lock().await.clone();
+    Ok(make_config_view(&cfg, session_id, &state).await)
 }
 
 /// Update configuration fields.
@@ -95,8 +123,29 @@ pub async fn update_config(
     if let Some(provider) = partial.web_search_provider {
         cfg.web_search_provider = normalize_web_search_provider(Some(&provider));
     }
-    let session_id = state.session_id.lock().await;
-    Ok(make_config_view(&cfg, session_id.clone()))
+    if let Some(enabled) = partial.chrome_mcp_enabled {
+        cfg.chrome_mcp_enabled = enabled;
+    }
+    if let Some(auto_connect) = partial.chrome_mcp_auto_connect {
+        cfg.chrome_mcp_auto_connect = auto_connect;
+    }
+    if let Some(browser_url) = partial.chrome_mcp_browser_url {
+        cfg.chrome_mcp_browser_url = normalize_chrome_mcp_browser_url(Some(&browser_url));
+    }
+    if let Some(channel) = partial.chrome_mcp_channel {
+        cfg.chrome_mcp_channel = normalize_chrome_mcp_channel(Some(&channel));
+    }
+    if let Some(timeout) = partial.chrome_mcp_connect_timeout_sec {
+        cfg.chrome_mcp_connect_timeout_sec = timeout.max(1);
+    }
+    if let Some(timeout) = partial.chrome_mcp_rpc_timeout_sec {
+        cfg.chrome_mcp_rpc_timeout_sec = timeout.max(1);
+    }
+    let cfg_snapshot = cfg.clone();
+    drop(cfg);
+    state.sync_chrome_mcp_config(&cfg_snapshot).await;
+    let session_id = state.session_id.lock().await.clone();
+    Ok(make_config_view(&cfg_snapshot, session_id, &state).await)
 }
 
 /// Known models per provider for listing.
diff --git a/openplanter-desktop/crates/op-tauri/src/state.rs b/openplanter-desktop/crates/op-tauri/src/state.rs
index 5b9521c8..cb431fa4 100644
--- a/openplanter-desktop/crates/op-tauri/src/state.rs
+++ b/openplanter-desktop/crates/op-tauri/src/state.rs
@@ -7,6 +7,7 @@ use op_core::credentials::{
 #[cfg(test)]
 use op_core::settings::PersistentSettings;
 use op_core::settings::SettingsStore;
+use op_core::tools::chrome_mcp::{ChromeMcpConfigKey, ChromeMcpManager, ChromeMcpStatus};
 use op_core::workspace_init;
 use std::env;
 use std::fmt;
@@ -368,9 +369,16 @@ pub struct AppState {
     pub cancel_token: Arc<Mutex<CancellationToken>>,
     pub agent_running: Arc<Mutex<bool>>,
     pub init_lock: Arc<Mutex<()>>,
+    pub chrome_mcp: Arc<Mutex<ChromeMcpRuntime>>,
     startup_trace: String,
 }
 
+#[derive(Default)]
+pub struct ChromeMcpRuntime {
+    key: Option<ChromeMcpConfigKey>,
+    manager: Option<Arc<ChromeMcpManager>>,
+}
+
 impl AppState {
     pub fn try_new() -> Result<Self, StartupWorkspaceError> {
         let current_dir = env::current_dir().unwrap_or_else(|_| PathBuf::from("."));
@@ -406,6 +414,7 @@ impl AppState {
             cancel_token: Arc::new(Mutex::new(CancellationToken::new())),
             agent_running: Arc::new(Mutex::new(false)),
             init_lock: Arc::new(Mutex::new(())),
+            chrome_mcp: Arc::new(Mutex::new(ChromeMcpRuntime::default())),
             startup_trace: format_startup_trace(&current_dir, &resolved_workspace, &migration),
         })
     }
@@ -413,6 +422,82 @@ impl AppState {
     pub fn startup_trace(&self) -> &str {
         &self.startup_trace
     }
+
+    pub async fn sync_chrome_mcp_config(&self, cfg: &AgentConfig) {
+        let key = ChromeMcpConfigKey::from_config(cfg);
+        let mut runtime = self.chrome_mcp.lock().await;
+        if runtime.key.as_ref() == Some(&key) {
+            return;
+        }
+        if let Some(manager) = runtime.manager.take() {
+            tokio::spawn(async move {
+                manager.shutdown().await;
+            });
+        }
+        runtime.key = Some(key);
+    }
+
+    pub async fn chrome_mcp_manager(&self, cfg: &AgentConfig) -> Option<Arc<ChromeMcpManager>> {
+        let key = ChromeMcpConfigKey::from_config(cfg);
+        let mut runtime = self.chrome_mcp.lock().await;
+        if !key.enabled {
+            if let Some(manager) = runtime.manager.take() {
+                tokio::spawn(async move {
+                    manager.shutdown().await;
+                });
+            }
+            runtime.key = Some(key);
+            return None;
+        }
+        if runtime.key.as_ref() != Some(&key) {
+            if let Some(manager) = runtime.manager.take() {
+                tokio::spawn(async move {
+                    manager.shutdown().await;
+                });
+            }
+            runtime.key = Some(key.clone());
+        }
+        if runtime.manager.is_none() {
+            runtime.manager = Some(Arc::new(ChromeMcpManager::new(key)));
+        }
+        runtime.manager.clone()
+    }
+
+    pub async fn chrome_mcp_status(&self, cfg: &AgentConfig) -> ChromeMcpStatus {
+        let key = ChromeMcpConfigKey::from_config(cfg);
+        let manager = {
+            let runtime = self.chrome_mcp.lock().await;
+            if runtime.key.as_ref() == Some(&key) {
+                runtime.manager.clone()
+            } else {
+                None
+            }
+        };
+        if let Some(manager) = manager {
+            manager.status_snapshot().await
+        } else if !key.enabled {
+            ChromeMcpStatus {
+                status: "disabled".into(),
+                detail: "Chrome DevTools MCP is disabled.".into(),
+                tool_count: 0,
+                last_refresh_ms: None,
+            }
+        } else if key.browser_url.is_none() && !key.auto_connect {
+            ChromeMcpStatus {
+                status: "unavailable".into(),
+                detail: "Chrome DevTools MCP is enabled but cannot attach: set `chrome_mcp_browser_url` or enable `chrome_mcp_auto_connect`.".into(),
+                tool_count: 0,
+                last_refresh_ms: None,
+            }
+        } else {
+            ChromeMcpStatus {
+                status: "ready".into(),
+                detail: "Chrome DevTools MCP will initialize on the next solve.".into(),
+                tool_count: 0,
+                last_refresh_ms: None,
+            }
+        }
+    }
 }
 
 #[cfg(test)]
diff --git a/openplanter-desktop/frontend/src/api/types.ts b/openplanter-desktop/frontend/src/api/types.ts
index d0114632..fe4c7abf 100644
--- a/openplanter-desktop/frontend/src/api/types.ts
+++ b/openplanter-desktop/frontend/src/api/types.ts
@@ -110,6 +110,14 @@ export interface ConfigView {
   reasoning_effort: string | null;
   zai_plan: string;
   web_search_provider: string;
+  chrome_mcp_enabled: boolean;
+  chrome_mcp_auto_connect: boolean;
+  chrome_mcp_browser_url: string | null;
+  chrome_mcp_channel: string;
+  chrome_mcp_connect_timeout_sec: number;
+  chrome_mcp_rpc_timeout_sec: number;
+  chrome_mcp_status: string;
+  chrome_mcp_status_detail: string;
   workspace: string;
   session_id: string | null;
   recursive: boolean;
@@ -124,6 +132,12 @@ export interface PartialConfig {
   reasoning_effort?: string;
   zai_plan?: string;
   web_search_provider?: string;
+  chrome_mcp_enabled?: boolean;
+  chrome_mcp_auto_connect?: boolean;
+  chrome_mcp_browser_url?: string | null;
+  chrome_mcp_channel?: string;
+  chrome_mcp_connect_timeout_sec?: number;
+  chrome_mcp_rpc_timeout_sec?: number;
 }
 
 export interface ModelInfo {
@@ -150,6 +164,12 @@ export interface PersistentSettings {
   default_model_ollama?: string | null;
   zai_plan?: string | null;
   web_search_provider?: string | null;
+  chrome_mcp_enabled?: boolean | null;
+  chrome_mcp_auto_connect?: boolean | null;
+  chrome_mcp_browser_url?: string | null;
+  chrome_mcp_channel?: string | null;
+  chrome_mcp_connect_timeout_sec?: number | null;
+  chrome_mcp_rpc_timeout_sec?: number | null;
 }
 
 export interface SlashResult {
diff --git a/openplanter-desktop/frontend/src/commands/chrome.test.ts b/openplanter-desktop/frontend/src/commands/chrome.test.ts
new file mode 100644
index 00000000..4b1591e7
--- /dev/null
+++ b/openplanter-desktop/frontend/src/commands/chrome.test.ts
@@ -0,0 +1,128 @@
+import { vi, describe, it, expect, beforeEach, afterEach } from "vitest";
+import { __setHandler, __clearHandlers } from "../__mocks__/tauri";
+
+vi.mock("@tauri-apps/api/core", async () => {
+  const mock = await import("../__mocks__/tauri");
+  return { invoke: mock.invoke };
+});
+
+import { appState } from "../state/store";
+import { CHROME_USAGE, handleChromeCommand } from "./chrome";
+
+function makeChromeConfig(overrides: Record<string, unknown> = {}) {
+  return {
+    provider: "anthropic",
+    model: "claude-opus-4-6",
+    reasoning_effort: "medium",
+    zai_plan: "paygo",
+    web_search_provider: "exa",
+    chrome_mcp_enabled: true,
+    chrome_mcp_auto_connect: true,
+    chrome_mcp_browser_url: null,
+    chrome_mcp_channel: "stable",
+    chrome_mcp_connect_timeout_sec: 15,
+    chrome_mcp_rpc_timeout_sec: 45,
+    chrome_mcp_status: "ready",
+    chrome_mcp_status_detail: "Connected to Chrome.",
+    workspace: ".",
+    session_id: null,
+    recursive: true,
+    max_depth: 4,
+    max_steps_per_call: 100,
+    demo: false,
+    ...overrides,
+  };
+}
+
+describe("handleChromeCommand", () => {
+  const originalState = appState.get();
+
+  beforeEach(() => {
+    appState.set({
+      ...originalState,
+      chromeMcpEnabled: false,
+      chromeMcpAutoConnect: true,
+      chromeMcpBrowserUrl: null,
+      chromeMcpChannel: "stable",
+      chromeMcpStatus: "disabled",
+      chromeMcpStatusDetail: "Chrome DevTools MCP is disabled.",
+    });
+  });
+
+  afterEach(() => {
+    __clearHandlers();
+    appState.set(originalState);
+  });
+
+  it("shows current status with usage when called without args", async () => {
+    const result = await handleChromeCommand("");
+    expect(result.lines[0]).toContain("Chrome MCP:");
+    expect(result.lines[1]).toContain("Chrome runtime:");
+    expect(result.lines).toContain(CHROME_USAGE);
+  });
+
+  it("updates auto-connect mode", async () => {
+    __setHandler("update_config", ({ partial }: { partial: Record<string, unknown> }) => {
+      expect(partial.chrome_mcp_enabled).toBe(true);
+      expect(partial.chrome_mcp_auto_connect).toBe(true);
+      expect(partial.chrome_mcp_browser_url).toBeNull();
+      return makeChromeConfig();
+    });
+
+    const result = await handleChromeCommand("auto");
+    expect(result.lines[0]).toContain("attach=auto-connect");
+    expect(appState.get().chromeMcpEnabled).toBe(true);
+    expect(appState.get().chromeMcpAutoConnect).toBe(true);
+    expect(appState.get().chromeMcpBrowserUrl).toBeNull();
+  });
+
+  it("updates explicit browser url and persists when requested", async () => {
+    __setHandler("update_config", ({ partial }: { partial: Record<string, unknown> }) => {
+      expect(partial.chrome_mcp_enabled).toBe(true);
+      expect(partial.chrome_mcp_auto_connect).toBe(false);
+      expect(partial.chrome_mcp_browser_url).toBe("http://127.0.0.1:9222");
+      return makeChromeConfig({
+        chrome_mcp_auto_connect: false,
+        chrome_mcp_browser_url: "http://127.0.0.1:9222",
+        chrome_mcp_status_detail: "Attached to remote debugging endpoint.",
+      });
+    });
+    __setHandler("save_settings", ({ settings }: { settings: Record<string, unknown> }) => {
+      expect(settings.chrome_mcp_enabled).toBe(true);
+      expect(settings.chrome_mcp_auto_connect).toBe(false);
+      expect(settings.chrome_mcp_browser_url).toBe("http://127.0.0.1:9222");
+      expect(settings.chrome_mcp_channel).toBe("stable");
+    });
+
+    const result = await handleChromeCommand("url http://127.0.0.1:9222 --save");
+    expect(result.lines[0]).toContain("browser_url=http://127.0.0.1:9222");
+    expect(result.lines).toContain("(Settings saved)");
+    expect(appState.get().chromeMcpBrowserUrl).toBe("http://127.0.0.1:9222");
+  });
+
+  it("updates the Chrome channel", async () => {
+    __setHandler("update_config", ({ partial }: { partial: Record<string, unknown> }) => {
+      expect(partial.chrome_mcp_channel).toBe("beta");
+      return makeChromeConfig({
+        chrome_mcp_channel: "beta",
+        chrome_mcp_status: "unavailable",
+        chrome_mcp_status_detail: "Chrome Beta is not running.",
+      });
+    });
+
+    const result = await handleChromeCommand("channel beta");
+    expect(result.lines[0]).toContain("channel=beta");
+    expect(result.lines[1]).toContain("unavailable");
+    expect(appState.get().chromeMcpChannel).toBe("beta");
+  });
+
+  it("rejects invalid channels", async () => {
+    const result = await handleChromeCommand("channel nightly");
+    expect(result.lines[0]).toContain("Invalid Chrome channel");
+  });
+
+  it("shows url usage when endpoint is missing", async () => {
+    const result = await handleChromeCommand("url");
+    expect(result.lines).toEqual(["Usage: /chrome url <endpoint> [--save]"]);
+  });
+});
diff --git a/openplanter-desktop/frontend/src/commands/chrome.ts b/openplanter-desktop/frontend/src/commands/chrome.ts
new file mode 100644
index 00000000..5ab0bb20
--- /dev/null
+++ b/openplanter-desktop/frontend/src/commands/chrome.ts
@@ -0,0 +1,136 @@
+/** /chrome slash command handler. */
+import { saveSettings, updateConfig } from "../api/invoke";
+import type { ConfigView } from "../api/types";
+import { appState, type AppState } from "../state/store";
+import type { CommandResult } from "./model";
+
+export const VALID_CHROME_CHANNELS = ["stable", "beta", "dev", "canary"] as const;
+export const CHROME_USAGE =
+  "Usage: /chrome status|on|off|auto|url <endpoint>|channel <stable|beta|dev|canary> [--save]";
+
+type ChromeStatusSource = Pick<
+  AppState,
+  | "chromeMcpEnabled"
+  | "chromeMcpAutoConnect"
+  | "chromeMcpBrowserUrl"
+  | "chromeMcpChannel"
+  | "chromeMcpStatus"
+  | "chromeMcpStatusDetail"
+>;
+
+function applyChromeConfig(config: ConfigView): void {
+  appState.update((state) => ({
+    ...state,
+    chromeMcpEnabled: config.chrome_mcp_enabled,
+    chromeMcpAutoConnect: config.chrome_mcp_auto_connect,
+    chromeMcpBrowserUrl: config.chrome_mcp_browser_url,
+    chromeMcpChannel: config.chrome_mcp_channel,
+    chromeMcpConnectTimeoutSec: config.chrome_mcp_connect_timeout_sec,
+    chromeMcpRpcTimeoutSec: config.chrome_mcp_rpc_timeout_sec,
+    chromeMcpStatus: config.chrome_mcp_status,
+    chromeMcpStatusDetail: config.chrome_mcp_status_detail,
+  }));
+}
+
+function describeAttachMode(state: ChromeStatusSource): string {
+  if (state.chromeMcpBrowserUrl) {
+    return `browser_url=${state.chromeMcpBrowserUrl}`;
+  }
+  return state.chromeMcpAutoConnect ? "auto-connect" : "manual-disabled";
+}
+
+export function formatChromeStatusLines(state: ChromeStatusSource): string[] {
+  return [
+    `Chrome MCP: enabled=${state.chromeMcpEnabled} | attach=${describeAttachMode(state)} | channel=${state.chromeMcpChannel}`,
+    `Chrome runtime: ${state.chromeMcpStatus} | ${state.chromeMcpStatusDetail}`,
+  ];
+}
+
+/** Handle /chrome [status|on|off|auto|url|channel]. */
+export async function handleChromeCommand(args: string): Promise<CommandResult> {
+  const parts = args.trim().split(/\s+/).filter(Boolean);
+  const save = parts.includes("--save");
+  const filtered = parts.filter((part) => part !== "--save");
+  const action = filtered[0]?.toLowerCase() ?? "";
+
+  if (!action || action === "status") {
+    const lines = formatChromeStatusLines(appState.get());
+    if (!action) {
+      lines.push(CHROME_USAGE);
+    }
+    return { action: "handled", lines };
+  }
+
+  let partial: Record<string, unknown>;
+  switch (action) {
+    case "on":
+      partial = { chrome_mcp_enabled: true };
+      break;
+    case "off":
+      partial = { chrome_mcp_enabled: false };
+      break;
+    case "auto":
+      partial = {
+        chrome_mcp_enabled: true,
+        chrome_mcp_auto_connect: true,
+        chrome_mcp_browser_url: null,
+      };
+      break;
+    case "url":
+      if (filtered.length < 2) {
+        return { action: "handled", lines: ["Usage: /chrome url <endpoint> [--save]"] };
+      }
+      partial = {
+        chrome_mcp_enabled: true,
+        chrome_mcp_auto_connect: false,
+        chrome_mcp_browser_url: filtered[1].trim(),
+      };
+      break;
+    case "channel": {
+      const channel = filtered[1]?.trim().toLowerCase() ?? "";
+      if (!channel) {
+        return {
+          action: "handled",
+          lines: ["Usage: /chrome channel <stable|beta|dev|canary> [--save]"],
+        };
+      }
+      if (!VALID_CHROME_CHANNELS.includes(channel as (typeof VALID_CHROME_CHANNELS)[number])) {
+        return {
+          action: "handled",
+          lines: [`Invalid Chrome channel "${channel}". Expected: ${VALID_CHROME_CHANNELS.join(", ")}`],
+        };
+      }
+      partial = { chrome_mcp_channel: channel };
+      break;
+    }
+    default:
+      return {
+        action: "handled",
+        lines: [`Unknown /chrome action "${action}".`, CHROME_USAGE],
+      };
+  }
+
+  try {
+    const config = await updateConfig(partial);
+    applyChromeConfig(config);
+
+    const lines = formatChromeStatusLines(appState.get());
+    if (save) {
+      await saveSettings({
+        chrome_mcp_enabled: config.chrome_mcp_enabled,
+        chrome_mcp_auto_connect: config.chrome_mcp_auto_connect,
+        chrome_mcp_browser_url: config.chrome_mcp_browser_url,
+        chrome_mcp_channel: config.chrome_mcp_channel,
+        chrome_mcp_connect_timeout_sec: config.chrome_mcp_connect_timeout_sec,
+        chrome_mcp_rpc_timeout_sec: config.chrome_mcp_rpc_timeout_sec,
+      });
+      lines.push("(Settings saved)");
+    }
+    return { action: "handled", lines };
+  } catch (e) {
+    return {
+      action: "handled",
+      lines: [`Failed to update Chrome MCP settings: ${e}`],
+    };
+  }
+}
diff --git a/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts b/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
index 42915f39..55f469fb 100644
--- a/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
+++ b/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
@@ -26,6 +26,7 @@ describe("completionRegistry", () => {
     expect(values).toContain("/zai-plan");
     expect(values).toContain("/web-search");
     expect(values).toContain("/reasoning");
+    expect(values).toContain("/chrome");
     expect(values).toContain("/init");
   });
 
@@ -102,6 +103,31 @@ describe("completionRegistry", () => {
     expect(zaiPlanCmd!.children![0].children?.[0].value).toBe("--save");
   });
 
+  it("/chrome has expected subcommands", () => {
+    const chromeCmd = COMMAND_COMPLETIONS.find((c) => c.value === "/chrome");
+    expect(chromeCmd).toBeDefined();
+    expect(chromeCmd!.children?.map((child) => child.value)).toEqual([
+      "status",
+      "on",
+      "off",
+      "auto",
+      "url",
+      "channel",
+    ]);
+  });
+
+  it("/chrome channel exposes supported channels and save flag", () => {
+    const chromeCmd = COMMAND_COMPLETIONS.find((c) => c.value === "/chrome")!;
+    const channelCmd = chromeCmd.children!.find((c) => c.value === "channel")!;
+    expect(channelCmd.children?.map((child) => child.value)).toEqual([
+      "stable",
+      "beta",
+      "dev",
+      "canary",
+    ]);
+    expect(channelCmd.children?.[0].children?.[0].value).toBe("--save");
+  });
+
   it("reasoning level children have --save flag", () => {
     const reasoningCmd = COMMAND_COMPLETIONS.find((c) => c.value === "/reasoning")!;
     for (const level of reasoningCmd.children!) {
diff --git a/openplanter-desktop/frontend/src/commands/completionRegistry.ts b/openplanter-desktop/frontend/src/commands/completionRegistry.ts
index e7ae9ab8..329f215f 100644
--- a/openplanter-desktop/frontend/src/commands/completionRegistry.ts
+++ b/openplanter-desktop/frontend/src/commands/completionRegistry.ts
@@ -48,6 +48,13 @@ const ZAI_PLANS: CompletionItem[] = [
   { value: "coding", description: "Use the Z.AI Coding Plan endpoint", children: SAVE_FLAG },
 ];
 
+const CHROME_CHANNELS: CompletionItem[] = [
+  { value: "stable", description: "Target Chrome Stable", children: SAVE_FLAG },
+  { value: "beta", description: "Target Chrome Beta", children: SAVE_FLAG },
+  { value: "dev", description: "Target Chrome Dev", children: SAVE_FLAG },
+  { value: "canary", description: "Target Chrome Canary", children: SAVE_FLAG },
+];
+
 export const COMMAND_COMPLETIONS: CompletionItem[] = [
   { value: "/help", description: "Show available commands" },
   { value: "/new", description: "Start a new session" },
@@ -78,6 +85,32 @@ export const COMMAND_COMPLETIONS: CompletionItem[] = [
     description: "Set reasoning effort",
     children: REASONING_LEVELS,
   },
+  {
+    value: "/chrome",
+    description: "Show or configure Chrome DevTools MCP",
+    children: [
+      { value: "status", description: "Show Chrome MCP status" },
+      { value: "on", description: "Enable Chrome MCP", children: SAVE_FLAG },
+      { value: "off", description: "Disable Chrome MCP", children: SAVE_FLAG },
+      { value: "auto", description: "Enable auto-connect mode", children: SAVE_FLAG },
+      {
+        value: "url",
+        description: "Set an explicit Chrome browser URL",
+        children: [
+          {
+            value: "<endpoint>",
+            description: "Remote debugging endpoint URL",
+            children: SAVE_FLAG,
+          },
+        ],
+      },
+      {
+        value: "channel",
+        description: "Set the Chrome release channel",
+        children: CHROME_CHANNELS,
+      },
+    ],
+  },
   {
     value: "/init",
     description: "Workspace initialization and migration",
diff --git a/openplanter-desktop/frontend/src/commands/slash.test.ts b/openplanter-desktop/frontend/src/commands/slash.test.ts
index d5db6e44..87b6f6e0 100644
--- a/openplanter-desktop/frontend/src/commands/slash.test.ts
+++ b/openplanter-desktop/frontend/src/commands/slash.test.ts
@@ -19,6 +19,12 @@ describe("dispatchSlashCommand", () => {
       model: "claude-opus-4-6",
       zaiPlan: "paygo",
       webSearchProvider: "exa",
+      chromeMcpEnabled: true,
+      chromeMcpAutoConnect: true,
+      chromeMcpBrowserUrl: null,
+      chromeMcpChannel: "stable",
+      chromeMcpStatus: "ready",
+      chromeMcpStatusDetail: "Connected to Chrome.",
       sessionId: "20260101-120000-deadbeef",
       reasoningEffort: "medium",
       initGateState: "ready",
@@ -85,6 +91,13 @@ describe("dispatchSlashCommand", () => {
     expect(result!.lines.some((l) => l.includes("Z.AI plan:"))).toBe(true);
   });
 
+  it("status shows chrome mcp state", async () => {
+    const result = await dispatchSlashCommand("/status");
+    expect(result).not.toBeNull();
+    expect(result!.lines.some((l) => l.includes("Chrome MCP:"))).toBe(true);
+    expect(result!.lines.some((l) => l.includes("Chrome runtime:"))).toBe(true);
+  });
+
   it("unknown command", async () => {
     const result = await dispatchSlashCommand("/foobar");
     expect(result).not.toBeNull();
@@ -168,6 +181,19 @@ describe("dispatchSlashCommand", () => {
     (globalThis as any).window = origWindow;
   });
 
+  it("help includes chrome command", async () => {
+    const result = await dispatchSlashCommand("/help");
+    expect(result).not.toBeNull();
+    expect(result!.lines.some((l) => l.includes("/chrome"))).toBe(true);
+  });
+
+  it("chrome dispatches", async () => {
+    const result = await dispatchSlashCommand("/chrome");
+    expect(result).not.toBeNull();
+    expect(result!.action).toBe("handled");
+    expect(result!.lines.some((l) => l.includes("Chrome MCP:"))).toBe(true);
+  });
+
   it("/init status dispatches", async () => {
     __setHandler("get_init_status", () => ({
       runtime_workspace: "/tmp/ws",
diff --git a/openplanter-desktop/frontend/src/commands/slash.ts b/openplanter-desktop/frontend/src/commands/slash.ts
index 67d1a584..7cf050a5 100644
--- a/openplanter-desktop/frontend/src/commands/slash.ts
+++ b/openplanter-desktop/frontend/src/commands/slash.ts
@@ -2,6 +2,7 @@
 import { appState } from "../state/store";
 import { openSession } from "../api/invoke";
 import { handleModelCommand, type CommandResult } from "./model";
+import { CHROME_USAGE, formatChromeStatusLines, handleChromeCommand } from "./chrome";
 import { handleReasoningCommand } from "./reasoning";
 import { handleWebSearchCommand } from "./webSearch";
 import { handleZaiPlanCommand } from "./zaiPlan";
@@ -39,6 +40,8 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
           "  /web-search <provider> --save  Set and persist",
           "  /reasoning          Show/set reasoning effort",
           "  /reasoning <level>  Set level (low, medium, high, off)",
+          "  /chrome             Show current Chrome DevTools MCP status",
+          `  ${CHROME_USAGE.slice(6)}`,
           "  /init status        Show workspace init status",
           "  /init standard      Initialize the current workspace",
           "  /init migrate       Open the migration init panel",
@@ -93,6 +96,7 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
           `Z.AI plan:   ${s.zaiPlan || "paygo"}`,
           `Web search:  ${s.webSearchProvider || "exa"}`,
           `Reasoning:   ${s.reasoningEffort ?? "off"}`,
+          ...formatChromeStatusLines(s),
           `Mode:        ${s.recursive ? "recursive" : "flat"}`,
           `Max depth:   ${s.maxDepth}`,
           `Max steps:   ${s.maxStepsPerCall}`,
@@ -117,6 +121,9 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
     case "/reasoning":
       return handleReasoningCommand(args);
 
+    case "/chrome":
+      return handleChromeCommand(args);
+
     case "/init":
       return handleInitCommand(args);
 
diff --git a/openplanter-desktop/frontend/src/components/App.ts b/openplanter-desktop/frontend/src/components/App.ts
index f8ddab4d..4edaa79e 100644
--- a/openplanter-desktop/frontend/src/components/App.ts
+++ b/openplanter-desktop/frontend/src/components/App.ts
@@ -74,6 +74,7 @@ export function createApp(root: HTMLElement): void {
       `<div><span class="label">model:</span> <span class="value">${s.model || "\u2014"}</span></div>`,
       `<div><span class="label">z.ai plan:</span> <span class="value">${s.zaiPlan || "paygo"}</span></div>`,
       `<div><span class="label">web search:</span> <span class="value">${s.webSearchProvider || "exa"}</span></div>`,
+      `<div><span class="label">chrome mcp:</span> <span class="value">${s.chromeMcpStatus} (${s.chromeMcpChannel})</span></div>`,
       `<div><span class="label">reasoning:</span> <span class="value">${s.reasoningEffort ?? "off"}</span></div>`,
       `<div><span class="label">mode:</span> <span class="value">${s.recursive ? "recursive" : "flat"}</span></div>`,
     ].join("");
diff --git a/openplanter-desktop/frontend/src/components/ChatPane.test.ts b/openplanter-desktop/frontend/src/components/ChatPane.test.ts
index 688b5099..a33d7840 100644
--- a/openplanter-desktop/frontend/src/components/ChatPane.test.ts
+++ b/openplanter-desktop/frontend/src/components/ChatPane.test.ts
@@ -30,7 +30,7 @@ describe("KEY_ARGS", () => {
     expect(KEY_ARGS["read_file"]).toBe("path");
     expect(KEY_ARGS["run_shell"]).toBe("command");
     expect(KEY_ARGS["web_search"]).toBe("query");
-    expect(KEY_ARGS["fetch_url"]).toBe("url");
+    expect(KEY_ARGS["fetch_url"]).toBe("urls");
   });
 });
 
@@ -279,6 +279,27 @@ describe("createChatPane", () => {
     document.body.removeChild(pane);
   });
 
+  it("falls back to the first informative value for unknown tool args", () => {
+    const pane = createChatPane();
+    document.body.appendChild(pane);
+
+    window.dispatchEvent(
+      new CustomEvent("agent-delta", { detail: { kind: "tool_call_start", text: "chrome_click" } })
+    );
+    window.dispatchEvent(
+      new CustomEvent(
+        "agent-delta",
+        { detail: { kind: "tool_call_args", text: '{"selector": "#submit", "timeout": 5}' } },
+      )
+    );
+
+    const indicator = pane.querySelector(".activity-indicator");
+    expect(indicator!.getAttribute("data-mode")).toBe("tool");
+    expect(pane.querySelector(".activity-preview")!.textContent).toBe("#submit");
+
+    document.body.removeChild(pane);
+  });
+
   it("renders step summary on agent-step event", () => {
     const pane = createChatPane();
     document.body.appendChild(pane);
@@ -452,6 +473,22 @@ Trailing text.`;
     expect(msg!.textContent).not.toContain("<tool_call>");
   });
 
+  it("renders fallback key args for unknown tool calls in assistant messages", () => {
+    const pane = createChatPane();
+    const content = `<tool_call>
+{"name": "chrome_evaluate", "arguments": {"expression": "document.title", "timeout": 10}}
+</tool_call>`;
+    appState.update((s) => ({
+      ...s,
+      messages: [makeMsg({ role: "assistant", content, isRendered: true })],
+    }));
+    const msg = pane.querySelector(".message.assistant.rendered");
+    const toolBlock = msg!.querySelector(".tool-call-block");
+    expect(toolBlock).not.toBeNull();
+    expect(toolBlock!.querySelector(".tool-fn")!.textContent).toBe("chrome_evaluate");
+    expect(toolBlock!.querySelector(".tool-arg")!.textContent).toContain("document.title");
+  });
+
   it("renders tool_result XML as collapsible block in rendered assistant message", () => {
     const pane = createChatPane();
     const content = `<tool_result>
diff --git a/openplanter-desktop/frontend/src/components/ChatPane.ts b/openplanter-desktop/frontend/src/components/ChatPane.ts
index 734caf08..ce5339e7 100644
--- a/openplanter-desktop/frontend/src/components/ChatPane.ts
+++ b/openplanter-desktop/frontend/src/components/ChatPane.ts
@@ -2,24 +2,10 @@
 import { appState, type ChatMessage, type StepToolCall } from "../state/store";
 import { createInputBar } from "./InputBar";
 import { parseAgentContent, stripToolXml, type ContentSegment } from "./contentParser";
+import { extractToolCallKeyArg, KEY_ARGS } from "./toolArgs";
 import MarkdownIt from "markdown-it";
 import hljs from "highlight.js";
 
-/** Key argument names for tool call display. */
-const KEY_ARGS: Record<string, string> = {
-  read_file: "path",
-  write_file: "path",
-  edit_file: "path",
-  list_files: "directory",
-  run_shell: "command",
-  run_shell_bg: "command",
-  kill_shell_bg: "pid",
-  web_search: "query",
-  fetch_url: "url",
-  apply_patch: "path",
-  hashline_edit: "path",
-};
-
 const md = new MarkdownIt({
   html: false,
   linkify: true,
@@ -34,16 +20,6 @@ const md = new MarkdownIt({
   },
 });
 
-/** Extract the key argument value from a partial JSON string. */
-function extractKeyArg(toolName: string, argsJson: string): string | null {
-  const keyName = KEY_ARGS[toolName];
-  if (!keyName) return null;
-  // Try to extract "keyName": "value" from possibly-incomplete JSON
-  const regex = new RegExp(`"${keyName}"\\s*:\\s*"([^"]*)"?`);
-  const m = argsJson.match(regex);
-  return m ? m[1] : null;
-}
-
 /** Format elapsed milliseconds as a readable string. */
 function formatElapsed(ms: number): string {
   if (ms < 1000) return `${ms}ms`;
@@ -511,7 +487,7 @@ export function createChatPane(): HTMLElement {
 
       // Always re-extract key arg as more chunks arrive — partial JSON
       // grows with each chunk so the extracted value gets more complete.
-      const keyArg = extractKeyArg(currentToolName, toolArgsBuf);
+      const keyArg = extractToolCallKeyArg(currentToolName, toolArgsBuf);
       if (keyArg) {
         const current = stepToolCalls[stepToolCalls.length - 1];
         if (current) current.keyArg = keyArg;
@@ -592,5 +568,4 @@ export function createChatPane(): HTMLElement {
 
   return pane;
 }
-
 export { KEY_ARGS };
diff --git a/openplanter-desktop/frontend/src/components/contentParser.test.ts b/openplanter-desktop/frontend/src/components/contentParser.test.ts
index ccb888a0..e62788a9 100644
--- a/openplanter-desktop/frontend/src/components/contentParser.test.ts
+++ b/openplanter-desktop/frontend/src/components/contentParser.test.ts
@@ -86,7 +86,19 @@ Environment confirmed.`;
     expect(result[0]).toMatchObject({
       type: "tool_call",
       name: "custom_tool",
-      keyArg: "",
+      keyArg: "stuff",
+    });
+  });
+
+  it("falls back to the first informative array or number for unknown tools", () => {
+    const content = `<tool_call>
+{"name": "custom_tool", "arguments": {"links": ["https://a.test", "https://b.test"], "limit": 3}}
+</tool_call>`;
+    const result = parseAgentContent(content);
+    expect(result[0]).toMatchObject({
+      type: "tool_call",
+      name: "custom_tool",
+      keyArg: "https://a.test, https://b.test",
     });
   });
 
diff --git a/openplanter-desktop/frontend/src/components/contentParser.ts b/openplanter-desktop/frontend/src/components/contentParser.ts
index eea4f95f..fec28dd7 100644
--- a/openplanter-desktop/frontend/src/components/contentParser.ts
+++ b/openplanter-desktop/frontend/src/components/contentParser.ts
@@ -1,19 +1,5 @@
 /** Parse <tool_call> and <tool_result> XML blocks from agent content. */
-
-/** Key argument names for tool call display (mirrors ChatPane's KEY_ARGS). */
-const KEY_ARGS: Record<string, string> = {
-  read_file: "path",
-  write_file: "path",
-  edit_file: "path",
-  list_files: "directory",
-  run_shell: "command",
-  run_shell_bg: "command",
-  kill_shell_bg: "pid",
-  web_search: "query",
-  fetch_url: "url",
-  apply_patch: "path",
-  hashline_edit: "path",
-};
+import { getToolCallKeyArg } from "./toolArgs";
 
 export type ContentSegment =
   | { type: "text"; text: string }
@@ -67,8 +53,7 @@ function parseToolCall(json: string): ContentSegment {
     const obj = JSON.parse(json);
     const name: string = obj.name ?? "unknown";
     const args = obj.arguments ?? {};
-    const keyName = KEY_ARGS[name];
-    const keyArg = keyName && typeof args[keyName] === "string" ? args[keyName] : "";
+    const keyArg = getToolCallKeyArg(name, args);
     return { type: "tool_call", name, keyArg, rawArgs: JSON.stringify(args) };
   } catch {
     return { type: "tool_call", name: "unknown", keyArg: "", rawArgs: json };
diff --git a/openplanter-desktop/frontend/src/components/toolArgs.ts b/openplanter-desktop/frontend/src/components/toolArgs.ts
new file mode 100644
index 00000000..9fb110e4
--- /dev/null
+++ b/openplanter-desktop/frontend/src/components/toolArgs.ts
@@ -0,0 +1,160 @@
+/** Shared helpers for rendering compact tool argument previews. */
+
+export const KEY_ARGS: Record<string, string> = {
+  read_file: "path",
+  read_image: "path",
+  audio_transcribe: "path",
+  write_file: "path",
+  edit_file: "path",
+  hashline_edit: "path",
+  apply_patch: "patch",
+  list_files: "glob",
+  search_files: "query",
+  repo_map: "glob",
+  run_shell: "command",
+  run_shell_bg: "command",
+  check_shell_bg: "job_id",
+  kill_shell_bg: "job_id",
+  web_search: "query",
+  fetch_url: "urls",
+  subtask: "objective",
+  execute: "objective",
+  think: "note",
+};
+
+interface IndexedCandidate {
+  index: number;
+  value: string;
+}
+
+function normalizePreviewValue(value: unknown): string | null {
+  if (typeof value === "string") {
+    const trimmed = value.trim();
+    return trimmed || null;
+  }
+
+  if (typeof value === "number" && Number.isFinite(value)) {
+    return String(value);
+  }
+
+  if (Array.isArray(value)) {
+    const items = value.flatMap((item) => {
+      if (typeof item === "string") {
+        const trimmed = item.trim();
+        return trimmed ? [trimmed] : [];
+      }
+      if (typeof item === "number" && Number.isFinite(item)) {
+        return [String(item)];
+      }
+      return [];
+    });
+    return items.length > 0 ? items.join(", ") : null;
+  }
+
+  return null;
+}
+
+function escapeRegExp(value: string): string {
+  return value.replace(/[.*+?^${}()|[\]\\]/g, "\\$&");
+}
+
+function collectRegexCandidates(
+  source: string,
+  regex: RegExp,
+  pickValue: (match: RegExpMatchArray) => string | null,
+): IndexedCandidate[] {
+  const candidates: IndexedCandidate[] = [];
+  for (const match of source.matchAll(regex)) {
+    const value = pickValue(match)?.trim();
+    if (value) {
+      candidates.push({
+        index: match.index ?? Number.MAX_SAFE_INTEGER,
+        value,
+      });
+    }
+  }
+  return candidates;
+}
+
+function collectCandidatesForKey(source: string, key: string): IndexedCandidate[] {
+  const escapedKey = escapeRegExp(key);
+  const stringRegex = new RegExp(`"${escapedKey}"\\s*:\\s*"([^"]*)`, "g");
+  const arrayRegex = new RegExp(`"${escapedKey}"\\s*:\\s*\\[([^\\]]*)`, "g");
+  const numberRegex = new RegExp(`"${escapedKey}"\\s*:\\s*(-?\\d+(?:\\.\\d+)?)`, "g");
+
+  return [
+    ...collectRegexCandidates(source, stringRegex, (match) => match[1] ?? null),
+    ...collectRegexCandidates(source, arrayRegex, (match) => {
+      const items = [...(match[1] ?? "").matchAll(/"([^"]*)/g)]
+        .map((item) => item[1]?.trim() ?? "")
+        .filter(Boolean);
+      return items.length > 0 ? items.join(", ") : null;
+    }),
+    ...collectRegexCandidates(source, numberRegex, (match) => match[1] ?? null),
+  ].sort((a, b) => a.index - b.index);
+}
+
+function collectFallbackCandidates(source: string): IndexedCandidate[] {
+  return [
+    ...collectRegexCandidates(
+      source,
+      /"([^"]+)"\s*:\s*"([^"]*)/g,
+      (match) => match[2] ?? null,
+    ),
+    ...collectRegexCandidates(
+      source,
+      /"([^"]+)"\s*:\s*\[([^\]]*)/g,
+      (match) => {
+        const items = [...(match[2] ?? "").matchAll(/"([^"]*)/g)]
+          .map((item) => item[1]?.trim() ?? "")
+          .filter(Boolean);
+        return items.length > 0 ? items.join(", ") : null;
+      },
+    ),
+    ...collectRegexCandidates(
+      source,
+      /"([^"]+)"\s*:\s*(-?\d+(?:\.\d+)?)/g,
+      (match) => match[2] ?? null,
+    ),
+  ].sort((a, b) => a.index - b.index);
+}
+
+/** Return the best compact preview for a parsed tool argument object. */
+export function getToolCallKeyArg(toolName: string, args: unknown): string {
+  if (!args || typeof args !== "object" || Array.isArray(args)) {
+    return "";
+  }
+
+  const entries = Object.entries(args as Record<string, unknown>);
+  const preferredKey = KEY_ARGS[toolName];
+
+  if (preferredKey) {
+    const preferredValue = normalizePreviewValue((args as Record<string, unknown>)[preferredKey]);
+    if (preferredValue) {
+      return preferredValue;
+    }
+  }
+
+  for (const [, value] of entries) {
+    const preview = normalizePreviewValue(value);
+    if (preview) {
+      return preview;
+    }
+  }
+
+  return "";
+}
+
+/** Best-effort extraction from a partial JSON argument string during streaming. */
+export function extractToolCallKeyArg(toolName: string, argsJson: string): string | null {
+  const preferredKey = KEY_ARGS[toolName];
+  if (preferredKey) {
+    const preferred = collectCandidatesForKey(argsJson, preferredKey)[0];
+    if (preferred) {
+      return preferred.value;
+    }
+  }
+
+  const fallback = collectFallbackCandidates(argsJson)[0];
+  return fallback?.value ?? null;
+}
diff --git a/openplanter-desktop/frontend/src/main.ts b/openplanter-desktop/frontend/src/main.ts
index fb13670b..c0493fc7 100644
--- a/openplanter-desktop/frontend/src/main.ts
+++ b/openplanter-desktop/frontend/src/main.ts
@@ -40,6 +40,14 @@ async function init() {
       model: config.model,
       zaiPlan: config.zai_plan,
       webSearchProvider: config.web_search_provider,
+      chromeMcpEnabled: config.chrome_mcp_enabled,
+      chromeMcpAutoConnect: config.chrome_mcp_auto_connect,
+      chromeMcpBrowserUrl: config.chrome_mcp_browser_url,
+      chromeMcpChannel: config.chrome_mcp_channel,
+      chromeMcpConnectTimeoutSec: config.chrome_mcp_connect_timeout_sec,
+      chromeMcpRpcTimeoutSec: config.chrome_mcp_rpc_timeout_sec,
+      chromeMcpStatus: config.chrome_mcp_status,
+      chromeMcpStatusDetail: config.chrome_mcp_status_detail,
       sessionId: config.session_id,
       reasoningEffort: config.reasoning_effort,
       recursive: config.recursive,
@@ -76,6 +84,7 @@ async function init() {
           `model: ${model || "—"}`,
           `z.ai plan: ${state.zaiPlan || "paygo"}`,
           `web search: ${state.webSearchProvider || "exa"}`,
+          `chrome mcp: ${state.chromeMcpStatus}`,
           `reasoning: ${reasoningLabel}`,
           `mode: ${modeLabel}`,
           `workspace: ${state.workspace || "."}`,
diff --git a/openplanter-desktop/frontend/src/state/store.ts b/openplanter-desktop/frontend/src/state/store.ts
index 4fa1eeca..eaca952c 100644
--- a/openplanter-desktop/frontend/src/state/store.ts
+++ b/openplanter-desktop/frontend/src/state/store.ts
@@ -72,6 +72,14 @@ export interface AppState {
   model: string;
   zaiPlan: string;
   webSearchProvider: string;
+  chromeMcpEnabled: boolean;
+  chromeMcpAutoConnect: boolean;
+  chromeMcpBrowserUrl: string | null;
+  chromeMcpChannel: string;
+  chromeMcpConnectTimeoutSec: number;
+  chromeMcpRpcTimeoutSec: number;
+  chromeMcpStatus: string;
+  chromeMcpStatusDetail: string;
   sessionId: string | null;
   inputTokens: number;
   outputTokens: number;
@@ -103,6 +111,14 @@ export const appState = new Store<AppState>({
   model: "",
   zaiPlan: "paygo",
   webSearchProvider: "exa",
+  chromeMcpEnabled: false,
+  chromeMcpAutoConnect: true,
+  chromeMcpBrowserUrl: null,
+  chromeMcpChannel: "stable",
+  chromeMcpConnectTimeoutSec: 15,
+  chromeMcpRpcTimeoutSec: 45,
+  chromeMcpStatus: "disabled",
+  chromeMcpStatusDetail: "Chrome DevTools MCP is disabled.",
   sessionId: null,
   inputTokens: 0,
   outputTokens: 0,
diff --git a/tests/test_chrome_mcp.py b/tests/test_chrome_mcp.py
new file mode 100644
index 00000000..dc1ad5ca
--- /dev/null
+++ b/tests/test_chrome_mcp.py
@@ -0,0 +1,207 @@
+from __future__ import annotations
+
+import os
+import stat
+import tempfile
+import unittest
+from pathlib import Path
+from unittest.mock import patch
+
+from agent.chrome_mcp import (
+    ChromeMcpError,
+    ChromeMcpManager,
+    acquire_shared_manager,
+    shutdown_all_shared_managers,
+)
+
+
+FAKE_MCP_SERVER = """#!/usr/bin/env python3
+import json
+import sys
+
+TOOLS = [
+    {
+        "name": "navigate_page",
+        "description": "Navigate the page",
+        "inputSchema": {
+            "type": "object",
+            "properties": {"url": {"type": "string"}},
+            "required": ["url"],
+            "additionalProperties": False,
+        },
+    },
+    {
+        "name": "take_screenshot",
+        "description": "Take a screenshot",
+        "inputSchema": {
+            "type": "object",
+            "properties": {},
+            "required": [],
+            "additionalProperties": False,
+        },
+    },
+]
+
+for raw_line in sys.stdin:
+    line = raw_line.strip()
+    if not line:
+        continue
+    payload = json.loads(line)
+    method = payload.get("method")
+    request_id = payload.get("id")
+    if method == "initialize" and request_id is not None:
+        sys.stdout.write(json.dumps({
+            "jsonrpc": "2.0",
+            "id": request_id,
+            "result": {
+                "protocolVersion": "2025-11-25",
+                "serverInfo": {"name": "fake-chrome-mcp", "version": "1.0"},
+            },
+        }) + "\\n")
+        sys.stdout.flush()
+        continue
+    if method == "tools/list" and request_id is not None:
+        sys.stdout.write(json.dumps({
+            "jsonrpc": "2.0",
+            "id": request_id,
+            "result": {"tools": TOOLS},
+        }) + "\\n")
+        sys.stdout.flush()
+        continue
+    if method == "tools/call" and request_id is not None:
+        params = payload.get("params") or {}
+        name = params.get("name")
+        if name == "take_screenshot":
+            result = {
+                "content": [
+                    {"type": "text", "text": "Screenshot captured."},
+                    {"type": "image", "data": "ZmFrZS1pbWFnZQ==", "mimeType": "image/png"},
+                ]
+            }
+        else:
+            result = {
+                "content": [
+                    {"type": "text", "text": f"Called {name}"},
+                ]
+            }
+        sys.stdout.write(json.dumps({
+            "jsonrpc": "2.0",
+            "id": request_id,
+            "result": result,
+        }) + "\\n")
+        sys.stdout.flush()
+"""
+
+
+def _write_fake_launcher(tmpdir: str) -> Path:
+    launcher = Path(tmpdir) / "fake_npx.py"
+    launcher.write_text(FAKE_MCP_SERVER, encoding="utf-8")
+    launcher.chmod(launcher.stat().st_mode | stat.S_IXUSR)
+    return launcher
+
+
+class ChromeMcpManagerTests(unittest.TestCase):
+    def tearDown(self) -> None:
+        shutdown_all_shared_managers()
+
+    def test_initialize_list_tools_and_call_tool(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            launcher = _write_fake_launcher(tmpdir)
+            with patch.dict(
+                os.environ,
+                {
+                    "OPENPLANTER_CHROME_MCP_COMMAND": str(launcher),
+                    "OPENPLANTER_CHROME_MCP_PACKAGE": "ignored-package",
+                },
+                clear=False,
+            ):
+                manager = ChromeMcpManager(
+                    enabled=True,
+                    auto_connect=True,
+                    browser_url=None,
+                    channel="stable",
+                    connect_timeout_sec=3,
+                    rpc_timeout_sec=3,
+                )
+                tools = manager.list_tools(force_refresh=True)
+                self.assertEqual([tool.name for tool in tools], ["navigate_page", "take_screenshot"])
+
+                result = manager.call_tool("navigate_page", {"url": "https://example.com"})
+                self.assertIn("Called navigate_page", result.content)
+                self.assertFalse(result.is_error)
+                manager.shutdown()
+
+    def test_call_tool_parses_image_payload(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            launcher = _write_fake_launcher(tmpdir)
+            with patch.dict(
+                os.environ,
+                {
+                    "OPENPLANTER_CHROME_MCP_COMMAND": str(launcher),
+                    "OPENPLANTER_CHROME_MCP_PACKAGE": "ignored-package",
+                },
+                clear=False,
+            ):
+                manager = ChromeMcpManager(
+                    enabled=True,
+                    auto_connect=True,
+                    browser_url=None,
+                    channel="stable",
+                    connect_timeout_sec=3,
+                    rpc_timeout_sec=3,
+                )
+                result = manager.call_tool("take_screenshot", {})
+                self.assertIn("Screenshot captured.", result.content)
+                self.assertIsNotNone(result.image)
+                assert result.image is not None
+                self.assertEqual(result.image.media_type, "image/png")
+                self.assertEqual(result.image.base64_data, "ZmFrZS1pbWFnZQ==")
+                manager.shutdown()
+
+    def test_missing_attach_mode_reports_unavailable(self) -> None:
+        manager = ChromeMcpManager(
+            enabled=True,
+            auto_connect=False,
+            browser_url=None,
+            channel="stable",
+            connect_timeout_sec=1,
+            rpc_timeout_sec=1,
+        )
+        with self.assertRaises(ChromeMcpError):
+            manager.list_tools()
+        status = manager.status_snapshot()
+        self.assertEqual(status.status, "unavailable")
+        self.assertIn("chrome_mcp_browser_url", status.detail)
+
+    def test_shared_manager_registry_reuses_instances(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            launcher = _write_fake_launcher(tmpdir)
+            with patch.dict(
+                os.environ,
+                {
+                    "OPENPLANTER_CHROME_MCP_COMMAND": str(launcher),
+                    "OPENPLANTER_CHROME_MCP_PACKAGE": "ignored-package",
+                },
+                clear=False,
+            ):
+                first = acquire_shared_manager(
+                    enabled=True,
+                    auto_connect=True,
+                    browser_url=None,
+                    channel="stable",
+                    connect_timeout_sec=3,
+                    rpc_timeout_sec=3,
+                )
+                second = acquire_shared_manager(
+                    enabled=True,
+                    auto_connect=True,
+                    browser_url=None,
+                    channel="stable",
+                    connect_timeout_sec=3,
+                    rpc_timeout_sec=3,
+                )
+                self.assertIs(first, second)
+
+
+if __name__ == "__main__":
+    unittest.main()
diff --git a/tests/test_engine.py b/tests/test_engine.py
index 4e8c58bc..3fca7972 100644
--- a/tests/test_engine.py
+++ b/tests/test_engine.py
@@ -9,6 +9,7 @@
 from unittest.mock import patch
 
 from conftest import _tc
+from agent.chrome_mcp import ChromeMcpCallResult
 from agent.config import AgentConfig
 from agent.engine import RLMEngine
 from agent.prompts import build_system_prompt as _build_system_prompt
@@ -17,6 +18,53 @@
 
 
 class EngineTests(unittest.TestCase):
+    def test_dynamic_tool_defs_are_merged_for_main_loop(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(workspace=root, max_depth=1, max_steps_per_call=2)
+            tools = WorkspaceTools(root=root)
+            model = ScriptedModel(scripted_turns=[ModelTurn(text="done", stop_reason="end_turn")])
+            with patch.object(
+                tools,
+                "get_chrome_mcp_tool_defs",
+                return_value=[
+                    {
+                        "name": "navigate_page",
+                        "description": "Navigate Chrome",
+                        "parameters": {
+                            "type": "object",
+                            "properties": {"url": {"type": "string"}},
+                            "required": ["url"],
+                            "additionalProperties": False,
+                        },
+                    }
+                ],
+            ):
+                engine = RLMEngine(model=model, tools=tools, config=cfg)
+                names = [tool["name"] for tool in engine._build_tool_defs(include_subtask=True)]
+            self.assertIn("navigate_page", names)
+
+    def test_dynamic_tool_calls_fall_through_to_chrome_manager(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            cfg = AgentConfig(workspace=root, max_depth=1, max_steps_per_call=4)
+            tools = WorkspaceTools(root=root)
+            model = ScriptedModel(
+                scripted_turns=[
+                    ModelTurn(tool_calls=[_tc("navigate_page", url="https://example.com")]),
+                    ModelTurn(text="done", stop_reason="end_turn"),
+                ]
+            )
+            with patch.object(tools, "get_chrome_mcp_tool_defs", return_value=[]), patch.object(
+                tools,
+                "try_execute_dynamic_tool",
+                return_value=ChromeMcpCallResult(content="Navigated to https://example.com"),
+            ) as mocked:
+                engine = RLMEngine(model=model, tools=tools, config=cfg)
+                result = engine.solve("navigate using Chrome MCP")
+            self.assertEqual(result, "done")
+            mocked.assert_called_once()
+
     def test_write_and_read_then_final(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)
diff --git a/tests/test_settings.py b/tests/test_settings.py
index 6a645a98..afc8d763 100644
--- a/tests/test_settings.py
+++ b/tests/test_settings.py
@@ -8,7 +8,12 @@
 from agent.builder import _validate_model_provider, infer_provider_for_model
 from agent.credentials import CredentialBundle
 from agent.model import ModelError
-from agent.settings import PersistentSettings, SettingsStore, normalize_reasoning_effort
+from agent.settings import (
+    PersistentSettings,
+    SettingsStore,
+    normalize_chrome_mcp_channel,
+    normalize_reasoning_effort,
+)
 from agent.tui import SLASH_COMMANDS, _compute_suggestions
 
 
@@ -26,6 +31,27 @@ def test_settings_roundtrip(self) -> None:
             self.assertEqual(loaded.default_model, "gpt-5.2")
             self.assertEqual(loaded.default_reasoning_effort, "high")
 
+    def test_chrome_mcp_settings_roundtrip(self) -> None:
+        with tempfile.TemporaryDirectory() as tmpdir:
+            root = Path(tmpdir)
+            store = SettingsStore(workspace=root, session_root_dir=".openplanter")
+            settings = PersistentSettings(
+                chrome_mcp_enabled=True,
+                chrome_mcp_auto_connect=False,
+                chrome_mcp_browser_url="http://127.0.0.1:9222",
+                chrome_mcp_channel="beta",
+                chrome_mcp_connect_timeout_sec=21,
+                chrome_mcp_rpc_timeout_sec=61,
+            )
+            store.save(settings)
+            loaded = store.load()
+            self.assertTrue(loaded.chrome_mcp_enabled)
+            self.assertFalse(loaded.chrome_mcp_auto_connect)
+            self.assertEqual(loaded.chrome_mcp_browser_url, "http://127.0.0.1:9222")
+            self.assertEqual(loaded.chrome_mcp_channel, "beta")
+            self.assertEqual(loaded.chrome_mcp_connect_timeout_sec, 21)
+            self.assertEqual(loaded.chrome_mcp_rpc_timeout_sec, 61)
+
     def test_normalize_reasoning_effort(self) -> None:
         self.assertEqual(normalize_reasoning_effort("LOW"), "low")
         self.assertEqual(normalize_reasoning_effort(" medium "), "medium")
@@ -33,6 +59,12 @@ def test_normalize_reasoning_effort(self) -> None:
         with self.assertRaises(ValueError):
             normalize_reasoning_effort("extreme")
 
+    def test_normalize_chrome_channel(self) -> None:
+        self.assertEqual(normalize_chrome_mcp_channel("BETA"), "beta")
+        self.assertIsNone(normalize_chrome_mcp_channel(""))
+        with self.assertRaises(ValueError):
+            normalize_chrome_mcp_channel("nightly")
+
     def test_per_provider_model_roundtrip(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)
@@ -162,6 +194,10 @@ def test_slash_r_matches_reasoning(self) -> None:
         matches, _ = _compute_suggestions("/r")
         self.assertIn("/reasoning", matches)
 
+    def test_slash_c_matches_chrome(self) -> None:
+        matches, _ = _compute_suggestions("/ch")
+        self.assertIn("/chrome", matches)
+
 
 class InferProviderTests(unittest.TestCase):
     def test_claude_is_anthropic(self) -> None:
diff --git a/tests/test_tool_defs.py b/tests/test_tool_defs.py
index a985725b..09b74089 100644
--- a/tests/test_tool_defs.py
+++ b/tests/test_tool_defs.py
@@ -71,6 +71,45 @@ def test_default_includes_subtask(self) -> None:
         names = [d["name"] for d in defs]
         self.assertIn("subtask", names)
 
+    def test_dynamic_defs_are_merged(self) -> None:
+        defs = get_tool_definitions(
+            include_subtask=False,
+            dynamic_defs=[
+                {
+                    "name": "navigate_page",
+                    "description": "Navigate Chrome",
+                    "parameters": {
+                        "type": "object",
+                        "properties": {"url": {"type": "string"}},
+                        "required": ["url"],
+                        "additionalProperties": False,
+                    },
+                }
+            ],
+        )
+        names = [d["name"] for d in defs]
+        self.assertIn("navigate_page", names)
+
+    def test_dynamic_defs_do_not_override_static_names(self) -> None:
+        defs = get_tool_definitions(
+            include_subtask=False,
+            dynamic_defs=[
+                {
+                    "name": "read_file",
+                    "description": "override",
+                    "parameters": {
+                        "type": "object",
+                        "properties": {},
+                        "required": [],
+                        "additionalProperties": False,
+                    },
+                }
+            ],
+        )
+        matches = [d for d in defs if d["name"] == "read_file"]
+        self.assertEqual(len(matches), 1)
+        self.assertIn("Read the contents", matches[0]["description"])
+
 
 class MakeStrictParametersTests(unittest.TestCase):
     """Tests for _make_strict_parameters()."""
diff --git a/tests/test_tui_repl.py b/tests/test_tui_repl.py
index cd331fde..cda7e98d 100644
--- a/tests/test_tui_repl.py
+++ b/tests/test_tui_repl.py
@@ -8,6 +8,7 @@
 
 import pytest
 
+from agent.chrome_mcp import ChromeMcpStatus
 from agent.config import AgentConfig
 from agent.settings import SettingsStore
 from agent.tui import ChatContext, RichREPL, _queue_prompt_style, dispatch_slash_command
@@ -261,6 +262,14 @@ def test_exit_command_exits(self, tmp_path):
             repl.run()
         repl.ctx.runtime.solve.assert_not_called()
 
+
+class TestRunLoopMore:
+    def _make_repl(self, tmp_path):
+        ctx = _make_ctx(tmp_path)
+        repl = RichREPL(ctx)
+        repl.console = MagicMock()
+        return repl
+
     def test_help_command_handled(self, tmp_path):
         """The /help command should be handled without running the agent, then continue."""
         repl = self._make_repl(tmp_path)
@@ -323,6 +332,44 @@ def fake_solve(objective, on_event=None, on_step=None, on_content_delta=None):
         assert agent_ran.is_set()
 
 
+class TestChromeSlashCommand:
+    def test_status_renders_runtime_state(self, tmp_path):
+        ctx = _make_ctx(tmp_path)
+        ctx.cfg.chrome_mcp_enabled = True
+        ctx.cfg.chrome_mcp_auto_connect = True
+        ctx.cfg.chrome_mcp_channel = "stable"
+        ctx.runtime.engine.tools.chrome_mcp_status.return_value = ChromeMcpStatus(
+            status="ready",
+            detail="Chrome DevTools MCP ready with 2 tool(s).",
+            tool_count=2,
+        )
+        lines: list[str] = []
+        result = dispatch_slash_command("/chrome status", ctx, emit=lines.append)
+        assert result == "handled"
+        assert any("Chrome MCP:" in line for line in lines)
+        assert any("ready" in line for line in lines)
+
+    def test_auto_rebuilds_engine_and_persists(self, tmp_path):
+        ctx = _make_ctx(tmp_path)
+        rebuilt_engine = MagicMock()
+        rebuilt_engine.tools.chrome_mcp_status.return_value = ChromeMcpStatus(
+            status="ready",
+            detail="Chrome DevTools MCP ready with 3 tool(s).",
+            tool_count=3,
+        )
+        lines: list[str] = []
+        with patch("agent.builder.build_engine", return_value=rebuilt_engine):
+            result = dispatch_slash_command("/chrome auto --save", ctx, emit=lines.append)
+        assert result == "handled"
+        assert ctx.cfg.chrome_mcp_enabled is True
+        assert ctx.cfg.chrome_mcp_auto_connect is True
+        assert ctx.cfg.chrome_mcp_browser_url is None
+        saved = ctx.settings_store.load()
+        assert saved.chrome_mcp_enabled is True
+        assert saved.chrome_mcp_auto_connect is True
+        assert "Saved as workspace default." in lines
+
+
 # ---------------------------------------------------------------------------
 # dispatch_slash_command
 # ---------------------------------------------------------------------------

From 36eebce7ec11270923c6ad1326b7006e2e7e54c8 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 12:48:31 -0400
Subject: [PATCH 43/58] Fix /chrome auto browser URL clearing

---
 openplanter-desktop/frontend/src/commands/chrome.test.ts | 2 +-
 openplanter-desktop/frontend/src/commands/chrome.ts      | 4 +++-
 2 files changed, 4 insertions(+), 2 deletions(-)

diff --git a/openplanter-desktop/frontend/src/commands/chrome.test.ts b/openplanter-desktop/frontend/src/commands/chrome.test.ts
index 4b1591e7..04da61a5 100644
--- a/openplanter-desktop/frontend/src/commands/chrome.test.ts
+++ b/openplanter-desktop/frontend/src/commands/chrome.test.ts
@@ -65,7 +65,7 @@ describe("handleChromeCommand", () => {
     __setHandler("update_config", ({ partial }: { partial: Record<string, unknown> }) => {
       expect(partial.chrome_mcp_enabled).toBe(true);
       expect(partial.chrome_mcp_auto_connect).toBe(true);
-      expect(partial.chrome_mcp_browser_url).toBeNull();
+      expect(partial.chrome_mcp_browser_url).toBe("");
       return makeChromeConfig();
     });
 
diff --git a/openplanter-desktop/frontend/src/commands/chrome.ts b/openplanter-desktop/frontend/src/commands/chrome.ts
index 5ab0bb20..83b76ff3 100644
--- a/openplanter-desktop/frontend/src/commands/chrome.ts
+++ b/openplanter-desktop/frontend/src/commands/chrome.ts
@@ -73,7 +73,9 @@ export async function handleChromeCommand(args: string): Promise<CommandResult>
       partial = {
         chrome_mcp_enabled: true,
         chrome_mcp_auto_connect: true,
-        chrome_mcp_browser_url: null,
+        // Tauri partial config treats `null` as "field omitted", so send an
+        // empty string and let the Rust normalizer clear the stored URL.
+        chrome_mcp_browser_url: "",
       };
       break;
     case "url":

From 8d757d411fa3b4d6e8713b2c403b23890718711c Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 15:43:17 -0400
Subject: [PATCH 44/58] Revert "Add GPT-5.4 defaults and OAuth parity"

This reverts commit bfd94e2a4ec65d40aea54795376ff9bf948c1cb3.
---
 README.md                                     |   3 +-
 agent/__main__.py                             |  20 +---
 agent/builder.py                              |  24 +---
 agent/config.py                               |  39 ++-----
 agent/tui.py                                  |   5 +-
 .../crates/op-core/src/builder.rs             |  28 ++---
 .../crates/op-core/src/config.rs              | 104 ++++--------------
 .../crates/op-core/src/credentials.rs         |   6 +-
 .../crates/op-core/src/model/openai.rs        |   6 +-
 .../op-core/tests/test_model_streaming.rs     |   6 +-
 .../crates/op-tauri/src/commands/config.rs    |  45 +-------
 .../crates/op-tauri/src/state.rs              |  28 -----
 .../frontend/src/api/invoke.test.ts           |  14 +--
 .../frontend/src/commands/model.test.ts       |  41 +------
 .../frontend/src/commands/model.ts            |   7 +-
 tests/test_coverage_gaps.py                   |  23 +---
 tests/test_model.py                           |   4 +-
 tests/test_settings.py                        |   2 +-
 18 files changed, 78 insertions(+), 327 deletions(-)

diff --git a/README.md b/README.md
index 2ff7345d..03eb90e7 100644
--- a/README.md
+++ b/README.md
@@ -93,7 +93,7 @@ The container mounts `./workspace` as the agent's working directory.
 
 | Provider | Default Model | Env Var |
 |----------|---------------|---------|
-| OpenAI | `azure-foundry/gpt-5.4` | `OPENAI_API_KEY` or `OPENAI_OAUTH_TOKEN` |
+| OpenAI | `azure-foundry/gpt-5.3-codex` | `OPENAI_API_KEY` or `OPENAI_OAUTH_TOKEN` |
 | Anthropic | `anthropic-foundry/claude-opus-4-6` | `ANTHROPIC_API_KEY` |
 | OpenRouter | `anthropic/claude-sonnet-4-5` | `OPENROUTER_API_KEY` |
 | Cerebras | `qwen-3-235b-a22b-instruct-2507` | `CEREBRAS_API_KEY` |
@@ -310,7 +310,6 @@ OPENPLANTER_WORKSPACE=workspace
 |------|-------------|
 | `--provider NAME` | `auto`, `openai`, `anthropic`, `openrouter`, `cerebras`, `zai`, `ollama` |
 | `--model NAME` | Model name or `newest` to auto-select |
-| `--openai-oauth-token TOKEN` | ChatGPT Plus/Teams/Pro OAuth bearer token for OpenAI-compatible models |
 | `--zai-plan PLAN` | Z.AI endpoint plan: `paygo` or `coding` |
 | `--reasoning-effort LEVEL` | `low`, `medium`, `high`, or `none` |
 | `--chrome-mcp` / `--no-chrome-mcp` | Enable or disable native Chrome DevTools MCP tools |
diff --git a/agent/__main__.py b/agent/__main__.py
index 2eb3bc9d..eaf74ad9 100644
--- a/agent/__main__.py
+++ b/agent/__main__.py
@@ -407,12 +407,8 @@ def _apply_runtime_overrides(cfg: AgentConfig, args: argparse.Namespace, creds:
         cfg.provider = args.provider
     cfg.provider = _resolve_provider(cfg.provider, creds)
 
-    cfg.openai_oauth_token = (creds.openai_oauth_token or "").strip() or None
-    cfg.openai_api_key = resolve_openai_api_key(
-        creds.openai_api_key,
-        cfg.openai_base_url,
-        cfg.openai_oauth_token,
-    )
+    effective_openai_key = creds.openai_api_key or creds.openai_oauth_token
+    cfg.openai_api_key = resolve_openai_api_key(effective_openai_key, cfg.openai_base_url)
     cfg.anthropic_api_key = resolve_anthropic_api_key(
         creds.anthropic_api_key,
         cfg.anthropic_base_url,
@@ -451,20 +447,12 @@ def _apply_runtime_overrides(cfg: AgentConfig, args: argparse.Namespace, creds:
             cfg.ollama_base_url = args.base_url
         cfg.base_url = args.base_url
 
-    cfg.openai_api_key = resolve_openai_api_key(
-        cfg.openai_api_key,
-        cfg.openai_base_url,
-        cfg.openai_oauth_token,
-    )
+    cfg.openai_api_key = resolve_openai_api_key(cfg.openai_api_key, cfg.openai_base_url)
     cfg.anthropic_api_key = resolve_anthropic_api_key(
         cfg.anthropic_api_key,
         cfg.anthropic_base_url,
     )
-    cfg.api_key = resolve_openai_api_key(
-        cfg.api_key,
-        cfg.base_url,
-        cfg.openai_oauth_token,
-    )
+    cfg.api_key = resolve_openai_api_key(cfg.api_key, cfg.base_url)
 
     if args.model:
         cfg.model = args.model
diff --git a/agent/builder.py b/agent/builder.py
index 8522cc1a..76d3f751 100644
--- a/agent/builder.py
+++ b/agent/builder.py
@@ -83,17 +83,9 @@ def _validate_model_provider(model_name: str, provider: str) -> None:
 
 def _fetch_models_for_provider(cfg: AgentConfig, provider: str) -> list[dict]:
     if provider == "openai":
-        api_key = resolve_openai_api_key(
-            cfg.openai_api_key,
-            cfg.openai_base_url,
-            cfg.openai_oauth_token,
-        )
+        api_key = resolve_openai_api_key(cfg.openai_api_key, cfg.openai_base_url)
         if not api_key:
-            raise ModelError(
-                "OpenAI auth not configured. Set OPENAI_API_KEY, "
-                "OPENPLANTER_OPENAI_API_KEY, OPENAI_OAUTH_TOKEN, "
-                "or OPENPLANTER_OPENAI_OAUTH_TOKEN."
-            )
+            raise ModelError("OpenAI key not configured.")
         models = list_openai_models(api_key=api_key, base_url=cfg.openai_base_url)
         if is_foundry_openai_base_url(cfg.openai_base_url):
             return [
@@ -156,11 +148,7 @@ def _resolve_model_name(cfg: AgentConfig) -> str:
 
 def build_model_factory(cfg: AgentConfig) -> ModelFactory | None:
     """Return a factory that creates models by name + optional reasoning effort."""
-    openai_api_key = resolve_openai_api_key(
-        cfg.openai_api_key,
-        cfg.openai_base_url,
-        cfg.openai_oauth_token,
-    )
+    openai_api_key = resolve_openai_api_key(cfg.openai_api_key, cfg.openai_base_url)
     anthropic_api_key = resolve_anthropic_api_key(cfg.anthropic_api_key, cfg.anthropic_base_url)
 
     def _factory(model_name: str, reasoning_effort: str | None = None) -> AnthropicModel | OpenAICompatibleModel:
@@ -276,11 +264,7 @@ def build_engine(cfg: AgentConfig) -> RLMEngine:
 
     _validate_model_provider(model_name, cfg.provider)
 
-    openai_api_key = resolve_openai_api_key(
-        cfg.openai_api_key,
-        cfg.openai_base_url,
-        cfg.openai_oauth_token,
-    )
+    openai_api_key = resolve_openai_api_key(cfg.openai_api_key, cfg.openai_base_url)
     anthropic_api_key = resolve_anthropic_api_key(cfg.anthropic_api_key, cfg.anthropic_base_url)
 
     if cfg.provider == "openai" and openai_api_key:
diff --git a/agent/config.py b/agent/config.py
index 9fb9c362..baf83ef6 100644
--- a/agent/config.py
+++ b/agent/config.py
@@ -24,7 +24,7 @@
 VALID_CHROME_MCP_CHANNELS: set[str] = {"stable", "beta", "dev", "canary"}
 
 PROVIDER_DEFAULT_MODELS: dict[str, str] = {
-    "openai": "azure-foundry/gpt-5.4",
+    "openai": "azure-foundry/gpt-5.3-codex",
     "anthropic": "anthropic-foundry/claude-opus-4-6",
     "openrouter": "anthropic/claude-sonnet-4-5",
     "cerebras": "qwen-3-235b-a22b-instruct-2507",
@@ -79,19 +79,12 @@ def is_foundry_anthropic_base_url(url: str) -> bool:
     return _normalize_base_url(url) == FOUNDRY_ANTHROPIC_BASE_URL
 
 
-def resolve_openai_api_key(
-    api_key: str | None,
-    base_url: str,
-    openai_oauth_token: str | None = None,
-) -> str | None:
+def resolve_openai_api_key(api_key: str | None, base_url: str) -> str | None:
     key = (api_key or "").strip() or None
-    if key == FOUNDRY_OPENAI_API_KEY_PLACEHOLDER:
-        key = None
+    if key == FOUNDRY_OPENAI_API_KEY_PLACEHOLDER and not is_foundry_openai_base_url(base_url):
+        return None
     if key:
         return key
-    token = (openai_oauth_token or "").strip() or None
-    if token:
-        return token
     if is_foundry_openai_base_url(base_url):
         return FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
     return None
@@ -144,7 +137,6 @@ class AgentConfig:
     tavily_base_url: str = "https://api.tavily.com"
     mistral_transcription_base_url: str = MISTRAL_TRANSCRIPTION_BASE_URL
     openai_api_key: str | None = None
-    openai_oauth_token: str | None = None
     anthropic_api_key: str | None = None
     openrouter_api_key: str | None = None
     cerebras_api_key: str | None = None
@@ -200,19 +192,11 @@ class AgentConfig:
     demo: bool = False
 
     def __post_init__(self) -> None:
-        self.openai_api_key = resolve_openai_api_key(
-            self.openai_api_key,
-            self.openai_base_url,
-            self.openai_oauth_token,
-        )
+        self.openai_api_key = resolve_openai_api_key(self.openai_api_key, self.openai_base_url)
         self.anthropic_api_key = resolve_anthropic_api_key(
             self.anthropic_api_key, self.anthropic_base_url
         )
-        self.api_key = resolve_openai_api_key(
-            self.api_key,
-            self.base_url,
-            self.openai_oauth_token,
-        )
+        self.api_key = resolve_openai_api_key(self.api_key, self.base_url)
         self.chrome_mcp_browser_url = normalize_chrome_mcp_browser_url(
             self.chrome_mcp_browser_url
         )
@@ -227,10 +211,6 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             os.getenv("OPENPLANTER_OPENAI_API_KEY")
             or os.getenv("OPENAI_API_KEY")
         )
-        openai_oauth_token = (
-            os.getenv("OPENPLANTER_OPENAI_OAUTH_TOKEN")
-            or os.getenv("OPENAI_OAUTH_TOKEN")
-        )
         anthropic_api_key = os.getenv("OPENPLANTER_ANTHROPIC_API_KEY") or os.getenv("ANTHROPIC_API_KEY")
         openrouter_api_key = os.getenv("OPENPLANTER_OPENROUTER_API_KEY") or os.getenv("OPENROUTER_API_KEY")
         cerebras_api_key = os.getenv("OPENPLANTER_CEREBRAS_API_KEY") or os.getenv("CEREBRAS_API_KEY")
@@ -253,11 +233,7 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             "OPENPLANTER_ANTHROPIC_BASE_URL",
             FOUNDRY_ANTHROPIC_BASE_URL,
         )
-        openai_api_key = resolve_openai_api_key(
-            openai_api_key,
-            openai_base_url,
-            openai_oauth_token,
-        )
+        openai_api_key = resolve_openai_api_key(openai_api_key, openai_base_url)
         anthropic_api_key = resolve_anthropic_api_key(anthropic_api_key, anthropic_base_url)
         zai_plan = normalize_zai_plan(os.getenv("OPENPLANTER_ZAI_PLAN", "paygo"))
         zai_paygo_base_url = os.getenv("OPENPLANTER_ZAI_PAYGO_BASE_URL", ZAI_PAYGO_BASE_URL)
@@ -312,7 +288,6 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
                 or MISTRAL_TRANSCRIPTION_BASE_URL,
             ),
             openai_api_key=openai_api_key,
-            openai_oauth_token=(openai_oauth_token or "").strip() or None,
             anthropic_api_key=anthropic_api_key,
             openrouter_api_key=openrouter_api_key,
             cerebras_api_key=cerebras_api_key,
diff --git a/agent/tui.py b/agent/tui.py
index af40aa06..9b34f3f0 100644
--- a/agent/tui.py
+++ b/agent/tui.py
@@ -126,12 +126,9 @@ def _build_splash() -> str:
     "sonnet4.6": "anthropic-foundry/claude-sonnet-4-6",
     "haiku": "anthropic-foundry/claude-haiku-4-5",
     "haiku4.5": "anthropic-foundry/claude-haiku-4-5",
-    "gpt5": "azure-foundry/gpt-5.4",
-    "gpt-5": "azure-foundry/gpt-5.4",
+    "gpt5": "azure-foundry/gpt-5.3-codex",
     "gpt5.3": "azure-foundry/gpt-5.3-codex",
-    "gpt-5.3": "azure-foundry/gpt-5.3-codex",
     "gpt5.4": "azure-foundry/gpt-5.4",
-    "gpt-5.4": "azure-foundry/gpt-5.4",
     "kimi": "azure-foundry/Kimi-K2.5",
     "gpt4": "gpt-4.1",
     "gpt4.1": "gpt-4.1",
diff --git a/openplanter-desktop/crates/op-core/src/builder.rs b/openplanter-desktop/crates/op-core/src/builder.rs
index 40bdf724..e2660db2 100644
--- a/openplanter-desktop/crates/op-core/src/builder.rs
+++ b/openplanter-desktop/crates/op-core/src/builder.rs
@@ -170,11 +170,10 @@ pub fn resolve_endpoint(cfg: &AgentConfig, provider: &str) -> Result<(String, St
             let key = resolve_openai_api_key(
                 cfg.openai_api_key.clone().or_else(|| cfg.api_key.clone()),
                 &cfg.openai_base_url,
-                cfg.openai_oauth_token.clone(),
             )
             .ok_or_else(|| {
                 ModelError::Message(
-                    "No OpenAI auth configured. Set OPENAI_API_KEY, OPENPLANTER_OPENAI_API_KEY, OPENAI_OAUTH_TOKEN, or OPENPLANTER_OPENAI_OAUTH_TOKEN.".into(),
+                    "No OpenAI API key. Set OPENAI_API_KEY or OPENPLANTER_OPENAI_API_KEY.".into(),
                 )
             })?;
             Ok((cfg.openai_base_url.clone(), key))
@@ -304,7 +303,7 @@ mod tests {
     fn test_infer_openai() {
         assert_eq!(infer_provider_for_model("gpt-5.2"), Some("openai"));
         assert_eq!(
-            infer_provider_for_model("azure-foundry/gpt-5.4"),
+            infer_provider_for_model("azure-foundry/gpt-5.3-codex"),
             Some("openai")
         );
         assert_eq!(infer_provider_for_model("o1-preview"), Some("openai"));
@@ -383,11 +382,14 @@ mod tests {
     #[test]
     fn test_resolve_model_name_explicit() {
         let cfg = AgentConfig {
-            model: "azure-foundry/gpt-5.4".into(),
+            model: "azure-foundry/gpt-5.3-codex".into(),
             provider: "openai".into(),
             ..Default::default()
         };
-        assert_eq!(resolve_model_name(&cfg).unwrap(), "azure-foundry/gpt-5.4");
+        assert_eq!(
+            resolve_model_name(&cfg).unwrap(),
+            "azure-foundry/gpt-5.3-codex"
+        );
     }
 
     #[test]
@@ -397,7 +399,10 @@ mod tests {
             provider: "openai".into(),
             ..Default::default()
         };
-        assert_eq!(resolve_model_name(&cfg).unwrap(), "azure-foundry/gpt-5.4");
+        assert_eq!(
+            resolve_model_name(&cfg).unwrap(),
+            "azure-foundry/gpt-5.3-codex"
+        );
     }
 
     // ── resolve_provider ──
@@ -536,17 +541,6 @@ mod tests {
         assert_eq!(key, "sk-openai");
     }
 
-    #[test]
-    fn test_resolve_endpoint_openai_uses_oauth_token_when_api_key_missing() {
-        let cfg = AgentConfig {
-            openai_api_key: Some(crate::config::FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.into()),
-            openai_oauth_token: Some("oauth-token".into()),
-            ..Default::default()
-        };
-        let (_, key) = resolve_endpoint(&cfg, "openai").unwrap();
-        assert_eq!(key, "oauth-token");
-    }
-
     #[test]
     fn test_resolve_endpoint_zai() {
         let cfg = AgentConfig {
diff --git a/openplanter-desktop/crates/op-core/src/config.rs b/openplanter-desktop/crates/op-core/src/config.rs
index f8698512..36d42af4 100644
--- a/openplanter-desktop/crates/op-core/src/config.rs
+++ b/openplanter-desktop/crates/op-core/src/config.rs
@@ -30,7 +30,7 @@ pub const CHROME_MCP_RPC_TIMEOUT_SEC: i64 = 45;
 pub static PROVIDER_DEFAULT_MODELS: LazyLock<HashMap<&'static str, &'static str>> =
     LazyLock::new(|| {
         HashMap::from([
-            ("openai", "azure-foundry/gpt-5.4"),
+            ("openai", "azure-foundry/gpt-5.3-codex"),
             ("anthropic", "anthropic-foundry/claude-opus-4-6"),
             ("openrouter", "anthropic/claude-sonnet-4-5"),
             ("cerebras", "qwen-3-235b-a22b-instruct-2507"),
@@ -120,42 +120,19 @@ pub fn is_foundry_anthropic_base_url(value: &str) -> bool {
     normalize_base_url(value) == FOUNDRY_ANTHROPIC_BASE_URL
 }
 
-pub fn has_real_openai_api_key(api_key: Option<&str>) -> bool {
-    api_key
-        .map(str::trim)
-        .filter(|value| !value.is_empty())
-        .is_some_and(|value| value != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER)
-}
-
-pub fn has_openai_auth(api_key: Option<&str>, openai_oauth_token: Option<&str>) -> bool {
-    has_real_openai_api_key(api_key)
-        || openai_oauth_token
-            .map(str::trim)
-            .filter(|value| !value.is_empty())
-            .is_some()
-}
-
-pub fn resolve_openai_api_key(
-    api_key: Option<String>,
-    base_url: &str,
-    openai_oauth_token: Option<String>,
-) -> Option<String> {
+pub fn resolve_openai_api_key(api_key: Option<String>, base_url: &str) -> Option<String> {
     let normalized = api_key
         .as_deref()
         .map(str::trim)
         .filter(|value| !value.is_empty())
         .map(str::to_string);
-    let real_key = normalized.filter(|value| value != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER);
-    if real_key.is_some() {
-        return real_key;
+    if normalized.as_deref() == Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER)
+        && !is_foundry_openai_base_url(base_url)
+    {
+        return None;
     }
-    let token = openai_oauth_token
-        .as_deref()
-        .map(str::trim)
-        .filter(|value| !value.is_empty())
-        .map(str::to_string);
-    if token.is_some() {
-        return token;
+    if normalized.is_some() {
+        return normalized;
     }
     if is_foundry_openai_base_url(base_url) {
         return Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.to_string());
@@ -225,7 +202,6 @@ pub struct AgentConfig {
     // API keys
     pub api_key: Option<String>,
     pub openai_api_key: Option<String>,
-    pub openai_oauth_token: Option<String>,
     pub anthropic_api_key: Option<String>,
     pub openrouter_api_key: Option<String>,
     pub cerebras_api_key: Option<String>,
@@ -303,7 +279,6 @@ impl Default for AgentConfig {
             mistral_transcription_base_url: MISTRAL_TRANSCRIPTION_BASE_URL.into(),
             api_key: Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.into()),
             openai_api_key: Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.into()),
-            openai_oauth_token: None,
             anthropic_api_key: Some(FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER.into()),
             openrouter_api_key: None,
             cerebras_api_key: None,
@@ -363,10 +338,10 @@ impl AgentConfig {
     pub fn from_env(workspace: impl AsRef<Path>) -> Self {
         let ws = dunce_canonicalize(workspace.as_ref());
 
-        let openai_api_key =
-            env_opt("OPENPLANTER_OPENAI_API_KEY").or_else(|| env_opt("OPENAI_API_KEY"));
-        let openai_oauth_token =
-            env_opt("OPENPLANTER_OPENAI_OAUTH_TOKEN").or_else(|| env_opt("OPENAI_OAUTH_TOKEN"));
+        let openai_api_key = env_opt("OPENPLANTER_OPENAI_API_KEY")
+            .or_else(|| env_opt("OPENAI_API_KEY"))
+            .or_else(|| env_opt("OPENPLANTER_OPENAI_OAUTH_TOKEN"))
+            .or_else(|| env_opt("OPENAI_OAUTH_TOKEN"));
 
         let anthropic_api_key =
             env_opt("OPENPLANTER_ANTHROPIC_API_KEY").or_else(|| env_opt("ANTHROPIC_API_KEY"));
@@ -399,8 +374,7 @@ impl AgentConfig {
             .unwrap_or_else(|| FOUNDRY_OPENAI_BASE_URL.into());
         let anthropic_base_url =
             env_or("OPENPLANTER_ANTHROPIC_BASE_URL", FOUNDRY_ANTHROPIC_BASE_URL);
-        let openai_api_key =
-            resolve_openai_api_key(openai_api_key, &openai_base_url, openai_oauth_token.clone());
+        let openai_api_key = resolve_openai_api_key(openai_api_key, &openai_base_url);
         let anthropic_api_key = resolve_anthropic_api_key(anthropic_api_key, &anthropic_base_url);
 
         let reasoning_effort_raw = env_or("OPENPLANTER_REASONING_EFFORT", "high")
@@ -464,7 +438,6 @@ impl AgentConfig {
                 .or_else(|| env_opt("MISTRAL_BASE_URL"))
                 .unwrap_or_else(|| MISTRAL_TRANSCRIPTION_BASE_URL.into()),
             openai_api_key,
-            openai_oauth_token,
             anthropic_api_key,
             openrouter_api_key,
             cerebras_api_key,
@@ -641,7 +614,7 @@ mod tests {
     fn test_provider_default_models() {
         assert_eq!(
             PROVIDER_DEFAULT_MODELS.get("openai"),
-            Some(&"azure-foundry/gpt-5.4")
+            Some(&"azure-foundry/gpt-5.3-codex")
         );
         assert_eq!(
             PROVIDER_DEFAULT_MODELS.get("anthropic"),
@@ -669,8 +642,6 @@ mod tests {
             "OPENPLANTER_REASONING_EFFORT",
             "OPENPLANTER_OPENAI_API_KEY",
             "OPENAI_API_KEY",
-            "OPENPLANTER_OPENAI_OAUTH_TOKEN",
-            "OPENAI_OAUTH_TOKEN",
             "OPENPLANTER_OPENAI_BASE_URL",
             "OPENPLANTER_BASE_URL",
             "OPENPLANTER_ANTHROPIC_API_KEY",
@@ -781,7 +752,7 @@ mod tests {
         unsafe {
             // --- Phase 2: test custom values ---
             env::set_var("OPENPLANTER_PROVIDER", "openai");
-            env::set_var("OPENPLANTER_MODEL", "azure-foundry/gpt-5.4");
+            env::set_var("OPENPLANTER_MODEL", "azure-foundry/gpt-5.3-codex");
             env::set_var("OPENPLANTER_REASONING_EFFORT", "low");
             env::set_var("OPENPLANTER_MAX_DEPTH", "8");
             env::set_var("OPENPLANTER_BUDGET_EXTENSION_ENABLED", "false");
@@ -825,7 +796,7 @@ mod tests {
 
         let cfg = AgentConfig::from_env("/tmp");
         assert_eq!(cfg.provider, "openai");
-        assert_eq!(cfg.model, "azure-foundry/gpt-5.4");
+        assert_eq!(cfg.model, "azure-foundry/gpt-5.3-codex");
         assert_eq!(cfg.reasoning_effort, Some("low".into()));
         assert_eq!(cfg.max_depth, 8);
         assert!(!cfg.budget_extension_enabled);
@@ -862,25 +833,6 @@ mod tests {
         assert_eq!(cfg.rate_limit_retry_after_cap_sec, 90.0);
 
         // Restore original values
-        unsafe {
-            env::remove_var("OPENAI_API_KEY");
-            env::set_var("OPENAI_OAUTH_TOKEN", "oauth-token");
-        }
-
-        let cfg = AgentConfig::from_env("/tmp");
-        assert_eq!(cfg.openai_oauth_token.as_deref(), Some("oauth-token"));
-        assert_eq!(cfg.openai_api_key.as_deref(), Some("oauth-token"));
-        assert_eq!(cfg.api_key.as_deref(), Some("oauth-token"));
-
-        unsafe {
-            env::set_var("OPENAI_API_KEY", "sk-test456");
-        }
-
-        let cfg = AgentConfig::from_env("/tmp");
-        assert_eq!(cfg.openai_oauth_token.as_deref(), Some("oauth-token"));
-        assert_eq!(cfg.openai_api_key.as_deref(), Some("sk-test456"));
-        assert_eq!(cfg.api_key.as_deref(), Some("sk-test456"));
-
         for (k, v) in saved {
             unsafe {
                 match v {
@@ -909,34 +861,16 @@ mod tests {
         assert!(is_foundry_openai_base_url(FOUNDRY_OPENAI_BASE_URL));
         assert!(is_foundry_anthropic_base_url(FOUNDRY_ANTHROPIC_BASE_URL));
         assert_eq!(
-            resolve_openai_api_key(None, FOUNDRY_OPENAI_BASE_URL, None).as_deref(),
+            resolve_openai_api_key(None, FOUNDRY_OPENAI_BASE_URL).as_deref(),
             Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER)
         );
-        assert_eq!(
-            resolve_openai_api_key(
-                Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.to_string()),
-                FOUNDRY_OPENAI_BASE_URL,
-                Some("oauth-token".to_string()),
-            )
-            .as_deref(),
-            Some("oauth-token")
-        );
-        assert_eq!(
-            resolve_openai_api_key(
-                Some("sk-openai".to_string()),
-                FOUNDRY_OPENAI_BASE_URL,
-                Some("oauth-token".to_string()),
-            )
-            .as_deref(),
-            Some("sk-openai")
-        );
         assert_eq!(
             resolve_anthropic_api_key(None, FOUNDRY_ANTHROPIC_BASE_URL).as_deref(),
             Some(FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER)
         );
         assert_eq!(
-            strip_foundry_model_prefix("azure-foundry/gpt-5.4"),
-            "gpt-5.4"
+            strip_foundry_model_prefix("azure-foundry/gpt-5.3-codex"),
+            "gpt-5.3-codex"
         );
         assert_eq!(
             strip_foundry_model_prefix("anthropic-foundry/claude-opus-4-6"),
diff --git a/openplanter-desktop/crates/op-core/src/credentials.rs b/openplanter-desktop/crates/op-core/src/credentials.rs
index 9dccc7a2..c36e7dce 100644
--- a/openplanter-desktop/crates/op-core/src/credentials.rs
+++ b/openplanter-desktop/crates/op-core/src/credentials.rs
@@ -172,11 +172,7 @@ pub fn parse_env_file(path: &Path) -> CredentialBundle {
 
     CredentialBundle {
         openai_api_key: get_key(&env_map, "OPENAI_API_KEY", "OPENPLANTER_OPENAI_API_KEY"),
-        openai_oauth_token: get_key(
-            &env_map,
-            "OPENAI_OAUTH_TOKEN",
-            "OPENPLANTER_OPENAI_OAUTH_TOKEN",
-        ),
+        openai_oauth_token: get_key(&env_map, "OPENAI_OAUTH_TOKEN", "OPENPLANTER_OPENAI_OAUTH_TOKEN"),
         anthropic_api_key: get_key(
             &env_map,
             "ANTHROPIC_API_KEY",
diff --git a/openplanter-desktop/crates/op-core/src/model/openai.rs b/openplanter-desktop/crates/op-core/src/model/openai.rs
index b8b5c20e..b3fb5ad4 100644
--- a/openplanter-desktop/crates/op-core/src/model/openai.rs
+++ b/openplanter-desktop/crates/op-core/src/model/openai.rs
@@ -762,7 +762,7 @@ mod tests {
     fn test_reasoning_model_gpt5() {
         assert!(make_model("gpt-5.2", None).is_reasoning_model());
         assert!(make_model("gpt-5", None).is_reasoning_model());
-        assert!(make_model("azure-foundry/gpt-5.4", None).is_reasoning_model());
+        assert!(make_model("azure-foundry/gpt-5.3-codex", None).is_reasoning_model());
     }
 
     #[test]
@@ -848,12 +848,12 @@ mod tests {
 
     #[test]
     fn test_payload_strips_foundry_prefix() {
-        let model = make_model("azure-foundry/gpt-5.4", Some("high"));
+        let model = make_model("azure-foundry/gpt-5.3-codex", Some("high"));
         let msgs = vec![Message::User {
             content: "Hi".to_string(),
         }];
         let payload = model.build_payload(&msgs, &[], true);
-        assert_eq!(payload["model"], "gpt-5.4");
+        assert_eq!(payload["model"], "gpt-5.3-codex");
     }
 
     #[test]
diff --git a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
index 8543afff..4e0adf27 100644
--- a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
+++ b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
@@ -1007,7 +1007,7 @@ async fn test_solve_missing_key_emits_error() {
         api_key: None,
         openai_api_key: None,
         demo: false,
-        // No OpenAI auth set
+        // No API key set
         ..Default::default()
     };
 
@@ -1016,8 +1016,8 @@ async fn test_solve_missing_key_emits_error() {
 
     let recorded = errors.lock().unwrap().clone();
     assert!(
-        recorded.iter().any(|e| e.contains("OpenAI auth")),
-        "should emit error about missing OpenAI auth, got: {:?}",
+        recorded.iter().any(|e| e.contains("API key")),
+        "should emit error about missing API key, got: {:?}",
         recorded
     );
 }
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/config.rs b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
index e303b6a3..620703da 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/config.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
@@ -1,6 +1,6 @@
 use crate::state::AppState;
 use op_core::config::{
-    has_openai_auth, normalize_chrome_mcp_browser_url, normalize_chrome_mcp_channel,
+    normalize_chrome_mcp_browser_url, normalize_chrome_mcp_channel,
     normalize_web_search_provider, normalize_zai_plan, resolve_zai_base_url,
 };
 use op_core::credentials::credentials_from_env;
@@ -152,8 +152,8 @@ pub async fn update_config(
 fn known_models_for_provider(provider: &str) -> Vec<ModelInfo> {
     let models: Vec<(&str, &str)> = match provider {
         "openai" => vec![
-            ("azure-foundry/gpt-5.4", "GPT-5.4 (Foundry)"),
             ("azure-foundry/gpt-5.3-codex", "GPT-5.3 Codex (Foundry)"),
+            ("azure-foundry/gpt-5.4", "GPT-5.4 (Foundry)"),
             ("azure-foundry/Kimi-K2.5", "Kimi K2.5 (Foundry)"),
         ],
         "anthropic" => vec![
@@ -244,13 +244,7 @@ pub async fn save_settings(
 /// Build credential status from config: which providers/services have API keys configured.
 pub fn build_credential_status(cfg: &op_core::config::AgentConfig) -> HashMap<String, bool> {
     let mut status = HashMap::new();
-    status.insert(
-        "openai".to_string(),
-        has_openai_auth(
-            cfg.openai_api_key.as_deref(),
-            cfg.openai_oauth_token.as_deref(),
-        ),
-    );
+    status.insert("openai".to_string(), cfg.openai_api_key.is_some());
     status.insert("anthropic".to_string(), cfg.anthropic_api_key.is_some());
     status.insert("openrouter".to_string(), cfg.openrouter_api_key.is_some());
     status.insert("cerebras".to_string(), cfg.cerebras_api_key.is_some());
@@ -279,13 +273,9 @@ pub async fn get_credentials_status(
     let mut status = HashMap::new();
     status.insert(
         "openai".to_string(),
-        has_openai_auth(
-            cfg.openai_api_key.as_deref(),
-            cfg.openai_oauth_token.as_deref(),
-        ) || has_openai_auth(
-            env_creds.openai_api_key.as_deref(),
-            env_creds.openai_oauth_token.as_deref(),
-        ),
+        cfg.openai_api_key.is_some()
+            || env_creds.openai_api_key.is_some()
+            || env_creds.openai_oauth_token.is_some(),
     );
     status.insert(
         "anthropic".to_string(),
@@ -427,7 +417,6 @@ mod tests {
         // Force all keys to None
         let mut cfg = cfg;
         cfg.openai_api_key = None;
-        cfg.openai_oauth_token = None;
         cfg.anthropic_api_key = None;
         cfg.openrouter_api_key = None;
         cfg.cerebras_api_key = None;
@@ -455,7 +444,6 @@ mod tests {
     fn test_cred_status_openai_set() {
         let mut cfg = op_core::config::AgentConfig::from_env("/nonexistent");
         cfg.openai_api_key = Some("sk-test".to_string());
-        cfg.openai_oauth_token = None;
         cfg.anthropic_api_key = None;
         cfg.openrouter_api_key = None;
         cfg.cerebras_api_key = None;
@@ -469,7 +457,6 @@ mod tests {
     fn test_cred_status_anthropic_set() {
         let mut cfg = op_core::config::AgentConfig::from_env("/nonexistent");
         cfg.openai_api_key = None;
-        cfg.openai_oauth_token = None;
         cfg.anthropic_api_key = Some("sk-ant-test".to_string());
         cfg.openrouter_api_key = None;
         cfg.cerebras_api_key = None;
@@ -482,7 +469,6 @@ mod tests {
     fn test_cred_status_ollama_always_true() {
         let mut cfg = op_core::config::AgentConfig::from_env("/nonexistent");
         cfg.openai_api_key = None;
-        cfg.openai_oauth_token = None;
         cfg.anthropic_api_key = None;
         cfg.openrouter_api_key = None;
         cfg.cerebras_api_key = None;
@@ -495,7 +481,6 @@ mod tests {
     fn test_cred_status_all_set() {
         let mut cfg = op_core::config::AgentConfig::from_env("/nonexistent");
         cfg.openai_api_key = Some("k1".to_string());
-        cfg.openai_oauth_token = Some("oauth-token".to_string());
         cfg.anthropic_api_key = Some("k2".to_string());
         cfg.openrouter_api_key = Some("k3".to_string());
         cfg.cerebras_api_key = Some("k4".to_string());
@@ -522,22 +507,4 @@ mod tests {
             "should have 12 entries (6 providers + 6 services)"
         );
     }
-
-    #[test]
-    fn test_cred_status_openai_oauth_counts_as_configured() {
-        let mut cfg = op_core::config::AgentConfig::from_env("/nonexistent");
-        cfg.openai_api_key = None;
-        cfg.openai_oauth_token = Some("oauth-token".to_string());
-        let status = build_credential_status(&cfg);
-        assert_eq!(status["openai"], true);
-    }
-
-    #[test]
-    fn test_cred_status_openai_placeholder_does_not_count() {
-        let mut cfg = op_core::config::AgentConfig::from_env("/nonexistent");
-        cfg.openai_api_key = Some(op_core::config::FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.to_string());
-        cfg.openai_oauth_token = None;
-        let status = build_credential_status(&cfg);
-        assert_eq!(status["openai"], false);
-    }
 }
diff --git a/openplanter-desktop/crates/op-tauri/src/state.rs b/openplanter-desktop/crates/op-tauri/src/state.rs
index cb431fa4..05253e76 100644
--- a/openplanter-desktop/crates/op-tauri/src/state.rs
+++ b/openplanter-desktop/crates/op-tauri/src/state.rs
@@ -509,7 +509,6 @@ mod tests {
     fn empty_cfg() -> AgentConfig {
         let mut cfg = AgentConfig::from_env("/nonexistent");
         cfg.openai_api_key = None;
-        cfg.openai_oauth_token = None;
         cfg.anthropic_api_key = None;
         cfg.openrouter_api_key = None;
         cfg.cerebras_api_key = None;
@@ -547,33 +546,6 @@ mod tests {
         assert_eq!(cfg.openai_api_key, Some("existing".to_string()));
     }
 
-    #[test]
-    fn test_merge_prefers_real_openai_key_over_oauth() {
-        let mut cfg = empty_cfg();
-        let env_creds = CredentialBundle {
-            openai_api_key: Some("env-key".to_string()),
-            openai_oauth_token: Some("oauth-token".to_string()),
-            ..Default::default()
-        };
-        merge_credentials_into_config(&mut cfg, &env_creds, &CredentialBundle::default());
-        assert_eq!(cfg.openai_oauth_token, Some("oauth-token".to_string()));
-        assert_eq!(cfg.openai_api_key, Some("env-key".to_string()));
-        assert_eq!(cfg.api_key, Some("env-key".to_string()));
-    }
-
-    #[test]
-    fn test_merge_uses_oauth_when_only_placeholder_exists() {
-        let mut cfg = AgentConfig::default();
-        let env_creds = CredentialBundle {
-            openai_oauth_token: Some("oauth-token".to_string()),
-            ..Default::default()
-        };
-        merge_credentials_into_config(&mut cfg, &env_creds, &CredentialBundle::default());
-        assert_eq!(cfg.openai_oauth_token, Some("oauth-token".to_string()));
-        assert_eq!(cfg.openai_api_key, Some("oauth-token".to_string()));
-        assert_eq!(cfg.api_key, Some("oauth-token".to_string()));
-    }
-
     #[test]
     fn test_merge_env_over_file() {
         let mut cfg = empty_cfg();
diff --git a/openplanter-desktop/frontend/src/api/invoke.test.ts b/openplanter-desktop/frontend/src/api/invoke.test.ts
index ad980cf2..0c1b27f7 100644
--- a/openplanter-desktop/frontend/src/api/invoke.test.ts
+++ b/openplanter-desktop/frontend/src/api/invoke.test.ts
@@ -70,10 +70,10 @@ describe("invoke wrappers", () => {
 
   it("updateConfig sends partial and returns config", async () => {
     __setHandler("update_config", ({ partial }: any) => {
-      expect(partial.model).toBe("azure-foundry/gpt-5.4");
+      expect(partial.model).toBe("azure-foundry/gpt-5.3-codex");
       return {
         provider: "openai",
-        model: "azure-foundry/gpt-5.4",
+        model: "azure-foundry/gpt-5.3-codex",
         zai_plan: "coding",
         workspace: ".",
         session_id: null,
@@ -85,8 +85,8 @@ describe("invoke wrappers", () => {
         demo: false,
       };
     });
-    const config = await updateConfig({ model: "azure-foundry/gpt-5.4" });
-    expect(config.model).toBe("azure-foundry/gpt-5.4");
+    const config = await updateConfig({ model: "azure-foundry/gpt-5.3-codex" });
+    expect(config.model).toBe("azure-foundry/gpt-5.3-codex");
     expect(config.zai_plan).toBe("coding");
     expect(config.web_search_provider).toBe("firecrawl");
   });
@@ -96,15 +96,15 @@ describe("invoke wrappers", () => {
       expect(provider).toBe("openai");
       return [
         {
-          id: "azure-foundry/gpt-5.4",
-          name: "GPT-5.4 (Foundry)",
+          id: "azure-foundry/gpt-5.3-codex",
+          name: "GPT-5.3 Codex (Foundry)",
           provider: "openai",
         },
       ];
     });
     const models = await listModels("openai");
     expect(models).toHaveLength(1);
-    expect(models[0].id).toBe("azure-foundry/gpt-5.4");
+    expect(models[0].id).toBe("azure-foundry/gpt-5.3-codex");
   });
 
   it("saveSettings sends settings object", async () => {
diff --git a/openplanter-desktop/frontend/src/commands/model.test.ts b/openplanter-desktop/frontend/src/commands/model.test.ts
index efa2e572..ef5edff6 100644
--- a/openplanter-desktop/frontend/src/commands/model.test.ts
+++ b/openplanter-desktop/frontend/src/commands/model.test.ts
@@ -17,7 +17,7 @@ describe("inferProvider", () => {
 
   it("gpt returns openai", () => {
     expect(inferProvider("gpt-5.2")).toBe("openai");
-    expect(inferProvider("azure-foundry/gpt-5.4")).toBe("openai");
+    expect(inferProvider("azure-foundry/gpt-5.3-codex")).toBe("openai");
   });
 
   it("o1 returns openai", () => {
@@ -68,25 +68,13 @@ describe("MODEL_ALIASES", () => {
   });
 
   it("gpt5 alias", () => {
-    expect(MODEL_ALIASES["gpt5"]).toBe("azure-foundry/gpt-5.4");
-  });
-
-  it("gpt-5 alias", () => {
-    expect(MODEL_ALIASES["gpt-5"]).toBe("azure-foundry/gpt-5.4");
-  });
-
-  it("gpt-5.3 alias", () => {
-    expect(MODEL_ALIASES["gpt-5.3"]).toBe("azure-foundry/gpt-5.3-codex");
+    expect(MODEL_ALIASES["gpt5"]).toBe("azure-foundry/gpt-5.3-codex");
   });
 
   it("gpt-5.4 alias", () => {
     expect(MODEL_ALIASES["gpt-5.4"]).toBe("azure-foundry/gpt-5.4");
   });
 
-  it("gpt5.4 alias", () => {
-    expect(MODEL_ALIASES["gpt5.4"]).toBe("azure-foundry/gpt-5.4");
-  });
-
   it("zai alias", () => {
     expect(MODEL_ALIASES["zai"]).toBe("glm-5");
   });
@@ -158,29 +146,4 @@ describe("handleModelCommand", () => {
     expect(appState.get().model).toBe("glm-5");
     expect(appState.get().zaiPlan).toBe("coding");
   });
-
-  it("gpt5 alias switches to gpt-5.4", async () => {
-    __setHandler("update_config", ({ partial }: { partial: Record<string, string> }) => {
-      expect(partial.model).toBe("azure-foundry/gpt-5.4");
-      expect(partial.provider).toBe("openai");
-      return {
-        provider: "openai",
-        model: "azure-foundry/gpt-5.4",
-        zai_plan: "paygo",
-        workspace: ".",
-        session_id: null,
-        recursive: true,
-        max_depth: 4,
-        max_steps_per_call: 100,
-        reasoning_effort: "high",
-        web_search_provider: "exa",
-        demo: false,
-      };
-    });
-
-    const result = await handleModelCommand("gpt5");
-    expect(result.lines).toContain("Switched to openai/azure-foundry/gpt-5.4");
-    expect(appState.get().provider).toBe("openai");
-    expect(appState.get().model).toBe("azure-foundry/gpt-5.4");
-  });
 });
diff --git a/openplanter-desktop/frontend/src/commands/model.ts b/openplanter-desktop/frontend/src/commands/model.ts
index 91900662..68b45bab 100644
--- a/openplanter-desktop/frontend/src/commands/model.ts
+++ b/openplanter-desktop/frontend/src/commands/model.ts
@@ -11,11 +11,10 @@ export const MODEL_ALIASES: Record<string, string> = {
   "sonnet-4": "anthropic-foundry/claude-sonnet-4-6",
   "haiku-4": "anthropic-foundry/claude-haiku-4-5",
   "opus-4": "anthropic-foundry/claude-opus-4-6",
-  gpt5: "azure-foundry/gpt-5.4",
-  "gpt-5": "azure-foundry/gpt-5.4",
-  "gpt5.3": "azure-foundry/gpt-5.3-codex",
+  gpt5: "azure-foundry/gpt-5.3-codex",
+  "gpt-5": "azure-foundry/gpt-5.3-codex",
   "gpt-5.3": "azure-foundry/gpt-5.3-codex",
-  "gpt5.4": "azure-foundry/gpt-5.4",
+  gpt54: "azure-foundry/gpt-5.4",
   "gpt-5.4": "azure-foundry/gpt-5.4",
   kimi: "azure-foundry/Kimi-K2.5",
   gpt4o: "gpt-4o",
diff --git a/tests/test_coverage_gaps.py b/tests/test_coverage_gaps.py
index 7ab3444e..72724b6b 100644
--- a/tests/test_coverage_gaps.py
+++ b/tests/test_coverage_gaps.py
@@ -281,23 +281,6 @@ def test_api_keys_from_env(self) -> None:
         self.assertEqual(cfg.brave_api_key, "brave")
         self.assertEqual(cfg.tavily_api_key, "tavily")
 
-    def test_openai_oauth_token_from_env_without_api_key(self) -> None:
-        env = {"OPENAI_OAUTH_TOKEN": "oauth-token"}
-        with patch.dict(os.environ, env, clear=True):
-            cfg = AgentConfig.from_env("/tmp/test-ws")
-        self.assertEqual(cfg.openai_oauth_token, "oauth-token")
-        self.assertEqual(cfg.openai_api_key, "oauth-token")
-
-    def test_openai_api_key_beats_oauth_token(self) -> None:
-        env = {
-            "OPENAI_API_KEY": "oa",
-            "OPENAI_OAUTH_TOKEN": "oauth-token",
-        }
-        with patch.dict(os.environ, env, clear=True):
-            cfg = AgentConfig.from_env("/tmp/test-ws")
-        self.assertEqual(cfg.openai_oauth_token, "oauth-token")
-        self.assertEqual(cfg.openai_api_key, "oa")
-
     def test_foundry_placeholder_keys_disabled_for_public_endpoints(self) -> None:
         env = {
             "OPENPLANTER_OPENAI_BASE_URL": "https://api.openai.com/v1",
@@ -382,7 +365,7 @@ def test_explicit_model_returned(self) -> None:
 
     def test_empty_model_uses_provider_default(self) -> None:
         cfg = AgentConfig(workspace=Path("/tmp"), provider="openai", model="")
-        self.assertEqual(_resolve_model_name(cfg), "azure-foundry/gpt-5.4")
+        self.assertEqual(_resolve_model_name(cfg), "azure-foundry/gpt-5.3-codex")
 
     def test_empty_model_anthropic_default(self) -> None:
         cfg = AgentConfig(workspace=Path("/tmp"), provider="anthropic", model="")
@@ -416,7 +399,7 @@ def test_openai_provider_with_key(self) -> None:
             cfg = AgentConfig(
                 workspace=Path(tmpdir),
                 provider="openai",
-                model="azure-foundry/gpt-5.4",
+                model="azure-foundry/gpt-5.3-codex",
                 openai_api_key="test-key",
             )
             engine = build_engine(cfg)
@@ -438,7 +421,7 @@ def test_no_key_fallback_to_echo(self) -> None:
             cfg = AgentConfig(
                 workspace=Path(tmpdir),
                 provider="openai",
-                model="azure-foundry/gpt-5.4",
+                model="azure-foundry/gpt-5.3-codex",
                 openai_base_url="https://api.openai.com/v1",
                 openai_api_key=None,
                 )
diff --git a/tests/test_model.py b/tests/test_model.py
index db5c97cb..0631eb19 100644
--- a/tests/test_model.py
+++ b/tests/test_model.py
@@ -55,14 +55,14 @@ def fake_http_json(url, method, headers, payload=None, timeout_sec=90):  # type:
 
         with patch("agent.model._http_stream_sse", mock_openai_stream(fake_http_json)):
             model = OpenAICompatibleModel(
-                model="azure-foundry/gpt-5.4",
+                model="azure-foundry/gpt-5.3-codex",
                 api_key="k",
                 reasoning_effort="high",
             )
             conv = model.create_conversation("system", "user msg")
             turn = model.complete(conv)
             self.assertEqual(turn.text, "ok")
-            self.assertEqual(captured["payload"]["model"], "gpt-5.4")
+            self.assertEqual(captured["payload"]["model"], "gpt-5.3-codex")
 
     def test_openai_payload_includes_thinking_type(self) -> None:
         captured: dict = {}
diff --git a/tests/test_settings.py b/tests/test_settings.py
index afc8d763..c4963faa 100644
--- a/tests/test_settings.py
+++ b/tests/test_settings.py
@@ -214,7 +214,7 @@ def test_gpt_is_openai(self) -> None:
         self.assertEqual(infer_provider_for_model("gpt-4.1-mini"), "openai")
         self.assertEqual(infer_provider_for_model("GPT-4o"), "openai")
         self.assertEqual(
-            infer_provider_for_model("azure-foundry/gpt-5.4"),
+            infer_provider_for_model("azure-foundry/gpt-5.3-codex"),
             "openai",
         )
 

From 6b15772ae6edec6e2973c23caad3135c07755d68 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 15:43:53 -0400
Subject: [PATCH 45/58] Revert "Add GPT-5.4 alias and ChatGPT OAuth support for
 OpenAI auth"

This reverts commit a384928a7c4fe9ac7f892308549664cb1161eb7e.
---
 README.md                                       |  4 +---
 agent/__main__.py                               | 16 ++--------------
 agent/credentials.py                            | 17 -----------------
 agent/tui.py                                    |  1 -
 .../crates/op-core/src/config.rs                |  6 ++----
 .../crates/op-core/src/credentials.rs           |  7 -------
 .../crates/op-tauri/src/commands/config.rs      |  5 +----
 .../frontend/src/commands/model.test.ts         |  4 ----
 .../frontend/src/commands/model.ts              |  2 --
 tests/test_credentials.py                       |  3 ---
 10 files changed, 6 insertions(+), 59 deletions(-)

diff --git a/README.md b/README.md
index 03eb90e7..48f4ecfb 100644
--- a/README.md
+++ b/README.md
@@ -93,7 +93,7 @@ The container mounts `./workspace` as the agent's working directory.
 
 | Provider | Default Model | Env Var |
 |----------|---------------|---------|
-| OpenAI | `azure-foundry/gpt-5.3-codex` | `OPENAI_API_KEY` or `OPENAI_OAUTH_TOKEN` |
+| OpenAI | `azure-foundry/gpt-5.3-codex` | `OPENAI_API_KEY` |
 | Anthropic | `anthropic-foundry/claude-opus-4-6` | `ANTHROPIC_API_KEY` |
 | OpenRouter | `anthropic/claude-sonnet-4-5` | `OPENROUTER_API_KEY` |
 | Cerebras | `qwen-3-235b-a22b-instruct-2507` | `CEREBRAS_API_KEY` |
@@ -105,8 +105,6 @@ OpenAI-compatible requests now default to the Azure Foundry proxy at
 default to the Anthropic Foundry proxy at
 `https://foundry-proxy.cheetah-koi.ts.net/anthropic/v1`.
 
-For OpenAI-compatible access, you can authenticate with either a standard API key or a ChatGPT OAuth token (Plus/Pro/Teams): `OPENAI_OAUTH_TOKEN` (or `OPENPLANTER_OPENAI_OAUTH_TOKEN`).
-
 ### Local Models (Ollama)
 
 [Ollama](https://ollama.com) runs models locally with no API key. Install Ollama, pull a model (`ollama pull llama3.2`), then:
diff --git a/agent/__main__.py b/agent/__main__.py
index eaf74ad9..b6a6bf2a 100644
--- a/agent/__main__.py
+++ b/agent/__main__.py
@@ -91,10 +91,6 @@ def build_parser() -> argparse.ArgumentParser:
     parser.add_argument("--base-url", help="Provider base URL override for this run.")
     parser.add_argument("--api-key", help="Legacy API key alias (maps to OpenAI).")
     parser.add_argument("--openai-api-key", help="OpenAI API key override.")
-    parser.add_argument(
-        "--openai-oauth-token",
-        help="ChatGPT OAuth token (Plus/Pro/Teams) override for OpenAI-compatible endpoints.",
-    )
     parser.add_argument("--anthropic-api-key", help="Anthropic API key override.")
     parser.add_argument("--openrouter-api-key", help="OpenRouter API key override.")
     parser.add_argument("--cerebras-api-key", help="Cerebras API key override.")
@@ -226,7 +222,7 @@ def _resolve_provider(requested: str, creds: CredentialBundle) -> str:
         return requested
     if requested == "all":
         return "all"
-    if creds.openai_api_key or creds.openai_oauth_token:
+    if creds.openai_api_key:
         return "openai"
     if creds.anthropic_api_key:
         return "anthropic"
@@ -277,7 +273,6 @@ def _load_credentials(
 
     creds = CredentialBundle(
         openai_api_key=user_creds.openai_api_key,
-        openai_oauth_token=user_creds.openai_oauth_token,
         anthropic_api_key=user_creds.anthropic_api_key,
         openrouter_api_key=user_creds.openrouter_api_key,
         cerebras_api_key=user_creds.cerebras_api_key,
@@ -294,8 +289,6 @@ def _load_credentials(
     stored = store.load()
     if stored.openai_api_key:
         creds.openai_api_key = stored.openai_api_key
-    if stored.openai_oauth_token:
-        creds.openai_oauth_token = stored.openai_oauth_token
     if stored.anthropic_api_key:
         creds.anthropic_api_key = stored.anthropic_api_key
     if stored.openrouter_api_key:
@@ -320,8 +313,6 @@ def _load_credentials(
     env_creds = credentials_from_env()
     if env_creds.openai_api_key:
         creds.openai_api_key = env_creds.openai_api_key
-    if env_creds.openai_oauth_token:
-        creds.openai_oauth_token = env_creds.openai_oauth_token
     if env_creds.anthropic_api_key:
         creds.anthropic_api_key = env_creds.anthropic_api_key
     if env_creds.openrouter_api_key:
@@ -351,8 +342,6 @@ def _load_credentials(
         creds.openai_api_key = args.api_key.strip() or creds.openai_api_key
     if args.openai_api_key:
         creds.openai_api_key = args.openai_api_key.strip() or creds.openai_api_key
-    if args.openai_oauth_token:
-        creds.openai_oauth_token = args.openai_oauth_token.strip() or creds.openai_oauth_token
     if args.anthropic_api_key:
         creds.anthropic_api_key = args.anthropic_api_key.strip() or creds.anthropic_api_key
     if args.openrouter_api_key:
@@ -407,8 +396,7 @@ def _apply_runtime_overrides(cfg: AgentConfig, args: argparse.Namespace, creds:
         cfg.provider = args.provider
     cfg.provider = _resolve_provider(cfg.provider, creds)
 
-    effective_openai_key = creds.openai_api_key or creds.openai_oauth_token
-    cfg.openai_api_key = resolve_openai_api_key(effective_openai_key, cfg.openai_base_url)
+    cfg.openai_api_key = resolve_openai_api_key(creds.openai_api_key, cfg.openai_base_url)
     cfg.anthropic_api_key = resolve_anthropic_api_key(
         creds.anthropic_api_key,
         cfg.anthropic_base_url,
diff --git a/agent/credentials.py b/agent/credentials.py
index 95ee01d9..09bb81a4 100644
--- a/agent/credentials.py
+++ b/agent/credentials.py
@@ -12,7 +12,6 @@
 @dataclass(slots=True)
 class CredentialBundle:
     openai_api_key: str | None = None
-    openai_oauth_token: str | None = None
     anthropic_api_key: str | None = None
     openrouter_api_key: str | None = None
     cerebras_api_key: str | None = None
@@ -27,7 +26,6 @@ class CredentialBundle:
     def has_any(self) -> bool:
         return bool(
             (self.openai_api_key and self.openai_api_key.strip())
-            or (self.openai_oauth_token and self.openai_oauth_token.strip())
             or (self.anthropic_api_key and self.anthropic_api_key.strip())
             or (self.openrouter_api_key and self.openrouter_api_key.strip())
             or (self.cerebras_api_key and self.cerebras_api_key.strip())
@@ -46,8 +44,6 @@ def has_any(self) -> bool:
     def merge_missing(self, other: "CredentialBundle") -> None:
         if not self.openai_api_key and other.openai_api_key:
             self.openai_api_key = other.openai_api_key
-        if not self.openai_oauth_token and other.openai_oauth_token:
-            self.openai_oauth_token = other.openai_oauth_token
         if not self.anthropic_api_key and other.anthropic_api_key:
             self.anthropic_api_key = other.anthropic_api_key
         if not self.openrouter_api_key and other.openrouter_api_key:
@@ -76,8 +72,6 @@ def to_json(self) -> dict[str, str]:
         out: dict[str, str] = {}
         if self.openai_api_key:
             out["openai_api_key"] = self.openai_api_key
-        if self.openai_oauth_token:
-            out["openai_oauth_token"] = self.openai_oauth_token
         if self.anthropic_api_key:
             out["anthropic_api_key"] = self.anthropic_api_key
         if self.openrouter_api_key:
@@ -106,7 +100,6 @@ def from_json(cls, payload: dict[str, str] | None) -> "CredentialBundle":
             return cls()
         return cls(
             openai_api_key=(payload.get("openai_api_key") or "").strip() or None,
-            openai_oauth_token=(payload.get("openai_oauth_token") or "").strip() or None,
             anthropic_api_key=(payload.get("anthropic_api_key") or "").strip() or None,
             openrouter_api_key=(payload.get("openrouter_api_key") or "").strip() or None,
             cerebras_api_key=(payload.get("cerebras_api_key") or "").strip() or None,
@@ -158,10 +151,6 @@ def parse_env_file(path: Path) -> CredentialBundle:
     env = parse_env_assignments(path)
     return CredentialBundle(
         openai_api_key=(env.get("OPENAI_API_KEY") or env.get("OPENPLANTER_OPENAI_API_KEY") or "").strip() or None,
-        openai_oauth_token=(
-            env.get("OPENAI_OAUTH_TOKEN") or env.get("OPENPLANTER_OPENAI_OAUTH_TOKEN") or ""
-        ).strip()
-        or None,
         anthropic_api_key=(env.get("ANTHROPIC_API_KEY") or env.get("OPENPLANTER_ANTHROPIC_API_KEY") or "").strip()
         or None,
         openrouter_api_key=(env.get("OPENROUTER_API_KEY") or env.get("OPENPLANTER_OPENROUTER_API_KEY") or "").strip()
@@ -193,10 +182,6 @@ def credentials_from_env() -> CredentialBundle:
             or ""
         ).strip()
         or None,
-        openai_oauth_token=(
-            os.getenv("OPENPLANTER_OPENAI_OAUTH_TOKEN") or os.getenv("OPENAI_OAUTH_TOKEN") or ""
-        ).strip()
-        or None,
         anthropic_api_key=(
             os.getenv("OPENPLANTER_ANTHROPIC_API_KEY") or os.getenv("ANTHROPIC_API_KEY") or ""
         ).strip()
@@ -313,7 +298,6 @@ def prompt_for_credentials(
     """
     current = CredentialBundle(
         openai_api_key=existing.openai_api_key,
-        openai_oauth_token=existing.openai_oauth_token,
         anthropic_api_key=existing.anthropic_api_key,
         openrouter_api_key=existing.openrouter_api_key,
         cerebras_api_key=existing.cerebras_api_key,
@@ -352,7 +336,6 @@ def _ask(label: str, existing_value: str | None) -> str | None:
         return value
 
     current.openai_api_key = _ask("OpenAI", current.openai_api_key)
-    current.openai_oauth_token = _ask("ChatGPT OAuth (Plus/Pro/Teams)", current.openai_oauth_token)
     current.anthropic_api_key = _ask("Anthropic", current.anthropic_api_key)
     current.openrouter_api_key = _ask("OpenRouter", current.openrouter_api_key)
     current.cerebras_api_key = _ask("Cerebras", current.cerebras_api_key)
diff --git a/agent/tui.py b/agent/tui.py
index 9b34f3f0..d71939a7 100644
--- a/agent/tui.py
+++ b/agent/tui.py
@@ -128,7 +128,6 @@ def _build_splash() -> str:
     "haiku4.5": "anthropic-foundry/claude-haiku-4-5",
     "gpt5": "azure-foundry/gpt-5.3-codex",
     "gpt5.3": "azure-foundry/gpt-5.3-codex",
-    "gpt5.4": "azure-foundry/gpt-5.4",
     "kimi": "azure-foundry/Kimi-K2.5",
     "gpt4": "gpt-4.1",
     "gpt4.1": "gpt-4.1",
diff --git a/openplanter-desktop/crates/op-core/src/config.rs b/openplanter-desktop/crates/op-core/src/config.rs
index 36d42af4..0be8c38f 100644
--- a/openplanter-desktop/crates/op-core/src/config.rs
+++ b/openplanter-desktop/crates/op-core/src/config.rs
@@ -338,10 +338,8 @@ impl AgentConfig {
     pub fn from_env(workspace: impl AsRef<Path>) -> Self {
         let ws = dunce_canonicalize(workspace.as_ref());
 
-        let openai_api_key = env_opt("OPENPLANTER_OPENAI_API_KEY")
-            .or_else(|| env_opt("OPENAI_API_KEY"))
-            .or_else(|| env_opt("OPENPLANTER_OPENAI_OAUTH_TOKEN"))
-            .or_else(|| env_opt("OPENAI_OAUTH_TOKEN"));
+        let openai_api_key =
+            env_opt("OPENPLANTER_OPENAI_API_KEY").or_else(|| env_opt("OPENAI_API_KEY"));
 
         let anthropic_api_key =
             env_opt("OPENPLANTER_ANTHROPIC_API_KEY").or_else(|| env_opt("ANTHROPIC_API_KEY"));
diff --git a/openplanter-desktop/crates/op-core/src/credentials.rs b/openplanter-desktop/crates/op-core/src/credentials.rs
index c36e7dce..f6e4fe5c 100644
--- a/openplanter-desktop/crates/op-core/src/credentials.rs
+++ b/openplanter-desktop/crates/op-core/src/credentials.rs
@@ -13,7 +13,6 @@ use serde::{Deserialize, Serialize};
 #[derive(Debug, Clone, Default, Serialize, Deserialize)]
 pub struct CredentialBundle {
     pub openai_api_key: Option<String>,
-    pub openai_oauth_token: Option<String>,
     pub anthropic_api_key: Option<String>,
     pub openrouter_api_key: Option<String>,
     pub cerebras_api_key: Option<String>,
@@ -31,7 +30,6 @@ impl CredentialBundle {
     pub fn has_any(&self) -> bool {
         let keys = [
             &self.openai_api_key,
-            &self.openai_oauth_token,
             &self.anthropic_api_key,
             &self.openrouter_api_key,
             &self.cerebras_api_key,
@@ -57,7 +55,6 @@ impl CredentialBundle {
             };
         }
         fill!(openai_api_key);
-        fill!(openai_oauth_token);
         fill!(anthropic_api_key);
         fill!(openrouter_api_key);
         fill!(cerebras_api_key);
@@ -81,7 +78,6 @@ impl CredentialBundle {
             };
         }
         add!(openai_api_key, "openai_api_key");
-        add!(openai_oauth_token, "openai_oauth_token");
         add!(anthropic_api_key, "anthropic_api_key");
         add!(openrouter_api_key, "openrouter_api_key");
         add!(cerebras_api_key, "cerebras_api_key");
@@ -108,7 +104,6 @@ impl CredentialBundle {
         }
         Self {
             openai_api_key: get_str(payload, "openai_api_key"),
-            openai_oauth_token: get_str(payload, "openai_oauth_token"),
             anthropic_api_key: get_str(payload, "anthropic_api_key"),
             openrouter_api_key: get_str(payload, "openrouter_api_key"),
             cerebras_api_key: get_str(payload, "cerebras_api_key"),
@@ -172,7 +167,6 @@ pub fn parse_env_file(path: &Path) -> CredentialBundle {
 
     CredentialBundle {
         openai_api_key: get_key(&env_map, "OPENAI_API_KEY", "OPENPLANTER_OPENAI_API_KEY"),
-        openai_oauth_token: get_key(&env_map, "OPENAI_OAUTH_TOKEN", "OPENPLANTER_OPENAI_OAUTH_TOKEN"),
         anthropic_api_key: get_key(
             &env_map,
             "ANTHROPIC_API_KEY",
@@ -215,7 +209,6 @@ pub fn credentials_from_env() -> CredentialBundle {
 
     CredentialBundle {
         openai_api_key: env_key("OPENPLANTER_OPENAI_API_KEY", "OPENAI_API_KEY"),
-        openai_oauth_token: env_key("OPENPLANTER_OPENAI_OAUTH_TOKEN", "OPENAI_OAUTH_TOKEN"),
         anthropic_api_key: env_key("OPENPLANTER_ANTHROPIC_API_KEY", "ANTHROPIC_API_KEY"),
         openrouter_api_key: env_key("OPENPLANTER_OPENROUTER_API_KEY", "OPENROUTER_API_KEY"),
         cerebras_api_key: env_key("OPENPLANTER_CEREBRAS_API_KEY", "CEREBRAS_API_KEY"),
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/config.rs b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
index 620703da..1b8c9b99 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/config.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
@@ -153,7 +153,6 @@ fn known_models_for_provider(provider: &str) -> Vec<ModelInfo> {
     let models: Vec<(&str, &str)> = match provider {
         "openai" => vec![
             ("azure-foundry/gpt-5.3-codex", "GPT-5.3 Codex (Foundry)"),
-            ("azure-foundry/gpt-5.4", "GPT-5.4 (Foundry)"),
             ("azure-foundry/Kimi-K2.5", "Kimi K2.5 (Foundry)"),
         ],
         "anthropic" => vec![
@@ -273,9 +272,7 @@ pub async fn get_credentials_status(
     let mut status = HashMap::new();
     status.insert(
         "openai".to_string(),
-        cfg.openai_api_key.is_some()
-            || env_creds.openai_api_key.is_some()
-            || env_creds.openai_oauth_token.is_some(),
+        cfg.openai_api_key.is_some() || env_creds.openai_api_key.is_some(),
     );
     status.insert(
         "anthropic".to_string(),
diff --git a/openplanter-desktop/frontend/src/commands/model.test.ts b/openplanter-desktop/frontend/src/commands/model.test.ts
index ef5edff6..72410132 100644
--- a/openplanter-desktop/frontend/src/commands/model.test.ts
+++ b/openplanter-desktop/frontend/src/commands/model.test.ts
@@ -71,10 +71,6 @@ describe("MODEL_ALIASES", () => {
     expect(MODEL_ALIASES["gpt5"]).toBe("azure-foundry/gpt-5.3-codex");
   });
 
-  it("gpt-5.4 alias", () => {
-    expect(MODEL_ALIASES["gpt-5.4"]).toBe("azure-foundry/gpt-5.4");
-  });
-
   it("zai alias", () => {
     expect(MODEL_ALIASES["zai"]).toBe("glm-5");
   });
diff --git a/openplanter-desktop/frontend/src/commands/model.ts b/openplanter-desktop/frontend/src/commands/model.ts
index 68b45bab..45f7016d 100644
--- a/openplanter-desktop/frontend/src/commands/model.ts
+++ b/openplanter-desktop/frontend/src/commands/model.ts
@@ -14,8 +14,6 @@ export const MODEL_ALIASES: Record<string, string> = {
   gpt5: "azure-foundry/gpt-5.3-codex",
   "gpt-5": "azure-foundry/gpt-5.3-codex",
   "gpt-5.3": "azure-foundry/gpt-5.3-codex",
-  gpt54: "azure-foundry/gpt-5.4",
-  "gpt-5.4": "azure-foundry/gpt-5.4",
   kimi: "azure-foundry/Kimi-K2.5",
   gpt4o: "gpt-4o",
   "gpt-4o": "gpt-4o",
diff --git a/tests/test_credentials.py b/tests/test_credentials.py
index 6a610320..f891dad0 100644
--- a/tests/test_credentials.py
+++ b/tests/test_credentials.py
@@ -21,7 +21,6 @@ def test_parse_env_file_extracts_supported_keys(self) -> None:
                 "\n".join(
                     [
                         "OPENAI_API_KEY=oa-key",
-                        "OPENAI_OAUTH_TOKEN=oauth-token",
                         "ANTHROPIC_API_KEY=an-key",
                         "OPENROUTER_API_KEY=or-key",
                         "ZAI_API_KEY=zai-key",
@@ -36,7 +35,6 @@ def test_parse_env_file_extracts_supported_keys(self) -> None:
             )
             creds = parse_env_file(env_path)
             self.assertEqual(creds.openai_api_key, "oa-key")
-            self.assertEqual(creds.openai_oauth_token, "oauth-token")
             self.assertEqual(creds.anthropic_api_key, "an-key")
             self.assertEqual(creds.openrouter_api_key, "or-key")
             self.assertEqual(creds.zai_api_key, "zai-key")
@@ -68,7 +66,6 @@ def test_store_roundtrip(self) -> None:
             store = CredentialStore(workspace=root, session_root_dir=".openplanter")
             creds = CredentialBundle(
                 openai_api_key="oa",
-                openai_oauth_token="oauth",
                 anthropic_api_key="an",
                 openrouter_api_key="or",
                 zai_api_key="zai",

From 1a51d2bcb4ff9ce0ff3eac934f2f33da378ee0bf Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 15:44:07 -0400
Subject: [PATCH 46/58] Revert "Fix /chrome auto browser URL clearing"

This reverts commit 36eebce7ec11270923c6ad1326b7006e2e7e54c8.
---
 openplanter-desktop/frontend/src/commands/chrome.test.ts | 2 +-
 openplanter-desktop/frontend/src/commands/chrome.ts      | 4 +---
 2 files changed, 2 insertions(+), 4 deletions(-)

diff --git a/openplanter-desktop/frontend/src/commands/chrome.test.ts b/openplanter-desktop/frontend/src/commands/chrome.test.ts
index 04da61a5..4b1591e7 100644
--- a/openplanter-desktop/frontend/src/commands/chrome.test.ts
+++ b/openplanter-desktop/frontend/src/commands/chrome.test.ts
@@ -65,7 +65,7 @@ describe("handleChromeCommand", () => {
     __setHandler("update_config", ({ partial }: { partial: Record<string, unknown> }) => {
       expect(partial.chrome_mcp_enabled).toBe(true);
       expect(partial.chrome_mcp_auto_connect).toBe(true);
-      expect(partial.chrome_mcp_browser_url).toBe("");
+      expect(partial.chrome_mcp_browser_url).toBeNull();
       return makeChromeConfig();
     });
 
diff --git a/openplanter-desktop/frontend/src/commands/chrome.ts b/openplanter-desktop/frontend/src/commands/chrome.ts
index 83b76ff3..5ab0bb20 100644
--- a/openplanter-desktop/frontend/src/commands/chrome.ts
+++ b/openplanter-desktop/frontend/src/commands/chrome.ts
@@ -73,9 +73,7 @@ export async function handleChromeCommand(args: string): Promise<CommandResult>
       partial = {
         chrome_mcp_enabled: true,
         chrome_mcp_auto_connect: true,
-        // Tauri partial config treats `null` as "field omitted", so send an
-        // empty string and let the Rust normalizer clear the stored URL.
-        chrome_mcp_browser_url: "",
+        chrome_mcp_browser_url: null,
       };
       break;
     case "url":

From 0b9c3c84184e4d36fb780aec2742dcdfa5a69ce2 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 15:44:55 -0400
Subject: [PATCH 47/58] Revert "Add native Chrome DevTools MCP integration"

This reverts commit 39825dc6b31a5e56f8b08447c7dea004d5bdddbc.
---
 README.md                                     |  57 +-
 agent/__main__.py                             |  92 ---
 agent/builder.py                              |   6 -
 agent/chrome_mcp.py                           | 572 -----------------
 agent/config.py                               |  57 --
 agent/engine.py                               |  32 +-
 agent/settings.py                             |  76 ---
 agent/tool_defs.py                            |  31 -
 agent/tools.py                                |  63 --
 agent/tui.py                                  | 104 +--
 .../crates/op-core/src/config.rs              |  51 --
 .../crates/op-core/src/config_hydration.rs    |  36 --
 .../crates/op-core/src/engine/mod.rs          |  38 +-
 .../crates/op-core/src/events.rs              |  14 -
 .../crates/op-core/src/settings.rs            |  62 +-
 .../crates/op-core/src/tools/chrome_mcp.rs    | 596 ------------------
 .../crates/op-core/src/tools/defs.rs          |  58 +-
 .../crates/op-core/src/tools/mod.rs           |  35 +-
 .../crates/op-tauri/src/bridge.rs             |  72 +--
 .../crates/op-tauri/src/commands/agent.rs     |   4 +-
 .../crates/op-tauri/src/commands/config.rs    |  61 +-
 .../crates/op-tauri/src/state.rs              |  85 ---
 openplanter-desktop/frontend/src/api/types.ts |  20 -
 .../frontend/src/commands/chrome.test.ts      | 128 ----
 .../frontend/src/commands/chrome.ts           | 136 ----
 .../src/commands/completionRegistry.test.ts   |  26 -
 .../src/commands/completionRegistry.ts        |  33 -
 .../frontend/src/commands/slash.test.ts       |  26 -
 .../frontend/src/commands/slash.ts            |   7 -
 .../frontend/src/components/App.ts            |   1 -
 .../frontend/src/components/ChatPane.test.ts  |  39 +-
 .../frontend/src/components/ChatPane.ts       |  29 +-
 .../src/components/contentParser.test.ts      |  14 +-
 .../frontend/src/components/contentParser.ts  |  19 +-
 .../frontend/src/components/toolArgs.ts       | 160 -----
 openplanter-desktop/frontend/src/main.ts      |   9 -
 .../frontend/src/state/store.ts               |  16 -
 tests/test_chrome_mcp.py                      | 207 ------
 tests/test_engine.py                          |  48 --
 tests/test_settings.py                        |  38 +-
 tests/test_tool_defs.py                       |  39 --
 tests/test_tui_repl.py                        |  47 --
 42 files changed, 95 insertions(+), 3149 deletions(-)
 delete mode 100644 agent/chrome_mcp.py
 delete mode 100644 openplanter-desktop/crates/op-core/src/tools/chrome_mcp.rs
 delete mode 100644 openplanter-desktop/frontend/src/commands/chrome.test.ts
 delete mode 100644 openplanter-desktop/frontend/src/commands/chrome.ts
 delete mode 100644 openplanter-desktop/frontend/src/components/toolArgs.ts
 delete mode 100644 tests/test_chrome_mcp.py

diff --git a/README.md b/README.md
index 48f4ecfb..7aee4d49 100644
--- a/README.md
+++ b/README.md
@@ -50,8 +50,6 @@ cargo tauri build
 
 Requires: Rust stable, Node.js 20+, the Tauri CLI, and platform-specific Tauri dependencies ([see Tauri prerequisites](https://v2.tauri.app/start/prerequisites/)).
 
-If you want the desktop app to control a live Chrome session through Chrome DevTools MCP, keep a local Node/npm install available at runtime. OpenPlanter shells out to `npx -y chrome-devtools-mcp@latest`; it does not bundle the server or launch Chrome for you.
-
 ## CLI Agent
 
 The Python CLI agent can be used independently of the desktop app.
@@ -78,8 +76,6 @@ Or run a single task headlessly:
 openplanter-agent --task "Cross-reference vendor payments against lobbying disclosures and flag overlaps" --workspace ./data
 ```
 
-Chrome DevTools MCP support in the CLI/TUI also uses local `npx`, so install Node.js 20+ if you want to enable Chrome tools there.
-
 ### Docker
 
 ```bash
@@ -223,53 +219,6 @@ The agent has access to 20 tools, organized around its investigation workflow:
 
 In **recursive mode** (the default), the agent spawns sub-agents via `subtask` and `execute` to parallelize entity resolution, cross-dataset linking, and evidence-chain construction across large investigations.
 
-When Chrome DevTools MCP is enabled, OpenPlanter discovers Chrome's published MCP tools at solve start and appends them natively to the built-in tool set for the main agent, recursive subtasks, and execute flows.
-
-## Chrome DevTools MCP
-
-OpenPlanter can attach to the official Chrome DevTools MCP server and reuse an active Chrome debugging session. The integration is native in both runtimes, but the server itself is still the upstream package started locally through `npx`.
-
-### Requirements
-
-- Node.js and npm available on your `PATH`
-- Chrome 144 or newer
-- Remote debugging enabled in Chrome at `chrome://inspect/#remote-debugging`
-
-### How OpenPlanter Connects
-
-- Auto-connect mode: OpenPlanter starts `chrome-devtools-mcp` with `--autoConnect` and reuses a running Chrome session after you approve Chrome's debugging prompt.
-- Browser URL mode: OpenPlanter passes `--browserUrl <endpoint>` to attach to an existing remote debugging endpoint. This takes precedence over auto-connect when configured.
-- Channel selection: `stable` is the default channel; you can switch to `beta`, `dev`, or `canary` when needed.
-
-If Chrome MCP cannot start because Node/npm is missing, Chrome remote debugging is disabled, or Chrome is not available, OpenPlanter keeps running with its built-in tools and reports Chrome MCP as `unavailable`.
-
-### Desktop Usage
-
-Use the desktop slash command:
-
-```text
-/chrome status
-/chrome on
-/chrome off
-/chrome auto --save
-/chrome url http://127.0.0.1:9222 --save
-/chrome channel beta --save
-```
-
-The sidebar and `/status` output both show the current Chrome MCP runtime state.
-
-### CLI Usage
-
-Use per-run flags:
-
-```bash
-openplanter-agent --chrome-mcp --chrome-auto-connect
-openplanter-agent --chrome-mcp --chrome-browser-url http://127.0.0.1:9222
-openplanter-agent --chrome-mcp --chrome-channel beta
-```
-
-The TUI also supports `/chrome status|on|off|auto|url <endpoint>|channel <stable|beta|dev|canary> [--save]`.
-
 ## CLI Reference
 
 ```
@@ -310,10 +259,6 @@ OPENPLANTER_WORKSPACE=workspace
 | `--model NAME` | Model name or `newest` to auto-select |
 | `--zai-plan PLAN` | Z.AI endpoint plan: `paygo` or `coding` |
 | `--reasoning-effort LEVEL` | `low`, `medium`, `high`, or `none` |
-| `--chrome-mcp` / `--no-chrome-mcp` | Enable or disable native Chrome DevTools MCP tools |
-| `--chrome-auto-connect` / `--no-chrome-auto-connect` | Use Chrome MCP auto-connect or require an explicit browser URL |
-| `--chrome-browser-url URL` | Attach Chrome MCP to an existing remote debugging browser URL |
-| `--chrome-channel CHANNEL` | Chrome release channel for auto-connect: `stable`, `beta`, `dev`, `canary` |
 | `--list-models` | Fetch available models from the provider API |
 
 ### Execution
@@ -337,7 +282,7 @@ OPENPLANTER_WORKSPACE=workspace
 
 ### Persistent Defaults
 
-Use `--default-model`, `--default-reasoning-effort`, Chrome MCP slash commands with `--save`, or per-provider variants like `--default-model-openai` to save workspace defaults to `.openplanter/settings.json`. View them with `--show-settings`.
+Use `--default-model`, `--default-reasoning-effort`, or per-provider variants like `--default-model-openai` to save workspace defaults to `.openplanter/settings.json`. View them with `--show-settings`.
 
 ## Configuration
 
diff --git a/agent/__main__.py b/agent/__main__.py
index b6a6bf2a..7b17ec08 100644
--- a/agent/__main__.py
+++ b/agent/__main__.py
@@ -109,40 +109,6 @@ def build_parser() -> argparse.ArgumentParser:
         choices=["exa", "firecrawl", "brave", "tavily"],
         help="Web search backend provider.",
     )
-    parser.add_argument(
-        "--chrome-mcp",
-        dest="chrome_mcp_enabled",
-        action="store_true",
-        help="Enable native Chrome DevTools MCP tools for this run.",
-    )
-    parser.add_argument(
-        "--no-chrome-mcp",
-        dest="chrome_mcp_enabled",
-        action="store_false",
-        help="Disable native Chrome DevTools MCP tools for this run.",
-    )
-    parser.add_argument(
-        "--chrome-auto-connect",
-        dest="chrome_auto_connect",
-        action="store_true",
-        help="Ask the Chrome DevTools MCP server to auto-connect to a running Chrome instance.",
-    )
-    parser.add_argument(
-        "--no-chrome-auto-connect",
-        dest="chrome_auto_connect",
-        action="store_false",
-        help="Disable Chrome MCP auto-connect and rely on --chrome-browser-url instead.",
-    )
-    parser.add_argument(
-        "--chrome-browser-url",
-        help="Remote debugging browser URL for Chrome DevTools MCP (preferred over auto-connect).",
-    )
-    parser.add_argument(
-        "--chrome-channel",
-        choices=["stable", "beta", "dev", "canary"],
-        help="Chrome channel to target when Chrome MCP auto-connect is used.",
-    )
-    parser.set_defaults(chrome_mcp_enabled=None, chrome_auto_connect=None)
     parser.add_argument("--voyage-api-key", help="Voyage API key override.")
     parser.add_argument(
         "--configure-keys",
@@ -450,16 +416,6 @@ def _apply_runtime_overrides(cfg: AgentConfig, args: argparse.Namespace, creds:
         cfg.web_search_provider = "exa"
     if args.reasoning_effort:
         cfg.reasoning_effort = None if args.reasoning_effort == "none" else args.reasoning_effort
-    if args.chrome_mcp_enabled is not None:
-        cfg.chrome_mcp_enabled = bool(args.chrome_mcp_enabled)
-    if args.chrome_auto_connect is not None:
-        cfg.chrome_mcp_auto_connect = bool(args.chrome_auto_connect)
-    if args.chrome_browser_url is not None:
-        cfg.chrome_mcp_browser_url = args.chrome_browser_url.strip() or None
-        if cfg.chrome_mcp_browser_url:
-            cfg.chrome_mcp_enabled = True
-    if args.chrome_channel:
-        cfg.chrome_mcp_channel = args.chrome_channel
     if args.recursive:
         cfg.recursive = True
     if args.acceptance_criteria:
@@ -553,40 +509,6 @@ def _apply_persistent_settings(
         and settings.default_reasoning_effort
     ):
         cfg.reasoning_effort = settings.default_reasoning_effort
-    if (
-        args.chrome_mcp_enabled is None
-        and os.getenv("OPENPLANTER_CHROME_MCP_ENABLED") is None
-        and settings.chrome_mcp_enabled is not None
-    ):
-        cfg.chrome_mcp_enabled = settings.chrome_mcp_enabled
-    if (
-        args.chrome_auto_connect is None
-        and os.getenv("OPENPLANTER_CHROME_MCP_AUTO_CONNECT") is None
-        and settings.chrome_mcp_auto_connect is not None
-    ):
-        cfg.chrome_mcp_auto_connect = settings.chrome_mcp_auto_connect
-    if (
-        args.chrome_browser_url is None
-        and os.getenv("OPENPLANTER_CHROME_MCP_BROWSER_URL") is None
-        and settings.chrome_mcp_browser_url
-    ):
-        cfg.chrome_mcp_browser_url = settings.chrome_mcp_browser_url
-    if (
-        args.chrome_channel is None
-        and os.getenv("OPENPLANTER_CHROME_MCP_CHANNEL") is None
-        and settings.chrome_mcp_channel
-    ):
-        cfg.chrome_mcp_channel = settings.chrome_mcp_channel
-    if (
-        os.getenv("OPENPLANTER_CHROME_MCP_CONNECT_TIMEOUT_SEC") is None
-        and settings.chrome_mcp_connect_timeout_sec is not None
-    ):
-        cfg.chrome_mcp_connect_timeout_sec = settings.chrome_mcp_connect_timeout_sec
-    if (
-        os.getenv("OPENPLANTER_CHROME_MCP_RPC_TIMEOUT_SEC") is None
-        and settings.chrome_mcp_rpc_timeout_sec is not None
-    ):
-        cfg.chrome_mcp_rpc_timeout_sec = settings.chrome_mcp_rpc_timeout_sec
 
     return settings
 
@@ -601,18 +523,6 @@ def _print_settings(settings: PersistentSettings) -> None:
     print(f"  default_model_cerebras: {settings.default_model_cerebras or '(unset)'}")
     print(f"  default_model_zai: {settings.default_model_zai or '(unset)'}")
     print(f"  default_model_ollama: {settings.default_model_ollama or '(unset)'}")
-    print(f"  chrome_mcp_enabled: {settings.chrome_mcp_enabled if settings.chrome_mcp_enabled is not None else '(unset)'}")
-    print(f"  chrome_mcp_auto_connect: {settings.chrome_mcp_auto_connect if settings.chrome_mcp_auto_connect is not None else '(unset)'}")
-    print(f"  chrome_mcp_browser_url: {settings.chrome_mcp_browser_url or '(unset)'}")
-    print(f"  chrome_mcp_channel: {settings.chrome_mcp_channel or '(unset)'}")
-    print(
-        "  chrome_mcp_connect_timeout_sec: "
-        f"{settings.chrome_mcp_connect_timeout_sec if settings.chrome_mcp_connect_timeout_sec is not None else '(unset)'}"
-    )
-    print(
-        "  chrome_mcp_rpc_timeout_sec: "
-        f"{settings.chrome_mcp_rpc_timeout_sec if settings.chrome_mcp_rpc_timeout_sec is not None else '(unset)'}"
-    )
 
 
 def _has_non_interactive_command(args: argparse.Namespace) -> bool:
@@ -755,7 +665,6 @@ def main() -> None:
 
     engine = build_engine(cfg)
     model_name = _get_model_display_name(engine)
-    chrome_status = engine.tools.chrome_mcp_status()
 
     try:
         runtime = SessionRuntime.bootstrap(
@@ -779,7 +688,6 @@ def main() -> None:
     if cfg.reasoning_effort:
         startup_info["Reasoning"] = cfg.reasoning_effort
     startup_info["Mode"] = "recursive" if cfg.recursive else "flat"
-    startup_info["ChromeMCP"] = f"{chrome_status.status}: {chrome_status.detail}"
     startup_info["Workspace"] = str(cfg.workspace)
     startup_info["WorkspaceSource"] = workspace_resolution.source
     if workspace_resolution.guardrail_action != "none":
diff --git a/agent/builder.py b/agent/builder.py
index 76d3f751..057eba5d 100644
--- a/agent/builder.py
+++ b/agent/builder.py
@@ -247,12 +247,6 @@ def build_engine(cfg: AgentConfig) -> RLMEngine:
         mistral_transcription_chunk_overlap_seconds=cfg.mistral_transcription_chunk_overlap_seconds,
         mistral_transcription_max_chunks=cfg.mistral_transcription_max_chunks,
         mistral_transcription_request_timeout_sec=cfg.mistral_transcription_request_timeout_sec,
-        chrome_mcp_enabled=cfg.chrome_mcp_enabled,
-        chrome_mcp_auto_connect=cfg.chrome_mcp_auto_connect,
-        chrome_mcp_browser_url=cfg.chrome_mcp_browser_url,
-        chrome_mcp_channel=cfg.chrome_mcp_channel,
-        chrome_mcp_connect_timeout_sec=cfg.chrome_mcp_connect_timeout_sec,
-        chrome_mcp_rpc_timeout_sec=cfg.chrome_mcp_rpc_timeout_sec,
         max_observation_chars=cfg.max_observation_chars,
     )
 
diff --git a/agent/chrome_mcp.py b/agent/chrome_mcp.py
deleted file mode 100644
index 50112c1b..00000000
--- a/agent/chrome_mcp.py
+++ /dev/null
@@ -1,572 +0,0 @@
-from __future__ import annotations
-
-import atexit
-import json
-import os
-import shlex
-import shutil
-import subprocess
-import threading
-import time
-from dataclasses import dataclass
-from typing import Any
-
-from .config import (
-    CHROME_MCP_DEFAULT_CHANNEL,
-    normalize_chrome_mcp_browser_url,
-    normalize_chrome_mcp_channel,
-)
-
-
-class ChromeMcpError(RuntimeError):
-    pass
-
-
-@dataclass(frozen=True)
-class ChromeMcpToolDef:
-    name: str
-    description: str
-    parameters: dict[str, Any]
-
-    def as_tool_definition(self) -> dict[str, Any]:
-        return {
-            "name": self.name,
-            "description": self.description,
-            "parameters": self.parameters,
-        }
-
-
-@dataclass(frozen=True)
-class ChromeMcpImage:
-    base64_data: str
-    media_type: str
-
-
-@dataclass(frozen=True)
-class ChromeMcpCallResult:
-    content: str
-    is_error: bool = False
-    image: ChromeMcpImage | None = None
-
-
-@dataclass(frozen=True)
-class ChromeMcpStatus:
-    status: str
-    detail: str
-    tool_count: int = 0
-    last_refresh_at: float | None = None
-
-
-@dataclass
-class _PendingRequest:
-    event: threading.Event
-    result: dict[str, Any] | None = None
-    error: Exception | None = None
-
-
-def _env_text(name: str, default: str) -> str:
-    value = (os.getenv(name) or "").strip()
-    return value or default
-
-
-def _format_protocol_error(error: object) -> str:
-    if isinstance(error, dict):
-        message = str(error.get("message") or "Unknown MCP error").strip()
-        code = error.get("code")
-        if code is None:
-            return message
-        return f"{message} (code {code})"
-    return str(error or "Unknown MCP error")
-
-
-def _status_detail_from_exception(
-    exc: Exception,
-    *,
-    browser_url: str | None,
-    stderr_tail: list[str],
-) -> str:
-    detail = str(exc).strip() or type(exc).__name__
-    stderr_text = " ".join(line.strip() for line in stderr_tail[-4:] if line.strip())
-    lower = f"{detail} {stderr_text}".lower()
-    hints: list[str] = []
-    if "npx" in lower and ("not found" in lower or "no such file" in lower):
-        hints.append("Install Node.js/npm so `npx` is available locally.")
-    if "timed out" in lower or "timeout" in lower:
-        if browser_url:
-            hints.append("Confirm the remote debugging endpoint is reachable.")
-        else:
-            hints.append(
-                "Enable Chrome remote debugging at chrome://inspect/#remote-debugging "
-                "and allow the Chrome DevTools MCP connection prompt."
-            )
-    if "inspect/#remote-debugging" not in lower and browser_url is None:
-        hints.append(
-            "Chrome 144+ must have remote debugging enabled at chrome://inspect/#remote-debugging."
-        )
-    if stderr_text:
-        detail = f"{detail} stderr: {stderr_text}"
-    if hints:
-        detail = f"{detail} {' '.join(hints)}"
-    return detail.strip()
-
-
-class ChromeMcpManager:
-    def __init__(
-        self,
-        *,
-        enabled: bool,
-        auto_connect: bool,
-        browser_url: str | None,
-        channel: str,
-        connect_timeout_sec: int,
-        rpc_timeout_sec: int,
-    ) -> None:
-        self.enabled = bool(enabled)
-        self.auto_connect = bool(auto_connect)
-        self.browser_url = normalize_chrome_mcp_browser_url(browser_url)
-        self.channel = normalize_chrome_mcp_channel(channel or CHROME_MCP_DEFAULT_CHANNEL)
-        self.connect_timeout_sec = max(1, int(connect_timeout_sec))
-        self.rpc_timeout_sec = max(1, int(rpc_timeout_sec))
-        self._lock = threading.RLock()
-        self._proc: subprocess.Popen[str] | None = None
-        self._reader_thread: threading.Thread | None = None
-        self._stderr_thread: threading.Thread | None = None
-        self._pending: dict[int, _PendingRequest] = {}
-        self._next_id = 1
-        self._tools: list[ChromeMcpToolDef] = []
-        self._last_refresh_at: float | None = None
-        self._status = ChromeMcpStatus(
-            status="disabled" if not self.enabled else "ready",
-            detail=(
-                "Chrome DevTools MCP is disabled."
-                if not self.enabled
-                else "Chrome DevTools MCP will initialize on the next solve."
-            ),
-            tool_count=0,
-        )
-        self._stderr_tail: list[str] = []
-
-    def status_snapshot(self) -> ChromeMcpStatus:
-        with self._lock:
-            return ChromeMcpStatus(
-                status=self._status.status,
-                detail=self._status.detail,
-                tool_count=self._status.tool_count,
-                last_refresh_at=self._status.last_refresh_at,
-            )
-
-    def ensure_connected(self) -> None:
-        if not self.enabled:
-            with self._lock:
-                self._status = ChromeMcpStatus(
-                    status="disabled",
-                    detail="Chrome DevTools MCP is disabled.",
-                    tool_count=len(self._tools),
-                    last_refresh_at=self._last_refresh_at,
-                )
-            return
-        with self._lock:
-            if self._proc is not None and self._proc.poll() is None and self._reader_thread is not None:
-                return
-            if not self.browser_url and not self.auto_connect:
-                detail = (
-                    "Chrome DevTools MCP is enabled but cannot attach: set "
-                    "`chrome_mcp_browser_url` or enable `chrome_mcp_auto_connect`."
-                )
-                self._status = ChromeMcpStatus(
-                    status="unavailable",
-                    detail=detail,
-                    tool_count=len(self._tools),
-                    last_refresh_at=self._last_refresh_at,
-                )
-                raise ChromeMcpError(detail)
-            self._start_process_locked()
-        try:
-            self._initialize_handshake()
-        except Exception as exc:
-            detail = _status_detail_from_exception(
-                exc,
-                browser_url=self.browser_url,
-                stderr_tail=self._stderr_tail,
-            )
-            with self._lock:
-                self._status = ChromeMcpStatus(
-                    status="unavailable",
-                    detail=detail,
-                    tool_count=len(self._tools),
-                    last_refresh_at=self._last_refresh_at,
-                )
-            self.shutdown()
-            raise ChromeMcpError(detail) from exc
-
-    def list_tools(self, *, force_refresh: bool = False) -> list[ChromeMcpToolDef]:
-        if not self.enabled:
-            return []
-        self.ensure_connected()
-        with self._lock:
-            if self._tools and not force_refresh:
-                return list(self._tools)
-        tools: list[ChromeMcpToolDef] = []
-        cursor: str | None = None
-        while True:
-            params: dict[str, Any] = {}
-            if cursor:
-                params["cursor"] = cursor
-            result = self._request_with_reconnect(
-                "tools/list",
-                params=params,
-                timeout_sec=self.rpc_timeout_sec,
-            )
-            raw_tools = result.get("tools")
-            if isinstance(raw_tools, list):
-                for item in raw_tools:
-                    if not isinstance(item, dict):
-                        continue
-                    name = str(item.get("name") or "").strip()
-                    if not name:
-                        continue
-                    description = str(item.get("description") or "").strip()
-                    parameters = item.get("inputSchema")
-                    if not isinstance(parameters, dict):
-                        parameters = {"type": "object", "properties": {}, "required": []}
-                    tools.append(
-                        ChromeMcpToolDef(
-                            name=name,
-                            description=description,
-                            parameters=parameters,
-                        )
-                    )
-            raw_cursor = result.get("nextCursor")
-            cursor = str(raw_cursor).strip() if raw_cursor else None
-            if not cursor:
-                break
-        now = time.time()
-        with self._lock:
-            self._tools = tools
-            self._last_refresh_at = now
-            self._status = ChromeMcpStatus(
-                status="ready",
-                detail=(
-                    f"Chrome DevTools MCP ready with {len(tools)} tool(s) "
-                    f"via {'browser_url' if self.browser_url else 'auto-connect'}."
-                ),
-                tool_count=len(tools),
-                last_refresh_at=now,
-            )
-            return list(self._tools)
-
-    def call_tool(self, name: str, arguments: dict[str, Any]) -> ChromeMcpCallResult:
-        if not self.enabled:
-            raise ChromeMcpError("Chrome DevTools MCP is disabled.")
-        self.ensure_connected()
-        result = self._request_with_reconnect(
-            "tools/call",
-            params={"name": name, "arguments": arguments},
-            timeout_sec=self.rpc_timeout_sec,
-        )
-        return self._parse_call_result(result)
-
-    def shutdown(self) -> None:
-        with self._lock:
-            self._shutdown_locked()
-
-    def _request_with_reconnect(
-        self,
-        method: str,
-        *,
-        params: dict[str, Any],
-        timeout_sec: int,
-    ) -> dict[str, Any]:
-        last_error: Exception | None = None
-        for attempt in range(2):
-            try:
-                return self._request(method, params=params, timeout_sec=timeout_sec)
-            except Exception as exc:
-                last_error = exc
-                with self._lock:
-                    self._shutdown_locked()
-                    self._status = ChromeMcpStatus(
-                        status="unavailable",
-                        detail=_status_detail_from_exception(
-                            exc,
-                            browser_url=self.browser_url,
-                            stderr_tail=self._stderr_tail,
-                        ),
-                        tool_count=len(self._tools),
-                        last_refresh_at=self._last_refresh_at,
-                    )
-                if attempt == 0:
-                    self.ensure_connected()
-                    continue
-                break
-        raise ChromeMcpError(str(last_error or "Chrome DevTools MCP request failed"))
-
-    def _initialize_handshake(self) -> None:
-        init_params = {
-            "protocolVersion": "2025-11-25",
-            "capabilities": {},
-            "clientInfo": {"name": "openplanter-agent", "version": "1.0"},
-        }
-        self._request("initialize", params=init_params, timeout_sec=self.connect_timeout_sec)
-        self._notify("notifications/initialized", {})
-
-    def _request(
-        self,
-        method: str,
-        *,
-        params: dict[str, Any],
-        timeout_sec: int,
-    ) -> dict[str, Any]:
-        with self._lock:
-            proc = self._proc
-            if proc is None or proc.poll() is not None or proc.stdin is None:
-                raise ChromeMcpError("Chrome DevTools MCP process is not running.")
-            request_id = self._next_id
-            self._next_id += 1
-            pending = _PendingRequest(event=threading.Event())
-            self._pending[request_id] = pending
-            payload = {
-                "jsonrpc": "2.0",
-                "id": request_id,
-                "method": method,
-                "params": params,
-            }
-            try:
-                proc.stdin.write(json.dumps(payload, ensure_ascii=True) + "\n")
-                proc.stdin.flush()
-            except Exception as exc:
-                self._pending.pop(request_id, None)
-                raise ChromeMcpError(f"Failed to send MCP request {method}: {exc}") from exc
-        if not pending.event.wait(timeout_sec):
-            with self._lock:
-                self._pending.pop(request_id, None)
-            raise ChromeMcpError(f"Timed out waiting for Chrome DevTools MCP {method} response.")
-        if pending.error is not None:
-            raise ChromeMcpError(str(pending.error))
-        return pending.result or {}
-
-    def _notify(self, method: str, params: dict[str, Any]) -> None:
-        with self._lock:
-            proc = self._proc
-            if proc is None or proc.poll() is not None or proc.stdin is None:
-                raise ChromeMcpError("Chrome DevTools MCP process is not running.")
-            payload = {"jsonrpc": "2.0", "method": method, "params": params}
-            proc.stdin.write(json.dumps(payload, ensure_ascii=True) + "\n")
-            proc.stdin.flush()
-
-    def _start_process_locked(self) -> None:
-        self._shutdown_locked()
-        command = _env_text("OPENPLANTER_CHROME_MCP_COMMAND", "npx")
-        if shutil.which(command) is None:
-            raise ChromeMcpError(f"`{command}` is not installed or not on PATH.")
-        package = _env_text("OPENPLANTER_CHROME_MCP_PACKAGE", "chrome-devtools-mcp@latest")
-        args = [command, "-y", package]
-        if self.browser_url:
-            args.append(f"--browserUrl={self.browser_url}")
-        else:
-            args.append("--autoConnect")
-            args.append(f"--channel={self.channel}")
-        extra_args = (os.getenv("OPENPLANTER_CHROME_MCP_EXTRA_ARGS") or "").strip()
-        if extra_args:
-            args.extend(shlex.split(extra_args))
-        self._proc = subprocess.Popen(
-            args,
-            stdin=subprocess.PIPE,
-            stdout=subprocess.PIPE,
-            stderr=subprocess.PIPE,
-            text=True,
-            encoding="utf-8",
-            bufsize=1,
-            start_new_session=True,
-        )
-        self._reader_thread = threading.Thread(
-            target=self._reader_loop,
-            name="openplanter-chrome-mcp-reader",
-            daemon=True,
-        )
-        self._stderr_thread = threading.Thread(
-            target=self._stderr_loop,
-            name="openplanter-chrome-mcp-stderr",
-            daemon=True,
-        )
-        self._reader_thread.start()
-        self._stderr_thread.start()
-
-    def _reader_loop(self) -> None:
-        proc = self._proc
-        if proc is None or proc.stdout is None:
-            return
-        try:
-            for raw_line in proc.stdout:
-                line = raw_line.strip()
-                if not line:
-                    continue
-                try:
-                    payload = json.loads(line)
-                except json.JSONDecodeError:
-                    continue
-                if not isinstance(payload, dict):
-                    continue
-                request_id = payload.get("id")
-                if not isinstance(request_id, int):
-                    continue
-                with self._lock:
-                    pending = self._pending.pop(request_id, None)
-                if pending is None:
-                    continue
-                if "error" in payload:
-                    pending.error = ChromeMcpError(_format_protocol_error(payload.get("error")))
-                else:
-                    result = payload.get("result")
-                    pending.result = result if isinstance(result, dict) else {}
-                pending.event.set()
-        finally:
-            exit_code = proc.poll()
-            error = ChromeMcpError(
-                f"Chrome DevTools MCP process exited unexpectedly"
-                + (f" with code {exit_code}." if exit_code is not None else ".")
-            )
-            with self._lock:
-                pending = list(self._pending.values())
-                self._pending.clear()
-            for item in pending:
-                item.error = error
-                item.event.set()
-
-    def _stderr_loop(self) -> None:
-        proc = self._proc
-        if proc is None or proc.stderr is None:
-            return
-        for raw_line in proc.stderr:
-            line = raw_line.strip()
-            if not line:
-                continue
-            with self._lock:
-                self._stderr_tail.append(line)
-                self._stderr_tail = self._stderr_tail[-20:]
-
-    def _shutdown_locked(self) -> None:
-        proc = self._proc
-        self._proc = None
-        self._reader_thread = None
-        self._stderr_thread = None
-        pending = list(self._pending.values())
-        self._pending.clear()
-        for item in pending:
-            item.error = ChromeMcpError("Chrome DevTools MCP shut down before responding.")
-            item.event.set()
-        if proc is None:
-            return
-        try:
-            proc.terminate()
-            proc.wait(timeout=2)
-        except Exception:
-            try:
-                proc.kill()
-            except Exception:
-                pass
-
-    def _parse_call_result(self, result: dict[str, Any]) -> ChromeMcpCallResult:
-        content_parts: list[str] = []
-        image: ChromeMcpImage | None = None
-        raw_content = result.get("content")
-        if isinstance(raw_content, list):
-            for item in raw_content:
-                if isinstance(item, str):
-                    if item.strip():
-                        content_parts.append(item.strip())
-                    continue
-                if not isinstance(item, dict):
-                    continue
-                item_type = str(item.get("type") or "").strip().lower()
-                if item_type == "text":
-                    text = item.get("text")
-                    if isinstance(text, str) and text.strip():
-                        content_parts.append(text.strip())
-                    continue
-                if item_type == "image":
-                    data = item.get("data")
-                    media_type = item.get("mimeType") or item.get("mediaType")
-                    if (
-                        image is None
-                        and isinstance(data, str)
-                        and data.strip()
-                        and isinstance(media_type, str)
-                        and media_type.strip()
-                    ):
-                        image = ChromeMcpImage(
-                            base64_data=data.strip(),
-                            media_type=media_type.strip(),
-                        )
-                    media_text = media_type.strip() if isinstance(media_type, str) else "image"
-                    content_parts.append(f"[{media_text} attached]")
-                    continue
-                uri = item.get("uri") or item.get("url")
-                if isinstance(uri, str) and uri.strip():
-                    label = str(item.get("name") or item_type or "resource").strip()
-                    content_parts.append(f"{label}: {uri.strip()}")
-        structured = result.get("structuredContent")
-        if not content_parts and structured is not None:
-            try:
-                content_parts.append(json.dumps(structured, indent=2, ensure_ascii=True))
-            except TypeError:
-                content_parts.append(str(structured))
-        content = "\n".join(part for part in content_parts if part).strip()
-        if not content:
-            content = "Chrome DevTools MCP tool completed with no textual output."
-        is_error = bool(result.get("isError"))
-        if is_error:
-            content = f"Chrome DevTools MCP tool error: {content}"
-        return ChromeMcpCallResult(content=content, is_error=is_error, image=image)
-
-
-_SHARED_MANAGERS: dict[tuple[Any, ...], ChromeMcpManager] = {}
-_SHARED_LOCK = threading.Lock()
-
-
-def acquire_shared_manager(
-    *,
-    enabled: bool,
-    auto_connect: bool,
-    browser_url: str | None,
-    channel: str,
-    connect_timeout_sec: int,
-    rpc_timeout_sec: int,
-) -> ChromeMcpManager | None:
-    if not enabled:
-        return None
-    key = (
-        bool(enabled),
-        bool(auto_connect),
-        normalize_chrome_mcp_browser_url(browser_url),
-        normalize_chrome_mcp_channel(channel),
-        max(1, int(connect_timeout_sec)),
-        max(1, int(rpc_timeout_sec)),
-        _env_text("OPENPLANTER_CHROME_MCP_COMMAND", "npx"),
-        _env_text("OPENPLANTER_CHROME_MCP_PACKAGE", "chrome-devtools-mcp@latest"),
-        (os.getenv("OPENPLANTER_CHROME_MCP_EXTRA_ARGS") or "").strip(),
-    )
-    with _SHARED_LOCK:
-        manager = _SHARED_MANAGERS.get(key)
-        if manager is None:
-            manager = ChromeMcpManager(
-                enabled=enabled,
-                auto_connect=auto_connect,
-                browser_url=browser_url,
-                channel=channel,
-                connect_timeout_sec=connect_timeout_sec,
-                rpc_timeout_sec=rpc_timeout_sec,
-            )
-            _SHARED_MANAGERS[key] = manager
-        return manager
-
-
-def shutdown_all_shared_managers() -> None:
-    with _SHARED_LOCK:
-        managers = list(_SHARED_MANAGERS.values())
-        _SHARED_MANAGERS.clear()
-    for manager in managers:
-        manager.shutdown()
-
-
-atexit.register(shutdown_all_shared_managers)
diff --git a/agent/config.py b/agent/config.py
index baf83ef6..aa604cb8 100644
--- a/agent/config.py
+++ b/agent/config.py
@@ -18,10 +18,6 @@
 MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS = 2.0
 MISTRAL_TRANSCRIPTION_MAX_CHUNKS = 48
 MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC = 180
-CHROME_MCP_DEFAULT_CHANNEL = "stable"
-CHROME_MCP_CONNECT_TIMEOUT_SEC = 15
-CHROME_MCP_RPC_TIMEOUT_SEC = 45
-VALID_CHROME_MCP_CHANNELS: set[str] = {"stable", "beta", "dev", "canary"}
 
 PROVIDER_DEFAULT_MODELS: dict[str, str] = {
     "openai": "azure-foundry/gpt-5.3-codex",
@@ -39,25 +35,6 @@ def normalize_zai_plan(value: str | None) -> str:
     return "paygo"
 
 
-def _env_bool(name: str, default: bool) -> bool:
-    raw = os.getenv(name)
-    if raw is None:
-        return default
-    return raw.strip().lower() in {"1", "true", "yes", "on"}
-
-
-def normalize_chrome_mcp_channel(value: str | None) -> str:
-    cleaned = (value or "").strip().lower()
-    if cleaned in VALID_CHROME_MCP_CHANNELS:
-        return cleaned
-    return CHROME_MCP_DEFAULT_CHANNEL
-
-
-def normalize_chrome_mcp_browser_url(value: str | None) -> str | None:
-    cleaned = (value or "").strip()
-    return cleaned or None
-
-
 def resolve_zai_base_url(
     plan: str,
     *,
@@ -158,12 +135,6 @@ class AgentConfig:
     mistral_transcription_request_timeout_sec: int = (
         MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC
     )
-    chrome_mcp_enabled: bool = False
-    chrome_mcp_auto_connect: bool = True
-    chrome_mcp_browser_url: str | None = None
-    chrome_mcp_channel: str = CHROME_MCP_DEFAULT_CHANNEL
-    chrome_mcp_connect_timeout_sec: int = CHROME_MCP_CONNECT_TIMEOUT_SEC
-    chrome_mcp_rpc_timeout_sec: int = CHROME_MCP_RPC_TIMEOUT_SEC
     max_depth: int = 4
     max_steps_per_call: int = 100
     budget_extension_enabled: bool = True
@@ -197,12 +168,6 @@ def __post_init__(self) -> None:
             self.anthropic_api_key, self.anthropic_base_url
         )
         self.api_key = resolve_openai_api_key(self.api_key, self.base_url)
-        self.chrome_mcp_browser_url = normalize_chrome_mcp_browser_url(
-            self.chrome_mcp_browser_url
-        )
-        self.chrome_mcp_channel = normalize_chrome_mcp_channel(self.chrome_mcp_channel)
-        self.chrome_mcp_connect_timeout_sec = max(1, int(self.chrome_mcp_connect_timeout_sec))
-        self.chrome_mcp_rpc_timeout_sec = max(1, int(self.chrome_mcp_rpc_timeout_sec))
 
     @classmethod
     def from_env(cls, workspace: str | Path) -> "AgentConfig":
@@ -259,8 +224,6 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             0,
             int(os.getenv("OPENPLANTER_BUDGET_EXTENSION_MAX_BLOCKS", "2")),
         )
-        chrome_mcp_enabled = _env_bool("OPENPLANTER_CHROME_MCP_ENABLED", False)
-        chrome_mcp_auto_connect = _env_bool("OPENPLANTER_CHROME_MCP_AUTO_CONNECT", True)
         return cls(
             workspace=ws,
             provider=os.getenv("OPENPLANTER_PROVIDER", "auto").strip().lower() or "auto",
@@ -331,26 +294,6 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
                     str(MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC),
                 )
             ),
-            chrome_mcp_enabled=chrome_mcp_enabled,
-            chrome_mcp_auto_connect=chrome_mcp_auto_connect,
-            chrome_mcp_browser_url=normalize_chrome_mcp_browser_url(
-                os.getenv("OPENPLANTER_CHROME_MCP_BROWSER_URL")
-            ),
-            chrome_mcp_channel=normalize_chrome_mcp_channel(
-                os.getenv("OPENPLANTER_CHROME_MCP_CHANNEL", CHROME_MCP_DEFAULT_CHANNEL)
-            ),
-            chrome_mcp_connect_timeout_sec=int(
-                os.getenv(
-                    "OPENPLANTER_CHROME_MCP_CONNECT_TIMEOUT_SEC",
-                    str(CHROME_MCP_CONNECT_TIMEOUT_SEC),
-                )
-            ),
-            chrome_mcp_rpc_timeout_sec=int(
-                os.getenv(
-                    "OPENPLANTER_CHROME_MCP_RPC_TIMEOUT_SEC",
-                    str(CHROME_MCP_RPC_TIMEOUT_SEC),
-                )
-            ),
             max_depth=int(os.getenv("OPENPLANTER_MAX_DEPTH", "4")),
             max_steps_per_call=int(os.getenv("OPENPLANTER_MAX_STEPS", "100")),
             budget_extension_enabled=budget_extension_enabled,
diff --git a/agent/engine.py b/agent/engine.py
index 4ff67441..1e4f4de1 100644
--- a/agent/engine.py
+++ b/agent/engine.py
@@ -431,22 +431,10 @@ def __post_init__(self) -> None:
                 acceptance_criteria=self.config.acceptance_criteria,
                 demo=self.config.demo,
             )
-        self._set_model_tool_defs(self.model, include_subtask=self.config.recursive)
-
-    def _build_tool_defs(self, *, include_subtask: bool) -> list[dict[str, Any]]:
         ac = self.config.acceptance_criteria
-        dynamic_defs = self.tools.get_chrome_mcp_tool_defs()
-        return get_tool_definitions(
-            include_subtask=include_subtask,
-            include_acceptance_criteria=ac,
-            dynamic_defs=dynamic_defs,
-        )
-
-    def _set_model_tool_defs(self, model: BaseModel, *, include_subtask: bool) -> list[dict[str, Any]]:
-        tool_defs = self._build_tool_defs(include_subtask=include_subtask)
-        if hasattr(model, "tool_defs"):
-            model.tool_defs = tool_defs
-        return tool_defs
+        tool_defs = get_tool_definitions(include_subtask=self.config.recursive, include_acceptance_criteria=ac)
+        if hasattr(self.model, "tool_defs"):
+            self.model.tool_defs = tool_defs
 
     def cancel(self) -> None:
         """Signal the engine to stop after the current model call or tool."""
@@ -474,7 +462,6 @@ def solve_with_context(
             self._shell_command_counts.clear()
         active_context = context if context is not None else ExternalContext()
         deadline = (time.monotonic() + self.config.max_solve_seconds) if self.config.max_solve_seconds > 0 else 0
-        self._set_model_tool_defs(self.model, include_subtask=self.config.recursive)
         try:
             result = self._solve_recursive(
                 objective=objective.strip(),
@@ -1504,10 +1491,10 @@ def _apply_tool_call(
             # Give executor full tools (no subtask, no execute).
             _saved_defs = None
             if exec_model and hasattr(exec_model, "tool_defs"):
-                exec_model.tool_defs = self._build_tool_defs(include_subtask=False)
+                exec_model.tool_defs = get_tool_definitions(include_subtask=False, include_acceptance_criteria=self.config.acceptance_criteria)
             elif exec_model is None and hasattr(cur, "tool_defs"):
                 _saved_defs = cur.tool_defs
-                cur.tool_defs = self._build_tool_defs(include_subtask=False)
+                cur.tool_defs = get_tool_definitions(include_subtask=False, include_acceptance_criteria=self.config.acceptance_criteria)
 
             self._emit(f"[d{depth}] >> executing leaf: {objective}", on_event)
             child_logger = (
@@ -1547,15 +1534,6 @@ def _apply_tool_call(
             limit = int(args.get("limit", 100) or 100)
             return False, self._read_artifact(aid, offset, limit)
 
-        dynamic_result = self.tools.try_execute_dynamic_tool(name, args)
-        if dynamic_result is not None:
-            if dynamic_result.image is not None:
-                self._pending_image.data = (
-                    dynamic_result.image.base64_data,
-                    dynamic_result.image.media_type,
-                )
-            return False, dynamic_result.content
-
         return False, f"Unknown action type: {name}"
 
     # ------------------------------------------------------------------
diff --git a/agent/settings.py b/agent/settings.py
index 448a211c..5b3b4f97 100644
--- a/agent/settings.py
+++ b/agent/settings.py
@@ -6,7 +6,6 @@
 
 
 VALID_REASONING_EFFORTS: set[str] = {"low", "medium", "high"}
-VALID_CHROME_MCP_CHANNELS: set[str] = {"stable", "beta", "dev", "canary"}
 
 
 def normalize_reasoning_effort(value: str | None) -> str | None:
@@ -23,35 +22,6 @@ def normalize_reasoning_effort(value: str | None) -> str | None:
     return cleaned
 
 
-def normalize_bool(value: bool | str | None) -> bool | None:
-    if value is None:
-        return None
-    if isinstance(value, bool):
-        return value
-    cleaned = value.strip().lower()
-    if not cleaned:
-        return None
-    if cleaned in {"1", "true", "yes", "on"}:
-        return True
-    if cleaned in {"0", "false", "no", "off"}:
-        return False
-    raise ValueError(f"Invalid boolean value '{value}'.")
-
-
-def normalize_chrome_mcp_channel(value: str | None) -> str | None:
-    if value is None:
-        return None
-    cleaned = value.strip().lower()
-    if not cleaned:
-        return None
-    if cleaned not in VALID_CHROME_MCP_CHANNELS:
-        raise ValueError(
-            f"Invalid Chrome MCP channel '{value}'. Expected one of: "
-            f"{', '.join(sorted(VALID_CHROME_MCP_CHANNELS))}"
-        )
-    return cleaned
-
-
 @dataclass(slots=True)
 class PersistentSettings:
     default_model: str | None = None
@@ -62,12 +32,6 @@ class PersistentSettings:
     default_model_cerebras: str | None = None
     default_model_zai: str | None = None
     default_model_ollama: str | None = None
-    chrome_mcp_enabled: bool | None = None
-    chrome_mcp_auto_connect: bool | None = None
-    chrome_mcp_browser_url: str | None = None
-    chrome_mcp_channel: str | None = None
-    chrome_mcp_connect_timeout_sec: int | None = None
-    chrome_mcp_rpc_timeout_sec: int | None = None
 
     def default_model_for_provider(self, provider: str) -> str | None:
         per_provider = {
@@ -95,20 +59,6 @@ def normalized(self) -> "PersistentSettings":
             default_model_cerebras=(self.default_model_cerebras or "").strip() or None,
             default_model_zai=(self.default_model_zai or "").strip() or None,
             default_model_ollama=(self.default_model_ollama or "").strip() or None,
-            chrome_mcp_enabled=normalize_bool(self.chrome_mcp_enabled),
-            chrome_mcp_auto_connect=normalize_bool(self.chrome_mcp_auto_connect),
-            chrome_mcp_browser_url=(self.chrome_mcp_browser_url or "").strip() or None,
-            chrome_mcp_channel=normalize_chrome_mcp_channel(self.chrome_mcp_channel),
-            chrome_mcp_connect_timeout_sec=(
-                max(1, int(self.chrome_mcp_connect_timeout_sec))
-                if self.chrome_mcp_connect_timeout_sec is not None
-                else None
-            ),
-            chrome_mcp_rpc_timeout_sec=(
-                max(1, int(self.chrome_mcp_rpc_timeout_sec))
-                if self.chrome_mcp_rpc_timeout_sec is not None
-                else None
-            ),
         )
 
     def to_json(self) -> dict[str, str]:
@@ -129,18 +79,6 @@ def to_json(self) -> dict[str, str]:
             payload["default_model_zai"] = self.default_model_zai
         if self.default_model_ollama:
             payload["default_model_ollama"] = self.default_model_ollama
-        if self.chrome_mcp_enabled is not None:
-            payload["chrome_mcp_enabled"] = self.chrome_mcp_enabled
-        if self.chrome_mcp_auto_connect is not None:
-            payload["chrome_mcp_auto_connect"] = self.chrome_mcp_auto_connect
-        if self.chrome_mcp_browser_url:
-            payload["chrome_mcp_browser_url"] = self.chrome_mcp_browser_url
-        if self.chrome_mcp_channel:
-            payload["chrome_mcp_channel"] = self.chrome_mcp_channel
-        if self.chrome_mcp_connect_timeout_sec is not None:
-            payload["chrome_mcp_connect_timeout_sec"] = self.chrome_mcp_connect_timeout_sec
-        if self.chrome_mcp_rpc_timeout_sec is not None:
-            payload["chrome_mcp_rpc_timeout_sec"] = self.chrome_mcp_rpc_timeout_sec
         return payload
 
     @classmethod
@@ -158,20 +96,6 @@ def from_json(cls, payload: dict | None) -> "PersistentSettings":
             default_model_cerebras=(str(payload.get("default_model_cerebras", "")).strip() or None),
             default_model_zai=(str(payload.get("default_model_zai", "")).strip() or None),
             default_model_ollama=(str(payload.get("default_model_ollama", "")).strip() or None),
-            chrome_mcp_enabled=payload.get("chrome_mcp_enabled"),
-            chrome_mcp_auto_connect=payload.get("chrome_mcp_auto_connect"),
-            chrome_mcp_browser_url=(str(payload.get("chrome_mcp_browser_url", "")).strip() or None),
-            chrome_mcp_channel=(str(payload.get("chrome_mcp_channel", "")).strip() or None),
-            chrome_mcp_connect_timeout_sec=(
-                int(payload["chrome_mcp_connect_timeout_sec"])
-                if payload.get("chrome_mcp_connect_timeout_sec") is not None
-                else None
-            ),
-            chrome_mcp_rpc_timeout_sec=(
-                int(payload["chrome_mcp_rpc_timeout_sec"])
-                if payload.get("chrome_mcp_rpc_timeout_sec") is not None
-                else None
-            ),
         ).normalized()
 
 
diff --git a/agent/tool_defs.py b/agent/tool_defs.py
index ce873da4..50f7a9cb 100644
--- a/agent/tool_defs.py
+++ b/agent/tool_defs.py
@@ -488,34 +488,6 @@
 _DELEGATION_TOOLS = {"subtask", "execute", "list_artifacts", "read_artifact"}
 
 
-def _merge_dynamic_definitions(
-    defs: list[dict[str, Any]],
-    dynamic_defs: list[dict[str, Any]] | None,
-) -> list[dict[str, Any]]:
-    if not dynamic_defs:
-        return defs
-    merged = list(defs)
-    seen = {str(item.get("name", "")).strip() for item in defs}
-    for item in dynamic_defs:
-        if not isinstance(item, dict):
-            continue
-        name = str(item.get("name", "")).strip()
-        if not name or name in seen:
-            continue
-        parameters = item.get("parameters")
-        if not isinstance(parameters, dict):
-            continue
-        merged.append(
-            {
-                "name": name,
-                "description": str(item.get("description", "") or ""),
-                "parameters": parameters,
-            }
-        )
-        seen.add(name)
-    return merged
-
-
 def _strip_acceptance_criteria(defs: list[dict[str, Any]]) -> list[dict[str, Any]]:
     """Remove acceptance_criteria property from subtask/execute schemas."""
     import copy
@@ -535,7 +507,6 @@ def get_tool_definitions(
     include_subtask: bool = True,
     include_artifacts: bool = False,
     include_acceptance_criteria: bool = False,
-    dynamic_defs: list[dict[str, Any]] | None = None,
 ) -> list[dict[str, Any]]:
     """Return tool definitions based on mode.
 
@@ -552,8 +523,6 @@ def get_tool_definitions(
     if include_artifacts:
         defs += [d for d in TOOL_DEFINITIONS if d["name"] in _ARTIFACT_TOOLS]
 
-    defs = _merge_dynamic_definitions(defs, dynamic_defs)
-
     if not include_acceptance_criteria:
         defs = _strip_acceptance_criteria(defs)
     return defs
diff --git a/agent/tools.py b/agent/tools.py
index d4e29bcd..c9a457cc 100644
--- a/agent/tools.py
+++ b/agent/tools.py
@@ -27,12 +27,6 @@
 
 _MAX_WALK_ENTRIES = 50_000
 
-from .chrome_mcp import (
-    ChromeMcpCallResult,
-    ChromeMcpError,
-    ChromeMcpStatus,
-    acquire_shared_manager,
-)
 from .patching import (
     AddFileOp,
     DeleteFileOp,
@@ -145,12 +139,6 @@ class WorkspaceTools:
     mistral_transcription_chunk_overlap_seconds: float = 2.0
     mistral_transcription_max_chunks: int = 48
     mistral_transcription_request_timeout_sec: int = 180
-    chrome_mcp_enabled: bool = False
-    chrome_mcp_auto_connect: bool = True
-    chrome_mcp_browser_url: str | None = None
-    chrome_mcp_channel: str = "stable"
-    chrome_mcp_connect_timeout_sec: int = 15
-    chrome_mcp_rpc_timeout_sec: int = 45
 
     def __post_init__(self) -> None:
         self.root = self.root.expanduser().resolve()
@@ -165,14 +153,6 @@ def __post_init__(self) -> None:
         self._parallel_write_claims: dict[str, dict[Path, str]] = {}
         self._parallel_lock = threading.Lock()
         self._scope_local = threading.local()
-        self._chrome_mcp = acquire_shared_manager(
-            enabled=self.chrome_mcp_enabled,
-            auto_connect=self.chrome_mcp_auto_connect,
-            browser_url=self.chrome_mcp_browser_url,
-            channel=self.chrome_mcp_channel,
-            connect_timeout_sec=self.chrome_mcp_connect_timeout_sec,
-            rpc_timeout_sec=self.chrome_mcp_rpc_timeout_sec,
-        )
 
     def _clip(self, text: str, max_chars: int) -> str:
         if len(text) <= max_chars:
@@ -364,49 +344,6 @@ def cleanup_bg_jobs(self) -> None:
                 pass
         self._bg_jobs.clear()
 
-    def chrome_mcp_status(self) -> ChromeMcpStatus:
-        if not self.chrome_mcp_enabled or self._chrome_mcp is None:
-            return ChromeMcpStatus(
-                status="disabled",
-                detail="Chrome DevTools MCP is disabled.",
-            )
-        return self._chrome_mcp.status_snapshot()
-
-    def get_chrome_mcp_tool_defs(self, *, force_refresh: bool = False) -> list[dict[str, Any]]:
-        if not self.chrome_mcp_enabled or self._chrome_mcp is None:
-            return []
-        try:
-            return [
-                tool.as_tool_definition()
-                for tool in self._chrome_mcp.list_tools(force_refresh=force_refresh)
-            ]
-        except ChromeMcpError:
-            return []
-
-    def try_execute_dynamic_tool(
-        self,
-        name: str,
-        arguments: dict[str, Any],
-    ) -> ChromeMcpCallResult | None:
-        if not self.chrome_mcp_enabled or self._chrome_mcp is None:
-            return None
-        try:
-            known_names = {tool.name for tool in self._chrome_mcp.list_tools()}
-        except ChromeMcpError as exc:
-            return ChromeMcpCallResult(
-                content=f"Chrome DevTools MCP unavailable: {exc}",
-                is_error=True,
-            )
-        if name not in known_names:
-            return None
-        try:
-            return self._chrome_mcp.call_tool(name, arguments)
-        except ChromeMcpError as exc:
-            return ChromeMcpCallResult(
-                content=f"Chrome DevTools MCP unavailable: {exc}",
-                is_error=True,
-            )
-
     def list_files(self, glob: str | None = None) -> str:
         lines: list[str]
         if shutil.which("rg"):
diff --git a/agent/tui.py b/agent/tui.py
index d71939a7..d206313d 100644
--- a/agent/tui.py
+++ b/agent/tui.py
@@ -15,16 +15,7 @@
 from .settings import SettingsStore
 
 
-SLASH_COMMANDS: list[str] = [
-    "/quit",
-    "/exit",
-    "/help",
-    "/status",
-    "/clear",
-    "/model",
-    "/reasoning",
-    "/chrome",
-]
+SLASH_COMMANDS: list[str] = ["/quit", "/exit", "/help", "/status", "/clear", "/model", "/reasoning"]
 
 
 def _queue_prompt_style():
@@ -115,7 +106,6 @@ def _build_splash() -> str:
     "  /model <name> --save  Switch and persist as default",
     "  /model list [all]   List available models",
     "  /reasoning [low|medium|high|off]  Change reasoning effort",
-    "  /chrome status|on|off|auto|url <endpoint>|channel <stable|beta|dev|canary> [--save]",
     "  /status  /clear  /quit  /exit  /help",
 ]
 
@@ -368,90 +358,6 @@ def _get_mode_label(cfg: AgentConfig) -> str:
     return "flat"
 
 
-def _format_chrome_status(ctx: ChatContext) -> list[str]:
-    status = ctx.runtime.engine.tools.chrome_mcp_status()
-    attach_mode = (
-        f"browser_url={ctx.cfg.chrome_mcp_browser_url}"
-        if ctx.cfg.chrome_mcp_browser_url
-        else ("auto-connect" if ctx.cfg.chrome_mcp_auto_connect else "manual-disabled")
-    )
-    lines = [
-        (
-            "Chrome MCP: "
-            f"enabled={ctx.cfg.chrome_mcp_enabled} | attach={attach_mode} | "
-            f"channel={ctx.cfg.chrome_mcp_channel}"
-        ),
-        f"Runtime status: {status.status} | {status.detail}",
-    ]
-    if status.tool_count:
-        lines.append(f"Discovered Chrome tools: {status.tool_count}")
-    return lines
-
-
-def handle_chrome_command(args: str, ctx: ChatContext) -> list[str]:
-    from .builder import build_engine
-
-    parts = [part for part in args.strip().split() if part]
-    save = False
-    if "--save" in parts:
-        save = True
-        parts = [part for part in parts if part != "--save"]
-
-    if not parts or parts[0] == "status":
-        lines = _format_chrome_status(ctx)
-        if not parts:
-            lines.append(
-                "Usage: /chrome status|on|off|auto|url <endpoint>|channel <stable|beta|dev|canary> [--save]"
-            )
-        return lines
-
-    action = parts[0].lower()
-    if action == "on":
-        ctx.cfg.chrome_mcp_enabled = True
-    elif action == "off":
-        ctx.cfg.chrome_mcp_enabled = False
-    elif action == "auto":
-        ctx.cfg.chrome_mcp_enabled = True
-        ctx.cfg.chrome_mcp_auto_connect = True
-        ctx.cfg.chrome_mcp_browser_url = None
-    elif action == "url":
-        if len(parts) < 2:
-            return ["Usage: /chrome url <endpoint> [--save]"]
-        ctx.cfg.chrome_mcp_enabled = True
-        ctx.cfg.chrome_mcp_auto_connect = False
-        ctx.cfg.chrome_mcp_browser_url = parts[1].strip() or None
-    elif action == "channel":
-        if len(parts) < 2:
-            return ["Usage: /chrome channel <stable|beta|dev|canary> [--save]"]
-        channel = parts[1].strip().lower()
-        if channel not in {"stable", "beta", "dev", "canary"}:
-            return [f"Invalid Chrome channel '{channel}'. Use: stable, beta, dev, canary"]
-        ctx.cfg.chrome_mcp_channel = channel
-    else:
-        return [
-            f"Unknown /chrome action '{action}'.",
-            "Usage: /chrome status|on|off|auto|url <endpoint>|channel <stable|beta|dev|canary> [--save]",
-        ]
-
-    try:
-        ctx.runtime.engine = build_engine(ctx.cfg)
-    except ModelError as exc:
-        return [f"Failed to apply Chrome MCP change: {exc}"]
-
-    lines = _format_chrome_status(ctx)
-    if save:
-        settings = ctx.settings_store.load()
-        settings.chrome_mcp_enabled = ctx.cfg.chrome_mcp_enabled
-        settings.chrome_mcp_auto_connect = ctx.cfg.chrome_mcp_auto_connect
-        settings.chrome_mcp_browser_url = ctx.cfg.chrome_mcp_browser_url
-        settings.chrome_mcp_channel = ctx.cfg.chrome_mcp_channel
-        settings.chrome_mcp_connect_timeout_sec = ctx.cfg.chrome_mcp_connect_timeout_sec
-        settings.chrome_mcp_rpc_timeout_sec = ctx.cfg.chrome_mcp_rpc_timeout_sec
-        ctx.settings_store.save(settings)
-        lines.append("Saved as workspace default.")
-    return lines
-
-
 def dispatch_slash_command(
     command: str,
     ctx: ChatContext,
@@ -479,8 +385,6 @@ def dispatch_slash_command(
                 )
         else:
             emit("  Tokens: (none yet)")
-        for line in _format_chrome_status(ctx):
-            emit(f"  {line}")
         return "handled"
     if command == "/clear":
         return "clear"
@@ -496,12 +400,6 @@ def dispatch_slash_command(
         for line in lines:
             emit(line)
         return "handled"
-    if command.startswith("/chrome"):
-        cmd_args = command[len("/chrome"):].strip()
-        lines = handle_chrome_command(cmd_args, ctx)
-        for line in lines:
-            emit(line)
-        return "handled"
     return None
 
 
diff --git a/openplanter-desktop/crates/op-core/src/config.rs b/openplanter-desktop/crates/op-core/src/config.rs
index 0be8c38f..378eaba6 100644
--- a/openplanter-desktop/crates/op-core/src/config.rs
+++ b/openplanter-desktop/crates/op-core/src/config.rs
@@ -22,9 +22,6 @@ pub const MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS: i64 = 900;
 pub const MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS: f64 = 2.0;
 pub const MISTRAL_TRANSCRIPTION_MAX_CHUNKS: i64 = 48;
 pub const MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC: i64 = 180;
-pub const CHROME_MCP_DEFAULT_CHANNEL: &str = "stable";
-pub const CHROME_MCP_CONNECT_TIMEOUT_SEC: i64 = 15;
-pub const CHROME_MCP_RPC_TIMEOUT_SEC: i64 = 45;
 
 /// Default model for each supported provider.
 pub static PROVIDER_DEFAULT_MODELS: LazyLock<HashMap<&'static str, &'static str>> =
@@ -92,22 +89,6 @@ pub fn normalize_web_search_provider(value: Option<&str>) -> String {
     }
 }
 
-pub fn normalize_chrome_mcp_channel(value: Option<&str>) -> String {
-    match value.unwrap_or_default().trim().to_lowercase().as_str() {
-        "beta" => "beta".to_string(),
-        "dev" => "dev".to_string(),
-        "canary" => "canary".to_string(),
-        _ => CHROME_MCP_DEFAULT_CHANNEL.to_string(),
-    }
-}
-
-pub fn normalize_chrome_mcp_browser_url(value: Option<&str>) -> Option<String> {
-    value
-        .map(str::trim)
-        .filter(|value| !value.is_empty())
-        .map(str::to_string)
-}
-
 fn normalize_base_url(value: &str) -> String {
     value.trim().trim_end_matches('/').to_string()
 }
@@ -219,12 +200,6 @@ pub struct AgentConfig {
     pub mistral_transcription_chunk_overlap_seconds: f64,
     pub mistral_transcription_max_chunks: i64,
     pub mistral_transcription_request_timeout_sec: i64,
-    pub chrome_mcp_enabled: bool,
-    pub chrome_mcp_auto_connect: bool,
-    pub chrome_mcp_browser_url: Option<String>,
-    pub chrome_mcp_channel: String,
-    pub chrome_mcp_connect_timeout_sec: i64,
-    pub chrome_mcp_rpc_timeout_sec: i64,
 
     // Limits
     pub max_depth: i64,
@@ -297,12 +272,6 @@ impl Default for AgentConfig {
                 MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS,
             mistral_transcription_max_chunks: MISTRAL_TRANSCRIPTION_MAX_CHUNKS,
             mistral_transcription_request_timeout_sec: MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC,
-            chrome_mcp_enabled: false,
-            chrome_mcp_auto_connect: true,
-            chrome_mcp_browser_url: None,
-            chrome_mcp_channel: CHROME_MCP_DEFAULT_CHANNEL.into(),
-            chrome_mcp_connect_timeout_sec: CHROME_MCP_CONNECT_TIMEOUT_SEC,
-            chrome_mcp_rpc_timeout_sec: CHROME_MCP_RPC_TIMEOUT_SEC,
             max_depth: 4,
             max_steps_per_call: 100,
             budget_extension_enabled: true,
@@ -399,8 +368,6 @@ impl AgentConfig {
         });
         let web_search_provider =
             normalize_web_search_provider(env_opt("OPENPLANTER_WEB_SEARCH_PROVIDER").as_deref());
-        let chrome_mcp_enabled = env_bool("OPENPLANTER_CHROME_MCP_ENABLED", false);
-        let chrome_mcp_auto_connect = env_bool("OPENPLANTER_CHROME_MCP_AUTO_CONNECT", true);
 
         Self {
             workspace: ws,
@@ -470,24 +437,6 @@ impl AgentConfig {
                 "OPENPLANTER_MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC",
                 MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC,
             ),
-            chrome_mcp_enabled,
-            chrome_mcp_auto_connect,
-            chrome_mcp_browser_url: normalize_chrome_mcp_browser_url(
-                env_opt("OPENPLANTER_CHROME_MCP_BROWSER_URL").as_deref(),
-            ),
-            chrome_mcp_channel: normalize_chrome_mcp_channel(
-                env_opt("OPENPLANTER_CHROME_MCP_CHANNEL").as_deref(),
-            ),
-            chrome_mcp_connect_timeout_sec: env_int(
-                "OPENPLANTER_CHROME_MCP_CONNECT_TIMEOUT_SEC",
-                CHROME_MCP_CONNECT_TIMEOUT_SEC,
-            )
-            .max(1),
-            chrome_mcp_rpc_timeout_sec: env_int(
-                "OPENPLANTER_CHROME_MCP_RPC_TIMEOUT_SEC",
-                CHROME_MCP_RPC_TIMEOUT_SEC,
-            )
-            .max(1),
             max_depth: env_int("OPENPLANTER_MAX_DEPTH", 4),
             max_steps_per_call: env_int("OPENPLANTER_MAX_STEPS", 100),
             budget_extension_enabled: env_bool("OPENPLANTER_BUDGET_EXTENSION_ENABLED", true),
diff --git a/openplanter-desktop/crates/op-core/src/config_hydration.rs b/openplanter-desktop/crates/op-core/src/config_hydration.rs
index dd472209..e1e81c36 100644
--- a/openplanter-desktop/crates/op-core/src/config_hydration.rs
+++ b/openplanter-desktop/crates/op-core/src/config_hydration.rs
@@ -103,42 +103,6 @@ pub fn apply_settings_to_config(cfg: &mut AgentConfig, settings: &PersistentSett
         }
     }
 
-    if !has_env_value(&["OPENPLANTER_CHROME_MCP_ENABLED"]) {
-        if let Some(enabled) = settings.chrome_mcp_enabled {
-            cfg.chrome_mcp_enabled = enabled;
-        }
-    }
-
-    if !has_env_value(&["OPENPLANTER_CHROME_MCP_AUTO_CONNECT"]) {
-        if let Some(auto_connect) = settings.chrome_mcp_auto_connect {
-            cfg.chrome_mcp_auto_connect = auto_connect;
-        }
-    }
-
-    if !has_env_value(&["OPENPLANTER_CHROME_MCP_BROWSER_URL"]) {
-        if let Some(browser_url) = settings.chrome_mcp_browser_url.as_deref() {
-            cfg.chrome_mcp_browser_url = Some(browser_url.to_string());
-        }
-    }
-
-    if !has_env_value(&["OPENPLANTER_CHROME_MCP_CHANNEL"]) {
-        if let Some(channel) = settings.chrome_mcp_channel.as_deref() {
-            cfg.chrome_mcp_channel = channel.to_string();
-        }
-    }
-
-    if !has_env_value(&["OPENPLANTER_CHROME_MCP_CONNECT_TIMEOUT_SEC"]) {
-        if let Some(timeout) = settings.chrome_mcp_connect_timeout_sec {
-            cfg.chrome_mcp_connect_timeout_sec = timeout.max(1);
-        }
-    }
-
-    if !has_env_value(&["OPENPLANTER_CHROME_MCP_RPC_TIMEOUT_SEC"]) {
-        if let Some(timeout) = settings.chrome_mcp_rpc_timeout_sec {
-            cfg.chrome_mcp_rpc_timeout_sec = timeout.max(1);
-        }
-    }
-
     if !has_env_value(&["OPENPLANTER_MODEL"]) {
         let saved_model = if cfg.provider == "auto" {
             settings.default_model.as_deref()
diff --git a/openplanter-desktop/crates/op-core/src/engine/mod.rs b/openplanter-desktop/crates/op-core/src/engine/mod.rs
index be16d40a..4b6faa18 100644
--- a/openplanter-desktop/crates/op-core/src/engine/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/mod.rs
@@ -9,7 +9,6 @@ pub mod investigation_state;
 pub mod judge;
 
 use std::collections::HashSet;
-use std::sync::Arc;
 use std::time::Duration;
 
 use anyhow::anyhow;
@@ -796,26 +795,6 @@ pub async fn solve_with_initial_context(
     emitter: &dyn SolveEmitter,
     cancel: CancellationToken,
     initial_context: Option<SolveInitialContext>,
-) {
-    solve_with_initial_context_and_chrome_mcp(
-        objective,
-        config,
-        emitter,
-        cancel,
-        initial_context,
-        None,
-    )
-    .await;
-}
-
-/// Real solve flow with optional initial structured context and shared Chrome MCP manager.
-pub async fn solve_with_initial_context_and_chrome_mcp(
-    objective: &str,
-    config: &AgentConfig,
-    emitter: &dyn SolveEmitter,
-    cancel: CancellationToken,
-    initial_context: Option<SolveInitialContext>,
-    chrome_mcp: Option<Arc<crate::tools::chrome_mcp::ChromeMcpManager>>,
 ) {
     if config.demo {
         return demo_solve(objective, emitter, cancel).await;
@@ -834,21 +813,8 @@ pub async fn solve_with_initial_context_and_chrome_mcp(
     emitter.emit_trace(&format!("Solving with {}/{}", provider, model.model_name()));
 
     // 2. Build tools and messages
-    let dynamic_tool_defs = if let Some(manager) = chrome_mcp.as_ref() {
-        match manager.list_tools(false).await {
-            Ok(defs) => defs,
-            Err(err) => {
-                emitter.emit_trace(&format!(
-                    "[chrome-mcp] unavailable; continuing with built-in tools only: {err}"
-                ));
-                Vec::new()
-            }
-        }
-    } else {
-        Vec::new()
-    };
-    let tool_defs = build_tool_defs(&provider, &dynamic_tool_defs);
-    let mut tools = WorkspaceTools::new(config, chrome_mcp);
+    let tool_defs = build_tool_defs(&provider);
+    let mut tools = WorkspaceTools::new(config);
 
     let system_prompt =
         build_system_prompt(config.recursive, config.acceptance_criteria, config.demo);
diff --git a/openplanter-desktop/crates/op-core/src/events.rs b/openplanter-desktop/crates/op-core/src/events.rs
index 1a49f147..326c6d0b 100644
--- a/openplanter-desktop/crates/op-core/src/events.rs
+++ b/openplanter-desktop/crates/op-core/src/events.rs
@@ -201,14 +201,6 @@ pub struct ConfigView {
     pub reasoning_effort: Option<String>,
     pub zai_plan: String,
     pub web_search_provider: String,
-    pub chrome_mcp_enabled: bool,
-    pub chrome_mcp_auto_connect: bool,
-    pub chrome_mcp_browser_url: Option<String>,
-    pub chrome_mcp_channel: String,
-    pub chrome_mcp_connect_timeout_sec: i64,
-    pub chrome_mcp_rpc_timeout_sec: i64,
-    pub chrome_mcp_status: String,
-    pub chrome_mcp_status_detail: String,
     pub workspace: String,
     pub session_id: Option<String>,
     pub recursive: bool,
@@ -225,12 +217,6 @@ pub struct PartialConfig {
     pub reasoning_effort: Option<String>,
     pub zai_plan: Option<String>,
     pub web_search_provider: Option<String>,
-    pub chrome_mcp_enabled: Option<bool>,
-    pub chrome_mcp_auto_connect: Option<bool>,
-    pub chrome_mcp_browser_url: Option<String>,
-    pub chrome_mcp_channel: Option<String>,
-    pub chrome_mcp_connect_timeout_sec: Option<i64>,
-    pub chrome_mcp_rpc_timeout_sec: Option<i64>,
 }
 
 /// Model information for the model list.
diff --git a/openplanter-desktop/crates/op-core/src/settings.rs b/openplanter-desktop/crates/op-core/src/settings.rs
index b250492e..de0688f6 100644
--- a/openplanter-desktop/crates/op-core/src/settings.rs
+++ b/openplanter-desktop/crates/op-core/src/settings.rs
@@ -1,12 +1,10 @@
+use std::collections::HashMap;
 use std::fs;
 use std::path::{Path, PathBuf};
 
 use serde::{Deserialize, Serialize};
 
-use crate::config::{
-    normalize_chrome_mcp_browser_url, normalize_chrome_mcp_channel,
-    normalize_web_search_provider, normalize_zai_plan,
-};
+use crate::config::{normalize_web_search_provider, normalize_zai_plan};
 
 const VALID_REASONING_EFFORTS: &[&str] = &["low", "medium", "high"];
 
@@ -31,20 +29,6 @@ pub fn normalize_reasoning_effort(value: Option<&str>) -> Result<Option<String>,
     }
 }
 
-pub fn normalize_bool(value: Option<&serde_json::Value>) -> Result<Option<bool>, String> {
-    match value {
-        None | Some(serde_json::Value::Null) => Ok(None),
-        Some(serde_json::Value::Bool(value)) => Ok(Some(*value)),
-        Some(serde_json::Value::String(value)) => match value.trim().to_lowercase().as_str() {
-            "" => Ok(None),
-            "1" | "true" | "yes" | "on" => Ok(Some(true)),
-            "0" | "false" | "no" | "off" => Ok(Some(false)),
-            _ => Err(format!("Invalid boolean value '{}'.", value)),
-        },
-        Some(other) => Err(format!("Invalid boolean value '{}'.", other)),
-    }
-}
-
 /// Persistent settings stored per workspace.
 ///
 /// Mirrors the Python `PersistentSettings` dataclass.
@@ -60,12 +44,6 @@ pub struct PersistentSettings {
     pub default_model_ollama: Option<String>,
     pub zai_plan: Option<String>,
     pub web_search_provider: Option<String>,
-    pub chrome_mcp_enabled: Option<bool>,
-    pub chrome_mcp_auto_connect: Option<bool>,
-    pub chrome_mcp_browser_url: Option<String>,
-    pub chrome_mcp_channel: Option<String>,
-    pub chrome_mcp_connect_timeout_sec: Option<i64>,
-    pub chrome_mcp_rpc_timeout_sec: Option<i64>,
 }
 
 impl PersistentSettings {
@@ -124,27 +102,16 @@ impl PersistentSettings {
             default_model_ollama: trim_opt(&self.default_model_ollama),
             zai_plan,
             web_search_provider,
-            chrome_mcp_enabled: self.chrome_mcp_enabled,
-            chrome_mcp_auto_connect: self.chrome_mcp_auto_connect,
-            chrome_mcp_browser_url: normalize_chrome_mcp_browser_url(
-                self.chrome_mcp_browser_url.as_deref(),
-            ),
-            chrome_mcp_channel: self
-                .chrome_mcp_channel
-                .as_deref()
-                .map(|value| normalize_chrome_mcp_channel(Some(value))),
-            chrome_mcp_connect_timeout_sec: self.chrome_mcp_connect_timeout_sec.map(|value| value.max(1)),
-            chrome_mcp_rpc_timeout_sec: self.chrome_mcp_rpc_timeout_sec.map(|value| value.max(1)),
         })
     }
 
     /// Serialize to JSON map, omitting `None` values.
-    pub fn to_json(&self) -> serde_json::Map<String, serde_json::Value> {
-        let mut payload = serde_json::Map::new();
+    pub fn to_json(&self) -> HashMap<String, String> {
+        let mut payload = HashMap::new();
         macro_rules! add {
             ($field:ident, $key:expr) => {
                 if let Some(ref v) = self.$field {
-                    payload.insert($key.to_string(), serde_json::json!(v));
+                    payload.insert($key.to_string(), v.clone());
                 }
             };
         }
@@ -158,12 +125,6 @@ impl PersistentSettings {
         add!(default_model_ollama, "default_model_ollama");
         add!(zai_plan, "zai_plan");
         add!(web_search_provider, "web_search_provider");
-        add!(chrome_mcp_enabled, "chrome_mcp_enabled");
-        add!(chrome_mcp_auto_connect, "chrome_mcp_auto_connect");
-        add!(chrome_mcp_browser_url, "chrome_mcp_browser_url");
-        add!(chrome_mcp_channel, "chrome_mcp_channel");
-        add!(chrome_mcp_connect_timeout_sec, "chrome_mcp_connect_timeout_sec");
-        add!(chrome_mcp_rpc_timeout_sec, "chrome_mcp_rpc_timeout_sec");
         payload
     }
 
@@ -192,19 +153,6 @@ impl PersistentSettings {
             default_model_ollama: get_str(obj, "default_model_ollama"),
             zai_plan: get_str(obj, "zai_plan"),
             web_search_provider: get_str(obj, "web_search_provider"),
-            chrome_mcp_enabled: normalize_bool(obj.get("chrome_mcp_enabled"))?,
-            chrome_mcp_auto_connect: normalize_bool(obj.get("chrome_mcp_auto_connect"))?,
-            chrome_mcp_browser_url: normalize_chrome_mcp_browser_url(
-                get_str(obj, "chrome_mcp_browser_url").as_deref(),
-            ),
-            chrome_mcp_channel: get_str(obj, "chrome_mcp_channel")
-                .map(|value| normalize_chrome_mcp_channel(Some(&value))),
-            chrome_mcp_connect_timeout_sec: obj
-                .get("chrome_mcp_connect_timeout_sec")
-                .and_then(|value| value.as_i64()),
-            chrome_mcp_rpc_timeout_sec: obj
-                .get("chrome_mcp_rpc_timeout_sec")
-                .and_then(|value| value.as_i64()),
         };
         settings.normalized()
     }
diff --git a/openplanter-desktop/crates/op-core/src/tools/chrome_mcp.rs b/openplanter-desktop/crates/op-core/src/tools/chrome_mcp.rs
deleted file mode 100644
index b4e7d14a..00000000
--- a/openplanter-desktop/crates/op-core/src/tools/chrome_mcp.rs
+++ /dev/null
@@ -1,596 +0,0 @@
-use std::env;
-use std::process::Stdio;
-use std::sync::Arc;
-use std::time::Duration;
-
-use anyhow::{Context, anyhow};
-use chrono::Utc;
-use serde::{Deserialize, Serialize};
-use serde_json::{Value, json};
-use tokio::io::{AsyncBufReadExt, AsyncWriteExt, BufReader, Lines};
-use tokio::process::{Child, ChildStderr, ChildStdin, ChildStdout, Command};
-use tokio::sync::Mutex;
-use tokio::task::JoinHandle;
-use tokio::time::timeout;
-
-use crate::config::{
-    AgentConfig, normalize_chrome_mcp_browser_url, normalize_chrome_mcp_channel,
-};
-
-#[derive(Debug, Clone, PartialEq, Eq)]
-pub struct ChromeMcpConfigKey {
-    pub enabled: bool,
-    pub auto_connect: bool,
-    pub browser_url: Option<String>,
-    pub channel: String,
-    pub connect_timeout_sec: i64,
-    pub rpc_timeout_sec: i64,
-}
-
-impl ChromeMcpConfigKey {
-    pub fn from_config(config: &AgentConfig) -> Self {
-        Self {
-            enabled: config.chrome_mcp_enabled,
-            auto_connect: config.chrome_mcp_auto_connect,
-            browser_url: normalize_chrome_mcp_browser_url(config.chrome_mcp_browser_url.as_deref()),
-            channel: normalize_chrome_mcp_channel(Some(&config.chrome_mcp_channel)),
-            connect_timeout_sec: config.chrome_mcp_connect_timeout_sec.max(1),
-            rpc_timeout_sec: config.chrome_mcp_rpc_timeout_sec.max(1),
-        }
-    }
-}
-
-#[derive(Debug, Clone, Serialize, Deserialize, PartialEq)]
-pub struct ChromeMcpToolDef {
-    pub name: String,
-    pub description: String,
-    pub parameters: Value,
-}
-
-#[derive(Debug, Clone, Serialize, Deserialize, PartialEq, Eq)]
-pub struct ChromeMcpStatus {
-    pub status: String,
-    pub detail: String,
-    pub tool_count: usize,
-    #[serde(default, skip_serializing_if = "Option::is_none")]
-    pub last_refresh_ms: Option<i64>,
-}
-
-impl ChromeMcpStatus {
-    fn disabled() -> Self {
-        Self {
-            status: "disabled".into(),
-            detail: "Chrome DevTools MCP is disabled.".into(),
-            tool_count: 0,
-            last_refresh_ms: None,
-        }
-    }
-
-    fn pending() -> Self {
-        Self {
-            status: "ready".into(),
-            detail: "Chrome DevTools MCP will initialize on the next solve.".into(),
-            tool_count: 0,
-            last_refresh_ms: None,
-        }
-    }
-}
-
-struct ChromeMcpInner {
-    child: Option<Child>,
-    stdin: Option<ChildStdin>,
-    stdout: Option<Lines<BufReader<ChildStdout>>>,
-    stderr_task: Option<JoinHandle<()>>,
-    stderr_tail: Arc<Mutex<Vec<String>>>,
-    next_request_id: u64,
-    tools: Vec<ChromeMcpToolDef>,
-    last_refresh_ms: Option<i64>,
-    status: ChromeMcpStatus,
-}
-
-impl ChromeMcpInner {
-    fn new(enabled: bool) -> Self {
-        Self {
-            child: None,
-            stdin: None,
-            stdout: None,
-            stderr_task: None,
-            stderr_tail: Arc::new(Mutex::new(Vec::new())),
-            next_request_id: 1,
-            tools: Vec::new(),
-            last_refresh_ms: None,
-            status: if enabled {
-                ChromeMcpStatus::pending()
-            } else {
-                ChromeMcpStatus::disabled()
-            },
-        }
-    }
-}
-
-pub struct ChromeMcpManager {
-    config: ChromeMcpConfigKey,
-    inner: Mutex<ChromeMcpInner>,
-}
-
-impl ChromeMcpManager {
-    pub fn new(config: ChromeMcpConfigKey) -> Self {
-        let enabled = config.enabled;
-        Self {
-            config,
-            inner: Mutex::new(ChromeMcpInner::new(enabled)),
-        }
-    }
-
-    pub async fn status_snapshot(&self) -> ChromeMcpStatus {
-        self.inner.lock().await.status.clone()
-    }
-
-    pub async fn list_tools(&self, force_refresh: bool) -> anyhow::Result<Vec<ChromeMcpToolDef>> {
-        if !self.config.enabled {
-            return Ok(Vec::new());
-        }
-        let mut last_error: Option<anyhow::Error> = None;
-        for attempt in 0..2 {
-            let mut inner = self.inner.lock().await;
-            match self.list_tools_locked(&mut inner, force_refresh).await {
-                Ok(tools) => return Ok(tools),
-                Err(err) => {
-                    last_error = Some(err);
-                    self.shutdown_locked(&mut inner).await;
-                    if attempt == 0 {
-                        continue;
-                    }
-                }
-            }
-        }
-        Err(last_error.unwrap_or_else(|| anyhow!("Chrome DevTools MCP tools/list failed")))
-    }
-
-    pub async fn call_tool(&self, name: &str, arguments: &Value) -> anyhow::Result<String> {
-        if !self.config.enabled {
-            return Err(anyhow!("Chrome DevTools MCP is disabled."));
-        }
-        let mut last_error: Option<anyhow::Error> = None;
-        for attempt in 0..2 {
-            let mut inner = self.inner.lock().await;
-            match self.call_tool_locked(&mut inner, name, arguments).await {
-                Ok(result) => return Ok(result),
-                Err(err) => {
-                    last_error = Some(err);
-                    self.shutdown_locked(&mut inner).await;
-                    if attempt == 0 {
-                        continue;
-                    }
-                }
-            }
-        }
-        Err(last_error.unwrap_or_else(|| anyhow!("Chrome DevTools MCP tools/call failed")))
-    }
-
-    pub async fn shutdown(&self) {
-        let mut inner = self.inner.lock().await;
-        self.shutdown_locked(&mut inner).await;
-    }
-
-    async fn list_tools_locked(
-        &self,
-        inner: &mut ChromeMcpInner,
-        force_refresh: bool,
-    ) -> anyhow::Result<Vec<ChromeMcpToolDef>> {
-        if !force_refresh && !inner.tools.is_empty() {
-            return Ok(inner.tools.clone());
-        }
-        self.ensure_connected_locked(inner).await?;
-        let mut tools = Vec::new();
-        let mut cursor: Option<String> = None;
-        loop {
-            let mut params = serde_json::Map::new();
-            if let Some(current) = cursor.as_deref() {
-                params.insert("cursor".into(), Value::String(current.to_string()));
-            }
-            let result = self
-                .request_locked(
-                    inner,
-                    "tools/list",
-                    Value::Object(params),
-                    self.config.rpc_timeout_sec,
-                )
-                .await?;
-            if let Some(items) = result.get("tools").and_then(|value| value.as_array()) {
-                for item in items {
-                    let Some(name) = item.get("name").and_then(|value| value.as_str()) else {
-                        continue;
-                    };
-                    let description = item
-                        .get("description")
-                        .and_then(|value| value.as_str())
-                        .unwrap_or_default()
-                        .to_string();
-                    let parameters = item
-                        .get("inputSchema")
-                        .cloned()
-                        .unwrap_or_else(|| json!({"type":"object","properties":{},"required":[]}));
-                    tools.push(ChromeMcpToolDef {
-                        name: name.to_string(),
-                        description,
-                        parameters,
-                    });
-                }
-            }
-            cursor = result
-                .get("nextCursor")
-                .and_then(|value| value.as_str())
-                .map(str::to_string);
-            if cursor.is_none() {
-                break;
-            }
-        }
-        let status = ChromeMcpStatus {
-            status: "ready".into(),
-            detail: format!(
-                "Chrome DevTools MCP ready with {} tool(s) via {}.",
-                tools.len(),
-                if self.config.browser_url.is_some() {
-                    "browser_url"
-                } else {
-                    "auto-connect"
-                }
-            ),
-            tool_count: tools.len(),
-            last_refresh_ms: Some(Utc::now().timestamp_millis()),
-        };
-        inner.last_refresh_ms = status.last_refresh_ms;
-        inner.status = status;
-        inner.tools = tools.clone();
-        Ok(tools)
-    }
-
-    async fn call_tool_locked(
-        &self,
-        inner: &mut ChromeMcpInner,
-        name: &str,
-        arguments: &Value,
-    ) -> anyhow::Result<String> {
-        self.ensure_connected_locked(inner).await?;
-        if inner.tools.is_empty() {
-            let _ = self.list_tools_locked(inner, false).await?;
-        }
-        let result = self
-            .request_locked(
-                inner,
-                "tools/call",
-                json!({
-                    "name": name,
-                    "arguments": arguments,
-                }),
-                self.config.rpc_timeout_sec,
-            )
-            .await?;
-        Ok(parse_call_result(&result))
-    }
-
-    async fn ensure_connected_locked(&self, inner: &mut ChromeMcpInner) -> anyhow::Result<()> {
-        if !self.config.enabled {
-            inner.status = ChromeMcpStatus::disabled();
-            return Ok(());
-        }
-        if inner.child.is_some() && inner.stdin.is_some() && inner.stdout.is_some() {
-            return Ok(());
-        }
-        if self.config.browser_url.is_none() && !self.config.auto_connect {
-            let detail = "Chrome DevTools MCP is enabled but cannot attach: set `chrome_mcp_browser_url` or enable `chrome_mcp_auto_connect`.".to_string();
-            inner.status = ChromeMcpStatus {
-                status: "unavailable".into(),
-                detail: detail.clone(),
-                tool_count: inner.tools.len(),
-                last_refresh_ms: inner.last_refresh_ms,
-            };
-            return Err(anyhow!(detail));
-        }
-        self.spawn_locked(inner).await?;
-        if let Err(err) = self
-            .request_locked(
-                inner,
-                "initialize",
-                json!({
-                    "protocolVersion": "2025-11-25",
-                    "capabilities": {},
-                    "clientInfo": { "name": "openplanter-desktop", "version": "1.0" }
-                }),
-                self.config.connect_timeout_sec,
-            )
-            .await
-        {
-            let detail = self.status_detail_from_error(&err, inner).await;
-            inner.status = ChromeMcpStatus {
-                status: "unavailable".into(),
-                detail: detail.clone(),
-                tool_count: inner.tools.len(),
-                last_refresh_ms: inner.last_refresh_ms,
-            };
-            return Err(anyhow!(detail));
-        }
-        self.notify_locked(inner, "notifications/initialized", json!({}))
-            .await?;
-        inner.status = ChromeMcpStatus::pending();
-        Ok(())
-    }
-
-    async fn request_locked(
-        &self,
-        inner: &mut ChromeMcpInner,
-        method: &str,
-        params: Value,
-        timeout_sec: i64,
-    ) -> anyhow::Result<Value> {
-        let request_id = inner.next_request_id;
-        inner.next_request_id += 1;
-        let payload = json!({
-            "jsonrpc": "2.0",
-            "id": request_id,
-            "method": method,
-            "params": params,
-        });
-        let stdin = inner
-            .stdin
-            .as_mut()
-            .ok_or_else(|| anyhow!("Chrome DevTools MCP stdin is unavailable"))?;
-        stdin
-            .write_all(format!("{}\n", payload).as_bytes())
-            .await
-            .with_context(|| format!("failed to write Chrome DevTools MCP request {method}"))?;
-        stdin.flush().await?;
-
-        let stdout = inner
-            .stdout
-            .as_mut()
-            .ok_or_else(|| anyhow!("Chrome DevTools MCP stdout is unavailable"))?;
-        let response = timeout(
-            Duration::from_secs(timeout_sec.max(1) as u64),
-            async {
-                loop {
-                    let maybe_line = stdout.next_line().await?;
-                    let line = maybe_line.ok_or_else(|| anyhow!("Chrome DevTools MCP closed stdout"))?;
-                    let Ok(payload): Result<Value, _> = serde_json::from_str(&line) else {
-                        continue;
-                    };
-                    let Some(id) = payload.get("id").and_then(|value| value.as_u64()) else {
-                        continue;
-                    };
-                    if id == request_id {
-                        return Ok::<Value, anyhow::Error>(payload);
-                    }
-                }
-            },
-        )
-        .await
-        .map_err(|_| anyhow!("Timed out waiting for Chrome DevTools MCP {method} response."))??;
-
-        if let Some(err) = response.get("error") {
-            return Err(anyhow!(format_protocol_error(err)));
-        }
-
-        Ok(response.get("result").cloned().unwrap_or(Value::Null))
-    }
-
-    async fn notify_locked(
-        &self,
-        inner: &mut ChromeMcpInner,
-        method: &str,
-        params: Value,
-    ) -> anyhow::Result<()> {
-        let stdin = inner
-            .stdin
-            .as_mut()
-            .ok_or_else(|| anyhow!("Chrome DevTools MCP stdin is unavailable"))?;
-        let payload = json!({
-            "jsonrpc": "2.0",
-            "method": method,
-            "params": params,
-        });
-        stdin
-            .write_all(format!("{}\n", payload).as_bytes())
-            .await
-            .with_context(|| format!("failed to write Chrome DevTools MCP notification {method}"))?;
-        stdin.flush().await?;
-        Ok(())
-    }
-
-    async fn spawn_locked(&self, inner: &mut ChromeMcpInner) -> anyhow::Result<()> {
-        self.shutdown_locked(inner).await;
-        let command = env::var("OPENPLANTER_CHROME_MCP_COMMAND").unwrap_or_else(|_| "npx".into());
-        let package = env::var("OPENPLANTER_CHROME_MCP_PACKAGE")
-            .unwrap_or_else(|_| "chrome-devtools-mcp@latest".into());
-        let mut args = vec!["-y".to_string(), package];
-        if let Some(browser_url) = self.config.browser_url.as_deref() {
-            args.push(format!("--browserUrl={browser_url}"));
-        } else {
-            args.push("--autoConnect".into());
-            args.push(format!("--channel={}", self.config.channel));
-        }
-        if let Ok(extra_args) = env::var("OPENPLANTER_CHROME_MCP_EXTRA_ARGS") {
-            args.extend(extra_args.split_whitespace().map(str::to_string));
-        }
-        let mut child = Command::new(&command)
-            .args(&args)
-            .stdin(Stdio::piped())
-            .stdout(Stdio::piped())
-            .stderr(Stdio::piped())
-            .spawn()
-            .with_context(|| {
-                format!(
-                    "failed to spawn Chrome DevTools MCP command `{}`. Install Node.js/npm so `npx` is available locally.",
-                    command
-                )
-            })?;
-
-        let stdin = child
-            .stdin
-            .take()
-            .ok_or_else(|| anyhow!("Chrome DevTools MCP stdin pipe is unavailable"))?;
-        let stdout = child
-            .stdout
-            .take()
-            .ok_or_else(|| anyhow!("Chrome DevTools MCP stdout pipe is unavailable"))?;
-        let stderr = child
-            .stderr
-            .take()
-            .ok_or_else(|| anyhow!("Chrome DevTools MCP stderr pipe is unavailable"))?;
-        let stderr_tail = inner.stderr_tail.clone();
-        inner.stderr_task = Some(tokio::spawn(async move {
-            let _ = read_stderr(stderr, stderr_tail).await;
-        }));
-        inner.stdin = Some(stdin);
-        inner.stdout = Some(BufReader::new(stdout).lines());
-        inner.child = Some(child);
-        Ok(())
-    }
-
-    async fn shutdown_locked(&self, inner: &mut ChromeMcpInner) {
-        if let Some(task) = inner.stderr_task.take() {
-            task.abort();
-        }
-        inner.stdin = None;
-        inner.stdout = None;
-        if let Some(mut child) = inner.child.take() {
-            let _ = child.kill().await;
-            let _ = child.wait().await;
-        }
-    }
-
-    async fn status_detail_from_error(
-        &self,
-        error: &anyhow::Error,
-        inner: &ChromeMcpInner,
-    ) -> String {
-        let mut detail = error.to_string();
-        let stderr_tail = inner.stderr_tail.lock().await.clone();
-        let stderr_text = stderr_tail
-            .iter()
-            .rev()
-            .take(4)
-            .cloned()
-            .collect::<Vec<_>>()
-            .into_iter()
-            .rev()
-            .collect::<Vec<_>>()
-            .join(" ");
-        let lower = format!("{detail} {stderr_text}").to_lowercase();
-        if !stderr_text.trim().is_empty() {
-            detail = format!("{detail} stderr: {stderr_text}");
-        }
-        if lower.contains("timed out") || lower.contains("timeout") {
-            if self.config.browser_url.is_some() {
-                detail.push_str(" Confirm the configured browser URL is reachable.");
-            } else {
-                detail.push_str(
-                    " Enable Chrome remote debugging at chrome://inspect/#remote-debugging and allow the connection prompt in Chrome.",
-                );
-            }
-        }
-        if lower.contains("no such file") || lower.contains("not found") || lower.contains("spawn") {
-            detail.push_str(" Install Node.js/npm so `npx` is available locally.");
-        }
-        if self.config.browser_url.is_none() && !lower.contains("inspect/#remote-debugging") {
-            detail.push_str(
-                " Chrome 144+ must have remote debugging enabled at chrome://inspect/#remote-debugging.",
-            );
-        }
-        detail
-    }
-}
-
-async fn read_stderr(stderr: ChildStderr, sink: Arc<Mutex<Vec<String>>>) -> anyhow::Result<()> {
-    let mut lines = BufReader::new(stderr).lines();
-    while let Some(line) = lines.next_line().await? {
-        let mut sink = sink.lock().await;
-        sink.push(line);
-        if sink.len() > 20 {
-            let excess = sink.len() - 20;
-            sink.drain(0..excess);
-        }
-    }
-    Ok(())
-}
-
-fn format_protocol_error(error: &Value) -> String {
-    let message = error
-        .get("message")
-        .and_then(|value| value.as_str())
-        .unwrap_or("Unknown MCP error");
-    match error.get("code").and_then(|value| value.as_i64()) {
-        Some(code) => format!("{message} (code {code})"),
-        None => message.to_string(),
-    }
-}
-
-fn parse_call_result(result: &Value) -> String {
-    let mut content_parts: Vec<String> = Vec::new();
-    if let Some(content) = result.get("content").and_then(|value| value.as_array()) {
-        for item in content {
-            if let Some(text) = item.as_str() {
-                if !text.trim().is_empty() {
-                    content_parts.push(text.trim().to_string());
-                }
-                continue;
-            }
-            let item_type = item
-                .get("type")
-                .and_then(|value| value.as_str())
-                .unwrap_or_default()
-                .to_lowercase();
-            match item_type.as_str() {
-                "text" => {
-                    if let Some(text) = item.get("text").and_then(|value| value.as_str()) {
-                        if !text.trim().is_empty() {
-                            content_parts.push(text.trim().to_string());
-                        }
-                    }
-                }
-                "image" => {
-                    let media_type = item
-                        .get("mimeType")
-                        .or_else(|| item.get("mediaType"))
-                        .and_then(|value| value.as_str())
-                        .unwrap_or("image");
-                    content_parts.push(format!("[{media_type} attached]"));
-                }
-                _ => {
-                    if let Some(uri) = item
-                        .get("uri")
-                        .or_else(|| item.get("url"))
-                        .and_then(|value| value.as_str())
-                    {
-                        let label = item
-                            .get("name")
-                            .and_then(|value| value.as_str())
-                            .unwrap_or("resource");
-                        content_parts.push(format!("{label}: {uri}"));
-                    }
-                }
-            }
-        }
-    }
-    if content_parts.is_empty() {
-        if let Some(structured) = result.get("structuredContent") {
-            content_parts.push(
-                serde_json::to_string_pretty(structured)
-                    .unwrap_or_else(|_| structured.to_string()),
-            );
-        }
-    }
-    let mut content = if content_parts.is_empty() {
-        "Chrome DevTools MCP tool completed with no textual output.".to_string()
-    } else {
-        content_parts.join("\n")
-    };
-    if result
-        .get("isError")
-        .and_then(|value| value.as_bool())
-        .unwrap_or(false)
-    {
-        content = format!("Chrome DevTools MCP tool error: {content}");
-    }
-    content
-}
diff --git a/openplanter-desktop/crates/op-core/src/tools/defs.rs b/openplanter-desktop/crates/op-core/src/tools/defs.rs
index ba71eb37..b8c3f91c 100644
--- a/openplanter-desktop/crates/op-core/src/tools/defs.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/defs.rs
@@ -4,8 +4,6 @@
 /// provider-specific shapes expected by OpenAI and Anthropic APIs.
 use serde_json::{Value, json};
 
-use super::chrome_mcp::ChromeMcpToolDef;
-
 struct ToolDef {
     name: &'static str,
     description: &'static str,
@@ -357,27 +355,6 @@ fn mvp_tool_defs() -> Vec<ToolDef> {
     ]
 }
 
-fn merged_tool_defs(dynamic_defs: &[ChromeMcpToolDef]) -> Vec<(String, String, Value)> {
-    let mut defs: Vec<(String, String, Value)> = mvp_tool_defs()
-        .into_iter()
-        .map(|def| (def.name.to_string(), def.description.to_string(), def.parameters))
-        .collect();
-    let mut existing: std::collections::HashSet<String> =
-        defs.iter().map(|(name, _, _)| name.clone()).collect();
-    for def in dynamic_defs {
-        if existing.contains(&def.name) {
-            continue;
-        }
-        defs.push((
-            def.name.clone(),
-            def.description.clone(),
-            def.parameters.clone(),
-        ));
-        existing.insert(def.name.clone());
-    }
-    defs
-}
-
 /// For OpenAI strict mode: make all properties required, wrapping optional ones
 /// with `anyOf [original, null]`. Recurse into nested objects and array items.
 fn strict_fixup(schema: &mut Value) {
@@ -455,20 +432,16 @@ fn strict_fixup(schema: &mut Value) {
 
 /// Convert to OpenAI tools format: `[{ type: "function", function: { name, description, parameters, strict } }]`
 pub fn to_openai_tools() -> Vec<Value> {
-    to_openai_tools_with_dynamic(&[])
-}
-
-pub fn to_openai_tools_with_dynamic(dynamic_defs: &[ChromeMcpToolDef]) -> Vec<Value> {
-    merged_tool_defs(dynamic_defs)
+    mvp_tool_defs()
         .into_iter()
         .map(|def| {
-            let (name, description, mut params) = def;
+            let mut params = def.parameters;
             strict_fixup(&mut params);
             json!({
                 "type": "function",
                 "function": {
-                    "name": name,
-                    "description": description,
+                    "name": def.name,
+                    "description": def.description,
                     "parameters": params,
                     "strict": true
                 }
@@ -479,28 +452,23 @@ pub fn to_openai_tools_with_dynamic(dynamic_defs: &[ChromeMcpToolDef]) -> Vec<Va
 
 /// Convert to Anthropic tools format: `[{ name, description, input_schema }]`
 pub fn to_anthropic_tools() -> Vec<Value> {
-    to_anthropic_tools_with_dynamic(&[])
-}
-
-pub fn to_anthropic_tools_with_dynamic(dynamic_defs: &[ChromeMcpToolDef]) -> Vec<Value> {
-    merged_tool_defs(dynamic_defs)
+    mvp_tool_defs()
         .into_iter()
         .map(|def| {
-            let (name, description, parameters) = def;
             json!({
-                "name": name,
-                "description": description,
-                "input_schema": parameters
+                "name": def.name,
+                "description": def.description,
+                "input_schema": def.parameters
             })
         })
         .collect()
 }
 
 /// Build tool definitions for the given provider.
-pub fn build_tool_defs(provider: &str, dynamic_defs: &[ChromeMcpToolDef]) -> Vec<Value> {
+pub fn build_tool_defs(provider: &str) -> Vec<Value> {
     match provider {
-        "anthropic" => to_anthropic_tools_with_dynamic(dynamic_defs),
-        _ => to_openai_tools_with_dynamic(dynamic_defs),
+        "anthropic" => to_anthropic_tools(),
+        _ => to_openai_tools(),
     }
 }
 
@@ -607,14 +575,14 @@ mod tests {
 
     #[test]
     fn test_build_tool_defs_anthropic() {
-        let tools = build_tool_defs("anthropic", &[]);
+        let tools = build_tool_defs("anthropic");
         assert!(tools[0].get("input_schema").is_some());
         assert!(tools[0].get("type").is_none());
     }
 
     #[test]
     fn test_build_tool_defs_openai() {
-        let tools = build_tool_defs("openai", &[]);
+        let tools = build_tool_defs("openai");
         assert_eq!(tools[0]["type"], "function");
     }
 
diff --git a/openplanter-desktop/crates/op-core/src/tools/mod.rs b/openplanter-desktop/crates/op-core/src/tools/mod.rs
index f4a0cf78..fba6bed8 100644
--- a/openplanter-desktop/crates/op-core/src/tools/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/mod.rs
@@ -3,7 +3,6 @@
 /// The `WorkspaceTools` struct is the central dispatcher that owns tool state
 /// (files-read set, background jobs) and routes tool calls to the appropriate module.
 pub mod audio;
-pub mod chrome_mcp;
 pub mod defs;
 pub mod filesystem;
 pub mod patching;
@@ -12,7 +11,6 @@ pub mod web;
 
 use std::collections::HashSet;
 use std::path::PathBuf;
-use std::sync::Arc;
 
 use crate::config::{AgentConfig, normalize_web_search_provider};
 
@@ -73,7 +71,6 @@ pub struct WorkspaceTools {
     mistral_transcription_chunk_overlap_seconds: f64,
     mistral_transcription_max_chunks: i64,
     mistral_transcription_request_timeout_sec: u64,
-    chrome_mcp: Option<Arc<chrome_mcp::ChromeMcpManager>>,
     files_read: HashSet<PathBuf>,
     bg_jobs: shell::BgJobs,
 }
@@ -88,10 +85,7 @@ fn clip(text: &str, max_chars: usize) -> String {
 }
 
 impl WorkspaceTools {
-    pub fn new(
-        config: &AgentConfig,
-        chrome_mcp: Option<Arc<chrome_mcp::ChromeMcpManager>>,
-    ) -> Self {
+    pub fn new(config: &AgentConfig) -> Self {
         Self {
             root: config.workspace.clone(),
             scope: ToolScope::FullWorkspace,
@@ -122,7 +116,6 @@ impl WorkspaceTools {
             mistral_transcription_request_timeout_sec: config
                 .mistral_transcription_request_timeout_sec
                 as u64,
-            chrome_mcp,
             files_read: HashSet::new(),
             bg_jobs: shell::BgJobs::new(),
         }
@@ -164,7 +157,6 @@ impl WorkspaceTools {
             mistral_transcription_request_timeout_sec: config
                 .mistral_transcription_request_timeout_sec
                 as u64,
-            chrome_mcp: None,
             files_read: HashSet::new(),
             bg_jobs: shell::BgJobs::new(),
         }
@@ -447,26 +439,7 @@ impl WorkspaceTools {
                 ToolResult::ok(format!("Noted: {note}"))
             }
 
-            _ => {
-                if let Some(manager) = &self.chrome_mcp {
-                    match manager.list_tools(false).await {
-                        Ok(tools) if tools.iter().any(|tool| tool.name == name) => {
-                            match manager.call_tool(name, &args).await {
-                                Ok(content) => ToolResult::ok(content),
-                                Err(err) => {
-                                    ToolResult::error(format!("Chrome DevTools MCP unavailable: {err}"))
-                                }
-                            }
-                        }
-                        Ok(_) => ToolResult::error(format!("Unknown tool: {name}")),
-                        Err(err) => {
-                            ToolResult::error(format!("Chrome DevTools MCP unavailable: {err}"))
-                        }
-                    }
-                } else {
-                    ToolResult::error(format!("Unknown tool: {name}"))
-                }
-            }
+            _ => ToolResult::error(format!("Unknown tool: {name}")),
         };
 
         // Clip observation to max_observation_chars
@@ -551,7 +524,7 @@ mod tests {
     async fn test_full_workspace_scope_unchanged() {
         let tmp = tempdir().unwrap();
         let cfg = test_config(tmp.path());
-        let mut tools = WorkspaceTools::new(&cfg, None);
+        let mut tools = WorkspaceTools::new(&cfg);
 
         let result = tools
             .execute("write_file", r#"{"path":"notes.md","content":"allowed"}"#)
@@ -569,7 +542,7 @@ mod tests {
         let tmp = tempdir().unwrap();
         let mut cfg = test_config(tmp.path());
         cfg.max_observation_chars = 6000;
-        let mut tools = WorkspaceTools::new(&cfg, None);
+        let mut tools = WorkspaceTools::new(&cfg);
 
         let mut content = "a".repeat(5999);
         content.push('─');
diff --git a/openplanter-desktop/crates/op-tauri/src/bridge.rs b/openplanter-desktop/crates/op-tauri/src/bridge.rs
index 3b0e696e..ec7294f2 100644
--- a/openplanter-desktop/crates/op-tauri/src/bridge.rs
+++ b/openplanter-desktop/crates/op-tauri/src/bridge.rs
@@ -198,69 +198,17 @@ struct PendingToolCall {
 /// Key argument names for tool call display (mirrors frontend KEY_ARGS).
 fn extract_key_arg(tool_name: &str, args_json: &str) -> Option<String> {
     let key_name = match tool_name {
-        "read_file" | "write_file" | "edit_file" | "apply_patch" | "hashline_edit" => Some("path"),
-        "list_files" => Some("directory"),
-        "run_shell" | "run_shell_bg" => Some("command"),
-        "kill_shell_bg" => Some("pid"),
-        "web_search" => Some("query"),
-        "fetch_url" => Some("url"),
-        _ => None,
+        "read_file" | "write_file" | "edit_file" | "apply_patch" | "hashline_edit" => "path",
+        "list_files" => "directory",
+        "run_shell" | "run_shell_bg" => "command",
+        "kill_shell_bg" => "pid",
+        "web_search" => "query",
+        "fetch_url" => "url",
+        _ => return None,
     };
-    if let Ok(value) = serde_json::from_str::<serde_json::Value>(args_json) {
-        if let Some(key) = key_name {
-            if let Some(found) = value
-                .get(key)
-                .and_then(preview_value)
-                .filter(|value| !value.is_empty())
-            {
-                return Some(found);
-            }
-        }
-        return first_informative_value(&value);
-    }
-    if let Some(key) = key_name {
-        let pattern = format!("\"{}\"\\s*:\\s*\"([^\"]*)\"?", regex::escape(key));
-        let re = regex::Regex::new(&pattern).ok()?;
-        if let Some(captures) = re.captures(args_json) {
-            return captures.get(1).map(|capture| capture.as_str().to_string());
-        }
-    }
-    let re = regex::Regex::new(r#""[^"]+"\s*:\s*"([^"]+)""#).ok()?;
-    re.captures(args_json)
-        .and_then(|captures| captures.get(1))
-        .map(|capture| capture.as_str().to_string())
-}
-
-fn preview_value(value: &serde_json::Value) -> Option<String> {
-    match value {
-        serde_json::Value::String(text) => {
-            let trimmed = text.trim();
-            if trimmed.is_empty() {
-                None
-            } else {
-                Some(trimmed.chars().take(60).collect())
-            }
-        }
-        serde_json::Value::Array(items) => {
-            let collected = items
-                .iter()
-                .filter_map(|item| item.as_str().map(str::trim).filter(|text| !text.is_empty()))
-                .take(3)
-                .collect::<Vec<_>>();
-            if collected.is_empty() {
-                None
-            } else {
-                Some(collected.join(", "))
-            }
-        }
-        serde_json::Value::Number(number) => Some(number.to_string()),
-        _ => None,
-    }
-}
-
-fn first_informative_value(value: &serde_json::Value) -> Option<String> {
-    let object = value.as_object()?;
-    object.values().find_map(preview_value)
+    let pattern = format!("\"{}\"\\s*:\\s*\"([^\"]*)\"?", regex::escape(key_name));
+    let re = regex::Regex::new(&pattern).ok()?;
+    re.captures(args_json).map(|c| c[1].to_string())
 }
 
 impl<E: SolveEmitter> LoggingEmitter<E> {
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
index 36a533bd..d3eeb81f 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
@@ -50,7 +50,6 @@ pub async fn solve(
     state: State<'_, AppState>,
 ) -> Result<(), String> {
     let cfg = state.config.lock().await.clone();
-    let chrome_mcp = state.chrome_mcp_manager(&cfg).await;
     let init_status = workspace_init::get_init_status(&cfg.workspace, &cfg.session_root_dir)
         .map_err(|e| e.to_string())?;
     if init_status.gate_state != "ready" {
@@ -124,13 +123,12 @@ pub async fn solve(
 
     tokio::spawn(async move {
         let result = tokio::spawn(async move {
-            op_core::engine::solve_with_initial_context_and_chrome_mcp(
+            op_core::engine::solve_with_initial_context(
                 &objective,
                 &cfg,
                 &emitter,
                 token,
                 Some(initial_context),
-                chrome_mcp,
             )
             .await;
         })
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/config.rs b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
index 1b8c9b99..535367bd 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/config.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
@@ -1,6 +1,5 @@
 use crate::state::AppState;
 use op_core::config::{
-    normalize_chrome_mcp_browser_url, normalize_chrome_mcp_channel,
     normalize_web_search_provider, normalize_zai_plan, resolve_zai_base_url,
 };
 use op_core::credentials::credentials_from_env;
@@ -9,26 +8,13 @@ use op_core::settings::{PersistentSettings, SettingsStore};
 use std::collections::HashMap;
 use tauri::State;
 
-async fn make_config_view(
-    cfg: &op_core::config::AgentConfig,
-    session_id: Option<String>,
-    state: &AppState,
-) -> ConfigView {
-    let chrome_status = state.chrome_mcp_status(cfg).await;
+fn make_config_view(cfg: &op_core::config::AgentConfig, session_id: Option<String>) -> ConfigView {
     ConfigView {
         provider: cfg.provider.clone(),
         model: cfg.model.clone(),
         reasoning_effort: cfg.reasoning_effort.clone(),
         zai_plan: cfg.zai_plan.clone(),
         web_search_provider: cfg.web_search_provider.clone(),
-        chrome_mcp_enabled: cfg.chrome_mcp_enabled,
-        chrome_mcp_auto_connect: cfg.chrome_mcp_auto_connect,
-        chrome_mcp_browser_url: cfg.chrome_mcp_browser_url.clone(),
-        chrome_mcp_channel: cfg.chrome_mcp_channel.clone(),
-        chrome_mcp_connect_timeout_sec: cfg.chrome_mcp_connect_timeout_sec,
-        chrome_mcp_rpc_timeout_sec: cfg.chrome_mcp_rpc_timeout_sec,
-        chrome_mcp_status: chrome_status.status,
-        chrome_mcp_status_detail: chrome_status.detail,
         workspace: cfg.workspace.display().to_string(),
         session_id,
         recursive: cfg.recursive,
@@ -67,29 +53,15 @@ fn merge_settings(
         web_search_provider: incoming
             .web_search_provider
             .or(existing.web_search_provider),
-        chrome_mcp_enabled: incoming.chrome_mcp_enabled.or(existing.chrome_mcp_enabled),
-        chrome_mcp_auto_connect: incoming
-            .chrome_mcp_auto_connect
-            .or(existing.chrome_mcp_auto_connect),
-        chrome_mcp_browser_url: incoming
-            .chrome_mcp_browser_url
-            .or(existing.chrome_mcp_browser_url),
-        chrome_mcp_channel: incoming.chrome_mcp_channel.or(existing.chrome_mcp_channel),
-        chrome_mcp_connect_timeout_sec: incoming
-            .chrome_mcp_connect_timeout_sec
-            .or(existing.chrome_mcp_connect_timeout_sec),
-        chrome_mcp_rpc_timeout_sec: incoming
-            .chrome_mcp_rpc_timeout_sec
-            .or(existing.chrome_mcp_rpc_timeout_sec),
     }
 }
 
 /// Get the current configuration.
 #[tauri::command]
 pub async fn get_config(state: State<'_, AppState>) -> Result<ConfigView, String> {
-    let cfg = state.config.lock().await.clone();
-    let session_id = state.session_id.lock().await.clone();
-    Ok(make_config_view(&cfg, session_id, &state).await)
+    let cfg = state.config.lock().await;
+    let session_id = state.session_id.lock().await;
+    Ok(make_config_view(&cfg, session_id.clone()))
 }
 
 /// Update configuration fields.
@@ -123,29 +95,8 @@ pub async fn update_config(
     if let Some(provider) = partial.web_search_provider {
         cfg.web_search_provider = normalize_web_search_provider(Some(&provider));
     }
-    if let Some(enabled) = partial.chrome_mcp_enabled {
-        cfg.chrome_mcp_enabled = enabled;
-    }
-    if let Some(auto_connect) = partial.chrome_mcp_auto_connect {
-        cfg.chrome_mcp_auto_connect = auto_connect;
-    }
-    if let Some(browser_url) = partial.chrome_mcp_browser_url {
-        cfg.chrome_mcp_browser_url = normalize_chrome_mcp_browser_url(Some(&browser_url));
-    }
-    if let Some(channel) = partial.chrome_mcp_channel {
-        cfg.chrome_mcp_channel = normalize_chrome_mcp_channel(Some(&channel));
-    }
-    if let Some(timeout) = partial.chrome_mcp_connect_timeout_sec {
-        cfg.chrome_mcp_connect_timeout_sec = timeout.max(1);
-    }
-    if let Some(timeout) = partial.chrome_mcp_rpc_timeout_sec {
-        cfg.chrome_mcp_rpc_timeout_sec = timeout.max(1);
-    }
-    let cfg_snapshot = cfg.clone();
-    drop(cfg);
-    state.sync_chrome_mcp_config(&cfg_snapshot).await;
-    let session_id = state.session_id.lock().await.clone();
-    Ok(make_config_view(&cfg_snapshot, session_id, &state).await)
+    let session_id = state.session_id.lock().await;
+    Ok(make_config_view(&cfg, session_id.clone()))
 }
 
 /// Known models per provider for listing.
diff --git a/openplanter-desktop/crates/op-tauri/src/state.rs b/openplanter-desktop/crates/op-tauri/src/state.rs
index 05253e76..1c240b39 100644
--- a/openplanter-desktop/crates/op-tauri/src/state.rs
+++ b/openplanter-desktop/crates/op-tauri/src/state.rs
@@ -7,7 +7,6 @@ use op_core::credentials::{
 #[cfg(test)]
 use op_core::settings::PersistentSettings;
 use op_core::settings::SettingsStore;
-use op_core::tools::chrome_mcp::{ChromeMcpConfigKey, ChromeMcpManager, ChromeMcpStatus};
 use op_core::workspace_init;
 use std::env;
 use std::fmt;
@@ -369,16 +368,9 @@ pub struct AppState {
     pub cancel_token: Arc<Mutex<CancellationToken>>,
     pub agent_running: Arc<Mutex<bool>>,
     pub init_lock: Arc<Mutex<()>>,
-    pub chrome_mcp: Arc<Mutex<ChromeMcpRuntime>>,
     startup_trace: String,
 }
 
-#[derive(Default)]
-pub struct ChromeMcpRuntime {
-    key: Option<ChromeMcpConfigKey>,
-    manager: Option<Arc<ChromeMcpManager>>,
-}
-
 impl AppState {
     pub fn try_new() -> Result<Self, StartupWorkspaceError> {
         let current_dir = env::current_dir().unwrap_or_else(|_| PathBuf::from("."));
@@ -414,7 +406,6 @@ impl AppState {
             cancel_token: Arc::new(Mutex::new(CancellationToken::new())),
             agent_running: Arc::new(Mutex::new(false)),
             init_lock: Arc::new(Mutex::new(())),
-            chrome_mcp: Arc::new(Mutex::new(ChromeMcpRuntime::default())),
             startup_trace: format_startup_trace(&current_dir, &resolved_workspace, &migration),
         })
     }
@@ -422,82 +413,6 @@ impl AppState {
     pub fn startup_trace(&self) -> &str {
         &self.startup_trace
     }
-
-    pub async fn sync_chrome_mcp_config(&self, cfg: &AgentConfig) {
-        let key = ChromeMcpConfigKey::from_config(cfg);
-        let mut runtime = self.chrome_mcp.lock().await;
-        if runtime.key.as_ref() == Some(&key) {
-            return;
-        }
-        if let Some(manager) = runtime.manager.take() {
-            tokio::spawn(async move {
-                manager.shutdown().await;
-            });
-        }
-        runtime.key = Some(key);
-    }
-
-    pub async fn chrome_mcp_manager(&self, cfg: &AgentConfig) -> Option<Arc<ChromeMcpManager>> {
-        let key = ChromeMcpConfigKey::from_config(cfg);
-        let mut runtime = self.chrome_mcp.lock().await;
-        if !key.enabled {
-            if let Some(manager) = runtime.manager.take() {
-                tokio::spawn(async move {
-                    manager.shutdown().await;
-                });
-            }
-            runtime.key = Some(key);
-            return None;
-        }
-        if runtime.key.as_ref() != Some(&key) {
-            if let Some(manager) = runtime.manager.take() {
-                tokio::spawn(async move {
-                    manager.shutdown().await;
-                });
-            }
-            runtime.key = Some(key.clone());
-        }
-        if runtime.manager.is_none() {
-            runtime.manager = Some(Arc::new(ChromeMcpManager::new(key)));
-        }
-        runtime.manager.clone()
-    }
-
-    pub async fn chrome_mcp_status(&self, cfg: &AgentConfig) -> ChromeMcpStatus {
-        let key = ChromeMcpConfigKey::from_config(cfg);
-        let manager = {
-            let runtime = self.chrome_mcp.lock().await;
-            if runtime.key.as_ref() == Some(&key) {
-                runtime.manager.clone()
-            } else {
-                None
-            }
-        };
-        if let Some(manager) = manager {
-            manager.status_snapshot().await
-        } else if !key.enabled {
-            ChromeMcpStatus {
-                status: "disabled".into(),
-                detail: "Chrome DevTools MCP is disabled.".into(),
-                tool_count: 0,
-                last_refresh_ms: None,
-            }
-        } else if key.browser_url.is_none() && !key.auto_connect {
-            ChromeMcpStatus {
-                status: "unavailable".into(),
-                detail: "Chrome DevTools MCP is enabled but cannot attach: set `chrome_mcp_browser_url` or enable `chrome_mcp_auto_connect`.".into(),
-                tool_count: 0,
-                last_refresh_ms: None,
-            }
-        } else {
-            ChromeMcpStatus {
-                status: "ready".into(),
-                detail: "Chrome DevTools MCP will initialize on the next solve.".into(),
-                tool_count: 0,
-                last_refresh_ms: None,
-            }
-        }
-    }
 }
 
 #[cfg(test)]
diff --git a/openplanter-desktop/frontend/src/api/types.ts b/openplanter-desktop/frontend/src/api/types.ts
index fe4c7abf..d0114632 100644
--- a/openplanter-desktop/frontend/src/api/types.ts
+++ b/openplanter-desktop/frontend/src/api/types.ts
@@ -110,14 +110,6 @@ export interface ConfigView {
   reasoning_effort: string | null;
   zai_plan: string;
   web_search_provider: string;
-  chrome_mcp_enabled: boolean;
-  chrome_mcp_auto_connect: boolean;
-  chrome_mcp_browser_url: string | null;
-  chrome_mcp_channel: string;
-  chrome_mcp_connect_timeout_sec: number;
-  chrome_mcp_rpc_timeout_sec: number;
-  chrome_mcp_status: string;
-  chrome_mcp_status_detail: string;
   workspace: string;
   session_id: string | null;
   recursive: boolean;
@@ -132,12 +124,6 @@ export interface PartialConfig {
   reasoning_effort?: string;
   zai_plan?: string;
   web_search_provider?: string;
-  chrome_mcp_enabled?: boolean;
-  chrome_mcp_auto_connect?: boolean;
-  chrome_mcp_browser_url?: string | null;
-  chrome_mcp_channel?: string;
-  chrome_mcp_connect_timeout_sec?: number;
-  chrome_mcp_rpc_timeout_sec?: number;
 }
 
 export interface ModelInfo {
@@ -164,12 +150,6 @@ export interface PersistentSettings {
   default_model_ollama?: string | null;
   zai_plan?: string | null;
   web_search_provider?: string | null;
-  chrome_mcp_enabled?: boolean | null;
-  chrome_mcp_auto_connect?: boolean | null;
-  chrome_mcp_browser_url?: string | null;
-  chrome_mcp_channel?: string | null;
-  chrome_mcp_connect_timeout_sec?: number | null;
-  chrome_mcp_rpc_timeout_sec?: number | null;
 }
 
 export interface SlashResult {
diff --git a/openplanter-desktop/frontend/src/commands/chrome.test.ts b/openplanter-desktop/frontend/src/commands/chrome.test.ts
deleted file mode 100644
index 4b1591e7..00000000
--- a/openplanter-desktop/frontend/src/commands/chrome.test.ts
+++ /dev/null
@@ -1,128 +0,0 @@
-import { vi, describe, it, expect, beforeEach, afterEach } from "vitest";
-import { __setHandler, __clearHandlers } from "../__mocks__/tauri";
-
-vi.mock("@tauri-apps/api/core", async () => {
-  const mock = await import("../__mocks__/tauri");
-  return { invoke: mock.invoke };
-});
-
-import { appState } from "../state/store";
-import { CHROME_USAGE, handleChromeCommand } from "./chrome";
-
-function makeChromeConfig(overrides: Record<string, unknown> = {}) {
-  return {
-    provider: "anthropic",
-    model: "claude-opus-4-6",
-    reasoning_effort: "medium",
-    zai_plan: "paygo",
-    web_search_provider: "exa",
-    chrome_mcp_enabled: true,
-    chrome_mcp_auto_connect: true,
-    chrome_mcp_browser_url: null,
-    chrome_mcp_channel: "stable",
-    chrome_mcp_connect_timeout_sec: 15,
-    chrome_mcp_rpc_timeout_sec: 45,
-    chrome_mcp_status: "ready",
-    chrome_mcp_status_detail: "Connected to Chrome.",
-    workspace: ".",
-    session_id: null,
-    recursive: true,
-    max_depth: 4,
-    max_steps_per_call: 100,
-    demo: false,
-    ...overrides,
-  };
-}
-
-describe("handleChromeCommand", () => {
-  const originalState = appState.get();
-
-  beforeEach(() => {
-    appState.set({
-      ...originalState,
-      chromeMcpEnabled: false,
-      chromeMcpAutoConnect: true,
-      chromeMcpBrowserUrl: null,
-      chromeMcpChannel: "stable",
-      chromeMcpStatus: "disabled",
-      chromeMcpStatusDetail: "Chrome DevTools MCP is disabled.",
-    });
-  });
-
-  afterEach(() => {
-    __clearHandlers();
-    appState.set(originalState);
-  });
-
-  it("shows current status with usage when called without args", async () => {
-    const result = await handleChromeCommand("");
-    expect(result.lines[0]).toContain("Chrome MCP:");
-    expect(result.lines[1]).toContain("Chrome runtime:");
-    expect(result.lines).toContain(CHROME_USAGE);
-  });
-
-  it("updates auto-connect mode", async () => {
-    __setHandler("update_config", ({ partial }: { partial: Record<string, unknown> }) => {
-      expect(partial.chrome_mcp_enabled).toBe(true);
-      expect(partial.chrome_mcp_auto_connect).toBe(true);
-      expect(partial.chrome_mcp_browser_url).toBeNull();
-      return makeChromeConfig();
-    });
-
-    const result = await handleChromeCommand("auto");
-    expect(result.lines[0]).toContain("attach=auto-connect");
-    expect(appState.get().chromeMcpEnabled).toBe(true);
-    expect(appState.get().chromeMcpAutoConnect).toBe(true);
-    expect(appState.get().chromeMcpBrowserUrl).toBeNull();
-  });
-
-  it("updates explicit browser url and persists when requested", async () => {
-    __setHandler("update_config", ({ partial }: { partial: Record<string, unknown> }) => {
-      expect(partial.chrome_mcp_enabled).toBe(true);
-      expect(partial.chrome_mcp_auto_connect).toBe(false);
-      expect(partial.chrome_mcp_browser_url).toBe("http://127.0.0.1:9222");
-      return makeChromeConfig({
-        chrome_mcp_auto_connect: false,
-        chrome_mcp_browser_url: "http://127.0.0.1:9222",
-        chrome_mcp_status_detail: "Attached to remote debugging endpoint.",
-      });
-    });
-    __setHandler("save_settings", ({ settings }: { settings: Record<string, unknown> }) => {
-      expect(settings.chrome_mcp_enabled).toBe(true);
-      expect(settings.chrome_mcp_auto_connect).toBe(false);
-      expect(settings.chrome_mcp_browser_url).toBe("http://127.0.0.1:9222");
-      expect(settings.chrome_mcp_channel).toBe("stable");
-    });
-
-    const result = await handleChromeCommand("url http://127.0.0.1:9222 --save");
-    expect(result.lines[0]).toContain("browser_url=http://127.0.0.1:9222");
-    expect(result.lines).toContain("(Settings saved)");
-    expect(appState.get().chromeMcpBrowserUrl).toBe("http://127.0.0.1:9222");
-  });
-
-  it("updates the Chrome channel", async () => {
-    __setHandler("update_config", ({ partial }: { partial: Record<string, unknown> }) => {
-      expect(partial.chrome_mcp_channel).toBe("beta");
-      return makeChromeConfig({
-        chrome_mcp_channel: "beta",
-        chrome_mcp_status: "unavailable",
-        chrome_mcp_status_detail: "Chrome Beta is not running.",
-      });
-    });
-
-    const result = await handleChromeCommand("channel beta");
-    expect(result.lines[0]).toContain("channel=beta");
-    expect(result.lines[1]).toContain("unavailable");
-    expect(appState.get().chromeMcpChannel).toBe("beta");
-  });
-
-  it("rejects invalid channels", async () => {
-    const result = await handleChromeCommand("channel nightly");
-    expect(result.lines[0]).toContain("Invalid Chrome channel");
-  });
-
-  it("shows url usage when endpoint is missing", async () => {
-    const result = await handleChromeCommand("url");
-    expect(result.lines).toEqual(["Usage: /chrome url <endpoint> [--save]"]);
-  });
-});
diff --git a/openplanter-desktop/frontend/src/commands/chrome.ts b/openplanter-desktop/frontend/src/commands/chrome.ts
deleted file mode 100644
index 5ab0bb20..00000000
--- a/openplanter-desktop/frontend/src/commands/chrome.ts
+++ /dev/null
@@ -1,136 +0,0 @@
-/** /chrome slash command handler. */
-import { saveSettings, updateConfig } from "../api/invoke";
-import type { ConfigView } from "../api/types";
-import { appState, type AppState } from "../state/store";
-import type { CommandResult } from "./model";
-
-export const VALID_CHROME_CHANNELS = ["stable", "beta", "dev", "canary"] as const;
-export const CHROME_USAGE =
-  "Usage: /chrome status|on|off|auto|url <endpoint>|channel <stable|beta|dev|canary> [--save]";
-
-type ChromeStatusSource = Pick<
-  AppState,
-  | "chromeMcpEnabled"
-  | "chromeMcpAutoConnect"
-  | "chromeMcpBrowserUrl"
-  | "chromeMcpChannel"
-  | "chromeMcpStatus"
-  | "chromeMcpStatusDetail"
->;
-
-function applyChromeConfig(config: ConfigView): void {
-  appState.update((state) => ({
-    ...state,
-    chromeMcpEnabled: config.chrome_mcp_enabled,
-    chromeMcpAutoConnect: config.chrome_mcp_auto_connect,
-    chromeMcpBrowserUrl: config.chrome_mcp_browser_url,
-    chromeMcpChannel: config.chrome_mcp_channel,
-    chromeMcpConnectTimeoutSec: config.chrome_mcp_connect_timeout_sec,
-    chromeMcpRpcTimeoutSec: config.chrome_mcp_rpc_timeout_sec,
-    chromeMcpStatus: config.chrome_mcp_status,
-    chromeMcpStatusDetail: config.chrome_mcp_status_detail,
-  }));
-}
-
-function describeAttachMode(state: ChromeStatusSource): string {
-  if (state.chromeMcpBrowserUrl) {
-    return `browser_url=${state.chromeMcpBrowserUrl}`;
-  }
-  return state.chromeMcpAutoConnect ? "auto-connect" : "manual-disabled";
-}
-
-export function formatChromeStatusLines(state: ChromeStatusSource): string[] {
-  return [
-    `Chrome MCP: enabled=${state.chromeMcpEnabled} | attach=${describeAttachMode(state)} | channel=${state.chromeMcpChannel}`,
-    `Chrome runtime: ${state.chromeMcpStatus} | ${state.chromeMcpStatusDetail}`,
-  ];
-}
-
-/** Handle /chrome [status|on|off|auto|url|channel]. */
-export async function handleChromeCommand(args: string): Promise<CommandResult> {
-  const parts = args.trim().split(/\s+/).filter(Boolean);
-  const save = parts.includes("--save");
-  const filtered = parts.filter((part) => part !== "--save");
-  const action = filtered[0]?.toLowerCase() ?? "";
-
-  if (!action || action === "status") {
-    const lines = formatChromeStatusLines(appState.get());
-    if (!action) {
-      lines.push(CHROME_USAGE);
-    }
-    return { action: "handled", lines };
-  }
-
-  let partial: Record<string, unknown>;
-  switch (action) {
-    case "on":
-      partial = { chrome_mcp_enabled: true };
-      break;
-    case "off":
-      partial = { chrome_mcp_enabled: false };
-      break;
-    case "auto":
-      partial = {
-        chrome_mcp_enabled: true,
-        chrome_mcp_auto_connect: true,
-        chrome_mcp_browser_url: null,
-      };
-      break;
-    case "url":
-      if (filtered.length < 2) {
-        return { action: "handled", lines: ["Usage: /chrome url <endpoint> [--save]"] };
-      }
-      partial = {
-        chrome_mcp_enabled: true,
-        chrome_mcp_auto_connect: false,
-        chrome_mcp_browser_url: filtered[1].trim(),
-      };
-      break;
-    case "channel": {
-      const channel = filtered[1]?.trim().toLowerCase() ?? "";
-      if (!channel) {
-        return {
-          action: "handled",
-          lines: ["Usage: /chrome channel <stable|beta|dev|canary> [--save]"],
-        };
-      }
-      if (!VALID_CHROME_CHANNELS.includes(channel as (typeof VALID_CHROME_CHANNELS)[number])) {
-        return {
-          action: "handled",
-          lines: [`Invalid Chrome channel "${channel}". Expected: ${VALID_CHROME_CHANNELS.join(", ")}`],
-        };
-      }
-      partial = { chrome_mcp_channel: channel };
-      break;
-    }
-    default:
-      return {
-        action: "handled",
-        lines: [`Unknown /chrome action "${action}".`, CHROME_USAGE],
-      };
-  }
-
-  try {
-    const config = await updateConfig(partial);
-    applyChromeConfig(config);
-
-    const lines = formatChromeStatusLines(appState.get());
-    if (save) {
-      await saveSettings({
-        chrome_mcp_enabled: config.chrome_mcp_enabled,
-        chrome_mcp_auto_connect: config.chrome_mcp_auto_connect,
-        chrome_mcp_browser_url: config.chrome_mcp_browser_url,
-        chrome_mcp_channel: config.chrome_mcp_channel,
-        chrome_mcp_connect_timeout_sec: config.chrome_mcp_connect_timeout_sec,
-        chrome_mcp_rpc_timeout_sec: config.chrome_mcp_rpc_timeout_sec,
-      });
-      lines.push("(Settings saved)");
-    }
-    return { action: "handled", lines };
-  } catch (e) {
-    return {
-      action: "handled",
-      lines: [`Failed to update Chrome MCP settings: ${e}`],
-    };
-  }
-}
diff --git a/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts b/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
index 55f469fb..42915f39 100644
--- a/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
+++ b/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
@@ -26,7 +26,6 @@ describe("completionRegistry", () => {
     expect(values).toContain("/zai-plan");
     expect(values).toContain("/web-search");
     expect(values).toContain("/reasoning");
-    expect(values).toContain("/chrome");
     expect(values).toContain("/init");
   });
 
@@ -103,31 +102,6 @@ describe("completionRegistry", () => {
     expect(zaiPlanCmd!.children![0].children?.[0].value).toBe("--save");
   });
 
-  it("/chrome has expected subcommands", () => {
-    const chromeCmd = COMMAND_COMPLETIONS.find((c) => c.value === "/chrome");
-    expect(chromeCmd).toBeDefined();
-    expect(chromeCmd!.children?.map((child) => child.value)).toEqual([
-      "status",
-      "on",
-      "off",
-      "auto",
-      "url",
-      "channel",
-    ]);
-  });
-
-  it("/chrome channel exposes supported channels and save flag", () => {
-    const chromeCmd = COMMAND_COMPLETIONS.find((c) => c.value === "/chrome")!;
-    const channelCmd = chromeCmd.children!.find((c) => c.value === "channel")!;
-    expect(channelCmd.children?.map((child) => child.value)).toEqual([
-      "stable",
-      "beta",
-      "dev",
-      "canary",
-    ]);
-    expect(channelCmd.children?.[0].children?.[0].value).toBe("--save");
-  });
-
   it("reasoning level children have --save flag", () => {
     const reasoningCmd = COMMAND_COMPLETIONS.find((c) => c.value === "/reasoning")!;
     for (const level of reasoningCmd.children!) {
diff --git a/openplanter-desktop/frontend/src/commands/completionRegistry.ts b/openplanter-desktop/frontend/src/commands/completionRegistry.ts
index 329f215f..e7ae9ab8 100644
--- a/openplanter-desktop/frontend/src/commands/completionRegistry.ts
+++ b/openplanter-desktop/frontend/src/commands/completionRegistry.ts
@@ -48,13 +48,6 @@ const ZAI_PLANS: CompletionItem[] = [
   { value: "coding", description: "Use the Z.AI Coding Plan endpoint", children: SAVE_FLAG },
 ];
 
-const CHROME_CHANNELS: CompletionItem[] = [
-  { value: "stable", description: "Target Chrome Stable", children: SAVE_FLAG },
-  { value: "beta", description: "Target Chrome Beta", children: SAVE_FLAG },
-  { value: "dev", description: "Target Chrome Dev", children: SAVE_FLAG },
-  { value: "canary", description: "Target Chrome Canary", children: SAVE_FLAG },
-];
-
 export const COMMAND_COMPLETIONS: CompletionItem[] = [
   { value: "/help", description: "Show available commands" },
   { value: "/new", description: "Start a new session" },
@@ -85,32 +78,6 @@ export const COMMAND_COMPLETIONS: CompletionItem[] = [
     description: "Set reasoning effort",
     children: REASONING_LEVELS,
   },
-  {
-    value: "/chrome",
-    description: "Show or configure Chrome DevTools MCP",
-    children: [
-      { value: "status", description: "Show Chrome MCP status" },
-      { value: "on", description: "Enable Chrome MCP", children: SAVE_FLAG },
-      { value: "off", description: "Disable Chrome MCP", children: SAVE_FLAG },
-      { value: "auto", description: "Enable auto-connect mode", children: SAVE_FLAG },
-      {
-        value: "url",
-        description: "Set an explicit Chrome browser URL",
-        children: [
-          {
-            value: "<endpoint>",
-            description: "Remote debugging endpoint URL",
-            children: SAVE_FLAG,
-          },
-        ],
-      },
-      {
-        value: "channel",
-        description: "Set the Chrome release channel",
-        children: CHROME_CHANNELS,
-      },
-    ],
-  },
   {
     value: "/init",
     description: "Workspace initialization and migration",
diff --git a/openplanter-desktop/frontend/src/commands/slash.test.ts b/openplanter-desktop/frontend/src/commands/slash.test.ts
index 87b6f6e0..d5db6e44 100644
--- a/openplanter-desktop/frontend/src/commands/slash.test.ts
+++ b/openplanter-desktop/frontend/src/commands/slash.test.ts
@@ -19,12 +19,6 @@ describe("dispatchSlashCommand", () => {
       model: "claude-opus-4-6",
       zaiPlan: "paygo",
       webSearchProvider: "exa",
-      chromeMcpEnabled: true,
-      chromeMcpAutoConnect: true,
-      chromeMcpBrowserUrl: null,
-      chromeMcpChannel: "stable",
-      chromeMcpStatus: "ready",
-      chromeMcpStatusDetail: "Connected to Chrome.",
       sessionId: "20260101-120000-deadbeef",
       reasoningEffort: "medium",
       initGateState: "ready",
@@ -91,13 +85,6 @@ describe("dispatchSlashCommand", () => {
     expect(result!.lines.some((l) => l.includes("Z.AI plan:"))).toBe(true);
   });
 
-  it("status shows chrome mcp state", async () => {
-    const result = await dispatchSlashCommand("/status");
-    expect(result).not.toBeNull();
-    expect(result!.lines.some((l) => l.includes("Chrome MCP:"))).toBe(true);
-    expect(result!.lines.some((l) => l.includes("Chrome runtime:"))).toBe(true);
-  });
-
   it("unknown command", async () => {
     const result = await dispatchSlashCommand("/foobar");
     expect(result).not.toBeNull();
@@ -181,19 +168,6 @@ describe("dispatchSlashCommand", () => {
     (globalThis as any).window = origWindow;
   });
 
-  it("help includes chrome command", async () => {
-    const result = await dispatchSlashCommand("/help");
-    expect(result).not.toBeNull();
-    expect(result!.lines.some((l) => l.includes("/chrome"))).toBe(true);
-  });
-
-  it("chrome dispatches", async () => {
-    const result = await dispatchSlashCommand("/chrome");
-    expect(result).not.toBeNull();
-    expect(result!.action).toBe("handled");
-    expect(result!.lines.some((l) => l.includes("Chrome MCP:"))).toBe(true);
-  });
-
   it("/init status dispatches", async () => {
     __setHandler("get_init_status", () => ({
       runtime_workspace: "/tmp/ws",
diff --git a/openplanter-desktop/frontend/src/commands/slash.ts b/openplanter-desktop/frontend/src/commands/slash.ts
index 7cf050a5..67d1a584 100644
--- a/openplanter-desktop/frontend/src/commands/slash.ts
+++ b/openplanter-desktop/frontend/src/commands/slash.ts
@@ -2,7 +2,6 @@
 import { appState } from "../state/store";
 import { openSession } from "../api/invoke";
 import { handleModelCommand, type CommandResult } from "./model";
-import { CHROME_USAGE, formatChromeStatusLines, handleChromeCommand } from "./chrome";
 import { handleReasoningCommand } from "./reasoning";
 import { handleWebSearchCommand } from "./webSearch";
 import { handleZaiPlanCommand } from "./zaiPlan";
@@ -40,8 +39,6 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
           "  /web-search <provider> --save  Set and persist",
           "  /reasoning          Show/set reasoning effort",
           "  /reasoning <level>  Set level (low, medium, high, off)",
-          "  /chrome             Show current Chrome DevTools MCP status",
-          `  ${CHROME_USAGE.slice(6)}`,
           "  /init status        Show workspace init status",
           "  /init standard      Initialize the current workspace",
           "  /init migrate       Open the migration init panel",
@@ -96,7 +93,6 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
           `Z.AI plan:   ${s.zaiPlan || "paygo"}`,
           `Web search:  ${s.webSearchProvider || "exa"}`,
           `Reasoning:   ${s.reasoningEffort ?? "off"}`,
-          ...formatChromeStatusLines(s),
           `Mode:        ${s.recursive ? "recursive" : "flat"}`,
           `Max depth:   ${s.maxDepth}`,
           `Max steps:   ${s.maxStepsPerCall}`,
@@ -121,9 +117,6 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
     case "/reasoning":
       return handleReasoningCommand(args);
 
-    case "/chrome":
-      return handleChromeCommand(args);
-
     case "/init":
       return handleInitCommand(args);
 
diff --git a/openplanter-desktop/frontend/src/components/App.ts b/openplanter-desktop/frontend/src/components/App.ts
index 4edaa79e..f8ddab4d 100644
--- a/openplanter-desktop/frontend/src/components/App.ts
+++ b/openplanter-desktop/frontend/src/components/App.ts
@@ -74,7 +74,6 @@ export function createApp(root: HTMLElement): void {
       `<div><span class="label">model:</span> <span class="value">${s.model || "\u2014"}</span></div>`,
       `<div><span class="label">z.ai plan:</span> <span class="value">${s.zaiPlan || "paygo"}</span></div>`,
       `<div><span class="label">web search:</span> <span class="value">${s.webSearchProvider || "exa"}</span></div>`,
-      `<div><span class="label">chrome mcp:</span> <span class="value">${s.chromeMcpStatus} (${s.chromeMcpChannel})</span></div>`,
       `<div><span class="label">reasoning:</span> <span class="value">${s.reasoningEffort ?? "off"}</span></div>`,
       `<div><span class="label">mode:</span> <span class="value">${s.recursive ? "recursive" : "flat"}</span></div>`,
     ].join("");
diff --git a/openplanter-desktop/frontend/src/components/ChatPane.test.ts b/openplanter-desktop/frontend/src/components/ChatPane.test.ts
index a33d7840..688b5099 100644
--- a/openplanter-desktop/frontend/src/components/ChatPane.test.ts
+++ b/openplanter-desktop/frontend/src/components/ChatPane.test.ts
@@ -30,7 +30,7 @@ describe("KEY_ARGS", () => {
     expect(KEY_ARGS["read_file"]).toBe("path");
     expect(KEY_ARGS["run_shell"]).toBe("command");
     expect(KEY_ARGS["web_search"]).toBe("query");
-    expect(KEY_ARGS["fetch_url"]).toBe("urls");
+    expect(KEY_ARGS["fetch_url"]).toBe("url");
   });
 });
 
@@ -279,27 +279,6 @@ describe("createChatPane", () => {
     document.body.removeChild(pane);
   });
 
-  it("falls back to the first informative value for unknown tool args", () => {
-    const pane = createChatPane();
-    document.body.appendChild(pane);
-
-    window.dispatchEvent(
-      new CustomEvent("agent-delta", { detail: { kind: "tool_call_start", text: "chrome_click" } })
-    );
-    window.dispatchEvent(
-      new CustomEvent(
-        "agent-delta",
-        { detail: { kind: "tool_call_args", text: '{"selector": "#submit", "timeout": 5}' } },
-      )
-    );
-
-    const indicator = pane.querySelector(".activity-indicator");
-    expect(indicator!.getAttribute("data-mode")).toBe("tool");
-    expect(pane.querySelector(".activity-preview")!.textContent).toBe("#submit");
-
-    document.body.removeChild(pane);
-  });
-
   it("renders step summary on agent-step event", () => {
     const pane = createChatPane();
     document.body.appendChild(pane);
@@ -473,22 +452,6 @@ Trailing text.`;
     expect(msg!.textContent).not.toContain("<tool_call>");
   });
 
-  it("renders fallback key args for unknown tool calls in assistant messages", () => {
-    const pane = createChatPane();
-    const content = `<tool_call>
-{"name": "chrome_evaluate", "arguments": {"expression": "document.title", "timeout": 10}}
-</tool_call>`;
-    appState.update((s) => ({
-      ...s,
-      messages: [makeMsg({ role: "assistant", content, isRendered: true })],
-    }));
-    const msg = pane.querySelector(".message.assistant.rendered");
-    const toolBlock = msg!.querySelector(".tool-call-block");
-    expect(toolBlock).not.toBeNull();
-    expect(toolBlock!.querySelector(".tool-fn")!.textContent).toBe("chrome_evaluate");
-    expect(toolBlock!.querySelector(".tool-arg")!.textContent).toContain("document.title");
-  });
-
   it("renders tool_result XML as collapsible block in rendered assistant message", () => {
     const pane = createChatPane();
     const content = `<tool_result>
diff --git a/openplanter-desktop/frontend/src/components/ChatPane.ts b/openplanter-desktop/frontend/src/components/ChatPane.ts
index ce5339e7..734caf08 100644
--- a/openplanter-desktop/frontend/src/components/ChatPane.ts
+++ b/openplanter-desktop/frontend/src/components/ChatPane.ts
@@ -2,10 +2,24 @@
 import { appState, type ChatMessage, type StepToolCall } from "../state/store";
 import { createInputBar } from "./InputBar";
 import { parseAgentContent, stripToolXml, type ContentSegment } from "./contentParser";
-import { extractToolCallKeyArg, KEY_ARGS } from "./toolArgs";
 import MarkdownIt from "markdown-it";
 import hljs from "highlight.js";
 
+/** Key argument names for tool call display. */
+const KEY_ARGS: Record<string, string> = {
+  read_file: "path",
+  write_file: "path",
+  edit_file: "path",
+  list_files: "directory",
+  run_shell: "command",
+  run_shell_bg: "command",
+  kill_shell_bg: "pid",
+  web_search: "query",
+  fetch_url: "url",
+  apply_patch: "path",
+  hashline_edit: "path",
+};
+
 const md = new MarkdownIt({
   html: false,
   linkify: true,
@@ -20,6 +34,16 @@ const md = new MarkdownIt({
   },
 });
 
+/** Extract the key argument value from a partial JSON string. */
+function extractKeyArg(toolName: string, argsJson: string): string | null {
+  const keyName = KEY_ARGS[toolName];
+  if (!keyName) return null;
+  // Try to extract "keyName": "value" from possibly-incomplete JSON
+  const regex = new RegExp(`"${keyName}"\\s*:\\s*"([^"]*)"?`);
+  const m = argsJson.match(regex);
+  return m ? m[1] : null;
+}
+
 /** Format elapsed milliseconds as a readable string. */
 function formatElapsed(ms: number): string {
   if (ms < 1000) return `${ms}ms`;
@@ -487,7 +511,7 @@ export function createChatPane(): HTMLElement {
 
       // Always re-extract key arg as more chunks arrive — partial JSON
       // grows with each chunk so the extracted value gets more complete.
-      const keyArg = extractToolCallKeyArg(currentToolName, toolArgsBuf);
+      const keyArg = extractKeyArg(currentToolName, toolArgsBuf);
       if (keyArg) {
         const current = stepToolCalls[stepToolCalls.length - 1];
         if (current) current.keyArg = keyArg;
@@ -568,4 +592,5 @@ export function createChatPane(): HTMLElement {
 
   return pane;
 }
+
 export { KEY_ARGS };
diff --git a/openplanter-desktop/frontend/src/components/contentParser.test.ts b/openplanter-desktop/frontend/src/components/contentParser.test.ts
index e62788a9..ccb888a0 100644
--- a/openplanter-desktop/frontend/src/components/contentParser.test.ts
+++ b/openplanter-desktop/frontend/src/components/contentParser.test.ts
@@ -86,19 +86,7 @@ Environment confirmed.`;
     expect(result[0]).toMatchObject({
       type: "tool_call",
       name: "custom_tool",
-      keyArg: "stuff",
-    });
-  });
-
-  it("falls back to the first informative array or number for unknown tools", () => {
-    const content = `<tool_call>
-{"name": "custom_tool", "arguments": {"links": ["https://a.test", "https://b.test"], "limit": 3}}
-</tool_call>`;
-    const result = parseAgentContent(content);
-    expect(result[0]).toMatchObject({
-      type: "tool_call",
-      name: "custom_tool",
-      keyArg: "https://a.test, https://b.test",
+      keyArg: "",
     });
   });
 
diff --git a/openplanter-desktop/frontend/src/components/contentParser.ts b/openplanter-desktop/frontend/src/components/contentParser.ts
index fec28dd7..eea4f95f 100644
--- a/openplanter-desktop/frontend/src/components/contentParser.ts
+++ b/openplanter-desktop/frontend/src/components/contentParser.ts
@@ -1,5 +1,19 @@
 /** Parse <tool_call> and <tool_result> XML blocks from agent content. */
-import { getToolCallKeyArg } from "./toolArgs";
+
+/** Key argument names for tool call display (mirrors ChatPane's KEY_ARGS). */
+const KEY_ARGS: Record<string, string> = {
+  read_file: "path",
+  write_file: "path",
+  edit_file: "path",
+  list_files: "directory",
+  run_shell: "command",
+  run_shell_bg: "command",
+  kill_shell_bg: "pid",
+  web_search: "query",
+  fetch_url: "url",
+  apply_patch: "path",
+  hashline_edit: "path",
+};
 
 export type ContentSegment =
   | { type: "text"; text: string }
@@ -53,7 +67,8 @@ function parseToolCall(json: string): ContentSegment {
     const obj = JSON.parse(json);
     const name: string = obj.name ?? "unknown";
     const args = obj.arguments ?? {};
-    const keyArg = getToolCallKeyArg(name, args);
+    const keyName = KEY_ARGS[name];
+    const keyArg = keyName && typeof args[keyName] === "string" ? args[keyName] : "";
     return { type: "tool_call", name, keyArg, rawArgs: JSON.stringify(args) };
   } catch {
     return { type: "tool_call", name: "unknown", keyArg: "", rawArgs: json };
diff --git a/openplanter-desktop/frontend/src/components/toolArgs.ts b/openplanter-desktop/frontend/src/components/toolArgs.ts
deleted file mode 100644
index 9fb110e4..00000000
--- a/openplanter-desktop/frontend/src/components/toolArgs.ts
+++ /dev/null
@@ -1,160 +0,0 @@
-/** Shared helpers for rendering compact tool argument previews. */
-
-export const KEY_ARGS: Record<string, string> = {
-  read_file: "path",
-  read_image: "path",
-  audio_transcribe: "path",
-  write_file: "path",
-  edit_file: "path",
-  hashline_edit: "path",
-  apply_patch: "patch",
-  list_files: "glob",
-  search_files: "query",
-  repo_map: "glob",
-  run_shell: "command",
-  run_shell_bg: "command",
-  check_shell_bg: "job_id",
-  kill_shell_bg: "job_id",
-  web_search: "query",
-  fetch_url: "urls",
-  subtask: "objective",
-  execute: "objective",
-  think: "note",
-};
-
-interface IndexedCandidate {
-  index: number;
-  value: string;
-}
-
-function normalizePreviewValue(value: unknown): string | null {
-  if (typeof value === "string") {
-    const trimmed = value.trim();
-    return trimmed || null;
-  }
-
-  if (typeof value === "number" && Number.isFinite(value)) {
-    return String(value);
-  }
-
-  if (Array.isArray(value)) {
-    const items = value.flatMap((item) => {
-      if (typeof item === "string") {
-        const trimmed = item.trim();
-        return trimmed ? [trimmed] : [];
-      }
-      if (typeof item === "number" && Number.isFinite(item)) {
-        return [String(item)];
-      }
-      return [];
-    });
-    return items.length > 0 ? items.join(", ") : null;
-  }
-
-  return null;
-}
-
-function escapeRegExp(value: string): string {
-  return value.replace(/[.*+?^${}()|[\]\\]/g, "\\$&");
-}
-
-function collectRegexCandidates(
-  source: string,
-  regex: RegExp,
-  pickValue: (match: RegExpMatchArray) => string | null,
-): IndexedCandidate[] {
-  const candidates: IndexedCandidate[] = [];
-  for (const match of source.matchAll(regex)) {
-    const value = pickValue(match)?.trim();
-    if (value) {
-      candidates.push({
-        index: match.index ?? Number.MAX_SAFE_INTEGER,
-        value,
-      });
-    }
-  }
-  return candidates;
-}
-
-function collectCandidatesForKey(source: string, key: string): IndexedCandidate[] {
-  const escapedKey = escapeRegExp(key);
-  const stringRegex = new RegExp(`"${escapedKey}"\\s*:\\s*"([^"]*)`, "g");
-  const arrayRegex = new RegExp(`"${escapedKey}"\\s*:\\s*\\[([^\\]]*)`, "g");
-  const numberRegex = new RegExp(`"${escapedKey}"\\s*:\\s*(-?\\d+(?:\\.\\d+)?)`, "g");
-
-  return [
-    ...collectRegexCandidates(source, stringRegex, (match) => match[1] ?? null),
-    ...collectRegexCandidates(source, arrayRegex, (match) => {
-      const items = [...(match[1] ?? "").matchAll(/"([^"]*)/g)]
-        .map((item) => item[1]?.trim() ?? "")
-        .filter(Boolean);
-      return items.length > 0 ? items.join(", ") : null;
-    }),
-    ...collectRegexCandidates(source, numberRegex, (match) => match[1] ?? null),
-  ].sort((a, b) => a.index - b.index);
-}
-
-function collectFallbackCandidates(source: string): IndexedCandidate[] {
-  return [
-    ...collectRegexCandidates(
-      source,
-      /"([^"]+)"\s*:\s*"([^"]*)/g,
-      (match) => match[2] ?? null,
-    ),
-    ...collectRegexCandidates(
-      source,
-      /"([^"]+)"\s*:\s*\[([^\]]*)/g,
-      (match) => {
-        const items = [...(match[2] ?? "").matchAll(/"([^"]*)/g)]
-          .map((item) => item[1]?.trim() ?? "")
-          .filter(Boolean);
-        return items.length > 0 ? items.join(", ") : null;
-      },
-    ),
-    ...collectRegexCandidates(
-      source,
-      /"([^"]+)"\s*:\s*(-?\d+(?:\.\d+)?)/g,
-      (match) => match[2] ?? null,
-    ),
-  ].sort((a, b) => a.index - b.index);
-}
-
-/** Return the best compact preview for a parsed tool argument object. */
-export function getToolCallKeyArg(toolName: string, args: unknown): string {
-  if (!args || typeof args !== "object" || Array.isArray(args)) {
-    return "";
-  }
-
-  const entries = Object.entries(args as Record<string, unknown>);
-  const preferredKey = KEY_ARGS[toolName];
-
-  if (preferredKey) {
-    const preferredValue = normalizePreviewValue((args as Record<string, unknown>)[preferredKey]);
-    if (preferredValue) {
-      return preferredValue;
-    }
-  }
-
-  for (const [, value] of entries) {
-    const preview = normalizePreviewValue(value);
-    if (preview) {
-      return preview;
-    }
-  }
-
-  return "";
-}
-
-/** Best-effort extraction from a partial JSON argument string during streaming. */
-export function extractToolCallKeyArg(toolName: string, argsJson: string): string | null {
-  const preferredKey = KEY_ARGS[toolName];
-  if (preferredKey) {
-    const preferred = collectCandidatesForKey(argsJson, preferredKey)[0];
-    if (preferred) {
-      return preferred.value;
-    }
-  }
-
-  const fallback = collectFallbackCandidates(argsJson)[0];
-  return fallback?.value ?? null;
-}
diff --git a/openplanter-desktop/frontend/src/main.ts b/openplanter-desktop/frontend/src/main.ts
index c0493fc7..fb13670b 100644
--- a/openplanter-desktop/frontend/src/main.ts
+++ b/openplanter-desktop/frontend/src/main.ts
@@ -40,14 +40,6 @@ async function init() {
       model: config.model,
       zaiPlan: config.zai_plan,
       webSearchProvider: config.web_search_provider,
-      chromeMcpEnabled: config.chrome_mcp_enabled,
-      chromeMcpAutoConnect: config.chrome_mcp_auto_connect,
-      chromeMcpBrowserUrl: config.chrome_mcp_browser_url,
-      chromeMcpChannel: config.chrome_mcp_channel,
-      chromeMcpConnectTimeoutSec: config.chrome_mcp_connect_timeout_sec,
-      chromeMcpRpcTimeoutSec: config.chrome_mcp_rpc_timeout_sec,
-      chromeMcpStatus: config.chrome_mcp_status,
-      chromeMcpStatusDetail: config.chrome_mcp_status_detail,
       sessionId: config.session_id,
       reasoningEffort: config.reasoning_effort,
       recursive: config.recursive,
@@ -84,7 +76,6 @@ async function init() {
           `model: ${model || "—"}`,
           `z.ai plan: ${state.zaiPlan || "paygo"}`,
           `web search: ${state.webSearchProvider || "exa"}`,
-          `chrome mcp: ${state.chromeMcpStatus}`,
           `reasoning: ${reasoningLabel}`,
           `mode: ${modeLabel}`,
           `workspace: ${state.workspace || "."}`,
diff --git a/openplanter-desktop/frontend/src/state/store.ts b/openplanter-desktop/frontend/src/state/store.ts
index eaca952c..4fa1eeca 100644
--- a/openplanter-desktop/frontend/src/state/store.ts
+++ b/openplanter-desktop/frontend/src/state/store.ts
@@ -72,14 +72,6 @@ export interface AppState {
   model: string;
   zaiPlan: string;
   webSearchProvider: string;
-  chromeMcpEnabled: boolean;
-  chromeMcpAutoConnect: boolean;
-  chromeMcpBrowserUrl: string | null;
-  chromeMcpChannel: string;
-  chromeMcpConnectTimeoutSec: number;
-  chromeMcpRpcTimeoutSec: number;
-  chromeMcpStatus: string;
-  chromeMcpStatusDetail: string;
   sessionId: string | null;
   inputTokens: number;
   outputTokens: number;
@@ -111,14 +103,6 @@ export const appState = new Store<AppState>({
   model: "",
   zaiPlan: "paygo",
   webSearchProvider: "exa",
-  chromeMcpEnabled: false,
-  chromeMcpAutoConnect: true,
-  chromeMcpBrowserUrl: null,
-  chromeMcpChannel: "stable",
-  chromeMcpConnectTimeoutSec: 15,
-  chromeMcpRpcTimeoutSec: 45,
-  chromeMcpStatus: "disabled",
-  chromeMcpStatusDetail: "Chrome DevTools MCP is disabled.",
   sessionId: null,
   inputTokens: 0,
   outputTokens: 0,
diff --git a/tests/test_chrome_mcp.py b/tests/test_chrome_mcp.py
deleted file mode 100644
index dc1ad5ca..00000000
--- a/tests/test_chrome_mcp.py
+++ /dev/null
@@ -1,207 +0,0 @@
-from __future__ import annotations
-
-import os
-import stat
-import tempfile
-import unittest
-from pathlib import Path
-from unittest.mock import patch
-
-from agent.chrome_mcp import (
-    ChromeMcpError,
-    ChromeMcpManager,
-    acquire_shared_manager,
-    shutdown_all_shared_managers,
-)
-
-
-FAKE_MCP_SERVER = """#!/usr/bin/env python3
-import json
-import sys
-
-TOOLS = [
-    {
-        "name": "navigate_page",
-        "description": "Navigate the page",
-        "inputSchema": {
-            "type": "object",
-            "properties": {"url": {"type": "string"}},
-            "required": ["url"],
-            "additionalProperties": False,
-        },
-    },
-    {
-        "name": "take_screenshot",
-        "description": "Take a screenshot",
-        "inputSchema": {
-            "type": "object",
-            "properties": {},
-            "required": [],
-            "additionalProperties": False,
-        },
-    },
-]
-
-for raw_line in sys.stdin:
-    line = raw_line.strip()
-    if not line:
-        continue
-    payload = json.loads(line)
-    method = payload.get("method")
-    request_id = payload.get("id")
-    if method == "initialize" and request_id is not None:
-        sys.stdout.write(json.dumps({
-            "jsonrpc": "2.0",
-            "id": request_id,
-            "result": {
-                "protocolVersion": "2025-11-25",
-                "serverInfo": {"name": "fake-chrome-mcp", "version": "1.0"},
-            },
-        }) + "\\n")
-        sys.stdout.flush()
-        continue
-    if method == "tools/list" and request_id is not None:
-        sys.stdout.write(json.dumps({
-            "jsonrpc": "2.0",
-            "id": request_id,
-            "result": {"tools": TOOLS},
-        }) + "\\n")
-        sys.stdout.flush()
-        continue
-    if method == "tools/call" and request_id is not None:
-        params = payload.get("params") or {}
-        name = params.get("name")
-        if name == "take_screenshot":
-            result = {
-                "content": [
-                    {"type": "text", "text": "Screenshot captured."},
-                    {"type": "image", "data": "ZmFrZS1pbWFnZQ==", "mimeType": "image/png"},
-                ]
-            }
-        else:
-            result = {
-                "content": [
-                    {"type": "text", "text": f"Called {name}"},
-                ]
-            }
-        sys.stdout.write(json.dumps({
-            "jsonrpc": "2.0",
-            "id": request_id,
-            "result": result,
-        }) + "\\n")
-        sys.stdout.flush()
-"""
-
-
-def _write_fake_launcher(tmpdir: str) -> Path:
-    launcher = Path(tmpdir) / "fake_npx.py"
-    launcher.write_text(FAKE_MCP_SERVER, encoding="utf-8")
-    launcher.chmod(launcher.stat().st_mode | stat.S_IXUSR)
-    return launcher
-
-
-class ChromeMcpManagerTests(unittest.TestCase):
-    def tearDown(self) -> None:
-        shutdown_all_shared_managers()
-
-    def test_initialize_list_tools_and_call_tool(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            launcher = _write_fake_launcher(tmpdir)
-            with patch.dict(
-                os.environ,
-                {
-                    "OPENPLANTER_CHROME_MCP_COMMAND": str(launcher),
-                    "OPENPLANTER_CHROME_MCP_PACKAGE": "ignored-package",
-                },
-                clear=False,
-            ):
-                manager = ChromeMcpManager(
-                    enabled=True,
-                    auto_connect=True,
-                    browser_url=None,
-                    channel="stable",
-                    connect_timeout_sec=3,
-                    rpc_timeout_sec=3,
-                )
-                tools = manager.list_tools(force_refresh=True)
-                self.assertEqual([tool.name for tool in tools], ["navigate_page", "take_screenshot"])
-
-                result = manager.call_tool("navigate_page", {"url": "https://example.com"})
-                self.assertIn("Called navigate_page", result.content)
-                self.assertFalse(result.is_error)
-                manager.shutdown()
-
-    def test_call_tool_parses_image_payload(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            launcher = _write_fake_launcher(tmpdir)
-            with patch.dict(
-                os.environ,
-                {
-                    "OPENPLANTER_CHROME_MCP_COMMAND": str(launcher),
-                    "OPENPLANTER_CHROME_MCP_PACKAGE": "ignored-package",
-                },
-                clear=False,
-            ):
-                manager = ChromeMcpManager(
-                    enabled=True,
-                    auto_connect=True,
-                    browser_url=None,
-                    channel="stable",
-                    connect_timeout_sec=3,
-                    rpc_timeout_sec=3,
-                )
-                result = manager.call_tool("take_screenshot", {})
-                self.assertIn("Screenshot captured.", result.content)
-                self.assertIsNotNone(result.image)
-                assert result.image is not None
-                self.assertEqual(result.image.media_type, "image/png")
-                self.assertEqual(result.image.base64_data, "ZmFrZS1pbWFnZQ==")
-                manager.shutdown()
-
-    def test_missing_attach_mode_reports_unavailable(self) -> None:
-        manager = ChromeMcpManager(
-            enabled=True,
-            auto_connect=False,
-            browser_url=None,
-            channel="stable",
-            connect_timeout_sec=1,
-            rpc_timeout_sec=1,
-        )
-        with self.assertRaises(ChromeMcpError):
-            manager.list_tools()
-        status = manager.status_snapshot()
-        self.assertEqual(status.status, "unavailable")
-        self.assertIn("chrome_mcp_browser_url", status.detail)
-
-    def test_shared_manager_registry_reuses_instances(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            launcher = _write_fake_launcher(tmpdir)
-            with patch.dict(
-                os.environ,
-                {
-                    "OPENPLANTER_CHROME_MCP_COMMAND": str(launcher),
-                    "OPENPLANTER_CHROME_MCP_PACKAGE": "ignored-package",
-                },
-                clear=False,
-            ):
-                first = acquire_shared_manager(
-                    enabled=True,
-                    auto_connect=True,
-                    browser_url=None,
-                    channel="stable",
-                    connect_timeout_sec=3,
-                    rpc_timeout_sec=3,
-                )
-                second = acquire_shared_manager(
-                    enabled=True,
-                    auto_connect=True,
-                    browser_url=None,
-                    channel="stable",
-                    connect_timeout_sec=3,
-                    rpc_timeout_sec=3,
-                )
-                self.assertIs(first, second)
-
-
-if __name__ == "__main__":
-    unittest.main()
diff --git a/tests/test_engine.py b/tests/test_engine.py
index 3fca7972..4e8c58bc 100644
--- a/tests/test_engine.py
+++ b/tests/test_engine.py
@@ -9,7 +9,6 @@
 from unittest.mock import patch
 
 from conftest import _tc
-from agent.chrome_mcp import ChromeMcpCallResult
 from agent.config import AgentConfig
 from agent.engine import RLMEngine
 from agent.prompts import build_system_prompt as _build_system_prompt
@@ -18,53 +17,6 @@
 
 
 class EngineTests(unittest.TestCase):
-    def test_dynamic_tool_defs_are_merged_for_main_loop(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            root = Path(tmpdir)
-            cfg = AgentConfig(workspace=root, max_depth=1, max_steps_per_call=2)
-            tools = WorkspaceTools(root=root)
-            model = ScriptedModel(scripted_turns=[ModelTurn(text="done", stop_reason="end_turn")])
-            with patch.object(
-                tools,
-                "get_chrome_mcp_tool_defs",
-                return_value=[
-                    {
-                        "name": "navigate_page",
-                        "description": "Navigate Chrome",
-                        "parameters": {
-                            "type": "object",
-                            "properties": {"url": {"type": "string"}},
-                            "required": ["url"],
-                            "additionalProperties": False,
-                        },
-                    }
-                ],
-            ):
-                engine = RLMEngine(model=model, tools=tools, config=cfg)
-                names = [tool["name"] for tool in engine._build_tool_defs(include_subtask=True)]
-            self.assertIn("navigate_page", names)
-
-    def test_dynamic_tool_calls_fall_through_to_chrome_manager(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            root = Path(tmpdir)
-            cfg = AgentConfig(workspace=root, max_depth=1, max_steps_per_call=4)
-            tools = WorkspaceTools(root=root)
-            model = ScriptedModel(
-                scripted_turns=[
-                    ModelTurn(tool_calls=[_tc("navigate_page", url="https://example.com")]),
-                    ModelTurn(text="done", stop_reason="end_turn"),
-                ]
-            )
-            with patch.object(tools, "get_chrome_mcp_tool_defs", return_value=[]), patch.object(
-                tools,
-                "try_execute_dynamic_tool",
-                return_value=ChromeMcpCallResult(content="Navigated to https://example.com"),
-            ) as mocked:
-                engine = RLMEngine(model=model, tools=tools, config=cfg)
-                result = engine.solve("navigate using Chrome MCP")
-            self.assertEqual(result, "done")
-            mocked.assert_called_once()
-
     def test_write_and_read_then_final(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)
diff --git a/tests/test_settings.py b/tests/test_settings.py
index c4963faa..30366442 100644
--- a/tests/test_settings.py
+++ b/tests/test_settings.py
@@ -8,12 +8,7 @@
 from agent.builder import _validate_model_provider, infer_provider_for_model
 from agent.credentials import CredentialBundle
 from agent.model import ModelError
-from agent.settings import (
-    PersistentSettings,
-    SettingsStore,
-    normalize_chrome_mcp_channel,
-    normalize_reasoning_effort,
-)
+from agent.settings import PersistentSettings, SettingsStore, normalize_reasoning_effort
 from agent.tui import SLASH_COMMANDS, _compute_suggestions
 
 
@@ -31,27 +26,6 @@ def test_settings_roundtrip(self) -> None:
             self.assertEqual(loaded.default_model, "gpt-5.2")
             self.assertEqual(loaded.default_reasoning_effort, "high")
 
-    def test_chrome_mcp_settings_roundtrip(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            root = Path(tmpdir)
-            store = SettingsStore(workspace=root, session_root_dir=".openplanter")
-            settings = PersistentSettings(
-                chrome_mcp_enabled=True,
-                chrome_mcp_auto_connect=False,
-                chrome_mcp_browser_url="http://127.0.0.1:9222",
-                chrome_mcp_channel="beta",
-                chrome_mcp_connect_timeout_sec=21,
-                chrome_mcp_rpc_timeout_sec=61,
-            )
-            store.save(settings)
-            loaded = store.load()
-            self.assertTrue(loaded.chrome_mcp_enabled)
-            self.assertFalse(loaded.chrome_mcp_auto_connect)
-            self.assertEqual(loaded.chrome_mcp_browser_url, "http://127.0.0.1:9222")
-            self.assertEqual(loaded.chrome_mcp_channel, "beta")
-            self.assertEqual(loaded.chrome_mcp_connect_timeout_sec, 21)
-            self.assertEqual(loaded.chrome_mcp_rpc_timeout_sec, 61)
-
     def test_normalize_reasoning_effort(self) -> None:
         self.assertEqual(normalize_reasoning_effort("LOW"), "low")
         self.assertEqual(normalize_reasoning_effort(" medium "), "medium")
@@ -59,12 +33,6 @@ def test_normalize_reasoning_effort(self) -> None:
         with self.assertRaises(ValueError):
             normalize_reasoning_effort("extreme")
 
-    def test_normalize_chrome_channel(self) -> None:
-        self.assertEqual(normalize_chrome_mcp_channel("BETA"), "beta")
-        self.assertIsNone(normalize_chrome_mcp_channel(""))
-        with self.assertRaises(ValueError):
-            normalize_chrome_mcp_channel("nightly")
-
     def test_per_provider_model_roundtrip(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)
@@ -194,10 +162,6 @@ def test_slash_r_matches_reasoning(self) -> None:
         matches, _ = _compute_suggestions("/r")
         self.assertIn("/reasoning", matches)
 
-    def test_slash_c_matches_chrome(self) -> None:
-        matches, _ = _compute_suggestions("/ch")
-        self.assertIn("/chrome", matches)
-
 
 class InferProviderTests(unittest.TestCase):
     def test_claude_is_anthropic(self) -> None:
diff --git a/tests/test_tool_defs.py b/tests/test_tool_defs.py
index 09b74089..a985725b 100644
--- a/tests/test_tool_defs.py
+++ b/tests/test_tool_defs.py
@@ -71,45 +71,6 @@ def test_default_includes_subtask(self) -> None:
         names = [d["name"] for d in defs]
         self.assertIn("subtask", names)
 
-    def test_dynamic_defs_are_merged(self) -> None:
-        defs = get_tool_definitions(
-            include_subtask=False,
-            dynamic_defs=[
-                {
-                    "name": "navigate_page",
-                    "description": "Navigate Chrome",
-                    "parameters": {
-                        "type": "object",
-                        "properties": {"url": {"type": "string"}},
-                        "required": ["url"],
-                        "additionalProperties": False,
-                    },
-                }
-            ],
-        )
-        names = [d["name"] for d in defs]
-        self.assertIn("navigate_page", names)
-
-    def test_dynamic_defs_do_not_override_static_names(self) -> None:
-        defs = get_tool_definitions(
-            include_subtask=False,
-            dynamic_defs=[
-                {
-                    "name": "read_file",
-                    "description": "override",
-                    "parameters": {
-                        "type": "object",
-                        "properties": {},
-                        "required": [],
-                        "additionalProperties": False,
-                    },
-                }
-            ],
-        )
-        matches = [d for d in defs if d["name"] == "read_file"]
-        self.assertEqual(len(matches), 1)
-        self.assertIn("Read the contents", matches[0]["description"])
-
 
 class MakeStrictParametersTests(unittest.TestCase):
     """Tests for _make_strict_parameters()."""
diff --git a/tests/test_tui_repl.py b/tests/test_tui_repl.py
index cda7e98d..cd331fde 100644
--- a/tests/test_tui_repl.py
+++ b/tests/test_tui_repl.py
@@ -8,7 +8,6 @@
 
 import pytest
 
-from agent.chrome_mcp import ChromeMcpStatus
 from agent.config import AgentConfig
 from agent.settings import SettingsStore
 from agent.tui import ChatContext, RichREPL, _queue_prompt_style, dispatch_slash_command
@@ -262,14 +261,6 @@ def test_exit_command_exits(self, tmp_path):
             repl.run()
         repl.ctx.runtime.solve.assert_not_called()
 
-
-class TestRunLoopMore:
-    def _make_repl(self, tmp_path):
-        ctx = _make_ctx(tmp_path)
-        repl = RichREPL(ctx)
-        repl.console = MagicMock()
-        return repl
-
     def test_help_command_handled(self, tmp_path):
         """The /help command should be handled without running the agent, then continue."""
         repl = self._make_repl(tmp_path)
@@ -332,44 +323,6 @@ def fake_solve(objective, on_event=None, on_step=None, on_content_delta=None):
         assert agent_ran.is_set()
 
 
-class TestChromeSlashCommand:
-    def test_status_renders_runtime_state(self, tmp_path):
-        ctx = _make_ctx(tmp_path)
-        ctx.cfg.chrome_mcp_enabled = True
-        ctx.cfg.chrome_mcp_auto_connect = True
-        ctx.cfg.chrome_mcp_channel = "stable"
-        ctx.runtime.engine.tools.chrome_mcp_status.return_value = ChromeMcpStatus(
-            status="ready",
-            detail="Chrome DevTools MCP ready with 2 tool(s).",
-            tool_count=2,
-        )
-        lines: list[str] = []
-        result = dispatch_slash_command("/chrome status", ctx, emit=lines.append)
-        assert result == "handled"
-        assert any("Chrome MCP:" in line for line in lines)
-        assert any("ready" in line for line in lines)
-
-    def test_auto_rebuilds_engine_and_persists(self, tmp_path):
-        ctx = _make_ctx(tmp_path)
-        rebuilt_engine = MagicMock()
-        rebuilt_engine.tools.chrome_mcp_status.return_value = ChromeMcpStatus(
-            status="ready",
-            detail="Chrome DevTools MCP ready with 3 tool(s).",
-            tool_count=3,
-        )
-        lines: list[str] = []
-        with patch("agent.builder.build_engine", return_value=rebuilt_engine):
-            result = dispatch_slash_command("/chrome auto --save", ctx, emit=lines.append)
-        assert result == "handled"
-        assert ctx.cfg.chrome_mcp_enabled is True
-        assert ctx.cfg.chrome_mcp_auto_connect is True
-        assert ctx.cfg.chrome_mcp_browser_url is None
-        saved = ctx.settings_store.load()
-        assert saved.chrome_mcp_enabled is True
-        assert saved.chrome_mcp_auto_connect is True
-        assert "Saved as workspace default." in lines
-
-
 # ---------------------------------------------------------------------------
 # dispatch_slash_command
 # ---------------------------------------------------------------------------

From 12e6e7ef386e3b2ebf36b23a2629dab3db1a19b2 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 15:45:20 -0400
Subject: [PATCH 48/58] Revert "fix: preserve byte-safe audio chunk sizes"

This reverts commit 5372b98ef2244ba341ec4250b34a59dc20f2d071.
---
 agent/tools.py                                |   5 +
 .../crates/op-core/src/tools/audio.rs         | 111 ++----------------
 tests/test_audio_transcribe.py                |  76 ++----------
 3 files changed, 24 insertions(+), 168 deletions(-)

diff --git a/agent/tools.py b/agent/tools.py
index c9a457cc..3c49c899 100644
--- a/agent/tools.py
+++ b/agent/tools.py
@@ -1370,6 +1370,11 @@ def audio_transcribe(
                 effective_chunk_seconds = self._audio_chunk_seconds_budget(
                     requested_chunk_seconds
                 )
+                if duration_sec > self._AUDIO_MIN_CHUNK_SECONDS:
+                    effective_chunk_seconds = max(
+                        min(duration_sec, effective_chunk_seconds),
+                        min(duration_sec, self._AUDIO_MIN_CHUNK_SECONDS),
+                    )
                 effective_overlap_seconds = min(
                     float(
                         chunk_overlap_seconds
diff --git a/openplanter-desktop/crates/op-core/src/tools/audio.rs b/openplanter-desktop/crates/op-core/src/tools/audio.rs
index cfee6185..75619c01 100644
--- a/openplanter-desktop/crates/op-core/src/tools/audio.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/audio.rs
@@ -1008,11 +1008,15 @@ pub async fn audio_transcribe(
     };
     let requested_chunk_seconds = (chunk_max_seconds.unwrap_or(default_chunk_max_seconds) as f64)
         .min(AUDIO_MAX_CHUNK_SECONDS);
-    let effective_chunk_seconds =
+    let mut effective_chunk_seconds =
         match audio_chunk_seconds_budget(max_bytes, requested_chunk_seconds) {
             Ok(value) => value,
             Err(error) => return ToolResult::error(error),
         };
+    if duration_sec > AUDIO_MIN_CHUNK_SECONDS {
+        effective_chunk_seconds =
+            effective_chunk_seconds.max(duration_sec.min(AUDIO_MIN_CHUNK_SECONDS));
+    }
     let effective_overlap_seconds = chunk_overlap_seconds
         .unwrap_or(default_chunk_overlap_seconds)
         .min((effective_chunk_seconds - 0.001).max(0.0));
@@ -1216,7 +1220,7 @@ mod tests {
         let ffmpeg = root.join("ffmpeg");
         std::fs::write(
             &ffprobe,
-            "#!/bin/sh\nprintf '{\"format\":{\"duration\":\"50.0\"}}'\n",
+            "#!/bin/sh\nprintf '{\"format\":{\"duration\":\"58.0\"}}'\n",
         )
         .unwrap();
         std::fs::write(
@@ -1232,27 +1236,6 @@ mod tests {
         }
     }
 
-    fn install_budget_sensitive_media_tools(root: &Path, duration_seconds: f64) {
-        let ffprobe = root.join("ffprobe");
-        let ffmpeg = root.join("ffmpeg");
-        std::fs::write(
-            &ffprobe,
-            format!("#!/bin/sh\nprintf '{{\"format\":{{\"duration\":\"{duration_seconds}\"}}}}'\n"),
-        )
-        .unwrap();
-        std::fs::write(
-            &ffmpeg,
-            "#!/bin/sh\nout=\"\"\nduration=\"\"\nprev=\"\"\nfor arg in \"$@\"; do\n  if [ \"$prev\" = \"-t\" ]; then duration=\"$arg\"; fi\n  prev=\"$arg\"\n  out=\"$arg\"\ndone\nif [ -n \"$duration\" ]; then\n  bytes=$(awk \"BEGIN { printf \\\"%d\\\", $duration * 32000 }\")\n  dd if=/dev/zero of=\"$out\" bs=1 count=\"$bytes\" status=none\nelse\n  printf 'chunk' > \"$out\"\nfi\n",
-        )
-        .unwrap();
-        #[cfg(unix)]
-        {
-            use std::os::unix::fs::PermissionsExt;
-            std::fs::set_permissions(&ffprobe, std::fs::Permissions::from_mode(0o755)).unwrap();
-            std::fs::set_permissions(&ffmpeg, std::fs::Permissions::from_mode(0o755)).unwrap();
-        }
-    }
-
     #[tokio::test]
     async fn test_audio_transcribe_success() {
         let dir = tempdir().unwrap();
@@ -1386,7 +1369,7 @@ mod tests {
         });
 
         let audio = dir.path().join("clip.wav");
-        std::fs::write(&audio, vec![b'x'; 1_200_000]).unwrap();
+        std::fs::write(&audio, vec![b'x'; 512]).unwrap();
         let root = dir.path().to_path_buf();
         let mut files_read = HashSet::new();
 
@@ -1395,7 +1378,7 @@ mod tests {
             Some("mistral-key"),
             &format!("http://{}", addr),
             "voxtral-mini-latest",
-            1_100_000,
+            64,
             900,
             2.0,
             48,
@@ -1433,82 +1416,4 @@ mod tests {
         assert_eq!(parsed["response"]["segments"][0]["speaker"], "c0_speaker_a");
         assert_eq!(parsed["response"]["segments"][1]["speaker"], "c1_speaker_a");
     }
-
-    #[tokio::test]
-    async fn test_audio_transcribe_preserves_byte_budgeted_chunk_size() {
-        let dir = tempdir().unwrap();
-        install_budget_sensitive_media_tools(dir.path(), 35.0);
-        let original_path = std::env::var_os("PATH");
-        unsafe {
-            let mut parts = vec![dir.path().to_path_buf()];
-            if let Some(existing) = &original_path {
-                parts.extend(std::env::split_paths(existing));
-            }
-            std::env::set_var("PATH", std::env::join_paths(parts).unwrap());
-        }
-
-        let counter = Arc::new(Mutex::new(0usize));
-        let counter_clone = counter.clone();
-        let app = Router::new().route(
-            "/v1/audio/transcriptions",
-            post(move |_body: Bytes| {
-                let counter = counter_clone.clone();
-                async move {
-                    let mut state = counter.lock().unwrap();
-                    *state += 1;
-                    Json(json!({
-                        "text": format!("chunk {}", *state),
-                    }))
-                }
-            }),
-        );
-        let listener = TcpListener::bind("127.0.0.1:0").await.unwrap();
-        let addr = listener.local_addr().unwrap();
-        tokio::spawn(async move {
-            axum::serve(listener, app).await.unwrap();
-        });
-
-        let audio = dir.path().join("clip.wav");
-        std::fs::write(&audio, vec![b'x'; 512]).unwrap();
-        let root = dir.path().to_path_buf();
-        let mut files_read = HashSet::new();
-
-        let result = audio_transcribe(
-            &root,
-            Some("mistral-key"),
-            &format!("http://{}", addr),
-            "voxtral-mini-latest",
-            300_000,
-            900,
-            0.0,
-            48,
-            "clip.wav",
-            None,
-            None,
-            None,
-            None,
-            None,
-            None,
-            Some("force"),
-            Some(30),
-            Some(0.0),
-            None,
-            None,
-            20_000,
-            5,
-            5,
-            &mut files_read,
-        )
-        .await;
-
-        if let Some(value) = original_path {
-            unsafe { std::env::set_var("PATH", value) };
-        }
-
-        assert!(!result.is_error, "unexpected error: {}", result.content);
-        let parsed: Value = serde_json::from_str(&result.content).unwrap();
-        assert_eq!(parsed["mode"], "chunked");
-        assert!(parsed["chunking"]["chunk_seconds"].as_f64().unwrap() < 30.0);
-        assert!(parsed["chunking"]["total_chunks"].as_u64().unwrap() >= 5);
-    }
 }
diff --git a/tests/test_audio_transcribe.py b/tests/test_audio_transcribe.py
index 215a38f3..be70f572 100644
--- a/tests/test_audio_transcribe.py
+++ b/tests/test_audio_transcribe.py
@@ -90,15 +90,15 @@ def test_audio_transcribe_path_escape_blocked(self, tmp_path: Path) -> None:
 
     def test_audio_transcribe_auto_chunks_oversize_files(self, tmp_path: Path) -> None:
         audio = tmp_path / "clip.wav"
-        _write_audio(audio, payload=b"x" * 1_200_000)
+        _write_audio(audio, payload=b"x" * 512)
         tools = _make_tools(
             tmp_path,
-            mistral_transcription_max_bytes=1_100_000,
+            mistral_transcription_max_bytes=64,
         )
 
         with pytest.MonkeyPatch.context() as mp:
             mp.setattr(tools, "_ensure_media_tools", lambda: None)
-            mp.setattr(tools, "_probe_media_duration", lambda _: 50.0)
+            mp.setattr(tools, "_probe_media_duration", lambda _: 58.0)
 
             def fake_extract(
                 source: Path,
@@ -155,12 +155,8 @@ def fake_extract(
         assert parsed["chunking"]["total_chunks"] == 2
         assert parsed["response"]["segments"][0]["speaker"] == "c0_speaker_a"
         assert parsed["response"]["segments"][1]["speaker"] == "c1_speaker_a"
-        assert parsed["response"]["segments"][1]["start"] == pytest.approx(
-            parsed["chunking"]["chunk_seconds"], abs=0.01
-        )
-        assert parsed["response"]["segments"][1]["end"] == pytest.approx(
-            parsed["chunking"]["chunk_seconds"] + 2.0, abs=0.01
-        )
+        assert parsed["response"]["segments"][1]["start"] == 30.0
+        assert parsed["response"]["segments"][1]["end"] == 32.0
 
     def test_audio_transcribe_off_keeps_oversize_rejection(self, tmp_path: Path) -> None:
         audio = tmp_path / "clip.wav"
@@ -172,56 +168,6 @@ def test_audio_transcribe_off_keeps_oversize_rejection(self, tmp_path: Path) ->
         out = tools.audio_transcribe("clip.wav", chunking="off")
         assert "Audio file too large" in out
 
-    def test_audio_transcribe_preserves_byte_budgeted_chunk_size(
-        self, tmp_path: Path
-    ) -> None:
-        audio = tmp_path / "clip.wav"
-        _write_audio(audio, payload=b"x" * 512)
-        tools = _make_tools(
-            tmp_path,
-            mistral_transcription_max_bytes=300_000,
-        )
-
-        with pytest.MonkeyPatch.context() as mp:
-            mp.setattr(tools, "_ensure_media_tools", lambda: None)
-            mp.setattr(tools, "_probe_media_duration", lambda _: 35.0)
-
-            def fake_extract(
-                source: Path,
-                output: Path,
-                *,
-                start_sec: float,
-                duration_sec: float,
-            ) -> None:
-                output.write_bytes(b"x" * int(duration_sec * 32_000))
-
-            observed_sizes: list[int] = []
-
-            def fake_request(*, resolved: Path, **_: object) -> dict[str, object]:
-                observed_sizes.append(resolved.stat().st_size)
-                if observed_sizes[-1] > tools.mistral_transcription_max_bytes:
-                    raise ToolError(
-                        f"Audio file too large: {observed_sizes[-1]:,} bytes "
-                        f"(max {tools.mistral_transcription_max_bytes:,} bytes)"
-                    )
-                return {"text": f"chunk {len(observed_sizes)}"}
-
-            mp.setattr(tools, "_extract_audio_chunk", fake_extract)
-            mp.setattr(tools, "_mistral_transcription_request", fake_request)
-
-            raw = tools.audio_transcribe(
-                "clip.wav",
-                chunking="force",
-                chunk_max_seconds=30,
-                chunk_overlap_seconds=0,
-            )
-
-        parsed = json.loads(raw)
-        assert parsed["mode"] == "chunked"
-        assert parsed["chunking"]["chunk_seconds"] < 30
-        assert observed_sizes
-        assert max(observed_sizes) <= tools.mistral_transcription_max_bytes
-
     def test_audio_transcribe_force_chunks_even_when_under_limit(self, tmp_path: Path) -> None:
         audio = tmp_path / "clip.wav"
         _write_audio(audio, payload=b"x" * 32)
@@ -317,15 +263,15 @@ def fake_request(*, resolved: Path, **_: object) -> dict[str, object]:
 
     def test_audio_transcribe_fail_fast_on_chunk_error(self, tmp_path: Path) -> None:
         audio = tmp_path / "clip.wav"
-        _write_audio(audio, payload=b"x" * 1_200_000)
+        _write_audio(audio, payload=b"x" * 512)
         tools = _make_tools(
             tmp_path,
-            mistral_transcription_max_bytes=1_100_000,
+            mistral_transcription_max_bytes=64,
         )
 
         with pytest.MonkeyPatch.context() as mp:
             mp.setattr(tools, "_ensure_media_tools", lambda: None)
-            mp.setattr(tools, "_probe_media_duration", lambda _: 50.0)
+            mp.setattr(tools, "_probe_media_duration", lambda _: 58.0)
 
             def fake_extract(
                 source: Path,
@@ -356,15 +302,15 @@ def fake_request(**_: object) -> dict[str, object]:
 
     def test_audio_transcribe_can_return_partial_chunked_output(self, tmp_path: Path) -> None:
         audio = tmp_path / "clip.wav"
-        _write_audio(audio, payload=b"x" * 1_200_000)
+        _write_audio(audio, payload=b"x" * 512)
         tools = _make_tools(
             tmp_path,
-            mistral_transcription_max_bytes=1_100_000,
+            mistral_transcription_max_bytes=64,
         )
 
         with pytest.MonkeyPatch.context() as mp:
             mp.setattr(tools, "_ensure_media_tools", lambda: None)
-            mp.setattr(tools, "_probe_media_duration", lambda _: 60.0)
+            mp.setattr(tools, "_probe_media_duration", lambda _: 86.0)
 
             def fake_extract(
                 source: Path,

From 6cf12d4eb8b1f4ecac8e0716fff87cbcb5329096 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 15:45:20 -0400
Subject: [PATCH 49/58] Revert "feat: add long-form mistral transcription
 chunking"

This reverts commit b2088403108a3d1f584413178dae40188e29994b.
---
 README.md                                     |   51 +-
 agent/__main__.py                             |    6 -
 agent/builder.py                              |    9 -
 agent/config.py                               |   62 -
 agent/credentials.py                          |   34 -
 agent/engine.py                               |   75 -
 agent/tool_defs.py                            |   66 -
 agent/tools.py                                |  887 -----------
 agent/tui.py                                  |    1 -
 openplanter-desktop/Cargo.lock                |   17 -
 openplanter-desktop/crates/op-core/Cargo.toml |    2 +-
 .../crates/op-core/src/builder.rs             |   11 -
 .../crates/op-core/src/config.rs              |  152 --
 .../crates/op-core/src/config_hydration.rs    |    1 -
 .../crates/op-core/src/credentials.rs         |   45 +-
 .../crates/op-core/src/engine/mod.rs          |    1 -
 .../crates/op-core/src/tools/audio.rs         | 1419 -----------------
 .../crates/op-core/src/tools/defs.rs          |   63 -
 .../crates/op-core/src/tools/mod.rs           |  126 --
 .../crates/op-tauri/src/commands/agent.rs     |    4 +-
 .../crates/op-tauri/src/commands/config.rs    |   18 +-
 .../crates/op-tauri/src/state.rs              |   14 +-
 .../frontend/src/api/invoke.test.ts           |    2 -
 .../frontend/src/commands/model.test.ts       |    5 -
 .../frontend/src/components/App.test.ts       |    4 +-
 .../frontend/src/components/App.ts            |    2 +-
 tests/test_audio_transcribe.py                |  391 -----
 tests/test_credentials.py                     |    3 -
 tests/test_settings.py                        |    8 -
 tests/test_tool_defs.py                       |    2 +-
 30 files changed, 16 insertions(+), 3465 deletions(-)
 delete mode 100644 openplanter-desktop/crates/op-core/src/tools/audio.rs
 delete mode 100644 tests/test_audio_transcribe.py

diff --git a/README.md b/README.md
index 7aee4d49..a710b1a7 100644
--- a/README.md
+++ b/README.md
@@ -153,59 +153,14 @@ export OPENPLANTER_RATE_LIMIT_RETRY_AFTER_CAP_SEC=120.0
 export OPENPLANTER_ZAI_STREAM_MAX_RETRIES=10
 ```
 
-Additional service keys: `EXA_API_KEY`, `FIRECRAWL_API_KEY`, `BRAVE_API_KEY`, `TAVILY_API_KEY` (web search), `VOYAGE_API_KEY` (embeddings), `MISTRAL_TRANSCRIPTION_API_KEY` or `MISTRAL_API_KEY` (audio transcription).
-
-### Audio Transcription
-
-OpenPlanter includes an `audio_transcribe` tool backed by Mistral's offline transcription API. It uploads local workspace audio files to `POST /v1/audio/transcriptions`, defaults to `voxtral-mini-latest`, and returns transcript text plus any timestamp or diarization metadata that Mistral includes.
-
-Long-form recordings can now be chunked automatically. When `chunking` is left at its default of `auto`, OpenPlanter keeps the current single-upload path for smaller files and switches to overlapping chunked transcription when the upload would exceed the configured Mistral size cap. `chunking: "force"` always chunks, and `chunking: "off"` keeps the single-upload path.
-
-Configure it with:
-
-```bash
-export MISTRAL_API_KEY=...
-# Optional overrides
-export OPENPLANTER_MISTRAL_TRANSCRIPTION_BASE_URL=https://api.mistral.ai
-export OPENPLANTER_MISTRAL_TRANSCRIPTION_MODEL=voxtral-mini-latest
-export OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_BYTES=104857600
-export OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS=900
-export OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS=2.0
-export OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_CHUNKS=48
-export OPENPLANTER_MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC=180
-```
-
-Example tool call:
-
-```json
-{
-  "name": "audio_transcribe",
-  "arguments": {
-    "path": "recordings/interview.wav",
-    "chunking": "auto",
-    "chunk_max_seconds": 900,
-    "chunk_overlap_seconds": 2.0,
-    "diarize": true,
-    "timestamp_granularities": ["segment"]
-  }
-}
-```
-
-Notes:
-- The tool only accepts local workspace files.
-- Long-form chunking requires `ffmpeg` and `ffprobe` to be available at runtime.
-- Video inputs (`.mp4`, `.webm`, `.mov`, `.mkv`, `.avi`, `.m4v`) are audio-extracted with `ffmpeg` before transcription.
-- `language` cannot be combined with `timestamp_granularities`.
-- `context_bias` is normalized to up to 100 phrases before upload.
-- Chunked diarization uses chunk-local speaker labels (for example `c1_speaker_a`) and does not attempt cross-chunk speaker identity merging.
-- If `continue_on_chunk_error` is `true`, the tool can return partial chunked output with warnings instead of failing immediately.
+Additional service keys: `EXA_API_KEY`, `FIRECRAWL_API_KEY`, `BRAVE_API_KEY`, `TAVILY_API_KEY` (web search), `VOYAGE_API_KEY` (embeddings).
 
 All keys can also be set with an `OPENPLANTER_` prefix (e.g. `OPENPLANTER_OPENAI_API_KEY`), via `.env` files in the workspace, or via CLI flags.
 Provider base URLs can also be overridden with `OPENPLANTER_*_BASE_URL`, including `OPENPLANTER_TAVILY_BASE_URL`.
 
 ## Agent Tools
 
-The agent has access to 20 tools, organized around its investigation workflow:
+The agent has access to 19 tools, organized around its investigation workflow:
 
 **Dataset ingestion & workspace** — `list_files`, `search_files`, `repo_map`, `read_file`, `write_file`, `edit_file`, `hashline_edit`, `apply_patch` — load, inspect, and transform source datasets; write structured findings.
 
@@ -213,8 +168,6 @@ The agent has access to 20 tools, organized around its investigation workflow:
 
 **Web** — `web_search` (Exa, Firecrawl, Brave, or Tavily), `fetch_url` — pull public records, verify entities, and retrieve supplementary data.
 
-**Audio** — `audio_transcribe` — transcribe local audio/video with Mistral, including optional timestamps, diarization, and automatic chunking for long recordings.
-
 **Planning & delegation** — `think`, `subtask`, `execute`, `list_artifacts`, `read_artifact` — decompose investigations into focused sub-tasks, each with acceptance criteria and independent verification.
 
 In **recursive mode** (the default), the agent spawns sub-agents via `subtask` and `execute` to parallelize entity resolution, cross-dataset linking, and evidence-chain construction across large investigations.
diff --git a/agent/__main__.py b/agent/__main__.py
index 7b17ec08..33f8d8f1 100644
--- a/agent/__main__.py
+++ b/agent/__main__.py
@@ -248,7 +248,6 @@ def _load_credentials(
         brave_api_key=user_creds.brave_api_key,
         tavily_api_key=user_creds.tavily_api_key,
         voyage_api_key=user_creds.voyage_api_key,
-        mistral_transcription_api_key=user_creds.mistral_transcription_api_key,
     )
 
     store = CredentialStore(workspace=cfg.workspace, session_root_dir=cfg.session_root_dir)
@@ -273,8 +272,6 @@ def _load_credentials(
         creds.tavily_api_key = stored.tavily_api_key
     if stored.voyage_api_key:
         creds.voyage_api_key = stored.voyage_api_key
-    if stored.mistral_transcription_api_key:
-        creds.mistral_transcription_api_key = stored.mistral_transcription_api_key
 
     env_creds = credentials_from_env()
     if env_creds.openai_api_key:
@@ -297,8 +294,6 @@ def _load_credentials(
         creds.tavily_api_key = env_creds.tavily_api_key
     if env_creds.voyage_api_key:
         creds.voyage_api_key = env_creds.voyage_api_key
-    if env_creds.mistral_transcription_api_key:
-        creds.mistral_transcription_api_key = env_creds.mistral_transcription_api_key
 
     for env_path in discover_env_candidates(cfg.workspace):
         file_creds = parse_env_file(env_path)
@@ -375,7 +370,6 @@ def _apply_runtime_overrides(cfg: AgentConfig, args: argparse.Namespace, creds:
     cfg.brave_api_key = creds.brave_api_key
     cfg.tavily_api_key = creds.tavily_api_key
     cfg.voyage_api_key = creds.voyage_api_key
-    cfg.mistral_transcription_api_key = creds.mistral_transcription_api_key
     cfg.api_key = cfg.openai_api_key
 
     if args.zai_plan:
diff --git a/agent/builder.py b/agent/builder.py
index 057eba5d..59152fd1 100644
--- a/agent/builder.py
+++ b/agent/builder.py
@@ -239,15 +239,6 @@ def build_engine(cfg: AgentConfig) -> RLMEngine:
         brave_base_url=cfg.brave_base_url,
         tavily_api_key=cfg.tavily_api_key,
         tavily_base_url=cfg.tavily_base_url,
-        mistral_transcription_api_key=cfg.mistral_transcription_api_key,
-        mistral_transcription_base_url=cfg.mistral_transcription_base_url,
-        mistral_transcription_model=cfg.mistral_transcription_model,
-        mistral_transcription_max_bytes=cfg.mistral_transcription_max_bytes,
-        mistral_transcription_chunk_max_seconds=cfg.mistral_transcription_chunk_max_seconds,
-        mistral_transcription_chunk_overlap_seconds=cfg.mistral_transcription_chunk_overlap_seconds,
-        mistral_transcription_max_chunks=cfg.mistral_transcription_max_chunks,
-        mistral_transcription_request_timeout_sec=cfg.mistral_transcription_request_timeout_sec,
-        max_observation_chars=cfg.max_observation_chars,
     )
 
     try:
diff --git a/agent/config.py b/agent/config.py
index aa604cb8..7f1f0740 100644
--- a/agent/config.py
+++ b/agent/config.py
@@ -12,12 +12,6 @@
 FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER = "dont-worry-it-will-be-injected"
 ZAI_PAYGO_BASE_URL = "https://api.z.ai/api/paas/v4"
 ZAI_CODING_BASE_URL = "https://api.z.ai/api/coding/paas/v4"
-MISTRAL_TRANSCRIPTION_BASE_URL = "https://api.mistral.ai"
-MISTRAL_TRANSCRIPTION_DEFAULT_MODEL = "voxtral-mini-latest"
-MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS = 900
-MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS = 2.0
-MISTRAL_TRANSCRIPTION_MAX_CHUNKS = 48
-MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC = 180
 
 PROVIDER_DEFAULT_MODELS: dict[str, str] = {
     "openai": "azure-foundry/gpt-5.3-codex",
@@ -112,7 +106,6 @@ class AgentConfig:
     firecrawl_base_url: str = "https://api.firecrawl.dev/v1"
     brave_base_url: str = "https://api.search.brave.com/res/v1"
     tavily_base_url: str = "https://api.tavily.com"
-    mistral_transcription_base_url: str = MISTRAL_TRANSCRIPTION_BASE_URL
     openai_api_key: str | None = None
     anthropic_api_key: str | None = None
     openrouter_api_key: str | None = None
@@ -124,17 +117,6 @@ class AgentConfig:
     tavily_api_key: str | None = None
     web_search_provider: str = "exa"
     voyage_api_key: str | None = None
-    mistral_transcription_api_key: str | None = None
-    mistral_transcription_model: str = MISTRAL_TRANSCRIPTION_DEFAULT_MODEL
-    mistral_transcription_max_bytes: int = 100 * 1024 * 1024
-    mistral_transcription_chunk_max_seconds: int = MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS
-    mistral_transcription_chunk_overlap_seconds: float = (
-        MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS
-    )
-    mistral_transcription_max_chunks: int = MISTRAL_TRANSCRIPTION_MAX_CHUNKS
-    mistral_transcription_request_timeout_sec: int = (
-        MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC
-    )
     max_depth: int = 4
     max_steps_per_call: int = 100
     budget_extension_enabled: bool = True
@@ -185,11 +167,6 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
         brave_api_key = os.getenv("OPENPLANTER_BRAVE_API_KEY") or os.getenv("BRAVE_API_KEY")
         tavily_api_key = os.getenv("OPENPLANTER_TAVILY_API_KEY") or os.getenv("TAVILY_API_KEY")
         voyage_api_key = os.getenv("OPENPLANTER_VOYAGE_API_KEY") or os.getenv("VOYAGE_API_KEY")
-        mistral_transcription_api_key = (
-            os.getenv("OPENPLANTER_MISTRAL_TRANSCRIPTION_API_KEY")
-            or os.getenv("MISTRAL_TRANSCRIPTION_API_KEY")
-            or os.getenv("MISTRAL_API_KEY")
-        )
         openai_base_url = os.getenv("OPENPLANTER_OPENAI_BASE_URL") or os.getenv(
             "OPENPLANTER_BASE_URL",
             FOUNDRY_OPENAI_BASE_URL,
@@ -244,12 +221,6 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             firecrawl_base_url=os.getenv("OPENPLANTER_FIRECRAWL_BASE_URL", "https://api.firecrawl.dev/v1"),
             brave_base_url=os.getenv("OPENPLANTER_BRAVE_BASE_URL", "https://api.search.brave.com/res/v1"),
             tavily_base_url=os.getenv("OPENPLANTER_TAVILY_BASE_URL", "https://api.tavily.com"),
-            mistral_transcription_base_url=os.getenv(
-                "OPENPLANTER_MISTRAL_TRANSCRIPTION_BASE_URL",
-                os.getenv("MISTRAL_TRANSCRIPTION_BASE_URL")
-                or os.getenv("MISTRAL_BASE_URL")
-                or MISTRAL_TRANSCRIPTION_BASE_URL,
-            ),
             openai_api_key=openai_api_key,
             anthropic_api_key=anthropic_api_key,
             openrouter_api_key=openrouter_api_key,
@@ -261,39 +232,6 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             tavily_api_key=tavily_api_key,
             web_search_provider=web_search_provider,
             voyage_api_key=voyage_api_key,
-            mistral_transcription_api_key=(mistral_transcription_api_key or "").strip() or None,
-            mistral_transcription_model=(
-                os.getenv("OPENPLANTER_MISTRAL_TRANSCRIPTION_MODEL")
-                or os.getenv("MISTRAL_TRANSCRIPTION_MODEL")
-                or MISTRAL_TRANSCRIPTION_DEFAULT_MODEL
-            ),
-            mistral_transcription_max_bytes=int(
-                os.getenv("OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_BYTES", "104857600")
-            ),
-            mistral_transcription_chunk_max_seconds=int(
-                os.getenv(
-                    "OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS",
-                    str(MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS),
-                )
-            ),
-            mistral_transcription_chunk_overlap_seconds=float(
-                os.getenv(
-                    "OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS",
-                    str(MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS),
-                )
-            ),
-            mistral_transcription_max_chunks=int(
-                os.getenv(
-                    "OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_CHUNKS",
-                    str(MISTRAL_TRANSCRIPTION_MAX_CHUNKS),
-                )
-            ),
-            mistral_transcription_request_timeout_sec=int(
-                os.getenv(
-                    "OPENPLANTER_MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC",
-                    str(MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC),
-                )
-            ),
             max_depth=int(os.getenv("OPENPLANTER_MAX_DEPTH", "4")),
             max_steps_per_call=int(os.getenv("OPENPLANTER_MAX_STEPS", "100")),
             budget_extension_enabled=budget_extension_enabled,
diff --git a/agent/credentials.py b/agent/credentials.py
index 09bb81a4..e1a25c03 100644
--- a/agent/credentials.py
+++ b/agent/credentials.py
@@ -21,7 +21,6 @@ class CredentialBundle:
     brave_api_key: str | None = None
     tavily_api_key: str | None = None
     voyage_api_key: str | None = None
-    mistral_transcription_api_key: str | None = None
 
     def has_any(self) -> bool:
         return bool(
@@ -35,10 +34,6 @@ def has_any(self) -> bool:
             or (self.brave_api_key and self.brave_api_key.strip())
             or (self.tavily_api_key and self.tavily_api_key.strip())
             or (self.voyage_api_key and self.voyage_api_key.strip())
-            or (
-                self.mistral_transcription_api_key
-                and self.mistral_transcription_api_key.strip()
-            )
         )
 
     def merge_missing(self, other: "CredentialBundle") -> None:
@@ -62,11 +57,6 @@ def merge_missing(self, other: "CredentialBundle") -> None:
             self.tavily_api_key = other.tavily_api_key
         if not self.voyage_api_key and other.voyage_api_key:
             self.voyage_api_key = other.voyage_api_key
-        if (
-            not self.mistral_transcription_api_key
-            and other.mistral_transcription_api_key
-        ):
-            self.mistral_transcription_api_key = other.mistral_transcription_api_key
 
     def to_json(self) -> dict[str, str]:
         out: dict[str, str] = {}
@@ -90,8 +80,6 @@ def to_json(self) -> dict[str, str]:
             out["tavily_api_key"] = self.tavily_api_key
         if self.voyage_api_key:
             out["voyage_api_key"] = self.voyage_api_key
-        if self.mistral_transcription_api_key:
-            out["mistral_transcription_api_key"] = self.mistral_transcription_api_key
         return out
 
     @classmethod
@@ -109,10 +97,6 @@ def from_json(cls, payload: dict[str, str] | None) -> "CredentialBundle":
             brave_api_key=(payload.get("brave_api_key") or "").strip() or None,
             tavily_api_key=(payload.get("tavily_api_key") or "").strip() or None,
             voyage_api_key=(payload.get("voyage_api_key") or "").strip() or None,
-            mistral_transcription_api_key=(
-                payload.get("mistral_transcription_api_key") or ""
-            ).strip()
-            or None,
         )
 
 
@@ -164,13 +148,6 @@ def parse_env_file(path: Path) -> CredentialBundle:
         brave_api_key=(env.get("BRAVE_API_KEY") or env.get("OPENPLANTER_BRAVE_API_KEY") or "").strip() or None,
         tavily_api_key=(env.get("TAVILY_API_KEY") or env.get("OPENPLANTER_TAVILY_API_KEY") or "").strip() or None,
         voyage_api_key=(env.get("VOYAGE_API_KEY") or env.get("OPENPLANTER_VOYAGE_API_KEY") or "").strip() or None,
-        mistral_transcription_api_key=(
-            env.get("OPENPLANTER_MISTRAL_TRANSCRIPTION_API_KEY")
-            or env.get("MISTRAL_TRANSCRIPTION_API_KEY")
-            or env.get("MISTRAL_API_KEY")
-            or ""
-        ).strip()
-        or None,
     )
 
 
@@ -206,13 +183,6 @@ def credentials_from_env() -> CredentialBundle:
         brave_api_key=(os.getenv("OPENPLANTER_BRAVE_API_KEY") or os.getenv("BRAVE_API_KEY") or "").strip() or None,
         tavily_api_key=(os.getenv("OPENPLANTER_TAVILY_API_KEY") or os.getenv("TAVILY_API_KEY") or "").strip() or None,
         voyage_api_key=(os.getenv("OPENPLANTER_VOYAGE_API_KEY") or os.getenv("VOYAGE_API_KEY") or "").strip() or None,
-        mistral_transcription_api_key=(
-            os.getenv("OPENPLANTER_MISTRAL_TRANSCRIPTION_API_KEY")
-            or os.getenv("MISTRAL_TRANSCRIPTION_API_KEY")
-            or os.getenv("MISTRAL_API_KEY")
-            or ""
-        ).strip()
-        or None,
     )
 
 
@@ -307,7 +277,6 @@ def prompt_for_credentials(
         brave_api_key=existing.brave_api_key,
         tavily_api_key=existing.tavily_api_key,
         voyage_api_key=existing.voyage_api_key,
-        mistral_transcription_api_key=existing.mistral_transcription_api_key,
     )
 
     should_prompt = force or not current.has_any()
@@ -345,9 +314,6 @@ def _ask(label: str, existing_value: str | None) -> str | None:
     current.brave_api_key = _ask("Brave", current.brave_api_key)
     current.tavily_api_key = _ask("Tavily", current.tavily_api_key)
     current.voyage_api_key = _ask("Voyage", current.voyage_api_key)
-    current.mistral_transcription_api_key = _ask(
-        "Mistral Transcription", current.mistral_transcription_api_key
-    )
     if not force and current.has_any() and not existing.has_any():
         changed = True
     return current, changed
diff --git a/agent/engine.py b/agent/engine.py
index 1e4f4de1..33ff033c 100644
--- a/agent/engine.py
+++ b/agent/engine.py
@@ -32,7 +32,6 @@
     "fetch_url",
     "read_file",
     "read_image",
-    "audio_transcribe",
     "list_artifacts",
     "read_artifact",
 }
@@ -1262,80 +1261,6 @@ def _apply_tool_call(
                 self._pending_image.data = (b64, media_type)
             return False, text
 
-        if name == "audio_transcribe":
-            path = str(args.get("path", "")).strip()
-            if not path:
-                return False, "audio_transcribe requires path"
-            diarize = args.get("diarize")
-            diarize = diarize if isinstance(diarize, bool) else None
-            raw_timestamps = args.get("timestamp_granularities")
-            if isinstance(raw_timestamps, list):
-                timestamp_granularities = [
-                    str(v).strip() for v in raw_timestamps if str(v).strip()
-                ]
-            elif isinstance(raw_timestamps, str) and raw_timestamps.strip():
-                timestamp_granularities = [raw_timestamps.strip()]
-            else:
-                timestamp_granularities = None
-            raw_context_bias = args.get("context_bias")
-            if isinstance(raw_context_bias, list):
-                context_bias = [
-                    str(v).strip() for v in raw_context_bias if str(v).strip()
-                ]
-            elif isinstance(raw_context_bias, str) and raw_context_bias.strip():
-                context_bias = [
-                    part.strip()
-                    for part in raw_context_bias.split(",")
-                    if part.strip()
-                ]
-            else:
-                context_bias = None
-            language = str(args.get("language", "")).strip() or None
-            model = str(args.get("model", "")).strip() or None
-            raw_temperature = args.get("temperature")
-            temperature = None
-            if isinstance(raw_temperature, (int, float)) and not isinstance(
-                raw_temperature, bool
-            ):
-                temperature = float(raw_temperature)
-            chunking = str(args.get("chunking", "")).strip().lower() or None
-            raw_chunk_max_seconds = args.get("chunk_max_seconds")
-            chunk_max_seconds = None
-            if isinstance(raw_chunk_max_seconds, int) and not isinstance(
-                raw_chunk_max_seconds, bool
-            ):
-                chunk_max_seconds = raw_chunk_max_seconds
-            raw_chunk_overlap_seconds = args.get("chunk_overlap_seconds")
-            chunk_overlap_seconds = None
-            if isinstance(raw_chunk_overlap_seconds, (int, float)) and not isinstance(
-                raw_chunk_overlap_seconds, bool
-            ):
-                chunk_overlap_seconds = float(raw_chunk_overlap_seconds)
-            raw_max_chunks = args.get("max_chunks")
-            max_chunks = None
-            if isinstance(raw_max_chunks, int) and not isinstance(raw_max_chunks, bool):
-                max_chunks = raw_max_chunks
-            raw_continue_on_chunk_error = args.get("continue_on_chunk_error")
-            continue_on_chunk_error = (
-                raw_continue_on_chunk_error
-                if isinstance(raw_continue_on_chunk_error, bool)
-                else None
-            )
-            return False, self.tools.audio_transcribe(
-                path=path,
-                diarize=diarize,
-                timestamp_granularities=timestamp_granularities,
-                context_bias=context_bias,
-                language=language,
-                model=model,
-                temperature=temperature,
-                chunking=chunking,
-                chunk_max_seconds=chunk_max_seconds,
-                chunk_overlap_seconds=chunk_overlap_seconds,
-                max_chunks=max_chunks,
-                continue_on_chunk_error=continue_on_chunk_error,
-            )
-
         if name == "write_file":
             path = str(args.get("path", "")).strip()
             if not path:
diff --git a/agent/tool_defs.py b/agent/tool_defs.py
index 50f7a9cb..73ef01ed 100644
--- a/agent/tool_defs.py
+++ b/agent/tool_defs.py
@@ -134,72 +134,6 @@
             "additionalProperties": False,
         },
     },
-    {
-        "name": "audio_transcribe",
-        "description": (
-            "Transcribe a local audio file with Mistral's offline transcription API. "
-            "Supports diarization, timestamp granularity, context bias, language, "
-            "model override, temperature, and optional chunking for long-form audio/video."
-        ),
-        "parameters": {
-            "type": "object",
-            "properties": {
-                "path": {
-                    "type": "string",
-                    "description": "Relative or absolute path to the audio file within the workspace.",
-                },
-                "diarize": {
-                    "type": "boolean",
-                    "description": "Whether to request speaker diarization.",
-                },
-                "timestamp_granularities": {
-                    "type": "array",
-                    "items": {"type": "string"},
-                    "description": "Optional timestamp granularity values such as 'segment' or 'word'.",
-                },
-                "context_bias": {
-                    "type": "array",
-                    "items": {"type": "string"},
-                    "description": "Optional bias phrases to steer transcription toward expected terms.",
-                },
-                "language": {
-                    "type": "string",
-                    "description": "Optional ISO language hint. Cannot be combined with timestamp_granularities.",
-                },
-                "model": {
-                    "type": "string",
-                    "description": "Optional transcription model override.",
-                },
-                "temperature": {
-                    "type": "number",
-                    "description": "Optional decoding temperature.",
-                },
-                "chunking": {
-                    "type": "string",
-                    "description": "Long-form handling mode: 'auto', 'off', or 'force'.",
-                    "enum": ["auto", "off", "force"],
-                },
-                "chunk_max_seconds": {
-                    "type": "integer",
-                    "description": "Maximum chunk duration in seconds for chunked transcription.",
-                },
-                "chunk_overlap_seconds": {
-                    "type": "number",
-                    "description": "Overlap between adjacent chunks in seconds.",
-                },
-                "max_chunks": {
-                    "type": "integer",
-                    "description": "Maximum number of chunks allowed for a transcription run.",
-                },
-                "continue_on_chunk_error": {
-                    "type": "boolean",
-                    "description": "Continue remaining chunks and return partial output if a chunk fails.",
-                },
-            },
-            "required": ["path"],
-            "additionalProperties": False,
-        },
-    },
     {
         "name": "write_file",
         "description": "Create or overwrite a file in the workspace with the given content.",
diff --git a/agent/tools.py b/agent/tools.py
index 3c49c899..e626d140 100644
--- a/agent/tools.py
+++ b/agent/tools.py
@@ -2,11 +2,9 @@
 
 import ast
 import base64
-import copy
 import fnmatch
 import html as _html
 import json
-import mimetypes
 import os
 import signal
 import shutil
@@ -16,7 +14,6 @@
 import urllib.error
 import urllib.parse
 import urllib.request
-import uuid
 import re as _re
 import zlib
 from contextlib import contextmanager
@@ -40,7 +37,6 @@
 _HASHLINE_PREFIX_RE = _re.compile(r"^\d+:[0-9a-f]{2}\|")
 _HEREDOC_RE = _re.compile(r"<<-?\s*['\"]?\w+['\"]?")
 _INTERACTIVE_RE = _re.compile(r"(^|[;&|]\s*)(vim|nano|less|more|top|htop|man)\b")
-_TOKEN_NORMALIZE_RE = _re.compile(r"[^a-z0-9]+")
 
 
 class _HTMLTextExtractor(HTMLParser):
@@ -119,7 +115,6 @@ class WorkspaceTools:
     command_timeout_sec: int = 45
     max_shell_output_chars: int = 16000
     max_file_chars: int = 20000
-    max_observation_chars: int = 6000
     max_files_listed: int = 400
     max_search_hits: int = 200
     web_search_provider: str = "exa"
@@ -131,14 +126,6 @@ class WorkspaceTools:
     brave_base_url: str = "https://api.search.brave.com/res/v1"
     tavily_api_key: str | None = None
     tavily_base_url: str = "https://api.tavily.com"
-    mistral_transcription_api_key: str | None = None
-    mistral_transcription_base_url: str = "https://api.mistral.ai"
-    mistral_transcription_model: str = "voxtral-mini-latest"
-    mistral_transcription_max_bytes: int = 100 * 1024 * 1024
-    mistral_transcription_chunk_max_seconds: int = 900
-    mistral_transcription_chunk_overlap_seconds: float = 2.0
-    mistral_transcription_max_chunks: int = 48
-    mistral_transcription_request_timeout_sec: int = 180
 
     def __post_init__(self) -> None:
         self.root = self.root.expanduser().resolve()
@@ -631,880 +618,6 @@ def read_image(self, path: str) -> tuple[str, str | None, str | None]:
         text = f"Image {rel} ({len(raw):,} bytes, {media_type})"
         return text, b64, media_type
 
-    _AUDIO_EXTENSIONS = {
-        ".aac",
-        ".flac",
-        ".m4a",
-        ".mp3",
-        ".mpeg",
-        ".mpga",
-        ".oga",
-        ".ogg",
-        ".opus",
-        ".wav",
-    }
-    _VIDEO_EXTENSIONS = {
-        ".avi",
-        ".m4v",
-        ".mkv",
-        ".mov",
-        ".mp4",
-        ".webm",
-    }
-    _TIMESTAMP_GRANULARITIES = {"segment", "word"}
-    _AUDIO_CHUNKING_MODES = {"auto", "force", "off"}
-    _AUDIO_CHUNK_TARGET_FILL_RATIO = 0.85
-    _AUDIO_CHUNK_BYTES_PER_SECOND = 32000
-    _AUDIO_MIN_CHUNK_SECONDS = 30.0
-    _AUDIO_MAX_CHUNK_SECONDS = 1800.0
-    _AUDIO_MAX_CHUNK_OVERLAP_SECONDS = 15.0
-    _AUDIO_MAX_CHUNKS = 200
-    _AUDIO_SPEAKER_FIELDS = {"speaker", "speaker_id", "speaker_label"}
-
-    def _mistral_transcription_url(self) -> str:
-        base = self.mistral_transcription_base_url.rstrip("/")
-        if base.endswith("/v1"):
-            return f"{base}/audio/transcriptions"
-        return f"{base}/v1/audio/transcriptions"
-
-    def _encode_multipart_form_data(
-        self,
-        *,
-        fields: list[tuple[str, str]],
-        file_field_name: str,
-        file_name: str,
-        file_bytes: bytes,
-        media_type: str,
-    ) -> tuple[bytes, str]:
-        boundary = f"----OpenPlanter{uuid.uuid4().hex}"
-        chunks: list[bytes] = []
-        for key, value in fields:
-            chunks.append(f"--{boundary}\r\n".encode("utf-8"))
-            chunks.append(
-                f'Content-Disposition: form-data; name="{key}"\r\n\r\n'.encode(
-                    "utf-8"
-                )
-            )
-            chunks.append(value.encode("utf-8"))
-            chunks.append(b"\r\n")
-        safe_name = Path(file_name).name.replace('"', "")
-        chunks.append(f"--{boundary}\r\n".encode("utf-8"))
-        chunks.append(
-            (
-                f'Content-Disposition: form-data; name="{file_field_name}"; '
-                f'filename="{safe_name}"\r\n'
-            ).encode("utf-8")
-        )
-        chunks.append(f"Content-Type: {media_type}\r\n\r\n".encode("utf-8"))
-        chunks.append(file_bytes)
-        chunks.append(b"\r\n")
-        chunks.append(f"--{boundary}--\r\n".encode("utf-8"))
-        return b"".join(chunks), boundary
-
-    def _mistral_transcription_request(
-        self,
-        *,
-        resolved: Path,
-        model: str,
-        diarize: bool | None,
-        timestamp_granularities: list[str] | None,
-        context_bias: list[str] | None,
-        language: str | None,
-        temperature: float | None,
-    ) -> dict[str, Any]:
-        if not (
-            self.mistral_transcription_api_key
-            and self.mistral_transcription_api_key.strip()
-        ):
-            raise ToolError("Mistral transcription API key not configured")
-        try:
-            size = resolved.stat().st_size
-        except OSError as exc:
-            raise ToolError(f"Failed to inspect audio file {resolved.name}: {exc}") from exc
-        if size > self.mistral_transcription_max_bytes:
-            raise ToolError(
-                f"Audio file too large: {size:,} bytes "
-                f"(max {self.mistral_transcription_max_bytes:,} bytes)"
-            )
-        try:
-            file_bytes = resolved.read_bytes()
-        except OSError as exc:
-            raise ToolError(f"Failed to read audio file {resolved.name}: {exc}") from exc
-
-        media_type = mimetypes.guess_type(resolved.name)[0] or "application/octet-stream"
-        fields: list[tuple[str, str]] = [
-            ("model", model),
-            ("stream", "false"),
-        ]
-        if diarize is not None:
-            fields.append(("diarize", "true" if diarize else "false"))
-        if language:
-            fields.append(("language", language))
-        if temperature is not None:
-            fields.append(("temperature", str(temperature)))
-        for granularity in timestamp_granularities or []:
-            fields.append(("timestamp_granularities", granularity))
-        for phrase in context_bias or []:
-            fields.append(("context_bias", phrase))
-
-        body, boundary = self._encode_multipart_form_data(
-            fields=fields,
-            file_field_name="file",
-            file_name=resolved.name,
-            file_bytes=file_bytes,
-            media_type=media_type,
-        )
-        req = urllib.request.Request(
-            url=self._mistral_transcription_url(),
-            data=body,
-            headers={
-                "Authorization": f"Bearer {self.mistral_transcription_api_key}",
-                "Content-Type": f"multipart/form-data; boundary={boundary}",
-            },
-            method="POST",
-        )
-        try:
-            with urllib.request.urlopen(
-                req, timeout=self.mistral_transcription_request_timeout_sec
-            ) as resp:
-                raw = resp.read().decode("utf-8", errors="replace")
-        except urllib.error.HTTPError as exc:
-            body = exc.read().decode("utf-8", errors="replace")
-            raise ToolError(f"Mistral transcription HTTP {exc.code}: {body}") from exc
-        except urllib.error.URLError as exc:
-            raise ToolError(f"Mistral transcription connection error: {exc}") from exc
-        except OSError as exc:
-            raise ToolError(f"Mistral transcription network error: {exc}") from exc
-
-        try:
-            parsed = json.loads(raw)
-        except json.JSONDecodeError as exc:
-            raise ToolError(
-                f"Mistral transcription returned non-JSON payload: {raw[:500]}"
-            ) from exc
-        if not isinstance(parsed, dict):
-            raise ToolError(
-                f"Mistral transcription returned non-object response: {type(parsed)!r}"
-            )
-        return parsed
-
-    def _audio_transcribe_max_chars(self) -> int:
-        return min(self.max_file_chars, self.max_observation_chars)
-
-    def _audio_transcribe_options(
-        self,
-        *,
-        diarize: bool | None,
-        timestamp_granularities: list[str] | None,
-        context_bias: list[str] | None,
-        language: str | None,
-        temperature: float | None,
-        chunking: str,
-        chunk_max_seconds: int | None,
-        chunk_overlap_seconds: float | None,
-        max_chunks: int | None,
-        continue_on_chunk_error: bool | None,
-    ) -> dict[str, Any]:
-        options: dict[str, Any] = {"chunking": chunking}
-        if diarize is not None:
-            options["diarize"] = diarize
-        if timestamp_granularities:
-            options["timestamp_granularities"] = timestamp_granularities
-        if context_bias:
-            options["context_bias"] = context_bias
-        if language:
-            options["language"] = language
-        if temperature is not None:
-            options["temperature"] = temperature
-        if chunk_max_seconds is not None:
-            options["chunk_max_seconds"] = chunk_max_seconds
-        if chunk_overlap_seconds is not None:
-            options["chunk_overlap_seconds"] = chunk_overlap_seconds
-        if max_chunks is not None:
-            options["max_chunks"] = max_chunks
-        if continue_on_chunk_error is not None:
-            options["continue_on_chunk_error"] = continue_on_chunk_error
-        return options
-
-    def _ensure_media_tools(self) -> None:
-        missing = [
-            name for name in ("ffmpeg", "ffprobe") if shutil.which(name) is None
-        ]
-        if missing:
-            joined = ", ".join(missing)
-            raise ToolError(
-                f"Long-form transcription requires {joined}. Install ffmpeg/ffprobe and retry."
-            )
-
-    def _run_media_command(self, argv: list[str]) -> str:
-        try:
-            completed = subprocess.run(
-                argv,
-                capture_output=True,
-                text=True,
-                timeout=self.command_timeout_sec,
-                check=False,
-            )
-        except FileNotFoundError as exc:
-            raise ToolError(f"Media tooling not available: {argv[0]}") from exc
-        except subprocess.TimeoutExpired as exc:
-            raise ToolError(f"{argv[0]} timed out after {self.command_timeout_sec}s") from exc
-        if completed.returncode != 0:
-            stderr = completed.stderr.strip() or completed.stdout.strip()
-            raise ToolError(f"{argv[0]} failed: {stderr or 'unknown error'}")
-        return completed.stdout
-
-    def _probe_media_duration(self, source: Path) -> float:
-        raw = self._run_media_command(
-            [
-                "ffprobe",
-                "-v",
-                "error",
-                "-print_format",
-                "json",
-                "-show_format",
-                str(source),
-            ]
-        )
-        try:
-            parsed = json.loads(raw)
-        except json.JSONDecodeError as exc:
-            raise ToolError(f"ffprobe returned invalid JSON for {source.name}") from exc
-        duration_value = (
-            parsed.get("format", {}).get("duration")
-            if isinstance(parsed, dict)
-            else None
-        )
-        try:
-            duration = float(duration_value)
-        except (TypeError, ValueError) as exc:
-            raise ToolError(f"ffprobe did not return a valid duration for {source.name}") from exc
-        if duration <= 0:
-            raise ToolError(f"ffprobe reported non-positive duration for {source.name}")
-        return duration
-
-    def _extract_audio_source(self, source: Path, output: Path) -> None:
-        self._run_media_command(
-            [
-                "ffmpeg",
-                "-nostdin",
-                "-y",
-                "-i",
-                str(source),
-                "-vn",
-                "-ac",
-                "1",
-                "-ar",
-                "16000",
-                "-c:a",
-                "pcm_s16le",
-                str(output),
-            ]
-        )
-
-    def _extract_audio_chunk(
-        self,
-        source: Path,
-        output: Path,
-        *,
-        start_sec: float,
-        duration_sec: float,
-    ) -> None:
-        self._run_media_command(
-            [
-                "ffmpeg",
-                "-nostdin",
-                "-y",
-                "-ss",
-                f"{start_sec:.3f}",
-                "-i",
-                str(source),
-                "-t",
-                f"{duration_sec:.3f}",
-                "-vn",
-                "-ac",
-                "1",
-                "-ar",
-                "16000",
-                "-c:a",
-                "pcm_s16le",
-                str(output),
-            ]
-        )
-
-    def _audio_chunk_seconds_budget(self, requested_seconds: float) -> float:
-        safe_seconds = (
-            self.mistral_transcription_max_bytes
-            * self._AUDIO_CHUNK_TARGET_FILL_RATIO
-            / self._AUDIO_CHUNK_BYTES_PER_SECOND
-        )
-        if safe_seconds <= 0:
-            raise ToolError("Mistral transcription max-bytes budget is too small to chunk audio")
-        return min(requested_seconds, safe_seconds)
-
-    def _plan_audio_chunks(
-        self,
-        *,
-        duration_sec: float,
-        chunk_seconds: float,
-        overlap_seconds: float,
-        max_chunks: int,
-    ) -> list[dict[str, float]]:
-        if duration_sec <= 0:
-            raise ToolError("Cannot chunk media with non-positive duration")
-        chunk_seconds = max(1.0, chunk_seconds)
-        overlap_seconds = min(max(0.0, overlap_seconds), max(0.0, chunk_seconds - 0.001))
-        chunks: list[dict[str, float]] = []
-        start = 0.0
-        while start < duration_sec - 1e-6:
-            end = min(duration_sec, start + chunk_seconds)
-            index = len(chunks)
-            chunks.append(
-                {
-                    "index": float(index),
-                    "start_sec": round(start, 3),
-                    "end_sec": round(end, 3),
-                    "duration_sec": round(end - start, 3),
-                    "leading_overlap_sec": 0.0 if index == 0 else round(overlap_seconds, 3),
-                }
-            )
-            if len(chunks) > max_chunks:
-                raise ToolError(
-                    f"Chunk plan would create {len(chunks)} chunks (max {max_chunks})"
-                )
-            if end >= duration_sec - 1e-6:
-                break
-            next_start = end - overlap_seconds
-            if next_start <= start + 1e-6:
-                next_start = end
-            start = next_start
-        return chunks
-
-    def _is_video_extension(self, ext: str) -> bool:
-        return ext in self._VIDEO_EXTENSIONS
-
-    def _normalized_audio_token(self, token: str) -> str:
-        return _TOKEN_NORMALIZE_RE.sub("", token.lower())
-
-    def _dedupe_audio_overlap_text(self, existing_text: str, incoming_text: str) -> str:
-        if not existing_text.strip():
-            return incoming_text.strip()
-        current_tokens = incoming_text.split()
-        if not current_tokens:
-            return ""
-        previous_tokens = existing_text.split()
-        max_window = min(len(previous_tokens), len(current_tokens), 80)
-        if max_window < 5:
-            return incoming_text.strip()
-        previous_norm = [
-            self._normalized_audio_token(token)
-            for token in previous_tokens[-max_window:]
-        ]
-        current_norm = [
-            self._normalized_audio_token(token)
-            for token in current_tokens[:max_window]
-        ]
-        for match_len in range(max_window, 4, -1):
-            if previous_norm[-match_len:] == current_norm[:match_len]:
-                return " ".join(current_tokens[match_len:]).strip()
-        return incoming_text.strip()
-
-    def _entry_time_bounds(self, entry: dict[str, Any]) -> tuple[float, float] | None:
-        start = entry.get("start")
-        end = entry.get("end")
-        if isinstance(start, (int, float)) and isinstance(end, (int, float)):
-            return float(start), float(end)
-        timestamps = entry.get("timestamps")
-        if (
-            isinstance(timestamps, list)
-            and len(timestamps) >= 2
-            and isinstance(timestamps[0], (int, float))
-            and isinstance(timestamps[1], (int, float))
-        ):
-            return float(timestamps[0]), float(timestamps[1])
-        return None
-
-    def _set_entry_time_bounds(
-        self,
-        entry: dict[str, Any],
-        *,
-        start: float,
-        end: float,
-    ) -> None:
-        if "start" in entry or "end" in entry:
-            entry["start"] = round(start, 3)
-            entry["end"] = round(end, 3)
-        elif isinstance(entry.get("timestamps"), list):
-            timestamps = list(entry.get("timestamps", []))
-            while len(timestamps) < 2:
-                timestamps.append(0.0)
-            timestamps[0] = round(start, 3)
-            timestamps[1] = round(end, 3)
-            entry["timestamps"] = timestamps
-
-    def _prefix_audio_speakers(self, value: Any, prefix: str) -> Any:
-        if isinstance(value, list):
-            return [self._prefix_audio_speakers(item, prefix) for item in value]
-        if isinstance(value, dict):
-            copied: dict[str, Any] = {}
-            for key, item in value.items():
-                if (
-                    key in self._AUDIO_SPEAKER_FIELDS
-                    and isinstance(item, str)
-                    and item.strip()
-                ):
-                    copied[key] = f"{prefix}{item.strip()}"
-                else:
-                    copied[key] = self._prefix_audio_speakers(item, prefix)
-            return copied
-        return value
-
-    def _shift_audio_items(
-        self,
-        items: list[Any],
-        *,
-        chunk_start_sec: float,
-        leading_overlap_sec: float,
-        speaker_prefix: str,
-    ) -> list[Any]:
-        shifted: list[Any] = []
-        for item in items:
-            copied = self._prefix_audio_speakers(copy.deepcopy(item), speaker_prefix)
-            if isinstance(copied, dict):
-                bounds = self._entry_time_bounds(copied)
-                if bounds is not None:
-                    start, end = bounds
-                    if end <= leading_overlap_sec + 1e-6:
-                        continue
-                    if start < leading_overlap_sec:
-                        start = leading_overlap_sec
-                    self._set_entry_time_bounds(
-                        copied,
-                        start=start + chunk_start_sec,
-                        end=end + chunk_start_sec,
-                    )
-            shifted.append(copied)
-        return shifted
-
-    def _collect_chunk_metadata(
-        self,
-        parsed: dict[str, Any],
-        *,
-        chunk_start_sec: float,
-        leading_overlap_sec: float,
-        speaker_prefix: str,
-    ) -> dict[str, list[Any]]:
-        aggregated: dict[str, list[Any]] = {}
-        if isinstance(parsed.get("segments"), list):
-            aggregated["segments"] = self._shift_audio_items(
-                parsed["segments"],
-                chunk_start_sec=chunk_start_sec,
-                leading_overlap_sec=leading_overlap_sec,
-                speaker_prefix=speaker_prefix,
-            )
-        elif isinstance(parsed.get("chunks"), list):
-            aggregated["segments"] = self._shift_audio_items(
-                parsed["chunks"],
-                chunk_start_sec=chunk_start_sec,
-                leading_overlap_sec=leading_overlap_sec,
-                speaker_prefix=speaker_prefix,
-            )
-        if isinstance(parsed.get("words"), list):
-            aggregated["words"] = self._shift_audio_items(
-                parsed["words"],
-                chunk_start_sec=chunk_start_sec,
-                leading_overlap_sec=leading_overlap_sec,
-                speaker_prefix=speaker_prefix,
-            )
-        if isinstance(parsed.get("diarization"), list):
-            aggregated["diarization"] = self._shift_audio_items(
-                parsed["diarization"],
-                chunk_start_sec=chunk_start_sec,
-                leading_overlap_sec=leading_overlap_sec,
-                speaker_prefix=speaker_prefix,
-            )
-        return aggregated
-
-    def _audio_json_length(self, payload: dict[str, Any]) -> int:
-        return len(json.dumps(payload, indent=2, ensure_ascii=True))
-
-    def _truncate_audio_text(
-        self,
-        payload: dict[str, Any],
-        *,
-        max_chars: int,
-    ) -> None:
-        text = str(payload.get("text", ""))
-        if not text:
-            return
-        base = copy.deepcopy(payload)
-        base["text"] = ""
-        if self._audio_json_length(base) > max_chars:
-            payload["text"] = ""
-            payload.setdefault("truncation", {})["text_truncated_chars"] = len(text)
-            return
-        low = 0
-        high = len(text)
-        while low < high:
-            mid = (low + high + 1) // 2
-            base["text"] = text[:mid]
-            if self._audio_json_length(base) <= max_chars:
-                low = mid
-            else:
-                high = mid - 1
-        payload["text"] = text[:low]
-        omitted = len(text) - low
-        if omitted > 0:
-            payload.setdefault("truncation", {})["text_truncated_chars"] = omitted
-
-    def _serialize_audio_envelope(
-        self,
-        envelope: dict[str, Any],
-        *,
-        max_chars: int,
-    ) -> str:
-        payload = copy.deepcopy(envelope)
-        payload.setdefault("truncation", {"applied": False})
-        if self._audio_json_length(payload) <= max_chars:
-            return json.dumps(payload, indent=2, ensure_ascii=True)
-
-        truncation = payload.setdefault("truncation", {})
-        truncation["applied"] = True
-        response = payload.get("response")
-        omitted_response_fields: dict[str, int] = {}
-
-        if isinstance(response, dict):
-            removal_order = ["words", "diarization", "segments"]
-            if payload.get("mode") != "chunked":
-                removal_order.append("chunks")
-            for key in removal_order:
-                value = response.get(key)
-                if isinstance(value, list) and value:
-                    omitted_response_fields[key] = len(value)
-                    response.pop(key, None)
-                    if self._audio_json_length(payload) <= max_chars:
-                        break
-            if omitted_response_fields:
-                truncation["omitted_response_fields"] = omitted_response_fields
-            if (
-                payload.get("mode") == "chunked"
-                and isinstance(response.get("chunks"), list)
-                and self._audio_json_length(payload) > max_chars
-            ):
-                chunk_summaries = response["chunks"]
-                keep = min(len(chunk_summaries), 12)
-                omitted = len(chunk_summaries) - keep
-                if omitted > 0:
-                    response["chunks"] = chunk_summaries[:keep]
-                    truncation["omitted_chunk_statuses"] = omitted
-
-        if self._audio_json_length(payload) > max_chars:
-            self._truncate_audio_text(payload, max_chars=max_chars)
-
-        if (
-            isinstance(payload.get("response"), dict)
-            and isinstance(payload["response"].get("chunks"), list)
-            and self._audio_json_length(payload) > max_chars
-        ):
-            while (
-                len(payload["response"]["chunks"]) > 3
-                and self._audio_json_length(payload) > max_chars
-            ):
-                payload["response"]["chunks"].pop()
-                truncation["omitted_chunk_statuses"] = truncation.get(
-                    "omitted_chunk_statuses", 0
-                ) + 1
-
-        if self._audio_json_length(payload) > max_chars and isinstance(
-            payload.get("options"), dict
-        ):
-            if isinstance(payload["options"].get("context_bias"), list):
-                truncation["omitted_context_bias_phrases"] = len(
-                    payload["options"]["context_bias"]
-                )
-                payload["options"].pop("context_bias", None)
-
-        return json.dumps(payload, indent=2, ensure_ascii=True)
-
-    def audio_transcribe(
-        self,
-        path: str,
-        diarize: bool | None = None,
-        timestamp_granularities: list[str] | None = None,
-        context_bias: list[str] | None = None,
-        language: str | None = None,
-        model: str | None = None,
-        temperature: float | None = None,
-        chunking: str | None = None,
-        chunk_max_seconds: int | None = None,
-        chunk_overlap_seconds: float | None = None,
-        max_chunks: int | None = None,
-        continue_on_chunk_error: bool | None = None,
-    ) -> str:
-        resolved = self._resolve_path(path)
-        if not resolved.exists():
-            return f"File not found: {path}"
-        if resolved.is_dir():
-            return f"Path is a directory, not a file: {path}"
-        ext = resolved.suffix.lower()
-        if ext not in self._AUDIO_EXTENSIONS and ext not in self._VIDEO_EXTENSIONS:
-            return (
-                f"Unsupported audio format: {ext or '(none)'}. "
-                f"Supported: {', '.join(sorted(self._AUDIO_EXTENSIONS | self._VIDEO_EXTENSIONS))}"
-            )
-        if language and timestamp_granularities:
-            return (
-                "language cannot be combined with timestamp_granularities for "
-                "Mistral offline transcription"
-            )
-        chunk_mode = (chunking or "auto").strip().lower()
-        if chunk_mode not in self._AUDIO_CHUNKING_MODES:
-            return "chunking must be one of auto, off, or force"
-        if chunk_max_seconds is not None and not (
-            self._AUDIO_MIN_CHUNK_SECONDS
-            <= float(chunk_max_seconds)
-            <= self._AUDIO_MAX_CHUNK_SECONDS
-        ):
-            return (
-                "chunk_max_seconds must be between "
-                f"{int(self._AUDIO_MIN_CHUNK_SECONDS)} and {int(self._AUDIO_MAX_CHUNK_SECONDS)}"
-            )
-        if chunk_overlap_seconds is not None and not (
-            0.0 <= float(chunk_overlap_seconds) <= self._AUDIO_MAX_CHUNK_OVERLAP_SECONDS
-        ):
-            return (
-                "chunk_overlap_seconds must be between 0 and "
-                f"{int(self._AUDIO_MAX_CHUNK_OVERLAP_SECONDS)}"
-            )
-        if max_chunks is not None and not (1 <= max_chunks <= self._AUDIO_MAX_CHUNKS):
-            return f"max_chunks must be between 1 and {self._AUDIO_MAX_CHUNKS}"
-        normalized_timestamps: list[str] | None = None
-        if timestamp_granularities:
-            seen: set[str] = set()
-            normalized_timestamps = []
-            for item in timestamp_granularities:
-                value = item.strip().lower()
-                if not value:
-                    continue
-                if value not in self._TIMESTAMP_GRANULARITIES:
-                    return (
-                        "timestamp_granularities must be drawn from "
-                        f"{', '.join(sorted(self._TIMESTAMP_GRANULARITIES))}"
-                    )
-                if value not in seen:
-                    normalized_timestamps.append(value)
-                    seen.add(value)
-        normalized_bias = [item.strip() for item in (context_bias or []) if item.strip()]
-        if len(normalized_bias) > 100:
-            return "context_bias supports at most 100 phrases"
-        chosen_model = (model or self.mistral_transcription_model or "").strip()
-        if not chosen_model:
-            return "No Mistral transcription model configured"
-        self._files_read.add(resolved)
-        rel = resolved.relative_to(self.root).as_posix()
-        options = self._audio_transcribe_options(
-            diarize=diarize,
-            timestamp_granularities=normalized_timestamps,
-            context_bias=normalized_bias,
-            language=language,
-            temperature=temperature,
-            chunking=chunk_mode,
-            chunk_max_seconds=chunk_max_seconds,
-            chunk_overlap_seconds=chunk_overlap_seconds,
-            max_chunks=max_chunks,
-            continue_on_chunk_error=continue_on_chunk_error,
-        )
-
-        try:
-            with tempfile.TemporaryDirectory(prefix="openplanter-audio-") as temp_root:
-                temp_dir = Path(temp_root)
-                upload_source = resolved
-                if self._is_video_extension(ext):
-                    self._ensure_media_tools()
-                    upload_source = temp_dir / "video-source.wav"
-                    self._extract_audio_source(resolved, upload_source)
-
-                try:
-                    upload_size = upload_source.stat().st_size
-                except OSError as exc:
-                    raise ToolError(
-                        f"Failed to inspect audio file {upload_source.name}: {exc}"
-                    ) from exc
-
-                chunk_requested = chunk_mode == "force" or (
-                    chunk_mode == "auto"
-                    and upload_size > self.mistral_transcription_max_bytes
-                )
-
-                if not chunk_requested:
-                    parsed = self._mistral_transcription_request(
-                        resolved=upload_source,
-                        model=chosen_model,
-                        diarize=diarize,
-                        timestamp_granularities=normalized_timestamps,
-                        context_bias=normalized_bias,
-                        language=language,
-                        temperature=temperature,
-                    )
-                    envelope = {
-                        "provider": "mistral",
-                        "service": "transcription",
-                        "path": rel,
-                        "model": chosen_model,
-                        "options": options,
-                        "text": str(parsed.get("text", "")),
-                        "response": parsed,
-                    }
-                    return self._serialize_audio_envelope(
-                        envelope, max_chars=self._audio_transcribe_max_chars()
-                    )
-
-                self._ensure_media_tools()
-                duration_sec = self._probe_media_duration(upload_source)
-                requested_chunk_seconds = float(
-                    chunk_max_seconds or self.mistral_transcription_chunk_max_seconds
-                )
-                requested_chunk_seconds = min(
-                    requested_chunk_seconds, self._AUDIO_MAX_CHUNK_SECONDS
-                )
-                effective_chunk_seconds = self._audio_chunk_seconds_budget(
-                    requested_chunk_seconds
-                )
-                if duration_sec > self._AUDIO_MIN_CHUNK_SECONDS:
-                    effective_chunk_seconds = max(
-                        min(duration_sec, effective_chunk_seconds),
-                        min(duration_sec, self._AUDIO_MIN_CHUNK_SECONDS),
-                    )
-                effective_overlap_seconds = min(
-                    float(
-                        chunk_overlap_seconds
-                        if chunk_overlap_seconds is not None
-                        else self.mistral_transcription_chunk_overlap_seconds
-                    ),
-                    max(0.0, effective_chunk_seconds - 0.001),
-                )
-                effective_max_chunks = max_chunks or self.mistral_transcription_max_chunks
-                chunk_plan = self._plan_audio_chunks(
-                    duration_sec=duration_sec,
-                    chunk_seconds=effective_chunk_seconds,
-                    overlap_seconds=effective_overlap_seconds,
-                    max_chunks=effective_max_chunks,
-                )
-                warnings: list[str] = []
-                chunk_statuses: list[dict[str, Any]] = []
-                stitched_text = ""
-                partial = False
-                aggregated_response: dict[str, Any] = {
-                    "speaker_scope": (
-                        "chunk_local_prefixed" if diarize else "not_requested"
-                    ),
-                    "chunks": chunk_statuses,
-                }
-
-                for plan_entry in chunk_plan:
-                    index = int(plan_entry["index"])
-                    start_sec = float(plan_entry["start_sec"])
-                    end_sec = float(plan_entry["end_sec"])
-                    duration_value = float(plan_entry["duration_sec"])
-                    leading_overlap_sec = float(plan_entry["leading_overlap_sec"])
-                    chunk_path = temp_dir / f"chunk-{index:03d}.wav"
-                    try:
-                        self._extract_audio_chunk(
-                            upload_source,
-                            chunk_path,
-                            start_sec=start_sec,
-                            duration_sec=duration_value,
-                        )
-                        parsed = self._mistral_transcription_request(
-                            resolved=chunk_path,
-                            model=chosen_model,
-                            diarize=diarize,
-                            timestamp_granularities=normalized_timestamps,
-                            context_bias=normalized_bias,
-                            language=language,
-                            temperature=temperature,
-                        )
-                    except ToolError as exc:
-                        partial = True
-                        message = f"chunk {index} failed: {exc}"
-                        chunk_statuses.append(
-                            {
-                                "index": index,
-                                "start_sec": start_sec,
-                                "end_sec": end_sec,
-                                "status": "error",
-                                "error": str(exc),
-                            }
-                        )
-                        if continue_on_chunk_error:
-                            warnings.append(message)
-                            continue
-                        return f"audio_transcribe failed in chunk {index}: {exc}"
-
-                    chunk_text = str(parsed.get("text", "")).strip()
-                    deduped_text = self._dedupe_audio_overlap_text(
-                        stitched_text, chunk_text
-                    )
-                    if deduped_text:
-                        stitched_text = (
-                            f"{stitched_text} {deduped_text}".strip()
-                            if stitched_text
-                            else deduped_text
-                        )
-
-                    metadata = self._collect_chunk_metadata(
-                        parsed,
-                        chunk_start_sec=start_sec,
-                        leading_overlap_sec=leading_overlap_sec,
-                        speaker_prefix=f"c{index}_",
-                    )
-                    for key, values in metadata.items():
-                        if values:
-                            aggregated_response.setdefault(key, []).extend(values)
-
-                    chunk_statuses.append(
-                        {
-                            "index": index,
-                            "start_sec": start_sec,
-                            "end_sec": end_sec,
-                            "status": "ok",
-                            "text_chars": len(chunk_text),
-                        }
-                    )
-
-                if not any(
-                    chunk.get("status") == "ok" for chunk in chunk_statuses
-                ):
-                    return "audio_transcribe failed: no chunk completed successfully"
-
-                envelope = {
-                    "provider": "mistral",
-                    "service": "transcription",
-                    "mode": "chunked",
-                    "path": rel,
-                    "model": chosen_model,
-                    "options": options,
-                    "chunking": {
-                        "strategy": "overlap_window",
-                        "chunk_seconds": round(effective_chunk_seconds, 3),
-                        "overlap_seconds": round(effective_overlap_seconds, 3),
-                        "total_chunks": len(chunk_plan),
-                        "failed_chunks": sum(
-                            1 for chunk in chunk_statuses if chunk["status"] != "ok"
-                        ),
-                        "partial": partial,
-                    },
-                    "text": stitched_text,
-                    "response": aggregated_response,
-                }
-                if warnings:
-                    envelope["warnings"] = warnings
-                return self._serialize_audio_envelope(
-                    envelope, max_chars=self._audio_transcribe_max_chars()
-                )
-        except ToolError as exc:
-            return str(exc)
-
     def write_file(self, path: str, content: str) -> str:
         resolved = self._resolve_path(path)
         if resolved.exists() and resolved.is_file() and resolved not in self._files_read:
diff --git a/agent/tui.py b/agent/tui.py
index d206313d..c1a63be2 100644
--- a/agent/tui.py
+++ b/agent/tui.py
@@ -432,7 +432,6 @@ def _clip_event(text: str) -> str:
 _KEY_ARGS: dict[str, str] = {
     "read_file": "path",
     "read_image": "path",
-    "audio_transcribe": "path",
     "write_file": "path",
     "edit_file": "path",
     "hashline_edit": "path",
diff --git a/openplanter-desktop/Cargo.lock b/openplanter-desktop/Cargo.lock
index 7cfac50f..503aecf9 100644
--- a/openplanter-desktop/Cargo.lock
+++ b/openplanter-desktop/Cargo.lock
@@ -2026,16 +2026,6 @@ version = "0.3.17"
 source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "6877bb514081ee2a7ff5ef9de3281f14a4dd4bceac4c09388074a6b5df8a139a"
 
-[[package]]
-name = "mime_guess"
-version = "2.0.5"
-source = "registry+https://github.com/rust-lang/crates.io-index"
-checksum = "f7c44f8e672c00fe5308fa235f821cb4198414e1c77935c1ab6948d3fd78550e"
-dependencies = [
- "mime",
- "unicase",
-]
-
 [[package]]
 name = "minimal-lexical"
 version = "0.2.1"
@@ -3122,7 +3112,6 @@ dependencies = [
  "js-sys",
  "log",
  "mime",
- "mime_guess",
  "native-tls",
  "percent-encoding",
  "pin-project-lite",
@@ -4590,12 +4579,6 @@ dependencies = [
  "unic-common",
 ]
 
-[[package]]
-name = "unicase"
-version = "2.9.0"
-source = "registry+https://github.com/rust-lang/crates.io-index"
-checksum = "dbc4bc3a9f746d862c45cb89d705aa10f187bb96c76001afab07a0d35ce60142"
-
 [[package]]
 name = "unicode-ident"
 version = "1.0.24"
diff --git a/openplanter-desktop/crates/op-core/Cargo.toml b/openplanter-desktop/crates/op-core/Cargo.toml
index 08671359..eaf10099 100644
--- a/openplanter-desktop/crates/op-core/Cargo.toml
+++ b/openplanter-desktop/crates/op-core/Cargo.toml
@@ -15,7 +15,7 @@ uuid = { workspace = true }
 regex = { workspace = true }
 async-trait = "0.1"
 tokio-util = { workspace = true }
-reqwest = { version = "0.12", features = ["json", "multipart", "stream"] }
+reqwest = { version = "0.12", features = ["json", "stream"] }
 reqwest-eventsource = "0.6"
 futures = "0.3"
 petgraph = { version = "0.7", features = ["serde-1"] }
diff --git a/openplanter-desktop/crates/op-core/src/builder.rs b/openplanter-desktop/crates/op-core/src/builder.rs
index e2660db2..786e4c10 100644
--- a/openplanter-desktop/crates/op-core/src/builder.rs
+++ b/openplanter-desktop/crates/op-core/src/builder.rs
@@ -464,17 +464,6 @@ mod tests {
         assert_eq!(resolve_provider(&cfg).unwrap(), "anthropic");
     }
 
-    #[test]
-    fn test_resolve_provider_auto_ignores_mistral_transcription_key() {
-        let cfg = AgentConfig {
-            provider: "auto".into(),
-            model: "some-unknown-model".into(),
-            mistral_transcription_api_key: Some("mistral-test".into()),
-            ..Default::default()
-        };
-        assert_eq!(resolve_provider(&cfg).unwrap(), "anthropic");
-    }
-
     #[test]
     fn test_resolve_provider_anthropic_key_preferred_first() {
         let cfg = AgentConfig {
diff --git a/openplanter-desktop/crates/op-core/src/config.rs b/openplanter-desktop/crates/op-core/src/config.rs
index 378eaba6..841a2f20 100644
--- a/openplanter-desktop/crates/op-core/src/config.rs
+++ b/openplanter-desktop/crates/op-core/src/config.rs
@@ -16,12 +16,6 @@ pub const ZAI_PAYGO_BASE_URL: &str = "https://api.z.ai/api/paas/v4";
 pub const ZAI_CODING_BASE_URL: &str = "https://api.z.ai/api/coding/paas/v4";
 pub const BRAVE_BASE_URL: &str = "https://api.search.brave.com/res/v1";
 pub const TAVILY_BASE_URL: &str = "https://api.tavily.com";
-pub const MISTRAL_TRANSCRIPTION_BASE_URL: &str = "https://api.mistral.ai";
-pub const MISTRAL_TRANSCRIPTION_DEFAULT_MODEL: &str = "voxtral-mini-latest";
-pub const MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS: i64 = 900;
-pub const MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS: f64 = 2.0;
-pub const MISTRAL_TRANSCRIPTION_MAX_CHUNKS: i64 = 48;
-pub const MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC: i64 = 180;
 
 /// Default model for each supported provider.
 pub static PROVIDER_DEFAULT_MODELS: LazyLock<HashMap<&'static str, &'static str>> =
@@ -178,7 +172,6 @@ pub struct AgentConfig {
     pub firecrawl_base_url: String,
     pub brave_base_url: String,
     pub tavily_base_url: String,
-    pub mistral_transcription_base_url: String,
 
     // API keys
     pub api_key: Option<String>,
@@ -193,13 +186,6 @@ pub struct AgentConfig {
     pub tavily_api_key: Option<String>,
     pub web_search_provider: String,
     pub voyage_api_key: Option<String>,
-    pub mistral_transcription_api_key: Option<String>,
-    pub mistral_transcription_model: String,
-    pub mistral_transcription_max_bytes: i64,
-    pub mistral_transcription_chunk_max_seconds: i64,
-    pub mistral_transcription_chunk_overlap_seconds: f64,
-    pub mistral_transcription_max_chunks: i64,
-    pub mistral_transcription_request_timeout_sec: i64,
 
     // Limits
     pub max_depth: i64,
@@ -251,7 +237,6 @@ impl Default for AgentConfig {
             firecrawl_base_url: "https://api.firecrawl.dev/v1".into(),
             brave_base_url: BRAVE_BASE_URL.into(),
             tavily_base_url: TAVILY_BASE_URL.into(),
-            mistral_transcription_base_url: MISTRAL_TRANSCRIPTION_BASE_URL.into(),
             api_key: Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.into()),
             openai_api_key: Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.into()),
             anthropic_api_key: Some(FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER.into()),
@@ -264,14 +249,6 @@ impl Default for AgentConfig {
             tavily_api_key: None,
             web_search_provider: "exa".into(),
             voyage_api_key: None,
-            mistral_transcription_api_key: None,
-            mistral_transcription_model: MISTRAL_TRANSCRIPTION_DEFAULT_MODEL.into(),
-            mistral_transcription_max_bytes: 100 * 1024 * 1024,
-            mistral_transcription_chunk_max_seconds: MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS,
-            mistral_transcription_chunk_overlap_seconds:
-                MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS,
-            mistral_transcription_max_chunks: MISTRAL_TRANSCRIPTION_MAX_CHUNKS,
-            mistral_transcription_request_timeout_sec: MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC,
             max_depth: 4,
             max_steps_per_call: 100,
             budget_extension_enabled: true,
@@ -332,9 +309,6 @@ impl AgentConfig {
 
         let voyage_api_key =
             env_opt("OPENPLANTER_VOYAGE_API_KEY").or_else(|| env_opt("VOYAGE_API_KEY"));
-        let mistral_transcription_api_key = env_opt("OPENPLANTER_MISTRAL_TRANSCRIPTION_API_KEY")
-            .or_else(|| env_opt("MISTRAL_TRANSCRIPTION_API_KEY"))
-            .or_else(|| env_opt("MISTRAL_API_KEY"));
 
         let openai_base_url = env_opt("OPENPLANTER_OPENAI_BASE_URL")
             .or_else(|| env_opt("OPENPLANTER_BASE_URL"))
@@ -398,10 +372,6 @@ impl AgentConfig {
             ),
             brave_base_url: env_or("OPENPLANTER_BRAVE_BASE_URL", BRAVE_BASE_URL),
             tavily_base_url: env_or("OPENPLANTER_TAVILY_BASE_URL", TAVILY_BASE_URL),
-            mistral_transcription_base_url: env_opt("OPENPLANTER_MISTRAL_TRANSCRIPTION_BASE_URL")
-                .or_else(|| env_opt("MISTRAL_TRANSCRIPTION_BASE_URL"))
-                .or_else(|| env_opt("MISTRAL_BASE_URL"))
-                .unwrap_or_else(|| MISTRAL_TRANSCRIPTION_BASE_URL.into()),
             openai_api_key,
             anthropic_api_key,
             openrouter_api_key,
@@ -413,30 +383,6 @@ impl AgentConfig {
             tavily_api_key,
             web_search_provider,
             voyage_api_key,
-            mistral_transcription_api_key,
-            mistral_transcription_model: env_opt("OPENPLANTER_MISTRAL_TRANSCRIPTION_MODEL")
-                .or_else(|| env_opt("MISTRAL_TRANSCRIPTION_MODEL"))
-                .unwrap_or_else(|| MISTRAL_TRANSCRIPTION_DEFAULT_MODEL.into()),
-            mistral_transcription_max_bytes: env_int(
-                "OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_BYTES",
-                100 * 1024 * 1024,
-            ),
-            mistral_transcription_chunk_max_seconds: env_int(
-                "OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS",
-                MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS,
-            ),
-            mistral_transcription_chunk_overlap_seconds: env_float(
-                "OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS",
-                MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS,
-            ),
-            mistral_transcription_max_chunks: env_int(
-                "OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_CHUNKS",
-                MISTRAL_TRANSCRIPTION_MAX_CHUNKS,
-            ),
-            mistral_transcription_request_timeout_sec: env_int(
-                "OPENPLANTER_MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC",
-                MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC,
-            ),
             max_depth: env_int("OPENPLANTER_MAX_DEPTH", 4),
             max_steps_per_call: env_int("OPENPLANTER_MAX_STEPS", 100),
             budget_extension_enabled: env_bool("OPENPLANTER_BUDGET_EXTENSION_ENABLED", true),
@@ -523,31 +469,6 @@ mod tests {
         assert!(cfg.brave_api_key.is_none());
         assert_eq!(cfg.tavily_base_url, TAVILY_BASE_URL);
         assert!(cfg.tavily_api_key.is_none());
-        assert_eq!(
-            cfg.mistral_transcription_base_url,
-            MISTRAL_TRANSCRIPTION_BASE_URL
-        );
-        assert!(cfg.mistral_transcription_api_key.is_none());
-        assert_eq!(
-            cfg.mistral_transcription_model,
-            MISTRAL_TRANSCRIPTION_DEFAULT_MODEL
-        );
-        assert_eq!(
-            cfg.mistral_transcription_chunk_max_seconds,
-            MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS
-        );
-        assert_eq!(
-            cfg.mistral_transcription_chunk_overlap_seconds,
-            MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS
-        );
-        assert_eq!(
-            cfg.mistral_transcription_max_chunks,
-            MISTRAL_TRANSCRIPTION_MAX_CHUNKS
-        );
-        assert_eq!(
-            cfg.mistral_transcription_request_timeout_sec,
-            MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC
-        );
         assert_eq!(cfg.rate_limit_max_retries, 12);
         assert_eq!(cfg.rate_limit_backoff_base_sec, 1.0);
         assert_eq!(cfg.rate_limit_backoff_max_sec, 60.0);
@@ -609,19 +530,6 @@ mod tests {
             "OPENPLANTER_TAVILY_API_KEY",
             "TAVILY_API_KEY",
             "OPENPLANTER_TAVILY_BASE_URL",
-            "OPENPLANTER_MISTRAL_TRANSCRIPTION_API_KEY",
-            "MISTRAL_TRANSCRIPTION_API_KEY",
-            "MISTRAL_API_KEY",
-            "OPENPLANTER_MISTRAL_TRANSCRIPTION_BASE_URL",
-            "MISTRAL_TRANSCRIPTION_BASE_URL",
-            "MISTRAL_BASE_URL",
-            "OPENPLANTER_MISTRAL_TRANSCRIPTION_MODEL",
-            "MISTRAL_TRANSCRIPTION_MODEL",
-            "OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_BYTES",
-            "OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS",
-            "OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS",
-            "OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_CHUNKS",
-            "OPENPLANTER_MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC",
             "OPENPLANTER_ZAI_PLAN",
             "OPENPLANTER_ZAI_BASE_URL",
             "OPENPLANTER_RATE_LIMIT_MAX_RETRIES",
@@ -662,34 +570,8 @@ mod tests {
         assert!(cfg.zai_api_key.is_none());
         assert!(cfg.brave_api_key.is_none());
         assert!(cfg.tavily_api_key.is_none());
-        assert!(cfg.mistral_transcription_api_key.is_none());
         assert_eq!(cfg.openai_base_url, FOUNDRY_OPENAI_BASE_URL);
         assert_eq!(cfg.anthropic_base_url, FOUNDRY_ANTHROPIC_BASE_URL);
-        assert_eq!(
-            cfg.mistral_transcription_base_url,
-            MISTRAL_TRANSCRIPTION_BASE_URL
-        );
-        assert_eq!(
-            cfg.mistral_transcription_model,
-            MISTRAL_TRANSCRIPTION_DEFAULT_MODEL
-        );
-        assert_eq!(cfg.mistral_transcription_max_bytes, 100 * 1024 * 1024);
-        assert_eq!(
-            cfg.mistral_transcription_chunk_max_seconds,
-            MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS
-        );
-        assert_eq!(
-            cfg.mistral_transcription_chunk_overlap_seconds,
-            MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS
-        );
-        assert_eq!(
-            cfg.mistral_transcription_max_chunks,
-            MISTRAL_TRANSCRIPTION_MAX_CHUNKS
-        );
-        assert_eq!(
-            cfg.mistral_transcription_request_timeout_sec,
-            MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC
-        );
         assert_eq!(cfg.web_search_provider, "exa");
         assert_eq!(cfg.rate_limit_max_retries, 12);
         assert_eq!(cfg.rate_limit_backoff_base_sec, 1.0);
@@ -711,27 +593,7 @@ mod tests {
             env::set_var("ZAI_API_KEY", "zai-test123");
             env::set_var("BRAVE_API_KEY", "brave-test123");
             env::set_var("TAVILY_API_KEY", "tavily-test123");
-            env::set_var("MISTRAL_API_KEY", "mistral-test123");
             env::set_var("OPENPLANTER_WEB_SEARCH_PROVIDER", "tavily");
-            env::set_var(
-                "OPENPLANTER_MISTRAL_TRANSCRIPTION_BASE_URL",
-                "https://mistral.example",
-            );
-            env::set_var(
-                "OPENPLANTER_MISTRAL_TRANSCRIPTION_MODEL",
-                "voxtral-mini-2508",
-            );
-            env::set_var("OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_BYTES", "2048");
-            env::set_var("OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_MAX_SECONDS", "600");
-            env::set_var(
-                "OPENPLANTER_MISTRAL_TRANSCRIPTION_CHUNK_OVERLAP_SECONDS",
-                "3.5",
-            );
-            env::set_var("OPENPLANTER_MISTRAL_TRANSCRIPTION_MAX_CHUNKS", "24");
-            env::set_var(
-                "OPENPLANTER_MISTRAL_TRANSCRIPTION_REQUEST_TIMEOUT_SEC",
-                "240",
-            );
             env::set_var("OPENPLANTER_RATE_LIMIT_MAX_RETRIES", "5");
             env::set_var("OPENPLANTER_RATE_LIMIT_BACKOFF_BASE_SEC", "2.5");
             env::set_var("OPENPLANTER_RATE_LIMIT_BACKOFF_MAX_SEC", "30.0");
@@ -755,20 +617,6 @@ mod tests {
         assert_eq!(cfg.zai_api_key, Some("zai-test123".into()));
         assert_eq!(cfg.brave_api_key, Some("brave-test123".into()));
         assert_eq!(cfg.tavily_api_key, Some("tavily-test123".into()));
-        assert_eq!(
-            cfg.mistral_transcription_api_key,
-            Some("mistral-test123".into())
-        );
-        assert_eq!(
-            cfg.mistral_transcription_base_url,
-            "https://mistral.example"
-        );
-        assert_eq!(cfg.mistral_transcription_model, "voxtral-mini-2508");
-        assert_eq!(cfg.mistral_transcription_max_bytes, 2048);
-        assert_eq!(cfg.mistral_transcription_chunk_max_seconds, 600);
-        assert_eq!(cfg.mistral_transcription_chunk_overlap_seconds, 3.5);
-        assert_eq!(cfg.mistral_transcription_max_chunks, 24);
-        assert_eq!(cfg.mistral_transcription_request_timeout_sec, 240);
         assert_eq!(cfg.zai_plan, "coding");
         assert_eq!(cfg.zai_base_url, ZAI_CODING_BASE_URL);
         assert_eq!(cfg.zai_stream_max_retries, 7);
diff --git a/openplanter-desktop/crates/op-core/src/config_hydration.rs b/openplanter-desktop/crates/op-core/src/config_hydration.rs
index e1e81c36..90177523 100644
--- a/openplanter-desktop/crates/op-core/src/config_hydration.rs
+++ b/openplanter-desktop/crates/op-core/src/config_hydration.rs
@@ -73,7 +73,6 @@ pub fn merge_credentials_into_config(
     merge!(brave_api_key);
     merge!(tavily_api_key);
     merge!(voyage_api_key);
-    merge!(mistral_transcription_api_key);
 }
 
 pub fn apply_settings_to_config(cfg: &mut AgentConfig, settings: &PersistentSettings) {
diff --git a/openplanter-desktop/crates/op-core/src/credentials.rs b/openplanter-desktop/crates/op-core/src/credentials.rs
index f6e4fe5c..9c7d2768 100644
--- a/openplanter-desktop/crates/op-core/src/credentials.rs
+++ b/openplanter-desktop/crates/op-core/src/credentials.rs
@@ -22,7 +22,6 @@ pub struct CredentialBundle {
     pub brave_api_key: Option<String>,
     pub tavily_api_key: Option<String>,
     pub voyage_api_key: Option<String>,
-    pub mistral_transcription_api_key: Option<String>,
 }
 
 impl CredentialBundle {
@@ -39,7 +38,6 @@ impl CredentialBundle {
             &self.brave_api_key,
             &self.tavily_api_key,
             &self.voyage_api_key,
-            &self.mistral_transcription_api_key,
         ];
         keys.iter()
             .any(|k| k.as_ref().map(|v| !v.trim().is_empty()).unwrap_or(false))
@@ -64,7 +62,6 @@ impl CredentialBundle {
         fill!(brave_api_key);
         fill!(tavily_api_key);
         fill!(voyage_api_key);
-        fill!(mistral_transcription_api_key);
     }
 
     /// Serialize to JSON map, omitting `None` values.
@@ -87,10 +84,6 @@ impl CredentialBundle {
         add!(brave_api_key, "brave_api_key");
         add!(tavily_api_key, "tavily_api_key");
         add!(voyage_api_key, "voyage_api_key");
-        add!(
-            mistral_transcription_api_key,
-            "mistral_transcription_api_key"
-        );
         out
     }
 
@@ -113,7 +106,6 @@ impl CredentialBundle {
             brave_api_key: get_str(payload, "brave_api_key"),
             tavily_api_key: get_str(payload, "tavily_api_key"),
             voyage_api_key: get_str(payload, "voyage_api_key"),
-            mistral_transcription_api_key: get_str(payload, "mistral_transcription_api_key"),
         }
     }
 }
@@ -188,12 +180,6 @@ pub fn parse_env_file(path: &Path) -> CredentialBundle {
         brave_api_key: get_key(&env_map, "BRAVE_API_KEY", "OPENPLANTER_BRAVE_API_KEY"),
         tavily_api_key: get_key(&env_map, "TAVILY_API_KEY", "OPENPLANTER_TAVILY_API_KEY"),
         voyage_api_key: get_key(&env_map, "VOYAGE_API_KEY", "OPENPLANTER_VOYAGE_API_KEY"),
-        mistral_transcription_api_key: env_map
-            .get("OPENPLANTER_MISTRAL_TRANSCRIPTION_API_KEY")
-            .or_else(|| env_map.get("MISTRAL_TRANSCRIPTION_API_KEY"))
-            .or_else(|| env_map.get("MISTRAL_API_KEY"))
-            .map(|s| s.trim().to_string())
-            .filter(|s| !s.is_empty()),
     }
 }
 
@@ -218,12 +204,6 @@ pub fn credentials_from_env() -> CredentialBundle {
         brave_api_key: env_key("OPENPLANTER_BRAVE_API_KEY", "BRAVE_API_KEY"),
         tavily_api_key: env_key("OPENPLANTER_TAVILY_API_KEY", "TAVILY_API_KEY"),
         voyage_api_key: env_key("OPENPLANTER_VOYAGE_API_KEY", "VOYAGE_API_KEY"),
-        mistral_transcription_api_key: env::var("OPENPLANTER_MISTRAL_TRANSCRIPTION_API_KEY")
-            .ok()
-            .or_else(|| env::var("MISTRAL_TRANSCRIPTION_API_KEY").ok())
-            .or_else(|| env::var("MISTRAL_API_KEY").ok())
-            .map(|s| s.trim().to_string())
-            .filter(|s| !s.is_empty()),
     }
 }
 
@@ -379,15 +359,6 @@ mod tests {
         assert!(!bundle.has_any());
     }
 
-    #[test]
-    fn test_credential_bundle_has_any_with_mistral_transcription_key() {
-        let bundle = CredentialBundle {
-            mistral_transcription_api_key: Some("mistral-test".into()),
-            ..Default::default()
-        };
-        assert!(bundle.has_any());
-    }
-
     #[test]
     fn test_credential_bundle_merge_missing() {
         let mut a = CredentialBundle {
@@ -424,7 +395,6 @@ mod tests {
         assert_eq!(json.get("firecrawl_api_key").unwrap(), "fc-789");
         assert_eq!(json.get("brave_api_key").unwrap(), "brave-101");
         assert_eq!(json.get("tavily_api_key").unwrap(), "tavily-202");
-        assert!(!json.contains_key("mistral_transcription_api_key"));
     }
 
     #[test]
@@ -442,7 +412,6 @@ ZAI_API_KEY=zai-from-env
 OPENPLANTER_FIRECRAWL_API_KEY="firecrawl-quoted"
 BRAVE_API_KEY=brave-from-env
 OPENPLANTER_TAVILY_API_KEY=tavily-from-env
-MISTRAL_API_KEY=mistral-from-env
 UNRELATED_VAR=foo
 "#,
         )
@@ -456,10 +425,6 @@ UNRELATED_VAR=foo
         assert_eq!(bundle.firecrawl_api_key, Some("firecrawl-quoted".into()));
         assert_eq!(bundle.brave_api_key, Some("brave-from-env".into()));
         assert_eq!(bundle.tavily_api_key, Some("tavily-from-env".into()));
-        assert_eq!(
-            bundle.mistral_transcription_api_key,
-            Some("mistral-from-env".into())
-        );
         assert!(bundle.cerebras_api_key.is_none());
     }
 
@@ -478,10 +443,7 @@ UNRELATED_VAR=foo
             env_map.get("OPENPLANTER_WORKSPACE"),
             Some(&"workspace".to_string())
         );
-        assert_eq!(
-            env_map.get("OPENAI_API_KEY"),
-            Some(&"sk-from-env".to_string())
-        );
+        assert_eq!(env_map.get("OPENAI_API_KEY"), Some(&"sk-from-env".to_string()));
     }
 
     #[test]
@@ -506,7 +468,6 @@ UNRELATED_VAR=foo
             zai_api_key: Some("zai-test".into()),
             brave_api_key: Some("brave-test".into()),
             tavily_api_key: Some("tavily-test".into()),
-            mistral_transcription_api_key: Some("mistral-test".into()),
             ..Default::default()
         };
         store.save(&bundle).unwrap();
@@ -516,10 +477,6 @@ UNRELATED_VAR=foo
         assert_eq!(loaded.zai_api_key, Some("zai-test".into()));
         assert_eq!(loaded.brave_api_key, Some("brave-test".into()));
         assert_eq!(loaded.tavily_api_key, Some("tavily-test".into()));
-        assert_eq!(
-            loaded.mistral_transcription_api_key,
-            Some("mistral-test".into())
-        );
     }
 
     #[test]
diff --git a/openplanter-desktop/crates/op-core/src/engine/mod.rs b/openplanter-desktop/crates/op-core/src/engine/mod.rs
index 4b6faa18..ea3b1517 100644
--- a/openplanter-desktop/crates/op-core/src/engine/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/engine/mod.rs
@@ -481,7 +481,6 @@ fn is_recon_tool(name: &str) -> bool {
             | "fetch_url"
             | "read_file"
             | "read_image"
-            | "audio_transcribe"
             | "list_artifacts"
             | "read_artifact"
     )
diff --git a/openplanter-desktop/crates/op-core/src/tools/audio.rs b/openplanter-desktop/crates/op-core/src/tools/audio.rs
deleted file mode 100644
index 75619c01..00000000
--- a/openplanter-desktop/crates/op-core/src/tools/audio.rs
+++ /dev/null
@@ -1,1419 +0,0 @@
-use std::collections::HashSet;
-use std::path::{Path, PathBuf};
-use std::process::Stdio;
-use std::time::Duration;
-
-use reqwest::multipart::{Form, Part};
-use serde_json::{Map, Value, json};
-use tokio::process::Command;
-use tokio::time::timeout;
-use uuid::Uuid;
-
-use super::{ToolResult, filesystem};
-
-const AUDIO_EXTENSIONS: &[&str] = &[
-    ".aac", ".flac", ".m4a", ".mp3", ".mpeg", ".mpga", ".oga", ".ogg", ".opus", ".wav",
-];
-const VIDEO_EXTENSIONS: &[&str] = &[".avi", ".m4v", ".mkv", ".mov", ".mp4", ".webm"];
-const TIMESTAMP_GRANULARITIES: &[&str] = &["segment", "word"];
-const CHUNKING_MODES: &[&str] = &["auto", "force", "off"];
-const AUDIO_CHUNK_TARGET_FILL_RATIO: f64 = 0.85;
-const AUDIO_CHUNK_BYTES_PER_SECOND: f64 = 32_000.0;
-const AUDIO_MIN_CHUNK_SECONDS: f64 = 30.0;
-const AUDIO_MAX_CHUNK_SECONDS: f64 = 1800.0;
-const AUDIO_MAX_CHUNK_OVERLAP_SECONDS: f64 = 15.0;
-const AUDIO_MAX_CHUNKS: i64 = 200;
-const SPEAKER_FIELDS: &[&str] = &["speaker", "speaker_id", "speaker_label"];
-
-#[derive(Debug, Clone)]
-struct ChunkPlan {
-    index: usize,
-    start_sec: f64,
-    end_sec: f64,
-    duration_sec: f64,
-    leading_overlap_sec: f64,
-}
-
-struct TempAudioDir {
-    path: PathBuf,
-}
-
-impl TempAudioDir {
-    fn new() -> Result<Self, String> {
-        let path = std::env::temp_dir().join(format!("openplanter-audio-{}", Uuid::new_v4()));
-        std::fs::create_dir_all(&path)
-            .map_err(|error| format!("Failed to create temp audio directory: {error}"))?;
-        Ok(Self { path })
-    }
-}
-
-impl Drop for TempAudioDir {
-    fn drop(&mut self) {
-        let _ = std::fs::remove_dir_all(&self.path);
-    }
-}
-
-fn transcription_endpoint(base_url: &str) -> String {
-    let trimmed = base_url.trim().trim_end_matches('/');
-    if trimmed.ends_with("/v1") {
-        format!("{trimmed}/audio/transcriptions")
-    } else {
-        format!("{trimmed}/v1/audio/transcriptions")
-    }
-}
-
-fn audio_media_type(path: &Path) -> &'static str {
-    match path
-        .extension()
-        .and_then(|value| value.to_str())
-        .map(|value| value.to_ascii_lowercase())
-        .as_deref()
-    {
-        Some("aac") => "audio/aac",
-        Some("flac") => "audio/flac",
-        Some("m4a") => "audio/mp4",
-        Some("mp3") | Some("mpga") => "audio/mpeg",
-        Some("mpeg") => "audio/mpeg",
-        Some("oga") | Some("ogg") | Some("opus") => "audio/ogg",
-        Some("wav") => "audio/wav",
-        _ => "application/octet-stream",
-    }
-}
-
-fn rel_path(root: &Path, path: &Path) -> String {
-    let canon_root = std::fs::canonicalize(root).unwrap_or_else(|_| root.to_path_buf());
-    path.strip_prefix(&canon_root)
-        .unwrap_or(path)
-        .to_string_lossy()
-        .replace('\\', "/")
-}
-
-fn is_video_extension(ext: &str) -> bool {
-    VIDEO_EXTENSIONS.iter().any(|value| *value == ext)
-}
-
-fn is_supported_extension(ext: &str) -> bool {
-    AUDIO_EXTENSIONS.iter().any(|value| *value == ext) || is_video_extension(ext)
-}
-
-fn json_length(payload: &Value) -> usize {
-    serde_json::to_string_pretty(payload)
-        .unwrap_or_else(|_| payload.to_string())
-        .len()
-}
-
-fn build_options(
-    diarize: Option<bool>,
-    timestamp_granularities: Option<&[String]>,
-    context_bias: Option<&[String]>,
-    language: Option<&str>,
-    temperature: Option<f64>,
-    chunking: &str,
-    chunk_max_seconds: Option<i64>,
-    chunk_overlap_seconds: Option<f64>,
-    max_chunks: Option<i64>,
-    continue_on_chunk_error: Option<bool>,
-) -> Value {
-    let mut options = Map::new();
-    options.insert("chunking".into(), Value::String(chunking.to_string()));
-    if let Some(value) = diarize {
-        options.insert("diarize".into(), Value::Bool(value));
-    }
-    if let Some(values) = timestamp_granularities.filter(|values| !values.is_empty()) {
-        options.insert(
-            "timestamp_granularities".into(),
-            Value::Array(values.iter().cloned().map(Value::String).collect()),
-        );
-    }
-    if let Some(values) = context_bias.filter(|values| !values.is_empty()) {
-        options.insert(
-            "context_bias".into(),
-            Value::Array(values.iter().cloned().map(Value::String).collect()),
-        );
-    }
-    if let Some(value) = language.filter(|value| !value.trim().is_empty()) {
-        options.insert("language".into(), Value::String(value.to_string()));
-    }
-    if let Some(value) = temperature {
-        if let Some(number) = serde_json::Number::from_f64(value) {
-            options.insert("temperature".into(), Value::Number(number));
-        }
-    }
-    if let Some(value) = chunk_max_seconds {
-        options.insert("chunk_max_seconds".into(), Value::Number(value.into()));
-    }
-    if let Some(value) = chunk_overlap_seconds {
-        if let Some(number) = serde_json::Number::from_f64(value) {
-            options.insert("chunk_overlap_seconds".into(), Value::Number(number));
-        }
-    }
-    if let Some(value) = max_chunks {
-        options.insert("max_chunks".into(), Value::Number(value.into()));
-    }
-    if let Some(value) = continue_on_chunk_error {
-        options.insert("continue_on_chunk_error".into(), Value::Bool(value));
-    }
-    Value::Object(options)
-}
-
-fn normalize_audio_token(token: &str) -> String {
-    token
-        .chars()
-        .filter(|ch| ch.is_ascii_alphanumeric())
-        .flat_map(char::to_lowercase)
-        .collect()
-}
-
-fn dedupe_audio_overlap_text(existing: &str, incoming: &str) -> String {
-    if existing.trim().is_empty() {
-        return incoming.trim().to_string();
-    }
-    let current_tokens: Vec<&str> = incoming.split_whitespace().collect();
-    if current_tokens.is_empty() {
-        return String::new();
-    }
-    let previous_tokens: Vec<&str> = existing.split_whitespace().collect();
-    let max_window = previous_tokens.len().min(current_tokens.len()).min(80);
-    if max_window < 5 {
-        return incoming.trim().to_string();
-    }
-    let previous_norm: Vec<String> = previous_tokens[previous_tokens.len() - max_window..]
-        .iter()
-        .map(|token| normalize_audio_token(token))
-        .collect();
-    let current_norm: Vec<String> = current_tokens[..max_window]
-        .iter()
-        .map(|token| normalize_audio_token(token))
-        .collect();
-    for match_len in (5..=max_window).rev() {
-        if previous_norm[max_window - match_len..] == current_norm[..match_len] {
-            return current_tokens[match_len..].join(" ").trim().to_string();
-        }
-    }
-    incoming.trim().to_string()
-}
-
-fn which_binary(name: &str) -> bool {
-    std::env::var_os("PATH")
-        .map(|paths| {
-            std::env::split_paths(&paths).any(|path| {
-                let candidate = path.join(name);
-                let executable = candidate.is_file();
-                if executable {
-                    return true;
-                }
-                #[cfg(windows)]
-                {
-                    return path.join(format!("{name}.exe")).is_file();
-                }
-                #[cfg(not(windows))]
-                {
-                    false
-                }
-            })
-        })
-        .unwrap_or(false)
-}
-
-fn ensure_media_tools() -> Result<(), String> {
-    let missing: Vec<&str> = ["ffmpeg", "ffprobe"]
-        .into_iter()
-        .filter(|name| !which_binary(name))
-        .collect();
-    if missing.is_empty() {
-        Ok(())
-    } else {
-        Err(format!(
-            "Long-form transcription requires {}. Install ffmpeg/ffprobe and retry.",
-            missing.join(", ")
-        ))
-    }
-}
-
-async fn run_media_command(
-    program: &str,
-    args: &[String],
-    timeout_sec: u64,
-) -> Result<String, String> {
-    let mut command = Command::new(program);
-    command
-        .args(args)
-        .stdout(Stdio::piped())
-        .stderr(Stdio::piped())
-        .stdin(Stdio::null());
-    let output = timeout(Duration::from_secs(timeout_sec), command.output())
-        .await
-        .map_err(|_| format!("{program} timed out after {timeout_sec}s"))?
-        .map_err(|error| format!("Media tooling not available: {program}: {error}"))?;
-    if !output.status.success() {
-        let stderr = String::from_utf8_lossy(&output.stderr).trim().to_string();
-        let stdout = String::from_utf8_lossy(&output.stdout).trim().to_string();
-        return Err(format!(
-            "{program} failed: {}",
-            if !stderr.is_empty() {
-                stderr
-            } else if !stdout.is_empty() {
-                stdout
-            } else {
-                "unknown error".to_string()
-            }
-        ));
-    }
-    Ok(String::from_utf8_lossy(&output.stdout).to_string())
-}
-
-async fn probe_media_duration(path: &Path, timeout_sec: u64) -> Result<f64, String> {
-    let stdout = run_media_command(
-        "ffprobe",
-        &[
-            "-v".to_string(),
-            "error".to_string(),
-            "-print_format".to_string(),
-            "json".to_string(),
-            "-show_format".to_string(),
-            path.display().to_string(),
-        ],
-        timeout_sec,
-    )
-    .await?;
-    let parsed: Value = serde_json::from_str(&stdout)
-        .map_err(|error| format!("ffprobe returned invalid JSON: {error}"))?;
-    let duration_value = parsed
-        .get("format")
-        .and_then(Value::as_object)
-        .and_then(|format| format.get("duration"))
-        .cloned()
-        .ok_or_else(|| {
-            format!(
-                "ffprobe did not return a valid duration for {}",
-                path.display()
-            )
-        })?;
-    let parsed_duration = match duration_value {
-        Value::String(value) => value
-            .parse::<f64>()
-            .map_err(|error| format!("ffprobe did not return a valid duration: {error}"))?,
-        Value::Number(value) => value
-            .as_f64()
-            .ok_or_else(|| "ffprobe did not return a valid numeric duration".to_string())?,
-        _ => {
-            return Err(format!(
-                "ffprobe did not return a valid duration for {}",
-                path.display()
-            ));
-        }
-    };
-    if parsed_duration <= 0.0 {
-        return Err(format!(
-            "ffprobe reported non-positive duration for {}",
-            path.display()
-        ));
-    }
-    Ok(parsed_duration)
-}
-
-async fn extract_audio_source(
-    source: &Path,
-    output: &Path,
-    timeout_sec: u64,
-) -> Result<(), String> {
-    run_media_command(
-        "ffmpeg",
-        &[
-            "-nostdin".to_string(),
-            "-y".to_string(),
-            "-i".to_string(),
-            source.display().to_string(),
-            "-vn".to_string(),
-            "-ac".to_string(),
-            "1".to_string(),
-            "-ar".to_string(),
-            "16000".to_string(),
-            "-c:a".to_string(),
-            "pcm_s16le".to_string(),
-            output.display().to_string(),
-        ],
-        timeout_sec,
-    )
-    .await
-    .map(|_| ())
-}
-
-async fn extract_audio_chunk(
-    source: &Path,
-    output: &Path,
-    start_sec: f64,
-    duration_sec: f64,
-    timeout_sec: u64,
-) -> Result<(), String> {
-    run_media_command(
-        "ffmpeg",
-        &[
-            "-nostdin".to_string(),
-            "-y".to_string(),
-            "-ss".to_string(),
-            format!("{start_sec:.3}"),
-            "-i".to_string(),
-            source.display().to_string(),
-            "-t".to_string(),
-            format!("{duration_sec:.3}"),
-            "-vn".to_string(),
-            "-ac".to_string(),
-            "1".to_string(),
-            "-ar".to_string(),
-            "16000".to_string(),
-            "-c:a".to_string(),
-            "pcm_s16le".to_string(),
-            output.display().to_string(),
-        ],
-        timeout_sec,
-    )
-    .await
-    .map(|_| ())
-}
-
-fn audio_chunk_seconds_budget(max_bytes: usize, requested_seconds: f64) -> Result<f64, String> {
-    let safe_seconds =
-        (max_bytes as f64 * AUDIO_CHUNK_TARGET_FILL_RATIO) / AUDIO_CHUNK_BYTES_PER_SECOND;
-    if safe_seconds <= 0.0 {
-        return Err("Mistral transcription max-bytes budget is too small to chunk audio".into());
-    }
-    Ok(requested_seconds.min(safe_seconds))
-}
-
-fn plan_audio_chunks(
-    duration_sec: f64,
-    chunk_seconds: f64,
-    overlap_seconds: f64,
-    max_chunks: i64,
-) -> Result<Vec<ChunkPlan>, String> {
-    if duration_sec <= 0.0 {
-        return Err("Cannot chunk media with non-positive duration".into());
-    }
-    let chunk_seconds = chunk_seconds.max(1.0);
-    let overlap_seconds = overlap_seconds
-        .max(0.0)
-        .min((chunk_seconds - 0.001).max(0.0));
-    let mut chunks = Vec::new();
-    let mut start = 0.0;
-    while start < duration_sec - 1e-6 {
-        let end = (start + chunk_seconds).min(duration_sec);
-        let index = chunks.len();
-        chunks.push(ChunkPlan {
-            index,
-            start_sec: (start * 1000.0).round() / 1000.0,
-            end_sec: (end * 1000.0).round() / 1000.0,
-            duration_sec: ((end - start) * 1000.0).round() / 1000.0,
-            leading_overlap_sec: if index == 0 {
-                0.0
-            } else {
-                (overlap_seconds * 1000.0).round() / 1000.0
-            },
-        });
-        if chunks.len() as i64 > max_chunks {
-            return Err(format!(
-                "Chunk plan would create {} chunks (max {max_chunks})",
-                chunks.len()
-            ));
-        }
-        if end >= duration_sec - 1e-6 {
-            break;
-        }
-        let mut next_start = end - overlap_seconds;
-        if next_start <= start + 1e-6 {
-            next_start = end;
-        }
-        start = next_start;
-    }
-    Ok(chunks)
-}
-
-fn entry_time_bounds(entry: &Map<String, Value>) -> Option<(f64, f64)> {
-    if let (Some(start), Some(end)) = (
-        entry.get("start").and_then(Value::as_f64),
-        entry.get("end").and_then(Value::as_f64),
-    ) {
-        return Some((start, end));
-    }
-    let timestamps = entry.get("timestamps")?.as_array()?;
-    if timestamps.len() < 2 {
-        return None;
-    }
-    Some((timestamps[0].as_f64()?, timestamps[1].as_f64()?))
-}
-
-fn set_entry_time_bounds(entry: &mut Map<String, Value>, start: f64, end: f64) {
-    if entry.contains_key("start") || entry.contains_key("end") {
-        entry.insert("start".into(), json!(((start * 1000.0).round() / 1000.0)));
-        entry.insert("end".into(), json!(((end * 1000.0).round() / 1000.0)));
-    } else if let Some(timestamps) = entry.get_mut("timestamps").and_then(Value::as_array_mut) {
-        while timestamps.len() < 2 {
-            timestamps.push(json!(0.0));
-        }
-        timestamps[0] = json!(((start * 1000.0).round() / 1000.0));
-        timestamps[1] = json!(((end * 1000.0).round() / 1000.0));
-    }
-}
-
-fn prefix_audio_speakers(value: &Value, prefix: &str) -> Value {
-    match value {
-        Value::Array(items) => Value::Array(
-            items
-                .iter()
-                .map(|item| prefix_audio_speakers(item, prefix))
-                .collect(),
-        ),
-        Value::Object(object) => Value::Object(
-            object
-                .iter()
-                .map(|(key, item)| {
-                    let value = if SPEAKER_FIELDS.contains(&key.as_str()) {
-                        item.as_str()
-                            .map(|speaker| Value::String(format!("{prefix}{speaker}")))
-                            .unwrap_or_else(|| prefix_audio_speakers(item, prefix))
-                    } else {
-                        prefix_audio_speakers(item, prefix)
-                    };
-                    (key.clone(), value)
-                })
-                .collect(),
-        ),
-        _ => value.clone(),
-    }
-}
-
-fn shift_audio_items(
-    items: &[Value],
-    chunk_start_sec: f64,
-    leading_overlap_sec: f64,
-    speaker_prefix: &str,
-) -> Vec<Value> {
-    let mut shifted = Vec::new();
-    for item in items {
-        let mut copied = prefix_audio_speakers(item, speaker_prefix);
-        if let Some(object) = copied.as_object_mut() {
-            if let Some((mut start, end)) = entry_time_bounds(object) {
-                if end <= leading_overlap_sec + 1e-6 {
-                    continue;
-                }
-                if start < leading_overlap_sec {
-                    start = leading_overlap_sec;
-                }
-                set_entry_time_bounds(object, start + chunk_start_sec, end + chunk_start_sec);
-            }
-        }
-        shifted.push(copied);
-    }
-    shifted
-}
-
-fn collect_chunk_metadata(
-    parsed: &Value,
-    chunk_start_sec: f64,
-    leading_overlap_sec: f64,
-    speaker_prefix: &str,
-) -> Map<String, Value> {
-    let mut aggregated = Map::new();
-    if let Some(items) = parsed.get("segments").and_then(Value::as_array) {
-        aggregated.insert(
-            "segments".into(),
-            Value::Array(shift_audio_items(
-                items,
-                chunk_start_sec,
-                leading_overlap_sec,
-                speaker_prefix,
-            )),
-        );
-    } else if let Some(items) = parsed.get("chunks").and_then(Value::as_array) {
-        aggregated.insert(
-            "segments".into(),
-            Value::Array(shift_audio_items(
-                items,
-                chunk_start_sec,
-                leading_overlap_sec,
-                speaker_prefix,
-            )),
-        );
-    }
-    if let Some(items) = parsed.get("words").and_then(Value::as_array) {
-        aggregated.insert(
-            "words".into(),
-            Value::Array(shift_audio_items(
-                items,
-                chunk_start_sec,
-                leading_overlap_sec,
-                speaker_prefix,
-            )),
-        );
-    }
-    if let Some(items) = parsed.get("diarization").and_then(Value::as_array) {
-        aggregated.insert(
-            "diarization".into(),
-            Value::Array(shift_audio_items(
-                items,
-                chunk_start_sec,
-                leading_overlap_sec,
-                speaker_prefix,
-            )),
-        );
-    }
-    aggregated
-}
-
-fn truncate_audio_text(payload: &mut Value, max_chars: usize) {
-    let original = payload
-        .get("text")
-        .and_then(Value::as_str)
-        .unwrap_or_default()
-        .to_string();
-    if original.is_empty() {
-        return;
-    }
-    let mut base = payload.clone();
-    base["text"] = Value::String(String::new());
-    if json_length(&base) > max_chars {
-        payload["text"] = Value::String(String::new());
-        payload["truncation"]["text_truncated_chars"] = json!(original.len());
-        return;
-    }
-
-    let mut low = 0usize;
-    let mut high = original.len();
-    while low < high {
-        let mid = (low + high + 1) / 2;
-        let idx = original.floor_char_boundary(mid);
-        base["text"] = Value::String(original[..idx].to_string());
-        if json_length(&base) <= max_chars {
-            low = idx;
-        } else if idx == 0 {
-            high = 0;
-        } else {
-            high = idx - 1;
-        }
-    }
-    let final_idx = original.floor_char_boundary(low);
-    payload["text"] = Value::String(original[..final_idx].to_string());
-    let omitted = original.len().saturating_sub(final_idx);
-    if omitted > 0 {
-        payload["truncation"]["text_truncated_chars"] = json!(omitted);
-    }
-}
-
-fn serialize_audio_envelope(mut payload: Value, max_chars: usize) -> String {
-    if payload.get("truncation").is_none() {
-        payload["truncation"] = json!({"applied": false});
-    }
-    if json_length(&payload) <= max_chars {
-        return serde_json::to_string_pretty(&payload).unwrap_or_else(|_| payload.to_string());
-    }
-
-    payload["truncation"]["applied"] = Value::Bool(true);
-    let mode = payload
-        .get("mode")
-        .and_then(Value::as_str)
-        .unwrap_or("")
-        .to_string();
-
-    let mut omitted_response_fields = Map::new();
-    let mut removal_order = vec!["words", "diarization", "segments"];
-    if mode != "chunked" {
-        removal_order.push("chunks");
-    }
-    for key in removal_order {
-        let removed = payload
-            .get_mut("response")
-            .and_then(Value::as_object_mut)
-            .and_then(|response| response.remove(key));
-        if let Some(value) = removed {
-            if let Some(items) = value.as_array() {
-                if !items.is_empty() {
-                    omitted_response_fields.insert(key.into(), json!(items.len()));
-                }
-            }
-            if json_length(&payload) <= max_chars {
-                break;
-            }
-        }
-    }
-    if !omitted_response_fields.is_empty() {
-        payload["truncation"]["omitted_response_fields"] = Value::Object(omitted_response_fields);
-    }
-
-    if mode == "chunked" && json_length(&payload) > max_chars {
-        let omitted = payload
-            .get_mut("response")
-            .and_then(Value::as_object_mut)
-            .and_then(|response| response.get_mut("chunks"))
-            .and_then(Value::as_array_mut)
-            .map(|chunks| {
-                let keep = chunks.len().min(12);
-                let omitted = chunks.len().saturating_sub(keep);
-                if omitted > 0 {
-                    chunks.truncate(keep);
-                }
-                omitted
-            })
-            .unwrap_or(0);
-        if omitted > 0 {
-            payload["truncation"]["omitted_chunk_statuses"] = json!(omitted);
-        }
-    }
-
-    if json_length(&payload) > max_chars {
-        truncate_audio_text(&mut payload, max_chars);
-    }
-
-    if json_length(&payload) > max_chars {
-        while json_length(&payload) > max_chars {
-            let popped = payload
-                .get_mut("response")
-                .and_then(Value::as_object_mut)
-                .and_then(|response| response.get_mut("chunks"))
-                .and_then(Value::as_array_mut)
-                .map(|chunks| {
-                    if chunks.len() > 3 {
-                        chunks.pop();
-                        true
-                    } else {
-                        false
-                    }
-                })
-                .unwrap_or(false);
-            if !popped {
-                break;
-            }
-            let current = payload["truncation"]
-                .get("omitted_chunk_statuses")
-                .and_then(Value::as_u64)
-                .unwrap_or(0);
-            payload["truncation"]["omitted_chunk_statuses"] = json!(current + 1);
-        }
-    }
-
-    if json_length(&payload) > max_chars {
-        if let Some(options) = payload.get_mut("options").and_then(Value::as_object_mut) {
-            if let Some(context_bias) = options.remove("context_bias") {
-                if let Some(items) = context_bias.as_array() {
-                    payload["truncation"]["omitted_context_bias_phrases"] = json!(items.len());
-                }
-            }
-        }
-    }
-
-    serde_json::to_string_pretty(&payload).unwrap_or_else(|_| payload.to_string())
-}
-
-async fn mistral_transcription_request(
-    api_key: &str,
-    base_url: &str,
-    resolved: &Path,
-    model: &str,
-    diarize: Option<bool>,
-    timestamp_granularities: Option<&[String]>,
-    context_bias: Option<&[String]>,
-    language: Option<&str>,
-    temperature: Option<f64>,
-    max_bytes: usize,
-    request_timeout_sec: u64,
-) -> Result<Value, String> {
-    let metadata = std::fs::metadata(resolved).map_err(|error| {
-        format!(
-            "Failed to inspect audio file {}: {error}",
-            resolved.display()
-        )
-    })?;
-    if metadata.len() as usize > max_bytes {
-        return Err(format!(
-            "Audio file too large: {} bytes (max {} bytes)",
-            metadata.len(),
-            max_bytes
-        ));
-    }
-    let bytes = std::fs::read(resolved)
-        .map_err(|error| format!("Failed to read audio file {}: {error}", resolved.display()))?;
-    let filename = resolved
-        .file_name()
-        .and_then(|value| value.to_str())
-        .unwrap_or("audio");
-    let mut form = Form::new()
-        .text("model", model.to_string())
-        .text("stream", "false")
-        .part(
-            "file",
-            Part::bytes(bytes)
-                .file_name(filename.to_string())
-                .mime_str(audio_media_type(resolved))
-                .expect("audio_media_type always returns a valid MIME type"),
-        );
-    if let Some(value) = diarize {
-        form = form.text("diarize", if value { "true" } else { "false" });
-    }
-    if let Some(value) = language.filter(|value| !value.trim().is_empty()) {
-        form = form.text("language", value.to_string());
-    }
-    if let Some(value) = temperature {
-        form = form.text("temperature", value.to_string());
-    }
-    if let Some(values) = timestamp_granularities {
-        for value in values {
-            form = form.text("timestamp_granularities", value.clone());
-        }
-    }
-    if let Some(values) = context_bias {
-        for value in values {
-            form = form.text("context_bias", value.clone());
-        }
-    }
-
-    let client = reqwest::Client::new();
-    let response = client
-        .post(transcription_endpoint(base_url))
-        .bearer_auth(api_key)
-        .timeout(Duration::from_secs(request_timeout_sec))
-        .multipart(form)
-        .send()
-        .await
-        .map_err(|error| format!("Mistral transcription request failed: {error}"))?;
-    let status = response.status();
-    let raw = response
-        .text()
-        .await
-        .map_err(|error| format!("Mistral transcription returned unreadable body: {error}"))?;
-    if !status.is_success() {
-        return Err(format!(
-            "Mistral transcription HTTP {}: {}",
-            status.as_u16(),
-            raw
-        ));
-    }
-    serde_json::from_str(&raw).map_err(|error| {
-        format!(
-            "Mistral transcription returned non-JSON payload: {error}: {}",
-            filesystem::clip(&raw, 500)
-        )
-    })
-}
-
-#[allow(clippy::too_many_arguments)]
-pub async fn audio_transcribe(
-    root: &Path,
-    api_key: Option<&str>,
-    base_url: &str,
-    default_model: &str,
-    max_bytes: usize,
-    default_chunk_max_seconds: i64,
-    default_chunk_overlap_seconds: f64,
-    default_max_chunks: i64,
-    path: &str,
-    diarize: Option<bool>,
-    timestamp_granularities: Option<&[String]>,
-    context_bias: Option<&[String]>,
-    language: Option<&str>,
-    model: Option<&str>,
-    temperature: Option<f64>,
-    chunking: Option<&str>,
-    chunk_max_seconds: Option<i64>,
-    chunk_overlap_seconds: Option<f64>,
-    max_chunks: Option<i64>,
-    continue_on_chunk_error: Option<bool>,
-    max_chars: usize,
-    command_timeout_sec: u64,
-    request_timeout_sec: u64,
-    files_read: &mut HashSet<PathBuf>,
-) -> ToolResult {
-    let resolved = match filesystem::resolve_path(root, path) {
-        Ok(value) => value,
-        Err(error) => return ToolResult::error(error),
-    };
-    if !resolved.exists() {
-        return ToolResult::error(format!("File not found: {path}"));
-    }
-    if resolved.is_dir() {
-        return ToolResult::error(format!("Path is a directory, not a file: {path}"));
-    }
-    let ext = resolved
-        .extension()
-        .and_then(|value| value.to_str())
-        .map(|value| format!(".{}", value.to_ascii_lowercase()))
-        .unwrap_or_default();
-    if !is_supported_extension(&ext) {
-        let mut supported: Vec<&str> = AUDIO_EXTENSIONS.iter().copied().collect();
-        supported.extend(VIDEO_EXTENSIONS.iter().copied());
-        supported.sort_unstable();
-        return ToolResult::error(format!(
-            "Unsupported audio format: {}. Supported: {}",
-            if ext.is_empty() { "(none)" } else { &ext },
-            supported.join(", ")
-        ));
-    }
-    if language.is_some() && timestamp_granularities.is_some() {
-        return ToolResult::error(
-            "language cannot be combined with timestamp_granularities for Mistral offline transcription"
-                .into(),
-        );
-    }
-    let chunk_mode = chunking.unwrap_or("auto").trim().to_ascii_lowercase();
-    if !CHUNKING_MODES.iter().any(|value| *value == chunk_mode) {
-        return ToolResult::error("chunking must be one of auto, off, or force".into());
-    }
-    if chunk_max_seconds
-        .map(|value| {
-            !(AUDIO_MIN_CHUNK_SECONDS as i64..=AUDIO_MAX_CHUNK_SECONDS as i64).contains(&value)
-        })
-        .unwrap_or(false)
-    {
-        return ToolResult::error(format!(
-            "chunk_max_seconds must be between {} and {}",
-            AUDIO_MIN_CHUNK_SECONDS as i64, AUDIO_MAX_CHUNK_SECONDS as i64
-        ));
-    }
-    if chunk_overlap_seconds
-        .map(|value| !(0.0..=AUDIO_MAX_CHUNK_OVERLAP_SECONDS).contains(&value))
-        .unwrap_or(false)
-    {
-        return ToolResult::error(format!(
-            "chunk_overlap_seconds must be between 0 and {}",
-            AUDIO_MAX_CHUNK_OVERLAP_SECONDS as i64
-        ));
-    }
-    if max_chunks
-        .map(|value| !(1..=AUDIO_MAX_CHUNKS).contains(&value))
-        .unwrap_or(false)
-    {
-        return ToolResult::error(format!(
-            "max_chunks must be between 1 and {AUDIO_MAX_CHUNKS}"
-        ));
-    }
-
-    let api_key = match api_key {
-        Some(value) if !value.trim().is_empty() => value,
-        _ => return ToolResult::error("Mistral transcription API key not configured".into()),
-    };
-    let chosen_model = model.unwrap_or(default_model).trim();
-    if chosen_model.is_empty() {
-        return ToolResult::error("No Mistral transcription model configured".into());
-    }
-    let normalized_timestamps = timestamp_granularities.map(|values| {
-        values
-            .iter()
-            .map(|value| value.trim().to_ascii_lowercase())
-            .filter(|value| !value.is_empty())
-            .collect::<Vec<_>>()
-    });
-    if normalized_timestamps.as_ref().is_some_and(|values| {
-        values
-            .iter()
-            .any(|value| !TIMESTAMP_GRANULARITIES.contains(&value.as_str()))
-    }) {
-        return ToolResult::error(format!(
-            "timestamp_granularities must be drawn from {}",
-            TIMESTAMP_GRANULARITIES.join(", ")
-        ));
-    }
-    let normalized_bias = context_bias.map(|values| {
-        values
-            .iter()
-            .map(|value| value.trim().to_string())
-            .filter(|value| !value.is_empty())
-            .collect::<Vec<_>>()
-    });
-    if normalized_bias
-        .as_ref()
-        .is_some_and(|values| values.len() > 100)
-    {
-        return ToolResult::error("context_bias supports at most 100 phrases".into());
-    }
-
-    let options = build_options(
-        diarize,
-        normalized_timestamps.as_deref(),
-        normalized_bias.as_deref(),
-        language,
-        temperature,
-        &chunk_mode,
-        chunk_max_seconds,
-        chunk_overlap_seconds,
-        max_chunks,
-        continue_on_chunk_error,
-    );
-
-    let temp_dir = match TempAudioDir::new() {
-        Ok(value) => value,
-        Err(error) => return ToolResult::error(error),
-    };
-    let mut upload_source = resolved.clone();
-    if is_video_extension(&ext) {
-        if let Err(error) = ensure_media_tools() {
-            return ToolResult::error(error);
-        }
-        let extracted = temp_dir.path.join("video-source.wav");
-        if let Err(error) = extract_audio_source(&resolved, &extracted, command_timeout_sec).await {
-            return ToolResult::error(error);
-        }
-        upload_source = extracted;
-    }
-
-    let upload_size = match std::fs::metadata(&upload_source) {
-        Ok(value) => value.len() as usize,
-        Err(error) => {
-            return ToolResult::error(format!(
-                "Failed to inspect audio file {}: {error}",
-                upload_source.display()
-            ));
-        }
-    };
-    files_read.insert(resolved.clone());
-
-    let chunk_requested =
-        chunk_mode == "force" || (chunk_mode == "auto" && upload_size > max_bytes);
-
-    if !chunk_requested {
-        let parsed = match mistral_transcription_request(
-            api_key,
-            base_url,
-            &upload_source,
-            chosen_model,
-            diarize,
-            normalized_timestamps.as_deref(),
-            normalized_bias.as_deref(),
-            language,
-            temperature,
-            max_bytes,
-            request_timeout_sec,
-        )
-        .await
-        {
-            Ok(value) => value,
-            Err(error) => return ToolResult::error(error),
-        };
-        let envelope = json!({
-            "provider": "mistral",
-            "service": "transcription",
-            "path": rel_path(root, &resolved),
-            "model": chosen_model,
-            "options": options,
-            "text": parsed.get("text").and_then(Value::as_str).unwrap_or_default(),
-            "response": parsed,
-        });
-        return ToolResult::ok(serialize_audio_envelope(envelope, max_chars));
-    }
-
-    if let Err(error) = ensure_media_tools() {
-        return ToolResult::error(error);
-    }
-
-    let duration_sec = match probe_media_duration(&upload_source, command_timeout_sec).await {
-        Ok(value) => value,
-        Err(error) => return ToolResult::error(error),
-    };
-    let requested_chunk_seconds = (chunk_max_seconds.unwrap_or(default_chunk_max_seconds) as f64)
-        .min(AUDIO_MAX_CHUNK_SECONDS);
-    let mut effective_chunk_seconds =
-        match audio_chunk_seconds_budget(max_bytes, requested_chunk_seconds) {
-            Ok(value) => value,
-            Err(error) => return ToolResult::error(error),
-        };
-    if duration_sec > AUDIO_MIN_CHUNK_SECONDS {
-        effective_chunk_seconds =
-            effective_chunk_seconds.max(duration_sec.min(AUDIO_MIN_CHUNK_SECONDS));
-    }
-    let effective_overlap_seconds = chunk_overlap_seconds
-        .unwrap_or(default_chunk_overlap_seconds)
-        .min((effective_chunk_seconds - 0.001).max(0.0));
-    let effective_max_chunks = max_chunks.unwrap_or(default_max_chunks);
-    let chunk_plan = match plan_audio_chunks(
-        duration_sec,
-        effective_chunk_seconds,
-        effective_overlap_seconds,
-        effective_max_chunks,
-    ) {
-        Ok(value) => value,
-        Err(error) => return ToolResult::error(error),
-    };
-
-    let mut chunk_statuses: Vec<Value> = Vec::new();
-    let mut warnings: Vec<String> = Vec::new();
-    let mut stitched_text = String::new();
-    let mut aggregated_response = Map::new();
-    aggregated_response.insert(
-        "speaker_scope".into(),
-        Value::String(if diarize.unwrap_or(false) {
-            "chunk_local_prefixed".into()
-        } else {
-            "not_requested".into()
-        }),
-    );
-    aggregated_response.insert("chunks".into(), Value::Array(Vec::new()));
-    let mut partial = false;
-    let continue_on_chunk_error = continue_on_chunk_error.unwrap_or(false);
-
-    for chunk in &chunk_plan {
-        let chunk_path = temp_dir.path.join(format!("chunk-{:03}.wav", chunk.index));
-        if let Err(error) = extract_audio_chunk(
-            &upload_source,
-            &chunk_path,
-            chunk.start_sec,
-            chunk.duration_sec,
-            command_timeout_sec,
-        )
-        .await
-        {
-            partial = true;
-            chunk_statuses.push(json!({
-                "index": chunk.index,
-                "start_sec": chunk.start_sec,
-                "end_sec": chunk.end_sec,
-                "status": "error",
-                "error": error,
-            }));
-            if continue_on_chunk_error {
-                warnings.push(format!("chunk {} failed: {error}", chunk.index));
-                continue;
-            }
-            return ToolResult::error(format!(
-                "audio_transcribe failed in chunk {}: {error}",
-                chunk.index
-            ));
-        }
-
-        let parsed = match mistral_transcription_request(
-            api_key,
-            base_url,
-            &chunk_path,
-            chosen_model,
-            diarize,
-            normalized_timestamps.as_deref(),
-            normalized_bias.as_deref(),
-            language,
-            temperature,
-            max_bytes,
-            request_timeout_sec,
-        )
-        .await
-        {
-            Ok(value) => value,
-            Err(error) => {
-                partial = true;
-                chunk_statuses.push(json!({
-                    "index": chunk.index,
-                    "start_sec": chunk.start_sec,
-                    "end_sec": chunk.end_sec,
-                    "status": "error",
-                    "error": error,
-                }));
-                if continue_on_chunk_error {
-                    warnings.push(format!("chunk {} failed: {error}", chunk.index));
-                    continue;
-                }
-                return ToolResult::error(format!(
-                    "audio_transcribe failed in chunk {}: {error}",
-                    chunk.index
-                ));
-            }
-        };
-
-        let chunk_text = parsed
-            .get("text")
-            .and_then(Value::as_str)
-            .unwrap_or_default();
-        let deduped_text = dedupe_audio_overlap_text(&stitched_text, chunk_text);
-        if !deduped_text.is_empty() {
-            if stitched_text.is_empty() {
-                stitched_text = deduped_text;
-            } else {
-                stitched_text = format!("{stitched_text} {deduped_text}");
-            }
-        }
-
-        let metadata = collect_chunk_metadata(
-            &parsed,
-            chunk.start_sec,
-            chunk.leading_overlap_sec,
-            &format!("c{}_", chunk.index),
-        );
-        for (key, value) in metadata {
-            if let Some(existing) = aggregated_response
-                .get_mut(&key)
-                .and_then(Value::as_array_mut)
-            {
-                if let Some(items) = value.as_array() {
-                    existing.extend(items.iter().cloned());
-                }
-            } else {
-                aggregated_response.insert(key, value);
-            }
-        }
-
-        chunk_statuses.push(json!({
-            "index": chunk.index,
-            "start_sec": chunk.start_sec,
-            "end_sec": chunk.end_sec,
-            "status": "ok",
-            "text_chars": chunk_text.len(),
-        }));
-    }
-
-    if !chunk_statuses
-        .iter()
-        .any(|chunk| chunk.get("status").and_then(Value::as_str) == Some("ok"))
-    {
-        return ToolResult::error(
-            "audio_transcribe failed: no chunk completed successfully".into(),
-        );
-    }
-
-    aggregated_response.insert("chunks".into(), Value::Array(chunk_statuses.clone()));
-    let mut envelope = json!({
-        "provider": "mistral",
-        "service": "transcription",
-        "mode": "chunked",
-        "path": rel_path(root, &resolved),
-        "model": chosen_model,
-        "options": options,
-        "chunking": {
-            "strategy": "overlap_window",
-            "chunk_seconds": ((effective_chunk_seconds * 1000.0).round() / 1000.0),
-            "overlap_seconds": ((effective_overlap_seconds * 1000.0).round() / 1000.0),
-            "total_chunks": chunk_plan.len(),
-            "failed_chunks": chunk_statuses.iter().filter(|chunk| {
-                chunk.get("status").and_then(Value::as_str) != Some("ok")
-            }).count(),
-            "partial": partial,
-        },
-        "text": stitched_text.trim(),
-        "response": Value::Object(aggregated_response),
-    });
-    if !warnings.is_empty() {
-        envelope["warnings"] = Value::Array(warnings.into_iter().map(Value::String).collect());
-    }
-    ToolResult::ok(serialize_audio_envelope(envelope, max_chars))
-}
-
-#[cfg(test)]
-mod tests {
-    use super::*;
-    use axum::{Json, Router, body::Bytes, routing::post};
-    use std::sync::{Arc, Mutex};
-    use tempfile::tempdir;
-    use tokio::net::TcpListener;
-
-    async fn capture_transcription(body: Bytes) -> Json<Value> {
-        Json(json!({
-            "text": "hello world",
-            "chunks": [{"text": "hello world", "timestamps": [0.0, 1.0]}],
-            "raw_body": String::from_utf8_lossy(&body).to_string(),
-        }))
-    }
-
-    async fn spawn_server() -> String {
-        let app = Router::new().route("/v1/audio/transcriptions", post(capture_transcription));
-        let listener = TcpListener::bind("127.0.0.1:0").await.unwrap();
-        let addr = listener.local_addr().unwrap();
-        tokio::spawn(async move {
-            axum::serve(listener, app).await.unwrap();
-        });
-        format!("http://{}", addr)
-    }
-
-    fn install_fake_media_tools(root: &Path) {
-        let ffprobe = root.join("ffprobe");
-        let ffmpeg = root.join("ffmpeg");
-        std::fs::write(
-            &ffprobe,
-            "#!/bin/sh\nprintf '{\"format\":{\"duration\":\"58.0\"}}'\n",
-        )
-        .unwrap();
-        std::fs::write(
-            &ffmpeg,
-            "#!/bin/sh\nout=\"\"\nfor arg in \"$@\"; do out=\"$arg\"; done\nprintf 'chunk' > \"$out\"\n",
-        )
-        .unwrap();
-        #[cfg(unix)]
-        {
-            use std::os::unix::fs::PermissionsExt;
-            std::fs::set_permissions(&ffprobe, std::fs::Permissions::from_mode(0o755)).unwrap();
-            std::fs::set_permissions(&ffmpeg, std::fs::Permissions::from_mode(0o755)).unwrap();
-        }
-    }
-
-    #[tokio::test]
-    async fn test_audio_transcribe_success() {
-        let dir = tempdir().unwrap();
-        let audio = dir.path().join("clip.wav");
-        std::fs::write(&audio, b"RIFF\x00\x00\x00\x00WAVEfmt ").unwrap();
-        let root = dir.path().to_path_buf();
-        let base_url = spawn_server().await;
-        let mut files_read = HashSet::new();
-
-        let result = audio_transcribe(
-            &root,
-            Some("mistral-key"),
-            &base_url,
-            "voxtral-mini-latest",
-            1024 * 1024,
-            900,
-            2.0,
-            48,
-            "clip.wav",
-            Some(true),
-            Some(&["segment".to_string()]),
-            Some(&["OpenPlanter".to_string()]),
-            None,
-            None,
-            Some(0.2),
-            None,
-            None,
-            None,
-            None,
-            None,
-            20_000,
-            5,
-            5,
-            &mut files_read,
-        )
-        .await;
-
-        assert!(!result.is_error, "unexpected error: {}", result.content);
-        let parsed: Value = serde_json::from_str(&result.content).unwrap();
-        assert_eq!(parsed["provider"], "mistral");
-        assert_eq!(parsed["path"], "clip.wav");
-        assert_eq!(parsed["text"], "hello world");
-        assert_eq!(parsed["options"]["diarize"], true);
-        let raw_body = parsed["response"]["raw_body"].as_str().unwrap();
-        assert!(raw_body.contains("name=\"model\""));
-        assert!(raw_body.contains("name=\"timestamp_granularities\""));
-        assert!(raw_body.contains("name=\"context_bias\""));
-    }
-
-    #[tokio::test]
-    async fn test_audio_transcribe_rejects_language_and_timestamps() {
-        let dir = tempdir().unwrap();
-        let audio = dir.path().join("clip.wav");
-        std::fs::write(&audio, b"RIFF\x00\x00\x00\x00WAVEfmt ").unwrap();
-        let root = dir.path().to_path_buf();
-        let mut files_read = HashSet::new();
-
-        let result = audio_transcribe(
-            &root,
-            Some("mistral-key"),
-            "https://api.mistral.ai",
-            "voxtral-mini-latest",
-            1024 * 1024,
-            900,
-            2.0,
-            48,
-            "clip.wav",
-            None,
-            Some(&["word".to_string()]),
-            None,
-            Some("en"),
-            None,
-            None,
-            None,
-            None,
-            None,
-            None,
-            None,
-            20_000,
-            5,
-            5,
-            &mut files_read,
-        )
-        .await;
-
-        assert!(result.is_error);
-        assert!(result.content.contains("cannot be combined"));
-    }
-
-    #[tokio::test]
-    async fn test_audio_transcribe_chunks_oversize_audio() {
-        let dir = tempdir().unwrap();
-        install_fake_media_tools(dir.path());
-        let original_path = std::env::var_os("PATH");
-        unsafe {
-            let mut parts = vec![dir.path().to_path_buf()];
-            if let Some(existing) = &original_path {
-                parts.extend(std::env::split_paths(existing));
-            }
-            std::env::set_var("PATH", std::env::join_paths(parts).unwrap());
-        }
-
-        let counter = Arc::new(Mutex::new(0usize));
-        let counter_clone = counter.clone();
-        let app = Router::new().route(
-            "/v1/audio/transcriptions",
-            post(move |_body: Bytes| {
-                let counter = counter_clone.clone();
-                async move {
-                    let mut state = counter.lock().unwrap();
-                    let response = if *state == 0 {
-                        json!({
-                            "text": "hello there general kenobi from tatooine",
-                            "segments": [{"text":"hello there general kenobi from tatooine","start":0.0,"end":4.0,"speaker":"speaker_a"}]
-                        })
-                    } else {
-                        json!({
-                            "text": "there general kenobi from tatooine today",
-                            "segments": [{"text":"there general kenobi from tatooine today","start":0.0,"end":4.0,"speaker":"speaker_a"}]
-                        })
-                    };
-                    *state += 1;
-                    Json(response)
-                }
-            }),
-        );
-        let listener = TcpListener::bind("127.0.0.1:0").await.unwrap();
-        let addr = listener.local_addr().unwrap();
-        tokio::spawn(async move {
-            axum::serve(listener, app).await.unwrap();
-        });
-
-        let audio = dir.path().join("clip.wav");
-        std::fs::write(&audio, vec![b'x'; 512]).unwrap();
-        let root = dir.path().to_path_buf();
-        let mut files_read = HashSet::new();
-
-        let result = audio_transcribe(
-            &root,
-            Some("mistral-key"),
-            &format!("http://{}", addr),
-            "voxtral-mini-latest",
-            64,
-            900,
-            2.0,
-            48,
-            "clip.wav",
-            Some(true),
-            None,
-            None,
-            None,
-            None,
-            None,
-            Some("auto"),
-            Some(30),
-            Some(2.0),
-            None,
-            None,
-            20_000,
-            5,
-            5,
-            &mut files_read,
-        )
-        .await;
-
-        if let Some(value) = original_path {
-            unsafe { std::env::set_var("PATH", value) };
-        }
-
-        assert!(!result.is_error, "unexpected error: {}", result.content);
-        let parsed: Value = serde_json::from_str(&result.content).unwrap();
-        assert_eq!(parsed["mode"], "chunked");
-        assert_eq!(
-            parsed["text"],
-            "hello there general kenobi from tatooine today"
-        );
-        assert_eq!(parsed["chunking"]["total_chunks"], 2);
-        assert_eq!(parsed["response"]["segments"][0]["speaker"], "c0_speaker_a");
-        assert_eq!(parsed["response"]["segments"][1]["speaker"], "c1_speaker_a");
-    }
-}
diff --git a/openplanter-desktop/crates/op-core/src/tools/defs.rs b/openplanter-desktop/crates/op-core/src/tools/defs.rs
index b8c3f91c..88b268e5 100644
--- a/openplanter-desktop/crates/op-core/src/tools/defs.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/defs.rs
@@ -66,68 +66,6 @@ fn mvp_tool_defs() -> Vec<ToolDef> {
                 "additionalProperties": false
             }),
         },
-        ToolDef {
-            name: "audio_transcribe",
-            description: "Transcribe a local audio file with Mistral's offline transcription API. Supports diarization, timestamp granularity, context bias, language, model override, temperature, and optional chunking for long-form audio/video.",
-            parameters: json!({
-                "type": "object",
-                "properties": {
-                    "path": {
-                        "type": "string",
-                        "description": "Relative or absolute path to the audio file within the workspace."
-                    },
-                    "diarize": {
-                        "type": "boolean",
-                        "description": "Whether to request speaker diarization."
-                    },
-                    "timestamp_granularities": {
-                        "type": "array",
-                        "items": { "type": "string" },
-                        "description": "Optional timestamp granularity values such as 'segment' or 'word'."
-                    },
-                    "context_bias": {
-                        "type": "array",
-                        "items": { "type": "string" },
-                        "description": "Optional bias phrases to steer transcription toward expected terms."
-                    },
-                    "language": {
-                        "type": "string",
-                        "description": "Optional ISO language hint. Cannot be combined with timestamp_granularities."
-                    },
-                    "model": {
-                        "type": "string",
-                        "description": "Optional transcription model override."
-                    },
-                    "temperature": {
-                        "type": "number",
-                        "description": "Optional decoding temperature."
-                    },
-                    "chunking": {
-                        "type": "string",
-                        "description": "Long-form handling mode: 'auto', 'off', or 'force'.",
-                        "enum": ["auto", "off", "force"]
-                    },
-                    "chunk_max_seconds": {
-                        "type": "integer",
-                        "description": "Maximum chunk duration in seconds for chunked transcription."
-                    },
-                    "chunk_overlap_seconds": {
-                        "type": "number",
-                        "description": "Overlap between adjacent chunks in seconds."
-                    },
-                    "max_chunks": {
-                        "type": "integer",
-                        "description": "Maximum number of chunks allowed for a transcription run."
-                    },
-                    "continue_on_chunk_error": {
-                        "type": "boolean",
-                        "description": "Continue remaining chunks and return partial output if a chunk fails."
-                    }
-                },
-                "required": ["path"],
-                "additionalProperties": false
-            }),
-        },
         ToolDef {
             name: "write_file",
             description: "Create or overwrite a file in the workspace with the given content.",
@@ -566,7 +504,6 @@ mod tests {
     fn test_tool_names() {
         let names = tool_names();
         assert!(names.contains(&"read_file"));
-        assert!(names.contains(&"audio_transcribe"));
         assert!(names.contains(&"run_shell"));
         assert!(names.contains(&"web_search"));
         assert!(names.contains(&"think"));
diff --git a/openplanter-desktop/crates/op-core/src/tools/mod.rs b/openplanter-desktop/crates/op-core/src/tools/mod.rs
index fba6bed8..693eb00e 100644
--- a/openplanter-desktop/crates/op-core/src/tools/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/mod.rs
@@ -2,7 +2,6 @@
 ///
 /// The `WorkspaceTools` struct is the central dispatcher that owns tool state
 /// (files-read set, background jobs) and routes tool calls to the appropriate module.
-pub mod audio;
 pub mod defs;
 pub mod filesystem;
 pub mod patching;
@@ -63,14 +62,6 @@ pub struct WorkspaceTools {
     brave_base_url: String,
     tavily_api_key: Option<String>,
     tavily_base_url: String,
-    mistral_transcription_api_key: Option<String>,
-    mistral_transcription_base_url: String,
-    mistral_transcription_model: String,
-    mistral_transcription_max_bytes: usize,
-    mistral_transcription_chunk_max_seconds: i64,
-    mistral_transcription_chunk_overlap_seconds: f64,
-    mistral_transcription_max_chunks: i64,
-    mistral_transcription_request_timeout_sec: u64,
     files_read: HashSet<PathBuf>,
     bg_jobs: shell::BgJobs,
 }
@@ -105,17 +96,6 @@ impl WorkspaceTools {
             brave_base_url: config.brave_base_url.clone(),
             tavily_api_key: config.tavily_api_key.clone(),
             tavily_base_url: config.tavily_base_url.clone(),
-            mistral_transcription_api_key: config.mistral_transcription_api_key.clone(),
-            mistral_transcription_base_url: config.mistral_transcription_base_url.clone(),
-            mistral_transcription_model: config.mistral_transcription_model.clone(),
-            mistral_transcription_max_bytes: config.mistral_transcription_max_bytes as usize,
-            mistral_transcription_chunk_max_seconds: config.mistral_transcription_chunk_max_seconds,
-            mistral_transcription_chunk_overlap_seconds: config
-                .mistral_transcription_chunk_overlap_seconds,
-            mistral_transcription_max_chunks: config.mistral_transcription_max_chunks,
-            mistral_transcription_request_timeout_sec: config
-                .mistral_transcription_request_timeout_sec
-                as u64,
             files_read: HashSet::new(),
             bg_jobs: shell::BgJobs::new(),
         }
@@ -146,17 +126,6 @@ impl WorkspaceTools {
             brave_base_url: config.brave_base_url.clone(),
             tavily_api_key: config.tavily_api_key.clone(),
             tavily_base_url: config.tavily_base_url.clone(),
-            mistral_transcription_api_key: config.mistral_transcription_api_key.clone(),
-            mistral_transcription_base_url: config.mistral_transcription_base_url.clone(),
-            mistral_transcription_model: config.mistral_transcription_model.clone(),
-            mistral_transcription_max_bytes: config.mistral_transcription_max_bytes as usize,
-            mistral_transcription_chunk_max_seconds: config.mistral_transcription_chunk_max_seconds,
-            mistral_transcription_chunk_overlap_seconds: config
-                .mistral_transcription_chunk_overlap_seconds,
-            mistral_transcription_max_chunks: config.mistral_transcription_max_chunks,
-            mistral_transcription_request_timeout_sec: config
-                .mistral_transcription_request_timeout_sec
-                as u64,
             files_read: HashSet::new(),
             bg_jobs: shell::BgJobs::new(),
         }
@@ -238,101 +207,6 @@ impl WorkspaceTools {
                     self.command_timeout_sec,
                 )
             }
-            "audio_transcribe" => {
-                let path = args.get("path").and_then(|v| v.as_str()).unwrap_or("");
-                let diarize = args.get("diarize").and_then(|v| v.as_bool());
-                let timestamp_granularities: Option<Vec<String>> = args
-                    .get("timestamp_granularities")
-                    .and_then(|v| {
-                        if let Some(values) = v.as_array() {
-                            Some(
-                                values
-                                    .iter()
-                                    .filter_map(|value| {
-                                        value.as_str().map(|s| s.trim().to_string())
-                                    })
-                                    .filter(|value| !value.is_empty())
-                                    .collect::<Vec<_>>(),
-                            )
-                        } else {
-                            v.as_str().map(|value| vec![value.trim().to_string()])
-                        }
-                    })
-                    .filter(|values| !values.is_empty());
-                let context_bias: Option<Vec<String>> = args
-                    .get("context_bias")
-                    .and_then(|v| {
-                        if let Some(values) = v.as_array() {
-                            Some(
-                                values
-                                    .iter()
-                                    .filter_map(|value| {
-                                        value.as_str().map(|s| s.trim().to_string())
-                                    })
-                                    .filter(|value| !value.is_empty())
-                                    .collect::<Vec<_>>(),
-                            )
-                        } else {
-                            v.as_str().map(|value| {
-                                value
-                                    .split(',')
-                                    .map(str::trim)
-                                    .filter(|part| !part.is_empty())
-                                    .map(ToString::to_string)
-                                    .collect::<Vec<_>>()
-                            })
-                        }
-                    })
-                    .filter(|values| !values.is_empty());
-                let language = args
-                    .get("language")
-                    .and_then(|v| v.as_str())
-                    .filter(|value| !value.trim().is_empty());
-                let model = args
-                    .get("model")
-                    .and_then(|v| v.as_str())
-                    .filter(|value| !value.trim().is_empty());
-                let temperature = args.get("temperature").and_then(|v| v.as_f64());
-                let chunking = args
-                    .get("chunking")
-                    .and_then(|v| v.as_str())
-                    .map(str::trim)
-                    .filter(|value| !value.is_empty());
-                let chunk_max_seconds = args.get("chunk_max_seconds").and_then(|v| v.as_i64());
-                let chunk_overlap_seconds =
-                    args.get("chunk_overlap_seconds").and_then(|v| v.as_f64());
-                let max_chunks = args.get("max_chunks").and_then(|v| v.as_i64());
-                let continue_on_chunk_error = args
-                    .get("continue_on_chunk_error")
-                    .and_then(|v| v.as_bool());
-                audio::audio_transcribe(
-                    &self.root,
-                    self.mistral_transcription_api_key.as_deref(),
-                    &self.mistral_transcription_base_url,
-                    &self.mistral_transcription_model,
-                    self.mistral_transcription_max_bytes,
-                    self.mistral_transcription_chunk_max_seconds,
-                    self.mistral_transcription_chunk_overlap_seconds,
-                    self.mistral_transcription_max_chunks,
-                    path,
-                    diarize,
-                    timestamp_granularities.as_deref(),
-                    context_bias.as_deref(),
-                    language,
-                    model,
-                    temperature,
-                    chunking,
-                    chunk_max_seconds,
-                    chunk_overlap_seconds,
-                    max_chunks,
-                    continue_on_chunk_error,
-                    self.max_file_chars.min(self.max_observation_chars),
-                    self.command_timeout_sec,
-                    self.mistral_transcription_request_timeout_sec,
-                    &mut self.files_read,
-                )
-                .await
-            }
 
             // Shell
             "run_shell" => {
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
index d3eeb81f..0bf58ff4 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
@@ -203,14 +203,14 @@ mod tests {
     }
 
     #[tokio::test]
-    async fn test_build_solve_initial_context_ignores_invalid_typed_state_without_warning() {
+    async fn test_build_solve_initial_context_degrades_to_no_packet_on_load_failure() {
         let tmp = tempdir().unwrap();
         fs::write(tmp.path().join("investigation_state.json"), "{not-json")
             .await
             .unwrap();
 
         let (context, warning) = build_solve_initial_context(tmp.path(), "sid").await;
-        assert!(warning.is_none());
+        assert!(warning.is_some());
         assert!(context.question_reasoning_packet.is_none());
         assert_eq!(context.session_id, Some("sid".to_string()));
         assert_eq!(context.session_dir, Some(tmp.path().display().to_string()));
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/config.rs b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
index 535367bd..9ea84671 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/config.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
@@ -205,10 +205,6 @@ pub fn build_credential_status(cfg: &op_core::config::AgentConfig) -> HashMap<St
     status.insert("brave".to_string(), cfg.brave_api_key.is_some());
     status.insert("tavily".to_string(), cfg.tavily_api_key.is_some());
     status.insert("voyage".to_string(), cfg.voyage_api_key.is_some());
-    status.insert(
-        "mistral_transcription".to_string(),
-        cfg.mistral_transcription_api_key.is_some(),
-    );
     status
 }
 
@@ -262,11 +258,6 @@ pub async fn get_credentials_status(
         "voyage".to_string(),
         cfg.voyage_api_key.is_some() || env_creds.voyage_api_key.is_some(),
     );
-    status.insert(
-        "mistral_transcription".to_string(),
-        cfg.mistral_transcription_api_key.is_some()
-            || env_creds.mistral_transcription_api_key.is_some(),
-    );
     Ok(status)
 }
 
@@ -374,7 +365,6 @@ mod tests {
         cfg.brave_api_key = None;
         cfg.tavily_api_key = None;
         cfg.voyage_api_key = None;
-        cfg.mistral_transcription_api_key = None;
         let status = build_credential_status(&cfg);
         assert_eq!(status["openai"], false);
         assert_eq!(status["anthropic"], false);
@@ -385,7 +375,6 @@ mod tests {
         assert_eq!(status["brave"], false);
         assert_eq!(status["tavily"], false);
         assert_eq!(status["voyage"], false);
-        assert_eq!(status["mistral_transcription"], false);
     }
 
     #[test]
@@ -438,7 +427,6 @@ mod tests {
         cfg.brave_api_key = Some("k8".to_string());
         cfg.tavily_api_key = Some("k9".to_string());
         cfg.voyage_api_key = Some("k10".to_string());
-        cfg.mistral_transcription_api_key = Some("k11".to_string());
         let status = build_credential_status(&cfg);
         for (provider, has_key) in &status {
             assert!(has_key, "{} should be true when key is set", provider);
@@ -446,13 +434,13 @@ mod tests {
     }
 
     #[test]
-    fn test_cred_status_has_twelve_entries() {
+    fn test_cred_status_has_eleven_entries() {
         let cfg = op_core::config::AgentConfig::from_env("/nonexistent");
         let status = build_credential_status(&cfg);
         assert_eq!(
             status.len(),
-            12,
-            "should have 12 entries (6 providers + 6 services)"
+            11,
+            "should have 11 entries (6 providers + 5 services)"
         );
     }
 }
diff --git a/openplanter-desktop/crates/op-tauri/src/state.rs b/openplanter-desktop/crates/op-tauri/src/state.rs
index 1c240b39..c6380fb4 100644
--- a/openplanter-desktop/crates/op-tauri/src/state.rs
+++ b/openplanter-desktop/crates/op-tauri/src/state.rs
@@ -105,9 +105,7 @@ fn apply_repo_root_guardrail(
                 GuardrailAction::RedirectedToWorkspace,
             ));
         }
-        return Err(StartupWorkspaceError::RepoRootDisallowed {
-            repo_root: candidate,
-        });
+        return Err(StartupWorkspaceError::RepoRootDisallowed { repo_root: candidate });
     }
 
     Ok((candidate, GuardrailAction::None))
@@ -643,10 +641,7 @@ mod tests {
 
         assert_eq!(resolved.source, WorkspaceSource::GitRoot);
         assert_eq!(resolved.path, canonicalize_or_self(&workspace));
-        assert_eq!(
-            resolved.invalid_override,
-            Some(invalid.display().to_string())
-        );
+        assert_eq!(resolved.invalid_override, Some(invalid.display().to_string()));
     }
 
     #[test]
@@ -664,10 +659,7 @@ mod tests {
 
         assert_eq!(resolved.source, WorkspaceSource::GitRoot);
         assert_eq!(resolved.path, canonicalize_or_self(&workspace));
-        assert_eq!(
-            resolved.invalid_override,
-            Some(invalid.display().to_string())
-        );
+        assert_eq!(resolved.invalid_override, Some(invalid.display().to_string()));
     }
 
     #[test]
diff --git a/openplanter-desktop/frontend/src/api/invoke.test.ts b/openplanter-desktop/frontend/src/api/invoke.test.ts
index 0c1b27f7..69797e64 100644
--- a/openplanter-desktop/frontend/src/api/invoke.test.ts
+++ b/openplanter-desktop/frontend/src/api/invoke.test.ts
@@ -133,7 +133,6 @@ describe("invoke wrappers", () => {
       brave: false,
       tavily: true,
       voyage: true,
-      mistral_transcription: true,
     }));
     const status = await getCredentialsStatus();
     expect(status.openai).toBe(true);
@@ -143,7 +142,6 @@ describe("invoke wrappers", () => {
     expect(status.brave).toBe(false);
     expect(status.tavily).toBe(true);
     expect(status.voyage).toBe(true);
-    expect(status.mistral_transcription).toBe(true);
   });
 
   it("listSessions sends limit", async () => {
diff --git a/openplanter-desktop/frontend/src/commands/model.test.ts b/openplanter-desktop/frontend/src/commands/model.test.ts
index 72410132..f98dfb86 100644
--- a/openplanter-desktop/frontend/src/commands/model.test.ts
+++ b/openplanter-desktop/frontend/src/commands/model.test.ts
@@ -32,11 +32,6 @@ describe("inferProvider", () => {
     expect(inferProvider("llama3.2")).toBe("ollama");
   });
 
-  it("mistral chat models stay ollama while voxtral stays tool-only", () => {
-    expect(inferProvider("mistral")).toBe("ollama");
-    expect(inferProvider("voxtral-mini-latest")).toBeNull();
-  });
-
   it("qwen-3 returns cerebras", () => {
     expect(inferProvider("qwen-3-235b-a22b-instruct-2507")).toBe("cerebras");
   });
diff --git a/openplanter-desktop/frontend/src/components/App.test.ts b/openplanter-desktop/frontend/src/components/App.test.ts
index 7838f044..19d87533 100644
--- a/openplanter-desktop/frontend/src/components/App.test.ts
+++ b/openplanter-desktop/frontend/src/components/App.test.ts
@@ -58,7 +58,7 @@ describe("createApp", () => {
     __setHandler("list_sessions", () => [SESSION_B, SESSION_A]);
     __setHandler("get_credentials_status", () => ({
       openai: true, anthropic: true, openrouter: false,
-      cerebras: false, zai: true, ollama: true, exa: false, firecrawl: true, brave: false, tavily: true, voyage: true, mistral_transcription: true,
+      cerebras: false, zai: true, ollama: true, exa: false, firecrawl: true, brave: false, tavily: true, voyage: true,
     }));
     __setHandler("open_session", () => ({
       id: "20260227-120000-cccc3333",
@@ -113,7 +113,7 @@ describe("createApp", () => {
 
     await vi.waitFor(() => {
       const creds = root.querySelector(".cred-status");
-      expect(creds!.children.length).toBe(12);
+      expect(creds!.children.length).toBe(11);
       expect(creds!.querySelector(".cred-ok")!.textContent).toContain("openai");
       expect(creds!.querySelector(".cred-missing")!.textContent).toContain("openrouter");
     });
diff --git a/openplanter-desktop/frontend/src/components/App.ts b/openplanter-desktop/frontend/src/components/App.ts
index f8ddab4d..c31e9bb9 100644
--- a/openplanter-desktop/frontend/src/components/App.ts
+++ b/openplanter-desktop/frontend/src/components/App.ts
@@ -313,7 +313,7 @@ async function loadCredentials(container: HTMLElement): Promise<void> {
   try {
     const status = await getCredentialsStatus();
     container.innerHTML = "";
-    const providers = ["openai", "anthropic", "openrouter", "cerebras", "zai", "ollama", "exa", "firecrawl", "brave", "tavily", "voyage", "mistral_transcription"];
+    const providers = ["openai", "anthropic", "openrouter", "cerebras", "zai", "ollama", "exa", "firecrawl", "brave", "tavily", "voyage"];
     for (const p of providers) {
       const row = document.createElement("div");
       const hasKey = status[p] ?? false;
diff --git a/tests/test_audio_transcribe.py b/tests/test_audio_transcribe.py
deleted file mode 100644
index be70f572..00000000
--- a/tests/test_audio_transcribe.py
+++ /dev/null
@@ -1,391 +0,0 @@
-from __future__ import annotations
-
-import json
-from pathlib import Path
-
-import pytest
-
-from agent.tool_defs import TOOL_DEFINITIONS
-from agent.tools import ToolError, WorkspaceTools
-
-
-def _write_audio(path: Path, payload: bytes = b"RIFF\x00\x00\x00\x00WAVEfmt ") -> None:
-    path.write_bytes(payload)
-
-
-def _make_tools(tmp_path: Path, **overrides: object) -> WorkspaceTools:
-    defaults: dict[str, object] = {
-        "root": tmp_path,
-        "mistral_transcription_api_key": "mistral-key",
-        "max_file_chars": 20_000,
-        "max_observation_chars": 20_000,
-    }
-    defaults.update(overrides)
-    return WorkspaceTools(**defaults)
-
-
-class TestAudioTranscribeTool:
-    def test_audio_transcribe_success_returns_wrapped_response(self, tmp_path: Path) -> None:
-        audio = tmp_path / "clip.wav"
-        _write_audio(audio)
-        tools = _make_tools(tmp_path)
-        mocked = {
-            "text": "hello world",
-            "chunks": [{"text": "hello world", "timestamps": [0.0, 1.0]}],
-        }
-
-        with pytest.MonkeyPatch.context() as mp:
-            mp.setattr(
-                tools,
-                "_mistral_transcription_request",
-                lambda **_: mocked,
-            )
-            raw = tools.audio_transcribe(
-                "clip.wav",
-                diarize=True,
-                timestamp_granularities=["segment"],
-                context_bias=["OpenPlanter", "Mistral"],
-                model="voxtral-mini-latest",
-                temperature=0.2,
-            )
-
-        parsed = json.loads(raw)
-        assert parsed["provider"] == "mistral"
-        assert parsed["path"] == "clip.wav"
-        assert parsed["text"] == "hello world"
-        assert parsed["options"]["diarize"] is True
-        assert parsed["options"]["timestamp_granularities"] == ["segment"]
-        assert parsed["options"]["context_bias"] == ["OpenPlanter", "Mistral"]
-        assert parsed["response"]["chunks"][0]["text"] == "hello world"
-
-    def test_audio_transcribe_requires_key(self, tmp_path: Path) -> None:
-        audio = tmp_path / "clip.wav"
-        _write_audio(audio)
-        tools = WorkspaceTools(root=tmp_path)
-        out = tools.audio_transcribe("clip.wav")
-        assert "Mistral transcription API key not configured" in out
-
-    def test_audio_transcribe_rejects_language_with_timestamps(self, tmp_path: Path) -> None:
-        audio = tmp_path / "clip.wav"
-        _write_audio(audio)
-        tools = _make_tools(tmp_path)
-        out = tools.audio_transcribe(
-            "clip.wav",
-            language="en",
-            timestamp_granularities=["word"],
-        )
-        assert "cannot be combined" in out
-
-    def test_audio_transcribe_rejects_non_audio_extension(self, tmp_path: Path) -> None:
-        note = tmp_path / "notes.txt"
-        note.write_text("hello", encoding="utf-8")
-        tools = _make_tools(tmp_path)
-        out = tools.audio_transcribe("notes.txt")
-        assert "Unsupported audio format" in out
-
-    def test_audio_transcribe_path_escape_blocked(self, tmp_path: Path) -> None:
-        tools = _make_tools(tmp_path)
-        with pytest.raises(ToolError, match="escapes workspace"):
-            tools.audio_transcribe("../../etc/passwd.wav")
-
-    def test_audio_transcribe_auto_chunks_oversize_files(self, tmp_path: Path) -> None:
-        audio = tmp_path / "clip.wav"
-        _write_audio(audio, payload=b"x" * 512)
-        tools = _make_tools(
-            tmp_path,
-            mistral_transcription_max_bytes=64,
-        )
-
-        with pytest.MonkeyPatch.context() as mp:
-            mp.setattr(tools, "_ensure_media_tools", lambda: None)
-            mp.setattr(tools, "_probe_media_duration", lambda _: 58.0)
-
-            def fake_extract(
-                source: Path,
-                output: Path,
-                *,
-                start_sec: float,
-                duration_sec: float,
-            ) -> None:
-                output.write_bytes(b"chunk")
-
-            responses = iter(
-                [
-                    {
-                        "text": "hello there general kenobi from tatooine",
-                        "segments": [
-                            {
-                                "text": "hello there general kenobi from tatooine",
-                                "start": 0.0,
-                                "end": 4.0,
-                                "speaker": "speaker_a",
-                            }
-                        ],
-                    },
-                    {
-                        "text": "there general kenobi from tatooine today",
-                        "segments": [
-                            {
-                                "text": "there general kenobi from tatooine today",
-                                "start": 0.0,
-                                "end": 4.0,
-                                "speaker": "speaker_a",
-                            }
-                        ],
-                    },
-                ]
-            )
-            mp.setattr(tools, "_extract_audio_chunk", fake_extract)
-            mp.setattr(
-                tools,
-                "_mistral_transcription_request",
-                lambda **_: next(responses),
-            )
-
-            raw = tools.audio_transcribe(
-                "clip.wav",
-                diarize=True,
-                chunk_max_seconds=30,
-                chunk_overlap_seconds=2,
-            )
-
-        parsed = json.loads(raw)
-        assert parsed["mode"] == "chunked"
-        assert parsed["text"] == "hello there general kenobi from tatooine today"
-        assert parsed["chunking"]["total_chunks"] == 2
-        assert parsed["response"]["segments"][0]["speaker"] == "c0_speaker_a"
-        assert parsed["response"]["segments"][1]["speaker"] == "c1_speaker_a"
-        assert parsed["response"]["segments"][1]["start"] == 30.0
-        assert parsed["response"]["segments"][1]["end"] == 32.0
-
-    def test_audio_transcribe_off_keeps_oversize_rejection(self, tmp_path: Path) -> None:
-        audio = tmp_path / "clip.wav"
-        _write_audio(audio, payload=b"x" * 512)
-        tools = _make_tools(
-            tmp_path,
-            mistral_transcription_max_bytes=64,
-        )
-        out = tools.audio_transcribe("clip.wav", chunking="off")
-        assert "Audio file too large" in out
-
-    def test_audio_transcribe_force_chunks_even_when_under_limit(self, tmp_path: Path) -> None:
-        audio = tmp_path / "clip.wav"
-        _write_audio(audio, payload=b"x" * 32)
-        tools = _make_tools(tmp_path)
-
-        with pytest.MonkeyPatch.context() as mp:
-            mp.setattr(tools, "_ensure_media_tools", lambda: None)
-            mp.setattr(tools, "_probe_media_duration", lambda _: 58.0)
-            mp.setattr(
-                tools,
-                "_extract_audio_chunk",
-                lambda *args, **kwargs: kwargs["output"].write_bytes(b"chunk"),
-                raising=False,
-            )
-            responses = iter(
-                [
-                    {"text": "one two three four five"},
-                    {"text": "three four five six"},
-                ]
-            )
-
-            def fake_chunk(
-                source: Path,
-                output: Path,
-                *,
-                start_sec: float,
-                duration_sec: float,
-            ) -> None:
-                output.write_bytes(b"chunk")
-
-            mp.setattr(tools, "_extract_audio_chunk", fake_chunk)
-            mp.setattr(
-                tools,
-                "_mistral_transcription_request",
-                lambda **_: next(responses),
-            )
-            raw = tools.audio_transcribe(
-                "clip.wav",
-                chunking="force",
-                chunk_max_seconds=30,
-                chunk_overlap_seconds=2,
-            )
-
-        parsed = json.loads(raw)
-        assert parsed["mode"] == "chunked"
-        assert parsed["options"]["chunking"] == "force"
-
-    def test_audio_transcribe_reports_missing_media_tools(self, tmp_path: Path) -> None:
-        audio = tmp_path / "clip.wav"
-        _write_audio(audio, payload=b"x" * 512)
-        tools = _make_tools(
-            tmp_path,
-            mistral_transcription_max_bytes=64,
-        )
-        with pytest.MonkeyPatch.context() as mp:
-            mp.setattr(
-                tools,
-                "_ensure_media_tools",
-                lambda: (_ for _ in ()).throw(
-                    ToolError(
-                        "Long-form transcription requires ffmpeg, ffprobe. Install ffmpeg/ffprobe and retry."
-                    )
-                ),
-            )
-            out = tools.audio_transcribe("clip.wav")
-        assert "ffmpeg" in out and "ffprobe" in out
-
-    def test_audio_transcribe_extracts_video_before_upload(self, tmp_path: Path) -> None:
-        video = tmp_path / "clip.mp4"
-        video.write_bytes(b"video")
-        tools = _make_tools(tmp_path)
-        extracted: dict[str, str] = {}
-
-        with pytest.MonkeyPatch.context() as mp:
-            mp.setattr(tools, "_ensure_media_tools", lambda: None)
-
-            def fake_extract(source: Path, output: Path) -> None:
-                extracted["source"] = source.name
-                output.write_bytes(b"wav")
-
-            def fake_request(*, resolved: Path, **_: object) -> dict[str, object]:
-                extracted["uploaded_suffix"] = resolved.suffix
-                return {"text": "video transcript"}
-
-            mp.setattr(tools, "_extract_audio_source", fake_extract)
-            mp.setattr(tools, "_mistral_transcription_request", fake_request)
-            raw = tools.audio_transcribe("clip.mp4", chunking="off")
-
-        parsed = json.loads(raw)
-        assert extracted["source"] == "clip.mp4"
-        assert extracted["uploaded_suffix"] == ".wav"
-        assert parsed["text"] == "video transcript"
-
-    def test_audio_transcribe_fail_fast_on_chunk_error(self, tmp_path: Path) -> None:
-        audio = tmp_path / "clip.wav"
-        _write_audio(audio, payload=b"x" * 512)
-        tools = _make_tools(
-            tmp_path,
-            mistral_transcription_max_bytes=64,
-        )
-
-        with pytest.MonkeyPatch.context() as mp:
-            mp.setattr(tools, "_ensure_media_tools", lambda: None)
-            mp.setattr(tools, "_probe_media_duration", lambda _: 58.0)
-
-            def fake_extract(
-                source: Path,
-                output: Path,
-                *,
-                start_sec: float,
-                duration_sec: float,
-            ) -> None:
-                output.write_bytes(b"chunk")
-
-            calls = {"count": 0}
-
-            def fake_request(**_: object) -> dict[str, object]:
-                calls["count"] += 1
-                if calls["count"] == 2:
-                    raise ToolError("boom")
-                return {"text": "alpha beta gamma delta epsilon"}
-
-            mp.setattr(tools, "_extract_audio_chunk", fake_extract)
-            mp.setattr(tools, "_mistral_transcription_request", fake_request)
-            out = tools.audio_transcribe(
-                "clip.wav",
-                chunk_max_seconds=30,
-                chunk_overlap_seconds=2,
-            )
-
-        assert "audio_transcribe failed in chunk 1" in out
-
-    def test_audio_transcribe_can_return_partial_chunked_output(self, tmp_path: Path) -> None:
-        audio = tmp_path / "clip.wav"
-        _write_audio(audio, payload=b"x" * 512)
-        tools = _make_tools(
-            tmp_path,
-            mistral_transcription_max_bytes=64,
-        )
-
-        with pytest.MonkeyPatch.context() as mp:
-            mp.setattr(tools, "_ensure_media_tools", lambda: None)
-            mp.setattr(tools, "_probe_media_duration", lambda _: 86.0)
-
-            def fake_extract(
-                source: Path,
-                output: Path,
-                *,
-                start_sec: float,
-                duration_sec: float,
-            ) -> None:
-                output.write_bytes(b"chunk")
-
-            calls = {"count": 0}
-
-            def fake_request(**_: object) -> dict[str, object]:
-                calls["count"] += 1
-                if calls["count"] == 2:
-                    raise ToolError("boom")
-                return {"text": f"chunk {calls['count']} transcript words words words"}
-
-            mp.setattr(tools, "_extract_audio_chunk", fake_extract)
-            mp.setattr(tools, "_mistral_transcription_request", fake_request)
-            raw = tools.audio_transcribe(
-                "clip.wav",
-                chunk_max_seconds=30,
-                chunk_overlap_seconds=1,
-                continue_on_chunk_error=True,
-            )
-
-        parsed = json.loads(raw)
-        assert parsed["chunking"]["partial"] is True
-        assert parsed["chunking"]["failed_chunks"] == 1
-        assert parsed["warnings"][0].startswith("chunk 1 failed")
-
-    def test_audio_transcribe_structured_truncation_keeps_valid_json(
-        self,
-        tmp_path: Path,
-    ) -> None:
-        audio = tmp_path / "clip.wav"
-        _write_audio(audio)
-        tools = _make_tools(
-            tmp_path,
-            max_file_chars=400,
-            max_observation_chars=400,
-        )
-        mocked = {
-            "text": "word " * 200,
-            "segments": [
-                {"text": "segment", "start": 0.0, "end": 1.0, "speaker": "speaker_a"}
-                for _ in range(30)
-            ],
-            "words": [
-                {"text": "word", "start": 0.0, "end": 0.1, "speaker": "speaker_a"}
-                for _ in range(60)
-            ],
-        }
-
-        with pytest.MonkeyPatch.context() as mp:
-            mp.setattr(tools, "_mistral_transcription_request", lambda **_: mocked)
-            raw = tools.audio_transcribe("clip.wav")
-
-        parsed = json.loads(raw)
-        assert parsed["truncation"]["applied"] is True
-        assert "text_truncated_chars" in parsed["truncation"]
-
-
-class TestAudioTranscribeToolDef:
-    def test_audio_transcribe_in_tool_definitions(self) -> None:
-        names = [d["name"] for d in TOOL_DEFINITIONS]
-        assert "audio_transcribe" in names
-
-    def test_audio_transcribe_definition_schema(self) -> None:
-        defn = next(d for d in TOOL_DEFINITIONS if d["name"] == "audio_transcribe")
-        assert defn["parameters"]["required"] == ["path"]
-        props = defn["parameters"]["properties"]
-        assert "context_bias" in props
-        assert props["context_bias"]["type"] == "array"
-        assert props["chunking"]["enum"] == ["auto", "off", "force"]
-        assert props["chunk_max_seconds"]["type"] == "integer"
-        assert props["continue_on_chunk_error"]["type"] == "boolean"
diff --git a/tests/test_credentials.py b/tests/test_credentials.py
index f891dad0..5df64705 100644
--- a/tests/test_credentials.py
+++ b/tests/test_credentials.py
@@ -28,7 +28,6 @@ def test_parse_env_file_extracts_supported_keys(self) -> None:
                         "FIRECRAWL_API_KEY=fc-key",
                         "BRAVE_API_KEY=brave-key",
                         "OPENPLANTER_TAVILY_API_KEY=tavily-key",
-                        "MISTRAL_API_KEY=mistral-key",
                     ]
                 ),
                 encoding="utf-8",
@@ -42,7 +41,6 @@ def test_parse_env_file_extracts_supported_keys(self) -> None:
             self.assertEqual(creds.firecrawl_api_key, "fc-key")
             self.assertEqual(creds.brave_api_key, "brave-key")
             self.assertEqual(creds.tavily_api_key, "tavily-key")
-            self.assertEqual(creds.mistral_transcription_api_key, "mistral-key")
 
     def test_parse_env_assignments_preserves_generic_workspace_keys(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
@@ -73,7 +71,6 @@ def test_store_roundtrip(self) -> None:
                 firecrawl_api_key="fc",
                 brave_api_key="brave",
                 tavily_api_key="tavily",
-                mistral_transcription_api_key="mistral",
             )
             store.save(creds)
             loaded = store.load()
diff --git a/tests/test_settings.py b/tests/test_settings.py
index 30366442..d39c08ea 100644
--- a/tests/test_settings.py
+++ b/tests/test_settings.py
@@ -4,9 +4,7 @@
 import unittest
 from pathlib import Path
 
-from agent.__main__ import _resolve_provider
 from agent.builder import _validate_model_provider, infer_provider_for_model
-from agent.credentials import CredentialBundle
 from agent.model import ModelError
 from agent.settings import PersistentSettings, SettingsStore, normalize_reasoning_effort
 from agent.tui import SLASH_COMMANDS, _compute_suggestions
@@ -242,11 +240,5 @@ def test_unknown_model_passes(self) -> None:
         _validate_model_provider("some-random-model", "anthropic")
 
 
-class ResolveProviderTests(unittest.TestCase):
-    def test_mistral_transcription_key_does_not_change_chat_provider(self) -> None:
-        creds = CredentialBundle(mistral_transcription_api_key="mistral-test")
-        self.assertEqual(_resolve_provider("auto", creds), "anthropic")
-
-
 if __name__ == "__main__":
     unittest.main()
diff --git a/tests/test_tool_defs.py b/tests/test_tool_defs.py
index a985725b..5efccd53 100644
--- a/tests/test_tool_defs.py
+++ b/tests/test_tool_defs.py
@@ -30,7 +30,7 @@ def test_tool_count(self) -> None:
         self.assertEqual(len(names), len(TOOL_DEFINITIONS))
         expected = {
             "list_files", "search_files", "repo_map", "web_search", "fetch_url",
-            "read_file", "read_image", "audio_transcribe", "write_file", "apply_patch", "edit_file",
+            "read_file", "read_image", "write_file", "apply_patch", "edit_file",
             "hashline_edit",
             "run_shell", "run_shell_bg", "check_shell_bg", "kill_shell_bg",
             "think", "subtask", "execute",

From 22dccc6de5bb67af03b4064a98679b92c566c3b4 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 15:46:19 -0400
Subject: [PATCH 50/58] Revert "Enforce workspace startup guardrails"

This reverts commit 32d657617c333ef0c121011129117720cca47bd2.
---
 README.md                                     |  26 +-
 agent/__main__.py                             |  28 +-
 agent/credentials.py                          |  29 ++-
 agent/workspace_resolution.py                 | 135 ----------
 .../crates/op-core/src/credentials.rs         |  42 +--
 .../crates/op-tauri/src/main.rs               |   8 +-
 .../crates/op-tauri/src/state.rs              | 246 +++---------------
 tests/test_credentials.py                     |  32 +--
 tests/test_workspace_resolution.py            | 155 -----------
 9 files changed, 59 insertions(+), 642 deletions(-)
 delete mode 100644 agent/workspace_resolution.py
 delete mode 100644 tests/test_workspace_resolution.py

diff --git a/README.md b/README.md
index a710b1a7..9775c447 100644
--- a/README.md
+++ b/README.md
@@ -63,11 +63,8 @@ pip install -e .
 # Configure API keys (interactive prompt)
 openplanter-agent --configure-keys
 
-# In this repo, point OpenPlanter at the live workspace from the repo-root .env
-echo 'OPENPLANTER_WORKSPACE=workspace' >> .env
-
 # Launch the TUI
-openplanter-agent
+openplanter-agent --workspace /path/to/your/project
 ```
 
 Or run a single task headlessly:
@@ -182,28 +179,11 @@ openplanter-agent [options]
 
 | Flag | Description |
 |------|-------------|
-| `--workspace DIR` | Explicit non-root workspace override. Repo root is rejected. |
+| `--workspace DIR` | Workspace root (default: `.`) |
 | `--session-id ID` | Use a specific session ID |
 | `--resume` | Resume the latest (or specified) session |
 | `--list-sessions` | List saved sessions and exit |
 
-### Startup Workspace Resolution
-
-Startup resolves the runtime workspace in this order:
-
-1. Explicit CLI `--workspace` for the Python agent, if provided
-2. Process env `OPENPLANTER_WORKSPACE`
-3. `OPENPLANTER_WORKSPACE` from the nearest ancestor `.env`
-4. Entry-point fallback, followed by repo-root guardrails
-
-Both the CLI and the desktop app refuse to operate directly in repo root. If startup would land on repo root and `<repo>/workspace` exists, OpenPlanter redirects there. Otherwise it exits with an actionable error.
-
-For this repository, the intended local setup is:
-
-```dotenv
-OPENPLANTER_WORKSPACE=workspace
-```
-
 ### Model Selection
 
 | Flag | Description |
@@ -243,7 +223,7 @@ Keys are resolved in this priority order (highest wins):
 
 1. CLI flags (`--openai-api-key`, etc.)
 2. Environment variables (`OPENAI_API_KEY` or `OPENPLANTER_OPENAI_API_KEY`)
-3. Nearest ancestor `.env` discovered from the resolved workspace path
+3. `.env` file in the workspace
 4. Workspace credential store (`.openplanter/credentials.json`)
 5. User credential store (`~/.openplanter/credentials.json`)
 
diff --git a/agent/__main__.py b/agent/__main__.py
index 33f8d8f1..7adc0dd6 100644
--- a/agent/__main__.py
+++ b/agent/__main__.py
@@ -4,7 +4,6 @@
 import os
 import sys
 from datetime import datetime, timezone
-from pathlib import Path
 
 from .builder import _fetch_models_for_provider, build_engine, infer_provider_for_model
 from .config import (
@@ -27,7 +26,6 @@
 from .runtime import SessionError, SessionRuntime, SessionStore
 from .settings import PersistentSettings, SettingsStore, normalize_reasoning_effort
 from .tui import ChatContext, _clip_event, _get_model_display_name, dispatch_slash_command, run_rich_repl
-from .workspace_resolution import WorkspaceResolutionError, resolve_startup_workspace
 
 VALID_REASONING_FLAGS = ["low", "medium", "high", "none"]
 
@@ -549,15 +547,9 @@ def _has_non_interactive_command(args: argparse.Namespace) -> bool:
     return False
 
 
-def _workspace_flag_explicit(argv: list[str]) -> bool:
-    return any(token == "--workspace" or token.startswith("--workspace=") for token in argv)
-
-
 def main() -> None:
-    argv = sys.argv[1:]
     parser = build_parser()
-    args = parser.parse_args(argv)
-    workspace_flag_explicit = _workspace_flag_explicit(argv)
+    args = parser.parse_args()
 
     if args.resume and args.session_id is None and args.session_id_positional:
         args.session_id = args.session_id_positional
@@ -568,20 +560,7 @@ def main() -> None:
     if (args.headless or non_tty) and not args.textual:
         args.no_tui = True
 
-    try:
-        workspace_resolution = resolve_startup_workspace(
-            cli_workspace=args.workspace,
-            cli_workspace_explicit=workspace_flag_explicit,
-            cwd=Path.cwd(),
-        )
-    except WorkspaceResolutionError as exc:
-        print(f"Workspace error: {exc}")
-        raise SystemExit(2)
-
-    for warning in workspace_resolution.warnings:
-        print(f"[workspace] {warning}")
-
-    cfg = AgentConfig.from_env(workspace_resolution.workspace)
+    cfg = AgentConfig.from_env(args.workspace)
     settings_store = SettingsStore(workspace=cfg.workspace, session_root_dir=cfg.session_root_dir)
     settings = _apply_persistent_settings(cfg, args, settings_store)
 
@@ -683,9 +662,6 @@ def main() -> None:
         startup_info["Reasoning"] = cfg.reasoning_effort
     startup_info["Mode"] = "recursive" if cfg.recursive else "flat"
     startup_info["Workspace"] = str(cfg.workspace)
-    startup_info["WorkspaceSource"] = workspace_resolution.source
-    if workspace_resolution.guardrail_action != "none":
-        startup_info["WorkspaceGuardrail"] = workspace_resolution.guardrail_action
     startup_info["Session"] = runtime.session_id
 
     ctx = ChatContext(runtime=runtime, cfg=cfg, settings_store=settings_store)
diff --git a/agent/credentials.py b/agent/credentials.py
index e1a25c03..4e46c2e7 100644
--- a/agent/credentials.py
+++ b/agent/credentials.py
@@ -107,13 +107,13 @@ def _strip_quotes(value: str) -> str:
     return value
 
 
-def parse_env_assignments(path: Path) -> dict[str, str]:
+def parse_env_file(path: Path) -> CredentialBundle:
     if not path.exists() or not path.is_file():
-        return {}
+        return CredentialBundle()
     try:
         lines = path.read_text(encoding="utf-8", errors="replace").splitlines()
     except OSError:
-        return {}
+        return CredentialBundle()
 
     env: dict[str, str] = {}
     for raw in lines:
@@ -128,11 +128,7 @@ def parse_env_assignments(path: Path) -> dict[str, str]:
         key = key.strip()
         value = _strip_quotes(value.strip())
         env[key] = value
-    return env
-
 
-def parse_env_file(path: Path) -> CredentialBundle:
-    env = parse_env_assignments(path)
     return CredentialBundle(
         openai_api_key=(env.get("OPENAI_API_KEY") or env.get("OPENPLANTER_OPENAI_API_KEY") or "").strip() or None,
         anthropic_api_key=(env.get("ANTHROPIC_API_KEY") or env.get("OPENPLANTER_ANTHROPIC_API_KEY") or "").strip()
@@ -188,13 +184,18 @@ def credentials_from_env() -> CredentialBundle:
 
 def discover_env_candidates(workspace: Path) -> list[Path]:
     ws = workspace.expanduser().resolve()
-    current: Path | None = ws
-    while current is not None:
-        env_path = current / ".env"
-        if env_path.exists():
-            return [env_path]
-        current = current.parent if current.parent != current else None
-    return []
+    candidates: list[Path] = [
+        ws / ".env",
+    ]
+    seen: set[str] = set()
+    unique: list[Path] = []
+    for path in candidates:
+        key = str(path.resolve()) if path.exists() else str(path)
+        if key in seen:
+            continue
+        seen.add(key)
+        unique.append(path)
+    return unique
 
 
 @dataclass(slots=True)
diff --git a/agent/workspace_resolution.py b/agent/workspace_resolution.py
deleted file mode 100644
index 772efab3..00000000
--- a/agent/workspace_resolution.py
+++ /dev/null
@@ -1,135 +0,0 @@
-from __future__ import annotations
-
-import os
-from dataclasses import dataclass, field
-from pathlib import Path
-from typing import Literal
-
-from .credentials import discover_env_candidates, parse_env_assignments
-
-WORKSPACE_ENV_KEY = "OPENPLANTER_WORKSPACE"
-
-WorkspaceSource = Literal["cli_arg", "env", "dotenv", "cwd"]
-GuardrailAction = Literal["none", "redirected_to_workspace"]
-
-
-class WorkspaceResolutionError(RuntimeError):
-    """Raised when startup would use an unsafe workspace path."""
-
-
-@dataclass(slots=True)
-class WorkspaceResolution:
-    workspace: Path
-    source: WorkspaceSource
-    env_path: Path | None = None
-    invalid_env_override: str | None = None
-    invalid_dotenv_value: str | None = None
-    guardrail_action: GuardrailAction = "none"
-    warnings: list[str] = field(default_factory=list)
-
-
-def resolve_startup_workspace(
-    cli_workspace: str,
-    cli_workspace_explicit: bool,
-    cwd: Path,
-) -> WorkspaceResolution:
-    cwd = _normalize_path(cwd)
-    warnings: list[str] = []
-    invalid_env_override: str | None = None
-    invalid_dotenv_value: str | None = None
-
-    if cli_workspace_explicit:
-        candidate = _resolve_candidate(cli_workspace, cwd)
-        if candidate.exists() and not candidate.is_dir():
-            raise WorkspaceResolutionError(
-                f"Refusing to use a file as the workspace: {candidate}. "
-                "Pass --workspace to a directory path instead."
-            )
-        workspace, guardrail_action = _apply_repo_root_guardrail(candidate, allow_redirect=False)
-        return WorkspaceResolution(
-            workspace=workspace,
-            source="cli_arg",
-            guardrail_action=guardrail_action,
-        )
-
-    env_override = (os.getenv(WORKSPACE_ENV_KEY) or "").strip()
-    if env_override:
-        candidate = _resolve_candidate(env_override, cwd)
-        if candidate.is_dir():
-            workspace, guardrail_action = _apply_repo_root_guardrail(candidate, allow_redirect=True)
-            return WorkspaceResolution(
-                workspace=workspace,
-                source="env",
-                guardrail_action=guardrail_action,
-            )
-        invalid_env_override = env_override
-        warnings.append(
-            f"Ignoring {WORKSPACE_ENV_KEY} from process environment because it does not resolve to an existing directory: {env_override}"
-        )
-
-    env_path = next(iter(discover_env_candidates(cwd)), None)
-    if env_path is not None:
-        raw_value = (parse_env_assignments(env_path).get(WORKSPACE_ENV_KEY) or "").strip()
-        if raw_value:
-            candidate = _resolve_candidate(raw_value, env_path.parent)
-            if candidate.is_dir():
-                workspace, guardrail_action = _apply_repo_root_guardrail(candidate, allow_redirect=True)
-                return WorkspaceResolution(
-                    workspace=workspace,
-                    source="dotenv",
-                    env_path=env_path,
-                    invalid_env_override=invalid_env_override,
-                    guardrail_action=guardrail_action,
-                    warnings=warnings,
-                )
-            invalid_dotenv_value = raw_value
-            warnings.append(
-                f"Ignoring {WORKSPACE_ENV_KEY} from {env_path} because it does not resolve to an existing directory: {raw_value}"
-            )
-
-    workspace, guardrail_action = _apply_repo_root_guardrail(cwd, allow_redirect=True)
-    return WorkspaceResolution(
-        workspace=workspace,
-        source="cwd",
-        env_path=env_path,
-        invalid_env_override=invalid_env_override,
-        invalid_dotenv_value=invalid_dotenv_value,
-        guardrail_action=guardrail_action,
-        warnings=warnings,
-    )
-
-
-def _resolve_candidate(raw_value: str, base_dir: Path) -> Path:
-    candidate = Path(raw_value).expanduser()
-    if not candidate.is_absolute():
-        candidate = base_dir / candidate
-    return _normalize_path(candidate)
-
-
-def _normalize_path(path: Path) -> Path:
-    return Path(os.path.realpath(os.fspath(path.expanduser())))
-
-
-def _find_repo_root(start: Path) -> Path | None:
-    current = _normalize_path(start)
-    while True:
-        if current.joinpath(".git").exists():
-            return current
-        parent = current.parent
-        if parent == current:
-            return None
-        current = parent
-
-
-def _apply_repo_root_guardrail(candidate: Path, allow_redirect: bool) -> tuple[Path, GuardrailAction]:
-    candidate = _normalize_path(candidate)
-    repo_root = _find_repo_root(candidate)
-    if repo_root is not None and repo_root == candidate:
-        workspace_dir = repo_root / "workspace"
-        if allow_redirect and workspace_dir.is_dir():
-            return (_normalize_path(workspace_dir), "redirected_to_workspace")
-        raise WorkspaceResolutionError(
-            f"Refusing to use repository root as the workspace: {repo_root}. "
-            f"Set {WORKSPACE_ENV_KEY} in the nearest .env or pass --workspace to a non-root directory."
-        )
-    return (candidate, "none")
diff --git a/openplanter-desktop/crates/op-core/src/credentials.rs b/openplanter-desktop/crates/op-core/src/credentials.rs
index 9c7d2768..0093b43e 100644
--- a/openplanter-desktop/crates/op-core/src/credentials.rs
+++ b/openplanter-desktop/crates/op-core/src/credentials.rs
@@ -123,10 +123,11 @@ fn strip_quotes(s: &str) -> &str {
     trimmed
 }
 
-pub fn parse_env_assignments(path: &Path) -> HashMap<String, String> {
+/// Parse a `.env` file and extract credential keys.
+pub fn parse_env_file(path: &Path) -> CredentialBundle {
     let content = match fs::read_to_string(path) {
         Ok(c) => c,
-        Err(_) => return HashMap::new(),
+        Err(_) => return CredentialBundle::default(),
     };
 
     let mut env_map: HashMap<String, String> = HashMap::new();
@@ -143,13 +144,6 @@ pub fn parse_env_assignments(path: &Path) -> HashMap<String, String> {
         }
     }
 
-    env_map
-}
-
-/// Parse a `.env` file and extract credential keys.
-pub fn parse_env_file(path: &Path) -> CredentialBundle {
-    let env_map = parse_env_assignments(path);
-
     fn get_key(map: &HashMap<String, String>, primary: &str, secondary: &str) -> Option<String> {
         map.get(primary)
             .or_else(|| map.get(secondary))
@@ -428,36 +422,6 @@ UNRELATED_VAR=foo
         assert!(bundle.cerebras_api_key.is_none());
     }
 
-    #[test]
-    fn test_parse_env_assignments_preserves_generic_workspace_keys() {
-        let dir = tempfile::tempdir().unwrap();
-        let env_path = dir.path().join(".env");
-        fs::write(
-            &env_path,
-            "OPENPLANTER_WORKSPACE=workspace\nOPENAI_API_KEY=sk-from-env\n",
-        )
-        .unwrap();
-
-        let env_map = parse_env_assignments(&env_path);
-        assert_eq!(
-            env_map.get("OPENPLANTER_WORKSPACE"),
-            Some(&"workspace".to_string())
-        );
-        assert_eq!(env_map.get("OPENAI_API_KEY"), Some(&"sk-from-env".to_string()));
-    }
-
-    #[test]
-    fn test_discover_env_candidates_returns_nearest_ancestor_env() {
-        let dir = tempfile::tempdir().unwrap();
-        let repo = dir.path().join("repo");
-        let nested = repo.join("workspace").join("deep");
-        fs::create_dir_all(&nested).unwrap();
-        fs::write(repo.join(".env"), "OPENPLANTER_WORKSPACE=workspace\n").unwrap();
-
-        let candidates = discover_env_candidates(&nested);
-        assert_eq!(candidates, vec![repo.join(".env").canonicalize().unwrap()]);
-    }
-
     #[test]
     fn test_credential_store_save_load() {
         let dir = tempfile::tempdir().unwrap();
diff --git a/openplanter-desktop/crates/op-tauri/src/main.rs b/openplanter-desktop/crates/op-tauri/src/main.rs
index f19df808..49cefe20 100644
--- a/openplanter-desktop/crates/op-tauri/src/main.rs
+++ b/openplanter-desktop/crates/op-tauri/src/main.rs
@@ -8,13 +8,7 @@ mod state;
 use state::AppState;
 
 fn main() {
-    let state = match AppState::try_new() {
-        Ok(state) => state,
-        Err(err) => {
-            eprintln!("[startup:error] {err}");
-            std::process::exit(2);
-        }
-    };
+    let state = AppState::new();
     eprintln!("[startup:info] {}", state.startup_trace());
 
     tauri::Builder::default()
diff --git a/openplanter-desktop/crates/op-tauri/src/state.rs b/openplanter-desktop/crates/op-tauri/src/state.rs
index c6380fb4..45e9cc95 100644
--- a/openplanter-desktop/crates/op-tauri/src/state.rs
+++ b/openplanter-desktop/crates/op-tauri/src/state.rs
@@ -1,15 +1,12 @@
 use op_core::config::AgentConfig;
 use op_core::config_hydration::{apply_settings_to_config, merge_credentials_into_config};
 use op_core::credentials::CredentialBundle;
-use op_core::credentials::{
-    credentials_from_env, discover_env_candidates, parse_env_assignments, parse_env_file,
-};
+use op_core::credentials::{credentials_from_env, discover_env_candidates, parse_env_file};
 #[cfg(test)]
 use op_core::settings::PersistentSettings;
 use op_core::settings::SettingsStore;
 use op_core::workspace_init;
 use std::env;
-use std::fmt;
 use std::fs;
 use std::path::{Path, PathBuf};
 use std::sync::Arc;
@@ -21,25 +18,15 @@ const WORKSPACE_ENV_KEY: &str = "OPENPLANTER_WORKSPACE";
 #[derive(Debug, Clone, PartialEq, Eq)]
 enum WorkspaceSource {
     EnvOverride,
-    DotEnv,
     GitRoot,
     CurrentDir,
 }
 
-#[derive(Debug, Clone, PartialEq, Eq)]
-enum GuardrailAction {
-    None,
-    RedirectedToWorkspace,
-}
-
 #[derive(Debug, Clone, PartialEq, Eq)]
 struct ResolvedWorkspace {
     path: PathBuf,
     source: WorkspaceSource,
-    dotenv_path: Option<PathBuf>,
     invalid_override: Option<String>,
-    invalid_dotenv_value: Option<String>,
-    guardrail_action: GuardrailAction,
 }
 
 #[derive(Debug, Clone, Default, PartialEq, Eq)]
@@ -50,24 +37,6 @@ struct LegacyMigrationReport {
     errors: Vec<String>,
 }
 
-#[derive(Debug, Clone, PartialEq, Eq)]
-pub enum StartupWorkspaceError {
-    RepoRootDisallowed { repo_root: PathBuf },
-}
-
-impl fmt::Display for StartupWorkspaceError {
-    fn fmt(&self, f: &mut fmt::Formatter<'_>) -> fmt::Result {
-        match self {
-            StartupWorkspaceError::RepoRootDisallowed { repo_root } => write!(
-                f,
-                "Refusing to use repository root as the workspace: {}. Set {} in the nearest .env or use a non-root workspace override.",
-                repo_root.display(),
-                WORKSPACE_ENV_KEY
-            ),
-        }
-    }
-}
-
 fn canonicalize_or_self(path: &Path) -> PathBuf {
     path.canonicalize().unwrap_or_else(|_| path.to_path_buf())
 }
@@ -83,108 +52,43 @@ fn find_git_root(start: &Path) -> Option<PathBuf> {
     None
 }
 
-fn resolve_candidate_path(raw_value: &str, base_dir: &Path) -> PathBuf {
-    let candidate = PathBuf::from(raw_value.trim());
-    let joined = if candidate.is_absolute() {
-        candidate
-    } else {
-        base_dir.join(candidate)
-    };
-    canonicalize_or_self(&joined)
-}
-
-fn apply_repo_root_guardrail(
-    candidate: &Path,
-) -> Result<(PathBuf, GuardrailAction), StartupWorkspaceError> {
-    let candidate = canonicalize_or_self(candidate);
-    if candidate.join(".git").exists() {
-        let workspace_dir = candidate.join("workspace");
-        if workspace_dir.is_dir() {
-            return Ok((
-                canonicalize_or_self(&workspace_dir),
-                GuardrailAction::RedirectedToWorkspace,
-            ));
-        }
-        return Err(StartupWorkspaceError::RepoRootDisallowed { repo_root: candidate });
-    }
-
-    Ok((candidate, GuardrailAction::None))
-}
-
 fn resolve_startup_workspace_from(
     current_dir: &Path,
     env_override: Option<&str>,
-) -> Result<ResolvedWorkspace, StartupWorkspaceError> {
-    let dotenv_path = discover_env_candidates(current_dir).into_iter().next();
+) -> ResolvedWorkspace {
     let mut invalid_override = None;
-    let mut invalid_dotenv_value = None;
 
     if let Some(raw_override) = env_override
         .map(str::trim)
         .filter(|value| !value.is_empty())
     {
-        let candidate = resolve_candidate_path(raw_override, current_dir);
-        if candidate.is_dir() {
-            let (path, guardrail_action) = apply_repo_root_guardrail(&candidate)?;
-            return Ok(ResolvedWorkspace {
-                path,
+        let candidate = PathBuf::from(raw_override);
+        if candidate.exists() {
+            return ResolvedWorkspace {
+                path: canonicalize_or_self(&candidate),
                 source: WorkspaceSource::EnvOverride,
-                dotenv_path: None,
                 invalid_override: None,
-                invalid_dotenv_value: None,
-                guardrail_action,
-            });
+            };
         }
         invalid_override = Some(raw_override.to_string());
     }
 
-    if let Some(path) = dotenv_path.as_ref() {
-        let env_map = parse_env_assignments(path);
-        if let Some(raw_value) = env_map
-            .get(WORKSPACE_ENV_KEY)
-            .map(|value| value.trim())
-            .filter(|value| !value.is_empty())
-        {
-            let candidate = resolve_candidate_path(raw_value, path.parent().unwrap_or(current_dir));
-            if candidate.is_dir() {
-                let (path, guardrail_action) = apply_repo_root_guardrail(&candidate)?;
-                return Ok(ResolvedWorkspace {
-                    path,
-                    source: WorkspaceSource::DotEnv,
-                    dotenv_path,
-                    invalid_override,
-                    invalid_dotenv_value: None,
-                    guardrail_action,
-                });
-            }
-            invalid_dotenv_value = Some(raw_value.to_string());
-        }
-    }
-
     if let Some(git_root) = find_git_root(current_dir) {
-        let (path, guardrail_action) = apply_repo_root_guardrail(&git_root)?;
-        return Ok(ResolvedWorkspace {
-            path,
+        return ResolvedWorkspace {
+            path: git_root,
             source: WorkspaceSource::GitRoot,
-            dotenv_path,
             invalid_override,
-            invalid_dotenv_value,
-            guardrail_action,
-        });
+        };
     }
 
-    let (path, guardrail_action) = apply_repo_root_guardrail(current_dir)?;
-    Ok(ResolvedWorkspace {
-        path,
+    ResolvedWorkspace {
+        path: canonicalize_or_self(current_dir),
         source: WorkspaceSource::CurrentDir,
-        dotenv_path,
         invalid_override,
-        invalid_dotenv_value,
-        guardrail_action,
-    })
+    }
 }
 
-fn resolve_desktop_workspace() -> Result<ResolvedWorkspace, StartupWorkspaceError> {
+fn resolve_desktop_workspace() -> ResolvedWorkspace {
     let current_dir = env::current_dir().unwrap_or_else(|_| PathBuf::from("."));
     let env_override = env::var(WORKSPACE_ENV_KEY).ok();
     resolve_startup_workspace_from(&current_dir, env_override.as_deref())
@@ -321,21 +225,10 @@ fn format_startup_trace(
 ) -> String {
     let source = match resolved.source {
         WorkspaceSource::EnvOverride => "env_override",
-        WorkspaceSource::DotEnv => "dotenv",
         WorkspaceSource::GitRoot => "git_root",
         WorkspaceSource::CurrentDir => "current_dir",
     };
-    let dotenv_path = resolved
-        .dotenv_path
-        .as_ref()
-        .map(|path| path.display().to_string())
-        .unwrap_or_else(|| "<none>".to_string());
     let invalid_override = resolved.invalid_override.as_deref().unwrap_or("<none>");
-    let invalid_dotenv_value = resolved.invalid_dotenv_value.as_deref().unwrap_or("<none>");
-    let guardrail_action = match resolved.guardrail_action {
-        GuardrailAction::None => "none",
-        GuardrailAction::RedirectedToWorkspace => "redirected_to_workspace",
-    };
     let migration_source = migration
         .source
         .as_ref()
@@ -343,15 +236,12 @@ fn format_startup_trace(
         .unwrap_or_else(|| "<none>".to_string());
 
     format!(
-        "pid={} cwd={} workspace={} source={} dotenv_path={} invalid_override={} invalid_dotenv_value={} guardrail_action={} migration_source={} migration_copied={} migration_skipped={} migration_errors={}",
+        "pid={} cwd={} workspace={} source={} invalid_override={} migration_source={} migration_copied={} migration_skipped={} migration_errors={}",
         std::process::id(),
         current_dir.display(),
         resolved.path.display(),
         source,
-        dotenv_path,
         invalid_override,
-        invalid_dotenv_value,
-        guardrail_action,
         migration_source,
         migration.copied_files,
         migration.skipped_existing,
@@ -370,9 +260,9 @@ pub struct AppState {
 }
 
 impl AppState {
-    pub fn try_new() -> Result<Self, StartupWorkspaceError> {
+    pub fn new() -> Self {
         let current_dir = env::current_dir().unwrap_or_else(|_| PathBuf::from("."));
-        let resolved_workspace = resolve_desktop_workspace()?;
+        let resolved_workspace = resolve_desktop_workspace();
         let mut cfg = AgentConfig::from_env(&resolved_workspace.path);
         let migration = migrate_legacy_desktop_state(&cfg.workspace, &cfg.session_root_dir);
         if let Err(err) =
@@ -398,14 +288,14 @@ impl AppState {
         let settings = SettingsStore::new(&cfg.workspace, &cfg.session_root_dir).load();
         apply_settings_to_config(&mut cfg, &settings);
 
-        Ok(Self {
+        Self {
             config: Arc::new(Mutex::new(cfg)),
             session_id: Arc::new(Mutex::new(None)),
             cancel_token: Arc::new(Mutex::new(CancellationToken::new())),
             agent_running: Arc::new(Mutex::new(false)),
             init_lock: Arc::new(Mutex::new(())),
             startup_trace: format_startup_trace(&current_dir, &resolved_workspace, &migration),
-        })
+        }
     }
 
     pub fn startup_trace(&self) -> &str {
@@ -555,113 +445,45 @@ mod tests {
         let override_dir = temp.path().join("override");
         fs::create_dir_all(&override_dir).unwrap();
 
-        let resolved =
-            resolve_startup_workspace_from(&repo, Some(override_dir.to_str().unwrap())).unwrap();
+        let resolved = resolve_startup_workspace_from(&repo, Some(override_dir.to_str().unwrap()));
 
         assert_eq!(resolved.source, WorkspaceSource::EnvOverride);
         assert_eq!(resolved.path, canonicalize_or_self(&override_dir));
         assert!(resolved.invalid_override.is_none());
-        assert_eq!(resolved.guardrail_action, GuardrailAction::None);
     }
 
     #[test]
-    fn test_resolve_startup_workspace_prefers_dotenv_before_git_root() {
+    fn test_resolve_startup_workspace_finds_git_root_from_nested_dir() {
         let temp = tempdir().unwrap();
         let repo = temp.path().join("repo");
-        let workspace = repo.join("workspace");
-        let nested = repo
-            .join("openplanter-desktop")
-            .join("crates")
-            .join("op-tauri");
         fs::create_dir_all(repo.join(".git")).unwrap();
-        fs::create_dir_all(&workspace).unwrap();
-        fs::create_dir_all(&nested).unwrap();
-        fs::write(repo.join(".env"), "OPENPLANTER_WORKSPACE=workspace\n").unwrap();
-
-        let resolved = resolve_startup_workspace_from(&nested, None).unwrap();
-
-        assert_eq!(resolved.source, WorkspaceSource::DotEnv);
-        assert_eq!(resolved.path, canonicalize_or_self(&workspace));
-        assert_eq!(
-            resolved.dotenv_path,
-            Some(canonicalize_or_self(&repo.join(".env")))
-        );
-    }
-
-    #[test]
-    fn test_resolve_startup_workspace_redirects_repo_root_to_workspace() {
-        let temp = tempdir().unwrap();
-        let repo = temp.path().join("repo");
-        let workspace = repo.join("workspace");
         let nested = repo
             .join("openplanter-desktop")
             .join("crates")
             .join("op-tauri");
-        fs::create_dir_all(repo.join(".git")).unwrap();
-        fs::create_dir_all(&workspace).unwrap();
         fs::create_dir_all(&nested).unwrap();
 
-        let resolved = resolve_startup_workspace_from(&nested, None).unwrap();
+        let resolved = resolve_startup_workspace_from(&nested, None);
 
         assert_eq!(resolved.source, WorkspaceSource::GitRoot);
-        assert_eq!(resolved.path, canonicalize_or_self(&workspace));
-        assert_eq!(
-            resolved.guardrail_action,
-            GuardrailAction::RedirectedToWorkspace
-        );
+        assert_eq!(resolved.path, canonicalize_or_self(&repo));
     }
 
     #[test]
-    fn test_resolve_startup_workspace_rejects_repo_root_when_workspace_dir_missing() {
+    fn test_resolve_startup_workspace_falls_back_to_current_dir() {
         let temp = tempdir().unwrap();
-        let repo = temp.path().join("repo");
-        fs::create_dir_all(repo.join(".git")).unwrap();
 
-        let err = resolve_startup_workspace_from(&repo, None).unwrap_err();
+        let resolved =
+            resolve_startup_workspace_from(temp.path(), Some("/definitely/missing/path"));
 
+        assert_eq!(resolved.source, WorkspaceSource::CurrentDir);
+        assert_eq!(resolved.path, canonicalize_or_self(temp.path()));
         assert_eq!(
-            err,
-            StartupWorkspaceError::RepoRootDisallowed {
-                repo_root: canonicalize_or_self(&repo),
-            }
+            resolved.invalid_override,
+            Some("/definitely/missing/path".to_string())
         );
     }
 
-    #[test]
-    fn test_resolve_startup_workspace_invalid_override_falls_back_cleanly() {
-        let temp = tempdir().unwrap();
-        let repo = temp.path().join("repo");
-        let workspace = repo.join("workspace");
-        let invalid = temp.path().join("missing");
-        fs::create_dir_all(repo.join(".git")).unwrap();
-        fs::create_dir_all(&workspace).unwrap();
-
-        let resolved =
-            resolve_startup_workspace_from(&repo, Some(invalid.to_str().unwrap())).unwrap();
-
-        assert_eq!(resolved.source, WorkspaceSource::GitRoot);
-        assert_eq!(resolved.path, canonicalize_or_self(&workspace));
-        assert_eq!(resolved.invalid_override, Some(invalid.display().to_string()));
-    }
-
-    #[test]
-    fn test_resolve_startup_workspace_file_override_is_treated_as_invalid() {
-        let temp = tempdir().unwrap();
-        let repo = temp.path().join("repo");
-        let workspace = repo.join("workspace");
-        let invalid = repo.join("workspace.txt");
-        fs::create_dir_all(repo.join(".git")).unwrap();
-        fs::create_dir_all(&workspace).unwrap();
-        fs::write(&invalid, "not a directory\n").unwrap();
-
-        let resolved =
-            resolve_startup_workspace_from(&repo, Some(invalid.to_str().unwrap())).unwrap();
-
-        assert_eq!(resolved.source, WorkspaceSource::GitRoot);
-        assert_eq!(resolved.path, canonicalize_or_self(&workspace));
-        assert_eq!(resolved.invalid_override, Some(invalid.display().to_string()));
-    }
-
     #[test]
     fn test_migrate_legacy_desktop_state_copies_missing_and_preserves_existing() {
         let temp = tempdir().unwrap();
@@ -725,10 +547,7 @@ mod tests {
         fs::create_dir_all(workspace.join(".git")).unwrap();
         fs::create_dir_all(&current_dir).unwrap();
 
-        let workspace_dir = workspace.join("workspace");
-        fs::create_dir_all(&workspace_dir).unwrap();
-
-        let resolved = resolve_startup_workspace_from(&current_dir, None).unwrap();
+        let resolved = resolve_startup_workspace_from(&current_dir, None);
         let migration = LegacyMigrationReport {
             source: Some(workspace.join("legacy-state")),
             copied_files: 2,
@@ -742,10 +561,7 @@ mod tests {
         assert!(trace.contains(&format!("cwd={}", current_dir.display())));
         assert!(trace.contains(&format!("workspace={}", resolved.path.display())));
         assert!(trace.contains("source=git_root"));
-        assert!(trace.contains("dotenv_path=<none>"));
         assert!(trace.contains("invalid_override=<none>"));
-        assert!(trace.contains("invalid_dotenv_value=<none>"));
-        assert!(trace.contains("guardrail_action=redirected_to_workspace"));
         assert!(trace.contains(&format!(
             "migration_source={}",
             workspace.join("legacy-state").display()
diff --git a/tests/test_credentials.py b/tests/test_credentials.py
index 5df64705..df98f1b5 100644
--- a/tests/test_credentials.py
+++ b/tests/test_credentials.py
@@ -7,7 +7,6 @@
 from agent.credentials import (
     CredentialBundle,
     CredentialStore,
-    parse_env_assignments,
     discover_env_candidates,
     parse_env_file,
 )
@@ -42,22 +41,6 @@ def test_parse_env_file_extracts_supported_keys(self) -> None:
             self.assertEqual(creds.brave_api_key, "brave-key")
             self.assertEqual(creds.tavily_api_key, "tavily-key")
 
-    def test_parse_env_assignments_preserves_generic_workspace_keys(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            env_path = Path(tmpdir) / ".env"
-            env_path.write_text(
-                "\n".join(
-                    [
-                        "OPENPLANTER_WORKSPACE=workspace",
-                        "OPENAI_API_KEY=oa-key",
-                    ]
-                ),
-                encoding="utf-8",
-            )
-            env_map = parse_env_assignments(env_path)
-            self.assertEqual(env_map["OPENPLANTER_WORKSPACE"], "workspace")
-            self.assertEqual(env_map["OPENAI_API_KEY"], "oa-key")
-
     def test_store_roundtrip(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)
@@ -76,20 +59,13 @@ def test_store_roundtrip(self) -> None:
             loaded = store.load()
             self.assertEqual(loaded, creds)
 
-    def test_discover_env_candidates_returns_nearest_ancestor_env(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            repo = Path(tmpdir) / "repo"
-            nested = repo / "workspace" / "deep"
-            nested.mkdir(parents=True, exist_ok=True)
-            (repo / ".env").write_text("OPENPLANTER_WORKSPACE=workspace\n", encoding="utf-8")
-            candidates = discover_env_candidates(nested)
-            self.assertEqual(candidates, [(repo / ".env").resolve()])
-
-    def test_discover_env_candidates_returns_empty_when_no_env_exists(self) -> None:
+    def test_discover_env_candidates_includes_workspace_env(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             workspace = Path(tmpdir) / "RLMCode"
             workspace.mkdir(parents=True, exist_ok=True)
-            self.assertEqual(discover_env_candidates(workspace), [])
+            candidates = discover_env_candidates(workspace)
+            self.assertGreaterEqual(len(candidates), 1)
+            self.assertEqual(candidates[0].resolve(), (workspace / ".env").resolve())
 
 
 if __name__ == "__main__":
diff --git a/tests/test_workspace_resolution.py b/tests/test_workspace_resolution.py
deleted file mode 100644
index ca53ac5c..00000000
--- a/tests/test_workspace_resolution.py
+++ /dev/null
@@ -1,155 +0,0 @@
-from __future__ import annotations
-
-import os
-import tempfile
-import unittest
-from pathlib import Path
-from unittest.mock import patch
-
-from agent.workspace_resolution import (
-    WorkspaceResolutionError,
-    resolve_startup_workspace,
-)
-
-
-class WorkspaceResolutionTests(unittest.TestCase):
-    def test_explicit_non_root_workspace_overrides_dotenv(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            repo = Path(tmpdir) / "repo"
-            explicit = repo / "custom-workspace"
-            default = repo / "workspace"
-            repo.mkdir()
-            explicit.mkdir()
-            default.mkdir()
-            (repo / ".git").mkdir()
-            (repo / ".env").write_text("OPENPLANTER_WORKSPACE=workspace\n", encoding="utf-8")
-
-            with patch.dict(os.environ, {}, clear=True):
-                resolved = resolve_startup_workspace(str(explicit), True, repo)
-
-            self.assertEqual(resolved.workspace, explicit.resolve())
-            self.assertEqual(resolved.source, "cli_arg")
-            self.assertEqual(resolved.guardrail_action, "none")
-
-    def test_explicit_repo_root_workspace_fails(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            repo = Path(tmpdir) / "repo"
-            repo.mkdir()
-            (repo / ".git").mkdir()
-            (repo / "workspace").mkdir()
-
-            with patch.dict(os.environ, {}, clear=True):
-                with self.assertRaises(WorkspaceResolutionError):
-                    resolve_startup_workspace(str(repo), True, repo)
-
-    def test_explicit_file_workspace_fails(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            repo = Path(tmpdir) / "repo"
-            repo.mkdir()
-            bogus_target = repo / "workspace.txt"
-            bogus_target.write_text("not a directory\n", encoding="utf-8")
-
-            with patch.dict(os.environ, {}, clear=True):
-                with self.assertRaises(WorkspaceResolutionError):
-                    resolve_startup_workspace(str(bogus_target), True, repo)
-
-    def test_nearest_ancestor_dotenv_wins(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            root = Path(tmpdir)
-            outer = root / "outer"
-            repo = outer / "repo"
-            nested = repo / "subdir" / "deeper"
-            outer_workspace = outer / "outer-ws"
-            repo_workspace = repo / "inner-ws"
-            nested.mkdir(parents=True)
-            outer_workspace.mkdir()
-            repo_workspace.mkdir()
-            (outer / ".env").write_text("OPENPLANTER_WORKSPACE=outer-ws\n", encoding="utf-8")
-            (repo / ".env").write_text("OPENPLANTER_WORKSPACE=inner-ws\n", encoding="utf-8")
-
-            with patch.dict(os.environ, {}, clear=True):
-                resolved = resolve_startup_workspace(".", False, nested)
-
-            self.assertEqual(resolved.workspace, repo_workspace.resolve())
-            self.assertEqual(resolved.source, "dotenv")
-            self.assertEqual(resolved.env_path, (repo / ".env").resolve())
-
-    def test_dotenv_relative_workspace_is_resolved_from_env_file_directory(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            repo = Path(tmpdir) / "repo"
-            nested = repo / "agent" / "inner"
-            workspace = repo / "workspace"
-            nested.mkdir(parents=True)
-            workspace.mkdir()
-            (repo / ".env").write_text("OPENPLANTER_WORKSPACE=workspace\n", encoding="utf-8")
-
-            with patch.dict(os.environ, {}, clear=True):
-                resolved = resolve_startup_workspace(".", False, nested)
-
-            self.assertEqual(resolved.workspace, workspace.resolve())
-            self.assertEqual(resolved.source, "dotenv")
-
-    def test_missing_workspace_key_redirects_repo_root_to_workspace(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            repo = Path(tmpdir) / "repo"
-            repo.mkdir()
-            (repo / ".git").mkdir()
-            workspace = repo / "workspace"
-            workspace.mkdir()
-            (repo / ".env").write_text("OPENPLANTER_PROVIDER=zai\n", encoding="utf-8")
-
-            with patch.dict(os.environ, {}, clear=True):
-                resolved = resolve_startup_workspace(".", False, repo)
-
-            self.assertEqual(resolved.workspace, workspace.resolve())
-            self.assertEqual(resolved.source, "cwd")
-            self.assertEqual(resolved.guardrail_action, "redirected_to_workspace")
-
-    def test_missing_workspace_key_fails_when_repo_root_has_no_workspace_dir(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            repo = Path(tmpdir) / "repo"
-            repo.mkdir()
-            (repo / ".git").mkdir()
-            (repo / ".env").write_text("OPENPLANTER_PROVIDER=zai\n", encoding="utf-8")
-
-            with patch.dict(os.environ, {}, clear=True):
-                with self.assertRaises(WorkspaceResolutionError):
-                    resolve_startup_workspace(".", False, repo)
-
-    def test_invalid_process_env_override_falls_back_to_guardrail_redirect(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            repo = Path(tmpdir) / "repo"
-            repo.mkdir()
-            (repo / ".git").mkdir()
-            workspace = repo / "workspace"
-            workspace.mkdir()
-
-            with patch.dict(os.environ, {"OPENPLANTER_WORKSPACE": str(repo / "missing")}, clear=True):
-                resolved = resolve_startup_workspace(".", False, repo)
-
-            self.assertEqual(resolved.workspace, workspace.resolve())
-            self.assertEqual(resolved.source, "cwd")
-            self.assertEqual(resolved.invalid_env_override, str(repo / "missing"))
-            self.assertEqual(resolved.guardrail_action, "redirected_to_workspace")
-
-    def test_file_path_workspace_override_is_treated_as_invalid(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            repo = Path(tmpdir) / "repo"
-            repo.mkdir()
-            (repo / ".git").mkdir()
-            workspace = repo / "workspace"
-            workspace.mkdir()
-            bogus_target = repo / "workspace.txt"
-            bogus_target.write_text("not a directory\n", encoding="utf-8")
-
-            with patch.dict(os.environ, {"OPENPLANTER_WORKSPACE": str(bogus_target)}, clear=True):
-                resolved = resolve_startup_workspace(".", False, repo)
-
-            self.assertEqual(resolved.workspace, workspace.resolve())
-            self.assertEqual(resolved.source, "cwd")
-            self.assertEqual(resolved.invalid_env_override, str(bogus_target))
-            self.assertEqual(resolved.guardrail_action, "redirected_to_workspace")
-
-
-if __name__ == "__main__":
-    unittest.main()

From 4316a3f32b27920f8f94b83d2316937f8174e0a3 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 15:47:20 -0400
Subject: [PATCH 51/58] Revert "Add desktop init and migration workflows"

This reverts commit f104f0c2ee087bb39fce37414bd10f5371bde881.
---
 .../crates/op-core/src/config_hydration.rs    |  126 --
 .../crates/op-core/src/events.rs              |  127 --
 openplanter-desktop/crates/op-core/src/lib.rs |    2 -
 .../crates/op-core/src/workspace_init.rs      | 1176 -----------------
 .../crates/op-tauri/src/commands/agent.rs     |   24 +-
 .../crates/op-tauri/src/commands/init.rs      |   82 --
 .../crates/op-tauri/src/commands/mod.rs       |    1 -
 .../crates/op-tauri/src/main.rs               |    5 -
 .../crates/op-tauri/src/state.rs              |  143 +-
 .../frontend/src/api/events.test.ts           |   18 -
 .../frontend/src/api/events.ts                |   10 -
 .../frontend/src/api/invoke.test.ts           |   82 --
 .../frontend/src/api/invoke.ts                |   29 -
 openplanter-desktop/frontend/src/api/types.ts |   76 --
 .../src/commands/completionRegistry.test.ts   |   13 -
 .../src/commands/completionRegistry.ts        |   11 -
 .../frontend/src/commands/init.ts             |  133 --
 .../frontend/src/commands/slash.test.ts       |   43 -
 .../frontend/src/commands/slash.ts            |    7 -
 .../frontend/src/components/App.test.ts       |   40 +-
 .../frontend/src/components/App.ts            |    5 -
 .../frontend/src/components/InputBar.test.ts  |   47 +-
 .../frontend/src/components/InputBar.ts       |   20 +-
 .../src/components/WorkspaceInitGate.ts       |  402 ------
 openplanter-desktop/frontend/src/main.ts      |   27 +-
 .../frontend/src/state/store.test.ts          |    3 -
 .../frontend/src/state/store.ts               |   18 -
 27 files changed, 132 insertions(+), 2538 deletions(-)
 delete mode 100644 openplanter-desktop/crates/op-core/src/config_hydration.rs
 delete mode 100644 openplanter-desktop/crates/op-core/src/workspace_init.rs
 delete mode 100644 openplanter-desktop/crates/op-tauri/src/commands/init.rs
 delete mode 100644 openplanter-desktop/frontend/src/commands/init.ts
 delete mode 100644 openplanter-desktop/frontend/src/components/WorkspaceInitGate.ts

diff --git a/openplanter-desktop/crates/op-core/src/config_hydration.rs b/openplanter-desktop/crates/op-core/src/config_hydration.rs
deleted file mode 100644
index 90177523..00000000
--- a/openplanter-desktop/crates/op-core/src/config_hydration.rs
+++ /dev/null
@@ -1,126 +0,0 @@
-use std::env;
-
-use crate::config::{
-    AgentConfig, FOUNDRY_OPENAI_API_KEY_PLACEHOLDER, normalize_web_search_provider,
-    normalize_zai_plan, resolve_openai_api_key, resolve_zai_base_url,
-};
-use crate::credentials::CredentialBundle;
-use crate::settings::PersistentSettings;
-
-/// Merge credentials into an AgentConfig.
-/// Priority: existing config value > env_creds > file_creds.
-pub fn merge_credentials_into_config(
-    cfg: &mut AgentConfig,
-    env_creds: &CredentialBundle,
-    file_creds: &CredentialBundle,
-) {
-    if cfg.openai_oauth_token.is_none() {
-        cfg.openai_oauth_token = env_creds
-            .openai_oauth_token
-            .clone()
-            .or_else(|| file_creds.openai_oauth_token.clone());
-    }
-    cfg.openai_api_key = cfg
-        .openai_api_key
-        .clone()
-        .filter(|value| {
-            let trimmed = value.trim();
-            !trimmed.is_empty() && trimmed != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
-        })
-        .or_else(|| env_creds.openai_api_key.clone())
-        .or_else(|| file_creds.openai_api_key.clone())
-        .or_else(|| cfg.openai_api_key.clone());
-    cfg.openai_api_key = resolve_openai_api_key(
-        cfg.openai_api_key.clone(),
-        &cfg.openai_base_url,
-        cfg.openai_oauth_token.clone(),
-    );
-    cfg.api_key = resolve_openai_api_key(
-        cfg.openai_api_key
-            .clone()
-            .filter(|value| {
-                let trimmed = value.trim();
-                !trimmed.is_empty() && trimmed != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
-            })
-            .or_else(|| {
-                cfg.api_key.clone().filter(|value| {
-                    let trimmed = value.trim();
-                    !trimmed.is_empty() && trimmed != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
-                })
-            })
-            .or_else(|| cfg.openai_api_key.clone())
-            .or_else(|| cfg.api_key.clone()),
-        &cfg.base_url,
-        cfg.openai_oauth_token.clone(),
-    );
-
-    macro_rules! merge {
-        ($field:ident) => {
-            if cfg.$field.is_none() {
-                cfg.$field = env_creds
-                    .$field
-                    .clone()
-                    .or_else(|| file_creds.$field.clone());
-            }
-        };
-    }
-    merge!(anthropic_api_key);
-    merge!(openrouter_api_key);
-    merge!(cerebras_api_key);
-    merge!(zai_api_key);
-    merge!(exa_api_key);
-    merge!(firecrawl_api_key);
-    merge!(brave_api_key);
-    merge!(tavily_api_key);
-    merge!(voyage_api_key);
-}
-
-pub fn apply_settings_to_config(cfg: &mut AgentConfig, settings: &PersistentSettings) {
-    if !has_env_value(&["OPENPLANTER_REASONING_EFFORT"]) {
-        if let Some(reasoning_effort) = settings.default_reasoning_effort.clone() {
-            cfg.reasoning_effort = Some(reasoning_effort);
-        }
-    }
-
-    if !has_env_value(&["OPENPLANTER_ZAI_PLAN"]) {
-        if let Some(plan) = settings.zai_plan.as_deref() {
-            cfg.zai_plan = normalize_zai_plan(Some(plan));
-        }
-    }
-
-    if !has_env_value(&["OPENPLANTER_ZAI_BASE_URL"]) {
-        cfg.zai_base_url = resolve_zai_base_url(
-            &cfg.zai_plan,
-            &cfg.zai_paygo_base_url,
-            &cfg.zai_coding_base_url,
-        );
-    }
-
-    if !has_env_value(&["OPENPLANTER_WEB_SEARCH_PROVIDER"]) {
-        if let Some(provider) = settings.web_search_provider.as_deref() {
-            cfg.web_search_provider = normalize_web_search_provider(Some(provider));
-        }
-    }
-
-    if !has_env_value(&["OPENPLANTER_MODEL"]) {
-        let saved_model = if cfg.provider == "auto" {
-            settings.default_model.as_deref()
-        } else {
-            settings
-                .default_model_for_provider(cfg.provider.as_str())
-                .or(settings.default_model.as_deref())
-        };
-        if let Some(model) = saved_model {
-            cfg.model = model.to_string();
-        }
-    }
-}
-
-fn has_env_value(keys: &[&str]) -> bool {
-    keys.iter().any(|key| {
-        env::var(key)
-            .ok()
-            .map(|value| !value.trim().is_empty())
-            .unwrap_or(false)
-    })
-}
diff --git a/openplanter-desktop/crates/op-core/src/events.rs b/openplanter-desktop/crates/op-core/src/events.rs
index 326c6d0b..a93593dd 100644
--- a/openplanter-desktop/crates/op-core/src/events.rs
+++ b/openplanter-desktop/crates/op-core/src/events.rs
@@ -243,116 +243,6 @@ pub struct SlashResult {
     pub success: bool,
 }
 
-/// Frontend gate state for workspace initialization.
-#[derive(Debug, Clone, Serialize, Deserialize, PartialEq, Eq)]
-#[serde(rename_all = "snake_case")]
-pub enum InitGateState {
-    Ready,
-    RequiresAction,
-    Blocked,
-}
-
-/// Report returned by standard workspace initialization.
-#[derive(Debug, Clone, Default, Serialize, Deserialize, PartialEq, Eq)]
-pub struct StandardInitReportView {
-    pub workspace: String,
-    pub created_paths: Vec<String>,
-    pub copied_paths: Vec<String>,
-    pub skipped_existing: u64,
-    pub errors: Vec<String>,
-    pub onboarding_required: bool,
-}
-
-/// Current initialization state for the runtime workspace.
-#[derive(Debug, Clone, Default, Serialize, Deserialize, PartialEq, Eq)]
-pub struct InitStatusView {
-    pub runtime_workspace: String,
-    pub gate_state: String,
-    pub onboarding_completed: bool,
-    pub has_openplanter_root: bool,
-    pub has_runtime_wiki: bool,
-    pub has_runtime_index: bool,
-    pub init_state_path: String,
-    pub last_migration_target: Option<String>,
-    pub warnings: Vec<String>,
-}
-
-/// Migration source classification.
-#[derive(Debug, Clone, Serialize, Deserialize, PartialEq, Eq)]
-#[serde(rename_all = "snake_case")]
-pub enum MigrationSourceKind {
-    OpenPlanterWorkspace,
-    ManualResearch,
-    Unknown,
-}
-
-/// Inspection data for a migration source.
-#[derive(Debug, Clone, Default, Serialize, Deserialize, PartialEq, Eq)]
-pub struct MigrationSourceInspection {
-    pub path: String,
-    pub kind: String,
-    pub has_sessions: bool,
-    pub has_settings: bool,
-    pub has_credentials: bool,
-    pub has_runtime_wiki: bool,
-    pub has_baseline_wiki: bool,
-    pub markdown_files: u64,
-    pub warnings: Vec<String>,
-}
-
-/// A user-selected migration source.
-#[derive(Debug, Clone, Default, Serialize, Deserialize, PartialEq, Eq)]
-pub struct MigrationSourceInput {
-    pub path: String,
-}
-
-/// Request payload for migration init.
-#[derive(Debug, Clone, Default, Serialize, Deserialize, PartialEq, Eq)]
-pub struct MigrationInitRequest {
-    pub target_workspace: String,
-    pub sources: Vec<MigrationSourceInput>,
-}
-
-/// Progress stages emitted during migration.
-#[derive(Debug, Clone, Serialize, Deserialize, PartialEq, Eq)]
-#[serde(rename_all = "snake_case")]
-pub enum MigrationProgressStage {
-    Inspect,
-    Copy,
-    MergeSessions,
-    MergeSettings,
-    MergeCredentials,
-    Synthesize,
-    Rewrite,
-    Done,
-}
-
-/// Progress event emitted while migration runs.
-#[derive(Debug, Clone, Default, Serialize, Deserialize, PartialEq, Eq)]
-pub struct MigrationProgressEvent {
-    pub stage: String,
-    pub message: String,
-    pub current: u32,
-    pub total: u32,
-}
-
-/// Result payload returned after migration init completes.
-#[derive(Debug, Clone, Default, Serialize, Deserialize, PartialEq, Eq)]
-pub struct MigrationInitResultView {
-    pub target_workspace: String,
-    pub sources: Vec<String>,
-    pub sessions_copied: u64,
-    pub sessions_renamed: u64,
-    pub settings_merged_fields: Vec<String>,
-    pub credentials_merged_fields: Vec<String>,
-    pub wiki_files_synthesized: u64,
-    pub raw_preservation_root: String,
-    pub rewrite_summary: String,
-    pub restart_required: bool,
-    pub restart_message: String,
-    pub warnings: Vec<String>,
-}
-
 #[cfg(test)]
 mod tests {
     use super::*;
@@ -453,7 +343,6 @@ mod tests {
         assert_eq!(parsed["tool_name"], "read_file");
         assert_eq!(parsed["tokens"]["input_tokens"], 1234);
     }
-
     #[test]
     fn test_loop_metrics_deserialize_backfills_new_fields() {
         let parsed: LoopMetrics = serde_json::from_str(
@@ -494,20 +383,4 @@ mod tests {
             }
         );
     }
-
-    #[test]
-    fn test_init_gate_state_serialization() {
-        assert_eq!(
-            serde_json::to_string(&InitGateState::RequiresAction).unwrap(),
-            "\"requires_action\""
-        );
-    }
-
-    #[test]
-    fn test_migration_progress_stage_serialization() {
-        assert_eq!(
-            serde_json::to_string(&MigrationProgressStage::MergeSessions).unwrap(),
-            "\"merge_sessions\""
-        );
-    }
 }
diff --git a/openplanter-desktop/crates/op-core/src/lib.rs b/openplanter-desktop/crates/op-core/src/lib.rs
index aeb3a3ef..62efa5cf 100644
--- a/openplanter-desktop/crates/op-core/src/lib.rs
+++ b/openplanter-desktop/crates/op-core/src/lib.rs
@@ -1,6 +1,5 @@
 pub mod builder;
 pub mod config;
-pub mod config_hydration;
 pub mod credentials;
 pub mod engine;
 pub mod events;
@@ -10,4 +9,3 @@ pub mod session;
 pub mod settings;
 pub mod tools;
 pub mod wiki;
-pub mod workspace_init;
diff --git a/openplanter-desktop/crates/op-core/src/workspace_init.rs b/openplanter-desktop/crates/op-core/src/workspace_init.rs
deleted file mode 100644
index 255fd9b1..00000000
--- a/openplanter-desktop/crates/op-core/src/workspace_init.rs
+++ /dev/null
@@ -1,1176 +0,0 @@
-use std::collections::{HashMap, HashSet};
-use std::env;
-use std::fs;
-use std::path::{Path, PathBuf};
-
-use chrono::Utc;
-use serde::{Deserialize, Serialize};
-use thiserror::Error;
-use tokio::runtime::Builder as TokioRuntimeBuilder;
-use tokio_util::sync::CancellationToken;
-use walkdir::WalkDir;
-
-use crate::config::AgentConfig;
-use crate::config_hydration::{apply_settings_to_config, merge_credentials_into_config};
-use crate::credentials::{CredentialBundle, CredentialStore};
-use crate::engine::curator::{CuratorResult, run_curator};
-use crate::events::{
-    InitGateState, InitStatusView, MigrationInitRequest, MigrationInitResultView,
-    MigrationProgressEvent, MigrationProgressStage, MigrationSourceInspection, MigrationSourceKind,
-    SessionInfo, StandardInitReportView,
-};
-use crate::settings::{PersistentSettings, SettingsStore};
-
-const INIT_STATE_FILE: &str = "init-state.json";
-const BASELINE_INDEX: &str = include_str!("../../../../wiki/index.md");
-const BASELINE_TEMPLATE: &str = include_str!("../../../../wiki/template.md");
-
-#[derive(Debug, Error)]
-pub enum WorkspaceInitError {
-    #[error("{0}")]
-    InvalidRequest(String),
-    #[error("I/O error: {0}")]
-    Io(#[from] std::io::Error),
-    #[error("Serialization error: {0}")]
-    Serde(#[from] serde_json::Error),
-    #[error("Curator rewrite failed: {0}")]
-    Curator(String),
-}
-
-#[derive(Debug, Clone, Serialize, Deserialize)]
-struct InitStateFile {
-    version: u32,
-    initialized_at: String,
-    last_standard_init_at: Option<String>,
-    onboarding_completed: bool,
-    last_migration_target: Option<String>,
-}
-
-impl Default for InitStateFile {
-    fn default() -> Self {
-        Self {
-            version: 1,
-            initialized_at: now_rfc3339(),
-            last_standard_init_at: None,
-            onboarding_completed: false,
-            last_migration_target: None,
-        }
-    }
-}
-
-#[derive(Debug, Clone)]
-struct SourceSpec {
-    original: String,
-    canonical: PathBuf,
-    inspection: MigrationSourceInspection,
-}
-
-pub fn run_standard_init(
-    workspace: &Path,
-    session_root_dir: &str,
-    mark_onboarding_complete: bool,
-) -> Result<StandardInitReportView, WorkspaceInitError> {
-    let workspace = workspace.to_path_buf();
-    let root = workspace.join(session_root_dir);
-    let wiki_dir = root.join("wiki");
-    let index_path = wiki_dir.join("index.md");
-    let init_path = root.join(INIT_STATE_FILE);
-
-    let root_preexisting = root.exists();
-    let index_preexisting = index_path.exists();
-    let mut report = StandardInitReportView {
-        workspace: workspace.display().to_string(),
-        ..Default::default()
-    };
-
-    ensure_dir(&workspace, &mut report.created_paths)?;
-    ensure_dir(&root, &mut report.created_paths)?;
-    ensure_dir(&root.join("sessions"), &mut report.created_paths)?;
-    ensure_dir(&root.join("migration"), &mut report.created_paths)?;
-    ensure_dir(
-        &root.join("migration").join("raw"),
-        &mut report.created_paths,
-    )?;
-    ensure_dir(&wiki_dir, &mut report.created_paths)?;
-
-    write_text_if_missing(&root.join("settings.json"), "{}", &mut report)?;
-    write_text_if_missing(&root.join("credentials.json"), "{}", &mut report)?;
-    write_text_if_missing(&index_path, BASELINE_INDEX, &mut report)?;
-    write_text_if_missing(
-        &wiki_dir.join("template.md"),
-        BASELINE_TEMPLATE,
-        &mut report,
-    )?;
-
-    let mut state = read_init_state(&init_path).unwrap_or_else(|| InitStateFile {
-        onboarding_completed: root_preexisting || index_preexisting,
-        ..InitStateFile::default()
-    });
-    if mark_onboarding_complete {
-        state.onboarding_completed = true;
-    }
-    state.last_standard_init_at = Some(now_rfc3339());
-    write_init_state(&init_path, &state)?;
-    report.onboarding_required = !state.onboarding_completed;
-
-    Ok(report)
-}
-
-pub fn complete_first_run_gate(
-    workspace: &Path,
-    session_root_dir: &str,
-) -> Result<InitStatusView, WorkspaceInitError> {
-    let _ = run_standard_init(workspace, session_root_dir, true)?;
-    get_init_status(workspace, session_root_dir)
-}
-
-pub fn get_init_status(
-    workspace: &Path,
-    session_root_dir: &str,
-) -> Result<InitStatusView, WorkspaceInitError> {
-    let root = workspace.join(session_root_dir);
-    let wiki_dir = root.join("wiki");
-    let index_path = wiki_dir.join("index.md");
-    let init_path = root.join(INIT_STATE_FILE);
-    let mut warnings = Vec::new();
-    let init_state = match fs::read_to_string(&init_path) {
-        Ok(content) => match serde_json::from_str::<InitStateFile>(&content) {
-            Ok(state) => Some(state),
-            Err(err) => {
-                warnings.push(format!("Failed to parse init state: {err}"));
-                None
-            }
-        },
-        Err(_) => None,
-    };
-    let onboarding_completed = init_state
-        .as_ref()
-        .map(|state| state.onboarding_completed)
-        .unwrap_or_else(|| root.exists() && index_path.exists());
-    let gate_state =
-        if root.exists() && wiki_dir.exists() && index_path.exists() && onboarding_completed {
-            InitGateState::Ready
-        } else {
-            InitGateState::RequiresAction
-        };
-
-    Ok(InitStatusView {
-        runtime_workspace: workspace.display().to_string(),
-        gate_state: gate_state_name(gate_state).to_string(),
-        onboarding_completed,
-        has_openplanter_root: root.exists(),
-        has_runtime_wiki: wiki_dir.exists(),
-        has_runtime_index: index_path.exists(),
-        init_state_path: init_path.display().to_string(),
-        last_migration_target: init_state.and_then(|state| state.last_migration_target),
-        warnings,
-    })
-}
-
-pub fn inspect_migration_source(path: &Path) -> MigrationSourceInspection {
-    let canonical = canonicalize_or_self(path);
-    let openplanter_root = canonical.join(".openplanter");
-    let runtime_wiki = openplanter_root.join("wiki");
-    let baseline_wiki = canonical.join("wiki");
-    let markdown_files = count_markdown_files(&canonical);
-    let kind = if openplanter_root.exists() {
-        MigrationSourceKind::OpenPlanterWorkspace
-    } else if markdown_files > 0 {
-        MigrationSourceKind::ManualResearch
-    } else {
-        MigrationSourceKind::Unknown
-    };
-
-    MigrationSourceInspection {
-        path: canonical.display().to_string(),
-        kind: source_kind_name(kind).to_string(),
-        has_sessions: openplanter_root.join("sessions").exists(),
-        has_settings: openplanter_root.join("settings.json").exists(),
-        has_credentials: openplanter_root.join("credentials.json").exists(),
-        has_runtime_wiki: runtime_wiki.exists(),
-        has_baseline_wiki: baseline_wiki.exists(),
-        markdown_files,
-        warnings: Vec::new(),
-    }
-}
-
-pub fn run_migration_init<F>(
-    request: &MigrationInitRequest,
-    runtime_config: &AgentConfig,
-    emit_progress: F,
-) -> Result<MigrationInitResultView, WorkspaceInitError>
-where
-    F: FnMut(MigrationProgressEvent),
-{
-    run_migration_init_with_runner(request, runtime_config, emit_progress, run_curator_blocking)
-}
-
-fn run_migration_init_with_runner<F, R>(
-    request: &MigrationInitRequest,
-    runtime_config: &AgentConfig,
-    mut emit_progress: F,
-    mut curator_runner: R,
-) -> Result<MigrationInitResultView, WorkspaceInitError>
-where
-    F: FnMut(MigrationProgressEvent),
-    R: FnMut(&str, &AgentConfig) -> Result<CuratorResult, WorkspaceInitError>,
-{
-    if request.target_workspace.trim().is_empty() {
-        return Err(WorkspaceInitError::InvalidRequest(
-            "Target workspace is required".to_string(),
-        ));
-    }
-    if request.sources.is_empty() {
-        return Err(WorkspaceInitError::InvalidRequest(
-            "At least one migration source is required".to_string(),
-        ));
-    }
-
-    let session_root_dir = runtime_config.session_root_dir.as_str();
-    let target = canonicalize_target_path(&expand_home(&request.target_workspace))?;
-    let total = request.sources.len() as u32;
-    let mut source_specs = Vec::new();
-    let mut seen_sources = HashSet::new();
-
-    for (index, source) in request.sources.iter().enumerate() {
-        let source_path = expand_home(&source.path);
-        if !source_path.exists() {
-            return Err(WorkspaceInitError::InvalidRequest(format!(
-                "Source does not exist: {}",
-                source.path
-            )));
-        }
-        let canonical = canonicalize_or_self(&source_path);
-        if canonical == target {
-            return Err(WorkspaceInitError::InvalidRequest(
-                "Target workspace cannot also be a source".to_string(),
-            ));
-        }
-        if !seen_sources.insert(canonical.clone()) {
-            return Err(WorkspaceInitError::InvalidRequest(format!(
-                "Duplicate source: {}",
-                canonical.display()
-            )));
-        }
-        emit_progress(progress_event(
-            MigrationProgressStage::Inspect,
-            format!("Inspecting {}", canonical.display()),
-            (index + 1) as u32,
-            total,
-        ));
-        source_specs.push(SourceSpec {
-            original: source.path.clone(),
-            canonical: canonical.clone(),
-            inspection: inspect_migration_source(&canonical),
-        });
-    }
-
-    let _ = run_standard_init(&target, session_root_dir, false)?;
-    let root = target.join(session_root_dir);
-    let raw_root = root.join("migration").join("raw");
-    let target_sessions_dir = root.join("sessions");
-    let target_wiki_dir = root.join("wiki");
-    let mut warnings = Vec::new();
-    let mut raw_specs = Vec::new();
-
-    for (index, spec) in source_specs.iter().enumerate() {
-        let slug = format!(
-            "{:02}-{}",
-            index + 1,
-            slugify_component(&display_name(&spec.canonical))
-        );
-        let raw_dest = raw_root.join(slug);
-        emit_progress(progress_event(
-            MigrationProgressStage::Copy,
-            format!("Copying raw content from {}", spec.canonical.display()),
-            (index + 1) as u32,
-            total,
-        ));
-        copy_source_snapshot(&spec.canonical, &raw_dest, &spec.inspection, &mut warnings)?;
-        raw_specs.push((spec.clone(), raw_dest));
-    }
-
-    emit_progress(progress_event(
-        MigrationProgressStage::MergeSessions,
-        "Merging sessions".to_string(),
-        0,
-        total,
-    ));
-    let mut sessions_copied = 0u64;
-    let mut sessions_renamed = 0u64;
-    for (_, raw_dest) in &raw_specs {
-        let sessions_dir = raw_dest.join(".openplanter").join("sessions");
-        if !sessions_dir.exists() {
-            continue;
-        }
-        for entry in fs::read_dir(&sessions_dir)? {
-            let entry = entry?;
-            if !entry.path().is_dir() {
-                continue;
-            }
-            let original_id = entry.file_name().to_string_lossy().to_string();
-            let resolved_id = unique_session_id(&target_sessions_dir, &original_id);
-            if resolved_id != original_id {
-                sessions_renamed += 1;
-            }
-            let target_session_dir = target_sessions_dir.join(&resolved_id);
-            copy_dir_all(&entry.path(), &target_session_dir)?;
-            rewrite_session_metadata_id(&target_session_dir, &resolved_id)?;
-            sessions_copied += 1;
-        }
-    }
-
-    emit_progress(progress_event(
-        MigrationProgressStage::MergeSettings,
-        "Merging settings".to_string(),
-        0,
-        total,
-    ));
-    let settings_store = SettingsStore::new(&target, session_root_dir);
-    let mut merged_settings = settings_store.load();
-    let mut settings_fields = Vec::new();
-    for (_, raw_dest) in &raw_specs {
-        let settings_path = raw_dest.join(".openplanter").join("settings.json");
-        if settings_path.exists() {
-            let incoming = read_settings_from_path(&settings_path)?;
-            merge_settings_missing(&mut merged_settings, &incoming, &mut settings_fields);
-        }
-    }
-    settings_store.save(&merged_settings)?;
-    settings_fields.sort();
-    settings_fields.dedup();
-
-    emit_progress(progress_event(
-        MigrationProgressStage::MergeCredentials,
-        "Merging credentials".to_string(),
-        0,
-        total,
-    ));
-    let credential_store = CredentialStore::new(&target, session_root_dir);
-    let mut merged_credentials = credential_store.load();
-    let mut credential_fields = Vec::new();
-    for (_, raw_dest) in &raw_specs {
-        let credentials_path = raw_dest.join(".openplanter").join("credentials.json");
-        if credentials_path.exists() {
-            let incoming = read_credentials_from_path(&credentials_path)?;
-            merge_credentials_missing(&mut merged_credentials, &incoming, &mut credential_fields);
-        }
-    }
-    credential_store.save(&merged_credentials)?;
-    credential_fields.sort();
-    credential_fields.dedup();
-
-    emit_progress(progress_event(
-        MigrationProgressStage::Synthesize,
-        "Preparing the target wiki for a one-time curator rewrite".to_string(),
-        0,
-        1,
-    ));
-    clear_runtime_wiki_documents(&target_wiki_dir)?;
-    let curator_context = build_migration_curator_context(&target, &raw_root, &raw_specs);
-    let curator_config = build_target_curator_config(
-        runtime_config,
-        &target,
-        &merged_settings,
-        &merged_credentials,
-    );
-
-    emit_progress(progress_event(
-        MigrationProgressStage::Rewrite,
-        "Running a one-time curator rewrite over imported sources".to_string(),
-        0,
-        1,
-    ));
-    let curator_result = curator_runner(&curator_context, &curator_config)?;
-    let rewrite_summary = normalize_rewrite_summary(&curator_result);
-    let wiki_files_synthesized = count_runtime_wiki_pages(&target_wiki_dir);
-    emit_progress(progress_event(
-        MigrationProgressStage::Rewrite,
-        rewrite_summary.clone(),
-        1,
-        1,
-    ));
-
-    let init_path = root.join(INIT_STATE_FILE);
-    let mut state = read_init_state(&init_path).unwrap_or_default();
-    state.onboarding_completed = true;
-    state.last_migration_target = Some(target.display().to_string());
-    state.last_standard_init_at = Some(now_rfc3339());
-    write_init_state(&init_path, &state)?;
-
-    let result = MigrationInitResultView {
-        target_workspace: target.display().to_string(),
-        sources: raw_specs
-            .iter()
-            .map(|(spec, _)| spec.canonical.display().to_string())
-            .collect(),
-        sessions_copied,
-        sessions_renamed,
-        settings_merged_fields: settings_fields,
-        credentials_merged_fields: credential_fields,
-        wiki_files_synthesized,
-        raw_preservation_root: raw_root.display().to_string(),
-        rewrite_summary,
-        restart_required: true,
-        restart_message: format!(
-            "Migration completed. Restart OpenPlanter with OPENPLANTER_WORKSPACE={} to use the new Desktop workspace.",
-            target.display()
-        ),
-        warnings,
-    };
-
-    emit_progress(progress_event(
-        MigrationProgressStage::Done,
-        "Migration complete".to_string(),
-        total,
-        total,
-    ));
-    Ok(result)
-}
-
-fn now_rfc3339() -> String {
-    Utc::now().to_rfc3339()
-}
-
-fn gate_state_name(state: InitGateState) -> &'static str {
-    match state {
-        InitGateState::Ready => "ready",
-        InitGateState::RequiresAction => "requires_action",
-        InitGateState::Blocked => "blocked",
-    }
-}
-
-fn source_kind_name(kind: MigrationSourceKind) -> &'static str {
-    match kind {
-        MigrationSourceKind::OpenPlanterWorkspace => "openplanter_workspace",
-        MigrationSourceKind::ManualResearch => "manual_research",
-        MigrationSourceKind::Unknown => "unknown",
-    }
-}
-
-fn progress_stage_name(stage: MigrationProgressStage) -> &'static str {
-    match stage {
-        MigrationProgressStage::Inspect => "inspect",
-        MigrationProgressStage::Copy => "copy",
-        MigrationProgressStage::MergeSessions => "merge_sessions",
-        MigrationProgressStage::MergeSettings => "merge_settings",
-        MigrationProgressStage::MergeCredentials => "merge_credentials",
-        MigrationProgressStage::Synthesize => "synthesize",
-        MigrationProgressStage::Rewrite => "rewrite",
-        MigrationProgressStage::Done => "done",
-    }
-}
-
-fn progress_event(
-    stage: MigrationProgressStage,
-    message: String,
-    current: u32,
-    total: u32,
-) -> MigrationProgressEvent {
-    MigrationProgressEvent {
-        stage: progress_stage_name(stage).to_string(),
-        message,
-        current,
-        total,
-    }
-}
-
-fn read_init_state(path: &Path) -> Option<InitStateFile> {
-    let content = fs::read_to_string(path).ok()?;
-    serde_json::from_str(&content).ok()
-}
-
-fn write_init_state(path: &Path, state: &InitStateFile) -> Result<(), WorkspaceInitError> {
-    if let Some(parent) = path.parent() {
-        fs::create_dir_all(parent)?;
-    }
-    fs::write(path, serde_json::to_string_pretty(state)?)?;
-    Ok(())
-}
-
-fn ensure_dir(path: &Path, created_paths: &mut Vec<String>) -> Result<(), WorkspaceInitError> {
-    if !path.exists() {
-        fs::create_dir_all(path)?;
-        created_paths.push(path.display().to_string());
-    }
-    Ok(())
-}
-
-fn write_text_if_missing(
-    path: &Path,
-    contents: &str,
-    report: &mut StandardInitReportView,
-) -> Result<(), WorkspaceInitError> {
-    if path.exists() {
-        report.skipped_existing += 1;
-        return Ok(());
-    }
-    if let Some(parent) = path.parent() {
-        fs::create_dir_all(parent)?;
-    }
-    fs::write(path, contents)?;
-    report.copied_paths.push(path.display().to_string());
-    Ok(())
-}
-
-fn expand_home(raw: &str) -> PathBuf {
-    if raw == "~" {
-        return home_dir().unwrap_or_else(|| PathBuf::from(raw));
-    }
-    if let Some(rest) = raw.strip_prefix("~/") {
-        if let Some(home) = home_dir() {
-            return home.join(rest);
-        }
-    }
-    PathBuf::from(raw)
-}
-
-fn home_dir() -> Option<PathBuf> {
-    #[cfg(windows)]
-    {
-        env::var_os("USERPROFILE").map(PathBuf::from)
-    }
-    #[cfg(not(windows))]
-    {
-        env::var_os("HOME").map(PathBuf::from)
-    }
-}
-
-fn canonicalize_or_self(path: &Path) -> PathBuf {
-    path.canonicalize().unwrap_or_else(|_| path.to_path_buf())
-}
-
-fn canonicalize_target_path(path: &Path) -> Result<PathBuf, WorkspaceInitError> {
-    if path.exists() {
-        return Ok(canonicalize_or_self(path));
-    }
-    if let Some(parent) = path.parent() {
-        fs::create_dir_all(parent)?;
-    }
-    Ok(path.to_path_buf())
-}
-
-fn count_markdown_files(path: &Path) -> u64 {
-    WalkDir::new(path)
-        .into_iter()
-        .filter_entry(|entry| !should_skip_walk_entry(entry.path()))
-        .filter_map(Result::ok)
-        .filter(|entry| entry.file_type().is_file())
-        .filter(|entry| is_markdown(entry.path()))
-        .count() as u64
-}
-
-fn should_skip_walk_entry(path: &Path) -> bool {
-    path.file_name()
-        .and_then(|value| value.to_str())
-        .map(|name| {
-            matches!(
-                name,
-                ".git" | "node_modules" | "target" | "dist" | "__pycache__"
-            )
-        })
-        .unwrap_or(false)
-}
-
-fn is_markdown(path: &Path) -> bool {
-    matches!(
-        path.extension().and_then(|value| value.to_str()),
-        Some("md") | Some("markdown")
-    )
-}
-
-fn display_name(path: &Path) -> String {
-    path.file_name()
-        .and_then(|value| value.to_str())
-        .map(ToString::to_string)
-        .unwrap_or_else(|| path.display().to_string())
-}
-
-fn slugify_component(text: &str) -> String {
-    let slug = text
-        .to_lowercase()
-        .chars()
-        .map(|ch| if ch.is_ascii_alphanumeric() { ch } else { '-' })
-        .collect::<String>()
-        .split('-')
-        .filter(|part| !part.is_empty())
-        .collect::<Vec<_>>()
-        .join("-");
-    if slug.is_empty() {
-        "workspace".to_string()
-    } else {
-        slug
-    }
-}
-
-fn copy_source_snapshot(
-    source: &Path,
-    raw_dest: &Path,
-    inspection: &MigrationSourceInspection,
-    warnings: &mut Vec<String>,
-) -> Result<(), WorkspaceInitError> {
-    fs::create_dir_all(raw_dest)?;
-    let openplanter_root = source.join(".openplanter");
-
-    if inspection.has_settings {
-        copy_file(
-            &openplanter_root.join("settings.json"),
-            &raw_dest.join(".openplanter").join("settings.json"),
-        )?;
-    }
-    if inspection.has_credentials {
-        copy_file(
-            &openplanter_root.join("credentials.json"),
-            &raw_dest.join(".openplanter").join("credentials.json"),
-        )?;
-    }
-    if inspection.has_sessions {
-        copy_dir_all(
-            &openplanter_root.join("sessions"),
-            &raw_dest.join(".openplanter").join("sessions"),
-        )?;
-    }
-    if inspection.has_runtime_wiki {
-        copy_dir_all(
-            &openplanter_root.join("wiki"),
-            &raw_dest.join(".openplanter").join("wiki"),
-        )?;
-    } else if inspection.has_baseline_wiki {
-        copy_dir_all(&source.join("wiki"), &raw_dest.join("wiki"))?;
-    }
-
-    if inspection.kind == source_kind_name(MigrationSourceKind::ManualResearch) {
-        let docs_root = raw_dest.join("documents");
-        let mut copied_any = false;
-        for entry in WalkDir::new(source)
-            .into_iter()
-            .filter_entry(|entry| !should_skip_walk_entry(entry.path()))
-            .filter_map(Result::ok)
-        {
-            if !entry.file_type().is_file() || !is_markdown(entry.path()) {
-                continue;
-            }
-            let rel = match entry.path().strip_prefix(source) {
-                Ok(rel) => rel,
-                Err(_) => continue,
-            };
-            copy_file(entry.path(), &docs_root.join(rel))?;
-            copied_any = true;
-        }
-        if !copied_any {
-            warnings.push(format!(
-                "No markdown documents found in manual source {}",
-                source.display()
-            ));
-        }
-    }
-
-    Ok(())
-}
-
-fn copy_file(src: &Path, dst: &Path) -> Result<(), WorkspaceInitError> {
-    if let Some(parent) = dst.parent() {
-        fs::create_dir_all(parent)?;
-    }
-    fs::copy(src, dst)?;
-    Ok(())
-}
-
-fn copy_dir_all(src: &Path, dst: &Path) -> Result<(), WorkspaceInitError> {
-    if !src.exists() {
-        return Ok(());
-    }
-    for entry in WalkDir::new(src).into_iter().filter_map(Result::ok) {
-        let rel = match entry.path().strip_prefix(src) {
-            Ok(rel) => rel,
-            Err(_) => continue,
-        };
-        let target = dst.join(rel);
-        if entry.file_type().is_dir() {
-            fs::create_dir_all(&target)?;
-        } else if entry.file_type().is_file() {
-            if let Some(parent) = target.parent() {
-                fs::create_dir_all(parent)?;
-            }
-            fs::copy(entry.path(), &target)?;
-        }
-    }
-    Ok(())
-}
-
-fn unique_session_id(target_sessions_dir: &Path, original_id: &str) -> String {
-    let mut candidate = original_id.to_string();
-    let mut suffix = 1u32;
-    while target_sessions_dir.join(&candidate).exists() {
-        suffix += 1;
-        candidate = format!("{original_id}-m{suffix}");
-    }
-    candidate
-}
-
-fn rewrite_session_metadata_id(session_dir: &Path, new_id: &str) -> Result<(), WorkspaceInitError> {
-    let metadata_path = session_dir.join("metadata.json");
-    if !metadata_path.exists() {
-        return Ok(());
-    }
-    let content = fs::read_to_string(&metadata_path)?;
-    let mut info: SessionInfo = serde_json::from_str(&content)?;
-    info.id = new_id.to_string();
-    fs::write(&metadata_path, serde_json::to_string_pretty(&info)?)?;
-    Ok(())
-}
-
-fn read_settings_from_path(path: &Path) -> Result<PersistentSettings, WorkspaceInitError> {
-    let content = fs::read_to_string(path)?;
-    let parsed: serde_json::Value = serde_json::from_str(&content)?;
-    Ok(PersistentSettings::from_json(&parsed).unwrap_or_default())
-}
-
-fn merge_settings_missing(
-    target: &mut PersistentSettings,
-    incoming: &PersistentSettings,
-    filled_fields: &mut Vec<String>,
-) {
-    macro_rules! fill {
-        ($field:ident) => {
-            if target.$field.is_none() && incoming.$field.is_some() {
-                target.$field = incoming.$field.clone();
-                filled_fields.push(stringify!($field).to_string());
-            }
-        };
-    }
-    fill!(default_model);
-    fill!(default_reasoning_effort);
-    fill!(default_model_openai);
-    fill!(default_model_anthropic);
-    fill!(default_model_openrouter);
-    fill!(default_model_cerebras);
-    fill!(default_model_zai);
-    fill!(default_model_ollama);
-    fill!(zai_plan);
-    fill!(web_search_provider);
-}
-
-fn read_credentials_from_path(path: &Path) -> Result<CredentialBundle, WorkspaceInitError> {
-    let content = fs::read_to_string(path)?;
-    let parsed: HashMap<String, serde_json::Value> = serde_json::from_str(&content)?;
-    Ok(CredentialBundle::from_json(&parsed))
-}
-
-fn merge_credentials_missing(
-    target: &mut CredentialBundle,
-    incoming: &CredentialBundle,
-    filled_fields: &mut Vec<String>,
-) {
-    macro_rules! fill {
-        ($field:ident) => {
-            if target.$field.is_none() && incoming.$field.is_some() {
-                target.$field = incoming.$field.clone();
-                filled_fields.push(stringify!($field).to_string());
-            }
-        };
-    }
-    fill!(openai_api_key);
-    fill!(openai_oauth_token);
-    fill!(anthropic_api_key);
-    fill!(openrouter_api_key);
-    fill!(cerebras_api_key);
-    fill!(zai_api_key);
-    fill!(exa_api_key);
-    fill!(firecrawl_api_key);
-    fill!(brave_api_key);
-    fill!(tavily_api_key);
-    fill!(voyage_api_key);
-}
-
-fn clear_runtime_wiki_documents(wiki_dir: &Path) -> Result<(), WorkspaceInitError> {
-    if !wiki_dir.exists() {
-        return Ok(());
-    }
-    for entry in fs::read_dir(wiki_dir)? {
-        let entry = entry?;
-        let path = entry.path();
-        let name = entry.file_name();
-        let keep = name == "index.md" || name == "template.md";
-        if keep {
-            continue;
-        }
-        if path.is_dir() {
-            fs::remove_dir_all(path)?;
-        } else {
-            fs::remove_file(path)?;
-        }
-    }
-    Ok(())
-}
-
-fn build_target_curator_config(
-    runtime_config: &AgentConfig,
-    target: &Path,
-    merged_settings: &PersistentSettings,
-    merged_credentials: &CredentialBundle,
-) -> AgentConfig {
-    let mut config = runtime_config.clone();
-    config.workspace = target.to_path_buf();
-    apply_settings_to_config(&mut config, merged_settings);
-    merge_credentials_into_config(
-        &mut config,
-        merged_credentials,
-        &CredentialBundle::default(),
-    );
-    config
-}
-
-fn build_migration_curator_context(
-    target: &Path,
-    raw_root: &Path,
-    raw_specs: &[(SourceSpec, PathBuf)],
-) -> String {
-    let raw_root_display = raw_root
-        .strip_prefix(target)
-        .unwrap_or(raw_root)
-        .display()
-        .to_string();
-    let mut lines = vec![
-        "You are performing a one-time workspace migration rewrite for the Desktop app."
-            .to_string(),
-        format!("Target workspace: {}", target.display()),
-        "Rewrite the canonical Desktop wiki inside `.openplanter/wiki/`.".to_string(),
-        format!(
-            "Read imported raw material from `{raw_root_display}` and treat it as the source of truth."
-        ),
-        "Merge duplicate information across sources, keep the result factual and legible, preserve provenance, and update `.openplanter/wiki/index.md` to match the final page set.".to_string(),
-        "Do not write outside `.openplanter/wiki/`, and do not modify raw snapshots under `.openplanter/migration/raw/`.".to_string(),
-        String::new(),
-        "Ordered import sources:".to_string(),
-    ];
-    for (index, (spec, raw_dest)) in raw_specs.iter().enumerate() {
-        let raw_display = raw_dest
-            .strip_prefix(target)
-            .unwrap_or(raw_dest)
-            .display()
-            .to_string();
-        lines.push(format!(
-            "{}. kind={} | source={} | original_input={} | raw_snapshot={}",
-            index + 1,
-            spec.inspection.kind,
-            spec.canonical.display(),
-            spec.original,
-            raw_display
-        ));
-    }
-    lines.join("\n")
-}
-
-fn normalize_rewrite_summary(result: &CuratorResult) -> String {
-    let summary = result.summary.trim();
-    if summary.is_empty() {
-        format!(
-            "Curator rewrite completed with {} wiki file(s) changed.",
-            result.files_changed
-        )
-    } else {
-        summary.to_string()
-    }
-}
-
-fn count_runtime_wiki_pages(wiki_dir: &Path) -> u64 {
-    WalkDir::new(wiki_dir)
-        .into_iter()
-        .filter_entry(|entry| !should_skip_walk_entry(entry.path()))
-        .filter_map(Result::ok)
-        .filter(|entry| entry.file_type().is_file())
-        .filter(|entry| is_markdown(entry.path()))
-        .filter(|entry| {
-            entry
-                .path()
-                .file_name()
-                .and_then(|value| value.to_str())
-                .map(|name| {
-                    !name.eq_ignore_ascii_case("index.md")
-                        && !name.eq_ignore_ascii_case("template.md")
-                })
-                .unwrap_or(true)
-        })
-        .count() as u64
-}
-
-fn run_curator_blocking(
-    context: &str,
-    config: &AgentConfig,
-) -> Result<CuratorResult, WorkspaceInitError> {
-    let runtime = TokioRuntimeBuilder::new_current_thread()
-        .enable_all()
-        .build()
-        .map_err(|err| WorkspaceInitError::Curator(err.to_string()))?;
-    runtime
-        .block_on(run_curator(context, config, CancellationToken::new()))
-        .map_err(WorkspaceInitError::Curator)
-}
-
-#[cfg(test)]
-mod tests {
-    use super::*;
-    use crate::events::MigrationSourceInput;
-    use tempfile::tempdir;
-
-    fn runtime_config(workspace: &Path) -> AgentConfig {
-        let mut cfg = AgentConfig::from_env(workspace);
-        cfg.workspace = workspace.to_path_buf();
-        cfg.provider = "auto".to_string();
-        cfg.model = "seed-model".to_string();
-        cfg.api_key = None;
-        cfg.openai_api_key = None;
-        cfg.openai_oauth_token = None;
-        cfg
-    }
-
-    #[test]
-    fn standard_init_is_idempotent() {
-        let temp = tempdir().unwrap();
-        let first = run_standard_init(temp.path(), ".openplanter", false).unwrap();
-        assert!(
-            temp.path()
-                .join(".openplanter")
-                .join("wiki")
-                .join("index.md")
-                .exists()
-        );
-        assert!(first.onboarding_required);
-
-        let second = run_standard_init(temp.path(), ".openplanter", true).unwrap();
-        assert!(!second.onboarding_required);
-
-        let status = get_init_status(temp.path(), ".openplanter").unwrap();
-        assert_eq!(status.gate_state, "ready");
-    }
-
-    #[test]
-    fn inspect_source_detects_openplanter_workspace() {
-        let temp = tempdir().unwrap();
-        let root = temp.path().join(".openplanter");
-        fs::create_dir_all(root.join("sessions")).unwrap();
-        fs::write(root.join("settings.json"), "{}").unwrap();
-        fs::write(root.join("credentials.json"), "{}").unwrap();
-        fs::create_dir_all(root.join("wiki")).unwrap();
-        fs::write(root.join("wiki").join("index.md"), BASELINE_INDEX).unwrap();
-
-        let inspection = inspect_migration_source(temp.path());
-        assert_eq!(inspection.kind, "openplanter_workspace");
-        assert!(inspection.has_sessions);
-        assert!(inspection.has_settings);
-    }
-
-    #[test]
-    fn migration_preserves_sources_and_merges_sessions() {
-        let temp = tempdir().unwrap();
-        let source_a = temp.path().join("source-a");
-        let source_b = temp.path().join("source-b");
-        let target = temp.path().join("target");
-
-        for source in [&source_a, &source_b] {
-            fs::create_dir_all(source.join(".openplanter").join("sessions").join("same-id"))
-                .unwrap();
-            fs::create_dir_all(
-                source
-                    .join(".openplanter")
-                    .join("wiki")
-                    .join("campaign-finance"),
-            )
-            .unwrap();
-            fs::write(
-                source
-                    .join(".openplanter")
-                    .join("sessions")
-                    .join("same-id")
-                    .join("metadata.json"),
-                serde_json::to_string_pretty(&SessionInfo {
-                    id: "same-id".to_string(),
-                    created_at: "2026-01-01T00:00:00Z".to_string(),
-                    turn_count: 1,
-                    last_objective: Some("Investigate".to_string()),
-                })
-                .unwrap(),
-            )
-            .unwrap();
-            fs::write(
-                source
-                    .join(".openplanter")
-                    .join("wiki")
-                    .join("campaign-finance")
-                    .join(format!("{}.md", display_name(source))),
-                format!(
-                    "# {}\n\n## Summary\n\nImported from {}\n",
-                    display_name(source),
-                    source.display()
-                ),
-            )
-            .unwrap();
-        }
-
-        fs::write(
-            source_a.join(".openplanter").join("settings.json"),
-            "{\"default_model\":\"alpha\"}",
-        )
-        .unwrap();
-        fs::write(
-            source_b.join(".openplanter").join("credentials.json"),
-            "{\"openai_api_key\":\"secret\"}",
-        )
-        .unwrap();
-
-        let request = MigrationInitRequest {
-            target_workspace: target.display().to_string(),
-            sources: vec![
-                MigrationSourceInput {
-                    path: source_a.display().to_string(),
-                },
-                MigrationSourceInput {
-                    path: source_b.display().to_string(),
-                },
-            ],
-        };
-
-        let mut progress = Vec::new();
-        let mut run_count = 0u32;
-        let source_a_display = source_a.display().to_string();
-        let source_b_display = source_b.display().to_string();
-        let result = run_migration_init_with_runner(
-            &request,
-            &runtime_config(temp.path()),
-            |event| progress.push(event.stage),
-            |context, cfg| {
-                run_count += 1;
-                assert!(context.contains(".openplanter/migration/raw"));
-                assert!(context.contains(&source_a_display));
-                assert!(context.contains(&source_b_display));
-                assert_eq!(cfg.workspace, target);
-                assert_eq!(cfg.model, "alpha");
-                assert_eq!(cfg.openai_api_key.as_deref(), Some("secret"));
-
-                let wiki_dir = cfg.workspace.join(&cfg.session_root_dir).join("wiki");
-                fs::create_dir_all(wiki_dir.join("campaign-finance")).unwrap();
-                fs::write(
-                    wiki_dir.join("campaign-finance").join("merged.md"),
-                    "# Merged Source\n\n## Overview\n\nCurated output.\n",
-                )
-                .unwrap();
-                fs::write(wiki_dir.join("index.md"), BASELINE_INDEX).unwrap();
-
-                Ok(CuratorResult {
-                    summary: "Curator rewrote 1 wiki file from imported sources.".to_string(),
-                    files_changed: 1,
-                })
-            },
-        )
-        .unwrap();
-
-        assert_eq!(result.sessions_copied, 2);
-        assert_eq!(result.sessions_renamed, 1);
-        assert_eq!(result.wiki_files_synthesized, 1);
-        assert_eq!(
-            result.rewrite_summary,
-            "Curator rewrote 1 wiki file from imported sources."
-        );
-        assert_eq!(run_count, 1);
-        assert!(
-            target
-                .join(".openplanter")
-                .join("migration")
-                .join("raw")
-                .exists()
-        );
-        assert!(
-            source_a
-                .join(".openplanter")
-                .join("sessions")
-                .join("same-id")
-                .exists()
-        );
-        assert!(
-            target
-                .join(".openplanter")
-                .join("wiki")
-                .join("campaign-finance")
-                .exists()
-                || target
-                    .join(".openplanter")
-                    .join("wiki")
-                    .join("imported")
-                    .exists()
-        );
-        let settings = SettingsStore::new(&target, ".openplanter").load();
-        assert_eq!(settings.default_model.as_deref(), Some("alpha"));
-        let creds = CredentialStore::new(&target, ".openplanter").load();
-        assert_eq!(creds.openai_api_key.as_deref(), Some("secret"));
-        let synth_index = progress
-            .iter()
-            .position(|stage| stage == "synthesize")
-            .unwrap();
-        let rewrite_index = progress
-            .iter()
-            .position(|stage| stage == "rewrite")
-            .unwrap();
-        assert!(synth_index < rewrite_index);
-        assert_eq!(
-            progress
-                .iter()
-                .filter(|stage| stage.as_str() == "rewrite")
-                .count(),
-            2
-        );
-        assert_eq!(progress.last().map(String::as_str), Some("done"));
-    }
-
-    #[test]
-    fn migration_surfaces_curator_errors_after_preserving_raw_sources() {
-        let temp = tempdir().unwrap();
-        let source = temp.path().join("source-a");
-        let target = temp.path().join("target");
-
-        fs::create_dir_all(source.join(".openplanter").join("sessions").join("same-id")).unwrap();
-        fs::create_dir_all(source.join(".openplanter").join("wiki")).unwrap();
-        fs::write(
-            source.join(".openplanter").join("wiki").join("source-a.md"),
-            "# Source A\n",
-        )
-        .unwrap();
-
-        let request = MigrationInitRequest {
-            target_workspace: target.display().to_string(),
-            sources: vec![MigrationSourceInput {
-                path: source.display().to_string(),
-            }],
-        };
-
-        let result = run_migration_init_with_runner(
-            &request,
-            &runtime_config(temp.path()),
-            |_| {},
-            |_context, _cfg| {
-                Err(WorkspaceInitError::Curator(
-                    "missing credentials".to_string(),
-                ))
-            },
-        );
-
-        assert!(matches!(
-            result,
-            Err(WorkspaceInitError::Curator(message)) if message == "missing credentials"
-        ));
-        assert!(
-            target
-                .join(".openplanter")
-                .join("migration")
-                .join("raw")
-                .exists()
-        );
-        assert!(
-            source
-                .join(".openplanter")
-                .join("wiki")
-                .join("source-a.md")
-                .exists()
-        );
-    }
-}
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
index 0bf58ff4..f2a7b3af 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/agent.rs
@@ -12,7 +12,6 @@ use op_core::engine::investigation_state::{
 };
 use op_core::engine::{SolveEmitter, SolveInitialContext};
 use op_core::session::replay::{ReplayEntry, ReplayLogger};
-use op_core::workspace_init;
 
 async fn build_solve_initial_context(
     session_dir: &Path,
@@ -49,29 +48,15 @@ pub async fn solve(
     app: AppHandle,
     state: State<'_, AppState>,
 ) -> Result<(), String> {
-    let cfg = state.config.lock().await.clone();
-    let init_status = workspace_init::get_init_status(&cfg.workspace, &cfg.session_root_dir)
-        .map_err(|e| e.to_string())?;
-    if init_status.gate_state != "ready" {
-        return Err("Workspace initialization is not complete. Run /init first.".to_string());
-    }
-
-    {
-        let mut running = state.agent_running.lock().await;
-        if *running {
-            return Err("An agent task is already running.".to_string());
-        }
-        *running = true;
-    }
-
     // Create a fresh cancellation token for this solve run
     let token = CancellationToken::new();
     {
         let mut current = state.cancel_token.lock().await;
         *current = token.clone();
     }
+
+    let cfg = state.config.lock().await.clone();
     let error_handle = app.clone();
-    let running_flag = state.agent_running.clone();
 
     // Set up replay logging for this session
     let session_dir = sessions_dir(&state).await.join(&session_id);
@@ -134,11 +119,6 @@ pub async fn solve(
         })
         .await;
 
-        {
-            let mut running = running_flag.lock().await;
-            *running = false;
-        }
-
         // If the inner task panicked, emit an error so the frontend
         // doesn't get stuck in "running" state forever.
         if let Err(e) = result {
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/init.rs b/openplanter-desktop/crates/op-tauri/src/commands/init.rs
deleted file mode 100644
index 8e96e7f6..00000000
--- a/openplanter-desktop/crates/op-tauri/src/commands/init.rs
+++ /dev/null
@@ -1,82 +0,0 @@
-use std::path::PathBuf;
-
-use crate::state::AppState;
-use op_core::events::{
-    InitStatusView, MigrationInitRequest, MigrationInitResultView, MigrationSourceInspection,
-    StandardInitReportView,
-};
-use op_core::workspace_init;
-use tauri::{AppHandle, Emitter, State};
-
-async fn current_workspace_config(state: &State<'_, AppState>) -> op_core::config::AgentConfig {
-    state.config.lock().await.clone()
-}
-
-async fn ensure_idle(state: &State<'_, AppState>) -> Result<(), String> {
-    if *state.agent_running.lock().await {
-        return Err("Cannot run init while the agent is active".to_string());
-    }
-    Ok(())
-}
-
-#[tauri::command]
-pub async fn get_init_status(state: State<'_, AppState>) -> Result<InitStatusView, String> {
-    let cfg = current_workspace_config(&state).await;
-    workspace_init::get_init_status(&cfg.workspace, &cfg.session_root_dir)
-        .map_err(|e| e.to_string())
-}
-
-#[tauri::command]
-pub async fn run_standard_init(
-    state: State<'_, AppState>,
-) -> Result<StandardInitReportView, String> {
-    ensure_idle(&state).await?;
-    let _guard = state.init_lock.lock().await;
-    let cfg = current_workspace_config(&state).await;
-    tokio::task::spawn_blocking(move || {
-        workspace_init::run_standard_init(&cfg.workspace, &cfg.session_root_dir, true)
-    })
-    .await
-    .map_err(|e| e.to_string())?
-    .map_err(|e| e.to_string())
-}
-
-#[tauri::command]
-pub async fn complete_first_run_gate(state: State<'_, AppState>) -> Result<InitStatusView, String> {
-    ensure_idle(&state).await?;
-    let _guard = state.init_lock.lock().await;
-    let cfg = current_workspace_config(&state).await;
-    tokio::task::spawn_blocking(move || {
-        workspace_init::complete_first_run_gate(&cfg.workspace, &cfg.session_root_dir)
-    })
-    .await
-    .map_err(|e| e.to_string())?
-    .map_err(|e| e.to_string())
-}
-
-#[tauri::command]
-pub async fn inspect_migration_source(path: String) -> Result<MigrationSourceInspection, String> {
-    let path = PathBuf::from(path);
-    tokio::task::spawn_blocking(move || workspace_init::inspect_migration_source(&path))
-        .await
-        .map_err(|e| e.to_string())
-}
-
-#[tauri::command]
-pub async fn run_migration_init(
-    request: MigrationInitRequest,
-    app: AppHandle,
-    state: State<'_, AppState>,
-) -> Result<MigrationInitResultView, String> {
-    ensure_idle(&state).await?;
-    let _guard = state.init_lock.lock().await;
-    let cfg = current_workspace_config(&state).await;
-    tokio::task::spawn_blocking(move || {
-        workspace_init::run_migration_init(&request, &cfg, |event| {
-            let _ = app.emit("init:migration-progress", event);
-        })
-    })
-    .await
-    .map_err(|e| e.to_string())?
-    .map_err(|e| e.to_string())
-}
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/mod.rs b/openplanter-desktop/crates/op-tauri/src/commands/mod.rs
index b4525a46..4f02ad95 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/mod.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/mod.rs
@@ -1,5 +1,4 @@
 pub mod agent;
 pub mod config;
-pub mod init;
 pub mod session;
 pub mod wiki;
diff --git a/openplanter-desktop/crates/op-tauri/src/main.rs b/openplanter-desktop/crates/op-tauri/src/main.rs
index 49cefe20..edf948cf 100644
--- a/openplanter-desktop/crates/op-tauri/src/main.rs
+++ b/openplanter-desktop/crates/op-tauri/src/main.rs
@@ -23,11 +23,6 @@ fn main() {
             commands::config::list_models,
             commands::config::save_settings,
             commands::config::get_credentials_status,
-            commands::init::get_init_status,
-            commands::init::run_standard_init,
-            commands::init::complete_first_run_gate,
-            commands::init::inspect_migration_source,
-            commands::init::run_migration_init,
             commands::session::list_sessions,
             commands::session::open_session,
             commands::session::delete_session,
diff --git a/openplanter-desktop/crates/op-tauri/src/state.rs b/openplanter-desktop/crates/op-tauri/src/state.rs
index 45e9cc95..3d72dfe8 100644
--- a/openplanter-desktop/crates/op-tauri/src/state.rs
+++ b/openplanter-desktop/crates/op-tauri/src/state.rs
@@ -1,11 +1,11 @@
-use op_core::config::AgentConfig;
-use op_core::config_hydration::{apply_settings_to_config, merge_credentials_into_config};
-use op_core::credentials::CredentialBundle;
-use op_core::credentials::{credentials_from_env, discover_env_candidates, parse_env_file};
-#[cfg(test)]
-use op_core::settings::PersistentSettings;
-use op_core::settings::SettingsStore;
-use op_core::workspace_init;
+use op_core::config::{
+    AgentConfig, FOUNDRY_OPENAI_API_KEY_PLACEHOLDER, normalize_web_search_provider,
+    normalize_zai_plan, resolve_openai_api_key, resolve_zai_base_url,
+};
+use op_core::credentials::{
+    CredentialBundle, credentials_from_env, discover_env_candidates, parse_env_file,
+};
+use op_core::settings::{PersistentSettings, SettingsStore};
 use std::env;
 use std::fs;
 use std::path::{Path, PathBuf};
@@ -37,6 +37,124 @@ struct LegacyMigrationReport {
     errors: Vec<String>,
 }
 
+/// Merge credentials into an AgentConfig.
+/// Priority: existing config value > env_creds > file_creds.
+pub fn merge_credentials_into_config(
+    cfg: &mut AgentConfig,
+    env_creds: &CredentialBundle,
+    file_creds: &CredentialBundle,
+) {
+    if cfg.openai_oauth_token.is_none() {
+        cfg.openai_oauth_token = env_creds
+            .openai_oauth_token
+            .clone()
+            .or_else(|| file_creds.openai_oauth_token.clone());
+    }
+    cfg.openai_api_key = cfg
+        .openai_api_key
+        .clone()
+        .filter(|value| {
+            let trimmed = value.trim();
+            !trimmed.is_empty() && trimmed != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
+        })
+        .or_else(|| env_creds.openai_api_key.clone())
+        .or_else(|| file_creds.openai_api_key.clone())
+        .or_else(|| cfg.openai_api_key.clone());
+    cfg.openai_api_key = resolve_openai_api_key(
+        cfg.openai_api_key.clone(),
+        &cfg.openai_base_url,
+        cfg.openai_oauth_token.clone(),
+    );
+    cfg.api_key = resolve_openai_api_key(
+        cfg.openai_api_key
+            .clone()
+            .filter(|value| {
+                let trimmed = value.trim();
+                !trimmed.is_empty() && trimmed != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
+            })
+            .or_else(|| {
+                cfg.api_key.clone().filter(|value| {
+                    let trimmed = value.trim();
+                    !trimmed.is_empty() && trimmed != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
+                })
+            })
+            .or_else(|| cfg.openai_api_key.clone())
+            .or_else(|| cfg.api_key.clone()),
+        &cfg.base_url,
+        cfg.openai_oauth_token.clone(),
+    );
+
+    macro_rules! merge {
+        ($field:ident) => {
+            if cfg.$field.is_none() {
+                cfg.$field = env_creds
+                    .$field
+                    .clone()
+                    .or_else(|| file_creds.$field.clone());
+            }
+        };
+    }
+    merge!(anthropic_api_key);
+    merge!(openrouter_api_key);
+    merge!(cerebras_api_key);
+    merge!(zai_api_key);
+    merge!(exa_api_key);
+    merge!(firecrawl_api_key);
+    merge!(brave_api_key);
+    merge!(tavily_api_key);
+    merge!(voyage_api_key);
+}
+
+fn has_env_value(keys: &[&str]) -> bool {
+    keys.iter().any(|key| {
+        env::var(key)
+            .ok()
+            .map(|value| !value.trim().is_empty())
+            .unwrap_or(false)
+    })
+}
+
+fn apply_settings_to_config(cfg: &mut AgentConfig, settings: &PersistentSettings) {
+    if !has_env_value(&["OPENPLANTER_REASONING_EFFORT"]) {
+        if let Some(reasoning_effort) = settings.default_reasoning_effort.clone() {
+            cfg.reasoning_effort = Some(reasoning_effort);
+        }
+    }
+
+    if !has_env_value(&["OPENPLANTER_ZAI_PLAN"]) {
+        if let Some(plan) = settings.zai_plan.as_deref() {
+            cfg.zai_plan = normalize_zai_plan(Some(plan));
+        }
+    }
+
+    if !has_env_value(&["OPENPLANTER_ZAI_BASE_URL"]) {
+        cfg.zai_base_url = resolve_zai_base_url(
+            &cfg.zai_plan,
+            &cfg.zai_paygo_base_url,
+            &cfg.zai_coding_base_url,
+        );
+    }
+
+    if !has_env_value(&["OPENPLANTER_WEB_SEARCH_PROVIDER"]) {
+        if let Some(provider) = settings.web_search_provider.as_deref() {
+            cfg.web_search_provider = normalize_web_search_provider(Some(provider));
+        }
+    }
+
+    if !has_env_value(&["OPENPLANTER_MODEL"]) {
+        let saved_model = if cfg.provider == "auto" {
+            settings.default_model.as_deref()
+        } else {
+            settings
+                .default_model_for_provider(cfg.provider.as_str())
+                .or(settings.default_model.as_deref())
+        };
+        if let Some(model) = saved_model {
+            cfg.model = model.to_string();
+        }
+    }
+}
+
 fn canonicalize_or_self(path: &Path) -> PathBuf {
     path.canonicalize().unwrap_or_else(|_| path.to_path_buf())
 }
@@ -254,8 +372,6 @@ pub struct AppState {
     pub config: Arc<Mutex<AgentConfig>>,
     pub session_id: Arc<Mutex<Option<String>>>,
     pub cancel_token: Arc<Mutex<CancellationToken>>,
-    pub agent_running: Arc<Mutex<bool>>,
-    pub init_lock: Arc<Mutex<()>>,
     startup_trace: String,
 }
 
@@ -265,11 +381,6 @@ impl AppState {
         let resolved_workspace = resolve_desktop_workspace();
         let mut cfg = AgentConfig::from_env(&resolved_workspace.path);
         let migration = migrate_legacy_desktop_state(&cfg.workspace, &cfg.session_root_dir);
-        if let Err(err) =
-            workspace_init::run_standard_init(&cfg.workspace, &cfg.session_root_dir, false)
-        {
-            eprintln!("[startup:init] {err}");
-        }
 
         // Load .env files and merge credentials into config
         let env_creds = credentials_from_env();
@@ -292,8 +403,6 @@ impl AppState {
             config: Arc::new(Mutex::new(cfg)),
             session_id: Arc::new(Mutex::new(None)),
             cancel_token: Arc::new(Mutex::new(CancellationToken::new())),
-            agent_running: Arc::new(Mutex::new(false)),
-            init_lock: Arc::new(Mutex::new(())),
             startup_trace: format_startup_trace(&current_dir, &resolved_workspace, &migration),
         }
     }
diff --git a/openplanter-desktop/frontend/src/api/events.test.ts b/openplanter-desktop/frontend/src/api/events.test.ts
index 8e7618bb..859e859e 100644
--- a/openplanter-desktop/frontend/src/api/events.test.ts
+++ b/openplanter-desktop/frontend/src/api/events.test.ts
@@ -19,7 +19,6 @@ import {
   onAgentCompleteEvent,
   onAgentError,
   onLoopHealth,
-  onMigrationProgress,
   onWikiUpdated,
 } from "./events";
 
@@ -135,21 +134,6 @@ describe("event listeners", () => {
     expect(callback).toHaveBeenCalledWith(graphData);
   });
 
-  it("onMigrationProgress registers listener and forwards progress payload", async () => {
-    const callback = vi.fn();
-    await onMigrationProgress(callback);
-
-    const handler = listeners.get("init:migration-progress")!;
-    const payload = {
-      stage: "copy",
-      message: "Copying raw content",
-      current: 1,
-      total: 3,
-    };
-    handler({ payload });
-    expect(callback).toHaveBeenCalledWith(payload);
-  });
-
   it("onLoopHealth registers listener and forwards payload", async () => {
     const callback = vi.fn();
     await onLoopHealth(callback);
@@ -182,7 +166,6 @@ describe("event listeners", () => {
     handler({ payload });
     expect(callback).toHaveBeenCalledWith(payload);
   });
-
   it("all listeners return unlisten function", async () => {
     const noop = vi.fn();
     const unlistens = await Promise.all([
@@ -193,7 +176,6 @@ describe("event listeners", () => {
       onAgentCompleteEvent(noop),
       onAgentError(noop),
       onLoopHealth(noop),
-      onMigrationProgress(noop),
       onWikiUpdated(noop),
     ]);
     for (const u of unlistens) {
diff --git a/openplanter-desktop/frontend/src/api/events.ts b/openplanter-desktop/frontend/src/api/events.ts
index a00b62ee..f736485c 100644
--- a/openplanter-desktop/frontend/src/api/events.ts
+++ b/openplanter-desktop/frontend/src/api/events.ts
@@ -6,7 +6,6 @@ import type {
   DeltaEvent,
   GraphData,
   LoopHealthEvent,
-  MigrationProgressEvent,
   StepEvent,
 } from "./types";
 
@@ -63,15 +62,6 @@ export function onCuratorUpdate(
     callback(e.payload)
   );
 }
-
-export function onMigrationProgress(
-  callback: (event: MigrationProgressEvent) => void
-): Promise<UnlistenFn> {
-  return listen<MigrationProgressEvent>("init:migration-progress", (e) =>
-    callback(e.payload)
-  );
-}
-
 export function onLoopHealth(
   callback: (event: LoopHealthEvent) => void
 ): Promise<UnlistenFn> {
diff --git a/openplanter-desktop/frontend/src/api/invoke.test.ts b/openplanter-desktop/frontend/src/api/invoke.test.ts
index 69797e64..a67ad6c1 100644
--- a/openplanter-desktop/frontend/src/api/invoke.test.ts
+++ b/openplanter-desktop/frontend/src/api/invoke.test.ts
@@ -18,11 +18,7 @@ import {
   openSession,
   deleteSession,
   getGraphData,
-  getInitStatus,
-  inspectMigrationSource,
   debugLog,
-  runMigrationInit,
-  runStandardInit,
 } from "./invoke";
 
 describe("invoke wrappers", () => {
@@ -215,84 +211,6 @@ describe("invoke wrappers", () => {
     await debugLog("test message");
   });
 
-  it("getInitStatus calls invoke", async () => {
-    __setHandler("get_init_status", () => ({
-      runtime_workspace: "/tmp/ws",
-      gate_state: "requires_action",
-      onboarding_completed: false,
-      has_openplanter_root: true,
-      has_runtime_wiki: true,
-      has_runtime_index: true,
-      init_state_path: "/tmp/ws/.openplanter/init-state.json",
-      last_migration_target: null,
-      warnings: [],
-    }));
-    const status = await getInitStatus();
-    expect(status.runtime_workspace).toBe("/tmp/ws");
-    expect(status.gate_state).toBe("requires_action");
-  });
-
-  it("runStandardInit calls invoke", async () => {
-    __setHandler("run_standard_init", () => ({
-      workspace: "/tmp/ws",
-      created_paths: ["/tmp/ws/.openplanter"],
-      copied_paths: ["/tmp/ws/.openplanter/wiki/index.md"],
-      skipped_existing: 0,
-      errors: [],
-      onboarding_required: false,
-    }));
-    const report = await runStandardInit();
-    expect(report.workspace).toBe("/tmp/ws");
-    expect(report.created_paths).toHaveLength(1);
-  });
-
-  it("inspectMigrationSource sends path", async () => {
-    __setHandler("inspect_migration_source", ({ path }: any) => {
-      expect(path).toBe("/tmp/source");
-      return {
-        path,
-        kind: "manual_research",
-        has_sessions: false,
-        has_settings: false,
-        has_credentials: false,
-        has_runtime_wiki: false,
-        has_baseline_wiki: false,
-        markdown_files: 4,
-        warnings: [],
-      };
-    });
-    const inspection = await inspectMigrationSource("/tmp/source");
-    expect(inspection.kind).toBe("manual_research");
-    expect(inspection.markdown_files).toBe(4);
-  });
-
-  it("runMigrationInit sends request payload", async () => {
-    __setHandler("run_migration_init", ({ request }: any) => {
-      expect(request.target_workspace).toBe("/tmp/target");
-      expect(request.sources).toEqual([{ path: "/tmp/a" }, { path: "/tmp/b" }]);
-      return {
-        target_workspace: "/tmp/target",
-        sources: ["/tmp/a", "/tmp/b"],
-        sessions_copied: 2,
-        sessions_renamed: 1,
-        settings_merged_fields: ["default_model"],
-        credentials_merged_fields: ["openai_api_key"],
-        wiki_files_synthesized: 3,
-        raw_preservation_root: "/tmp/target/.openplanter/migration/raw",
-        rewrite_summary: "Curator rewrote 3 wiki files from imported sources.",
-        restart_required: true,
-        restart_message: "Restart required",
-        warnings: [],
-      };
-    });
-    const result = await runMigrationInit({
-      target_workspace: "/tmp/target",
-      sources: [{ path: "/tmp/a" }, { path: "/tmp/b" }],
-    });
-    expect(result.sessions_copied).toBe(2);
-    expect(result.restart_required).toBe(true);
-  });
-
   it("unhandled command rejects", async () => {
     await expect(solve("test", "s1")).rejects.toThrow("No mock for command: solve");
   });
diff --git a/openplanter-desktop/frontend/src/api/invoke.ts b/openplanter-desktop/frontend/src/api/invoke.ts
index f07662a5..c3094dee 100644
--- a/openplanter-desktop/frontend/src/api/invoke.ts
+++ b/openplanter-desktop/frontend/src/api/invoke.ts
@@ -3,16 +3,11 @@ import { invoke } from "@tauri-apps/api/core";
 import type {
   ConfigView,
   GraphData,
-  InitStatusView,
-  MigrationInitRequest,
-  MigrationInitResultView,
-  MigrationSourceInspection,
   ModelInfo,
   PartialConfig,
   PersistentSettings,
   ReplayEntry,
   SessionInfo,
-  StandardInitReportView,
 } from "./types";
 
 export async function solve(objective: string, sessionId: string): Promise<void> {
@@ -73,27 +68,3 @@ export async function readWikiFile(path: string): Promise<string> {
 export async function debugLog(msg: string): Promise<void> {
   return invoke("debug_log", { msg });
 }
-
-export async function getInitStatus(): Promise<InitStatusView> {
-  return invoke("get_init_status");
-}
-
-export async function runStandardInit(): Promise<StandardInitReportView> {
-  return invoke("run_standard_init");
-}
-
-export async function completeFirstRunGate(): Promise<InitStatusView> {
-  return invoke("complete_first_run_gate");
-}
-
-export async function inspectMigrationSource(
-  path: string
-): Promise<MigrationSourceInspection> {
-  return invoke("inspect_migration_source", { path });
-}
-
-export async function runMigrationInit(
-  request: MigrationInitRequest
-): Promise<MigrationInitResultView> {
-  return invoke("run_migration_init", { request });
-}
diff --git a/openplanter-desktop/frontend/src/api/types.ts b/openplanter-desktop/frontend/src/api/types.ts
index d0114632..bce28406 100644
--- a/openplanter-desktop/frontend/src/api/types.ts
+++ b/openplanter-desktop/frontend/src/api/types.ts
@@ -157,82 +157,6 @@ export interface SlashResult {
   success: boolean;
 }
 
-export type InitGateState = "ready" | "requires_action" | "blocked";
-export type MigrationSourceKind = "openplanter_workspace" | "manual_research" | "unknown";
-export type MigrationProgressStage =
-  | "inspect"
-  | "copy"
-  | "merge_sessions"
-  | "merge_settings"
-  | "merge_credentials"
-  | "synthesize"
-  | "rewrite"
-  | "done";
-
-export interface StandardInitReportView {
-  workspace: string;
-  created_paths: string[];
-  copied_paths: string[];
-  skipped_existing: number;
-  errors: string[];
-  onboarding_required: boolean;
-}
-
-export interface InitStatusView {
-  runtime_workspace: string;
-  gate_state: InitGateState;
-  onboarding_completed: boolean;
-  has_openplanter_root: boolean;
-  has_runtime_wiki: boolean;
-  has_runtime_index: boolean;
-  init_state_path: string;
-  last_migration_target: string | null;
-  warnings: string[];
-}
-
-export interface MigrationSourceInspection {
-  path: string;
-  kind: MigrationSourceKind;
-  has_sessions: boolean;
-  has_settings: boolean;
-  has_credentials: boolean;
-  has_runtime_wiki: boolean;
-  has_baseline_wiki: boolean;
-  markdown_files: number;
-  warnings: string[];
-}
-
-export interface MigrationSourceInput {
-  path: string;
-}
-
-export interface MigrationInitRequest {
-  target_workspace: string;
-  sources: MigrationSourceInput[];
-}
-
-export interface MigrationProgressEvent {
-  stage: MigrationProgressStage;
-  message: string;
-  current: number;
-  total: number;
-}
-
-export interface MigrationInitResultView {
-  target_workspace: string;
-  sources: string[];
-  sessions_copied: number;
-  sessions_renamed: number;
-  settings_merged_fields: string[];
-  credentials_merged_fields: string[];
-  wiki_files_synthesized: number;
-  raw_preservation_root: string;
-  rewrite_summary: string;
-  restart_required: boolean;
-  restart_message: string;
-  warnings: string[];
-}
-
 export interface StepToolCallEntry {
   name: string;
   key_arg: string;
diff --git a/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts b/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
index 42915f39..4ef78cf7 100644
--- a/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
+++ b/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
@@ -26,7 +26,6 @@ describe("completionRegistry", () => {
     expect(values).toContain("/zai-plan");
     expect(values).toContain("/web-search");
     expect(values).toContain("/reasoning");
-    expect(values).toContain("/init");
   });
 
   it("every item has a non-empty value and description", () => {
@@ -115,16 +114,4 @@ describe("completionRegistry", () => {
     expect(helpCmd).toBeDefined();
     expect(helpCmd!.children).toBeUndefined();
   });
-
-  it("/init has expected subcommands", () => {
-    const initCmd = COMMAND_COMPLETIONS.find((c) => c.value === "/init");
-    expect(initCmd).toBeDefined();
-    expect(initCmd!.children?.map((child) => child.value)).toEqual([
-      "status",
-      "standard",
-      "migrate",
-      "open",
-      "done",
-    ]);
-  });
 });
diff --git a/openplanter-desktop/frontend/src/commands/completionRegistry.ts b/openplanter-desktop/frontend/src/commands/completionRegistry.ts
index e7ae9ab8..973dc00e 100644
--- a/openplanter-desktop/frontend/src/commands/completionRegistry.ts
+++ b/openplanter-desktop/frontend/src/commands/completionRegistry.ts
@@ -78,15 +78,4 @@ export const COMMAND_COMPLETIONS: CompletionItem[] = [
     description: "Set reasoning effort",
     children: REASONING_LEVELS,
   },
-  {
-    value: "/init",
-    description: "Workspace initialization and migration",
-    children: [
-      { value: "status", description: "Show init status" },
-      { value: "standard", description: "Initialize the current workspace" },
-      { value: "migrate", description: "Open the migration init panel" },
-      { value: "open", description: "Open the init panel" },
-      { value: "done", description: "Mark the first-run gate complete" },
-    ],
-  },
 ];
diff --git a/openplanter-desktop/frontend/src/commands/init.ts b/openplanter-desktop/frontend/src/commands/init.ts
deleted file mode 100644
index 44bff941..00000000
--- a/openplanter-desktop/frontend/src/commands/init.ts
+++ /dev/null
@@ -1,133 +0,0 @@
-import {
-  completeFirstRunGate,
-  getInitStatus,
-  runStandardInit,
-} from "../api/invoke";
-import type { InitStatusView } from "../api/types";
-import { appState } from "../state/store";
-import type { CommandResult } from "./model";
-
-function statusLines(status: InitStatusView): string[] {
-  return [
-    `Workspace:   ${status.runtime_workspace}`,
-    `Gate:        ${status.gate_state}`,
-    `Initialized: ${status.onboarding_completed ? "yes" : "no"}`,
-    `Wiki root:   ${status.has_runtime_wiki ? "yes" : "no"}`,
-    `Wiki index:  ${status.has_runtime_index ? "yes" : "no"}`,
-    `Last migration target: ${status.last_migration_target || "—"}`,
-    ...status.warnings.map((warning) => `Warning: ${warning}`),
-  ];
-}
-
-export async function handleInitCommand(args: string): Promise<CommandResult> {
-  const parts = args.trim().split(/\s+/).filter(Boolean);
-  const subcommand = (parts[0] || "status").toLowerCase();
-
-  if (appState.get().isInitBusy) {
-    return {
-      action: "handled",
-      lines: ["Initialization is already running. Wait for it to finish first."],
-    };
-  }
-
-  if (subcommand === "status") {
-    const status = await getInitStatus();
-    appState.update((s) => ({
-      ...s,
-      initStatus: status,
-      initGateState: status.gate_state,
-      initGateVisible: status.gate_state !== "ready" ? true : s.initGateVisible,
-    }));
-    return { action: "handled", lines: statusLines(status) };
-  }
-
-  if (subcommand === "standard") {
-    try {
-      appState.update((s) => ({ ...s, isInitBusy: true, migrationResult: null }));
-      const report = await runStandardInit();
-      const status = await getInitStatus();
-      appState.update((s) => ({
-        ...s,
-        isInitBusy: false,
-        initStatus: status,
-        initGateState: status.gate_state,
-        initGateVisible: status.gate_state !== "ready" ? true : false,
-        initGateMode: "standard",
-        migrationProgress: null,
-      }));
-      if (typeof window !== "undefined") {
-        window.dispatchEvent(new CustomEvent("curator-done"));
-      }
-      return {
-        action: "handled",
-        lines: [
-          `Standard init completed for ${report.workspace}.`,
-          `Created paths: ${report.created_paths.length}`,
-          `Copied files: ${report.copied_paths.length}`,
-          `Skipped existing: ${report.skipped_existing}`,
-          ...statusLines(status),
-        ],
-      };
-    } catch (error) {
-      appState.update((s) => ({ ...s, isInitBusy: false }));
-      return {
-        action: "handled",
-        lines: [`Standard init failed: ${error}`],
-      };
-    }
-  }
-
-  if (subcommand === "migrate") {
-    appState.update((s) => ({
-      ...s,
-      initGateVisible: true,
-      initGateMode: "migration",
-      migrationResult: null,
-    }));
-    return {
-      action: "handled",
-      lines: ["Opened Migration Init. Add a target workspace and one or more sources in the setup panel."],
-    };
-  }
-
-  if (subcommand === "open") {
-    appState.update((s) => ({
-      ...s,
-      initGateVisible: true,
-      initGateMode: s.initGateMode,
-    }));
-    return {
-      action: "handled",
-      lines: ["Opened the workspace initialization panel."],
-    };
-  }
-
-  if (subcommand === "done") {
-    try {
-      appState.update((s) => ({ ...s, isInitBusy: true }));
-      const status = await completeFirstRunGate();
-      appState.update((s) => ({
-        ...s,
-        isInitBusy: false,
-        initStatus: status,
-        initGateState: status.gate_state,
-        initGateVisible: status.gate_state !== "ready",
-      }));
-      return { action: "handled", lines: statusLines(status) };
-    } catch (error) {
-      appState.update((s) => ({ ...s, isInitBusy: false }));
-      return {
-        action: "handled",
-        lines: [`Failed to complete onboarding: ${error}`],
-      };
-    }
-  }
-
-  return {
-    action: "handled",
-    lines: [
-      `Unknown /init subcommand: ${subcommand}`,
-      "Use /init status, /init standard, or /init migrate.",
-    ],
-  };
-}
diff --git a/openplanter-desktop/frontend/src/commands/slash.test.ts b/openplanter-desktop/frontend/src/commands/slash.test.ts
index d5db6e44..e95062f4 100644
--- a/openplanter-desktop/frontend/src/commands/slash.test.ts
+++ b/openplanter-desktop/frontend/src/commands/slash.test.ts
@@ -21,7 +21,6 @@ describe("dispatchSlashCommand", () => {
       webSearchProvider: "exa",
       sessionId: "20260101-120000-deadbeef",
       reasoningEffort: "medium",
-      initGateState: "ready",
     });
   });
 
@@ -167,46 +166,4 @@ describe("dispatchSlashCommand", () => {
 
     (globalThis as any).window = origWindow;
   });
-
-  it("/init status dispatches", async () => {
-    __setHandler("get_init_status", () => ({
-      runtime_workspace: "/tmp/ws",
-      gate_state: "requires_action",
-      onboarding_completed: false,
-      has_openplanter_root: true,
-      has_runtime_wiki: true,
-      has_runtime_index: true,
-      init_state_path: "/tmp/ws/.openplanter/init-state.json",
-      last_migration_target: null,
-      warnings: [],
-    }));
-    const result = await dispatchSlashCommand("/init status");
-    expect(result).not.toBeNull();
-    expect(result!.lines.some((l) => l.includes("Gate:"))).toBe(true);
-  });
-
-  it("/init standard dispatches", async () => {
-    __setHandler("run_standard_init", () => ({
-      workspace: "/tmp/ws",
-      created_paths: [],
-      copied_paths: [],
-      skipped_existing: 0,
-      errors: [],
-      onboarding_required: false,
-    }));
-    __setHandler("get_init_status", () => ({
-      runtime_workspace: "/tmp/ws",
-      gate_state: "ready",
-      onboarding_completed: true,
-      has_openplanter_root: true,
-      has_runtime_wiki: true,
-      has_runtime_index: true,
-      init_state_path: "/tmp/ws/.openplanter/init-state.json",
-      last_migration_target: null,
-      warnings: [],
-    }));
-    const result = await dispatchSlashCommand("/init standard");
-    expect(result).not.toBeNull();
-    expect(result!.lines.some((l) => l.includes("Standard init completed"))).toBe(true);
-  });
 });
diff --git a/openplanter-desktop/frontend/src/commands/slash.ts b/openplanter-desktop/frontend/src/commands/slash.ts
index 67d1a584..fb5cb23d 100644
--- a/openplanter-desktop/frontend/src/commands/slash.ts
+++ b/openplanter-desktop/frontend/src/commands/slash.ts
@@ -5,7 +5,6 @@ import { handleModelCommand, type CommandResult } from "./model";
 import { handleReasoningCommand } from "./reasoning";
 import { handleWebSearchCommand } from "./webSearch";
 import { handleZaiPlanCommand } from "./zaiPlan";
-import { handleInitCommand } from "./init";
 
 /** Dispatch a slash command. Returns null if not a slash command. */
 export async function dispatchSlashCommand(input: string): Promise<CommandResult | null> {
@@ -39,9 +38,6 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
           "  /web-search <provider> --save  Set and persist",
           "  /reasoning          Show/set reasoning effort",
           "  /reasoning <level>  Set level (low, medium, high, off)",
-          "  /init status        Show workspace init status",
-          "  /init standard      Initialize the current workspace",
-          "  /init migrate       Open the migration init panel",
         ],
       };
 
@@ -117,9 +113,6 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
     case "/reasoning":
       return handleReasoningCommand(args);
 
-    case "/init":
-      return handleInitCommand(args);
-
     default:
       return {
         action: "handled",
diff --git a/openplanter-desktop/frontend/src/components/App.test.ts b/openplanter-desktop/frontend/src/components/App.test.ts
index 19d87533..1a3d0bd6 100644
--- a/openplanter-desktop/frontend/src/components/App.test.ts
+++ b/openplanter-desktop/frontend/src/components/App.test.ts
@@ -44,17 +44,7 @@ describe("createApp", () => {
 
   beforeEach(() => {
     uuidCounter = 0;
-    appState.set({
-      ...originalState,
-      messages: [],
-      sessionId: null,
-      initGateVisible: false,
-      initGateState: "ready",
-      initStatus: null,
-      isInitBusy: false,
-      migrationProgress: null,
-      migrationResult: null,
-    });
+    appState.set({ ...originalState, messages: [], sessionId: null });
     __setHandler("list_sessions", () => [SESSION_B, SESSION_A]);
     __setHandler("get_credentials_status", () => ({
       openai: true, anthropic: true, openrouter: false,
@@ -149,34 +139,6 @@ describe("createApp", () => {
       expect(items[0].textContent).toBe("No sessions yet");
     });
   });
-
-  it("renders workspace init gate when requested", async () => {
-    appState.update((s) => ({
-      ...s,
-      initGateVisible: true,
-      initGateState: "requires_action",
-      initStatus: {
-        runtime_workspace: "/tmp/ws",
-        gate_state: "requires_action",
-        onboarding_completed: false,
-        has_openplanter_root: true,
-        has_runtime_wiki: true,
-        has_runtime_index: true,
-        init_state_path: "/tmp/ws/.openplanter/init-state.json",
-        last_migration_target: null,
-        warnings: [],
-      },
-    }));
-    const root = document.createElement("div");
-    document.body.appendChild(root);
-    createApp(root);
-
-    await vi.waitFor(() => {
-      const gate = root.querySelector(".workspace-init-gate") as HTMLElement;
-      expect(gate).not.toBeNull();
-      expect(gate.style.display).toBe("flex");
-    });
-  });
 });
 
 describe("session delete confirmation flow", () => {
diff --git a/openplanter-desktop/frontend/src/components/App.ts b/openplanter-desktop/frontend/src/components/App.ts
index c31e9bb9..3e8537d5 100644
--- a/openplanter-desktop/frontend/src/components/App.ts
+++ b/openplanter-desktop/frontend/src/components/App.ts
@@ -2,7 +2,6 @@
 import { createStatusBar } from "./StatusBar";
 import { createChatPane } from "./ChatPane";
 import { createGraphPane } from "./GraphPane";
-import { createWorkspaceInitGate } from "./WorkspaceInitGate";
 import { appState } from "../state/store";
 import { listSessions, openSession, deleteSession, getCredentialsStatus, getSessionHistory } from "../api/invoke";
 import type { ChatMessage } from "../state/store";
@@ -62,10 +61,6 @@ export function createApp(root: HTMLElement): void {
   const graphPane = createGraphPane();
   root.appendChild(graphPane);
 
-  // Workspace init gate
-  const workspaceInitGate = createWorkspaceInitGate();
-  root.appendChild(workspaceInitGate);
-
   // Reactive settings display
   function renderSettings() {
     const s = appState.get();
diff --git a/openplanter-desktop/frontend/src/components/InputBar.test.ts b/openplanter-desktop/frontend/src/components/InputBar.test.ts
index 1bea6eb1..cf5277a5 100644
--- a/openplanter-desktop/frontend/src/components/InputBar.test.ts
+++ b/openplanter-desktop/frontend/src/components/InputBar.test.ts
@@ -21,13 +21,7 @@ describe("createInputBar", () => {
 
   beforeEach(() => {
     uuidCounter = 0;
-    appState.set({
-      ...originalState,
-      messages: [],
-      inputHistory: [],
-      inputQueue: [],
-      initGateState: "ready",
-    });
+    appState.set({ ...originalState, messages: [], inputHistory: [], inputQueue: [] });
     // Default handlers to prevent unhandled rejection
     __setHandler("solve", () => {});
     __setHandler("cancel", () => {});
@@ -392,43 +386,4 @@ describe("createInputBar", () => {
 
     document.body.removeChild(bar);
   });
-
-  it("blocks normal objective submit until init is ready", async () => {
-    appState.update((s) => ({ ...s, initGateState: "requires_action" }));
-    const bar = createInputBar();
-    document.body.appendChild(bar);
-    const textarea = bar.querySelector("textarea")!;
-
-    textarea.value = "blocked objective";
-    bar.querySelectorAll("button")[0].click();
-
-    await vi.waitFor(() => {
-      expect(appState.get().isRunning).toBe(false);
-      expect(
-        appState.get().messages.some((m) =>
-          m.content.includes("Workspace initialization is required")
-        )
-      ).toBe(true);
-    });
-
-    document.body.removeChild(bar);
-  });
-
-  it("blocks non-init slash commands until init is ready", async () => {
-    appState.update((s) => ({ ...s, initGateState: "requires_action" }));
-    const bar = createInputBar();
-    document.body.appendChild(bar);
-    const textarea = bar.querySelector("textarea")!;
-
-    textarea.value = "/status";
-    bar.querySelectorAll("button")[0].click();
-
-    await vi.waitFor(() => {
-      expect(
-        appState.get().messages.some((m) => m.content.includes("Use /init first"))
-      ).toBe(true);
-    });
-
-    document.body.removeChild(bar);
-  });
 });
diff --git a/openplanter-desktop/frontend/src/components/InputBar.ts b/openplanter-desktop/frontend/src/components/InputBar.ts
index 80420ff5..d174cb45 100644
--- a/openplanter-desktop/frontend/src/components/InputBar.ts
+++ b/openplanter-desktop/frontend/src/components/InputBar.ts
@@ -55,15 +55,6 @@ export function createInputBar(): HTMLElement {
 
     // Check for slash commands
     if (text.startsWith("/")) {
-      const initRequired = appState.get().initGateState !== "ready";
-      const lower = text.toLowerCase();
-      if (initRequired && !lower.startsWith("/init") && !lower.startsWith("/help")) {
-        textarea.value = "";
-        autoResize();
-        addSystemMessage("Workspace initialization is required. Use /init first.");
-        return;
-      }
-
       textarea.value = "";
       autoResize();
 
@@ -89,13 +80,6 @@ export function createInputBar(): HTMLElement {
       return;
     }
 
-    if (appState.get().initGateState !== "ready") {
-      addSystemMessage(
-        "Workspace initialization is required before starting an objective. Use /init."
-      );
-      return;
-    }
-
     // If running, queue the input instead of blocking
     if (appState.get().isRunning) {
       appState.update((s) => ({
@@ -285,9 +269,7 @@ export function createInputBar(): HTMLElement {
     cancelBtn.style.display = running ? "" : "none";
     textarea.placeholder = running
       ? "Type to queue..."
-      : appState.get().initGateState !== "ready"
-        ? "Complete workspace init or use /init..."
-        : "Enter objective or /command...";
+      : "Enter objective or /command...";
     // Keep textarea enabled during execution for queuing
     submitBtn.disabled = false;
   });
diff --git a/openplanter-desktop/frontend/src/components/WorkspaceInitGate.ts b/openplanter-desktop/frontend/src/components/WorkspaceInitGate.ts
deleted file mode 100644
index 5baac0fd..00000000
--- a/openplanter-desktop/frontend/src/components/WorkspaceInitGate.ts
+++ /dev/null
@@ -1,402 +0,0 @@
-import {
-  getInitStatus,
-  inspectMigrationSource,
-  runMigrationInit,
-  runStandardInit,
-} from "../api/invoke";
-import type { MigrationSourceInspection } from "../api/types";
-import { appState } from "../state/store";
-
-interface SourceDraft {
-  path: string;
-  inspection: MigrationSourceInspection | null;
-}
-
-export function createWorkspaceInitGate(): HTMLElement {
-  const overlay = document.createElement("div");
-  overlay.className = "workspace-init-gate";
-  overlay.style.position = "fixed";
-  overlay.style.inset = "0";
-  overlay.style.display = "none";
-  overlay.style.alignItems = "center";
-  overlay.style.justifyContent = "center";
-  overlay.style.background = "rgba(6, 10, 14, 0.78)";
-  overlay.style.zIndex = "999";
-
-  const panel = document.createElement("div");
-  panel.className = "workspace-init-panel";
-  panel.style.width = "min(760px, 92vw)";
-  panel.style.maxHeight = "88vh";
-  panel.style.overflow = "auto";
-  panel.style.padding = "20px";
-  panel.style.borderRadius = "16px";
-  panel.style.background = "var(--bg-secondary)";
-  panel.style.border = "1px solid var(--border)";
-  panel.style.boxShadow = "0 24px 80px rgba(0, 0, 0, 0.35)";
-  overlay.appendChild(panel);
-
-  let targetWorkspace = "";
-  let sources: SourceDraft[] = [{ path: "", inspection: null }];
-  let localError = "";
-
-  function ensureDefaultTarget(): void {
-    const workspace = appState.get().workspace;
-    if (!targetWorkspace && workspace) {
-      targetWorkspace = `${workspace}-desktop`;
-    }
-  }
-
-  async function refreshStatus(): Promise<void> {
-    const status = await getInitStatus();
-    appState.update((s) => ({
-      ...s,
-      initStatus: status,
-      initGateState: status.gate_state,
-      initGateVisible: status.gate_state !== "ready" ? true : s.initGateVisible,
-    }));
-  }
-
-  function visibilityState(): boolean {
-    const state = appState.get();
-    return state.initGateVisible || state.initGateState !== "ready";
-  }
-
-  function updateBusy(isInitBusy: boolean): void {
-    appState.update((s) => ({ ...s, isInitBusy }));
-  }
-
-  async function handleStandardInit(): Promise<void> {
-    localError = "";
-    updateBusy(true);
-    try {
-      await runStandardInit();
-      await refreshStatus();
-      appState.update((s) => ({
-        ...s,
-        initGateVisible: false,
-        initGateMode: "standard",
-        migrationProgress: null,
-        migrationResult: null,
-      }));
-      window.dispatchEvent(new CustomEvent("curator-done"));
-    } catch (error) {
-      localError = `Standard init failed: ${error}`;
-    } finally {
-      updateBusy(false);
-      render();
-    }
-  }
-
-  async function handleInspect(index: number): Promise<void> {
-    const draft = sources[index];
-    if (!draft || !draft.path.trim()) {
-      localError = "Enter a source path before inspecting it.";
-      render();
-      return;
-    }
-    localError = "";
-    updateBusy(true);
-    try {
-      const inspection = await inspectMigrationSource(draft.path.trim());
-      sources[index] = { ...draft, inspection };
-    } catch (error) {
-      localError = `Inspection failed: ${error}`;
-    } finally {
-      updateBusy(false);
-      render();
-    }
-  }
-
-  async function handleMigration(): Promise<void> {
-    const trimmedTarget = targetWorkspace.trim();
-    const trimmedSources = sources
-      .map((source) => source.path.trim())
-      .filter(Boolean);
-    if (!trimmedTarget) {
-      localError = "Enter a target workspace path.";
-      render();
-      return;
-    }
-    if (trimmedSources.length === 0) {
-      localError = "Add at least one source workspace or research directory.";
-      render();
-      return;
-    }
-
-    localError = "";
-    appState.update((s) => ({
-      ...s,
-      isInitBusy: true,
-      migrationProgress: null,
-      migrationResult: null,
-      initGateMode: "migration",
-      initGateVisible: true,
-    }));
-    try {
-      const result = await runMigrationInit({
-        target_workspace: trimmedTarget,
-        sources: trimmedSources.map((path) => ({ path })),
-      });
-      appState.update((s) => ({
-        ...s,
-        isInitBusy: false,
-        migrationResult: result,
-        initGateVisible: true,
-      }));
-    } catch (error) {
-      localError = `Migration failed: ${error}`;
-      updateBusy(false);
-    } finally {
-      render();
-    }
-  }
-
-  function renderSourceRow(index: number, stateBusy: boolean): HTMLElement {
-    const draft = sources[index];
-    const row = document.createElement("div");
-    row.style.display = "grid";
-    row.style.gridTemplateColumns = "1fr auto auto";
-    row.style.gap = "8px";
-    row.style.marginBottom = "10px";
-
-    const input = document.createElement("input");
-    input.type = "text";
-    input.value = draft.path;
-    input.placeholder = "/path/to/openplanter-workspace-or-research-dir";
-    input.disabled = stateBusy;
-    input.addEventListener("input", () => {
-      sources[index] = { path: input.value, inspection: null };
-    });
-
-    const inspectBtn = document.createElement("button");
-    inspectBtn.textContent = "Inspect";
-    inspectBtn.disabled = stateBusy;
-    inspectBtn.addEventListener("click", () => {
-      void handleInspect(index);
-    });
-
-    const removeBtn = document.createElement("button");
-    removeBtn.textContent = "Remove";
-    removeBtn.disabled = stateBusy || sources.length === 1;
-    removeBtn.addEventListener("click", () => {
-      sources.splice(index, 1);
-      render();
-    });
-
-    row.appendChild(input);
-    row.appendChild(inspectBtn);
-    row.appendChild(removeBtn);
-
-    if (draft.inspection) {
-      const details = document.createElement("div");
-      details.style.gridColumn = "1 / -1";
-      details.style.padding = "8px 10px";
-      details.style.border = "1px solid var(--border)";
-      details.style.borderRadius = "10px";
-      details.style.background = "var(--bg-tertiary)";
-      details.textContent = [
-        `kind=${draft.inspection.kind}`,
-        `markdown=${draft.inspection.markdown_files}`,
-        `sessions=${draft.inspection.has_sessions ? "yes" : "no"}`,
-        `settings=${draft.inspection.has_settings ? "yes" : "no"}`,
-        `credentials=${draft.inspection.has_credentials ? "yes" : "no"}`,
-        `runtime_wiki=${draft.inspection.has_runtime_wiki ? "yes" : "no"}`,
-      ].join("  |  ");
-      row.appendChild(details);
-    }
-
-    return row;
-  }
-
-  function render(): void {
-    ensureDefaultTarget();
-    const state = appState.get();
-    const visible = visibilityState();
-    overlay.style.display = visible ? "flex" : "none";
-    if (!visible) {
-      return;
-    }
-
-    panel.replaceChildren();
-
-    const title = document.createElement("h2");
-    title.textContent = "Workspace Initialization";
-    panel.appendChild(title);
-
-    const intro = document.createElement("p");
-    intro.textContent =
-      state.initGateState !== "ready"
-        ? "Choose Standard Init to prepare the current workspace, or Migration Init to build a new Desktop workspace from one or more existing sources."
-        : "Manage the current workspace or open a migration flow to build a new Desktop workspace.";
-    panel.appendChild(intro);
-
-    const modeBar = document.createElement("div");
-    modeBar.style.display = "flex";
-    modeBar.style.gap = "8px";
-    modeBar.style.marginBottom = "14px";
-
-    const standardTab = document.createElement("button");
-    standardTab.textContent = "Standard Init";
-    standardTab.disabled = state.isInitBusy;
-    standardTab.style.fontWeight = state.initGateMode === "standard" ? "700" : "400";
-    standardTab.addEventListener("click", () => {
-      appState.update((s) => ({ ...s, initGateMode: "standard", migrationResult: null }));
-    });
-
-    const migrationTab = document.createElement("button");
-    migrationTab.textContent = "Migration Init";
-    migrationTab.disabled = state.isInitBusy;
-    migrationTab.style.fontWeight = state.initGateMode === "migration" ? "700" : "400";
-    migrationTab.addEventListener("click", () => {
-      appState.update((s) => ({ ...s, initGateMode: "migration" }));
-    });
-
-    modeBar.appendChild(standardTab);
-    modeBar.appendChild(migrationTab);
-    panel.appendChild(modeBar);
-
-    if (state.initStatus) {
-      const status = document.createElement("div");
-      status.style.padding = "10px 12px";
-      status.style.border = "1px solid var(--border)";
-      status.style.borderRadius = "12px";
-      status.style.background = "var(--bg-tertiary)";
-      status.style.marginBottom = "14px";
-      status.textContent = [
-        `workspace=${state.initStatus.runtime_workspace}`,
-        `gate=${state.initStatus.gate_state}`,
-        `wiki=${state.initStatus.has_runtime_index ? "ready" : "missing"}`,
-        `last_migration=${state.initStatus.last_migration_target || "—"}`,
-      ].join("  |  ");
-      panel.appendChild(status);
-    }
-
-    if (state.migrationProgress) {
-      const progress = document.createElement("div");
-      progress.style.padding = "10px 12px";
-      progress.style.border = "1px solid var(--border)";
-      progress.style.borderRadius = "12px";
-      progress.style.background = "rgba(57, 148, 255, 0.08)";
-      progress.style.marginBottom = "14px";
-      progress.textContent = `[${state.migrationProgress.stage}] ${state.migrationProgress.message}`;
-      panel.appendChild(progress);
-    }
-
-    if (state.migrationResult) {
-      const result = document.createElement("div");
-      result.style.padding = "12px";
-      result.style.border = "1px solid var(--border)";
-      result.style.borderRadius = "12px";
-      result.style.background = "rgba(56, 184, 90, 0.10)";
-      result.style.marginBottom = "14px";
-      result.textContent = [
-        `Target: ${state.migrationResult.target_workspace}`,
-        `Sessions copied: ${state.migrationResult.sessions_copied}`,
-        `Sessions renamed: ${state.migrationResult.sessions_renamed}`,
-        `Wiki pages available: ${state.migrationResult.wiki_files_synthesized}`,
-        `Curator summary: ${state.migrationResult.rewrite_summary}`,
-        state.migrationResult.restart_message,
-      ].join("\n");
-      panel.appendChild(result);
-    }
-
-    if (localError) {
-      const error = document.createElement("div");
-      error.style.padding = "10px 12px";
-      error.style.border = "1px solid rgba(255, 99, 99, 0.45)";
-      error.style.borderRadius = "12px";
-      error.style.background = "rgba(255, 99, 99, 0.10)";
-      error.style.marginBottom = "14px";
-      error.textContent = localError;
-      panel.appendChild(error);
-    }
-
-    if (state.initGateMode === "standard") {
-      const block = document.createElement("div");
-      const body = document.createElement("p");
-      body.textContent =
-        "Standard Init prepares the current workspace, creates the runtime wiki skeleton, and marks the Desktop onboarding flow complete.";
-      const button = document.createElement("button");
-      button.textContent = state.isInitBusy ? "Initializing..." : "Initialize Current Workspace";
-      button.disabled = state.isInitBusy;
-      button.addEventListener("click", () => {
-        void handleStandardInit();
-      });
-      block.appendChild(body);
-      block.appendChild(button);
-      panel.appendChild(block);
-    } else {
-      const migration = document.createElement("div");
-
-      const targetLabel = document.createElement("label");
-      targetLabel.textContent = "Target Workspace";
-      targetLabel.style.display = "block";
-      targetLabel.style.marginBottom = "6px";
-      migration.appendChild(targetLabel);
-
-      const targetInput = document.createElement("input");
-      targetInput.type = "text";
-      targetInput.value = targetWorkspace;
-      targetInput.placeholder = "/path/to/new-desktop-workspace";
-      targetInput.style.width = "100%";
-      targetInput.style.marginBottom = "14px";
-      targetInput.disabled = state.isInitBusy;
-      targetInput.addEventListener("input", () => {
-        targetWorkspace = targetInput.value;
-      });
-      migration.appendChild(targetInput);
-
-      const sourcesHeader = document.createElement("div");
-      sourcesHeader.textContent = "Migration Sources";
-      sourcesHeader.style.fontWeight = "700";
-      sourcesHeader.style.marginBottom = "8px";
-      migration.appendChild(sourcesHeader);
-
-      const sourceList = document.createElement("div");
-      for (let index = 0; index < sources.length; index += 1) {
-        sourceList.appendChild(renderSourceRow(index, state.isInitBusy));
-      }
-      migration.appendChild(sourceList);
-
-      const actions = document.createElement("div");
-      actions.style.display = "flex";
-      actions.style.gap = "8px";
-      actions.style.marginTop = "12px";
-
-      const addBtn = document.createElement("button");
-      addBtn.textContent = "Add Source";
-      addBtn.disabled = state.isInitBusy;
-      addBtn.addEventListener("click", () => {
-        sources.push({ path: "", inspection: null });
-        render();
-      });
-
-      const migrateBtn = document.createElement("button");
-      migrateBtn.textContent = state.isInitBusy ? "Migrating..." : "Run Migration Init";
-      migrateBtn.disabled = state.isInitBusy;
-      migrateBtn.addEventListener("click", () => {
-        void handleMigration();
-      });
-
-      actions.appendChild(addBtn);
-      actions.appendChild(migrateBtn);
-      migration.appendChild(actions);
-      panel.appendChild(migration);
-    }
-
-    if (state.initGateState === "ready") {
-      const closeBtn = document.createElement("button");
-      closeBtn.textContent = "Close";
-      closeBtn.style.marginTop = "16px";
-      closeBtn.disabled = state.isInitBusy;
-      closeBtn.addEventListener("click", () => {
-        appState.update((s) => ({ ...s, initGateVisible: false }));
-      });
-      panel.appendChild(closeBtn);
-    }
-  }
-
-  appState.subscribe(render);
-  render();
-  return overlay;
-}
diff --git a/openplanter-desktop/frontend/src/main.ts b/openplanter-desktop/frontend/src/main.ts
index fb13670b..e0d68bdf 100644
--- a/openplanter-desktop/frontend/src/main.ts
+++ b/openplanter-desktop/frontend/src/main.ts
@@ -1,5 +1,5 @@
 import { createApp } from "./components/App";
-import { getConfig, getInitStatus } from "./api/invoke";
+import { getConfig } from "./api/invoke";
 import {
   onAgentTrace,
   onAgentDelta,
@@ -9,7 +9,6 @@ import {
   onWikiUpdated,
   onCuratorUpdate,
   onLoopHealth,
-  onMigrationProgress,
 } from "./api/events";
 import { appState } from "./state/store";
 
@@ -33,7 +32,6 @@ async function init() {
     const config = await getConfig();
     provider = config.provider;
     model = config.model;
-    const initStatus = await getInitStatus();
     appState.update((s) => ({
       ...s,
       provider: config.provider,
@@ -46,9 +44,6 @@ async function init() {
       workspace: config.workspace,
       maxDepth: config.max_depth,
       maxStepsPerCall: config.max_steps_per_call,
-      initStatus,
-      initGateState: initStatus.gate_state,
-      initGateVisible: initStatus.gate_state !== "ready",
     }));
   } catch (e) {
     console.error("Failed to load config:", e);
@@ -88,17 +83,6 @@ async function init() {
         content: "Type /help for commands. ESC to cancel a running task.",
         timestamp: Date.now(),
       },
-      ...(state.initGateState !== "ready"
-        ? [
-            {
-              id: crypto.randomUUID(),
-              role: "system" as const,
-              content:
-                "Workspace initialization is required before running the agent. Use the setup panel or /init.",
-              timestamp: Date.now(),
-            },
-          ]
-        : []),
     ],
   }));
 
@@ -194,7 +178,6 @@ async function init() {
     // Notify graph pane to refresh with curator's wiki changes
     window.dispatchEvent(new CustomEvent("curator-done"));
   });
-
   await onLoopHealth((event) => {
     appState.update((s) => ({
       ...s,
@@ -202,14 +185,6 @@ async function init() {
       lastLoopMetrics: event.metrics,
     }));
   });
-
-  await onMigrationProgress((event) => {
-    appState.update((s) => ({
-      ...s,
-      migrationProgress: event,
-      isInitBusy: event.stage !== "done",
-    }));
-  });
 }
 
 function processQueue() {
diff --git a/openplanter-desktop/frontend/src/state/store.test.ts b/openplanter-desktop/frontend/src/state/store.test.ts
index 41420430..7796926e 100644
--- a/openplanter-desktop/frontend/src/state/store.test.ts
+++ b/openplanter-desktop/frontend/src/state/store.test.ts
@@ -71,9 +71,6 @@ describe("appState", () => {
     expect(state.maxDepth).toBe(4);
     expect(state.maxStepsPerCall).toBe(100);
     expect(state.inputQueue).toEqual([]);
-    expect(state.initGateState).toBe("ready");
-    expect(state.isInitBusy).toBe(false);
-    expect(state.initGateVisible).toBe(false);
   });
 
   it("message append via update", () => {
diff --git a/openplanter-desktop/frontend/src/state/store.ts b/openplanter-desktop/frontend/src/state/store.ts
index 4fa1eeca..8f9a9b2a 100644
--- a/openplanter-desktop/frontend/src/state/store.ts
+++ b/openplanter-desktop/frontend/src/state/store.ts
@@ -1,13 +1,9 @@
 /** Simple observable state store. */
 import type {
   CompletionMeta,
-  InitStatusView,
   LoopMetrics,
   LoopHealthEvent,
-  MigrationInitResultView,
-  MigrationProgressEvent,
 } from "../api/types";
-
 type Listener<T> = (value: T) => void;
 
 export class Store<T> {
@@ -89,13 +85,6 @@ export interface AppState {
   lastCompletion: CompletionMeta | null;
   inputHistory: string[];
   inputQueue: string[];
-  initGateState: "ready" | "requires_action" | "blocked";
-  initStatus: InitStatusView | null;
-  isInitBusy: boolean;
-  initGateVisible: boolean;
-  initGateMode: "standard" | "migration";
-  migrationProgress: MigrationProgressEvent | null;
-  migrationResult: MigrationInitResultView | null;
 }
 
 export const appState = new Store<AppState>({
@@ -120,11 +109,4 @@ export const appState = new Store<AppState>({
   lastCompletion: null,
   inputHistory: [],
   inputQueue: [],
-  initGateState: "ready",
-  initStatus: null,
-  isInitBusy: false,
-  initGateVisible: false,
-  initGateMode: "standard",
-  migrationProgress: null,
-  migrationResult: null,
 });

From ead5517a41bca981a935b87f41f3a7e5d49a4238 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 15:54:25 -0400
Subject: [PATCH 52/58] Restore provider-specific files to upstream on PR1

---
 agent/credentials.py                          |  51 --
 agent/model.py                                | 233 +------
 .../crates/op-core/src/credentials.rs         |  85 +--
 .../crates/op-core/src/model/anthropic.rs     | 174 ++---
 .../crates/op-core/src/model/openai.rs        | 657 ++----------------
 .../crates/op-tauri/src/commands/config.rs    | 215 ++----
 .../crates/op-tauri/src/state.rs              | 566 +--------------
 .../frontend/src/commands/model.ts            |  81 +--
 tests/test_credentials.py                     |  12 -
 tests/test_model.py                           | 197 +-----
 tests/test_settings.py                        |  24 -
 11 files changed, 221 insertions(+), 2074 deletions(-)

diff --git a/agent/credentials.py b/agent/credentials.py
index 4e46c2e7..3a387a59 100644
--- a/agent/credentials.py
+++ b/agent/credentials.py
@@ -15,11 +15,7 @@ class CredentialBundle:
     anthropic_api_key: str | None = None
     openrouter_api_key: str | None = None
     cerebras_api_key: str | None = None
-    zai_api_key: str | None = None
     exa_api_key: str | None = None
-    firecrawl_api_key: str | None = None
-    brave_api_key: str | None = None
-    tavily_api_key: str | None = None
     voyage_api_key: str | None = None
 
     def has_any(self) -> bool:
@@ -28,11 +24,7 @@ def has_any(self) -> bool:
             or (self.anthropic_api_key and self.anthropic_api_key.strip())
             or (self.openrouter_api_key and self.openrouter_api_key.strip())
             or (self.cerebras_api_key and self.cerebras_api_key.strip())
-            or (self.zai_api_key and self.zai_api_key.strip())
             or (self.exa_api_key and self.exa_api_key.strip())
-            or (self.firecrawl_api_key and self.firecrawl_api_key.strip())
-            or (self.brave_api_key and self.brave_api_key.strip())
-            or (self.tavily_api_key and self.tavily_api_key.strip())
             or (self.voyage_api_key and self.voyage_api_key.strip())
         )
 
@@ -45,16 +37,8 @@ def merge_missing(self, other: "CredentialBundle") -> None:
             self.openrouter_api_key = other.openrouter_api_key
         if not self.cerebras_api_key and other.cerebras_api_key:
             self.cerebras_api_key = other.cerebras_api_key
-        if not self.zai_api_key and other.zai_api_key:
-            self.zai_api_key = other.zai_api_key
         if not self.exa_api_key and other.exa_api_key:
             self.exa_api_key = other.exa_api_key
-        if not self.firecrawl_api_key and other.firecrawl_api_key:
-            self.firecrawl_api_key = other.firecrawl_api_key
-        if not self.brave_api_key and other.brave_api_key:
-            self.brave_api_key = other.brave_api_key
-        if not self.tavily_api_key and other.tavily_api_key:
-            self.tavily_api_key = other.tavily_api_key
         if not self.voyage_api_key and other.voyage_api_key:
             self.voyage_api_key = other.voyage_api_key
 
@@ -68,16 +52,8 @@ def to_json(self) -> dict[str, str]:
             out["openrouter_api_key"] = self.openrouter_api_key
         if self.cerebras_api_key:
             out["cerebras_api_key"] = self.cerebras_api_key
-        if self.zai_api_key:
-            out["zai_api_key"] = self.zai_api_key
         if self.exa_api_key:
             out["exa_api_key"] = self.exa_api_key
-        if self.firecrawl_api_key:
-            out["firecrawl_api_key"] = self.firecrawl_api_key
-        if self.brave_api_key:
-            out["brave_api_key"] = self.brave_api_key
-        if self.tavily_api_key:
-            out["tavily_api_key"] = self.tavily_api_key
         if self.voyage_api_key:
             out["voyage_api_key"] = self.voyage_api_key
         return out
@@ -91,11 +67,7 @@ def from_json(cls, payload: dict[str, str] | None) -> "CredentialBundle":
             anthropic_api_key=(payload.get("anthropic_api_key") or "").strip() or None,
             openrouter_api_key=(payload.get("openrouter_api_key") or "").strip() or None,
             cerebras_api_key=(payload.get("cerebras_api_key") or "").strip() or None,
-            zai_api_key=(payload.get("zai_api_key") or "").strip() or None,
             exa_api_key=(payload.get("exa_api_key") or "").strip() or None,
-            firecrawl_api_key=(payload.get("firecrawl_api_key") or "").strip() or None,
-            brave_api_key=(payload.get("brave_api_key") or "").strip() or None,
-            tavily_api_key=(payload.get("tavily_api_key") or "").strip() or None,
             voyage_api_key=(payload.get("voyage_api_key") or "").strip() or None,
         )
 
@@ -137,12 +109,7 @@ def parse_env_file(path: Path) -> CredentialBundle:
         or None,
         cerebras_api_key=(env.get("CEREBRAS_API_KEY") or env.get("OPENPLANTER_CEREBRAS_API_KEY") or "").strip()
         or None,
-        zai_api_key=(env.get("ZAI_API_KEY") or env.get("OPENPLANTER_ZAI_API_KEY") or "").strip() or None,
         exa_api_key=(env.get("EXA_API_KEY") or env.get("OPENPLANTER_EXA_API_KEY") or "").strip() or None,
-        firecrawl_api_key=(env.get("FIRECRAWL_API_KEY") or env.get("OPENPLANTER_FIRECRAWL_API_KEY") or "").strip()
-        or None,
-        brave_api_key=(env.get("BRAVE_API_KEY") or env.get("OPENPLANTER_BRAVE_API_KEY") or "").strip() or None,
-        tavily_api_key=(env.get("TAVILY_API_KEY") or env.get("OPENPLANTER_TAVILY_API_KEY") or "").strip() or None,
         voyage_api_key=(env.get("VOYAGE_API_KEY") or env.get("OPENPLANTER_VOYAGE_API_KEY") or "").strip() or None,
     )
 
@@ -167,17 +134,7 @@ def credentials_from_env() -> CredentialBundle:
             os.getenv("OPENPLANTER_CEREBRAS_API_KEY") or os.getenv("CEREBRAS_API_KEY") or ""
         ).strip()
         or None,
-        zai_api_key=(
-            os.getenv("OPENPLANTER_ZAI_API_KEY") or os.getenv("ZAI_API_KEY") or ""
-        ).strip()
-        or None,
         exa_api_key=(os.getenv("OPENPLANTER_EXA_API_KEY") or os.getenv("EXA_API_KEY") or "").strip() or None,
-        firecrawl_api_key=(
-            os.getenv("OPENPLANTER_FIRECRAWL_API_KEY") or os.getenv("FIRECRAWL_API_KEY") or ""
-        ).strip()
-        or None,
-        brave_api_key=(os.getenv("OPENPLANTER_BRAVE_API_KEY") or os.getenv("BRAVE_API_KEY") or "").strip() or None,
-        tavily_api_key=(os.getenv("OPENPLANTER_TAVILY_API_KEY") or os.getenv("TAVILY_API_KEY") or "").strip() or None,
         voyage_api_key=(os.getenv("OPENPLANTER_VOYAGE_API_KEY") or os.getenv("VOYAGE_API_KEY") or "").strip() or None,
     )
 
@@ -272,11 +229,7 @@ def prompt_for_credentials(
         anthropic_api_key=existing.anthropic_api_key,
         openrouter_api_key=existing.openrouter_api_key,
         cerebras_api_key=existing.cerebras_api_key,
-        zai_api_key=existing.zai_api_key,
         exa_api_key=existing.exa_api_key,
-        firecrawl_api_key=existing.firecrawl_api_key,
-        brave_api_key=existing.brave_api_key,
-        tavily_api_key=existing.tavily_api_key,
         voyage_api_key=existing.voyage_api_key,
     )
 
@@ -309,11 +262,7 @@ def _ask(label: str, existing_value: str | None) -> str | None:
     current.anthropic_api_key = _ask("Anthropic", current.anthropic_api_key)
     current.openrouter_api_key = _ask("OpenRouter", current.openrouter_api_key)
     current.cerebras_api_key = _ask("Cerebras", current.cerebras_api_key)
-    current.zai_api_key = _ask("Z.AI", current.zai_api_key)
     current.exa_api_key = _ask("Exa", current.exa_api_key)
-    current.firecrawl_api_key = _ask("Firecrawl", current.firecrawl_api_key)
-    current.brave_api_key = _ask("Brave", current.brave_api_key)
-    current.tavily_api_key = _ask("Tavily", current.tavily_api_key)
     current.voyage_api_key = _ask("Voyage", current.voyage_api_key)
     if not force and current.has_any() and not existing.has_any():
         changed = True
diff --git a/agent/model.py b/agent/model.py
index 45fca294..30bc3ff7 100644
--- a/agent/model.py
+++ b/agent/model.py
@@ -6,10 +6,8 @@
 import urllib.request
 from dataclasses import dataclass, field
 from datetime import datetime, timezone
-from email.utils import parsedate_to_datetime
 from typing import Any, Callable, Protocol
 
-from .config import strip_foundry_model_prefix
 from .tool_defs import TOOL_DEFINITIONS, to_anthropic_tools, to_openai_tools
 
 
@@ -17,27 +15,6 @@ class ModelError(RuntimeError):
     pass
 
 
-class HTTPModelError(ModelError):
-    def __init__(
-        self,
-        message: str,
-        *,
-        status_code: int | None = None,
-        provider_code: str | int | None = None,
-        body: str = "",
-        retry_after_sec: float | None = None,
-    ) -> None:
-        super().__init__(message)
-        self.status_code = status_code
-        self.provider_code = provider_code
-        self.body = body
-        self.retry_after_sec = retry_after_sec
-
-
-class RateLimitError(HTTPModelError):
-    pass
-
-
 # ---------------------------------------------------------------------------
 # Core data types
 # ---------------------------------------------------------------------------
@@ -126,130 +103,6 @@ def _extract_content(content: object) -> str:
     return ""
 
 
-def _parse_json_object(text: str) -> dict[str, Any] | None:
-    try:
-        parsed = json.loads(text)
-    except json.JSONDecodeError:
-        return None
-    if isinstance(parsed, dict):
-        return parsed
-    return None
-
-
-def _parse_retry_after_value(value: object) -> float | None:
-    if value is None:
-        return None
-    if isinstance(value, (int, float)):
-        return max(float(value), 0.0)
-    if isinstance(value, str):
-        text = value.strip()
-        if not text:
-            return None
-        try:
-            return max(float(text), 0.0)
-        except ValueError:
-            pass
-        try:
-            dt = parsedate_to_datetime(text)
-        except (TypeError, ValueError, IndexError):
-            return None
-        if dt.tzinfo is None:
-            dt = dt.replace(tzinfo=timezone.utc)
-        return max((dt - datetime.now(timezone.utc)).total_seconds(), 0.0)
-    return None
-
-
-def _parse_retry_after(headers: Any) -> float | None:
-    if headers is None:
-        return None
-    getter = getattr(headers, "get", None)
-    if not callable(getter):
-        return None
-    return _parse_retry_after_value(getter("Retry-After"))
-
-
-def _extract_openai_style_error(payload: dict[str, Any]) -> tuple[str, str | int | None, float | None]:
-    error = payload.get("error")
-    if isinstance(error, dict):
-        message = str(error.get("message", "")).strip()
-        provider_code = error.get("code")
-        retry_after = _parse_retry_after_value(error.get("retry_after"))
-        if retry_after is None:
-            retry_after = _parse_retry_after_value(payload.get("retry_after"))
-        return message, provider_code, retry_after
-    return "", None, _parse_retry_after_value(payload.get("retry_after"))
-
-
-def _is_rate_limit_error(
-    status_code: int | None,
-    provider_code: str | int | None,
-    message: str,
-) -> bool:
-    if status_code == 429:
-        return True
-    if provider_code is not None:
-        code_text = str(provider_code).strip().lower()
-        if code_text in {"1302", "429", "rate_limit", "rate_limit_exceeded", "too_many_requests"}:
-            return True
-    lower = message.lower()
-    return "rate limit" in lower or "too many requests" in lower
-
-
-def _raise_http_error(url: str, status_code: int, body: str, headers: Any) -> None:
-    parsed = _parse_json_object(body)
-    message = ""
-    provider_code: str | int | None = None
-    body_retry_after: float | None = None
-    if parsed is not None:
-        message, provider_code, body_retry_after = _extract_openai_style_error(parsed)
-    retry_after = _parse_retry_after(headers)
-    if retry_after is None:
-        retry_after = body_retry_after
-    text = message or body
-    exc_cls = RateLimitError if _is_rate_limit_error(status_code, provider_code, text) else HTTPModelError
-    raise exc_cls(
-        f"HTTP {status_code} calling {url}: {body}",
-        status_code=status_code,
-        provider_code=provider_code,
-        body=body,
-        retry_after_sec=retry_after,
-    )
-
-
-def _raise_sse_error(data_dict: dict[str, Any]) -> None:
-    if data_dict.get("type") == "error":
-        err = data_dict.get("error")
-        if isinstance(err, dict):
-            err_msg = str(err.get("message", str(data_dict)))
-            provider_code = err.get("code")
-            retry_after = _parse_retry_after_value(err.get("retry_after"))
-            if _is_rate_limit_error(None, provider_code, err_msg):
-                raise RateLimitError(
-                    f"Stream error: {err_msg}",
-                    status_code=None,
-                    provider_code=provider_code,
-                    body=json.dumps(data_dict, ensure_ascii=True),
-                    retry_after_sec=retry_after,
-                )
-            raise ModelError(f"Stream error: {err_msg}")
-        raise ModelError(f"Stream error: {data_dict}")
-
-    err = data_dict.get("error")
-    if isinstance(err, dict):
-        err_msg = str(err.get("message", str(data_dict)))
-        provider_code = err.get("code")
-        retry_after = _parse_retry_after_value(err.get("retry_after"))
-        if _is_rate_limit_error(None, provider_code, err_msg):
-            raise RateLimitError(
-                f"Stream error: {err_msg}",
-                status_code=None,
-                provider_code=provider_code,
-                body=json.dumps(data_dict, ensure_ascii=True),
-                retry_after_sec=retry_after,
-            )
-        raise ModelError(f"Stream error: {err_msg}")
-
-
 def _http_json(
     url: str,
     method: str,
@@ -268,10 +121,7 @@ def _http_json(
             raw = resp.read().decode("utf-8", errors="replace")
     except urllib.error.HTTPError as exc:  # pragma: no cover - network path
         body = exc.read().decode("utf-8", errors="replace")
-        try:
-            _raise_http_error(url, exc.code, body, exc.headers)
-        except ModelError as model_exc:
-            raise model_exc from exc
+        raise ModelError(f"HTTP {exc.code} calling {url}: {body}") from exc
     except urllib.error.URLError as exc:  # pragma: no cover - network path
         raise ModelError(f"Connection error calling {url}: {exc}") from exc
     except OSError as exc:  # pragma: no cover - bare socket.timeout, etc.
@@ -326,7 +176,10 @@ def _read_sse_events(
                 except json.JSONDecodeError:
                     data_dict = {"_raw": joined}
                 if isinstance(data_dict, dict):
-                    _raise_sse_error(data_dict)
+                    # Check for Anthropic error events
+                    if data_dict.get("type") == "error":
+                        err_msg = data_dict.get("error", {}).get("message", str(data_dict))
+                        raise ModelError(f"Stream error: {err_msg}")
                     events.append((current_event, data_dict))
                     if on_sse_event:
                         try:
@@ -345,7 +198,9 @@ def _read_sse_events(
         except json.JSONDecodeError:
             data_dict = {"_raw": joined}
         if isinstance(data_dict, dict):
-            _raise_sse_error(data_dict)
+            if data_dict.get("type") == "error":
+                err_msg = data_dict.get("error", {}).get("message", str(data_dict))
+                raise ModelError(f"Stream error: {err_msg}")
             events.append((current_event, data_dict))
             if on_sse_event:
                 try:
@@ -376,10 +231,7 @@ def _http_stream_sse(
             resp = urllib.request.urlopen(req, timeout=first_byte_timeout)
         except urllib.error.HTTPError as exc:
             body = exc.read().decode("utf-8", errors="replace")
-            try:
-                _raise_http_error(url, exc.code, body, exc.headers)
-            except ModelError as model_exc:
-                raise model_exc from exc
+            raise ModelError(f"HTTP {exc.code} calling {url}: {body}") from exc
         except (socket.timeout, urllib.error.URLError, OSError) as exc:
             # Timeout or connection error — retry
             last_exc = exc
@@ -402,7 +254,6 @@ def _accumulate_openai_stream(
 ) -> dict[str, Any]:
     """Reconstruct an OpenAI non-streaming response dict from SSE delta chunks."""
     text_parts: list[str] = []
-    reasoning_parts: list[str] = []
     tool_calls_by_index: dict[int, dict[str, Any]] = {}
     finish_reason = ""
     usage: dict[str, Any] = {}
@@ -428,9 +279,6 @@ def _accumulate_openai_stream(
         content = delta.get("content")
         if content:
             text_parts.append(content)
-        reasoning = delta.get("reasoning_content")
-        if isinstance(reasoning, str) and reasoning:
-            reasoning_parts.append(reasoning)
 
         # Tool calls (streamed incrementally)
         tc_deltas = delta.get("tool_calls")
@@ -457,8 +305,6 @@ def _accumulate_openai_stream(
         "role": "assistant",
         "content": "".join(text_parts) if text_parts else None,
     }
-    if reasoning_parts:
-        message["reasoning_content"] = "".join(reasoning_parts)
     if tool_calls_by_index:
         message["tool_calls"] = [
             tool_calls_by_index[i] for i in sorted(tool_calls_by_index)
@@ -787,17 +633,11 @@ class OpenAICompatibleModel:
     first_byte_timeout: float = 10
     strict_tools: bool = True
     tool_defs: list[dict[str, Any]] | None = None
-    thinking_type: str | None = None
     on_content_delta: Callable[[str, str], None] | None = None
-    provider: str | None = None
-    stream_max_retries: int = 3
-
-    def _request_model_name(self) -> str:
-        return strip_foundry_model_prefix(self.model)
 
     def _is_reasoning_model(self) -> bool:
         """OpenAI reasoning models (o-series, gpt-5 series) have different API constraints."""
-        lower = self._request_model_name().lower()
+        lower = self.model.lower()
         if (
             lower.startswith("o1-") or lower == "o1"
             or lower.startswith("o3-") or lower == "o3"
@@ -820,7 +660,7 @@ def complete(self, conversation: Conversation) -> ModelTurn:
         is_reasoning = self._is_reasoning_model()
 
         payload: dict[str, Any] = {
-            "model": self._request_model_name(),
+            "model": self.model,
             "messages": conversation._provider_messages,
             "tools": to_openai_tools(defs=self.tool_defs, strict=self.strict_tools),
             "tool_choice": "auto",
@@ -840,10 +680,8 @@ def complete(self, conversation: Conversation) -> ModelTurn:
         effort = (self.reasoning_effort or "").strip().lower()
         if effort:
             payload["reasoning_effort"] = effort
-        thinking_type = (self.thinking_type or "").strip().lower()
-        if thinking_type in {"enabled", "disabled"}:
-            payload["thinking"] = {"type": thinking_type}
 
+        url = self.base_url.rstrip("/") + "/chat/completions"
         headers = {
             "Authorization": f"Bearer {self.api_key}",
             "Content-Type": "application/json",
@@ -864,15 +702,6 @@ def _forward_delta(_event_type: str, data: dict[str, Any]) -> None:
             content = delta.get("content")
             if content:
                 cb("text", content)
-            reasoning_content = delta.get("reasoning_content")
-            if isinstance(reasoning_content, str) and reasoning_content:
-                cb("thinking", reasoning_content)
-            reasoning = delta.get("reasoning")
-            if isinstance(reasoning, str) and reasoning:
-                cb("thinking", reasoning)
-            thinking = delta.get("thinking")
-            if isinstance(thinking, str) and thinking:
-                cb("thinking", thinking)
             # Forward tool call argument deltas for live preview
             tc_deltas = delta.get("tool_calls")
             if tc_deltas:
@@ -887,21 +716,17 @@ def _forward_delta(_event_type: str, data: dict[str, Any]) -> None:
 
         sse_cb = _forward_delta if self.on_content_delta else None
 
-        def _request_stream(active_payload: dict[str, Any], active_base_url: str) -> dict[str, Any]:
+        try:
             events = _http_stream_sse(
-                url=active_base_url.rstrip("/") + "/chat/completions",
+                url=url,
                 method="POST",
                 headers=headers,
-                payload=active_payload,
+                payload=payload,
                 first_byte_timeout=self.first_byte_timeout,
                 stream_timeout=self.timeout_sec,
-                max_retries=self.stream_max_retries,
                 on_sse_event=sse_cb,
             )
-            return _accumulate_openai_stream(events)
-
-        try:
-            parsed = _request_stream(payload, self.base_url)
+            parsed = _accumulate_openai_stream(events)
         except ModelError as exc:
             text = str(exc).lower()
             unsupported_reasoning = effort and (
@@ -912,7 +737,16 @@ def _request_stream(active_payload: dict[str, Any], active_base_url: str) -> dic
                 raise
             payload = dict(payload)
             payload.pop("reasoning_effort", None)
-            parsed = _request_stream(payload, self.base_url)
+            events = _http_stream_sse(
+                url=url,
+                method="POST",
+                headers=headers,
+                payload=payload,
+                first_byte_timeout=self.first_byte_timeout,
+                stream_timeout=self.timeout_sec,
+                on_sse_event=sse_cb,
+            )
+            parsed = _accumulate_openai_stream(events)
 
         try:
             message = parsed["choices"][0]["message"]
@@ -920,13 +754,6 @@ def _request_stream(active_payload: dict[str, Any], active_base_url: str) -> dic
             raise ModelError(f"Model response missing content: {parsed}") from exc
 
         finish_reason = parsed["choices"][0].get("finish_reason", "")
-        if finish_reason == "rate_limit":
-            raise RateLimitError(
-                "Model finish_reason=rate_limit",
-                status_code=429,
-                provider_code="rate_limit",
-                body=json.dumps(parsed, ensure_ascii=True),
-            )
 
         # Parse tool calls
         raw_tool_calls = message.get("tool_calls")
@@ -1032,9 +859,6 @@ class AnthropicModel:
     tool_defs: list[dict[str, Any]] | None = None
     on_content_delta: Callable[[str, str], None] | None = None
 
-    def _request_model_name(self) -> str:
-        return strip_foundry_model_prefix(self.model)
-
     def create_conversation(self, system_prompt: str, initial_user_message: str) -> Conversation:
         messages: list[Any] = [
             {"role": "user", "content": initial_user_message},
@@ -1042,15 +866,14 @@ def create_conversation(self, system_prompt: str, initial_user_message: str) ->
         return Conversation(_provider_messages=messages, system_prompt=system_prompt)
 
     def _is_opus_46(self) -> bool:
-        lower = self._request_model_name().lower()
-        return "opus-4-6" in lower or "opus-4.6" in lower
+        return "opus-4-6" in self.model.lower() or "opus-4.6" in self.model.lower()
 
     def complete(self, conversation: Conversation) -> ModelTurn:
         effort = (self.reasoning_effort or "").strip().lower()
         use_thinking = effort in {"low", "medium", "high"}
 
         payload: dict[str, Any] = {
-            "model": self._request_model_name(),
+            "model": self.model,
             "max_tokens": self.max_tokens,
             "messages": conversation._provider_messages,
             "tools": to_anthropic_tools(defs=self.tool_defs),
diff --git a/openplanter-desktop/crates/op-core/src/credentials.rs b/openplanter-desktop/crates/op-core/src/credentials.rs
index 0093b43e..12e7e914 100644
--- a/openplanter-desktop/crates/op-core/src/credentials.rs
+++ b/openplanter-desktop/crates/op-core/src/credentials.rs
@@ -16,31 +16,26 @@ pub struct CredentialBundle {
     pub anthropic_api_key: Option<String>,
     pub openrouter_api_key: Option<String>,
     pub cerebras_api_key: Option<String>,
-    pub zai_api_key: Option<String>,
     pub exa_api_key: Option<String>,
-    pub firecrawl_api_key: Option<String>,
-    pub brave_api_key: Option<String>,
-    pub tavily_api_key: Option<String>,
     pub voyage_api_key: Option<String>,
 }
 
 impl CredentialBundle {
     /// Returns `true` if any key has a non-empty value.
     pub fn has_any(&self) -> bool {
-        let keys = [
+        let keys: [&Option<String>; 6] = [
             &self.openai_api_key,
             &self.anthropic_api_key,
             &self.openrouter_api_key,
             &self.cerebras_api_key,
-            &self.zai_api_key,
             &self.exa_api_key,
-            &self.firecrawl_api_key,
-            &self.brave_api_key,
-            &self.tavily_api_key,
             &self.voyage_api_key,
         ];
-        keys.iter()
-            .any(|k| k.as_ref().map(|v| !v.trim().is_empty()).unwrap_or(false))
+        keys.iter().any(|k| {
+            k.as_ref()
+                .map(|v| !v.trim().is_empty())
+                .unwrap_or(false)
+        })
     }
 
     /// Fill in missing keys from `other`.
@@ -56,11 +51,7 @@ impl CredentialBundle {
         fill!(anthropic_api_key);
         fill!(openrouter_api_key);
         fill!(cerebras_api_key);
-        fill!(zai_api_key);
         fill!(exa_api_key);
-        fill!(firecrawl_api_key);
-        fill!(brave_api_key);
-        fill!(tavily_api_key);
         fill!(voyage_api_key);
     }
 
@@ -78,11 +69,7 @@ impl CredentialBundle {
         add!(anthropic_api_key, "anthropic_api_key");
         add!(openrouter_api_key, "openrouter_api_key");
         add!(cerebras_api_key, "cerebras_api_key");
-        add!(zai_api_key, "zai_api_key");
         add!(exa_api_key, "exa_api_key");
-        add!(firecrawl_api_key, "firecrawl_api_key");
-        add!(brave_api_key, "brave_api_key");
-        add!(tavily_api_key, "tavily_api_key");
         add!(voyage_api_key, "voyage_api_key");
         out
     }
@@ -100,11 +87,7 @@ impl CredentialBundle {
             anthropic_api_key: get_str(payload, "anthropic_api_key"),
             openrouter_api_key: get_str(payload, "openrouter_api_key"),
             cerebras_api_key: get_str(payload, "cerebras_api_key"),
-            zai_api_key: get_str(payload, "zai_api_key"),
             exa_api_key: get_str(payload, "exa_api_key"),
-            firecrawl_api_key: get_str(payload, "firecrawl_api_key"),
-            brave_api_key: get_str(payload, "brave_api_key"),
-            tavily_api_key: get_str(payload, "tavily_api_key"),
             voyage_api_key: get_str(payload, "voyage_api_key"),
         }
     }
@@ -163,16 +146,12 @@ pub fn parse_env_file(path: &Path) -> CredentialBundle {
             "OPENROUTER_API_KEY",
             "OPENPLANTER_OPENROUTER_API_KEY",
         ),
-        cerebras_api_key: get_key(&env_map, "CEREBRAS_API_KEY", "OPENPLANTER_CEREBRAS_API_KEY"),
-        zai_api_key: get_key(&env_map, "ZAI_API_KEY", "OPENPLANTER_ZAI_API_KEY"),
-        exa_api_key: get_key(&env_map, "EXA_API_KEY", "OPENPLANTER_EXA_API_KEY"),
-        firecrawl_api_key: get_key(
+        cerebras_api_key: get_key(
             &env_map,
-            "FIRECRAWL_API_KEY",
-            "OPENPLANTER_FIRECRAWL_API_KEY",
+            "CEREBRAS_API_KEY",
+            "OPENPLANTER_CEREBRAS_API_KEY",
         ),
-        brave_api_key: get_key(&env_map, "BRAVE_API_KEY", "OPENPLANTER_BRAVE_API_KEY"),
-        tavily_api_key: get_key(&env_map, "TAVILY_API_KEY", "OPENPLANTER_TAVILY_API_KEY"),
+        exa_api_key: get_key(&env_map, "EXA_API_KEY", "OPENPLANTER_EXA_API_KEY"),
         voyage_api_key: get_key(&env_map, "VOYAGE_API_KEY", "OPENPLANTER_VOYAGE_API_KEY"),
     }
 }
@@ -192,11 +171,7 @@ pub fn credentials_from_env() -> CredentialBundle {
         anthropic_api_key: env_key("OPENPLANTER_ANTHROPIC_API_KEY", "ANTHROPIC_API_KEY"),
         openrouter_api_key: env_key("OPENPLANTER_OPENROUTER_API_KEY", "OPENROUTER_API_KEY"),
         cerebras_api_key: env_key("OPENPLANTER_CEREBRAS_API_KEY", "CEREBRAS_API_KEY"),
-        zai_api_key: env_key("OPENPLANTER_ZAI_API_KEY", "ZAI_API_KEY"),
         exa_api_key: env_key("OPENPLANTER_EXA_API_KEY", "EXA_API_KEY"),
-        firecrawl_api_key: env_key("OPENPLANTER_FIRECRAWL_API_KEY", "FIRECRAWL_API_KEY"),
-        brave_api_key: env_key("OPENPLANTER_BRAVE_API_KEY", "BRAVE_API_KEY"),
-        tavily_api_key: env_key("OPENPLANTER_TAVILY_API_KEY", "TAVILY_API_KEY"),
         voyage_api_key: env_key("OPENPLANTER_VOYAGE_API_KEY", "VOYAGE_API_KEY"),
     }
 }
@@ -335,24 +310,6 @@ mod tests {
         assert!(bundle.has_any());
     }
 
-    #[test]
-    fn test_credential_bundle_has_any_with_voyage_key() {
-        let bundle = CredentialBundle {
-            voyage_api_key: Some("voyage-test".into()),
-            ..Default::default()
-        };
-        assert!(bundle.has_any());
-    }
-
-    #[test]
-    fn test_credential_bundle_whitespace_only_values_do_not_count() {
-        let bundle = CredentialBundle {
-            voyage_api_key: Some("   ".into()),
-            ..Default::default()
-        };
-        assert!(!bundle.has_any());
-    }
-
     #[test]
     fn test_credential_bundle_merge_missing() {
         let mut a = CredentialBundle {
@@ -362,13 +319,11 @@ mod tests {
         let b = CredentialBundle {
             openai_api_key: Some("should-not-overwrite".into()),
             anthropic_api_key: Some("new-key".into()),
-            zai_api_key: Some("zai-key".into()),
             ..Default::default()
         };
         a.merge_missing(&b);
         assert_eq!(a.openai_api_key, Some("existing".into()));
         assert_eq!(a.anthropic_api_key, Some("new-key".into()));
-        assert_eq!(a.zai_api_key, Some("zai-key".into()));
     }
 
     #[test]
@@ -377,18 +332,12 @@ mod tests {
             openai_api_key: Some("sk-123".into()),
             anthropic_api_key: None,
             openrouter_api_key: Some("or-456".into()),
-            firecrawl_api_key: Some("fc-789".into()),
-            brave_api_key: Some("brave-101".into()),
-            tavily_api_key: Some("tavily-202".into()),
             ..Default::default()
         };
         let json = bundle.to_json();
         assert_eq!(json.get("openai_api_key").unwrap(), "sk-123");
         assert!(!json.contains_key("anthropic_api_key"));
         assert_eq!(json.get("openrouter_api_key").unwrap(), "or-456");
-        assert_eq!(json.get("firecrawl_api_key").unwrap(), "fc-789");
-        assert_eq!(json.get("brave_api_key").unwrap(), "brave-101");
-        assert_eq!(json.get("tavily_api_key").unwrap(), "tavily-202");
     }
 
     #[test]
@@ -402,10 +351,6 @@ mod tests {
 OPENAI_API_KEY=sk-from-env
 export ANTHROPIC_API_KEY='ant-key'
 EXA_API_KEY="exa-quoted"
-ZAI_API_KEY=zai-from-env
-OPENPLANTER_FIRECRAWL_API_KEY="firecrawl-quoted"
-BRAVE_API_KEY=brave-from-env
-OPENPLANTER_TAVILY_API_KEY=tavily-from-env
 UNRELATED_VAR=foo
 "#,
         )
@@ -415,10 +360,6 @@ UNRELATED_VAR=foo
         assert_eq!(bundle.openai_api_key, Some("sk-from-env".into()));
         assert_eq!(bundle.anthropic_api_key, Some("ant-key".into()));
         assert_eq!(bundle.exa_api_key, Some("exa-quoted".into()));
-        assert_eq!(bundle.zai_api_key, Some("zai-from-env".into()));
-        assert_eq!(bundle.firecrawl_api_key, Some("firecrawl-quoted".into()));
-        assert_eq!(bundle.brave_api_key, Some("brave-from-env".into()));
-        assert_eq!(bundle.tavily_api_key, Some("tavily-from-env".into()));
         assert!(bundle.cerebras_api_key.is_none());
     }
 
@@ -429,18 +370,12 @@ UNRELATED_VAR=foo
         let bundle = CredentialBundle {
             openai_api_key: Some("sk-test".into()),
             anthropic_api_key: Some("ant-test".into()),
-            zai_api_key: Some("zai-test".into()),
-            brave_api_key: Some("brave-test".into()),
-            tavily_api_key: Some("tavily-test".into()),
             ..Default::default()
         };
         store.save(&bundle).unwrap();
         let loaded = store.load();
         assert_eq!(loaded.openai_api_key, Some("sk-test".into()));
         assert_eq!(loaded.anthropic_api_key, Some("ant-test".into()));
-        assert_eq!(loaded.zai_api_key, Some("zai-test".into()));
-        assert_eq!(loaded.brave_api_key, Some("brave-test".into()));
-        assert_eq!(loaded.tavily_api_key, Some("tavily-test".into()));
     }
 
     #[test]
diff --git a/openplanter-desktop/crates/op-core/src/model/anthropic.rs b/openplanter-desktop/crates/op-core/src/model/anthropic.rs
index e760120a..a0705724 100644
--- a/openplanter-desktop/crates/op-core/src/model/anthropic.rs
+++ b/openplanter-desktop/crates/op-core/src/model/anthropic.rs
@@ -2,13 +2,12 @@
 //
 // Uses the Anthropic Messages API with SSE streaming.
 
-use anyhow::{Context, anyhow};
+use anyhow::{anyhow, Context};
 use reqwest_eventsource::{Event, RequestBuilderExt};
 use tokio_util::sync::CancellationToken;
 
-use super::{BaseModel, Message, ModelTurn, ToolCall};
-use crate::config::strip_foundry_model_prefix;
 use crate::events::{DeltaEvent, DeltaKind};
+use super::{BaseModel, Message, ModelTurn, ToolCall};
 
 pub struct AnthropicModel {
     client: reqwest::Client,
@@ -37,14 +36,10 @@ impl AnthropicModel {
     }
 
     fn is_opus_46(&self) -> bool {
-        let lower = self.request_model_name().to_lowercase();
+        let lower = self.model.to_lowercase();
         lower.contains("opus-4-6") || lower.contains("opus-4.6")
     }
 
-    fn request_model_name(&self) -> String {
-        strip_foundry_model_prefix(&self.model)
-    }
-
     /// Extract the system prompt from messages (Anthropic uses a top-level `system` field).
     fn extract_system(messages: &[Message]) -> Option<String> {
         for msg in messages {
@@ -72,10 +67,7 @@ impl AnthropicModel {
                         "content": content,
                     }));
                 }
-                Message::Assistant {
-                    content,
-                    tool_calls,
-                } => {
+                Message::Assistant { content, tool_calls } => {
                     let mut blocks: Vec<serde_json::Value> = Vec::new();
                     if !content.is_empty() {
                         blocks.push(serde_json::json!({
@@ -85,8 +77,8 @@ impl AnthropicModel {
                     }
                     if let Some(tcs) = tool_calls {
                         for tc in tcs {
-                            let input: serde_json::Value = serde_json::from_str(&tc.arguments)
-                                .unwrap_or(serde_json::json!({}));
+                            let input: serde_json::Value =
+                                serde_json::from_str(&tc.arguments).unwrap_or(serde_json::json!({}));
                             blocks.push(serde_json::json!({
                                 "type": "tool_use",
                                 "id": tc.id,
@@ -100,10 +92,7 @@ impl AnthropicModel {
                         "content": blocks,
                     }));
                 }
-                Message::Tool {
-                    tool_call_id,
-                    content,
-                } => {
+                Message::Tool { tool_call_id, content } => {
                     let block = serde_json::json!({
                         "type": "tool_result",
                         "tool_use_id": tool_call_id,
@@ -112,12 +101,8 @@ impl AnthropicModel {
                     // Merge into previous user message if it contains tool_result blocks
                     if let Some(last) = result.last_mut() {
                         if last.get("role").and_then(|r| r.as_str()) == Some("user") {
-                            if let Some(arr) =
-                                last.get_mut("content").and_then(|c| c.as_array_mut())
-                            {
-                                if arr.iter().any(|b| {
-                                    b.get("type").and_then(|t| t.as_str()) == Some("tool_result")
-                                }) {
+                            if let Some(arr) = last.get_mut("content").and_then(|c| c.as_array_mut()) {
+                                if arr.iter().any(|b| b.get("type").and_then(|t| t.as_str()) == Some("tool_result")) {
                                     arr.push(block);
                                     continue;
                                 }
@@ -148,7 +133,7 @@ impl AnthropicModel {
         let use_thinking = matches!(effort.as_str(), "low" | "medium" | "high");
 
         let mut payload = serde_json::json!({
-            "model": self.request_model_name(),
+            "model": self.model,
             "max_tokens": self.max_tokens,
             "messages": Self::convert_messages(messages),
             "stream": true,
@@ -235,8 +220,7 @@ impl BaseModel for AnthropicModel {
             tool_name: String,
             input_json: String,
         }
-        let mut blocks: std::collections::HashMap<u64, BlockState> =
-            std::collections::HashMap::new();
+        let mut blocks: std::collections::HashMap<u64, BlockState> = std::collections::HashMap::new();
         let mut tool_calls: Vec<ToolCall> = Vec::new();
 
         use futures::StreamExt;
@@ -287,8 +271,7 @@ impl BaseModel for AnthropicModel {
                     match msg_type {
                         "message_start" => {
                             if let Some(usage) = data.pointer("/message/usage") {
-                                if let Some(it) = usage.get("input_tokens").and_then(|v| v.as_u64())
-                                {
+                                if let Some(it) = usage.get("input_tokens").and_then(|v| v.as_u64()) {
                                     input_tokens = it;
                                 }
                             }
@@ -296,24 +279,13 @@ impl BaseModel for AnthropicModel {
 
                         "content_block_start" => {
                             let idx = data.get("index").and_then(|i| i.as_u64()).unwrap_or(0);
-                            let block = data
-                                .get("content_block")
-                                .unwrap_or(&serde_json::Value::Null);
-                            let btype =
-                                block.get("type").and_then(|t| t.as_str()).unwrap_or("text");
+                            let block = data.get("content_block").unwrap_or(&serde_json::Value::Null);
+                            let btype = block.get("type").and_then(|t| t.as_str()).unwrap_or("text");
 
                             let state = match btype {
                                 "tool_use" => {
-                                    let name = block
-                                        .get("name")
-                                        .and_then(|n| n.as_str())
-                                        .unwrap_or("")
-                                        .to_string();
-                                    let id = block
-                                        .get("id")
-                                        .and_then(|i| i.as_str())
-                                        .unwrap_or("")
-                                        .to_string();
+                                    let name = block.get("name").and_then(|n| n.as_str()).unwrap_or("").to_string();
+                                    let id = block.get("id").and_then(|i| i.as_str()).unwrap_or("").to_string();
                                     if !name.is_empty() {
                                         on_delta(DeltaEvent {
                                             kind: DeltaKind::ToolCallStart,
@@ -349,8 +321,7 @@ impl BaseModel for AnthropicModel {
                                 Some(d) => d,
                                 None => continue,
                             };
-                            let delta_type =
-                                delta.get("type").and_then(|t| t.as_str()).unwrap_or("");
+                            let delta_type = delta.get("type").and_then(|t| t.as_str()).unwrap_or("");
 
                             match delta_type {
                                 "text_delta" => {
@@ -365,8 +336,7 @@ impl BaseModel for AnthropicModel {
                                     }
                                 }
                                 "thinking_delta" => {
-                                    if let Some(t) = delta.get("thinking").and_then(|t| t.as_str())
-                                    {
+                                    if let Some(t) = delta.get("thinking").and_then(|t| t.as_str()) {
                                         if !t.is_empty() {
                                             thinking.push_str(t);
                                             on_delta(DeltaEvent {
@@ -377,9 +347,7 @@ impl BaseModel for AnthropicModel {
                                     }
                                 }
                                 "input_json_delta" => {
-                                    if let Some(chunk) =
-                                        delta.get("partial_json").and_then(|j| j.as_str())
-                                    {
+                                    if let Some(chunk) = delta.get("partial_json").and_then(|j| j.as_str()) {
                                         if !chunk.is_empty() {
                                             if let Some(block) = blocks.get_mut(&idx) {
                                                 block.input_json.push_str(chunk);
@@ -410,9 +378,7 @@ impl BaseModel for AnthropicModel {
 
                         "message_delta" => {
                             if let Some(usage) = data.get("usage") {
-                                if let Some(ot) =
-                                    usage.get("output_tokens").and_then(|v| v.as_u64())
-                                {
+                                if let Some(ot) = usage.get("output_tokens").and_then(|v| v.as_u64()) {
                                     output_tokens = ot;
                                 }
                             }
@@ -435,11 +401,7 @@ impl BaseModel for AnthropicModel {
 
         Ok(ModelTurn {
             text,
-            thinking: if thinking.is_empty() {
-                None
-            } else {
-                Some(thinking)
-            },
+            thinking: if thinking.is_empty() { None } else { Some(thinking) },
             tool_calls,
             input_tokens,
             output_tokens,
@@ -474,7 +436,6 @@ mod tests {
     fn test_is_opus_46() {
         assert!(make_model("claude-opus-4-6", None).is_opus_46());
         assert!(make_model("claude-opus-4.6-20250610", None).is_opus_46());
-        assert!(make_model("anthropic-foundry/claude-opus-4-6", None).is_opus_46());
         assert!(!make_model("claude-sonnet-4-5", None).is_opus_46());
     }
 
@@ -483,24 +444,15 @@ mod tests {
     #[test]
     fn test_extract_system_present() {
         let msgs = vec![
-            Message::System {
-                content: "Be helpful.".to_string(),
-            },
-            Message::User {
-                content: "Hi".to_string(),
-            },
+            Message::System { content: "Be helpful.".to_string() },
+            Message::User { content: "Hi".to_string() },
         ];
-        assert_eq!(
-            AnthropicModel::extract_system(&msgs),
-            Some("Be helpful.".to_string())
-        );
+        assert_eq!(AnthropicModel::extract_system(&msgs), Some("Be helpful.".to_string()));
     }
 
     #[test]
     fn test_extract_system_absent() {
-        let msgs = vec![Message::User {
-            content: "Hi".to_string(),
-        }];
+        let msgs = vec![Message::User { content: "Hi".to_string() }];
         assert_eq!(AnthropicModel::extract_system(&msgs), None);
     }
 
@@ -509,12 +461,8 @@ mod tests {
     #[test]
     fn test_convert_filters_system() {
         let msgs = vec![
-            Message::System {
-                content: "System prompt".to_string(),
-            },
-            Message::User {
-                content: "Hello".to_string(),
-            },
+            Message::System { content: "System prompt".to_string() },
+            Message::User { content: "Hello".to_string() },
         ];
         let converted = AnthropicModel::convert_messages(&msgs);
         assert_eq!(converted.len(), 1); // System is filtered out
@@ -560,40 +508,18 @@ mod tests {
             Message::Assistant {
                 content: "Using tools.".to_string(),
                 tool_calls: Some(vec![
-                    ToolCall {
-                        id: "t1".into(),
-                        name: "read_file".into(),
-                        arguments: "{}".into(),
-                    },
-                    ToolCall {
-                        id: "t2".into(),
-                        name: "list_files".into(),
-                        arguments: "{}".into(),
-                    },
+                    ToolCall { id: "t1".into(), name: "read_file".into(), arguments: "{}".into() },
+                    ToolCall { id: "t2".into(), name: "list_files".into(), arguments: "{}".into() },
                 ]),
             },
-            Message::Tool {
-                tool_call_id: "t1".into(),
-                content: "file1 contents".into(),
-            },
-            Message::Tool {
-                tool_call_id: "t2".into(),
-                content: "file list".into(),
-            },
+            Message::Tool { tool_call_id: "t1".into(), content: "file1 contents".into() },
+            Message::Tool { tool_call_id: "t2".into(), content: "file list".into() },
         ];
         let converted = AnthropicModel::convert_messages(&msgs);
         // Should be 2 messages: assistant + one merged user
-        assert_eq!(
-            converted.len(),
-            2,
-            "consecutive Tool messages should merge into one user message"
-        );
+        assert_eq!(converted.len(), 2, "consecutive Tool messages should merge into one user message");
         let user_content = converted[1]["content"].as_array().unwrap();
-        assert_eq!(
-            user_content.len(),
-            2,
-            "merged user message should have 2 tool_result blocks"
-        );
+        assert_eq!(user_content.len(), 2, "merged user message should have 2 tool_result blocks");
         assert_eq!(user_content[0]["tool_use_id"], "t1");
         assert_eq!(user_content[1]["tool_use_id"], "t2");
     }
@@ -604,12 +530,8 @@ mod tests {
     fn test_payload_no_thinking_has_temperature() {
         let model = make_model("claude-sonnet-4-5", None);
         let msgs = vec![
-            Message::System {
-                content: "System".to_string(),
-            },
-            Message::User {
-                content: "Hi".to_string(),
-            },
+            Message::System { content: "System".to_string() },
+            Message::User { content: "Hi".to_string() },
         ];
         let payload = model.build_payload(&msgs, &[]);
         assert_eq!(payload["temperature"], 0.0);
@@ -621,31 +543,17 @@ mod tests {
     #[test]
     fn test_payload_opus_46_adaptive_thinking() {
         let model = make_model("claude-opus-4-6", Some("high"));
-        let msgs = vec![Message::User {
-            content: "Hi".to_string(),
-        }];
+        let msgs = vec![Message::User { content: "Hi".to_string() }];
         let payload = model.build_payload(&msgs, &[]);
         assert!(payload.get("temperature").is_none()); // No temperature with thinking
         assert_eq!(payload["thinking"]["type"], "adaptive");
         assert_eq!(payload["output_config"]["effort"], "high");
     }
 
-    #[test]
-    fn test_payload_strips_foundry_prefix() {
-        let model = make_model("anthropic-foundry/claude-opus-4-6", Some("high"));
-        let msgs = vec![Message::User {
-            content: "Hi".to_string(),
-        }];
-        let payload = model.build_payload(&msgs, &[]);
-        assert_eq!(payload["model"], "claude-opus-4-6");
-    }
-
     #[test]
     fn test_payload_older_model_enabled_thinking() {
         let model = make_model("claude-sonnet-4-5", Some("medium"));
-        let msgs = vec![Message::User {
-            content: "Hi".to_string(),
-        }];
+        let msgs = vec![Message::User { content: "Hi".to_string() }];
         let payload = model.build_payload(&msgs, &[]);
         assert_eq!(payload["thinking"]["type"], "enabled");
         assert_eq!(payload["thinking"]["budget_tokens"], 4096);
@@ -655,12 +563,8 @@ mod tests {
     fn test_payload_system_extracted_to_top_level() {
         let model = make_model("claude-sonnet-4-5", None);
         let msgs = vec![
-            Message::System {
-                content: "You are helpful.".to_string(),
-            },
-            Message::User {
-                content: "Test".to_string(),
-            },
+            Message::System { content: "You are helpful.".to_string() },
+            Message::User { content: "Test".to_string() },
         ];
         let payload = model.build_payload(&msgs, &[]);
         // System should be top-level, not in messages array
diff --git a/openplanter-desktop/crates/op-core/src/model/openai.rs b/openplanter-desktop/crates/op-core/src/model/openai.rs
index b3fb5ad4..4b1353f6 100644
--- a/openplanter-desktop/crates/op-core/src/model/openai.rs
+++ b/openplanter-desktop/crates/op-core/src/model/openai.rs
@@ -1,32 +1,15 @@
 // OpenAI-compatible model implementation.
 //
-// Handles openai, openrouter, cerebras, zai, and ollama via /chat/completions.
+// Handles openai, openrouter, cerebras, and ollama — all use /chat/completions.
 
 use std::collections::HashMap;
-use std::sync::{Arc, RwLock};
-use std::time::Duration;
 
-use anyhow::{Context, anyhow};
-use chrono::{DateTime, Utc};
+use anyhow::{anyhow, Context};
 use reqwest_eventsource::{Event, RequestBuilderExt};
-use tokio::time::sleep;
 use tokio_util::sync::CancellationToken;
 
-use super::{BaseModel, Message, ModelTurn, RateLimitError, ToolCall};
-use crate::config::strip_foundry_model_prefix;
 use crate::events::{DeltaEvent, DeltaKind};
-
-#[derive(Debug, Clone, Default)]
-pub struct ZaiRuntimeConfig {
-    pub paygo_base_url: String,
-    pub coding_base_url: String,
-    pub stream_max_retries: usize,
-}
-
-struct StreamAttemptError {
-    error: anyhow::Error,
-    saw_output: bool,
-}
+use super::{BaseModel, Message, ModelTurn, ToolCall};
 
 pub struct OpenAIModel {
     client: reqwest::Client,
@@ -36,10 +19,6 @@ pub struct OpenAIModel {
     api_key: String,
     reasoning_effort: Option<String>,
     extra_headers: HashMap<String, String>,
-    thinking_type: Option<String>,
-    stream_max_retries: usize,
-    fallback_base_urls: Vec<String>,
-    active_base_url: Arc<RwLock<String>>,
 }
 
 impl OpenAIModel {
@@ -55,53 +34,18 @@ impl OpenAIModel {
             client: reqwest::Client::new(),
             model,
             provider,
-            base_url: base_url.clone(),
+            base_url,
             api_key,
             reasoning_effort,
             extra_headers,
-            thinking_type: None,
-            stream_max_retries: 1,
-            fallback_base_urls: Vec::new(),
-            active_base_url: Arc::new(RwLock::new(base_url)),
         }
     }
 
-    pub fn with_zai_runtime(mut self, config: ZaiRuntimeConfig) -> Self {
-        let effort = self
-            .reasoning_effort
-            .as_deref()
-            .unwrap_or_default()
-            .trim()
-            .to_lowercase();
-        self.thinking_type = Some(if effort.is_empty() || effort == "none" {
-            "disabled".to_string()
-        } else {
-            "enabled".to_string()
-        });
-        self.stream_max_retries = config.stream_max_retries.max(1);
-
-        let mut fallbacks = Vec::new();
-        for candidate in [config.paygo_base_url, config.coding_base_url] {
-            let trimmed = candidate.trim();
-            if trimmed.is_empty() {
-                continue;
-            }
-            if !fallbacks.iter().any(|url| url == trimmed) {
-                fallbacks.push(trimmed.to_string());
-            }
-        }
-        self.fallback_base_urls = fallbacks;
-        self
-    }
-
     fn is_reasoning_model(&self) -> bool {
-        let lower = self.request_model_name().to_lowercase();
-        if lower.starts_with("o1-")
-            || lower == "o1"
-            || lower.starts_with("o3-")
-            || lower == "o3"
-            || lower.starts_with("o4-")
-            || lower == "o4"
+        let lower = self.model.to_lowercase();
+        if lower.starts_with("o1-") || lower == "o1"
+            || lower.starts_with("o3-") || lower == "o3"
+            || lower.starts_with("o4-") || lower == "o4"
         {
             return true;
         }
@@ -111,10 +55,6 @@ impl OpenAIModel {
         false
     }
 
-    fn request_model_name(&self) -> String {
-        strip_foundry_model_prefix(&self.model)
-    }
-
     fn convert_messages(messages: &[Message]) -> Vec<serde_json::Value> {
         messages
             .iter()
@@ -127,10 +67,7 @@ impl OpenAIModel {
                     "role": "user",
                     "content": content,
                 }),
-                Message::Assistant {
-                    content,
-                    tool_calls,
-                } => {
+                Message::Assistant { content, tool_calls } => {
                     let mut obj = serde_json::json!({
                         "role": "assistant",
                         "content": content,
@@ -138,25 +75,20 @@ impl OpenAIModel {
                     if let Some(tcs) = tool_calls {
                         let tc_arr: Vec<serde_json::Value> = tcs
                             .iter()
-                            .map(|tc| {
-                                serde_json::json!({
-                                    "id": tc.id,
-                                    "type": "function",
-                                    "function": {
-                                        "name": tc.name,
-                                        "arguments": tc.arguments,
-                                    }
-                                })
-                            })
+                            .map(|tc| serde_json::json!({
+                                "id": tc.id,
+                                "type": "function",
+                                "function": {
+                                    "name": tc.name,
+                                    "arguments": tc.arguments,
+                                }
+                            }))
                             .collect();
                         obj["tool_calls"] = serde_json::Value::Array(tc_arr);
                     }
                     obj
                 }
-                Message::Tool {
-                    tool_call_id,
-                    content,
-                } => serde_json::json!({
+                Message::Tool { tool_call_id, content } => serde_json::json!({
                     "role": "tool",
                     "tool_call_id": tool_call_id,
                     "content": content,
@@ -172,13 +104,13 @@ impl OpenAIModel {
         stream: bool,
     ) -> serde_json::Value {
         let mut payload = serde_json::json!({
-            "model": self.request_model_name(),
+            "model": self.model,
             "messages": Self::convert_messages(messages),
         });
 
         if stream {
             payload["stream"] = serde_json::json!(true);
-            payload["stream_options"] = serde_json::json!({ "include_usage": true });
+            payload["stream_options"] = serde_json::json!({"include_usage": true});
         }
 
         if !tools.is_empty() {
@@ -197,322 +129,61 @@ impl OpenAIModel {
             }
         }
 
-        if let Some(ref thinking_type) = self.thinking_type {
-            let value = thinking_type.trim().to_lowercase();
-            if matches!(value.as_str(), "enabled" | "disabled") {
-                payload["thinking"] = serde_json::json!({ "type": value });
-            }
-        }
-
         payload
     }
+}
 
-    fn build_request(&self, url: &str, payload: &serde_json::Value) -> reqwest::RequestBuilder {
-        let mut request = self
-            .client
-            .post(url)
-            .header("Authorization", format!("Bearer {}", self.api_key))
-            .header("Content-Type", "application/json");
-
-        for (k, v) in &self.extra_headers {
-            request = request.header(k.as_str(), v.as_str());
-        }
-
-        request.json(payload)
-    }
-
-    fn current_base_url(&self) -> String {
-        self.active_base_url
-            .read()
-            .map(|value| value.clone())
-            .unwrap_or_else(|_| self.base_url.clone())
-    }
-
-    fn set_active_base_url(&self, base_url: &str) {
-        if let Ok(mut guard) = self.active_base_url.write() {
-            *guard = base_url.to_string();
-        }
-    }
-
-    fn candidate_base_urls(&self) -> Vec<String> {
-        let mut urls = Vec::new();
-        let current = self.current_base_url();
-        urls.push(current);
-        for candidate in &self.fallback_base_urls {
-            if !urls.iter().any(|url| url == candidate) {
-                urls.push(candidate.clone());
-            }
-        }
-        urls
-    }
-
-    fn should_try_next_zai_base_url(&self, err: &anyhow::Error) -> bool {
-        if self.provider != "zai" {
-            return false;
-        }
-        let text = err.to_string().to_lowercase();
-        text.contains("404") || text.contains("405") || text.contains("not found")
-    }
-
-    fn should_retry_zai_error(&self, err: &StreamAttemptError) -> bool {
-        if self.provider != "zai" || err.saw_output {
-            return false;
-        }
-        if err.error.downcast_ref::<RateLimitError>().is_some() {
-            return true;
-        }
-        let text = err.error.to_string().to_lowercase();
-        text.contains("429")
-            || text.contains("1302")
-            || text.contains("rate limit")
-            || text.contains("too many requests")
-            || text.contains("connection")
-            || text.contains("timed out")
-            || text.contains("timeout")
-            || text.contains("stream ended")
-            || text.contains("broken pipe")
-            || text.contains("500")
-            || text.contains("502")
-            || text.contains("503")
-            || text.contains("504")
-    }
-
-    fn parse_retry_after_value(value: Option<&serde_json::Value>) -> Option<f64> {
-        match value {
-            Some(serde_json::Value::Number(num)) => num.as_f64().map(|v| v.max(0.0)),
-            Some(serde_json::Value::String(text)) => Self::parse_retry_after_text(text),
-            _ => None,
-        }
-    }
-
-    fn parse_retry_after_text(text: &str) -> Option<f64> {
-        let trimmed = text.trim();
-        if trimmed.is_empty() {
-            return None;
-        }
-        if let Ok(seconds) = trimmed.parse::<f64>() {
-            return Some(seconds.max(0.0));
-        }
-        let parsed = DateTime::parse_from_rfc2822(trimmed).ok()?;
-        Some(
-            (parsed.with_timezone(&Utc) - Utc::now())
-                .num_milliseconds()
-                .max(0) as f64
-                / 1000.0,
-        )
-    }
-
-    fn parse_retry_after_header(headers: &reqwest::header::HeaderMap) -> Option<f64> {
-        let value = headers.get(reqwest::header::RETRY_AFTER)?;
-        let text = value.to_str().ok()?;
-        Self::parse_retry_after_text(text)
-    }
-
-    fn extract_provider_code(value: Option<&serde_json::Value>) -> Option<String> {
-        match value {
-            Some(serde_json::Value::String(text)) => {
-                let trimmed = text.trim();
-                (!trimmed.is_empty()).then(|| trimmed.to_string())
-            }
-            Some(serde_json::Value::Number(num)) => Some(num.to_string()),
-            Some(other) => {
-                let rendered = other.to_string();
-                let trimmed = rendered.trim();
-                (!trimmed.is_empty()).then(|| trimmed.to_string())
-            }
-            None => None,
-        }
-    }
-
-    fn extract_openai_style_error(
-        payload: &serde_json::Value,
-    ) -> (String, Option<String>, Option<f64>) {
-        if let Some(error) = payload.get("error").and_then(|value| value.as_object()) {
-            let message = error
-                .get("message")
-                .and_then(|value| value.as_str())
-                .unwrap_or_default()
-                .trim()
-                .to_string();
-            let provider_code = Self::extract_provider_code(error.get("code"));
-            let retry_after = Self::parse_retry_after_value(error.get("retry_after"))
-                .or_else(|| Self::parse_retry_after_value(payload.get("retry_after")));
-            return (message, provider_code, retry_after);
-        }
-        (
-            String::new(),
-            None,
-            Self::parse_retry_after_value(payload.get("retry_after")),
-        )
-    }
-
-    fn is_rate_limit_error(
-        status_code: Option<u16>,
-        provider_code: Option<&str>,
-        message: &str,
-    ) -> bool {
-        if status_code == Some(429) {
-            return true;
-        }
-        if let Some(code) = provider_code {
-            let code = code.trim().to_lowercase();
-            if matches!(
-                code.as_str(),
-                "1302" | "429" | "rate_limit" | "rate_limit_exceeded" | "too_many_requests"
-            ) {
-                return true;
-            }
-        }
-        let text = message.to_lowercase();
-        text.contains("rate limit") || text.contains("too many requests")
-    }
-
-    fn classify_stream_payload_error(payload: &serde_json::Value) -> Option<anyhow::Error> {
-        let is_error_type = payload
-            .get("type")
-            .and_then(|value| value.as_str())
-            .is_some_and(|value| value == "error");
-        let error = payload.get("error")?;
-        let message = error
-            .get("message")
-            .and_then(|value| value.as_str())
-            .map(str::trim)
-            .filter(|value| !value.is_empty())
-            .map(str::to_string)
-            .unwrap_or_else(|| payload.to_string());
-        let provider_code = Self::extract_provider_code(error.get("code"));
-        let retry_after = Self::parse_retry_after_value(error.get("retry_after"));
-        let prefixed_message = format!("Stream error: {message}");
-
-        if Self::is_rate_limit_error(None, provider_code.as_deref(), &message) {
-            return Some(anyhow::Error::new(RateLimitError {
-                message: prefixed_message,
-                status_code: None,
-                provider_code,
-                body: payload.to_string(),
-                retry_after_sec: retry_after,
-            }));
-        }
-
-        if is_error_type || provider_code.is_some() || payload.get("retry_after").is_some() {
-            return Some(anyhow!(prefixed_message));
-        }
-
-        None
-    }
-
-    async fn classify_sse_error(
-        &self,
-        url: &str,
-        error: reqwest_eventsource::Error,
-    ) -> anyhow::Error {
-        match error {
-            reqwest_eventsource::Error::InvalidStatusCode(status, response) => {
-                self.classify_invalid_status(url, status, response).await
-            }
-            other => anyhow!("SSE stream error: {other}"),
-        }
-    }
-
-    async fn classify_invalid_status(
+#[async_trait::async_trait]
+impl BaseModel for OpenAIModel {
+    async fn chat(
         &self,
-        url: &str,
-        status: reqwest::StatusCode,
-        response: reqwest::Response,
-    ) -> anyhow::Error {
-        let response_url = response.url().clone();
-        let headers = response.headers().clone();
-        let body = response.text().await.unwrap_or_default();
-        let parsed = serde_json::from_str::<serde_json::Value>(&body).ok();
-        let mut message = String::new();
-        let mut provider_code = None;
-        let mut retry_after = Self::parse_retry_after_header(&headers);
-
-        if let Some(ref payload) = parsed {
-            let (body_message, body_code, body_retry_after) =
-                Self::extract_openai_style_error(payload);
-            message = body_message;
-            provider_code = body_code;
-            if retry_after.is_none() {
-                retry_after = body_retry_after;
-            }
-        }
-
-        let detail = if !message.is_empty() {
-            message.clone()
-        } else if !body.trim().is_empty() {
-            body.clone()
-        } else {
-            status.to_string()
-        };
-
-        if Self::is_rate_limit_error(Some(status.as_u16()), provider_code.as_deref(), &detail) {
-            return anyhow::Error::new(RateLimitError {
-                message: format!(
-                    "HTTP {} calling {}: {}",
-                    status.as_u16(),
-                    response_url,
-                    detail
-                ),
-                status_code: Some(status.as_u16()),
-                provider_code,
-                body,
-                retry_after_sec: retry_after,
-            });
-        }
-
-        anyhow!(
-            "HTTP {} calling {}: {}",
-            status.as_u16(),
-            if response_url.as_str().is_empty() {
-                url
-            } else {
-                response_url.as_str()
-            },
-            detail
-        )
+        messages: &[Message],
+        tools: &[serde_json::Value],
+    ) -> anyhow::Result<ModelTurn> {
+        // Default: call chat_stream with a no-op callback
+        let noop = |_: DeltaEvent| {};
+        let cancel = CancellationToken::new();
+        self.chat_stream(messages, tools, &noop, &cancel).await
     }
 
-    async fn chat_stream_once(
+    async fn chat_stream(
         &self,
-        base_url: &str,
         messages: &[Message],
         tools: &[serde_json::Value],
         on_delta: &(dyn Fn(DeltaEvent) + Send + Sync),
         cancel: &CancellationToken,
-    ) -> Result<ModelTurn, StreamAttemptError> {
-        let url = format!("{}/chat/completions", base_url.trim_end_matches('/'));
+    ) -> anyhow::Result<ModelTurn> {
+        let url = format!("{}/chat/completions", self.base_url.trim_end_matches('/'));
         let payload = self.build_payload(messages, tools, true);
-        let request = self.build_request(&url, &payload);
-        let mut es = request.eventsource().map_err(|e| StreamAttemptError {
-            error: anyhow!("Failed to open SSE stream: {e}"),
-            saw_output: false,
-        })?;
+
+        let mut request = self
+            .client
+            .post(&url)
+            .header("Authorization", format!("Bearer {}", self.api_key))
+            .header("Content-Type", "application/json");
+
+        for (k, v) in &self.extra_headers {
+            request = request.header(k.as_str(), v.as_str());
+        }
+
+        let mut es = request.json(&payload).eventsource()?;
 
         let mut text = String::new();
-        let mut thinking = String::new();
-        let mut tool_calls_by_index: HashMap<usize, (String, String, String)> = HashMap::new();
+        let mut tool_calls_by_index: HashMap<usize, (String, String, String)> = HashMap::new(); // (id, name, args)
         let mut input_tokens: u64 = 0;
         let mut output_tokens: u64 = 0;
-        let mut saw_output = false;
 
         use futures::StreamExt;
         loop {
             if cancel.is_cancelled() {
                 es.close();
-                return Err(StreamAttemptError {
-                    error: anyhow!("Cancelled"),
-                    saw_output,
-                });
+                return Err(anyhow!("Cancelled"));
             }
 
             let event = tokio::select! {
                 _ = cancel.cancelled() => {
                     es.close();
-                    return Err(StreamAttemptError {
-                        error: anyhow!("Cancelled"),
-                        saw_output,
-                    });
+                    return Err(anyhow!("Cancelled"));
                 }
                 ev = es.next() => ev,
             };
@@ -522,8 +193,7 @@ impl OpenAIModel {
                 Some(Err(reqwest_eventsource::Error::StreamEnded)) => break,
                 Some(Err(e)) => {
                     es.close();
-                    let error = self.classify_sse_error(&url, e).await;
-                    return Err(StreamAttemptError { error, saw_output });
+                    return Err(anyhow!("SSE stream error: {e}"));
                 }
                 None => break,
             };
@@ -536,13 +206,9 @@ impl OpenAIModel {
                     }
 
                     let chunk: serde_json::Value = serde_json::from_str(&msg.data)
-                        .with_context(|| format!("Failed to parse SSE chunk: {}", &msg.data))
-                        .map_err(|error| StreamAttemptError { error, saw_output })?;
-
-                    if let Some(error) = Self::classify_stream_payload_error(&chunk) {
-                        return Err(StreamAttemptError { error, saw_output });
-                    }
+                        .with_context(|| format!("Failed to parse SSE chunk: {}", &msg.data))?;
 
+                    // Extract usage from any chunk that has it
                     if let Some(usage) = chunk.get("usage") {
                         if let Some(pt) = usage.get("prompt_tokens").and_then(|v| v.as_u64()) {
                             input_tokens = pt;
@@ -556,6 +222,7 @@ impl OpenAIModel {
                         Some(c) => c,
                         None => continue,
                     };
+
                     if choices.is_empty() {
                         continue;
                     }
@@ -565,9 +232,9 @@ impl OpenAIModel {
                         None => continue,
                     };
 
+                    // Text content delta
                     if let Some(content) = delta.get("content").and_then(|c| c.as_str()) {
                         if !content.is_empty() {
-                            saw_output = true;
                             text.push_str(content);
                             on_delta(DeltaEvent {
                                 kind: DeltaKind::Text,
@@ -576,26 +243,13 @@ impl OpenAIModel {
                         }
                     }
 
-                    for field in ["reasoning_content", "reasoning", "thinking"] {
-                        if let Some(value) = delta.get(field).and_then(|c| c.as_str()) {
-                            if !value.is_empty() {
-                                saw_output = true;
-                                thinking.push_str(value);
-                                on_delta(DeltaEvent {
-                                    kind: DeltaKind::Thinking,
-                                    text: value.to_string(),
-                                });
-                            }
-                        }
-                    }
-
+                    // Tool call deltas
                     if let Some(tc_deltas) = delta.get("tool_calls").and_then(|t| t.as_array()) {
                         for tc_delta in tc_deltas {
-                            let idx = tc_delta.get("index").and_then(|i| i.as_u64()).unwrap_or(0)
-                                as usize;
-                            let entry = tool_calls_by_index
-                                .entry(idx)
-                                .or_insert_with(|| (String::new(), String::new(), String::new()));
+                            let idx = tc_delta.get("index").and_then(|i| i.as_u64()).unwrap_or(0) as usize;
+                            let entry = tool_calls_by_index.entry(idx).or_insert_with(|| {
+                                (String::new(), String::new(), String::new())
+                            });
 
                             if let Some(id) = tc_delta.get("id").and_then(|i| i.as_str()) {
                                 if !id.is_empty() {
@@ -606,7 +260,6 @@ impl OpenAIModel {
                             if let Some(func) = tc_delta.get("function") {
                                 if let Some(name) = func.get("name").and_then(|n| n.as_str()) {
                                     if !name.is_empty() {
-                                        saw_output = true;
                                         entry.1 = name.to_string();
                                         on_delta(DeltaEvent {
                                             kind: DeltaKind::ToolCallStart,
@@ -616,7 +269,6 @@ impl OpenAIModel {
                                 }
                                 if let Some(args) = func.get("arguments").and_then(|a| a.as_str()) {
                                     if !args.is_empty() {
-                                        saw_output = true;
                                         entry.2.push_str(args);
                                         on_delta(DeltaEvent {
                                             kind: DeltaKind::ToolCallArgs,
@@ -631,96 +283,23 @@ impl OpenAIModel {
             }
         }
 
+        // Build tool calls from accumulated data
         let mut tool_calls: Vec<ToolCall> = Vec::new();
         let mut indices: Vec<usize> = tool_calls_by_index.keys().copied().collect();
         indices.sort();
         for idx in indices {
             let (id, name, arguments) = tool_calls_by_index.remove(&idx).unwrap();
-            tool_calls.push(ToolCall {
-                id,
-                name,
-                arguments,
-            });
+            tool_calls.push(ToolCall { id, name, arguments });
         }
 
         Ok(ModelTurn {
             text,
-            thinking: if thinking.is_empty() {
-                None
-            } else {
-                Some(thinking)
-            },
+            thinking: None,
             tool_calls,
             input_tokens,
             output_tokens,
         })
     }
-}
-
-#[async_trait::async_trait]
-impl BaseModel for OpenAIModel {
-    async fn chat(
-        &self,
-        messages: &[Message],
-        tools: &[serde_json::Value],
-    ) -> anyhow::Result<ModelTurn> {
-        let noop = |_: DeltaEvent| {};
-        let cancel = CancellationToken::new();
-        self.chat_stream(messages, tools, &noop, &cancel).await
-    }
-
-    async fn chat_stream(
-        &self,
-        messages: &[Message],
-        tools: &[serde_json::Value],
-        on_delta: &(dyn Fn(DeltaEvent) + Send + Sync),
-        cancel: &CancellationToken,
-    ) -> anyhow::Result<ModelTurn> {
-        let max_attempts = if self.provider == "zai" {
-            self.stream_max_retries.max(1)
-        } else {
-            1
-        };
-        let mut last_error: Option<anyhow::Error> = None;
-
-        for attempt in 0..max_attempts {
-            for base_url in self.candidate_base_urls() {
-                match self
-                    .chat_stream_once(&base_url, messages, tools, on_delta, cancel)
-                    .await
-                {
-                    Ok(turn) => {
-                        self.set_active_base_url(&base_url);
-                        return Ok(turn);
-                    }
-                    Err(err) => {
-                        let should_try_next = self.should_try_next_zai_base_url(&err.error);
-                        let should_retry = self.should_retry_zai_error(&err);
-                        last_error = Some(err.error);
-
-                        if should_try_next {
-                            continue;
-                        }
-
-                        if should_retry && attempt + 1 < max_attempts {
-                            break;
-                        }
-
-                        return Err(last_error
-                            .take()
-                            .unwrap_or_else(|| anyhow!("OpenAI-compatible request failed")));
-                    }
-                }
-            }
-
-            if attempt + 1 < max_attempts {
-                let backoff_ms = (250_u64 << attempt.min(3)).min(2_000);
-                sleep(Duration::from_millis(backoff_ms)).await;
-            }
-        }
-
-        Err(last_error.unwrap_or_else(|| anyhow!("OpenAI-compatible request failed")))
-    }
 
     fn model_name(&self) -> &str {
         &self.model
@@ -746,6 +325,8 @@ mod tests {
         )
     }
 
+    // ── is_reasoning_model ──
+
     #[test]
     fn test_reasoning_model_o1() {
         assert!(make_model("o1", None).is_reasoning_model());
@@ -762,7 +343,6 @@ mod tests {
     fn test_reasoning_model_gpt5() {
         assert!(make_model("gpt-5.2", None).is_reasoning_model());
         assert!(make_model("gpt-5", None).is_reasoning_model());
-        assert!(make_model("azure-foundry/gpt-5.3-codex", None).is_reasoning_model());
     }
 
     #[test]
@@ -771,6 +351,8 @@ mod tests {
         assert!(!make_model("claude-opus-4-6", None).is_reasoning_model());
     }
 
+    // ── convert_messages ──
+
     #[test]
     fn test_convert_system_message() {
         let msgs = vec![Message::System {
@@ -823,6 +405,8 @@ mod tests {
         assert_eq!(converted[0]["content"], "file contents");
     }
 
+    // ── build_payload ──
+
     #[test]
     fn test_payload_non_reasoning_has_temperature() {
         let model = make_model("gpt-4o", None);
@@ -846,16 +430,6 @@ mod tests {
         assert_eq!(payload["reasoning_effort"], "high");
     }
 
-    #[test]
-    fn test_payload_strips_foundry_prefix() {
-        let model = make_model("azure-foundry/gpt-5.3-codex", Some("high"));
-        let msgs = vec![Message::User {
-            content: "Hi".to_string(),
-        }];
-        let payload = model.build_payload(&msgs, &[], true);
-        assert_eq!(payload["model"], "gpt-5.3-codex");
-    }
-
     #[test]
     fn test_payload_with_tools() {
         let model = make_model("gpt-4o", None);
@@ -879,100 +453,7 @@ mod tests {
         assert!(payload.get("tool_choice").is_none());
     }
 
-    #[test]
-    fn test_payload_zai_includes_thinking() {
-        let model = OpenAIModel::new(
-            "glm-5".to_string(),
-            "zai".to_string(),
-            "https://api.z.ai/api/paas/v4".to_string(),
-            "zai-key".to_string(),
-            Some("high".to_string()),
-            HashMap::new(),
-        )
-        .with_zai_runtime(ZaiRuntimeConfig {
-            paygo_base_url: "https://api.z.ai/api/paas/v4".to_string(),
-            coding_base_url: "https://api.z.ai/api/coding/paas/v4".to_string(),
-            stream_max_retries: 4,
-        });
-        let msgs = vec![Message::User {
-            content: "Hi".to_string(),
-        }];
-        let payload = model.build_payload(&msgs, &[], true);
-        assert_eq!(payload["thinking"]["type"], "enabled");
-    }
-
-    #[test]
-    fn test_zai_runtime_switches_to_disabled_when_no_effort() {
-        let model = OpenAIModel::new(
-            "glm-5".to_string(),
-            "zai".to_string(),
-            "https://api.z.ai/api/paas/v4".to_string(),
-            "zai-key".to_string(),
-            None,
-            HashMap::new(),
-        )
-        .with_zai_runtime(ZaiRuntimeConfig {
-            paygo_base_url: "https://api.z.ai/api/paas/v4".to_string(),
-            coding_base_url: "https://api.z.ai/api/coding/paas/v4".to_string(),
-            stream_max_retries: 4,
-        });
-        let msgs = vec![Message::User {
-            content: "Hi".to_string(),
-        }];
-        let payload = model.build_payload(&msgs, &[], true);
-        assert_eq!(payload["thinking"]["type"], "disabled");
-    }
-
-    #[test]
-    fn test_zai_candidate_base_urls_prefers_active() {
-        let model = OpenAIModel::new(
-            "glm-5".to_string(),
-            "zai".to_string(),
-            "https://api.z.ai/api/paas/v4".to_string(),
-            "zai-key".to_string(),
-            Some("medium".to_string()),
-            HashMap::new(),
-        )
-        .with_zai_runtime(ZaiRuntimeConfig {
-            paygo_base_url: "https://api.z.ai/api/paas/v4".to_string(),
-            coding_base_url: "https://api.z.ai/api/coding/paas/v4".to_string(),
-            stream_max_retries: 4,
-        });
-        model.set_active_base_url("https://api.z.ai/api/coding/paas/v4");
-        assert_eq!(
-            model.candidate_base_urls(),
-            vec![
-                "https://api.z.ai/api/coding/paas/v4".to_string(),
-                "https://api.z.ai/api/paas/v4".to_string(),
-            ]
-        );
-    }
-
-    #[test]
-    fn test_retry_after_parses_seconds_and_http_dates() {
-        assert_eq!(OpenAIModel::parse_retry_after_text("3"), Some(3.0));
-        assert!(OpenAIModel::parse_retry_after_text("Wed, 21 Oct 2015 07:28:00 GMT").is_some());
-        assert_eq!(OpenAIModel::parse_retry_after_text(""), None);
-    }
-
-    #[test]
-    fn test_classify_stream_payload_rate_limit_error() {
-        let payload = serde_json::json!({
-            "type": "error",
-            "error": {
-                "message": "Too many requests",
-                "code": "1302",
-                "retry_after": 4
-            }
-        });
-        let error = OpenAIModel::classify_stream_payload_error(&payload)
-            .expect("payload should classify as an error");
-        let rate_limit = error
-            .downcast_ref::<RateLimitError>()
-            .expect("expected a structured rate-limit error");
-        assert_eq!(rate_limit.provider_code.as_deref(), Some("1302"));
-        assert_eq!(rate_limit.retry_after_sec, Some(4.0));
-    }
+    // ── model_name / provider_name ──
 
     #[test]
     fn test_model_name_and_provider() {
diff --git a/openplanter-desktop/crates/op-tauri/src/commands/config.rs b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
index 9ea84671..2015140c 100644
--- a/openplanter-desktop/crates/op-tauri/src/commands/config.rs
+++ b/openplanter-desktop/crates/op-tauri/src/commands/config.rs
@@ -1,67 +1,28 @@
+use std::collections::HashMap;
+use tauri::State;
 use crate::state::AppState;
-use op_core::config::{
-    normalize_web_search_provider, normalize_zai_plan, resolve_zai_base_url,
-};
-use op_core::credentials::credentials_from_env;
 use op_core::events::{ConfigView, ModelInfo, PartialConfig};
 use op_core::settings::{PersistentSettings, SettingsStore};
-use std::collections::HashMap;
-use tauri::State;
+use op_core::credentials::credentials_from_env;
 
-fn make_config_view(cfg: &op_core::config::AgentConfig, session_id: Option<String>) -> ConfigView {
-    ConfigView {
+/// Get the current configuration.
+#[tauri::command]
+pub async fn get_config(
+    state: State<'_, AppState>,
+) -> Result<ConfigView, String> {
+    let cfg = state.config.lock().await;
+    let session_id = state.session_id.lock().await;
+    Ok(ConfigView {
         provider: cfg.provider.clone(),
         model: cfg.model.clone(),
         reasoning_effort: cfg.reasoning_effort.clone(),
-        zai_plan: cfg.zai_plan.clone(),
-        web_search_provider: cfg.web_search_provider.clone(),
         workspace: cfg.workspace.display().to_string(),
-        session_id,
+        session_id: session_id.clone(),
         recursive: cfg.recursive,
         max_depth: cfg.max_depth,
         max_steps_per_call: cfg.max_steps_per_call,
         demo: cfg.demo,
-    }
-}
-
-fn merge_settings(
-    existing: PersistentSettings,
-    incoming: PersistentSettings,
-) -> PersistentSettings {
-    PersistentSettings {
-        default_model: incoming.default_model.or(existing.default_model),
-        default_reasoning_effort: incoming
-            .default_reasoning_effort
-            .or(existing.default_reasoning_effort),
-        default_model_openai: incoming
-            .default_model_openai
-            .or(existing.default_model_openai),
-        default_model_anthropic: incoming
-            .default_model_anthropic
-            .or(existing.default_model_anthropic),
-        default_model_openrouter: incoming
-            .default_model_openrouter
-            .or(existing.default_model_openrouter),
-        default_model_cerebras: incoming
-            .default_model_cerebras
-            .or(existing.default_model_cerebras),
-        default_model_zai: incoming.default_model_zai.or(existing.default_model_zai),
-        default_model_ollama: incoming
-            .default_model_ollama
-            .or(existing.default_model_ollama),
-        zai_plan: incoming.zai_plan.or(existing.zai_plan),
-        web_search_provider: incoming
-            .web_search_provider
-            .or(existing.web_search_provider),
-    }
-}
-
-/// Get the current configuration.
-#[tauri::command]
-pub async fn get_config(state: State<'_, AppState>) -> Result<ConfigView, String> {
-    let cfg = state.config.lock().await;
-    let session_id = state.session_id.lock().await;
-    Ok(make_config_view(&cfg, session_id.clone()))
+    })
 }
 
 /// Update configuration fields.
@@ -84,41 +45,35 @@ pub async fn update_config(
             Some(effort)
         };
     }
-    if let Some(plan) = partial.zai_plan {
-        cfg.zai_plan = normalize_zai_plan(Some(&plan));
-        cfg.zai_base_url = resolve_zai_base_url(
-            &cfg.zai_plan,
-            &cfg.zai_paygo_base_url,
-            &cfg.zai_coding_base_url,
-        );
-    }
-    if let Some(provider) = partial.web_search_provider {
-        cfg.web_search_provider = normalize_web_search_provider(Some(&provider));
-    }
     let session_id = state.session_id.lock().await;
-    Ok(make_config_view(&cfg, session_id.clone()))
+    Ok(ConfigView {
+        provider: cfg.provider.clone(),
+        model: cfg.model.clone(),
+        reasoning_effort: cfg.reasoning_effort.clone(),
+        workspace: cfg.workspace.display().to_string(),
+        session_id: session_id.clone(),
+        recursive: cfg.recursive,
+        max_depth: cfg.max_depth,
+        max_steps_per_call: cfg.max_steps_per_call,
+        demo: cfg.demo,
+    })
 }
 
 /// Known models per provider for listing.
 fn known_models_for_provider(provider: &str) -> Vec<ModelInfo> {
     let models: Vec<(&str, &str)> = match provider {
         "openai" => vec![
-            ("azure-foundry/gpt-5.3-codex", "GPT-5.3 Codex (Foundry)"),
-            ("azure-foundry/Kimi-K2.5", "Kimi K2.5 (Foundry)"),
+            ("gpt-5.2", "GPT-5.2"),
+            ("gpt-4o", "GPT-4o"),
+            ("gpt-4o-mini", "GPT-4o Mini"),
+            ("o1", "o1"),
+            ("o3", "o3"),
+            ("o4-mini", "o4-mini"),
         ],
         "anthropic" => vec![
-            (
-                "anthropic-foundry/claude-opus-4-6",
-                "Claude Opus 4.6 (Foundry)",
-            ),
-            (
-                "anthropic-foundry/claude-sonnet-4-6",
-                "Claude Sonnet 4.6 (Foundry)",
-            ),
-            (
-                "anthropic-foundry/claude-haiku-4-5",
-                "Claude Haiku 4.5 (Foundry)",
-            ),
+            ("claude-opus-4-6", "Claude Opus 4.6"),
+            ("claude-sonnet-4-5", "Claude Sonnet 4.5"),
+            ("claude-haiku-4-5", "Claude Haiku 4.5"),
         ],
         "openrouter" => vec![
             ("anthropic/claude-sonnet-4-5", "Claude Sonnet 4.5 (OR)"),
@@ -129,11 +84,6 @@ fn known_models_for_provider(provider: &str) -> Vec<ModelInfo> {
             ("qwen-3-235b-a22b-instruct-2507", "Qwen-3 235B"),
             ("llama-4-scout-17b-16e-instruct", "Llama-4 Scout"),
         ],
-        "zai" => vec![
-            ("glm-5", "GLM-5"),
-            ("glm-4.6", "GLM-4.6"),
-            ("zai-glm-4.6", "Z.AI GLM 4.6"),
-        ],
         "ollama" => vec![
             ("llama3.2", "Llama 3.2"),
             ("mistral", "Mistral"),
@@ -163,14 +113,7 @@ pub async fn list_models(
 ) -> Result<Vec<ModelInfo>, String> {
     if provider == "all" {
         let mut all = Vec::new();
-        for p in &[
-            "openai",
-            "anthropic",
-            "openrouter",
-            "cerebras",
-            "zai",
-            "ollama",
-        ] {
+        for p in &["openai", "anthropic", "openrouter", "cerebras", "ollama"] {
             all.extend(known_models_for_provider(p));
         }
         Ok(all)
@@ -187,8 +130,7 @@ pub async fn save_settings(
 ) -> Result<(), String> {
     let cfg = state.config.lock().await;
     let store = SettingsStore::new(&cfg.workspace, &cfg.session_root_dir);
-    let merged = merge_settings(store.load(), settings);
-    store.save(&merged).map_err(|e| e.to_string())
+    store.save(&settings).map_err(|e| e.to_string())
 }
 
 /// Build credential status from config: which providers/services have API keys configured.
@@ -198,13 +140,8 @@ pub fn build_credential_status(cfg: &op_core::config::AgentConfig) -> HashMap<St
     status.insert("anthropic".to_string(), cfg.anthropic_api_key.is_some());
     status.insert("openrouter".to_string(), cfg.openrouter_api_key.is_some());
     status.insert("cerebras".to_string(), cfg.cerebras_api_key.is_some());
-    status.insert("zai".to_string(), cfg.zai_api_key.is_some());
     status.insert("ollama".to_string(), true); // Ollama never needs a key
     status.insert("exa".to_string(), cfg.exa_api_key.is_some());
-    status.insert("firecrawl".to_string(), cfg.firecrawl_api_key.is_some());
-    status.insert("brave".to_string(), cfg.brave_api_key.is_some());
-    status.insert("tavily".to_string(), cfg.tavily_api_key.is_some());
-    status.insert("voyage".to_string(), cfg.voyage_api_key.is_some());
     status
 }
 
@@ -233,31 +170,11 @@ pub async fn get_credentials_status(
         "cerebras".to_string(),
         cfg.cerebras_api_key.is_some() || env_creds.cerebras_api_key.is_some(),
     );
-    status.insert(
-        "zai".to_string(),
-        cfg.zai_api_key.is_some() || env_creds.zai_api_key.is_some(),
-    );
     status.insert("ollama".to_string(), true); // Ollama never needs a key
     status.insert(
         "exa".to_string(),
         cfg.exa_api_key.is_some() || env_creds.exa_api_key.is_some(),
     );
-    status.insert(
-        "firecrawl".to_string(),
-        cfg.firecrawl_api_key.is_some() || env_creds.firecrawl_api_key.is_some(),
-    );
-    status.insert(
-        "brave".to_string(),
-        cfg.brave_api_key.is_some() || env_creds.brave_api_key.is_some(),
-    );
-    status.insert(
-        "tavily".to_string(),
-        cfg.tavily_api_key.is_some() || env_creds.tavily_api_key.is_some(),
-    );
-    status.insert(
-        "voyage".to_string(),
-        cfg.voyage_api_key.is_some() || env_creds.voyage_api_key.is_some(),
-    );
     Ok(status)
 }
 
@@ -298,48 +215,29 @@ mod tests {
         assert!(!models.is_empty(), "ollama should have known models");
     }
 
-    #[test]
-    fn test_zai_models_nonempty() {
-        let models = known_models_for_provider("zai");
-        assert!(!models.is_empty(), "zai should have known models");
-    }
-
     #[test]
     fn test_unknown_provider_empty() {
         let models = known_models_for_provider("foo");
-        assert!(
-            models.is_empty(),
-            "unknown provider should return empty vec"
-        );
+        assert!(models.is_empty(), "unknown provider should return empty vec");
     }
 
     #[test]
     fn test_all_providers_model_ids_unique() {
         let mut all_ids = HashSet::new();
-        for p in &[
-            "openai",
-            "anthropic",
-            "openrouter",
-            "cerebras",
-            "zai",
-            "ollama",
-        ] {
+        for p in &["openai", "anthropic", "openrouter", "cerebras", "ollama"] {
             for m in known_models_for_provider(p) {
-                assert!(all_ids.insert(m.id.clone()), "duplicate model ID: {}", m.id);
+                assert!(
+                    all_ids.insert(m.id.clone()),
+                    "duplicate model ID: {}",
+                    m.id
+                );
             }
         }
     }
 
     #[test]
     fn test_model_info_fields() {
-        for provider in &[
-            "openai",
-            "anthropic",
-            "openrouter",
-            "cerebras",
-            "zai",
-            "ollama",
-        ] {
+        for provider in &["openai", "anthropic", "openrouter", "cerebras", "ollama"] {
             for m in known_models_for_provider(provider) {
                 assert!(!m.id.is_empty(), "model id should not be empty");
                 assert!(m.name.is_some(), "model name should be Some for {}", m.id);
@@ -359,22 +257,12 @@ mod tests {
         cfg.anthropic_api_key = None;
         cfg.openrouter_api_key = None;
         cfg.cerebras_api_key = None;
-        cfg.zai_api_key = None;
-        cfg.exa_api_key = None;
-        cfg.firecrawl_api_key = None;
-        cfg.brave_api_key = None;
-        cfg.tavily_api_key = None;
-        cfg.voyage_api_key = None;
         let status = build_credential_status(&cfg);
         assert_eq!(status["openai"], false);
         assert_eq!(status["anthropic"], false);
         assert_eq!(status["openrouter"], false);
         assert_eq!(status["cerebras"], false);
-        assert_eq!(status["zai"], false);
         assert_eq!(status["ollama"], true, "ollama always true");
-        assert_eq!(status["brave"], false);
-        assert_eq!(status["tavily"], false);
-        assert_eq!(status["voyage"], false);
     }
 
     #[test]
@@ -384,7 +272,6 @@ mod tests {
         cfg.anthropic_api_key = None;
         cfg.openrouter_api_key = None;
         cfg.cerebras_api_key = None;
-        cfg.zai_api_key = None;
         let status = build_credential_status(&cfg);
         assert_eq!(status["openai"], true);
         assert_eq!(status["anthropic"], false);
@@ -409,7 +296,6 @@ mod tests {
         cfg.anthropic_api_key = None;
         cfg.openrouter_api_key = None;
         cfg.cerebras_api_key = None;
-        cfg.zai_api_key = None;
         let status = build_credential_status(&cfg);
         assert_eq!(status["ollama"], true);
     }
@@ -421,12 +307,7 @@ mod tests {
         cfg.anthropic_api_key = Some("k2".to_string());
         cfg.openrouter_api_key = Some("k3".to_string());
         cfg.cerebras_api_key = Some("k4".to_string());
-        cfg.zai_api_key = Some("k5".to_string());
-        cfg.exa_api_key = Some("k6".to_string());
-        cfg.firecrawl_api_key = Some("k7".to_string());
-        cfg.brave_api_key = Some("k8".to_string());
-        cfg.tavily_api_key = Some("k9".to_string());
-        cfg.voyage_api_key = Some("k10".to_string());
+        cfg.exa_api_key = Some("k5".to_string());
         let status = build_credential_status(&cfg);
         for (provider, has_key) in &status {
             assert!(has_key, "{} should be true when key is set", provider);
@@ -434,13 +315,9 @@ mod tests {
     }
 
     #[test]
-    fn test_cred_status_has_eleven_entries() {
+    fn test_cred_status_has_six_entries() {
         let cfg = op_core::config::AgentConfig::from_env("/nonexistent");
         let status = build_credential_status(&cfg);
-        assert_eq!(
-            status.len(),
-            11,
-            "should have 11 entries (6 providers + 5 services)"
-        );
+        assert_eq!(status.len(), 6, "should have 6 entries (5 providers + exa)");
     }
 }
diff --git a/openplanter-desktop/crates/op-tauri/src/state.rs b/openplanter-desktop/crates/op-tauri/src/state.rs
index 3d72dfe8..f4b831bb 100644
--- a/openplanter-desktop/crates/op-tauri/src/state.rs
+++ b/openplanter-desktop/crates/op-tauri/src/state.rs
@@ -1,41 +1,8 @@
-use op_core::config::{
-    AgentConfig, FOUNDRY_OPENAI_API_KEY_PLACEHOLDER, normalize_web_search_provider,
-    normalize_zai_plan, resolve_openai_api_key, resolve_zai_base_url,
-};
-use op_core::credentials::{
-    CredentialBundle, credentials_from_env, discover_env_candidates, parse_env_file,
-};
-use op_core::settings::{PersistentSettings, SettingsStore};
-use std::env;
-use std::fs;
-use std::path::{Path, PathBuf};
 use std::sync::Arc;
 use tokio::sync::Mutex;
 use tokio_util::sync::CancellationToken;
-
-const WORKSPACE_ENV_KEY: &str = "OPENPLANTER_WORKSPACE";
-
-#[derive(Debug, Clone, PartialEq, Eq)]
-enum WorkspaceSource {
-    EnvOverride,
-    GitRoot,
-    CurrentDir,
-}
-
-#[derive(Debug, Clone, PartialEq, Eq)]
-struct ResolvedWorkspace {
-    path: PathBuf,
-    source: WorkspaceSource,
-    invalid_override: Option<String>,
-}
-
-#[derive(Debug, Clone, Default, PartialEq, Eq)]
-struct LegacyMigrationReport {
-    source: Option<PathBuf>,
-    copied_files: u64,
-    skipped_existing: u64,
-    errors: Vec<String>,
-}
+use op_core::config::AgentConfig;
+use op_core::credentials::{credentials_from_env, discover_env_candidates, parse_env_file, CredentialBundle};
 
 /// Merge credentials into an AgentConfig.
 /// Priority: existing config value > env_creds > file_creds.
@@ -44,343 +11,32 @@ pub fn merge_credentials_into_config(
     env_creds: &CredentialBundle,
     file_creds: &CredentialBundle,
 ) {
-    if cfg.openai_oauth_token.is_none() {
-        cfg.openai_oauth_token = env_creds
-            .openai_oauth_token
-            .clone()
-            .or_else(|| file_creds.openai_oauth_token.clone());
-    }
-    cfg.openai_api_key = cfg
-        .openai_api_key
-        .clone()
-        .filter(|value| {
-            let trimmed = value.trim();
-            !trimmed.is_empty() && trimmed != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
-        })
-        .or_else(|| env_creds.openai_api_key.clone())
-        .or_else(|| file_creds.openai_api_key.clone())
-        .or_else(|| cfg.openai_api_key.clone());
-    cfg.openai_api_key = resolve_openai_api_key(
-        cfg.openai_api_key.clone(),
-        &cfg.openai_base_url,
-        cfg.openai_oauth_token.clone(),
-    );
-    cfg.api_key = resolve_openai_api_key(
-        cfg.openai_api_key
-            .clone()
-            .filter(|value| {
-                let trimmed = value.trim();
-                !trimmed.is_empty() && trimmed != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
-            })
-            .or_else(|| {
-                cfg.api_key.clone().filter(|value| {
-                    let trimmed = value.trim();
-                    !trimmed.is_empty() && trimmed != FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
-                })
-            })
-            .or_else(|| cfg.openai_api_key.clone())
-            .or_else(|| cfg.api_key.clone()),
-        &cfg.base_url,
-        cfg.openai_oauth_token.clone(),
-    );
-
     macro_rules! merge {
         ($field:ident) => {
             if cfg.$field.is_none() {
-                cfg.$field = env_creds
-                    .$field
-                    .clone()
+                cfg.$field = env_creds.$field.clone()
                     .or_else(|| file_creds.$field.clone());
             }
         };
     }
+    merge!(openai_api_key);
     merge!(anthropic_api_key);
     merge!(openrouter_api_key);
     merge!(cerebras_api_key);
-    merge!(zai_api_key);
     merge!(exa_api_key);
-    merge!(firecrawl_api_key);
-    merge!(brave_api_key);
-    merge!(tavily_api_key);
     merge!(voyage_api_key);
 }
 
-fn has_env_value(keys: &[&str]) -> bool {
-    keys.iter().any(|key| {
-        env::var(key)
-            .ok()
-            .map(|value| !value.trim().is_empty())
-            .unwrap_or(false)
-    })
-}
-
-fn apply_settings_to_config(cfg: &mut AgentConfig, settings: &PersistentSettings) {
-    if !has_env_value(&["OPENPLANTER_REASONING_EFFORT"]) {
-        if let Some(reasoning_effort) = settings.default_reasoning_effort.clone() {
-            cfg.reasoning_effort = Some(reasoning_effort);
-        }
-    }
-
-    if !has_env_value(&["OPENPLANTER_ZAI_PLAN"]) {
-        if let Some(plan) = settings.zai_plan.as_deref() {
-            cfg.zai_plan = normalize_zai_plan(Some(plan));
-        }
-    }
-
-    if !has_env_value(&["OPENPLANTER_ZAI_BASE_URL"]) {
-        cfg.zai_base_url = resolve_zai_base_url(
-            &cfg.zai_plan,
-            &cfg.zai_paygo_base_url,
-            &cfg.zai_coding_base_url,
-        );
-    }
-
-    if !has_env_value(&["OPENPLANTER_WEB_SEARCH_PROVIDER"]) {
-        if let Some(provider) = settings.web_search_provider.as_deref() {
-            cfg.web_search_provider = normalize_web_search_provider(Some(provider));
-        }
-    }
-
-    if !has_env_value(&["OPENPLANTER_MODEL"]) {
-        let saved_model = if cfg.provider == "auto" {
-            settings.default_model.as_deref()
-        } else {
-            settings
-                .default_model_for_provider(cfg.provider.as_str())
-                .or(settings.default_model.as_deref())
-        };
-        if let Some(model) = saved_model {
-            cfg.model = model.to_string();
-        }
-    }
-}
-
-fn canonicalize_or_self(path: &Path) -> PathBuf {
-    path.canonicalize().unwrap_or_else(|_| path.to_path_buf())
-}
-
-fn find_git_root(start: &Path) -> Option<PathBuf> {
-    let mut current = Some(canonicalize_or_self(start));
-    while let Some(dir) = current {
-        if dir.join(".git").exists() {
-            return Some(dir);
-        }
-        current = dir.parent().map(|parent| parent.to_path_buf());
-    }
-    None
-}
-
-fn resolve_startup_workspace_from(
-    current_dir: &Path,
-    env_override: Option<&str>,
-) -> ResolvedWorkspace {
-    let mut invalid_override = None;
-
-    if let Some(raw_override) = env_override
-        .map(str::trim)
-        .filter(|value| !value.is_empty())
-    {
-        let candidate = PathBuf::from(raw_override);
-        if candidate.exists() {
-            return ResolvedWorkspace {
-                path: canonicalize_or_self(&candidate),
-                source: WorkspaceSource::EnvOverride,
-                invalid_override: None,
-            };
-        }
-        invalid_override = Some(raw_override.to_string());
-    }
-
-    if let Some(git_root) = find_git_root(current_dir) {
-        return ResolvedWorkspace {
-            path: git_root,
-            source: WorkspaceSource::GitRoot,
-            invalid_override,
-        };
-    }
-
-    ResolvedWorkspace {
-        path: canonicalize_or_self(current_dir),
-        source: WorkspaceSource::CurrentDir,
-        invalid_override,
-    }
-}
-
-fn resolve_desktop_workspace() -> ResolvedWorkspace {
-    let current_dir = env::current_dir().unwrap_or_else(|_| PathBuf::from("."));
-    let env_override = env::var(WORKSPACE_ENV_KEY).ok();
-    resolve_startup_workspace_from(&current_dir, env_override.as_deref())
-}
-
-fn legacy_state_candidates(workspace: &Path, session_root_dir: &str) -> Vec<PathBuf> {
-    vec![
-        workspace
-            .join("openplanter-desktop")
-            .join("crates")
-            .join("op-tauri")
-            .join(session_root_dir),
-        workspace
-            .join("crates")
-            .join("op-tauri")
-            .join(session_root_dir),
-    ]
-}
-
-fn copy_missing_file(src: &Path, dst: &Path, report: &mut LegacyMigrationReport) {
-    if !src.exists() || !src.is_file() {
-        return;
-    }
-
-    if dst.exists() {
-        report.skipped_existing += 1;
-        return;
-    }
-
-    if let Some(parent) = dst.parent() {
-        if let Err(err) = fs::create_dir_all(parent) {
-            report
-                .errors
-                .push(format!("failed to create {}: {err}", parent.display()));
-            return;
-        }
-    }
-
-    match fs::copy(src, dst) {
-        Ok(_) => report.copied_files += 1,
-        Err(err) => report.errors.push(format!(
-            "failed to copy {} -> {}: {err}",
-            src.display(),
-            dst.display()
-        )),
-    }
-}
-
-fn copy_missing_tree(src: &Path, dst: &Path, report: &mut LegacyMigrationReport) {
-    if !src.exists() {
-        return;
-    }
-    if src.is_file() {
-        copy_missing_file(src, dst, report);
-        return;
-    }
-    if !src.is_dir() {
-        return;
-    }
-
-    if let Err(err) = fs::create_dir_all(dst) {
-        report
-            .errors
-            .push(format!("failed to create {}: {err}", dst.display()));
-        return;
-    }
-
-    let entries = match fs::read_dir(src) {
-        Ok(entries) => entries,
-        Err(err) => {
-            report
-                .errors
-                .push(format!("failed to read {}: {err}", src.display()));
-            return;
-        }
-    };
-
-    for entry in entries {
-        let entry = match entry {
-            Ok(entry) => entry,
-            Err(err) => {
-                report.errors.push(format!(
-                    "failed to read entry under {}: {err}",
-                    src.display()
-                ));
-                continue;
-            }
-        };
-        let src_path = entry.path();
-        let dst_path = dst.join(entry.file_name());
-        if src_path.is_dir() {
-            copy_missing_tree(&src_path, &dst_path, report);
-        } else {
-            copy_missing_file(&src_path, &dst_path, report);
-        }
-    }
-}
-
-fn migrate_legacy_desktop_state(workspace: &Path, session_root_dir: &str) -> LegacyMigrationReport {
-    let mut report = LegacyMigrationReport::default();
-    let destination_root = workspace.join(session_root_dir);
-
-    for candidate in legacy_state_candidates(workspace, session_root_dir) {
-        if !candidate.exists() {
-            continue;
-        }
-
-        report.source = Some(candidate.clone());
-        copy_missing_file(
-            &candidate.join("settings.json"),
-            &destination_root.join("settings.json"),
-            &mut report,
-        );
-        copy_missing_file(
-            &candidate.join("credentials.json"),
-            &destination_root.join("credentials.json"),
-            &mut report,
-        );
-        copy_missing_tree(
-            &candidate.join("sessions"),
-            &destination_root.join("sessions"),
-            &mut report,
-        );
-        break;
-    }
-
-    report
-}
-
-fn format_startup_trace(
-    current_dir: &Path,
-    resolved: &ResolvedWorkspace,
-    migration: &LegacyMigrationReport,
-) -> String {
-    let source = match resolved.source {
-        WorkspaceSource::EnvOverride => "env_override",
-        WorkspaceSource::GitRoot => "git_root",
-        WorkspaceSource::CurrentDir => "current_dir",
-    };
-    let invalid_override = resolved.invalid_override.as_deref().unwrap_or("<none>");
-    let migration_source = migration
-        .source
-        .as_ref()
-        .map(|path| path.display().to_string())
-        .unwrap_or_else(|| "<none>".to_string());
-
-    format!(
-        "pid={} cwd={} workspace={} source={} invalid_override={} migration_source={} migration_copied={} migration_skipped={} migration_errors={}",
-        std::process::id(),
-        current_dir.display(),
-        resolved.path.display(),
-        source,
-        invalid_override,
-        migration_source,
-        migration.copied_files,
-        migration.skipped_existing,
-        migration.errors.len()
-    )
-}
-
 /// Application state shared across Tauri commands.
 pub struct AppState {
     pub config: Arc<Mutex<AgentConfig>>,
     pub session_id: Arc<Mutex<Option<String>>>,
     pub cancel_token: Arc<Mutex<CancellationToken>>,
-    startup_trace: String,
 }
 
 impl AppState {
     pub fn new() -> Self {
-        let current_dir = env::current_dir().unwrap_or_else(|_| PathBuf::from("."));
-        let resolved_workspace = resolve_desktop_workspace();
-        let mut cfg = AgentConfig::from_env(&resolved_workspace.path);
-        let migration = migrate_legacy_desktop_state(&cfg.workspace, &cfg.session_root_dir);
+        let mut cfg = AgentConfig::from_env(".");
 
         // Load .env files and merge credentials into config
         let env_creds = credentials_from_env();
@@ -396,27 +52,17 @@ impl AppState {
             merge_credentials_into_config(&mut cfg, &env_creds, &empty);
         }
 
-        let settings = SettingsStore::new(&cfg.workspace, &cfg.session_root_dir).load();
-        apply_settings_to_config(&mut cfg, &settings);
-
         Self {
             config: Arc::new(Mutex::new(cfg)),
             session_id: Arc::new(Mutex::new(None)),
             cancel_token: Arc::new(Mutex::new(CancellationToken::new())),
-            startup_trace: format_startup_trace(&current_dir, &resolved_workspace, &migration),
         }
     }
-
-    pub fn startup_trace(&self) -> &str {
-        &self.startup_trace
-    }
 }
 
 #[cfg(test)]
 mod tests {
     use super::*;
-    use std::env;
-    use tempfile::tempdir;
 
     fn empty_cfg() -> AgentConfig {
         let mut cfg = AgentConfig::from_env("/nonexistent");
@@ -424,11 +70,7 @@ mod tests {
         cfg.anthropic_api_key = None;
         cfg.openrouter_api_key = None;
         cfg.cerebras_api_key = None;
-        cfg.zai_api_key = None;
         cfg.exa_api_key = None;
-        cfg.firecrawl_api_key = None;
-        cfg.brave_api_key = None;
-        cfg.tavily_api_key = None;
         cfg.voyage_api_key = None;
         cfg
     }
@@ -484,202 +126,4 @@ mod tests {
         merge_credentials_into_config(&mut cfg, &env_creds, &file_creds);
         assert_eq!(cfg.cerebras_api_key, Some("file-cer".to_string()));
     }
-
-    #[test]
-    fn test_merge_includes_zai_firecrawl_brave_tavily_and_voyage() {
-        let mut cfg = empty_cfg();
-        let env_creds = CredentialBundle {
-            zai_api_key: Some("zai-env".to_string()),
-            firecrawl_api_key: Some("fc-env".to_string()),
-            brave_api_key: Some("brave-env".to_string()),
-            tavily_api_key: Some("tavily-env".to_string()),
-            voyage_api_key: Some("voyage-env".to_string()),
-            ..Default::default()
-        };
-        merge_credentials_into_config(&mut cfg, &env_creds, &CredentialBundle::default());
-        assert_eq!(cfg.zai_api_key, Some("zai-env".to_string()));
-        assert_eq!(cfg.firecrawl_api_key, Some("fc-env".to_string()));
-        assert_eq!(cfg.brave_api_key, Some("brave-env".to_string()));
-        assert_eq!(cfg.tavily_api_key, Some("tavily-env".to_string()));
-        assert_eq!(cfg.voyage_api_key, Some("voyage-env".to_string()));
-    }
-
-    #[test]
-    fn test_apply_settings_to_config_sets_model_and_web_search() {
-        let keys = [
-            "OPENPLANTER_MODEL",
-            "OPENPLANTER_REASONING_EFFORT",
-            "OPENPLANTER_ZAI_PLAN",
-            "OPENPLANTER_ZAI_BASE_URL",
-            "OPENPLANTER_WEB_SEARCH_PROVIDER",
-        ];
-        let saved: Vec<_> = keys.iter().map(|key| (*key, env::var(key).ok())).collect();
-        unsafe {
-            for key in &keys {
-                env::remove_var(key);
-            }
-        }
-
-        let mut cfg = empty_cfg();
-        cfg.provider = "zai".to_string();
-        let settings = PersistentSettings {
-            default_model_zai: Some("glm-5".to_string()),
-            default_reasoning_effort: Some("medium".to_string()),
-            zai_plan: Some("coding".to_string()),
-            web_search_provider: Some("brave".to_string()),
-            ..Default::default()
-        };
-        apply_settings_to_config(&mut cfg, &settings);
-        assert_eq!(cfg.model, "glm-5");
-        assert_eq!(cfg.reasoning_effort, Some("medium".to_string()));
-        assert_eq!(cfg.zai_plan, "coding");
-        assert_eq!(cfg.zai_base_url, op_core::config::ZAI_CODING_BASE_URL);
-        assert_eq!(cfg.web_search_provider, "brave");
-
-        for (key, value) in saved {
-            unsafe {
-                match value {
-                    Some(value) => env::set_var(key, value),
-                    None => env::remove_var(key),
-                }
-            }
-        }
-    }
-
-    #[test]
-    fn test_resolve_startup_workspace_prefers_env_override() {
-        let temp = tempdir().unwrap();
-        let repo = temp.path().join("repo");
-        fs::create_dir_all(repo.join(".git")).unwrap();
-        let override_dir = temp.path().join("override");
-        fs::create_dir_all(&override_dir).unwrap();
-
-        let resolved = resolve_startup_workspace_from(&repo, Some(override_dir.to_str().unwrap()));
-
-        assert_eq!(resolved.source, WorkspaceSource::EnvOverride);
-        assert_eq!(resolved.path, canonicalize_or_self(&override_dir));
-        assert!(resolved.invalid_override.is_none());
-    }
-
-    #[test]
-    fn test_resolve_startup_workspace_finds_git_root_from_nested_dir() {
-        let temp = tempdir().unwrap();
-        let repo = temp.path().join("repo");
-        fs::create_dir_all(repo.join(".git")).unwrap();
-        let nested = repo
-            .join("openplanter-desktop")
-            .join("crates")
-            .join("op-tauri");
-        fs::create_dir_all(&nested).unwrap();
-
-        let resolved = resolve_startup_workspace_from(&nested, None);
-
-        assert_eq!(resolved.source, WorkspaceSource::GitRoot);
-        assert_eq!(resolved.path, canonicalize_or_self(&repo));
-    }
-
-    #[test]
-    fn test_resolve_startup_workspace_falls_back_to_current_dir() {
-        let temp = tempdir().unwrap();
-
-        let resolved =
-            resolve_startup_workspace_from(temp.path(), Some("/definitely/missing/path"));
-
-        assert_eq!(resolved.source, WorkspaceSource::CurrentDir);
-        assert_eq!(resolved.path, canonicalize_or_self(temp.path()));
-        assert_eq!(
-            resolved.invalid_override,
-            Some("/definitely/missing/path".to_string())
-        );
-    }
-
-    #[test]
-    fn test_migrate_legacy_desktop_state_copies_missing_and_preserves_existing() {
-        let temp = tempdir().unwrap();
-        let workspace = temp.path().join("repo");
-        let legacy = workspace
-            .join("openplanter-desktop")
-            .join("crates")
-            .join("op-tauri")
-            .join(".openplanter");
-        let destination = workspace.join(".openplanter");
-
-        fs::create_dir_all(legacy.join("sessions").join("session-a")).unwrap();
-        fs::write(legacy.join("settings.json"), "{\"legacy\":true}").unwrap();
-        fs::write(legacy.join("credentials.json"), "{\"key\":\"legacy\"}").unwrap();
-        fs::write(
-            legacy
-                .join("sessions")
-                .join("session-a")
-                .join("replay.jsonl"),
-            "legacy-session",
-        )
-        .unwrap();
-
-        fs::create_dir_all(&destination).unwrap();
-        fs::write(destination.join("settings.json"), "{\"keep\":true}").unwrap();
-
-        let report = migrate_legacy_desktop_state(&workspace, ".openplanter");
-
-        assert_eq!(report.source, Some(legacy));
-        assert_eq!(
-            fs::read_to_string(destination.join("settings.json")).unwrap(),
-            "{\"keep\":true}"
-        );
-        assert_eq!(
-            fs::read_to_string(destination.join("credentials.json")).unwrap(),
-            "{\"key\":\"legacy\"}"
-        );
-        assert_eq!(
-            fs::read_to_string(
-                destination
-                    .join("sessions")
-                    .join("session-a")
-                    .join("replay.jsonl")
-            )
-            .unwrap(),
-            "legacy-session"
-        );
-        assert_eq!(report.copied_files, 2);
-        assert_eq!(report.skipped_existing, 1);
-        assert!(report.errors.is_empty());
-    }
-
-    #[test]
-    fn test_startup_trace_uses_informational_migration_labels() {
-        let temp = tempdir().unwrap();
-        let workspace = temp.path().join("repo");
-        let current_dir = workspace
-            .join("openplanter-desktop")
-            .join("crates")
-            .join("op-tauri");
-        fs::create_dir_all(workspace.join(".git")).unwrap();
-        fs::create_dir_all(&current_dir).unwrap();
-
-        let resolved = resolve_startup_workspace_from(&current_dir, None);
-        let migration = LegacyMigrationReport {
-            source: Some(workspace.join("legacy-state")),
-            copied_files: 2,
-            skipped_existing: 3,
-            errors: vec!["copy failed".to_string()],
-        };
-
-        let trace = format_startup_trace(&current_dir, &resolved, &migration);
-
-        assert!(trace.contains("pid="));
-        assert!(trace.contains(&format!("cwd={}", current_dir.display())));
-        assert!(trace.contains(&format!("workspace={}", resolved.path.display())));
-        assert!(trace.contains("source=git_root"));
-        assert!(trace.contains("invalid_override=<none>"));
-        assert!(trace.contains(&format!(
-            "migration_source={}",
-            workspace.join("legacy-state").display()
-        )));
-        assert!(trace.contains("migration_copied=2"));
-        assert!(trace.contains("migration_skipped=3"));
-        assert!(trace.contains("migration_errors=1"));
-        assert!(!trace.contains(" copied="));
-        assert!(!trace.contains(" skipped="));
-        assert!(!trace.contains(" errors="));
-    }
 }
diff --git a/openplanter-desktop/frontend/src/commands/model.ts b/openplanter-desktop/frontend/src/commands/model.ts
index 45f7016d..0fa9e9c2 100644
--- a/openplanter-desktop/frontend/src/commands/model.ts
+++ b/openplanter-desktop/frontend/src/commands/model.ts
@@ -1,30 +1,22 @@
 /** /model slash command handler. */
-import { listModels, saveSettings, updateConfig } from "../api/invoke";
-import type { PersistentSettings } from "../api/types";
+import { updateConfig, listModels } from "../api/invoke";
 import { appState } from "../state/store";
 
 /** Aliases mapping short names to full model identifiers. */
 export const MODEL_ALIASES: Record<string, string> = {
-  opus: "anthropic-foundry/claude-opus-4-6",
-  sonnet: "anthropic-foundry/claude-sonnet-4-6",
-  haiku: "anthropic-foundry/claude-haiku-4-5",
-  "sonnet-4": "anthropic-foundry/claude-sonnet-4-6",
-  "haiku-4": "anthropic-foundry/claude-haiku-4-5",
-  "opus-4": "anthropic-foundry/claude-opus-4-6",
-  gpt5: "azure-foundry/gpt-5.3-codex",
-  "gpt-5": "azure-foundry/gpt-5.3-codex",
-  "gpt-5.3": "azure-foundry/gpt-5.3-codex",
-  kimi: "azure-foundry/Kimi-K2.5",
+  opus: "claude-opus-4-6",
+  sonnet: "claude-sonnet-4-5",
+  haiku: "claude-haiku-4-5",
+  "sonnet-4": "claude-sonnet-4-5",
+  "haiku-4": "claude-haiku-4-5",
+  "opus-4": "claude-opus-4-6",
+  gpt5: "gpt-5.2",
+  "gpt-5": "gpt-5.2",
   gpt4o: "gpt-4o",
   "gpt-4o": "gpt-4o",
-  o1: "o1",
-  o3: "o3",
+  "o1": "o1",
+  "o3": "o3",
   "o4-mini": "o4-mini",
-  glm: "glm-5",
-  glm5: "glm-5",
-  "glm-5": "glm-5",
-  zai: "glm-5",
-  "zai-glm": "zai-glm-4.6",
   llama: "llama3.2",
   mistral: "mistral",
   gemma: "gemma",
@@ -36,40 +28,14 @@ export const MODEL_ALIASES: Record<string, string> = {
 
 /** Infer provider from a model name, matching builder.rs patterns. */
 export function inferProvider(model: string): string | null {
-  if (/^anthropic-foundry\//i.test(model)) return "anthropic";
-  if (/^azure-foundry\//i.test(model)) return "openai";
   if (model.includes("/")) return "openrouter";
   if (/^claude/i.test(model)) return "anthropic";
-  if (/^(llama.*cerebras|qwen-3|gpt-oss)/i.test(model)) return "cerebras";
-  if (/^(glm|zai-glm)/i.test(model)) return "zai";
+  if (/^(llama.*cerebras|qwen-3|gpt-oss|zai-glm)/i.test(model)) return "cerebras";
   if (/^(gpt|o[1-4]-|o[1-4]$|chatgpt|dall-e|tts-|whisper)/i.test(model)) return "openai";
-  if (/^(llama|mistral|gemma|phi|codellama|deepseek|vicuna|tinyllama|neural-chat|dolphin|wizardlm|orca|nous-hermes|command-r|qwen(?!-3))/i.test(model)) return "ollama";
+  if (/^(llama|mistral|gemma|phi|codellama|deepseek|vicuna|tinyllama|neural-chat|dolphin|wizardlm|orca|nous-hermes|command-r|qwen)/i.test(model)) return "ollama";
   return null;
 }
 
-function buildProviderDefaultModelSettings(
-  provider: string,
-  model: string,
-): PersistentSettings {
-  const base: PersistentSettings = { default_model: model };
-  switch (provider) {
-    case "openai":
-      return { ...base, default_model_openai: model };
-    case "anthropic":
-      return { ...base, default_model_anthropic: model };
-    case "openrouter":
-      return { ...base, default_model_openrouter: model };
-    case "cerebras":
-      return { ...base, default_model_cerebras: model };
-    case "zai":
-      return { ...base, default_model_zai: model };
-    case "ollama":
-      return { ...base, default_model_ollama: model };
-    default:
-      return base;
-  }
-}
-
 export interface CommandResult {
   action: "handled" | "clear" | "quit";
   lines: string[];
@@ -77,9 +43,10 @@ export interface CommandResult {
 
 /** Handle /model [args]. */
 export async function handleModelCommand(args: string): Promise<CommandResult> {
-  const parts = args.trim().split(/\s+/).filter(Boolean);
+  const parts = args.trim().split(/\s+/);
   const subcommand = parts[0] || "";
 
+  // /model (no args) — show current info
   if (!subcommand) {
     const s = appState.get();
     const aliasEntries = Object.entries(MODEL_ALIASES)
@@ -90,7 +57,6 @@ export async function handleModelCommand(args: string): Promise<CommandResult> {
       lines: [
         `Provider: ${s.provider}`,
         `Model:    ${s.model}`,
-        `Z.AI plan: ${s.zaiPlan || "paygo"}`,
         "",
         "Aliases:",
         aliasEntries,
@@ -98,6 +64,7 @@ export async function handleModelCommand(args: string): Promise<CommandResult> {
     };
   }
 
+  // /model list [all|<provider>]
   if (subcommand === "list") {
     const filter = parts[1] || "all";
     try {
@@ -109,7 +76,7 @@ export async function handleModelCommand(args: string): Promise<CommandResult> {
         };
       }
       const lines = models.map(
-        (m) => `  ${m.id}${m.name ? ` (${m.name})` : ""} [${m.provider}]`,
+        (m) => `  ${m.id}${m.name ? ` (${m.name})` : ""} [${m.provider}]`
       );
       return {
         action: "handled",
@@ -123,38 +90,36 @@ export async function handleModelCommand(args: string): Promise<CommandResult> {
     }
   }
 
+  // /model <name> [--save]
   const modelName = subcommand;
   const save = parts.includes("--save");
+
+  // Resolve alias
   const resolved = MODEL_ALIASES[modelName.toLowerCase()] ?? modelName;
   const provider = inferProvider(resolved);
 
   if (!provider) {
     return {
       action: "handled",
-      lines: [
-        `Cannot infer provider for "${resolved}". Specify full model name or use a known alias.`,
-      ],
+      lines: [`Cannot infer provider for "${resolved}". Specify full model name or use a known alias.`],
     };
   }
 
   try {
     const config = await updateConfig({
       model: resolved,
-      provider,
+      provider: provider,
     });
 
     appState.update((s) => ({
       ...s,
       provider: config.provider,
       model: config.model,
-      zaiPlan: config.zai_plan,
     }));
 
     const lines = [`Switched to ${config.provider}/${config.model}`];
     if (save) {
-      await saveSettings(
-        buildProviderDefaultModelSettings(config.provider, config.model),
-      );
+      // save_settings would be called here when backend supports it
       lines.push("(Settings saved)");
     }
 
diff --git a/tests/test_credentials.py b/tests/test_credentials.py
index df98f1b5..79886207 100644
--- a/tests/test_credentials.py
+++ b/tests/test_credentials.py
@@ -22,11 +22,7 @@ def test_parse_env_file_extracts_supported_keys(self) -> None:
                         "OPENAI_API_KEY=oa-key",
                         "ANTHROPIC_API_KEY=an-key",
                         "OPENROUTER_API_KEY=or-key",
-                        "ZAI_API_KEY=zai-key",
                         "EXA_API_KEY=exa-key",
-                        "FIRECRAWL_API_KEY=fc-key",
-                        "BRAVE_API_KEY=brave-key",
-                        "OPENPLANTER_TAVILY_API_KEY=tavily-key",
                     ]
                 ),
                 encoding="utf-8",
@@ -35,11 +31,7 @@ def test_parse_env_file_extracts_supported_keys(self) -> None:
             self.assertEqual(creds.openai_api_key, "oa-key")
             self.assertEqual(creds.anthropic_api_key, "an-key")
             self.assertEqual(creds.openrouter_api_key, "or-key")
-            self.assertEqual(creds.zai_api_key, "zai-key")
             self.assertEqual(creds.exa_api_key, "exa-key")
-            self.assertEqual(creds.firecrawl_api_key, "fc-key")
-            self.assertEqual(creds.brave_api_key, "brave-key")
-            self.assertEqual(creds.tavily_api_key, "tavily-key")
 
     def test_store_roundtrip(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
@@ -49,11 +41,7 @@ def test_store_roundtrip(self) -> None:
                 openai_api_key="oa",
                 anthropic_api_key="an",
                 openrouter_api_key="or",
-                zai_api_key="zai",
                 exa_api_key="exa",
-                firecrawl_api_key="fc",
-                brave_api_key="brave",
-                tavily_api_key="tavily",
             )
             store.save(creds)
             loaded = store.load()
diff --git a/tests/test_model.py b/tests/test_model.py
index 0631eb19..19b1540e 100644
--- a/tests/test_model.py
+++ b/tests/test_model.py
@@ -4,7 +4,7 @@
 from unittest.mock import patch
 
 from conftest import mock_anthropic_stream, mock_openai_stream
-from agent.model import AnthropicModel, HTTPModelError, ModelError, OpenAICompatibleModel, RateLimitError
+from agent.model import AnthropicModel, ModelError, OpenAICompatibleModel
 
 
 class ModelPayloadTests(unittest.TestCase):
@@ -36,62 +36,6 @@ def fake_http_json(url, method, headers, payload=None, timeout_sec=90):  # type:
             self.assertEqual(turn.text, "ok")
             self.assertEqual(captured["payload"]["reasoning_effort"], "high")
 
-    def test_openai_payload_strips_foundry_prefix(self) -> None:
-        captured: dict = {}
-
-        def fake_http_json(url, method, headers, payload=None, timeout_sec=90):  # type: ignore[no-untyped-def]
-            captured["payload"] = payload
-            return {
-                "choices": [
-                    {
-                        "message": {
-                            "content": "ok",
-                            "tool_calls": None,
-                        },
-                        "finish_reason": "stop",
-                    }
-                ]
-            }
-
-        with patch("agent.model._http_stream_sse", mock_openai_stream(fake_http_json)):
-            model = OpenAICompatibleModel(
-                model="azure-foundry/gpt-5.3-codex",
-                api_key="k",
-                reasoning_effort="high",
-            )
-            conv = model.create_conversation("system", "user msg")
-            turn = model.complete(conv)
-            self.assertEqual(turn.text, "ok")
-            self.assertEqual(captured["payload"]["model"], "gpt-5.3-codex")
-
-    def test_openai_payload_includes_thinking_type(self) -> None:
-        captured: dict = {}
-
-        def fake_http_json(url, method, headers, payload=None, timeout_sec=90):  # type: ignore[no-untyped-def]
-            captured["payload"] = payload
-            return {
-                "choices": [
-                    {
-                        "message": {
-                            "content": "ok",
-                            "tool_calls": None,
-                        },
-                        "finish_reason": "stop",
-                    }
-                ]
-            }
-
-        with patch("agent.model._http_stream_sse", mock_openai_stream(fake_http_json)):
-            model = OpenAICompatibleModel(
-                model="glm-5",
-                api_key="k",
-                thinking_type="enabled",
-            )
-            conv = model.create_conversation("system", "user msg")
-            turn = model.complete(conv)
-            self.assertEqual(turn.text, "ok")
-            self.assertEqual(captured["payload"]["thinking"], {"type": "enabled"})
-
     def test_anthropic_payload_includes_thinking_budget(self) -> None:
         """Non-Opus-4.6 models use manual thinking with budget_tokens."""
         captured: dict = {}
@@ -114,27 +58,6 @@ def fake_http_json(url, method, headers, payload=None, timeout_sec=90):  # type:
             self.assertEqual(turn.text, "ok")
             self.assertEqual(captured["payload"]["thinking"]["budget_tokens"], 4096)
 
-    def test_anthropic_payload_strips_foundry_prefix(self) -> None:
-        captured: dict = {}
-
-        def fake_http_json(url, method, headers, payload=None, timeout_sec=90):  # type: ignore[no-untyped-def]
-            captured["payload"] = payload
-            return {
-                "content": [{"type": "text", "text": "ok"}],
-                "stop_reason": "end_turn",
-            }
-
-        with patch("agent.model._http_stream_sse", mock_anthropic_stream(fake_http_json)):
-            model = AnthropicModel(
-                model="anthropic-foundry/claude-opus-4-6",
-                api_key="k",
-                reasoning_effort="high",
-            )
-            conv = model.create_conversation("system", "user msg")
-            turn = model.complete(conv)
-            self.assertEqual(turn.text, "ok")
-            self.assertEqual(captured["payload"]["model"], "claude-opus-4-6")
-
     def test_anthropic_opus46_uses_adaptive_thinking(self) -> None:
         """Opus 4.6 uses adaptive thinking with output_config effort."""
         captured: dict = {}
@@ -219,124 +142,6 @@ def fake_http_json(url, method, headers, payload=None, timeout_sec=90):  # type:
             self.assertIn("thinking", calls[0])
             self.assertNotIn("thinking", calls[1])
 
-    def test_openai_reasoning_content_forwards_as_thinking(self) -> None:
-        deltas: list[tuple[str, str]] = []
-
-        def fake_stream_sse(url, method, headers, payload, first_byte_timeout=10, stream_timeout=120, max_retries=3, on_sse_event=None):  # type: ignore[no-untyped-def]
-            events = [
-                ("", {"choices": [{"delta": {"reasoning_content": "thinking text"}, "finish_reason": None}]}),
-                ("", {"choices": [{"delta": {"content": "final text"}, "finish_reason": None}]}),
-                ("", {"choices": [{"delta": {}, "finish_reason": "stop"}]}),
-            ]
-            if on_sse_event:
-                for event_type, data in events:
-                    on_sse_event(event_type, data)
-            return events
-
-        with patch("agent.model._http_stream_sse", fake_stream_sse):
-            model = OpenAICompatibleModel(
-                model="glm-5",
-                api_key="k",
-                on_content_delta=lambda delta_type, text: deltas.append((delta_type, text)),
-            )
-            conv = model.create_conversation("system", "user msg")
-            turn = model.complete(conv)
-            self.assertEqual(turn.text, "final text")
-            self.assertIn(("thinking", "thinking text"), deltas)
-            self.assertIn(("text", "final text"), deltas)
-
-    def test_openai_finish_reason_rate_limit_raises_rate_limit_error(self) -> None:
-        def fake_http_json(url, method, headers, payload=None, timeout_sec=90):  # type: ignore[no-untyped-def]
-            return {
-                "choices": [
-                    {
-                        "message": {"content": "partial", "tool_calls": None},
-                        "finish_reason": "rate_limit",
-                    }
-                ]
-            }
-
-        with patch("agent.model._http_stream_sse", mock_openai_stream(fake_http_json)):
-            model = OpenAICompatibleModel(model="glm-5", api_key="k")
-            conv = model.create_conversation("system", "user msg")
-            with self.assertRaises(RateLimitError):
-                model.complete(conv)
-
-    def test_zai_uses_configured_endpoint_without_auto_switch(self) -> None:
-        calls: list[str] = []
-
-        def fake_stream_sse(url, method, headers, payload, first_byte_timeout=10, stream_timeout=120, max_retries=3, on_sse_event=None):  # type: ignore[no-untyped-def]
-            calls.append(url)
-            if "/api/paas/v4/" in url:
-                raise HTTPModelError(
-                    f"HTTP 404 calling {url}: not found",
-                    status_code=404,
-                    body='{"error":{"message":"not found"}}',
-                )
-            return []
-
-        with patch("agent.model._http_stream_sse", fake_stream_sse):
-            model = OpenAICompatibleModel(
-                model="glm-5",
-                api_key="k",
-                base_url="https://api.z.ai/api/paas/v4",
-                provider="zai",
-            )
-            conv = model.create_conversation("system", "user msg")
-            with self.assertRaises(HTTPModelError):
-                model.complete(conv)
-            self.assertEqual(model.base_url, "https://api.z.ai/api/paas/v4")
-            self.assertEqual(len(calls), 1)
-
-    def test_openai_stream_retries_respected(self) -> None:
-        captured: dict[str, int] = {}
-
-        def fake_stream_sse(url, method, headers, payload, first_byte_timeout=10, stream_timeout=120, max_retries=3, on_sse_event=None):  # type: ignore[no-untyped-def]
-            captured["max_retries"] = max_retries
-            events = [
-                ("", {"choices": [{"delta": {"content": "ok"}, "finish_reason": None}]}),
-                ("", {"choices": [{"delta": {}, "finish_reason": "stop"}]}),
-            ]
-            if on_sse_event:
-                for event_type, data in events:
-                    on_sse_event(event_type, data)
-            return events
-
-        with patch("agent.model._http_stream_sse", fake_stream_sse):
-            model = OpenAICompatibleModel(
-                model="gpt-4.1-mini",
-                api_key="k",
-                stream_max_retries=7,
-            )
-            conv = model.create_conversation("system", "user msg")
-            model.complete(conv)
-        self.assertEqual(captured.get("max_retries"), 7)
-
-    def test_zai_stream_retries_respected(self) -> None:
-        captured: dict[str, int] = {}
-
-        def fake_stream_sse(url, method, headers, payload, first_byte_timeout=10, stream_timeout=120, max_retries=3, on_sse_event=None):  # type: ignore[no-untyped-def]
-            captured["max_retries"] = max_retries
-            events = [
-                ("", {"choices": [{"delta": {"content": "ok"}, "finish_reason": None}]}),
-                ("", {"choices": [{"delta": {}, "finish_reason": "stop"}]}),
-            ]
-            if on_sse_event:
-                for event_type, data in events:
-                    on_sse_event(event_type, data)
-            return events
-
-        with patch("agent.model._http_stream_sse", fake_stream_sse):
-            model = OpenAICompatibleModel(
-                model="glm-5",
-                api_key="k",
-                provider="zai",
-                stream_max_retries=10,
-            )
-            conv = model.create_conversation("system", "user msg")
-            model.complete(conv)
-        self.assertEqual(captured.get("max_retries"), 10)
-
 
 class OllamaPayloadTests(unittest.TestCase):
     def test_ollama_uses_openai_compatible_format(self) -> None:
diff --git a/tests/test_settings.py b/tests/test_settings.py
index d39c08ea..2f85fa12 100644
--- a/tests/test_settings.py
+++ b/tests/test_settings.py
@@ -40,7 +40,6 @@ def test_per_provider_model_roundtrip(self) -> None:
                 default_model_openai="gpt-4.1-mini",
                 default_model_anthropic="claude-opus-4-6",
                 default_model_openrouter="anthropic/claude-sonnet-4-5",
-                default_model_zai="glm-5",
             )
             store.save(settings)
             loaded = store.load()
@@ -48,7 +47,6 @@ def test_per_provider_model_roundtrip(self) -> None:
             self.assertEqual(loaded.default_model_openai, "gpt-4.1-mini")
             self.assertEqual(loaded.default_model_anthropic, "claude-opus-4-6")
             self.assertEqual(loaded.default_model_openrouter, "anthropic/claude-sonnet-4-5")
-            self.assertEqual(loaded.default_model_zai, "glm-5")
 
     def test_default_model_for_provider_specific(self) -> None:
         settings = PersistentSettings(
@@ -68,7 +66,6 @@ def test_default_model_for_provider_none(self) -> None:
         self.assertIsNone(settings.default_model_for_provider("anthropic"))
         self.assertIsNone(settings.default_model_for_provider("openrouter"))
         self.assertIsNone(settings.default_model_for_provider("cerebras"))
-        self.assertIsNone(settings.default_model_for_provider("zai"))
 
     def test_per_provider_model_ollama(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
@@ -88,13 +85,6 @@ def test_default_model_for_provider_ollama(self) -> None:
         )
         self.assertEqual(settings.default_model_for_provider("ollama"), "llama3.2")
 
-    def test_default_model_for_provider_zai(self) -> None:
-        settings = PersistentSettings(
-            default_model="global-model",
-            default_model_zai="glm-5",
-        )
-        self.assertEqual(settings.default_model_for_provider("zai"), "glm-5")
-
     def test_backward_compat_old_settings(self) -> None:
         """Old settings.json without per-provider keys still loads fine."""
         import json
@@ -110,7 +100,6 @@ def test_backward_compat_old_settings(self) -> None:
             self.assertIsNone(loaded.default_model_openai)
             self.assertIsNone(loaded.default_model_anthropic)
             self.assertIsNone(loaded.default_model_openrouter)
-            self.assertIsNone(loaded.default_model_zai)
 
 
 class ComputeSuggestionsTests(unittest.TestCase):
@@ -166,19 +155,11 @@ def test_claude_is_anthropic(self) -> None:
         self.assertEqual(infer_provider_for_model("claude-opus-4-6"), "anthropic")
         self.assertEqual(infer_provider_for_model("claude-sonnet-4-5-20250929"), "anthropic")
         self.assertEqual(infer_provider_for_model("Claude-3-Haiku"), "anthropic")
-        self.assertEqual(
-            infer_provider_for_model("anthropic-foundry/claude-opus-4-6"),
-            "anthropic",
-        )
 
     def test_gpt_is_openai(self) -> None:
         self.assertEqual(infer_provider_for_model("gpt-5.2"), "openai")
         self.assertEqual(infer_provider_for_model("gpt-4.1-mini"), "openai")
         self.assertEqual(infer_provider_for_model("GPT-4o"), "openai")
-        self.assertEqual(
-            infer_provider_for_model("azure-foundry/gpt-5.3-codex"),
-            "openai",
-        )
 
     def test_o_series_is_openai(self) -> None:
         self.assertEqual(infer_provider_for_model("o1-mini"), "openai")
@@ -209,10 +190,6 @@ def test_cerebras_qwen3_not_ollama(self) -> None:
         """qwen-3 models go to Cerebras, not Ollama."""
         self.assertEqual(infer_provider_for_model("qwen-3-235b-a22b-instruct-2507"), "cerebras")
 
-    def test_zai_models(self) -> None:
-        self.assertEqual(infer_provider_for_model("glm-5"), "zai")
-        self.assertEqual(infer_provider_for_model("GLM-4.5"), "zai")
-
     def test_unknown_returns_none(self) -> None:
         self.assertIsNone(infer_provider_for_model("my-custom-model"))
         self.assertIsNone(infer_provider_for_model("some-random-model"))
@@ -223,7 +200,6 @@ def test_matching_provider_passes(self) -> None:
         _validate_model_provider("gpt-5.2", "openai")
         _validate_model_provider("claude-opus-4-6", "anthropic")
         _validate_model_provider("anthropic/claude-sonnet-4-5", "openrouter")
-        _validate_model_provider("glm-5", "zai")
 
     def test_mismatch_raises(self) -> None:
         with self.assertRaises(ModelError):

From 2790662d0168b6f9e001433cef7d0de4bffb07bd Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 16:04:51 -0400
Subject: [PATCH 53/58] Restore provider tooling files to upstream on PR1

---
 agent/__main__.py                             |  119 +-
 agent/builder.py                              |  121 +-
 agent/settings.py                             |    6 -
 agent/tool_defs.py                            |    4 +-
 agent/tools.py                                |  433 ------
 agent/tui.py                                  |   26 +-
 .../crates/op-core/src/builder.rs             |  223 +--
 .../crates/op-core/src/model/mod.rs           |   29 +-
 .../crates/op-core/src/settings.rs            |   67 +-
 .../crates/op-core/src/tools/defs.rs          |   32 +-
 .../crates/op-core/src/tools/mod.rs           |  242 +---
 .../crates/op-core/src/tools/web.rs           | 1246 ++---------------
 tests/test_coverage_gaps.py                   |  150 +-
 tests/test_tools.py                           |  175 ---
 tests/test_tools_complex.py                   |   42 -
 15 files changed, 251 insertions(+), 2664 deletions(-)

diff --git a/agent/__main__.py b/agent/__main__.py
index 7adc0dd6..8ba38df4 100644
--- a/agent/__main__.py
+++ b/agent/__main__.py
@@ -6,13 +6,7 @@
 from datetime import datetime, timezone
 
 from .builder import _fetch_models_for_provider, build_engine, infer_provider_for_model
-from .config import (
-    AgentConfig,
-    normalize_zai_plan,
-    resolve_anthropic_api_key,
-    resolve_openai_api_key,
-    resolve_zai_base_url,
-)
+from .config import AgentConfig
 from .credentials import (
     CredentialBundle,
     CredentialStore,
@@ -39,7 +33,7 @@ def build_parser() -> argparse.ArgumentParser:
     parser.add_argument(
         "--provider",
         default=None,
-        choices=["auto", "openai", "anthropic", "openrouter", "cerebras", "zai", "ollama", "all"],
+        choices=["auto", "openai", "anthropic", "openrouter", "cerebras", "ollama", "all"],
         help="Model provider. Use 'all' only with --list-models.",
     )
     parser.add_argument("--model", help="Model name (use 'newest' to auto-select latest from API).")
@@ -73,10 +67,6 @@ def build_parser() -> argparse.ArgumentParser:
         "--default-model-cerebras",
         help="Persist workspace default model for Cerebras provider.",
     )
-    parser.add_argument(
-        "--default-model-zai",
-        help="Persist workspace default model for Z.AI provider.",
-    )
     parser.add_argument(
         "--default-model-ollama",
         help="Persist workspace default model for Ollama provider.",
@@ -92,21 +82,7 @@ def build_parser() -> argparse.ArgumentParser:
     parser.add_argument("--anthropic-api-key", help="Anthropic API key override.")
     parser.add_argument("--openrouter-api-key", help="OpenRouter API key override.")
     parser.add_argument("--cerebras-api-key", help="Cerebras API key override.")
-    parser.add_argument("--zai-api-key", help="Z.AI API key override.")
-    parser.add_argument(
-        "--zai-plan",
-        choices=["paygo", "coding"],
-        help="Z.AI endpoint plan: paygo uses /api/paas/v4, coding uses /api/coding/paas/v4.",
-    )
     parser.add_argument("--exa-api-key", help="Exa API key override.")
-    parser.add_argument("--firecrawl-api-key", help="Firecrawl API key override.")
-    parser.add_argument("--brave-api-key", help="Brave Search API key override.")
-    parser.add_argument("--tavily-api-key", help="Tavily API key override.")
-    parser.add_argument(
-        "--web-search-provider",
-        choices=["exa", "firecrawl", "brave", "tavily"],
-        help="Web search backend provider.",
-    )
     parser.add_argument("--voyage-api-key", help="Voyage API key override.")
     parser.add_argument(
         "--configure-keys",
@@ -136,11 +112,6 @@ def build_parser() -> argparse.ArgumentParser:
         "--session-id",
         help="Session id to use. If omitted, a new id is generated unless --resume is used.",
     )
-    parser.add_argument(
-        "session_id_positional",
-        nargs="?",
-        help=argparse.SUPPRESS,
-    )
     parser.add_argument(
         "--resume",
         action="store_true",
@@ -182,7 +153,7 @@ def _format_ts(ts: int) -> str:
 
 def _resolve_provider(requested: str, creds: CredentialBundle) -> str:
     requested = requested.strip().lower()
-    if requested in {"openai", "anthropic", "openrouter", "cerebras", "zai", "ollama"}:
+    if requested in {"openai", "anthropic", "openrouter", "cerebras", "ollama"}:
         return requested
     if requested == "all":
         return "all"
@@ -194,17 +165,15 @@ def _resolve_provider(requested: str, creds: CredentialBundle) -> str:
         return "openrouter"
     if creds.cerebras_api_key:
         return "cerebras"
-    if creds.zai_api_key:
-        return "zai"
-    return "anthropic"
+    return "openai"
 
 
 def _print_models(cfg: AgentConfig, requested_provider: str) -> int:
     providers: list[str]
     if requested_provider == "all":
-        providers = ["openai", "anthropic", "openrouter", "cerebras", "zai", "ollama"]
+        providers = ["openai", "anthropic", "openrouter", "cerebras", "ollama"]
     elif requested_provider == "auto":
-        providers = ["openai", "anthropic", "openrouter", "cerebras", "zai", "ollama"]
+        providers = ["openai", "anthropic", "openrouter", "cerebras", "ollama"]
     else:
         providers = [requested_provider]
 
@@ -240,11 +209,7 @@ def _load_credentials(
         anthropic_api_key=user_creds.anthropic_api_key,
         openrouter_api_key=user_creds.openrouter_api_key,
         cerebras_api_key=user_creds.cerebras_api_key,
-        zai_api_key=user_creds.zai_api_key,
         exa_api_key=user_creds.exa_api_key,
-        firecrawl_api_key=user_creds.firecrawl_api_key,
-        brave_api_key=user_creds.brave_api_key,
-        tavily_api_key=user_creds.tavily_api_key,
         voyage_api_key=user_creds.voyage_api_key,
     )
 
@@ -258,16 +223,8 @@ def _load_credentials(
         creds.openrouter_api_key = stored.openrouter_api_key
     if stored.cerebras_api_key:
         creds.cerebras_api_key = stored.cerebras_api_key
-    if stored.zai_api_key:
-        creds.zai_api_key = stored.zai_api_key
     if stored.exa_api_key:
         creds.exa_api_key = stored.exa_api_key
-    if stored.firecrawl_api_key:
-        creds.firecrawl_api_key = stored.firecrawl_api_key
-    if stored.brave_api_key:
-        creds.brave_api_key = stored.brave_api_key
-    if stored.tavily_api_key:
-        creds.tavily_api_key = stored.tavily_api_key
     if stored.voyage_api_key:
         creds.voyage_api_key = stored.voyage_api_key
 
@@ -280,16 +237,8 @@ def _load_credentials(
         creds.openrouter_api_key = env_creds.openrouter_api_key
     if env_creds.cerebras_api_key:
         creds.cerebras_api_key = env_creds.cerebras_api_key
-    if env_creds.zai_api_key:
-        creds.zai_api_key = env_creds.zai_api_key
     if env_creds.exa_api_key:
         creds.exa_api_key = env_creds.exa_api_key
-    if env_creds.firecrawl_api_key:
-        creds.firecrawl_api_key = env_creds.firecrawl_api_key
-    if env_creds.brave_api_key:
-        creds.brave_api_key = env_creds.brave_api_key
-    if env_creds.tavily_api_key:
-        creds.tavily_api_key = env_creds.tavily_api_key
     if env_creds.voyage_api_key:
         creds.voyage_api_key = env_creds.voyage_api_key
 
@@ -307,16 +256,8 @@ def _load_credentials(
         creds.openrouter_api_key = args.openrouter_api_key.strip() or creds.openrouter_api_key
     if args.cerebras_api_key:
         creds.cerebras_api_key = args.cerebras_api_key.strip() or creds.cerebras_api_key
-    if args.zai_api_key:
-        creds.zai_api_key = args.zai_api_key.strip() or creds.zai_api_key
     if args.exa_api_key:
         creds.exa_api_key = args.exa_api_key.strip() or creds.exa_api_key
-    if args.firecrawl_api_key:
-        creds.firecrawl_api_key = args.firecrawl_api_key.strip() or creds.firecrawl_api_key
-    if args.brave_api_key:
-        creds.brave_api_key = args.brave_api_key.strip() or creds.brave_api_key
-    if args.tavily_api_key:
-        creds.tavily_api_key = args.tavily_api_key.strip() or creds.tavily_api_key
     if args.voyage_api_key:
         creds.voyage_api_key = args.voyage_api_key.strip() or creds.voyage_api_key
 
@@ -355,29 +296,14 @@ def _apply_runtime_overrides(cfg: AgentConfig, args: argparse.Namespace, creds:
         cfg.provider = args.provider
     cfg.provider = _resolve_provider(cfg.provider, creds)
 
-    cfg.openai_api_key = resolve_openai_api_key(creds.openai_api_key, cfg.openai_base_url)
-    cfg.anthropic_api_key = resolve_anthropic_api_key(
-        creds.anthropic_api_key,
-        cfg.anthropic_base_url,
-    )
+    cfg.openai_api_key = creds.openai_api_key
+    cfg.anthropic_api_key = creds.anthropic_api_key
     cfg.openrouter_api_key = creds.openrouter_api_key
     cfg.cerebras_api_key = creds.cerebras_api_key
-    cfg.zai_api_key = creds.zai_api_key
     cfg.exa_api_key = creds.exa_api_key
-    cfg.firecrawl_api_key = creds.firecrawl_api_key
-    cfg.brave_api_key = creds.brave_api_key
-    cfg.tavily_api_key = creds.tavily_api_key
     cfg.voyage_api_key = creds.voyage_api_key
     cfg.api_key = cfg.openai_api_key
 
-    if args.zai_plan:
-        cfg.zai_plan = normalize_zai_plan(args.zai_plan)
-        cfg.zai_base_url = resolve_zai_base_url(
-            cfg.zai_plan,
-            paygo_base_url=cfg.zai_paygo_base_url,
-            coding_base_url=cfg.zai_coding_base_url,
-        )
-
     if args.base_url:
         if cfg.provider == "openai":
             cfg.openai_base_url = args.base_url
@@ -387,25 +313,12 @@ def _apply_runtime_overrides(cfg: AgentConfig, args: argparse.Namespace, creds:
             cfg.openrouter_base_url = args.base_url
         elif cfg.provider == "cerebras":
             cfg.cerebras_base_url = args.base_url
-        elif cfg.provider == "zai":
-            cfg.zai_base_url = args.base_url
         elif cfg.provider == "ollama":
             cfg.ollama_base_url = args.base_url
         cfg.base_url = args.base_url
 
-    cfg.openai_api_key = resolve_openai_api_key(cfg.openai_api_key, cfg.openai_base_url)
-    cfg.anthropic_api_key = resolve_anthropic_api_key(
-        cfg.anthropic_api_key,
-        cfg.anthropic_base_url,
-    )
-    cfg.api_key = resolve_openai_api_key(cfg.api_key, cfg.base_url)
-
     if args.model:
         cfg.model = args.model
-    if args.web_search_provider:
-        cfg.web_search_provider = args.web_search_provider
-    if cfg.web_search_provider not in {"exa", "firecrawl", "brave", "tavily"}:
-        cfg.web_search_provider = "exa"
     if args.reasoning_effort:
         cfg.reasoning_effort = None if args.reasoning_effort == "none" else args.reasoning_effort
     if args.recursive:
@@ -477,9 +390,6 @@ def _apply_persistent_settings(
     if args.default_model_cerebras is not None:
         settings.default_model_cerebras = args.default_model_cerebras.strip() or None
         changed = True
-    if args.default_model_zai is not None:
-        settings.default_model_zai = args.default_model_zai.strip() or None
-        changed = True
     if args.default_model_ollama is not None:
         settings.default_model_ollama = args.default_model_ollama.strip() or None
         changed = True
@@ -513,7 +423,6 @@ def _print_settings(settings: PersistentSettings) -> None:
     print(f"  default_model_anthropic: {settings.default_model_anthropic or '(unset)'}")
     print(f"  default_model_openrouter: {settings.default_model_openrouter or '(unset)'}")
     print(f"  default_model_cerebras: {settings.default_model_cerebras or '(unset)'}")
-    print(f"  default_model_zai: {settings.default_model_zai or '(unset)'}")
     print(f"  default_model_ollama: {settings.default_model_ollama or '(unset)'}")
 
 
@@ -540,8 +449,6 @@ def _has_non_interactive_command(args: argparse.Namespace) -> bool:
         return True
     if args.default_model_cerebras is not None:
         return True
-    if args.default_model_zai is not None:
-        return True
     if args.default_model_ollama is not None:
         return True
     return False
@@ -551,11 +458,6 @@ def main() -> None:
     parser = build_parser()
     args = parser.parse_args()
 
-    if args.resume and args.session_id is None and args.session_id_positional:
-        args.session_id = args.session_id_positional
-    elif args.session_id_positional and not args.resume:
-        parser.error("Positional session-id is only supported with --resume.")
-
     non_tty = not (sys.stdin.isatty() and sys.stdout.isatty())
     if (args.headless or non_tty) and not args.textual:
         args.no_tui = True
@@ -624,7 +526,6 @@ def main() -> None:
                 "anthropic": cfg.anthropic_api_key,
                 "openrouter": cfg.openrouter_api_key,
                 "cerebras": cfg.cerebras_api_key,
-                "zai": cfg.zai_api_key,
                 "ollama": "ollama",
             }.get(inferred)
             if key:
@@ -653,11 +554,7 @@ def main() -> None:
     startup_info: dict[str, str] = {
         "Provider": cfg.provider,
         "Model": model_name,
-        "WebSearch": cfg.web_search_provider,
     }
-    if cfg.provider == "zai":
-        startup_info["ZAIPlan"] = cfg.zai_plan
-        startup_info["ZAIURL"] = cfg.zai_base_url
     if cfg.reasoning_effort:
         startup_info["Reasoning"] = cfg.reasoning_effort
     startup_info["Mode"] = "recursive" if cfg.recursive else "flat"
diff --git a/agent/builder.py b/agent/builder.py
index 59152fd1..a47d3e31 100644
--- a/agent/builder.py
+++ b/agent/builder.py
@@ -9,16 +9,7 @@
 import re
 from pathlib import Path
 
-from .config import (
-    ANTHROPIC_FOUNDRY_MODEL_PREFIX,
-    AZURE_FOUNDRY_MODEL_PREFIX,
-    PROVIDER_DEFAULT_MODELS,
-    AgentConfig,
-    is_foundry_anthropic_base_url,
-    is_foundry_openai_base_url,
-    resolve_anthropic_api_key,
-    resolve_openai_api_key,
-)
+from .config import PROVIDER_DEFAULT_MODELS, AgentConfig
 from .engine import RLMEngine
 from .model import (
     AnthropicModel,
@@ -36,8 +27,7 @@
 # Patterns that unambiguously identify a provider.
 _ANTHROPIC_RE = re.compile(r"^claude", re.IGNORECASE)
 _OPENAI_RE = re.compile(r"^(gpt|o[1-4]-|o[1-4]$|chatgpt|dall-e|tts-|whisper)", re.IGNORECASE)
-_CEREBRAS_RE = re.compile(r"^(llama.*cerebras|qwen-3|gpt-oss)", re.IGNORECASE)
-_ZAI_RE = re.compile(r"^(glm|zai-glm)", re.IGNORECASE)
+_CEREBRAS_RE = re.compile(r"^(llama.*cerebras|qwen-3|gpt-oss|zai-glm)", re.IGNORECASE)
 _OLLAMA_RE = re.compile(
     r"^(llama|mistral|gemma|phi|codellama|deepseek|vicuna|tinyllama|"
     r"neural-chat|dolphin|wizardlm|orca|nous-hermes|command-r|qwen(?!-3))",
@@ -47,19 +37,12 @@
 
 def infer_provider_for_model(model: str) -> str | None:
     """Return the likely provider for *model*, or ``None`` if ambiguous."""
-    lowered = model.strip().lower()
-    if lowered.startswith(ANTHROPIC_FOUNDRY_MODEL_PREFIX):
-        return "anthropic"
-    if lowered.startswith(AZURE_FOUNDRY_MODEL_PREFIX):
-        return "openai"
     if "/" in model:
         return "openrouter"
     if _ANTHROPIC_RE.search(model):
         return "anthropic"
     if _CEREBRAS_RE.search(model):
         return "cerebras"
-    if _ZAI_RE.search(model):
-        return "zai"
     if _OPENAI_RE.search(model):
         return "openai"
     if _OLLAMA_RE.search(model):
@@ -83,37 +66,13 @@ def _validate_model_provider(model_name: str, provider: str) -> None:
 
 def _fetch_models_for_provider(cfg: AgentConfig, provider: str) -> list[dict]:
     if provider == "openai":
-        api_key = resolve_openai_api_key(cfg.openai_api_key, cfg.openai_base_url)
-        if not api_key:
+        if not cfg.openai_api_key:
             raise ModelError("OpenAI key not configured.")
-        models = list_openai_models(api_key=api_key, base_url=cfg.openai_base_url)
-        if is_foundry_openai_base_url(cfg.openai_base_url):
-            return [
-                {
-                    **row,
-                    "id": row["id"]
-                    if str(row.get("id", "")).lower().startswith(AZURE_FOUNDRY_MODEL_PREFIX)
-                    else f"{AZURE_FOUNDRY_MODEL_PREFIX}{row['id']}",
-                }
-                for row in models
-            ]
-        return models
+        return list_openai_models(api_key=cfg.openai_api_key, base_url=cfg.openai_base_url)
     if provider == "anthropic":
-        api_key = resolve_anthropic_api_key(cfg.anthropic_api_key, cfg.anthropic_base_url)
-        if not api_key:
+        if not cfg.anthropic_api_key:
             raise ModelError("Anthropic key not configured.")
-        models = list_anthropic_models(api_key=api_key, base_url=cfg.anthropic_base_url)
-        if is_foundry_anthropic_base_url(cfg.anthropic_base_url):
-            return [
-                {
-                    **row,
-                    "id": row["id"]
-                    if str(row.get("id", "")).lower().startswith(ANTHROPIC_FOUNDRY_MODEL_PREFIX)
-                    else f"{ANTHROPIC_FOUNDRY_MODEL_PREFIX}{row['id']}",
-                }
-                for row in models
-            ]
-        return models
+        return list_anthropic_models(api_key=cfg.anthropic_api_key, base_url=cfg.anthropic_base_url)
     if provider == "openrouter":
         if not cfg.openrouter_api_key:
             raise ModelError("OpenRouter key not configured.")
@@ -122,10 +81,6 @@ def _fetch_models_for_provider(cfg: AgentConfig, provider: str) -> list[dict]:
         if not cfg.cerebras_api_key:
             raise ModelError("Cerebras key not configured.")
         return list_openai_models(api_key=cfg.cerebras_api_key, base_url=cfg.cerebras_base_url)
-    if provider == "zai":
-        if not cfg.zai_api_key:
-            raise ModelError("Z.AI key not configured.")
-        return list_openai_models(api_key=cfg.zai_api_key, base_url=cfg.zai_base_url)
     if provider == "ollama":
         return list_ollama_models(base_url=cfg.ollama_base_url)
     raise ModelError(f"Unknown provider: {provider}")
@@ -143,28 +98,25 @@ def _resolve_model_name(cfg: AgentConfig) -> str:
         if not models:
             raise ModelError(f"No models returned for provider '{cfg.provider}'.")
         return str(models[0]["id"])
-    return PROVIDER_DEFAULT_MODELS.get(cfg.provider, "anthropic-foundry/claude-opus-4-6")
+    return PROVIDER_DEFAULT_MODELS.get(cfg.provider, "claude-opus-4-6")
 
 
 def build_model_factory(cfg: AgentConfig) -> ModelFactory | None:
     """Return a factory that creates models by name + optional reasoning effort."""
-    openai_api_key = resolve_openai_api_key(cfg.openai_api_key, cfg.openai_base_url)
-    anthropic_api_key = resolve_anthropic_api_key(cfg.anthropic_api_key, cfg.anthropic_base_url)
-
     def _factory(model_name: str, reasoning_effort: str | None = None) -> AnthropicModel | OpenAICompatibleModel:
         provider = infer_provider_for_model(model_name)
         effort = reasoning_effort or cfg.reasoning_effort
-        if provider == "anthropic" and anthropic_api_key:
+        if provider == "anthropic" and cfg.anthropic_api_key:
             return AnthropicModel(
                 model=model_name,
-                api_key=anthropic_api_key,
+                api_key=cfg.anthropic_api_key,
                 base_url=cfg.anthropic_base_url,
                 reasoning_effort=effort,
             )
-        if provider in ("openai", None) and openai_api_key:
+        if provider in ("openai", None) and cfg.openai_api_key:
             return OpenAICompatibleModel(
                 model=model_name,
-                api_key=openai_api_key,
+                api_key=cfg.openai_api_key,
                 base_url=cfg.openai_base_url,
                 reasoning_effort=effort,
             )
@@ -186,18 +138,6 @@ def _factory(model_name: str, reasoning_effort: str | None = None) -> AnthropicM
                 base_url=cfg.cerebras_base_url,
                 reasoning_effort=effort,
             )
-        if provider == "zai" and cfg.zai_api_key:
-            thinking_type = "disabled" if effort in (None, "", "none") else "enabled"
-            return OpenAICompatibleModel(
-                model=model_name,
-                api_key=cfg.zai_api_key,
-                base_url=cfg.zai_base_url,
-                reasoning_effort=effort,
-                thinking_type=thinking_type,
-                extra_headers={"Accept-Language": "en-US,en"},
-                provider="zai",
-                stream_max_retries=cfg.zai_stream_max_retries,
-            )
         if provider == "ollama":
             return OpenAICompatibleModel(
                 model=model_name,
@@ -209,14 +149,7 @@ def _factory(model_name: str, reasoning_effort: str | None = None) -> AnthropicM
             )
         raise ModelError(f"No API key available for model '{model_name}' (provider={provider})")
 
-    if (
-        anthropic_api_key
-        or openai_api_key
-        or cfg.openrouter_api_key
-        or cfg.cerebras_api_key
-        or cfg.zai_api_key
-        or cfg.ollama_base_url
-    ):
+    if cfg.anthropic_api_key or cfg.openai_api_key or cfg.openrouter_api_key or cfg.cerebras_api_key or cfg.ollama_base_url:
         return _factory
     return None
 
@@ -230,15 +163,8 @@ def build_engine(cfg: AgentConfig) -> RLMEngine:
         max_file_chars=cfg.max_file_chars,
         max_files_listed=cfg.max_files_listed,
         max_search_hits=cfg.max_search_hits,
-        web_search_provider=cfg.web_search_provider,
         exa_api_key=cfg.exa_api_key,
         exa_base_url=cfg.exa_base_url,
-        firecrawl_api_key=cfg.firecrawl_api_key,
-        firecrawl_base_url=cfg.firecrawl_base_url,
-        brave_api_key=cfg.brave_api_key,
-        brave_base_url=cfg.brave_base_url,
-        tavily_api_key=cfg.tavily_api_key,
-        tavily_base_url=cfg.tavily_base_url,
     )
 
     try:
@@ -249,13 +175,10 @@ def build_engine(cfg: AgentConfig) -> RLMEngine:
 
     _validate_model_provider(model_name, cfg.provider)
 
-    openai_api_key = resolve_openai_api_key(cfg.openai_api_key, cfg.openai_base_url)
-    anthropic_api_key = resolve_anthropic_api_key(cfg.anthropic_api_key, cfg.anthropic_base_url)
-
-    if cfg.provider == "openai" and openai_api_key:
+    if cfg.provider == "openai" and cfg.openai_api_key:
         model = OpenAICompatibleModel(
             model=model_name,
-            api_key=openai_api_key,
+            api_key=cfg.openai_api_key,
             base_url=cfg.openai_base_url,
             reasoning_effort=cfg.reasoning_effort,
         )
@@ -277,18 +200,6 @@ def build_engine(cfg: AgentConfig) -> RLMEngine:
             base_url=cfg.cerebras_base_url,
             reasoning_effort=cfg.reasoning_effort,
         )
-    elif cfg.provider == "zai" and cfg.zai_api_key:
-        thinking_type = "disabled" if cfg.reasoning_effort in (None, "", "none") else "enabled"
-        model = OpenAICompatibleModel(
-            model=model_name,
-            api_key=cfg.zai_api_key,
-            base_url=cfg.zai_base_url,
-            reasoning_effort=cfg.reasoning_effort,
-            thinking_type=thinking_type,
-            extra_headers={"Accept-Language": "en-US,en"},
-            provider="zai",
-            stream_max_retries=cfg.zai_stream_max_retries,
-        )
     elif cfg.provider == "ollama":
         model = OpenAICompatibleModel(
             model=model_name,
@@ -298,10 +209,10 @@ def build_engine(cfg: AgentConfig) -> RLMEngine:
             first_byte_timeout=120,
             strict_tools=False,
         )
-    elif cfg.provider == "anthropic" and anthropic_api_key:
+    elif cfg.provider == "anthropic" and cfg.anthropic_api_key:
         model = AnthropicModel(
             model=model_name,
-            api_key=anthropic_api_key,
+            api_key=cfg.anthropic_api_key,
             base_url=cfg.anthropic_base_url,
             reasoning_effort=cfg.reasoning_effort,
         )
diff --git a/agent/settings.py b/agent/settings.py
index 5b3b4f97..ec2835ee 100644
--- a/agent/settings.py
+++ b/agent/settings.py
@@ -30,7 +30,6 @@ class PersistentSettings:
     default_model_anthropic: str | None = None
     default_model_openrouter: str | None = None
     default_model_cerebras: str | None = None
-    default_model_zai: str | None = None
     default_model_ollama: str | None = None
 
     def default_model_for_provider(self, provider: str) -> str | None:
@@ -39,7 +38,6 @@ def default_model_for_provider(self, provider: str) -> str | None:
             "anthropic": self.default_model_anthropic,
             "openrouter": self.default_model_openrouter,
             "cerebras": self.default_model_cerebras,
-            "zai": self.default_model_zai,
             "ollama": self.default_model_ollama,
         }
         specific = per_provider.get(provider)
@@ -57,7 +55,6 @@ def normalized(self) -> "PersistentSettings":
             default_model_anthropic=(self.default_model_anthropic or "").strip() or None,
             default_model_openrouter=(self.default_model_openrouter or "").strip() or None,
             default_model_cerebras=(self.default_model_cerebras or "").strip() or None,
-            default_model_zai=(self.default_model_zai or "").strip() or None,
             default_model_ollama=(self.default_model_ollama or "").strip() or None,
         )
 
@@ -75,8 +72,6 @@ def to_json(self) -> dict[str, str]:
             payload["default_model_openrouter"] = self.default_model_openrouter
         if self.default_model_cerebras:
             payload["default_model_cerebras"] = self.default_model_cerebras
-        if self.default_model_zai:
-            payload["default_model_zai"] = self.default_model_zai
         if self.default_model_ollama:
             payload["default_model_ollama"] = self.default_model_ollama
         return payload
@@ -94,7 +89,6 @@ def from_json(cls, payload: dict | None) -> "PersistentSettings":
             default_model_anthropic=(str(payload.get("default_model_anthropic", "")).strip() or None),
             default_model_openrouter=(str(payload.get("default_model_openrouter", "")).strip() or None),
             default_model_cerebras=(str(payload.get("default_model_cerebras", "")).strip() or None),
-            default_model_zai=(str(payload.get("default_model_zai", "")).strip() or None),
             default_model_ollama=(str(payload.get("default_model_ollama", "")).strip() or None),
         ).normalized()
 
diff --git a/agent/tool_defs.py b/agent/tool_defs.py
index 73ef01ed..323edbde 100644
--- a/agent/tool_defs.py
+++ b/agent/tool_defs.py
@@ -63,7 +63,7 @@
     },
     {
         "name": "web_search",
-        "description": "Search the web using the configured provider (Exa, Firecrawl, Brave, or Tavily). Returns URLs, titles, and optional page text.",
+        "description": "Search the web using the Exa API. Returns URLs, titles, and optional page text.",
         "parameters": {
             "type": "object",
             "properties": {
@@ -86,7 +86,7 @@
     },
     {
         "name": "fetch_url",
-        "description": "Fetch and return the text content of one or more URLs using the configured provider backend (Exa, Firecrawl, Brave, or Tavily).",
+        "description": "Fetch and return the text content of one or more URLs.",
         "parameters": {
             "type": "object",
             "properties": {
diff --git a/agent/tools.py b/agent/tools.py
index e626d140..86a9e5ce 100644
--- a/agent/tools.py
+++ b/agent/tools.py
@@ -3,7 +3,6 @@
 import ast
 import base64
 import fnmatch
-import html as _html
 import json
 import os
 import signal
@@ -12,13 +11,11 @@
 import tempfile
 import threading
 import urllib.error
-import urllib.parse
 import urllib.request
 import re as _re
 import zlib
 from contextlib import contextmanager
 from dataclasses import dataclass, field
-from html.parser import HTMLParser
 from pathlib import Path
 from typing import Any
 
@@ -39,66 +36,6 @@
 _INTERACTIVE_RE = _re.compile(r"(^|[;&|]\s*)(vim|nano|less|more|top|htop|man)\b")
 
 
-class _HTMLTextExtractor(HTMLParser):
-    def __init__(self) -> None:
-        super().__init__(convert_charrefs=False)
-        self._title_parts: list[str] = []
-        self._text_parts: list[str] = []
-        self._skip_depth = 0
-        self._in_title = False
-
-    def handle_starttag(self, tag: str, attrs: list[tuple[str, str | None]]) -> None:
-        lowered = tag.lower()
-        if lowered in {"script", "style"}:
-            self._skip_depth += 1
-            return
-        if self._skip_depth:
-            return
-        if lowered == "title":
-            self._in_title = True
-            return
-        if lowered in {"article", "br", "div", "footer", "h1", "h2", "h3", "h4", "h5", "h6", "header", "li", "main", "p", "section", "td", "th", "tr"}:
-            self._text_parts.append("\n")
-
-    def handle_endtag(self, tag: str) -> None:
-        lowered = tag.lower()
-        if lowered in {"script", "style"}:
-            if self._skip_depth:
-                self._skip_depth -= 1
-            return
-        if self._skip_depth:
-            return
-        if lowered == "title":
-            self._in_title = False
-            return
-        if lowered in {"article", "div", "footer", "h1", "h2", "h3", "h4", "h5", "h6", "header", "li", "main", "p", "section", "td", "th", "tr"}:
-            self._text_parts.append("\n")
-
-    def handle_data(self, data: str) -> None:
-        if self._skip_depth or not data:
-            return
-        if self._in_title:
-            self._title_parts.append(data)
-        self._text_parts.append(data)
-
-    def title(self) -> str:
-        return _WS_RE.sub(" ", _html.unescape("".join(self._title_parts))).strip()
-
-    def text(self) -> str:
-        return _WS_RE.sub(" ", _html.unescape(" ".join(self._text_parts))).strip()
-
-
-def _extract_html_text(raw_html: str) -> tuple[str, str]:
-    parser = _HTMLTextExtractor()
-    try:
-        parser.feed(raw_html)
-        parser.close()
-        return parser.title(), parser.text()
-    except Exception:
-        stripped = _WS_RE.sub(" ", _re.sub(r"(?is)<[^>]+>", " ", raw_html)).strip()
-        return "", _html.unescape(stripped)
-
-
 def _line_hash(line: str) -> str:
     """2-char hex hash, whitespace-invariant."""
     return format(zlib.crc32(_WS_RE.sub("", line).encode("utf-8")) & 0xFF, "02x")
@@ -117,15 +54,8 @@ class WorkspaceTools:
     max_file_chars: int = 20000
     max_files_listed: int = 400
     max_search_hits: int = 200
-    web_search_provider: str = "exa"
     exa_api_key: str | None = None
     exa_base_url: str = "https://api.exa.ai"
-    firecrawl_api_key: str | None = None
-    firecrawl_base_url: str = "https://api.firecrawl.dev/v1"
-    brave_api_key: str | None = None
-    brave_base_url: str = "https://api.search.brave.com/res/v1"
-    tavily_api_key: str | None = None
-    tavily_base_url: str = "https://api.tavily.com"
 
     def __post_init__(self) -> None:
         self.root = self.root.expanduser().resolve()
@@ -874,148 +804,6 @@ def _exa_request(self, endpoint: str, payload: dict[str, Any]) -> dict[str, Any]
             raise ToolError(f"Exa API returned non-object response: {type(parsed)!r}")
         return parsed
 
-    def _firecrawl_request(self, endpoint: str, payload: dict[str, Any]) -> dict[str, Any]:
-        if not (self.firecrawl_api_key and self.firecrawl_api_key.strip()):
-            raise ToolError("FIRECRAWL_API_KEY not configured")
-        url = self.firecrawl_base_url.rstrip("/") + endpoint
-        req = urllib.request.Request(
-            url=url,
-            data=json.dumps(payload).encode("utf-8"),
-            headers={
-                "Authorization": f"Bearer {self.firecrawl_api_key}",
-                "Content-Type": "application/json",
-            },
-            method="POST",
-        )
-        try:
-            with urllib.request.urlopen(req, timeout=self.command_timeout_sec) as resp:
-                raw = resp.read().decode("utf-8", errors="replace")
-        except urllib.error.HTTPError as exc:
-            body = exc.read().decode("utf-8", errors="replace")
-            raise ToolError(f"Firecrawl API HTTP {exc.code}: {body}") from exc
-        except urllib.error.URLError as exc:
-            raise ToolError(f"Firecrawl API connection error: {exc}") from exc
-        except OSError as exc:
-            raise ToolError(f"Firecrawl API network error: {exc}") from exc
-
-        try:
-            parsed = json.loads(raw)
-        except json.JSONDecodeError as exc:
-            raise ToolError(f"Firecrawl API returned non-JSON payload: {raw[:500]}") from exc
-        if not isinstance(parsed, dict):
-            raise ToolError(f"Firecrawl API returned non-object response: {type(parsed)!r}")
-        return parsed
-
-    def _brave_request(self, endpoint: str, params: dict[str, Any]) -> dict[str, Any]:
-        if not (self.brave_api_key and self.brave_api_key.strip()):
-            raise ToolError("BRAVE_API_KEY not configured")
-        query = urllib.parse.urlencode(params, doseq=True)
-        url = self.brave_base_url.rstrip("/") + endpoint
-        if query:
-            url = f"{url}?{query}"
-        req = urllib.request.Request(
-            url=url,
-            headers={
-                "Accept": "application/json",
-                "X-Subscription-Token": self.brave_api_key,
-            },
-            method="GET",
-        )
-        try:
-            with urllib.request.urlopen(req, timeout=self.command_timeout_sec) as resp:
-                raw = resp.read().decode("utf-8", errors="replace")
-        except urllib.error.HTTPError as exc:
-            body = exc.read().decode("utf-8", errors="replace")
-            raise ToolError(f"Brave API HTTP {exc.code}: {body}") from exc
-        except urllib.error.URLError as exc:
-            raise ToolError(f"Brave API connection error: {exc}") from exc
-        except OSError as exc:
-            raise ToolError(f"Brave API network error: {exc}") from exc
-
-        try:
-            parsed = json.loads(raw)
-        except json.JSONDecodeError as exc:
-            raise ToolError(f"Brave API returned non-JSON payload: {raw[:500]}") from exc
-        if not isinstance(parsed, dict):
-            raise ToolError(f"Brave API returned non-object response: {type(parsed)!r}")
-        return parsed
-
-    def _tavily_request(self, endpoint: str, payload: dict[str, Any]) -> dict[str, Any]:
-        if not (self.tavily_api_key and self.tavily_api_key.strip()):
-            raise ToolError("TAVILY_API_KEY not configured")
-        url = self.tavily_base_url.rstrip("/") + endpoint
-        req = urllib.request.Request(
-            url=url,
-            data=json.dumps(payload).encode("utf-8"),
-            headers={
-                "Authorization": f"Bearer {self.tavily_api_key}",
-                "Content-Type": "application/json",
-            },
-            method="POST",
-        )
-        try:
-            with urllib.request.urlopen(req, timeout=self.command_timeout_sec) as resp:
-                raw = resp.read().decode("utf-8", errors="replace")
-        except urllib.error.HTTPError as exc:
-            body = exc.read().decode("utf-8", errors="replace")
-            raise ToolError(f"Tavily API HTTP {exc.code}: {body}") from exc
-        except urllib.error.URLError as exc:
-            raise ToolError(f"Tavily API connection error: {exc}") from exc
-        except OSError as exc:
-            raise ToolError(f"Tavily API network error: {exc}") from exc
-
-        try:
-            parsed = json.loads(raw)
-        except json.JSONDecodeError as exc:
-            raise ToolError(f"Tavily API returned non-JSON payload: {raw[:500]}") from exc
-        if not isinstance(parsed, dict):
-            raise ToolError(f"Tavily API returned non-object response: {type(parsed)!r}")
-        return parsed
-
-    def _fetch_url_direct(self, url: str) -> dict[str, str]:
-        req = urllib.request.Request(
-            url=url,
-            headers={
-                "Accept": "text/html,application/xhtml+xml,application/json,text/plain;q=0.9,*/*;q=0.8",
-                "User-Agent": "OpenPlanter/1.0",
-            },
-            method="GET",
-        )
-        try:
-            with urllib.request.urlopen(req, timeout=self.command_timeout_sec) as resp:
-                resolved_url = resp.geturl()
-                charset = resp.headers.get_content_charset() or "utf-8"
-                raw = resp.read().decode(charset, errors="replace")
-                content_type = (resp.headers.get("Content-Type") or "").lower()
-        except urllib.error.HTTPError as exc:
-            return {
-                "url": url,
-                "title": "",
-                "text": f"Direct fetch failed: HTTP {exc.code}",
-            }
-        except urllib.error.URLError as exc:
-            return {
-                "url": url,
-                "title": "",
-                "text": f"Direct fetch failed: {exc}",
-            }
-        except OSError as exc:
-            return {
-                "url": url,
-                "title": "",
-                "text": f"Direct fetch failed: {exc}",
-            }
-
-        if "html" in content_type:
-            title, text = _extract_html_text(raw)
-        else:
-            title, text = "", raw
-        return {
-            "url": resolved_url,
-            "title": title,
-            "text": self._clip(text or raw, 8000),
-        }
-
     def web_search(
         self,
         query: str,
@@ -1026,148 +814,6 @@ def web_search(
         if not query:
             return "web_search requires non-empty query"
         clamped_results = max(1, min(int(num_results), 20))
-        provider = (self.web_search_provider or "exa").strip().lower()
-        if provider not in {"exa", "firecrawl", "brave", "tavily"}:
-            provider = "exa"
-
-        if provider == "firecrawl":
-            payload: dict[str, Any] = {
-                "query": query,
-                "limit": clamped_results,
-            }
-            if include_text:
-                payload["scrapeOptions"] = {"formats": ["markdown"]}
-
-            try:
-                parsed = self._firecrawl_request("/search", payload)
-            except Exception as exc:
-                return f"Web search failed: {exc}"
-
-            data = parsed.get("data")
-            rows: list[Any] = []
-            if isinstance(data, list):
-                rows = data
-            elif isinstance(data, dict):
-                web_rows = data.get("web")
-                if isinstance(web_rows, list):
-                    rows = web_rows
-
-            out_results: list[dict[str, Any]] = []
-            for row in rows:
-                if not isinstance(row, dict):
-                    continue
-                metadata = row.get("metadata")
-                meta_title = ""
-                if isinstance(metadata, dict):
-                    meta_title = str(metadata.get("title", ""))
-                item: dict[str, Any] = {
-                    "url": str(row.get("url", "")),
-                    "title": str(row.get("title", "") or meta_title),
-                    "snippet": str(row.get("description", "") or row.get("snippet", "")),
-                }
-                if include_text:
-                    text_value = row.get("markdown") or row.get("text") or ""
-                    if isinstance(text_value, str) and text_value:
-                        item["text"] = self._clip(text_value, 4000)
-                out_results.append(item)
-
-            output = {
-                "query": query,
-                "provider": provider,
-                "results": out_results,
-                "total": len(out_results),
-            }
-            return self._clip(json.dumps(output, indent=2, ensure_ascii=True), self.max_file_chars)
-
-        if provider == "brave":
-            params: dict[str, Any] = {
-                "q": query,
-                "count": clamped_results,
-            }
-            if include_text:
-                params["extra_snippets"] = "true"
-
-            try:
-                parsed = self._brave_request("/web/search", params)
-            except Exception as exc:
-                return f"Web search failed: {exc}"
-
-            rows: list[Any] = []
-            web = parsed.get("web")
-            if isinstance(web, dict):
-                web_rows = web.get("results")
-                if isinstance(web_rows, list):
-                    rows = web_rows
-            elif isinstance(parsed.get("results"), list):
-                rows = parsed["results"]
-
-            out_results: list[dict[str, Any]] = []
-            for row in rows:
-                if not isinstance(row, dict):
-                    continue
-                description = str(row.get("description", "") or row.get("snippet", ""))
-                extra_snippets = row.get("extra_snippets")
-                extra_texts = [
-                    snippet
-                    for snippet in extra_snippets
-                    if isinstance(snippet, str) and snippet
-                ] if isinstance(extra_snippets, list) else []
-                item: dict[str, Any] = {
-                    "url": str(row.get("url", "")),
-                    "title": str(row.get("title", "")),
-                    "snippet": description or (extra_texts[0] if extra_texts else ""),
-                }
-                if include_text:
-                    text_parts = [part for part in [description, *extra_texts] if part]
-                    if text_parts:
-                        item["text"] = self._clip("\n\n".join(text_parts), 4000)
-                out_results.append(item)
-
-            output = {
-                "query": query,
-                "provider": provider,
-                "results": out_results,
-                "total": len(out_results),
-            }
-            return self._clip(json.dumps(output, indent=2, ensure_ascii=True), self.max_file_chars)
-
-        if provider == "tavily":
-            payload = {
-                "query": query,
-                "max_results": clamped_results,
-            }
-            if include_text:
-                payload["include_raw_content"] = "markdown"
-
-            try:
-                parsed = self._tavily_request("/search", payload)
-            except Exception as exc:
-                return f"Web search failed: {exc}"
-
-            rows = parsed.get("results")
-            out_results: list[dict[str, Any]] = []
-            for row in rows if isinstance(rows, list) else []:
-                if not isinstance(row, dict):
-                    continue
-                snippet = str(row.get("content", "") or row.get("snippet", ""))
-                text_value = row.get("raw_content") or row.get("content") or ""
-                item: dict[str, Any] = {
-                    "url": str(row.get("url", "")),
-                    "title": str(row.get("title", "")),
-                    "snippet": snippet,
-                }
-                if include_text and isinstance(text_value, str) and text_value:
-                    item["text"] = self._clip(text_value, 4000)
-                out_results.append(item)
-
-            output = {
-                "query": query,
-                "provider": provider,
-                "results": out_results,
-                "total": len(out_results),
-            }
-            return self._clip(json.dumps(output, indent=2, ensure_ascii=True), self.max_file_chars)
-
         payload: dict[str, Any] = {
             "query": query,
             "numResults": clamped_results,
@@ -1195,7 +841,6 @@ def web_search(
 
         output = {
             "query": query,
-            "provider": provider,
             "results": out_results,
             "total": len(out_results),
         }
@@ -1214,83 +859,6 @@ def fetch_url(self, urls: list[str]) -> str:
         if not normalized:
             return "fetch_url requires at least one valid URL"
         normalized = normalized[:10]
-        provider = (self.web_search_provider or "exa").strip().lower()
-        if provider not in {"exa", "firecrawl", "brave", "tavily"}:
-            provider = "exa"
-
-        if provider == "firecrawl":
-            pages: list[dict[str, Any]] = []
-            for url in normalized:
-                payload: dict[str, Any] = {
-                    "url": url,
-                    "formats": ["markdown"],
-                }
-                try:
-                    parsed = self._firecrawl_request("/scrape", payload)
-                except Exception as exc:
-                    return f"Fetch URL failed: {exc}"
-                data = parsed.get("data")
-                if not isinstance(data, dict):
-                    continue
-                metadata = data.get("metadata")
-                title = ""
-                if isinstance(metadata, dict):
-                    title = str(metadata.get("title", ""))
-                text = data.get("markdown") or data.get("text") or data.get("html") or ""
-                pages.append(
-                    {
-                        "url": str(data.get("url", "") or url),
-                        "title": title,
-                        "text": self._clip(str(text), 8000),
-                    }
-                )
-            output = {
-                "provider": provider,
-                "pages": pages,
-                "total": len(pages),
-            }
-            return self._clip(json.dumps(output, indent=2, ensure_ascii=True), self.max_file_chars)
-
-        if provider == "brave":
-            pages = [self._fetch_url_direct(url) for url in normalized]
-            output = {
-                "provider": provider,
-                "pages": pages,
-                "total": len(pages),
-            }
-            return self._clip(json.dumps(output, indent=2, ensure_ascii=True), self.max_file_chars)
-
-        if provider == "tavily":
-            payload = {
-                "urls": normalized,
-                "extract_depth": "basic",
-                "include_images": False,
-            }
-            try:
-                parsed = self._tavily_request("/extract", payload)
-            except Exception as exc:
-                return f"Fetch URL failed: {exc}"
-
-            pages: list[dict[str, Any]] = []
-            rows = parsed.get("results")
-            for row in rows if isinstance(rows, list) else []:
-                if not isinstance(row, dict):
-                    continue
-                text = row.get("raw_content") or row.get("content") or ""
-                pages.append(
-                    {
-                        "url": str(row.get("url", "")),
-                        "title": str(row.get("title", "") or ""),
-                        "text": self._clip(str(text), 8000),
-                    }
-                )
-            output = {
-                "provider": provider,
-                "pages": pages,
-                "total": len(pages),
-            }
-            return self._clip(json.dumps(output, indent=2, ensure_ascii=True), self.max_file_chars)
-
         payload: dict[str, Any] = {
             "ids": normalized,
             "text": {"maxCharacters": 8000},
@@ -1313,7 +881,6 @@ def fetch_url(self, urls: list[str]) -> str:
             )
 
         output = {
-            "provider": provider,
             "pages": pages,
             "total": len(pages),
         }
diff --git a/agent/tui.py b/agent/tui.py
index c1a63be2..0d7184ec 100644
--- a/agent/tui.py
+++ b/agent/tui.py
@@ -110,15 +110,14 @@ def _build_splash() -> str:
 ]
 
 MODEL_ALIASES: dict[str, str] = {
-    "opus": "anthropic-foundry/claude-opus-4-6",
-    "opus4.6": "anthropic-foundry/claude-opus-4-6",
-    "sonnet": "anthropic-foundry/claude-sonnet-4-6",
-    "sonnet4.6": "anthropic-foundry/claude-sonnet-4-6",
-    "haiku": "anthropic-foundry/claude-haiku-4-5",
-    "haiku4.5": "anthropic-foundry/claude-haiku-4-5",
-    "gpt5": "azure-foundry/gpt-5.3-codex",
-    "gpt5.3": "azure-foundry/gpt-5.3-codex",
-    "kimi": "azure-foundry/Kimi-K2.5",
+    "opus": "claude-opus-4-6",
+    "opus4.6": "claude-opus-4-6",
+    "sonnet": "claude-sonnet-4-5-20250929",
+    "sonnet4.5": "claude-sonnet-4-5-20250929",
+    "haiku": "claude-haiku-4-5-20251001",
+    "haiku4.5": "claude-haiku-4-5-20251001",
+    "gpt5": "gpt-5.2",
+    "gpt5.2": "gpt-5.2",
     "gpt4": "gpt-4.1",
     "gpt4.1": "gpt-4.1",
     "gpt4o": "gpt-4o",
@@ -129,8 +128,6 @@ def _build_splash() -> str:
     "cerebras": "qwen-3-235b-a22b-instruct-2507",
     "qwen235b": "qwen-3-235b-a22b-instruct-2507",
     "oss120b": "gpt-oss-120b",
-    "glm5": "glm-5",
-    "zai": "glm-5",
     "llama": "llama3.2",
     "llama3": "llama3.2",
     "mistral": "mistral",
@@ -179,7 +176,6 @@ def _api_key_for_provider(cfg: AgentConfig, provider: str) -> str | None:
         "anthropic": cfg.anthropic_api_key,
         "openrouter": cfg.openrouter_api_key,
         "cerebras": cfg.cerebras_api_key,
-        "zai": cfg.zai_api_key,
         "ollama": "ollama",
     }.get(provider)
 
@@ -195,8 +191,6 @@ def _available_providers(cfg: AgentConfig) -> list[str]:
         providers.append("openrouter")
     if cfg.cerebras_api_key:
         providers.append("cerebras")
-    if cfg.zai_api_key:
-        providers.append("zai")
     providers.append("ollama")
     return providers
 
@@ -226,7 +220,7 @@ def handle_model_command(args: str, ctx: ChatContext) -> list[str]:
         list_target = parts[1] if len(parts) > 1 else None
         if list_target == "all":
             providers = _available_providers(ctx.cfg)
-        elif list_target in {"openai", "anthropic", "openrouter", "cerebras", "zai", "ollama"}:
+        elif list_target in {"openai", "anthropic", "openrouter", "cerebras", "ollama"}:
             providers = [list_target]
         else:
             providers = [ctx.cfg.provider]
@@ -286,8 +280,6 @@ def handle_model_command(args: str, ctx: ChatContext) -> list[str]:
             settings.default_model_openrouter = new_model
         elif provider == "cerebras":
             settings.default_model_cerebras = new_model
-        elif provider == "zai":
-            settings.default_model_zai = new_model
         elif provider == "ollama":
             settings.default_model_ollama = new_model
         else:
diff --git a/openplanter-desktop/crates/op-core/src/builder.rs b/openplanter-desktop/crates/op-core/src/builder.rs
index 786e4c10..a0c4e319 100644
--- a/openplanter-desktop/crates/op-core/src/builder.rs
+++ b/openplanter-desktop/crates/op-core/src/builder.rs
@@ -7,13 +7,10 @@ use std::collections::HashMap;
 use regex::Regex;
 use std::sync::LazyLock;
 
-use crate::config::{
-    ANTHROPIC_FOUNDRY_MODEL_PREFIX, AZURE_FOUNDRY_MODEL_PREFIX, AgentConfig,
-    PROVIDER_DEFAULT_MODELS, resolve_anthropic_api_key, resolve_openai_api_key,
-};
+use crate::config::{AgentConfig, PROVIDER_DEFAULT_MODELS};
 use crate::model::BaseModel;
+use crate::model::openai::OpenAIModel;
 use crate::model::anthropic::AnthropicModel;
-use crate::model::openai::{OpenAIModel, ZaiRuntimeConfig};
 
 /// Error type for model/builder operations.
 #[derive(Debug, thiserror::Error)]
@@ -23,16 +20,14 @@ pub enum ModelError {
 }
 
 // Provider inference regexes — order matters (Cerebras `qwen-3` before Ollama `qwen`).
-static ANTHROPIC_RE: LazyLock<Regex> = LazyLock::new(|| Regex::new(r"(?i)^claude").unwrap());
+static ANTHROPIC_RE: LazyLock<Regex> =
+    LazyLock::new(|| Regex::new(r"(?i)^claude").unwrap());
 
-static OPENAI_RE: LazyLock<Regex> = LazyLock::new(|| {
-    Regex::new(r"(?i)^(gpt|o[1-4]-|o[1-4]$|chatgpt|dall-e|tts-|whisper)").unwrap()
-});
+static OPENAI_RE: LazyLock<Regex> =
+    LazyLock::new(|| Regex::new(r"(?i)^(gpt|o[1-4]-|o[1-4]$|chatgpt|dall-e|tts-|whisper)").unwrap());
 
 static CEREBRAS_RE: LazyLock<Regex> =
-    LazyLock::new(|| Regex::new(r"(?i)^(llama.*cerebras|qwen-3|gpt-oss)").unwrap());
-
-static ZAI_RE: LazyLock<Regex> = LazyLock::new(|| Regex::new(r"(?i)^(glm|zai-glm)").unwrap());
+    LazyLock::new(|| Regex::new(r"(?i)^(llama.*cerebras|qwen-3|gpt-oss|zai-glm)").unwrap());
 
 // Ollama regex: `qwen` without lookahead — Cerebras check runs first, so
 // `qwen-3*` is already caught before we reach this regex.
@@ -45,13 +40,6 @@ static OLLAMA_RE: LazyLock<Regex> = LazyLock::new(|| {
 
 /// Infer the likely provider for a model name, or `None` if ambiguous.
 pub fn infer_provider_for_model(model: &str) -> Option<&'static str> {
-    let lowered = model.trim().to_lowercase();
-    if lowered.starts_with(ANTHROPIC_FOUNDRY_MODEL_PREFIX) {
-        return Some("anthropic");
-    }
-    if lowered.starts_with(AZURE_FOUNDRY_MODEL_PREFIX) {
-        return Some("openai");
-    }
     if model.contains('/') {
         return Some("openrouter");
     }
@@ -61,9 +49,6 @@ pub fn infer_provider_for_model(model: &str) -> Option<&'static str> {
     if CEREBRAS_RE.is_match(model) {
         return Some("cerebras");
     }
-    if ZAI_RE.is_match(model) {
-        return Some("zai");
-    }
     if OPENAI_RE.is_match(model) {
         return Some("openai");
     }
@@ -101,12 +86,12 @@ pub fn resolve_model_name(cfg: &AgentConfig) -> Result<String, ModelError> {
         // For now, fall through to defaults.
         return Ok(PROVIDER_DEFAULT_MODELS
             .get(cfg.provider.as_str())
-            .unwrap_or(&"anthropic-foundry/claude-opus-4-6")
+            .unwrap_or(&"claude-opus-4-6")
             .to_string());
     }
     Ok(PROVIDER_DEFAULT_MODELS
         .get(cfg.provider.as_str())
-        .unwrap_or(&"anthropic-foundry/claude-opus-4-6")
+        .unwrap_or(&"claude-opus-4-6")
         .to_string())
 }
 
@@ -132,7 +117,6 @@ pub fn resolve_provider(cfg: &AgentConfig) -> Result<String, ModelError> {
         ("openai", &cfg.openai_api_key),
         ("openrouter", &cfg.openrouter_api_key),
         ("cerebras", &cfg.cerebras_api_key),
-        ("zai", &cfg.zai_api_key),
         ("ollama", &None), // ollama is always last — no key needed
     ];
 
@@ -147,75 +131,64 @@ pub fn resolve_provider(cfg: &AgentConfig) -> Result<String, ModelError> {
 }
 
 /// Resolve the base URL and API key for the given provider.
-pub fn resolve_endpoint(cfg: &AgentConfig, provider: &str) -> Result<(String, String), ModelError> {
+pub fn resolve_endpoint(
+    cfg: &AgentConfig,
+    provider: &str,
+) -> Result<(String, String), ModelError> {
     match provider {
         "anthropic" => {
-            let key = resolve_anthropic_api_key(
-                cfg.anthropic_api_key
-                    .clone()
-                    .or_else(|| cfg.api_key.clone()),
-                &cfg.anthropic_base_url,
-            )
-            .ok_or_else(|| {
-                ModelError::Message(
-                    "No Anthropic API key. Set ANTHROPIC_API_KEY or OPENPLANTER_ANTHROPIC_API_KEY."
-                        .into(),
-                )
-            })?;
+            let key = cfg
+                .anthropic_api_key
+                .as_deref()
+                .or(cfg.api_key.as_deref())
+                .filter(|k| !k.is_empty())
+                .ok_or_else(|| {
+                    ModelError::Message(
+                        "No Anthropic API key. Set ANTHROPIC_API_KEY or OPENPLANTER_ANTHROPIC_API_KEY.".into(),
+                    )
+                })?;
             // Anthropic base URL does NOT include /v1 suffix for /messages endpoint —
             // the model adapter appends /messages itself. The config stores it with /v1.
-            Ok((cfg.anthropic_base_url.clone(), key))
+            Ok((cfg.anthropic_base_url.clone(), key.to_string()))
         }
         "openai" => {
-            let key = resolve_openai_api_key(
-                cfg.openai_api_key.clone().or_else(|| cfg.api_key.clone()),
-                &cfg.openai_base_url,
-            )
-            .ok_or_else(|| {
-                ModelError::Message(
-                    "No OpenAI API key. Set OPENAI_API_KEY or OPENPLANTER_OPENAI_API_KEY.".into(),
-                )
-            })?;
-            Ok((cfg.openai_base_url.clone(), key))
-        }
-        "openrouter" => {
             let key = cfg
-                .openrouter_api_key
+                .openai_api_key
                 .as_deref()
                 .or(cfg.api_key.as_deref())
                 .filter(|k| !k.is_empty())
                 .ok_or_else(|| {
                     ModelError::Message(
-                        "No OpenRouter API key. Set OPENROUTER_API_KEY or OPENPLANTER_OPENROUTER_API_KEY.".into(),
+                        "No OpenAI API key. Set OPENAI_API_KEY or OPENPLANTER_OPENAI_API_KEY.".into(),
                     )
                 })?;
-            Ok((cfg.openrouter_base_url.clone(), key.to_string()))
+            Ok((cfg.openai_base_url.clone(), key.to_string()))
         }
-        "cerebras" => {
+        "openrouter" => {
             let key = cfg
-                .cerebras_api_key
+                .openrouter_api_key
                 .as_deref()
                 .or(cfg.api_key.as_deref())
                 .filter(|k| !k.is_empty())
                 .ok_or_else(|| {
                     ModelError::Message(
-                        "No Cerebras API key. Set CEREBRAS_API_KEY or OPENPLANTER_CEREBRAS_API_KEY.".into(),
+                        "No OpenRouter API key. Set OPENROUTER_API_KEY or OPENPLANTER_OPENROUTER_API_KEY.".into(),
                     )
                 })?;
-            Ok((cfg.cerebras_base_url.clone(), key.to_string()))
+            Ok((cfg.openrouter_base_url.clone(), key.to_string()))
         }
-        "zai" => {
+        "cerebras" => {
             let key = cfg
-                .zai_api_key
+                .cerebras_api_key
                 .as_deref()
                 .or(cfg.api_key.as_deref())
                 .filter(|k| !k.is_empty())
                 .ok_or_else(|| {
                     ModelError::Message(
-                        "No Z.AI API key. Set ZAI_API_KEY or OPENPLANTER_ZAI_API_KEY.".into(),
+                        "No Cerebras API key. Set CEREBRAS_API_KEY or OPENPLANTER_CEREBRAS_API_KEY.".into(),
                     )
                 })?;
-            Ok((cfg.zai_base_url.clone(), key.to_string()))
+            Ok((cfg.cerebras_base_url.clone(), key.to_string()))
         }
         "ollama" => {
             // Ollama doesn't need a real key — use a dummy
@@ -239,7 +212,7 @@ pub fn build_model(cfg: &AgentConfig) -> Result<Box<dyn BaseModel>, ModelError>
             api_key,
             cfg.reasoning_effort.clone(),
         ))),
-        "openai" | "openrouter" | "cerebras" | "zai" | "ollama" => {
+        _ => {
             // OpenAI-compatible: openai, openrouter, cerebras, ollama
             let mut extra_headers = HashMap::new();
             if provider == "openrouter" {
@@ -249,29 +222,15 @@ pub fn build_model(cfg: &AgentConfig) -> Result<Box<dyn BaseModel>, ModelError>
                 );
                 extra_headers.insert("X-Title".to_string(), "OpenPlanter".to_string());
             }
-            if provider == "zai" {
-                extra_headers.insert("Accept-Language".to_string(), "en-US,en".to_string());
-            }
-            let model = OpenAIModel::new(
+            Ok(Box::new(OpenAIModel::new(
                 model_name,
-                provider.clone(),
+                provider,
                 base_url,
                 api_key,
                 cfg.reasoning_effort.clone(),
                 extra_headers,
-            );
-            let model = if provider == "zai" {
-                model.with_zai_runtime(ZaiRuntimeConfig {
-                    paygo_base_url: cfg.zai_paygo_base_url.clone(),
-                    coding_base_url: cfg.zai_coding_base_url.clone(),
-                    stream_max_retries: cfg.zai_stream_max_retries.max(0) as usize,
-                })
-            } else {
-                model
-            };
-            Ok(Box::new(model))
+            )))
         }
-        _ => Err(ModelError::Message(format!("Unknown provider: {provider}"))),
     }
 }
 
@@ -285,10 +244,6 @@ mod tests {
             infer_provider_for_model("claude-opus-4-6"),
             Some("anthropic")
         );
-        assert_eq!(
-            infer_provider_for_model("anthropic-foundry/claude-opus-4-6"),
-            Some("anthropic")
-        );
         assert_eq!(
             infer_provider_for_model("claude-sonnet-4-5"),
             Some("anthropic")
@@ -302,10 +257,6 @@ mod tests {
     #[test]
     fn test_infer_openai() {
         assert_eq!(infer_provider_for_model("gpt-5.2"), Some("openai"));
-        assert_eq!(
-            infer_provider_for_model("azure-foundry/gpt-5.3-codex"),
-            Some("openai")
-        );
         assert_eq!(infer_provider_for_model("o1-preview"), Some("openai"));
         assert_eq!(infer_provider_for_model("o3"), Some("openai"));
         assert_eq!(infer_provider_for_model("chatgpt-4o"), Some("openai"));
@@ -331,12 +282,6 @@ mod tests {
         );
     }
 
-    #[test]
-    fn test_infer_zai() {
-        assert_eq!(infer_provider_for_model("glm-5"), Some("zai"));
-        assert_eq!(infer_provider_for_model("zai-glm-4.6"), Some("zai"));
-    }
-
     #[test]
     fn test_infer_ollama() {
         assert_eq!(infer_provider_for_model("llama3.2"), Some("ollama"));
@@ -352,7 +297,6 @@ mod tests {
         // qwen-3 → cerebras, qwen (no -3) → ollama
         assert_eq!(infer_provider_for_model("qwen-3"), Some("cerebras"));
         assert_eq!(infer_provider_for_model("qwen2"), Some("ollama"));
-        assert_eq!(infer_provider_for_model("zai-glm"), Some("zai"));
     }
 
     #[test]
@@ -382,14 +326,11 @@ mod tests {
     #[test]
     fn test_resolve_model_name_explicit() {
         let cfg = AgentConfig {
-            model: "azure-foundry/gpt-5.3-codex".into(),
+            model: "gpt-5.2".into(),
             provider: "openai".into(),
             ..Default::default()
         };
-        assert_eq!(
-            resolve_model_name(&cfg).unwrap(),
-            "azure-foundry/gpt-5.3-codex"
-        );
+        assert_eq!(resolve_model_name(&cfg).unwrap(), "gpt-5.2");
     }
 
     #[test]
@@ -399,10 +340,7 @@ mod tests {
             provider: "openai".into(),
             ..Default::default()
         };
-        assert_eq!(
-            resolve_model_name(&cfg).unwrap(),
-            "azure-foundry/gpt-5.3-codex"
-        );
+        assert_eq!(resolve_model_name(&cfg).unwrap(), "gpt-5.2");
     }
 
     // ── resolve_provider ──
@@ -420,7 +358,7 @@ mod tests {
     fn test_resolve_provider_auto_infers_from_model() {
         let cfg = AgentConfig {
             provider: "auto".into(),
-            model: "anthropic-foundry/claude-opus-4-6".into(),
+            model: "claude-opus-4-6".into(),
             ..Default::default()
         };
         assert_eq!(resolve_provider(&cfg).unwrap(), "anthropic");
@@ -428,40 +366,24 @@ mod tests {
 
     #[test]
     fn test_resolve_provider_auto_falls_back_to_key() {
-        let cfg = AgentConfig {
-            provider: "auto".into(),
-            model: "some-unknown-model".into(),
-            zai_api_key: Some("zai-test".into()),
-            openai_api_key: None,
-            anthropic_api_key: None,
-            openrouter_api_key: None,
-            cerebras_api_key: None,
-            ..Default::default()
-        };
-        assert_eq!(resolve_provider(&cfg).unwrap(), "zai");
-    }
-
-    #[test]
-    fn test_resolve_provider_auto_falls_back_to_openai_before_zai() {
         let cfg = AgentConfig {
             provider: "auto".into(),
             model: "some-unknown-model".into(),
             openai_api_key: Some("sk-test".into()),
-            anthropic_api_key: None,
-            zai_api_key: Some("zai-test".into()),
             ..Default::default()
         };
+        // anthropic checked first but no key, openai has key
         assert_eq!(resolve_provider(&cfg).unwrap(), "openai");
     }
 
     #[test]
-    fn test_resolve_provider_auto_no_keys_defaults_to_foundry_anthropic() {
+    fn test_resolve_provider_auto_no_keys_defaults_ollama() {
         let cfg = AgentConfig {
             provider: "auto".into(),
             model: "some-unknown-model".into(),
             ..Default::default()
         };
-        assert_eq!(resolve_provider(&cfg).unwrap(), "anthropic");
+        assert_eq!(resolve_provider(&cfg).unwrap(), "ollama");
     }
 
     #[test]
@@ -485,7 +407,7 @@ mod tests {
             ..Default::default()
         };
         let (url, key) = resolve_endpoint(&cfg, "anthropic").unwrap();
-        assert_eq!(url, crate::config::FOUNDRY_ANTHROPIC_BASE_URL);
+        assert_eq!(url, "https://api.anthropic.com/v1");
         assert_eq!(key, "sk-ant-key");
     }
 
@@ -493,8 +415,6 @@ mod tests {
     fn test_resolve_endpoint_anthropic_fallback_to_api_key() {
         let cfg = AgentConfig {
             api_key: Some("fallback-key".into()),
-            anthropic_api_key: None,
-            anthropic_base_url: "https://api.anthropic.com/v1".into(),
             ..Default::default()
         };
         let (_, key) = resolve_endpoint(&cfg, "anthropic").unwrap();
@@ -503,20 +423,10 @@ mod tests {
 
     #[test]
     fn test_resolve_endpoint_anthropic_missing_key() {
-        let cfg = AgentConfig {
-            anthropic_api_key: None,
-            api_key: None,
-            anthropic_base_url: "https://api.anthropic.com/v1".into(),
-            ..Default::default()
-        };
+        let cfg = AgentConfig::default();
         let result = resolve_endpoint(&cfg, "anthropic");
         assert!(result.is_err());
-        assert!(
-            result
-                .unwrap_err()
-                .to_string()
-                .contains("Anthropic API key")
-        );
+        assert!(result.unwrap_err().to_string().contains("Anthropic API key"));
     }
 
     #[test]
@@ -526,21 +436,10 @@ mod tests {
             ..Default::default()
         };
         let (url, key) = resolve_endpoint(&cfg, "openai").unwrap();
-        assert_eq!(url, crate::config::FOUNDRY_OPENAI_BASE_URL);
+        assert_eq!(url, "https://api.openai.com/v1");
         assert_eq!(key, "sk-openai");
     }
 
-    #[test]
-    fn test_resolve_endpoint_zai() {
-        let cfg = AgentConfig {
-            zai_api_key: Some("zai-key".into()),
-            ..Default::default()
-        };
-        let (url, key) = resolve_endpoint(&cfg, "zai").unwrap();
-        assert_eq!(url, "https://api.z.ai/api/paas/v4");
-        assert_eq!(key, "zai-key");
-    }
-
     #[test]
     fn test_resolve_endpoint_ollama_dummy_key() {
         let cfg = AgentConfig::default();
@@ -585,19 +484,6 @@ mod tests {
         assert_eq!(model.provider_name(), "openai");
     }
 
-    #[test]
-    fn test_build_model_zai() {
-        let cfg = AgentConfig {
-            provider: "zai".into(),
-            model: "glm-5".into(),
-            zai_api_key: Some("zai-key".into()),
-            ..Default::default()
-        };
-        let model = build_model(&cfg).unwrap();
-        assert_eq!(model.model_name(), "glm-5");
-        assert_eq!(model.provider_name(), "zai");
-    }
-
     #[test]
     fn test_build_model_ollama_no_key_needed() {
         let cfg = AgentConfig {
@@ -628,9 +514,7 @@ mod tests {
         let cfg = AgentConfig {
             provider: "openai".into(),
             model: "gpt-4o".into(),
-            openai_base_url: "https://api.openai.com/v1".into(),
-            openai_api_key: None,
-            api_key: None,
+            // No key set
             ..Default::default()
         };
         let result = build_model(&cfg);
@@ -651,10 +535,7 @@ mod tests {
             Err(e) => e.to_string(),
             Ok(_) => panic!("expected error"),
         };
-        assert!(
-            err_msg.contains("openai"),
-            "error should mention openai: {err_msg}"
-        );
+        assert!(err_msg.contains("openai"), "error should mention openai: {err_msg}");
     }
 
     #[test]
diff --git a/openplanter-desktop/crates/op-core/src/model/mod.rs b/openplanter-desktop/crates/op-core/src/model/mod.rs
index 2ec516ce..4f2781ec 100644
--- a/openplanter-desktop/crates/op-core/src/model/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/model/mod.rs
@@ -1,6 +1,6 @@
-pub mod anthropic;
 /// Model abstraction layer — trait + provider implementations.
 pub mod openai;
+pub mod anthropic;
 pub mod sse;
 
 use serde::{Deserialize, Serialize};
@@ -8,17 +8,6 @@ use serde::{Deserialize, Serialize};
 use crate::events::DeltaEvent;
 use tokio_util::sync::CancellationToken;
 
-/// Structured model error for provider rate limiting.
-#[derive(Debug, Clone, thiserror::Error)]
-#[error("{message}")]
-pub struct RateLimitError {
-    pub message: String,
-    pub status_code: Option<u16>,
-    pub provider_code: Option<String>,
-    pub body: String,
-    pub retry_after_sec: Option<f64>,
-}
-
 /// A single tool call returned by the model.
 #[derive(Debug, Clone, Serialize, Deserialize)]
 pub struct ToolCall {
@@ -46,26 +35,16 @@ pub enum Message {
     #[serde(rename = "user")]
     User { content: String },
     #[serde(rename = "assistant")]
-    Assistant {
-        content: String,
-        tool_calls: Option<Vec<ToolCall>>,
-    },
+    Assistant { content: String, tool_calls: Option<Vec<ToolCall>> },
     #[serde(rename = "tool")]
-    Tool {
-        tool_call_id: String,
-        content: String,
-    },
+    Tool { tool_call_id: String, content: String },
 }
 
 /// Trait for LLM model implementations.
 #[async_trait::async_trait]
 pub trait BaseModel: Send + Sync {
     /// Send a conversation and return the model's turn.
-    async fn chat(
-        &self,
-        messages: &[Message],
-        tools: &[serde_json::Value],
-    ) -> anyhow::Result<ModelTurn>;
+    async fn chat(&self, messages: &[Message], tools: &[serde_json::Value]) -> anyhow::Result<ModelTurn>;
 
     /// Send a conversation with streaming deltas and cancellation support.
     async fn chat_stream(
diff --git a/openplanter-desktop/crates/op-core/src/settings.rs b/openplanter-desktop/crates/op-core/src/settings.rs
index de0688f6..69fcd320 100644
--- a/openplanter-desktop/crates/op-core/src/settings.rs
+++ b/openplanter-desktop/crates/op-core/src/settings.rs
@@ -4,8 +4,6 @@ use std::path::{Path, PathBuf};
 
 use serde::{Deserialize, Serialize};
 
-use crate::config::{normalize_web_search_provider, normalize_zai_plan};
-
 const VALID_REASONING_EFFORTS: &[&str] = &["low", "medium", "high"];
 
 /// Normalize and validate a reasoning effort value.
@@ -40,10 +38,7 @@ pub struct PersistentSettings {
     pub default_model_anthropic: Option<String>,
     pub default_model_openrouter: Option<String>,
     pub default_model_cerebras: Option<String>,
-    pub default_model_zai: Option<String>,
     pub default_model_ollama: Option<String>,
-    pub zai_plan: Option<String>,
-    pub web_search_provider: Option<String>,
 }
 
 impl PersistentSettings {
@@ -54,7 +49,6 @@ impl PersistentSettings {
             "anthropic" => self.default_model_anthropic.as_deref(),
             "openrouter" => self.default_model_openrouter.as_deref(),
             "cerebras" => self.default_model_cerebras.as_deref(),
-            "zai" => self.default_model_zai.as_deref(),
             "ollama" => self.default_model_ollama.as_deref(),
             _ => None,
         };
@@ -73,16 +67,8 @@ impl PersistentSettings {
             .filter(|s| !s.is_empty())
             .map(String::from);
 
-        let effort = normalize_reasoning_effort(self.default_reasoning_effort.as_deref())?;
-
-        let web_search_provider = self
-            .web_search_provider
-            .as_deref()
-            .map(|value| normalize_web_search_provider(Some(value)));
-        let zai_plan = self
-            .zai_plan
-            .as_deref()
-            .map(|value| normalize_zai_plan(Some(value)));
+        let effort =
+            normalize_reasoning_effort(self.default_reasoning_effort.as_deref())?;
 
         fn trim_opt(v: &Option<String>) -> Option<String> {
             v.as_deref()
@@ -98,10 +84,7 @@ impl PersistentSettings {
             default_model_anthropic: trim_opt(&self.default_model_anthropic),
             default_model_openrouter: trim_opt(&self.default_model_openrouter),
             default_model_cerebras: trim_opt(&self.default_model_cerebras),
-            default_model_zai: trim_opt(&self.default_model_zai),
             default_model_ollama: trim_opt(&self.default_model_ollama),
-            zai_plan,
-            web_search_provider,
         })
     }
 
@@ -121,10 +104,7 @@ impl PersistentSettings {
         add!(default_model_anthropic, "default_model_anthropic");
         add!(default_model_openrouter, "default_model_openrouter");
         add!(default_model_cerebras, "default_model_cerebras");
-        add!(default_model_zai, "default_model_zai");
         add!(default_model_ollama, "default_model_ollama");
-        add!(zai_plan, "zai_plan");
-        add!(web_search_provider, "web_search_provider");
         payload
     }
 
@@ -149,10 +129,7 @@ impl PersistentSettings {
             default_model_anthropic: get_str(obj, "default_model_anthropic"),
             default_model_openrouter: get_str(obj, "default_model_openrouter"),
             default_model_cerebras: get_str(obj, "default_model_cerebras"),
-            default_model_zai: get_str(obj, "default_model_zai"),
             default_model_ollama: get_str(obj, "default_model_ollama"),
-            zai_plan: get_str(obj, "zai_plan"),
-            web_search_provider: get_str(obj, "web_search_provider"),
         };
         settings.normalized()
     }
@@ -188,9 +165,9 @@ impl SettingsStore {
     }
 
     pub fn save(&self, settings: &PersistentSettings) -> std::io::Result<()> {
-        let normalized = settings
-            .normalized()
-            .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidInput, e))?;
+        let normalized = settings.normalized().map_err(|e| {
+            std::io::Error::new(std::io::ErrorKind::InvalidInput, e)
+        })?;
         let json = serde_json::to_string_pretty(&normalized.to_json())
             .map_err(|e| std::io::Error::new(std::io::ErrorKind::Other, e))?;
         fs::write(&self.settings_path, json)
@@ -236,7 +213,6 @@ mod tests {
         let settings = PersistentSettings {
             default_model: Some("global-model".into()),
             default_model_openai: Some("gpt-5.2".into()),
-            default_model_zai: Some("glm-5".into()),
             ..Default::default()
         };
         assert_eq!(
@@ -247,7 +223,6 @@ mod tests {
             settings.default_model_for_provider("anthropic"),
             Some("global-model")
         );
-        assert_eq!(settings.default_model_for_provider("zai"), Some("glm-5"));
         assert_eq!(
             settings.default_model_for_provider("unknown"),
             Some("global-model")
@@ -261,18 +236,12 @@ mod tests {
         let settings = PersistentSettings {
             default_model: Some("gpt-5.2".into()),
             default_reasoning_effort: Some("high".into()),
-            default_model_zai: Some("glm-5".into()),
-            zai_plan: Some("coding".into()),
-            web_search_provider: Some("firecrawl".into()),
             ..Default::default()
         };
         store.save(&settings).unwrap();
         let loaded = store.load();
         assert_eq!(loaded.default_model, Some("gpt-5.2".into()));
         assert_eq!(loaded.default_reasoning_effort, Some("high".into()));
-        assert_eq!(loaded.default_model_zai, Some("glm-5".into()));
-        assert_eq!(loaded.zai_plan, Some("coding".into()));
-        assert_eq!(loaded.web_search_provider, Some("firecrawl".into()));
     }
 
     #[test]
@@ -301,9 +270,6 @@ mod tests {
             default_model: Some("gpt-5.2".into()),
             default_reasoning_effort: Some("high".into()),
             default_model_openai: Some("gpt-5.2".into()),
-            default_model_zai: Some("glm-5".into()),
-            zai_plan: Some("coding".into()),
-            web_search_provider: Some("firecrawl".into()),
             ..Default::default()
         };
         let json_val = serde_json::to_value(settings.to_json()).unwrap();
@@ -311,28 +277,5 @@ mod tests {
         assert_eq!(loaded.default_model, Some("gpt-5.2".into()));
         assert_eq!(loaded.default_reasoning_effort, Some("high".into()));
         assert_eq!(loaded.default_model_openai, Some("gpt-5.2".into()));
-        assert_eq!(loaded.default_model_zai, Some("glm-5".into()));
-        assert_eq!(loaded.zai_plan, Some("coding".into()));
-        assert_eq!(loaded.web_search_provider, Some("firecrawl".into()));
-    }
-
-    #[test]
-    fn test_web_search_provider_normalized() {
-        let settings = PersistentSettings {
-            web_search_provider: Some("unexpected".into()),
-            ..Default::default()
-        };
-        let normalized = settings.normalized().unwrap();
-        assert_eq!(normalized.web_search_provider, Some("exa".into()));
-    }
-
-    #[test]
-    fn test_zai_plan_normalized() {
-        let settings = PersistentSettings {
-            zai_plan: Some("unexpected".into()),
-            ..Default::default()
-        };
-        let normalized = settings.normalized().unwrap();
-        assert_eq!(normalized.zai_plan, Some("paygo".into()));
     }
 }
diff --git a/openplanter-desktop/crates/op-core/src/tools/defs.rs b/openplanter-desktop/crates/op-core/src/tools/defs.rs
index 88b268e5..9f630fcb 100644
--- a/openplanter-desktop/crates/op-core/src/tools/defs.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/defs.rs
@@ -2,7 +2,8 @@
 ///
 /// Single source of truth for tool schemas. Converter helpers produce the
 /// provider-specific shapes expected by OpenAI and Anthropic APIs.
-use serde_json::{Value, json};
+
+use serde_json::{json, Value};
 
 struct ToolDef {
     name: &'static str,
@@ -176,7 +177,7 @@ fn mvp_tool_defs() -> Vec<ToolDef> {
         // ── Web ──
         ToolDef {
             name: "web_search",
-            description: "Search the web using the configured Exa, Firecrawl, Brave, or Tavily backend. Returns URLs, titles, snippets, and optional page text.",
+            description: "Search the web using the Exa API. Returns URLs, titles, and optional page text.",
             parameters: json!({
                 "type": "object",
                 "properties": {
@@ -199,7 +200,7 @@ fn mvp_tool_defs() -> Vec<ToolDef> {
         },
         ToolDef {
             name: "fetch_url",
-            description: "Fetch and return the text content of one or more URLs using the configured Exa, Firecrawl, Brave, or Tavily backend.",
+            description: "Fetch and return the text content of one or more URLs.",
             parameters: json!({
                 "type": "object",
                 "properties": {
@@ -296,11 +297,7 @@ fn mvp_tool_defs() -> Vec<ToolDef> {
 /// For OpenAI strict mode: make all properties required, wrapping optional ones
 /// with `anyOf [original, null]`. Recurse into nested objects and array items.
 fn strict_fixup(schema: &mut Value) {
-    let Some(schema_type) = schema
-        .get("type")
-        .and_then(|t| t.as_str())
-        .map(String::from)
-    else {
+    let Some(schema_type) = schema.get("type").and_then(|t| t.as_str()).map(String::from) else {
         return;
     };
 
@@ -527,24 +524,17 @@ mod tests {
     fn test_strict_fixup_wraps_optional_with_anyof() {
         // list_files has only optional "glob" parameter
         let tools = to_openai_tools();
-        let list_files = tools
-            .iter()
-            .find(|t| t["function"]["name"] == "list_files")
-            .unwrap();
+        let list_files = tools.iter().find(|t| t["function"]["name"] == "list_files").unwrap();
         let glob_prop = &list_files["function"]["parameters"]["properties"]["glob"];
-        assert!(
-            glob_prop.get("anyOf").is_some(),
-            "Optional 'glob' should be wrapped with anyOf"
-        );
+        assert!(glob_prop.get("anyOf").is_some(), "Optional 'glob' should be wrapped with anyOf");
     }
 
     #[test]
     fn test_curator_tool_defs_openai() {
         let tools = build_curator_tool_defs("openai");
-        assert_eq!(tools.len(), 6, "curator should have exactly 6 tools");
+        assert_eq!(tools.len(), 8, "curator should have exactly 8 tools");
 
-        let names: Vec<String> = tools
-            .iter()
+        let names: Vec<String> = tools.iter()
             .map(|t| t["function"]["name"].as_str().unwrap().to_string())
             .collect();
 
@@ -555,8 +545,6 @@ mod tests {
         assert!(names.contains(&"list_files".to_string()));
         assert!(names.contains(&"search_files".to_string()));
         assert!(names.contains(&"think".to_string()));
-        assert!(!names.contains(&"apply_patch".to_string()));
-        assert!(!names.contains(&"hashline_edit".to_string()));
 
         // Should NOT include web, shell, or bg job tools
         assert!(!names.contains(&"web_search".to_string()));
@@ -570,7 +558,7 @@ mod tests {
     #[test]
     fn test_curator_tool_defs_anthropic() {
         let tools = build_curator_tool_defs("anthropic");
-        assert_eq!(tools.len(), 6);
+        assert_eq!(tools.len(), 8);
 
         // Anthropic format: flat with input_schema
         assert!(tools[0].get("input_schema").is_some());
diff --git a/openplanter-desktop/crates/op-core/src/tools/mod.rs b/openplanter-desktop/crates/op-core/src/tools/mod.rs
index 693eb00e..6781f4e2 100644
--- a/openplanter-desktop/crates/op-core/src/tools/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/mod.rs
@@ -2,16 +2,17 @@
 ///
 /// The `WorkspaceTools` struct is the central dispatcher that owns tool state
 /// (files-read set, background jobs) and routes tool calls to the appropriate module.
+
 pub mod defs;
 pub mod filesystem;
-pub mod patching;
 pub mod shell;
 pub mod web;
+pub mod patching;
 
 use std::collections::HashSet;
 use std::path::PathBuf;
 
-use crate::config::{AgentConfig, normalize_web_search_provider};
+use crate::config::AgentConfig;
 
 /// Result of executing a tool call.
 #[derive(Debug, Clone)]
@@ -36,16 +37,9 @@ impl ToolResult {
     }
 }
 
-#[derive(Debug, Clone)]
-enum ToolScope {
-    FullWorkspace,
-    CuratorWikiOnly { allowed_root: PathBuf },
-}
-
 /// Central dispatcher for workspace tools.
 pub struct WorkspaceTools {
     root: PathBuf,
-    scope: ToolScope,
     shell_path: String,
     command_timeout_sec: u64,
     max_shell_output_chars: usize,
@@ -53,33 +47,16 @@ pub struct WorkspaceTools {
     max_files_listed: usize,
     max_search_hits: usize,
     max_observation_chars: usize,
-    web_search_provider: String,
     exa_api_key: Option<String>,
     exa_base_url: String,
-    firecrawl_api_key: Option<String>,
-    firecrawl_base_url: String,
-    brave_api_key: Option<String>,
-    brave_base_url: String,
-    tavily_api_key: Option<String>,
-    tavily_base_url: String,
     files_read: HashSet<PathBuf>,
     bg_jobs: shell::BgJobs,
 }
 
-fn clip(text: &str, max_chars: usize) -> String {
-    if text.len() <= max_chars {
-        return text.to_string();
-    }
-    let end = text.floor_char_boundary(max_chars);
-    let omitted = text.len() - end;
-    format!("{}\n\n...[truncated {omitted} chars]...", &text[..end])
-}
-
 impl WorkspaceTools {
     pub fn new(config: &AgentConfig) -> Self {
         Self {
             root: config.workspace.clone(),
-            scope: ToolScope::FullWorkspace,
             shell_path: config.shell.clone(),
             command_timeout_sec: config.command_timeout_sec as u64,
             max_shell_output_chars: config.max_shell_output_chars as usize,
@@ -87,81 +64,24 @@ impl WorkspaceTools {
             max_files_listed: config.max_files_listed as usize,
             max_search_hits: config.max_search_hits as usize,
             max_observation_chars: config.max_observation_chars as usize,
-            web_search_provider: normalize_web_search_provider(Some(&config.web_search_provider)),
             exa_api_key: config.exa_api_key.clone(),
             exa_base_url: config.exa_base_url.clone(),
-            firecrawl_api_key: config.firecrawl_api_key.clone(),
-            firecrawl_base_url: config.firecrawl_base_url.clone(),
-            brave_api_key: config.brave_api_key.clone(),
-            brave_base_url: config.brave_base_url.clone(),
-            tavily_api_key: config.tavily_api_key.clone(),
-            tavily_base_url: config.tavily_base_url.clone(),
             files_read: HashSet::new(),
             bg_jobs: shell::BgJobs::new(),
         }
     }
 
-    pub fn new_curator(config: &AgentConfig) -> Self {
-        let allowed_root = filesystem::resolve_path(
-            &config.workspace,
-            &format!("{}/wiki", config.session_root_dir),
-        )
-        .unwrap_or_else(|_| config.workspace.join(&config.session_root_dir).join("wiki"));
-        Self {
-            root: config.workspace.clone(),
-            scope: ToolScope::CuratorWikiOnly { allowed_root },
-            shell_path: config.shell.clone(),
-            command_timeout_sec: config.command_timeout_sec as u64,
-            max_shell_output_chars: config.max_shell_output_chars as usize,
-            max_file_chars: config.max_file_chars as usize,
-            max_files_listed: config.max_files_listed as usize,
-            max_search_hits: config.max_search_hits as usize,
-            max_observation_chars: config.max_observation_chars as usize,
-            web_search_provider: normalize_web_search_provider(Some(&config.web_search_provider)),
-            exa_api_key: config.exa_api_key.clone(),
-            exa_base_url: config.exa_base_url.clone(),
-            firecrawl_api_key: config.firecrawl_api_key.clone(),
-            firecrawl_base_url: config.firecrawl_base_url.clone(),
-            brave_api_key: config.brave_api_key.clone(),
-            brave_base_url: config.brave_base_url.clone(),
-            tavily_api_key: config.tavily_api_key.clone(),
-            tavily_base_url: config.tavily_base_url.clone(),
-            files_read: HashSet::new(),
-            bg_jobs: shell::BgJobs::new(),
-        }
-    }
-
-    fn enforce_write_scope(&self, raw_path: &str) -> Result<(), ToolResult> {
-        match &self.scope {
-            ToolScope::FullWorkspace => Ok(()),
-            ToolScope::CuratorWikiOnly { allowed_root } => {
-                let resolved =
-                    filesystem::resolve_path(&self.root, raw_path).map_err(ToolResult::error)?;
-                if resolved == *allowed_root || resolved.starts_with(allowed_root) {
-                    Ok(())
-                } else {
-                    Err(ToolResult::error(
-                        "Curator writes are restricted to .openplanter/wiki/**".to_string(),
-                    ))
-                }
-            }
-        }
-    }
-
     /// Execute a tool by name with JSON arguments string.
     /// Returns the tool result, clipped to max_observation_chars.
     pub async fn execute(&mut self, name: &str, args_json: &str) -> ToolResult {
-        let args: serde_json::Value = serde_json::from_str(args_json)
-            .unwrap_or(serde_json::Value::Object(Default::default()));
+        let args: serde_json::Value =
+            serde_json::from_str(args_json).unwrap_or(serde_json::Value::Object(Default::default()));
 
         let result = match name {
             // Filesystem
             "read_file" => {
                 let path = args.get("path").and_then(|v| v.as_str()).unwrap_or("");
-                let hashline = args
-                    .get("hashline")
-                    .and_then(|v| v.as_bool())
-                    .unwrap_or(true);
+                let hashline = args.get("hashline").and_then(|v| v.as_bool()).unwrap_or(true);
                 filesystem::read_file(
                     &self.root,
                     path,
@@ -173,19 +93,19 @@ impl WorkspaceTools {
             "write_file" => {
                 let path = args.get("path").and_then(|v| v.as_str()).unwrap_or("");
                 let content = args.get("content").and_then(|v| v.as_str()).unwrap_or("");
-                if let Err(result) = self.enforce_write_scope(path) {
-                    return result;
-                }
                 filesystem::write_file(&self.root, path, content, &mut self.files_read)
             }
             "edit_file" => {
                 let path = args.get("path").and_then(|v| v.as_str()).unwrap_or("");
                 let old_text = args.get("old_text").and_then(|v| v.as_str()).unwrap_or("");
                 let new_text = args.get("new_text").and_then(|v| v.as_str()).unwrap_or("");
-                if let Err(result) = self.enforce_write_scope(path) {
-                    return result;
-                }
-                filesystem::edit_file(&self.root, path, old_text, new_text, &mut self.files_read)
+                filesystem::edit_file(
+                    &self.root,
+                    path,
+                    old_text,
+                    new_text,
+                    &mut self.files_read,
+                )
             }
             "list_files" => {
                 let glob = args.get("glob").and_then(|v| v.as_str());
@@ -225,7 +145,12 @@ impl WorkspaceTools {
             }
             "run_shell_bg" => {
                 let command = args.get("command").and_then(|v| v.as_str()).unwrap_or("");
-                shell::run_shell_bg(&self.root, &self.shell_path, command, &mut self.bg_jobs)
+                shell::run_shell_bg(
+                    &self.root,
+                    &self.shell_path,
+                    command,
+                    &mut self.bg_jobs,
+                )
             }
             "check_shell_bg" => {
                 let job_id = args.get("job_id").and_then(|v| v.as_u64()).unwrap_or(0) as u32;
@@ -239,24 +164,11 @@ impl WorkspaceTools {
             // Web
             "web_search" => {
                 let query = args.get("query").and_then(|v| v.as_str()).unwrap_or("");
-                let num_results = args
-                    .get("num_results")
-                    .and_then(|v| v.as_i64())
-                    .unwrap_or(10);
-                let include_text = args
-                    .get("include_text")
-                    .and_then(|v| v.as_bool())
-                    .unwrap_or(false);
+                let num_results = args.get("num_results").and_then(|v| v.as_i64()).unwrap_or(10);
+                let include_text = args.get("include_text").and_then(|v| v.as_bool()).unwrap_or(false);
                 web::web_search(
-                    &self.web_search_provider,
                     self.exa_api_key.as_deref(),
                     &self.exa_base_url,
-                    self.firecrawl_api_key.as_deref(),
-                    &self.firecrawl_base_url,
-                    self.brave_api_key.as_deref(),
-                    &self.brave_base_url,
-                    self.tavily_api_key.as_deref(),
-                    &self.tavily_base_url,
                     query,
                     num_results,
                     include_text,
@@ -276,15 +188,8 @@ impl WorkspaceTools {
                     })
                     .unwrap_or_default();
                 web::fetch_url(
-                    &self.web_search_provider,
                     self.exa_api_key.as_deref(),
                     &self.exa_base_url,
-                    self.firecrawl_api_key.as_deref(),
-                    &self.firecrawl_base_url,
-                    self.brave_api_key.as_deref(),
-                    &self.brave_base_url,
-                    self.tavily_api_key.as_deref(),
-                    &self.tavily_base_url,
                     &urls,
                     self.max_file_chars,
                     self.command_timeout_sec,
@@ -318,8 +223,12 @@ impl WorkspaceTools {
 
         // Clip observation to max_observation_chars
         if result.content.len() > self.max_observation_chars {
+            let omitted = result.content.len() - self.max_observation_chars;
             ToolResult {
-                content: clip(&result.content, self.max_observation_chars),
+                content: format!(
+                    "{}\n\n...[truncated {omitted} chars]...",
+                    &result.content[..self.max_observation_chars]
+                ),
                 is_error: result.is_error,
             }
         } else {
@@ -332,102 +241,3 @@ impl WorkspaceTools {
         self.bg_jobs.cleanup();
     }
 }
-
-#[cfg(test)]
-mod tests {
-    use super::*;
-    use tempfile::tempdir;
-
-    fn test_config(root: &std::path::Path) -> AgentConfig {
-        AgentConfig::from_env(root)
-    }
-
-    #[tokio::test]
-    async fn test_curator_scope_allows_wiki_writes() {
-        let tmp = tempdir().unwrap();
-        let cfg = test_config(tmp.path());
-        let mut tools = WorkspaceTools::new_curator(&cfg);
-
-        let result = tools
-            .execute(
-                "write_file",
-                r#"{"path":".openplanter/wiki/source.md","content":"hello"}"#,
-            )
-            .await;
-
-        assert!(!result.is_error, "unexpected error: {}", result.content);
-        assert_eq!(
-            std::fs::read_to_string(tmp.path().join(".openplanter/wiki/source.md")).unwrap(),
-            "hello"
-        );
-    }
-
-    #[tokio::test]
-    async fn test_curator_scope_rejects_non_wiki_writes() {
-        let tmp = tempdir().unwrap();
-        let cfg = test_config(tmp.path());
-        let mut tools = WorkspaceTools::new_curator(&cfg);
-
-        let result = tools
-            .execute("write_file", r#"{"path":"notes.md","content":"nope"}"#)
-            .await;
-
-        assert!(result.is_error);
-        assert!(result.content.contains(".openplanter/wiki"));
-        assert!(!tmp.path().join("notes.md").exists());
-    }
-
-    #[tokio::test]
-    async fn test_curator_scope_rejects_traversal() {
-        let tmp = tempdir().unwrap();
-        let cfg = test_config(tmp.path());
-        let mut tools = WorkspaceTools::new_curator(&cfg);
-
-        let result = tools
-            .execute(
-                "write_file",
-                r#"{"path":".openplanter/wiki/../../escape.md","content":"nope"}"#,
-            )
-            .await;
-
-        assert!(result.is_error);
-        assert!(!tmp.path().join("escape.md").exists());
-    }
-
-    #[tokio::test]
-    async fn test_full_workspace_scope_unchanged() {
-        let tmp = tempdir().unwrap();
-        let cfg = test_config(tmp.path());
-        let mut tools = WorkspaceTools::new(&cfg);
-
-        let result = tools
-            .execute("write_file", r#"{"path":"notes.md","content":"allowed"}"#)
-            .await;
-
-        assert!(!result.is_error, "unexpected error: {}", result.content);
-        assert_eq!(
-            std::fs::read_to_string(tmp.path().join("notes.md")).unwrap(),
-            "allowed"
-        );
-    }
-
-    #[tokio::test]
-    async fn test_execute_clips_observations_on_char_boundary() {
-        let tmp = tempdir().unwrap();
-        let mut cfg = test_config(tmp.path());
-        cfg.max_observation_chars = 6000;
-        let mut tools = WorkspaceTools::new(&cfg);
-
-        let mut content = "a".repeat(5999);
-        content.push('─');
-        std::fs::write(tmp.path().join("unicode.txt"), content).unwrap();
-
-        let result = tools
-            .execute("read_file", r#"{"path":"unicode.txt","hashline":false}"#)
-            .await;
-
-        assert!(!result.is_error, "unexpected error: {}", result.content);
-        assert!(result.content.contains("[truncated"));
-        assert!(std::str::from_utf8(result.content.as_bytes()).is_ok());
-    }
-}
diff --git a/openplanter-desktop/crates/op-core/src/tools/web.rs b/openplanter-desktop/crates/op-core/src/tools/web.rs
index eda00835..c9629e89 100644
--- a/openplanter-desktop/crates/op-core/src/tools/web.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/web.rs
@@ -1,281 +1,24 @@
-use std::sync::LazyLock;
-/// Web tools: Exa / Firecrawl / Brave / Tavily search and fetch_url.
-use std::time::Duration;
+/// Web tools: Exa search, fetch_url.
 
-use regex::Regex;
 use serde_json::json;
 
-use crate::config::normalize_web_search_provider;
-
 use super::ToolResult;
 
-static SCRIPT_RE: LazyLock<Regex> =
-    LazyLock::new(|| Regex::new(r"(?is)<script[^>]*>.*?</script>").unwrap());
-static STYLE_RE: LazyLock<Regex> =
-    LazyLock::new(|| Regex::new(r"(?is)<style[^>]*>.*?</style>").unwrap());
-static TITLE_RE: LazyLock<Regex> =
-    LazyLock::new(|| Regex::new(r"(?is)<title[^>]*>(.*?)</title>").unwrap());
-static BLOCK_TAG_RE: LazyLock<Regex> = LazyLock::new(|| {
-    Regex::new(r"(?is)</?(article|br|div|footer|h[1-6]|header|li|main|p|section|td|th|tr)[^>]*>")
-        .unwrap()
-});
-static TAG_RE: LazyLock<Regex> = LazyLock::new(|| Regex::new(r"(?is)<[^>]+>").unwrap());
-
 fn clip(text: &str, max_chars: usize) -> String {
     if text.len() <= max_chars {
         return text.to_string();
     }
     let end = text.floor_char_boundary(max_chars);
     let omitted = text.len() - end;
-    format!("{}\n\n...[truncated {omitted} chars]...", &text[..end])
-}
-
-fn collapse_ws(text: &str) -> String {
-    text.split_whitespace().collect::<Vec<_>>().join(" ")
-}
-
-fn decode_html_entities(text: &str) -> String {
-    text.replace("&nbsp;", " ")
-        .replace("&quot;", "\"")
-        .replace("&#39;", "'")
-        .replace("&#x27;", "'")
-        .replace("&lt;", "<")
-        .replace("&gt;", ">")
-        .replace("&amp;", "&")
-}
-
-fn extract_html_text(html: &str) -> (String, String) {
-    let title = TITLE_RE
-        .captures(html)
-        .and_then(|caps| caps.get(1))
-        .map(|m| collapse_ws(&decode_html_entities(m.as_str())))
-        .unwrap_or_default();
-    let without_scripts = SCRIPT_RE.replace_all(html, " ");
-    let without_styles = STYLE_RE.replace_all(&without_scripts, " ");
-    let with_breaks = BLOCK_TAG_RE.replace_all(&without_styles, "\n");
-    let plain = TAG_RE.replace_all(&with_breaks, " ");
-    let text = collapse_ws(&decode_html_entities(&plain));
-    (title, text)
-}
-
-async fn exa_request(
-    api_key: Option<&str>,
-    exa_base_url: &str,
-    endpoint: &str,
-    payload: &serde_json::Value,
-    timeout_sec: u64,
-) -> Result<serde_json::Value, String> {
-    let api_key = match api_key {
-        Some(value) if !value.trim().is_empty() => value,
-        _ => return Err("EXA_API_KEY not configured".into()),
-    };
-
-    let url = format!("{}{}", exa_base_url.trim_end_matches('/'), endpoint);
-    let client = reqwest::Client::new();
-    let response = client
-        .post(&url)
-        .header("x-api-key", api_key)
-        .header("Content-Type", "application/json")
-        .header("User-Agent", "exa-py 1.0.18")
-        .timeout(Duration::from_secs(timeout_sec))
-        .json(payload)
-        .send()
-        .await
-        .map_err(|e| format!("Exa API request failed: {e}"))?;
-
-    let response = response
-        .error_for_status()
-        .map_err(|e| format!("Exa API request failed: {e}"))?;
-
-    response
-        .json::<serde_json::Value>()
-        .await
-        .map_err(|e| format!("Exa API returned non-JSON payload: {e}"))
-}
-
-async fn firecrawl_request(
-    api_key: Option<&str>,
-    firecrawl_base_url: &str,
-    endpoint: &str,
-    payload: &serde_json::Value,
-    timeout_sec: u64,
-) -> Result<serde_json::Value, String> {
-    let api_key = match api_key {
-        Some(value) if !value.trim().is_empty() => value,
-        _ => return Err("FIRECRAWL_API_KEY not configured".into()),
-    };
-
-    let url = format!("{}{}", firecrawl_base_url.trim_end_matches('/'), endpoint);
-    let client = reqwest::Client::new();
-    let response = client
-        .post(&url)
-        .header("Authorization", format!("Bearer {api_key}"))
-        .header("Content-Type", "application/json")
-        .timeout(Duration::from_secs(timeout_sec))
-        .json(payload)
-        .send()
-        .await
-        .map_err(|e| format!("Firecrawl API request failed: {e}"))?;
-
-    let response = response
-        .error_for_status()
-        .map_err(|e| format!("Firecrawl API request failed: {e}"))?;
-
-    response
-        .json::<serde_json::Value>()
-        .await
-        .map_err(|e| format!("Firecrawl API returned non-JSON payload: {e}"))
-}
-
-async fn brave_request(
-    api_key: Option<&str>,
-    brave_base_url: &str,
-    endpoint: &str,
-    params: &[(&str, String)],
-    timeout_sec: u64,
-) -> Result<serde_json::Value, String> {
-    let api_key = match api_key {
-        Some(value) if !value.trim().is_empty() => value,
-        _ => return Err("BRAVE_API_KEY not configured".into()),
-    };
-
-    let url = format!("{}{}", brave_base_url.trim_end_matches('/'), endpoint);
-    let client = reqwest::Client::new();
-    let response = client
-        .get(&url)
-        .header("Accept", "application/json")
-        .header("X-Subscription-Token", api_key)
-        .query(params)
-        .timeout(Duration::from_secs(timeout_sec))
-        .send()
-        .await
-        .map_err(|e| format!("Brave API request failed: {e}"))?;
-
-    let response = response
-        .error_for_status()
-        .map_err(|e| format!("Brave API request failed: {e}"))?;
-
-    response
-        .json::<serde_json::Value>()
-        .await
-        .map_err(|e| format!("Brave API returned non-JSON payload: {e}"))
-}
-
-async fn tavily_request(
-    api_key: Option<&str>,
-    tavily_base_url: &str,
-    endpoint: &str,
-    payload: &serde_json::Value,
-    timeout_sec: u64,
-) -> Result<serde_json::Value, String> {
-    let api_key = match api_key {
-        Some(value) if !value.trim().is_empty() => value,
-        _ => return Err("TAVILY_API_KEY not configured".into()),
-    };
-
-    let url = format!("{}{}", tavily_base_url.trim_end_matches('/'), endpoint);
-    let client = reqwest::Client::new();
-    let response = client
-        .post(&url)
-        .header("Authorization", format!("Bearer {api_key}"))
-        .header("Content-Type", "application/json")
-        .timeout(Duration::from_secs(timeout_sec))
-        .json(payload)
-        .send()
-        .await
-        .map_err(|e| format!("Tavily API request failed: {e}"))?;
-
-    let response = response
-        .error_for_status()
-        .map_err(|e| format!("Tavily API request failed: {e}"))?;
-
-    response
-        .json::<serde_json::Value>()
-        .await
-        .map_err(|e| format!("Tavily API returned non-JSON payload: {e}"))
-}
-
-async fn fetch_direct_page(url: &str, timeout_sec: u64) -> serde_json::Value {
-    let client = reqwest::Client::new();
-    let response = match client
-        .get(url)
-        .header(
-            "Accept",
-            "text/html,application/xhtml+xml,application/json,text/plain;q=0.9,*/*;q=0.8",
-        )
-        .header("User-Agent", "OpenPlanter/1.0")
-        .timeout(Duration::from_secs(timeout_sec))
-        .send()
-        .await
-    {
-        Ok(response) => response,
-        Err(error) => {
-            return json!({
-                "url": url,
-                "title": "",
-                "text": format!("Direct fetch failed: {error}"),
-            });
-        }
-    };
-
-    let final_url = response.url().to_string();
-    let content_type = response
-        .headers()
-        .get(reqwest::header::CONTENT_TYPE)
-        .and_then(|value| value.to_str().ok())
-        .unwrap_or("")
-        .to_lowercase();
-
-    let response = match response.error_for_status() {
-        Ok(response) => response,
-        Err(error) => {
-            return json!({
-                "url": url,
-                "title": "",
-                "text": format!("Direct fetch failed: {error}"),
-            });
-        }
-    };
-
-    let body = match response.text().await {
-        Ok(body) => body,
-        Err(error) => {
-            return json!({
-                "url": final_url,
-                "title": "",
-                "text": format!("Direct fetch failed: {error}"),
-            });
-        }
-    };
-
-    let (title, extracted_text) = if content_type.contains("html") {
-        extract_html_text(&body)
-    } else {
-        (String::new(), body.clone())
-    };
-    let text = if extracted_text.is_empty() {
-        body
-    } else {
-        extracted_text
-    };
-
-    json!({
-        "url": final_url,
-        "title": title,
-        "text": clip(&text, 8_000),
-    })
+    format!(
+        "{}\n\n...[truncated {omitted} chars]...",
+        &text[..end]
+    )
 }
 
 pub async fn web_search(
-    provider: &str,
     exa_api_key: Option<&str>,
     exa_base_url: &str,
-    firecrawl_api_key: Option<&str>,
-    firecrawl_base_url: &str,
-    brave_api_key: Option<&str>,
-    brave_base_url: &str,
-    tavily_api_key: Option<&str>,
-    tavily_base_url: &str,
     query: &str,
     num_results: i64,
     include_text: bool,
@@ -287,264 +30,66 @@ pub async fn web_search(
         return ToolResult::error("web_search requires non-empty query".into());
     }
 
-    let provider = normalize_web_search_provider(Some(provider));
-    let clamped = num_results.clamp(1, 20);
-
-    let output = if provider == "firecrawl" {
-        let mut payload = json!({
-            "query": query,
-            "limit": clamped,
-        });
-        if include_text {
-            payload["scrapeOptions"] = json!({ "formats": ["markdown"] });
-        }
-
-        match firecrawl_request(
-            firecrawl_api_key,
-            firecrawl_base_url,
-            "/search",
-            &payload,
-            timeout_sec,
-        )
-        .await
-        {
-            Ok(body) => {
-                let mut rows: Vec<serde_json::Value> = Vec::new();
-                if let Some(items) = body.get("data").and_then(|value| value.as_array()) {
-                    rows.extend(items.iter().cloned());
-                } else if let Some(items) = body
-                    .get("data")
-                    .and_then(|value| value.get("web"))
-                    .and_then(|value| value.as_array())
-                {
-                    rows.extend(items.iter().cloned());
-                }
-
-                let mut results: Vec<serde_json::Value> = Vec::new();
-                for row in rows {
-                    let metadata = row.get("metadata").and_then(|value| value.as_object());
-                    let title = row
-                        .get("title")
-                        .and_then(|value| value.as_str())
-                        .filter(|value| !value.is_empty())
-                        .or_else(|| {
-                            metadata
-                                .and_then(|meta| meta.get("title"))
-                                .and_then(|value| value.as_str())
-                        })
-                        .unwrap_or("");
-
-                    let mut item = json!({
-                        "url": row.get("url").and_then(|value| value.as_str()).unwrap_or(""),
-                        "title": title,
-                        "snippet": row
-                            .get("description")
-                            .and_then(|value| value.as_str())
-                            .or_else(|| row.get("snippet").and_then(|value| value.as_str()))
-                            .unwrap_or(""),
-                    });
-
-                    if include_text {
-                        if let Some(text) = row
-                            .get("markdown")
-                            .and_then(|value| value.as_str())
-                            .or_else(|| row.get("text").and_then(|value| value.as_str()))
-                        {
-                            if !text.is_empty() {
-                                item["text"] = json!(clip(text, 4_000));
-                            }
-                        }
-                    }
-
-                    results.push(item);
-                }
-
-                json!({
-                    "query": query,
-                    "provider": provider,
-                    "results": results,
-                    "total": results.len(),
-                })
-            }
-            Err(error) => return ToolResult::error(format!("Web search failed: {error}")),
-        }
-    } else if provider == "brave" {
-        let mut params = vec![("q", query.to_string()), ("count", clamped.to_string())];
-        if include_text {
-            params.push(("extra_snippets", "true".to_string()));
-        }
-
-        match brave_request(
-            brave_api_key,
-            brave_base_url,
-            "/web/search",
-            &params,
-            timeout_sec,
-        )
-        .await
-        {
-            Ok(body) => {
-                let rows = body
-                    .get("web")
-                    .and_then(|value| value.get("results"))
-                    .and_then(|value| value.as_array())
-                    .or_else(|| body.get("results").and_then(|value| value.as_array()));
-                let mut results: Vec<serde_json::Value> = Vec::new();
-                if let Some(rows) = rows {
-                    for row in rows {
-                        let description = row
-                            .get("description")
-                            .and_then(|value| value.as_str())
-                            .or_else(|| row.get("snippet").and_then(|value| value.as_str()))
-                            .unwrap_or("")
-                            .to_string();
-                        let extra_texts = row
-                            .get("extra_snippets")
-                            .and_then(|value| value.as_array())
-                            .map(|items| {
-                                items
-                                    .iter()
-                                    .filter_map(|value| value.as_str())
-                                    .filter(|value| !value.is_empty())
-                                    .map(str::to_string)
-                                    .collect::<Vec<_>>()
-                            })
-                            .unwrap_or_default();
-                        let snippet = if !description.is_empty() {
-                            description.clone()
-                        } else {
-                            extra_texts.first().cloned().unwrap_or_default()
-                        };
+    let api_key = match exa_api_key {
+        Some(k) if !k.trim().is_empty() => k,
+        _ => return ToolResult::error("EXA_API_KEY not configured".into()),
+    };
 
-                        let mut item = json!({
-                            "url": row.get("url").and_then(|value| value.as_str()).unwrap_or(""),
-                            "title": row.get("title").and_then(|value| value.as_str()).unwrap_or(""),
-                            "snippet": snippet,
-                        });
-                        if include_text {
-                            let mut text_parts = Vec::new();
-                            if !description.is_empty() {
-                                text_parts.push(description.clone());
-                            }
-                            text_parts.extend(extra_texts.clone());
-                            if !text_parts.is_empty() {
-                                item["text"] = json!(clip(&text_parts.join("\n\n"), 4_000));
-                            }
-                        }
-                        results.push(item);
-                    }
-                }
+    let clamped = num_results.max(1).min(20);
+    let mut payload = json!({
+        "query": query,
+        "numResults": clamped,
+    });
+    if include_text {
+        payload["contents"] = json!({"text": {"maxCharacters": 4000}});
+    }
 
-                json!({
-                    "query": query,
-                    "provider": provider,
-                    "results": results,
-                    "total": results.len(),
-                })
-            }
-            Err(error) => return ToolResult::error(format!("Web search failed: {error}")),
-        }
-    } else if provider == "tavily" {
-        let mut payload = json!({
-            "query": query,
-            "max_results": clamped,
-        });
-        if include_text {
-            payload["include_raw_content"] = json!("markdown");
-        }
+    let url = format!("{}/search", exa_base_url.trim_end_matches('/'));
+    let client = reqwest::Client::new();
+    let response = client
+        .post(&url)
+        .header("x-api-key", api_key)
+        .header("Content-Type", "application/json")
+        .header("User-Agent", "exa-py 1.0.18")
+        .timeout(std::time::Duration::from_secs(timeout_sec))
+        .json(&payload)
+        .send()
+        .await;
 
-        match tavily_request(
-            tavily_api_key,
-            tavily_base_url,
-            "/search",
-            &payload,
-            timeout_sec,
-        )
-        .await
-        {
-            Ok(body) => {
-                let mut results: Vec<serde_json::Value> = Vec::new();
-                if let Some(rows) = body.get("results").and_then(|value| value.as_array()) {
-                    for row in rows {
-                        let snippet = row
-                            .get("content")
-                            .and_then(|value| value.as_str())
-                            .or_else(|| row.get("snippet").and_then(|value| value.as_str()))
-                            .unwrap_or("");
-                        let mut item = json!({
-                            "url": row.get("url").and_then(|value| value.as_str()).unwrap_or(""),
-                            "title": row.get("title").and_then(|value| value.as_str()).unwrap_or(""),
-                            "snippet": snippet,
-                        });
-                        if include_text {
-                            if let Some(text) = row
-                                .get("raw_content")
-                                .and_then(|value| value.as_str())
-                                .or_else(|| row.get("content").and_then(|value| value.as_str()))
-                            {
-                                if !text.is_empty() {
-                                    item["text"] = json!(clip(text, 4_000));
-                                }
-                            }
-                        }
-                        results.push(item);
-                    }
-                }
+    let resp = match response {
+        Ok(r) => r,
+        Err(e) => return ToolResult::error(format!("Web search failed: {e}")),
+    };
 
-                json!({
-                    "query": query,
-                    "provider": provider,
-                    "results": results,
-                    "total": results.len(),
-                })
-            }
-            Err(error) => return ToolResult::error(format!("Web search failed: {error}")),
-        }
-    } else {
-        let mut payload = json!({
-            "query": query,
-            "numResults": clamped,
-        });
-        if include_text {
-            payload["contents"] = json!({ "text": { "maxCharacters": 4_000 } });
-        }
+    let body: serde_json::Value = match resp.json().await {
+        Ok(b) => b,
+        Err(e) => return ToolResult::error(format!("Web search response parse error: {e}")),
+    };
 
-        match exa_request(exa_api_key, exa_base_url, "/search", &payload, timeout_sec).await {
-            Ok(body) => {
-                let mut results: Vec<serde_json::Value> = Vec::new();
-                if let Some(rows) = body.get("results").and_then(|value| value.as_array()) {
-                    for row in rows {
-                        let mut item = json!({
-                            "url": row.get("url").and_then(|value| value.as_str()).unwrap_or(""),
-                            "title": row.get("title").and_then(|value| value.as_str()).unwrap_or(""),
-                            "snippet": row
-                                .get("highlight")
-                                .and_then(|value| value.as_str())
-                                .or_else(|| row.get("snippet").and_then(|value| value.as_str()))
-                                .unwrap_or(""),
-                        });
-                        if include_text {
-                            if let Some(text) = row.get("text").and_then(|value| value.as_str()) {
-                                if !text.is_empty() {
-                                    item["text"] = json!(clip(text, 4_000));
-                                }
-                            }
-                        }
-                        results.push(item);
-                    }
+    let mut out_results: Vec<serde_json::Value> = Vec::new();
+    if let Some(results) = body.get("results").and_then(|r| r.as_array()) {
+        for row in results {
+            let mut item = json!({
+                "url": row.get("url").and_then(|u| u.as_str()).unwrap_or(""),
+                "title": row.get("title").and_then(|t| t.as_str()).unwrap_or(""),
+                "snippet": row.get("highlight").and_then(|h| h.as_str())
+                    .or_else(|| row.get("snippet").and_then(|s| s.as_str()))
+                    .unwrap_or(""),
+            });
+            if include_text {
+                if let Some(text) = row.get("text").and_then(|t| t.as_str()) {
+                    item["text"] = json!(clip(text, 4000));
                 }
-
-                json!({
-                    "query": query,
-                    "provider": provider,
-                    "results": results,
-                    "total": results.len(),
-                })
             }
-            Err(error) => return ToolResult::error(format!("Web search failed: {error}")),
+            out_results.push(item);
         }
-    };
+    }
 
+    let output = json!({
+        "query": query,
+        "results": out_results,
+        "total": out_results.len(),
+    });
     ToolResult::ok(clip(
         &serde_json::to_string_pretty(&output).unwrap_or_default(),
         max_file_chars,
@@ -552,656 +97,79 @@ pub async fn web_search(
 }
 
 pub async fn fetch_url(
-    provider: &str,
     exa_api_key: Option<&str>,
     exa_base_url: &str,
-    firecrawl_api_key: Option<&str>,
-    firecrawl_base_url: &str,
-    brave_api_key: Option<&str>,
-    brave_base_url: &str,
-    tavily_api_key: Option<&str>,
-    tavily_base_url: &str,
     urls: &[String],
     max_file_chars: usize,
     timeout_sec: u64,
 ) -> ToolResult {
-    let normalized: Vec<String> = urls
+    if urls.is_empty() {
+        return ToolResult::error("fetch_url requires at least one valid URL".into());
+    }
+
+    let api_key = match exa_api_key {
+        Some(k) if !k.trim().is_empty() => k,
+        _ => return ToolResult::error("EXA_API_KEY not configured".into()),
+    };
+
+    let normalized: Vec<&str> = urls
         .iter()
-        .map(|value| value.trim())
-        .filter(|value| !value.is_empty())
+        .map(|u| u.trim())
+        .filter(|u| !u.is_empty())
         .take(10)
-        .map(String::from)
         .collect();
 
     if normalized.is_empty() {
         return ToolResult::error("fetch_url requires at least one valid URL".into());
     }
 
-    let provider = normalize_web_search_provider(Some(provider));
-
-    let output = if provider == "firecrawl" {
-        let mut pages: Vec<serde_json::Value> = Vec::new();
-        for url in &normalized {
-            let payload = json!({
-                "url": url,
-                "formats": ["markdown"],
-            });
-            let body = match firecrawl_request(
-                firecrawl_api_key,
-                firecrawl_base_url,
-                "/scrape",
-                &payload,
-                timeout_sec,
-            )
-            .await
-            {
-                Ok(body) => body,
-                Err(error) => return ToolResult::error(format!("Fetch URL failed: {error}")),
-            };
-
-            if let Some(data) = body.get("data").and_then(|value| value.as_object()) {
-                let title = data
-                    .get("metadata")
-                    .and_then(|value| value.as_object())
-                    .and_then(|meta| meta.get("title"))
-                    .and_then(|value| value.as_str())
-                    .unwrap_or("");
-                let text = data
-                    .get("markdown")
-                    .and_then(|value| value.as_str())
-                    .or_else(|| data.get("text").and_then(|value| value.as_str()))
-                    .or_else(|| data.get("html").and_then(|value| value.as_str()))
-                    .unwrap_or("");
+    let payload = json!({
+        "ids": normalized,
+        "text": { "maxCharacters": 8000 },
+    });
 
-                pages.push(json!({
-                    "url": data.get("url").and_then(|value| value.as_str()).unwrap_or(url),
-                    "title": title,
-                    "text": clip(text, 8_000),
-                }));
-            }
-        }
-
-        json!({
-            "provider": provider,
-            "pages": pages,
-            "total": pages.len(),
-        })
-    } else if provider == "brave" {
-        let _ = brave_api_key;
-        let _ = brave_base_url;
-        let mut pages: Vec<serde_json::Value> = Vec::new();
-        for url in &normalized {
-            pages.push(fetch_direct_page(url, timeout_sec).await);
-        }
-
-        json!({
-            "provider": provider,
-            "pages": pages,
-            "total": pages.len(),
-        })
-    } else if provider == "tavily" {
-        let payload = json!({
-            "urls": normalized,
-            "extract_depth": "basic",
-            "include_images": false,
-        });
-
-        match tavily_request(
-            tavily_api_key,
-            tavily_base_url,
-            "/extract",
-            &payload,
-            timeout_sec,
-        )
-        .await
-        {
-            Ok(body) => {
-                let mut pages: Vec<serde_json::Value> = Vec::new();
-                if let Some(rows) = body.get("results").and_then(|value| value.as_array()) {
-                    for row in rows {
-                        pages.push(json!({
-                            "url": row.get("url").and_then(|value| value.as_str()).unwrap_or(""),
-                            "title": row.get("title").and_then(|value| value.as_str()).unwrap_or(""),
-                            "text": clip(
-                                row.get("raw_content")
-                                    .and_then(|value| value.as_str())
-                                    .or_else(|| row.get("content").and_then(|value| value.as_str()))
-                                    .unwrap_or(""),
-                                8_000,
-                            ),
-                        }));
-                    }
-                }
+    let url = format!("{}/contents", exa_base_url.trim_end_matches('/'));
+    let client = reqwest::Client::new();
+    let response = client
+        .post(&url)
+        .header("x-api-key", api_key)
+        .header("Content-Type", "application/json")
+        .header("User-Agent", "exa-py 1.0.18")
+        .timeout(std::time::Duration::from_secs(timeout_sec))
+        .json(&payload)
+        .send()
+        .await;
 
-                json!({
-                    "provider": provider,
-                    "pages": pages,
-                    "total": pages.len(),
-                })
-            }
-            Err(error) => return ToolResult::error(format!("Fetch URL failed: {error}")),
-        }
-    } else {
-        let payload = json!({
-            "ids": normalized,
-            "text": { "maxCharacters": 8_000 },
-        });
+    let resp = match response {
+        Ok(r) => r,
+        Err(e) => return ToolResult::error(format!("Fetch URL failed: {e}")),
+    };
 
-        match exa_request(
-            exa_api_key,
-            exa_base_url,
-            "/contents",
-            &payload,
-            timeout_sec,
-        )
-        .await
-        {
-            Ok(body) => {
-                let mut pages: Vec<serde_json::Value> = Vec::new();
-                if let Some(rows) = body.get("results").and_then(|value| value.as_array()) {
-                    for row in rows {
-                        pages.push(json!({
-                            "url": row.get("url").and_then(|value| value.as_str()).unwrap_or(""),
-                            "title": row.get("title").and_then(|value| value.as_str()).unwrap_or(""),
-                            "text": clip(
-                                row.get("text").and_then(|value| value.as_str()).unwrap_or(""),
-                                8_000,
-                            ),
-                        }));
-                    }
-                }
+    let body: serde_json::Value = match resp.json().await {
+        Ok(b) => b,
+        Err(e) => return ToolResult::error(format!("Fetch URL response parse error: {e}")),
+    };
 
-                json!({
-                    "provider": provider,
-                    "pages": pages,
-                    "total": pages.len(),
-                })
-            }
-            Err(error) => return ToolResult::error(format!("Fetch URL failed: {error}")),
+    let mut pages: Vec<serde_json::Value> = Vec::new();
+    if let Some(results) = body.get("results").and_then(|r| r.as_array()) {
+        for row in results {
+            pages.push(json!({
+                "url": row.get("url").and_then(|u| u.as_str()).unwrap_or(""),
+                "title": row.get("title").and_then(|t| t.as_str()).unwrap_or(""),
+                "text": clip(
+                    row.get("text").and_then(|t| t.as_str()).unwrap_or(""),
+                    8000,
+                ),
+            }));
         }
-    };
+    }
 
+    let output = json!({
+        "pages": pages,
+        "total": pages.len(),
+    });
     ToolResult::ok(clip(
         &serde_json::to_string_pretty(&output).unwrap_or_default(),
         max_file_chars,
     ))
 }
-
-#[cfg(test)]
-mod tests {
-    use axum::body::Body;
-    use axum::http::StatusCode;
-    use axum::response::Response;
-    use axum::routing::{get, post};
-    use axum::{Json, Router};
-    use serde_json::{Value, json};
-
-    use super::*;
-
-    async fn start_json_server(
-        path: &'static str,
-        response_payload: Value,
-    ) -> std::net::SocketAddr {
-        let app = Router::new().route(
-            path,
-            post(move || {
-                let response_payload = response_payload.clone();
-                async move { Json(response_payload) }
-            }),
-        );
-        let listener = tokio::net::TcpListener::bind("127.0.0.1:0").await.unwrap();
-        let addr = listener.local_addr().unwrap();
-        tokio::spawn(async move {
-            axum::serve(listener, app).await.unwrap();
-        });
-        addr
-    }
-
-    async fn start_json_get_server(
-        path: &'static str,
-        response_payload: Value,
-    ) -> std::net::SocketAddr {
-        let app = Router::new().route(
-            path,
-            get(move || {
-                let response_payload = response_payload.clone();
-                async move { Json(response_payload) }
-            }),
-        );
-        let listener = tokio::net::TcpListener::bind("127.0.0.1:0").await.unwrap();
-        let addr = listener.local_addr().unwrap();
-        tokio::spawn(async move {
-            axum::serve(listener, app).await.unwrap();
-        });
-        addr
-    }
-
-    async fn start_text_get_server(
-        path: &'static str,
-        body: &'static str,
-        content_type: &'static str,
-    ) -> std::net::SocketAddr {
-        let app = Router::new().route(
-            path,
-            get(move || async move {
-                Response::builder()
-                    .status(StatusCode::OK)
-                    .header("Content-Type", content_type)
-                    .body(Body::from(body))
-                    .unwrap()
-            }),
-        );
-        let listener = tokio::net::TcpListener::bind("127.0.0.1:0").await.unwrap();
-        let addr = listener.local_addr().unwrap();
-        tokio::spawn(async move {
-            axum::serve(listener, app).await.unwrap();
-        });
-        addr
-    }
-
-    async fn start_status_server(path: &'static str, status: StatusCode) -> std::net::SocketAddr {
-        let app = Router::new().route(
-            path,
-            post(move || async move {
-                Response::builder()
-                    .status(status)
-                    .body(Body::from("{\"error\":\"boom\"}"))
-                    .unwrap()
-            }),
-        );
-        let listener = tokio::net::TcpListener::bind("127.0.0.1:0").await.unwrap();
-        let addr = listener.local_addr().unwrap();
-        tokio::spawn(async move {
-            axum::serve(listener, app).await.unwrap();
-        });
-        addr
-    }
-
-    #[tokio::test]
-    async fn test_web_search_exa_output_shape() {
-        let addr = start_json_server(
-            "/search",
-            json!({
-                "results": [
-                    {
-                        "url": "https://example.com",
-                        "title": "Example",
-                        "highlight": "Snippet",
-                        "text": "Long page body"
-                    }
-                ]
-            }),
-        )
-        .await;
-
-        let result = web_search(
-            "exa",
-            Some("exa-key"),
-            &format!("http://{addr}"),
-            None,
-            "https://api.firecrawl.dev/v1",
-            None,
-            "https://api.search.brave.com/res/v1",
-            None,
-            "https://api.tavily.com",
-            "example query",
-            5,
-            true,
-            20_000,
-            5,
-        )
-        .await;
-
-        assert!(!result.is_error);
-        let parsed: Value = serde_json::from_str(&result.content).unwrap();
-        assert_eq!(parsed["provider"], "exa");
-        assert_eq!(parsed["query"], "example query");
-        assert_eq!(parsed["results"][0]["url"], "https://example.com");
-        assert_eq!(parsed["results"][0]["text"], "Long page body");
-    }
-
-    #[tokio::test]
-    async fn test_web_search_firecrawl_output_shape() {
-        let addr = start_json_server(
-            "/search",
-            json!({
-                "data": [
-                    {
-                        "url": "https://example.com/firecrawl",
-                        "description": "Firecrawl snippet",
-                        "markdown": "# Hello",
-                        "metadata": { "title": "Firecrawl Title" }
-                    }
-                ]
-            }),
-        )
-        .await;
-
-        let result = web_search(
-            "firecrawl",
-            None,
-            "https://api.exa.ai",
-            Some("fc-key"),
-            &format!("http://{addr}"),
-            None,
-            "https://api.search.brave.com/res/v1",
-            None,
-            "https://api.tavily.com",
-            "example query",
-            5,
-            true,
-            20_000,
-            5,
-        )
-        .await;
-
-        assert!(!result.is_error);
-        let parsed: Value = serde_json::from_str(&result.content).unwrap();
-        assert_eq!(parsed["provider"], "firecrawl");
-        assert_eq!(parsed["results"][0]["title"], "Firecrawl Title");
-        assert_eq!(parsed["results"][0]["text"], "# Hello");
-    }
-
-    #[tokio::test]
-    async fn test_fetch_url_firecrawl_output_shape() {
-        let addr = start_json_server(
-            "/scrape",
-            json!({
-                "data": {
-                    "url": "https://example.com/article",
-                    "markdown": "Article body",
-                    "metadata": { "title": "Article Title" }
-                }
-            }),
-        )
-        .await;
-
-        let result = fetch_url(
-            "firecrawl",
-            None,
-            "https://api.exa.ai",
-            Some("fc-key"),
-            &format!("http://{addr}"),
-            None,
-            "https://api.search.brave.com/res/v1",
-            None,
-            "https://api.tavily.com",
-            &[String::from("https://example.com/article")],
-            20_000,
-            5,
-        )
-        .await;
-
-        assert!(!result.is_error);
-        let parsed: Value = serde_json::from_str(&result.content).unwrap();
-        assert_eq!(parsed["provider"], "firecrawl");
-        assert_eq!(parsed["pages"][0]["title"], "Article Title");
-        assert_eq!(parsed["pages"][0]["text"], "Article body");
-    }
-
-    #[tokio::test]
-    async fn test_web_search_brave_output_shape() {
-        let addr = start_json_get_server(
-            "/web/search",
-            json!({
-                "web": {
-                    "results": [
-                        {
-                            "url": "https://example.com/brave",
-                            "title": "Brave Title",
-                            "description": "Brave snippet",
-                            "extra_snippets": ["Extra context"]
-                        }
-                    ]
-                }
-            }),
-        )
-        .await;
-
-        let result = web_search(
-            "brave",
-            None,
-            "https://api.exa.ai",
-            None,
-            "https://api.firecrawl.dev/v1",
-            Some("brave-key"),
-            &format!("http://{addr}"),
-            None,
-            "https://api.tavily.com",
-            "example query",
-            5,
-            true,
-            20_000,
-            5,
-        )
-        .await;
-
-        assert!(!result.is_error);
-        let parsed: Value = serde_json::from_str(&result.content).unwrap();
-        assert_eq!(parsed["provider"], "brave");
-        assert_eq!(parsed["results"][0]["title"], "Brave Title");
-        assert!(
-            parsed["results"][0]["text"]
-                .as_str()
-                .unwrap()
-                .contains("Extra context")
-        );
-    }
-
-    #[tokio::test]
-    async fn test_fetch_url_brave_output_shape() {
-        let addr = start_text_get_server(
-            "/page",
-            "<html><head><title>Brave Page</title></head><body><h1>Hello Brave</h1><p>Readable text.</p></body></html>",
-            "text/html; charset=utf-8",
-        )
-        .await;
-
-        let result = fetch_url(
-            "brave",
-            None,
-            "https://api.exa.ai",
-            None,
-            "https://api.firecrawl.dev/v1",
-            None,
-            "https://api.search.brave.com/res/v1",
-            None,
-            "https://api.tavily.com",
-            &[format!("http://{addr}/page")],
-            20_000,
-            5,
-        )
-        .await;
-
-        assert!(!result.is_error);
-        let parsed: Value = serde_json::from_str(&result.content).unwrap();
-        assert_eq!(parsed["provider"], "brave");
-        assert_eq!(parsed["pages"][0]["title"], "Brave Page");
-        assert!(
-            parsed["pages"][0]["text"]
-                .as_str()
-                .unwrap()
-                .contains("Hello Brave")
-        );
-    }
-
-    #[tokio::test]
-    async fn test_missing_firecrawl_key_errors() {
-        let result = web_search(
-            "firecrawl",
-            None,
-            "https://api.exa.ai",
-            None,
-            "https://api.firecrawl.dev/v1",
-            None,
-            "https://api.search.brave.com/res/v1",
-            None,
-            "https://api.tavily.com",
-            "example query",
-            5,
-            false,
-            20_000,
-            5,
-        )
-        .await;
-
-        assert!(result.is_error);
-        assert!(result.content.contains("FIRECRAWL_API_KEY"));
-    }
-
-    #[tokio::test]
-    async fn test_missing_brave_key_errors() {
-        let result = web_search(
-            "brave",
-            None,
-            "https://api.exa.ai",
-            None,
-            "https://api.firecrawl.dev/v1",
-            None,
-            "https://api.search.brave.com/res/v1",
-            None,
-            "https://api.tavily.com",
-            "example query",
-            5,
-            false,
-            20_000,
-            5,
-        )
-        .await;
-
-        assert!(result.is_error);
-        assert!(result.content.contains("BRAVE_API_KEY"));
-    }
-
-    #[tokio::test]
-    async fn test_web_search_tavily_output_shape() {
-        let addr = start_json_server(
-            "/search",
-            json!({
-                "results": [
-                    {
-                        "url": "https://example.com/tavily",
-                        "title": "Tavily Title",
-                        "content": "Tavily snippet",
-                        "raw_content": "Tavily raw content"
-                    }
-                ]
-            }),
-        )
-        .await;
-
-        let result = web_search(
-            "tavily",
-            None,
-            "https://api.exa.ai",
-            None,
-            "https://api.firecrawl.dev/v1",
-            None,
-            "https://api.search.brave.com/res/v1",
-            Some("tavily-key"),
-            &format!("http://{addr}"),
-            "example query",
-            5,
-            true,
-            20_000,
-            5,
-        )
-        .await;
-
-        assert!(!result.is_error);
-        let parsed: Value = serde_json::from_str(&result.content).unwrap();
-        assert_eq!(parsed["provider"], "tavily");
-        assert_eq!(parsed["results"][0]["title"], "Tavily Title");
-        assert_eq!(parsed["results"][0]["snippet"], "Tavily snippet");
-        assert_eq!(parsed["results"][0]["text"], "Tavily raw content");
-    }
-
-    #[tokio::test]
-    async fn test_fetch_url_tavily_output_shape() {
-        let addr = start_json_server(
-            "/extract",
-            json!({
-                "results": [
-                    {
-                        "url": "https://example.com/article",
-                        "title": "Tavily Article",
-                        "raw_content": "Article body"
-                    }
-                ]
-            }),
-        )
-        .await;
-
-        let result = fetch_url(
-            "tavily",
-            None,
-            "https://api.exa.ai",
-            None,
-            "https://api.firecrawl.dev/v1",
-            None,
-            "https://api.search.brave.com/res/v1",
-            Some("tavily-key"),
-            &format!("http://{addr}"),
-            &[String::from("https://example.com/article")],
-            20_000,
-            5,
-        )
-        .await;
-
-        assert!(!result.is_error);
-        let parsed: Value = serde_json::from_str(&result.content).unwrap();
-        assert_eq!(parsed["provider"], "tavily");
-        assert_eq!(parsed["pages"][0]["title"], "Tavily Article");
-        assert_eq!(parsed["pages"][0]["text"], "Article body");
-    }
-
-    #[tokio::test]
-    async fn test_missing_tavily_key_errors() {
-        let result = web_search(
-            "tavily",
-            None,
-            "https://api.exa.ai",
-            None,
-            "https://api.firecrawl.dev/v1",
-            None,
-            "https://api.search.brave.com/res/v1",
-            None,
-            "https://api.tavily.com",
-            "example query",
-            5,
-            false,
-            20_000,
-            5,
-        )
-        .await;
-
-        assert!(result.is_error);
-        assert!(result.content.contains("TAVILY_API_KEY"));
-    }
-
-    #[tokio::test]
-    async fn test_exa_http_error_bubbles_up() {
-        let addr = start_status_server("/search", StatusCode::BAD_GATEWAY).await;
-
-        let result = web_search(
-            "exa",
-            Some("exa-key"),
-            &format!("http://{addr}"),
-            None,
-            "https://api.firecrawl.dev/v1",
-            None,
-            "https://api.search.brave.com/res/v1",
-            None,
-            "https://api.tavily.com",
-            "example query",
-            5,
-            false,
-            20_000,
-            5,
-        )
-        .await;
-
-        assert!(result.is_error);
-        assert!(result.content.contains("Web search failed"));
-    }
-}
diff --git a/tests/test_coverage_gaps.py b/tests/test_coverage_gaps.py
index 72724b6b..22e4dfe7 100644
--- a/tests/test_coverage_gaps.py
+++ b/tests/test_coverage_gaps.py
@@ -69,18 +69,11 @@ def test_inner_quotes_preserved(self) -> None:
 class MergeMissingTests(unittest.TestCase):
     def test_fills_missing_keys(self) -> None:
         a = CredentialBundle(openai_api_key="oa")
-        b = CredentialBundle(
-            anthropic_api_key="an",
-            exa_api_key="exa",
-            brave_api_key="brave",
-            tavily_api_key="tavily",
-        )
+        b = CredentialBundle(anthropic_api_key="an", exa_api_key="exa")
         a.merge_missing(b)
         self.assertEqual(a.openai_api_key, "oa")
         self.assertEqual(a.anthropic_api_key, "an")
         self.assertEqual(a.exa_api_key, "exa")
-        self.assertEqual(a.brave_api_key, "brave")
-        self.assertEqual(a.tavily_api_key, "tavily")
 
     def test_does_not_overwrite_existing(self) -> None:
         a = CredentialBundle(openai_api_key="mine")
@@ -102,8 +95,6 @@ def test_merge_all_fields(self) -> None:
             openrouter_api_key="or",
             cerebras_api_key="cb",
             exa_api_key="exa",
-            brave_api_key="brave",
-            tavily_api_key="tavily",
         )
         a.merge_missing(b)
         self.assertEqual(a.openai_api_key, "oa")
@@ -111,8 +102,6 @@ def test_merge_all_fields(self) -> None:
         self.assertEqual(a.openrouter_api_key, "or")
         self.assertEqual(a.cerebras_api_key, "cb")
         self.assertEqual(a.exa_api_key, "exa")
-        self.assertEqual(a.brave_api_key, "brave")
-        self.assertEqual(a.tavily_api_key, "tavily")
 
 
 # ---------------------------------------------------------------------------
@@ -127,8 +116,6 @@ def test_reads_standard_env_vars(self) -> None:
             "ANTHROPIC_API_KEY": "an-key",
             "OPENROUTER_API_KEY": "or-key",
             "EXA_API_KEY": "exa-key",
-            "BRAVE_API_KEY": "brave-key",
-            "TAVILY_API_KEY": "tavily-key",
         }
         with patch.dict(os.environ, env, clear=True):
             creds = credentials_from_env()
@@ -136,8 +123,6 @@ def test_reads_standard_env_vars(self) -> None:
         self.assertEqual(creds.anthropic_api_key, "an-key")
         self.assertEqual(creds.openrouter_api_key, "or-key")
         self.assertEqual(creds.exa_api_key, "exa-key")
-        self.assertEqual(creds.brave_api_key, "brave-key")
-        self.assertEqual(creds.tavily_api_key, "tavily-key")
 
     def test_rlm_prefix_takes_priority(self) -> None:
         env = {
@@ -177,91 +162,29 @@ def test_defaults_from_clean_env(self) -> None:
         with patch.dict(os.environ, {}, clear=True):
             cfg = AgentConfig.from_env("/tmp/test-ws")
         self.assertEqual(cfg.provider, "auto")
-        self.assertEqual(cfg.model, "anthropic-foundry/claude-opus-4-6")
+        self.assertEqual(cfg.model, "claude-opus-4-6")
         self.assertEqual(cfg.reasoning_effort, "high")
         self.assertEqual(cfg.max_depth, 4)
         self.assertEqual(cfg.max_steps_per_call, 100)
-        self.assertTrue(cfg.budget_extension_enabled)
-        self.assertEqual(cfg.budget_extension_block_steps, 20)
-        self.assertEqual(cfg.budget_extension_max_blocks, 2)
         self.assertEqual(cfg.shell, "/bin/sh")
-        self.assertEqual(
-            cfg.openai_base_url,
-            "https://foundry-proxy.cheetah-koi.ts.net/openai/v1",
-        )
-        self.assertEqual(
-            cfg.anthropic_base_url,
-            "https://foundry-proxy.cheetah-koi.ts.net/anthropic/v1",
-        )
-        self.assertEqual(cfg.openai_api_key, "dont-worry-this-key-will-be-auto-injected")
-        self.assertEqual(cfg.anthropic_api_key, "dont-worry-it-will-be-injected")
 
     def test_custom_env_overrides(self) -> None:
         env = {
             "OPENPLANTER_PROVIDER": "anthropic",
-            "OPENPLANTER_MODEL": "anthropic-foundry/claude-opus-4-6",
+            "OPENPLANTER_MODEL": "claude-opus-4-6",
             "OPENPLANTER_REASONING_EFFORT": "low",
             "OPENPLANTER_MAX_DEPTH": "5",
             "OPENPLANTER_MAX_STEPS": "20",
-            "OPENPLANTER_BUDGET_EXTENSION_ENABLED": "false",
-            "OPENPLANTER_BUDGET_EXTENSION_BLOCK_STEPS": "7",
-            "OPENPLANTER_BUDGET_EXTENSION_MAX_BLOCKS": "1",
             "OPENPLANTER_SHELL": "/bin/bash",
-            "OPENPLANTER_WEB_SEARCH_PROVIDER": "tavily",
-            "OPENPLANTER_TAVILY_BASE_URL": "https://tavily.example",
         }
         with patch.dict(os.environ, env, clear=True):
             cfg = AgentConfig.from_env("/tmp/test-ws")
         self.assertEqual(cfg.provider, "anthropic")
-        self.assertEqual(cfg.model, "anthropic-foundry/claude-opus-4-6")
+        self.assertEqual(cfg.model, "claude-opus-4-6")
         self.assertEqual(cfg.reasoning_effort, "low")
         self.assertEqual(cfg.max_depth, 5)
         self.assertEqual(cfg.max_steps_per_call, 20)
-        self.assertFalse(cfg.budget_extension_enabled)
-        self.assertEqual(cfg.budget_extension_block_steps, 7)
-        self.assertEqual(cfg.budget_extension_max_blocks, 1)
         self.assertEqual(cfg.shell, "/bin/bash")
-        self.assertEqual(cfg.web_search_provider, "tavily")
-        self.assertEqual(cfg.tavily_base_url, "https://tavily.example")
-
-    def test_rate_limit_and_zai_stream_retries_from_env(self) -> None:
-        env = {
-            "OPENPLANTER_RATE_LIMIT_MAX_RETRIES": "7",
-            "OPENPLANTER_RATE_LIMIT_BACKOFF_BASE_SEC": "0.5",
-            "OPENPLANTER_RATE_LIMIT_BACKOFF_MAX_SEC": "10.0",
-            "OPENPLANTER_RATE_LIMIT_RETRY_AFTER_CAP_SEC": "30.0",
-            "OPENPLANTER_ZAI_STREAM_MAX_RETRIES": "8",
-        }
-        with patch.dict(os.environ, env, clear=True):
-            cfg = AgentConfig.from_env("/tmp/test-ws")
-        self.assertEqual(cfg.rate_limit_max_retries, 7)
-        self.assertEqual(cfg.rate_limit_backoff_base_sec, 0.5)
-        self.assertEqual(cfg.rate_limit_backoff_max_sec, 10.0)
-        self.assertEqual(cfg.rate_limit_retry_after_cap_sec, 30.0)
-        self.assertEqual(cfg.zai_stream_max_retries, 8)
-
-    def test_zai_plan_selects_endpoint(self) -> None:
-        env = {
-            "OPENPLANTER_ZAI_PLAN": "coding",
-            "OPENPLANTER_ZAI_PAYGO_BASE_URL": "https://paygo.example/v4",
-            "OPENPLANTER_ZAI_CODING_BASE_URL": "https://coding.example/v4",
-        }
-        with patch.dict(os.environ, env, clear=True):
-            cfg = AgentConfig.from_env("/tmp/test-ws")
-        self.assertEqual(cfg.zai_plan, "coding")
-        self.assertEqual(cfg.zai_base_url, "https://coding.example/v4")
-
-    def test_zai_base_url_override_wins_over_plan(self) -> None:
-        env = {
-            "OPENPLANTER_ZAI_PLAN": "paygo",
-            "OPENPLANTER_ZAI_BASE_URL": "https://override.example/v4",
-            "OPENPLANTER_ZAI_PAYGO_BASE_URL": "https://paygo.example/v4",
-            "OPENPLANTER_ZAI_CODING_BASE_URL": "https://coding.example/v4",
-        }
-        with patch.dict(os.environ, env, clear=True):
-            cfg = AgentConfig.from_env("/tmp/test-ws")
-        self.assertEqual(cfg.zai_plan, "paygo")
-        self.assertEqual(cfg.zai_base_url, "https://override.example/v4")
 
     def test_api_keys_from_env(self) -> None:
         env = {
@@ -269,8 +192,6 @@ def test_api_keys_from_env(self) -> None:
             "ANTHROPIC_API_KEY": "an",
             "OPENROUTER_API_KEY": "or",
             "EXA_API_KEY": "exa",
-            "BRAVE_API_KEY": "brave",
-            "TAVILY_API_KEY": "tavily",
         }
         with patch.dict(os.environ, env, clear=True):
             cfg = AgentConfig.from_env("/tmp/test-ws")
@@ -278,18 +199,6 @@ def test_api_keys_from_env(self) -> None:
         self.assertEqual(cfg.anthropic_api_key, "an")
         self.assertEqual(cfg.openrouter_api_key, "or")
         self.assertEqual(cfg.exa_api_key, "exa")
-        self.assertEqual(cfg.brave_api_key, "brave")
-        self.assertEqual(cfg.tavily_api_key, "tavily")
-
-    def test_foundry_placeholder_keys_disabled_for_public_endpoints(self) -> None:
-        env = {
-            "OPENPLANTER_OPENAI_BASE_URL": "https://api.openai.com/v1",
-            "OPENPLANTER_ANTHROPIC_BASE_URL": "https://api.anthropic.com/v1",
-        }
-        with patch.dict(os.environ, env, clear=True):
-            cfg = AgentConfig.from_env("/tmp/test-ws")
-        self.assertIsNone(cfg.openai_api_key)
-        self.assertIsNone(cfg.anthropic_api_key)
 
     def test_workspace_resolved(self) -> None:
         with patch.dict(os.environ, {}, clear=True):
@@ -365,25 +274,19 @@ def test_explicit_model_returned(self) -> None:
 
     def test_empty_model_uses_provider_default(self) -> None:
         cfg = AgentConfig(workspace=Path("/tmp"), provider="openai", model="")
-        self.assertEqual(_resolve_model_name(cfg), "azure-foundry/gpt-5.3-codex")
+        self.assertEqual(_resolve_model_name(cfg), "gpt-5.2")
 
     def test_empty_model_anthropic_default(self) -> None:
         cfg = AgentConfig(workspace=Path("/tmp"), provider="anthropic", model="")
-        self.assertEqual(_resolve_model_name(cfg), "anthropic-foundry/claude-opus-4-6")
+        self.assertEqual(_resolve_model_name(cfg), "claude-opus-4-6")
 
     def test_unknown_provider_fallback(self) -> None:
         cfg = AgentConfig(workspace=Path("/tmp"), provider="custom", model="")
         result = _resolve_model_name(cfg)
-        self.assertEqual(result, "anthropic-foundry/claude-opus-4-6")
+        self.assertEqual(result, "claude-opus-4-6")
 
     def test_newest_without_key_raises(self) -> None:
-        cfg = AgentConfig(
-            workspace=Path("/tmp"),
-            provider="openai",
-            model="newest",
-            openai_base_url="https://api.openai.com/v1",
-            openai_api_key=None,
-        )
+        cfg = AgentConfig(workspace=Path("/tmp"), provider="openai", model="newest")
         with self.assertRaises(ModelError):
             _resolve_model_name(cfg)
 
@@ -399,7 +302,7 @@ def test_openai_provider_with_key(self) -> None:
             cfg = AgentConfig(
                 workspace=Path(tmpdir),
                 provider="openai",
-                model="azure-foundry/gpt-5.3-codex",
+                model="gpt-5.2",
                 openai_api_key="test-key",
             )
             engine = build_engine(cfg)
@@ -410,7 +313,7 @@ def test_anthropic_provider_with_key(self) -> None:
             cfg = AgentConfig(
                 workspace=Path(tmpdir),
                 provider="anthropic",
-                model="anthropic-foundry/claude-opus-4-6",
+                model="claude-opus-4-6",
                 anthropic_api_key="test-key",
             )
             engine = build_engine(cfg)
@@ -421,10 +324,8 @@ def test_no_key_fallback_to_echo(self) -> None:
             cfg = AgentConfig(
                 workspace=Path(tmpdir),
                 provider="openai",
-                model="azure-foundry/gpt-5.3-codex",
-                openai_base_url="https://api.openai.com/v1",
-                openai_api_key=None,
-                )
+                model="gpt-5.2",
+            )
             engine = build_engine(cfg)
             self.assertIsInstance(engine.model, EchoFallbackModel)
 
@@ -439,33 +340,6 @@ def test_openrouter_provider_with_key(self) -> None:
             engine = build_engine(cfg)
             self.assertIsInstance(engine.model, OpenAICompatibleModel)
 
-    def test_zai_stream_retries_propagated(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            cfg = AgentConfig(
-                workspace=Path(tmpdir),
-                provider="zai",
-                model="glm-5",
-                zai_api_key="test-key",
-                zai_stream_max_retries=10,
-            )
-            engine = build_engine(cfg)
-            self.assertIsInstance(engine.model, OpenAICompatibleModel)
-            self.assertEqual(engine.model.stream_max_retries, 10)
-
-    def test_zai_coding_plan_sets_coding_endpoint(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            env = {
-                "OPENPLANTER_PROVIDER": "zai",
-                "OPENPLANTER_MODEL": "glm-5",
-                "OPENPLANTER_ZAI_PLAN": "coding",
-            }
-            with patch.dict(os.environ, env, clear=True):
-                cfg = AgentConfig.from_env(Path(tmpdir))
-            cfg.zai_api_key = "test-key"
-            engine = build_engine(cfg)
-            self.assertIsInstance(engine.model, OpenAICompatibleModel)
-            self.assertEqual(engine.model.base_url, cfg.zai_coding_base_url)
-
     def test_model_provider_mismatch_raises(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             cfg = AgentConfig(
diff --git a/tests/test_tools.py b/tests/test_tools.py
index c1fd374d..844722e0 100644
--- a/tests/test_tools.py
+++ b/tests/test_tools.py
@@ -77,7 +77,6 @@ def test_web_search_with_mocked_exa_response(self) -> None:
             with patch.object(WorkspaceTools, "_exa_request", return_value=mocked):
                 raw = tools.web_search("test query", num_results=3, include_text=True)
             parsed = json.loads(raw)
-            self.assertEqual(parsed["provider"], "exa")
             self.assertEqual(parsed["query"], "test query")
             self.assertEqual(parsed["total"], 1)
             self.assertEqual(parsed["results"][0]["url"], "https://example.com")
@@ -99,163 +98,10 @@ def test_fetch_url_with_mocked_exa_response(self) -> None:
             with patch.object(WorkspaceTools, "_exa_request", return_value=mocked):
                 raw = tools.fetch_url(["https://example.com"])
             parsed = json.loads(raw)
-            self.assertEqual(parsed["provider"], "exa")
             self.assertEqual(parsed["total"], 1)
             self.assertEqual(parsed["pages"][0]["url"], "https://example.com")
             self.assertEqual(parsed["pages"][0]["text"], "Page body")
 
-    def test_web_search_with_mocked_firecrawl_response(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            root = Path(tmpdir)
-            tools = WorkspaceTools(
-                root=root,
-                web_search_provider="firecrawl",
-                firecrawl_api_key="fc-key",
-            )
-            mocked = {
-                "data": [
-                    {
-                        "url": "https://example.com",
-                        "title": "Example",
-                        "description": "Snippet",
-                        "markdown": "Long text body",
-                    }
-                ]
-            }
-            with patch.object(WorkspaceTools, "_firecrawl_request", return_value=mocked):
-                raw = tools.web_search("test query", num_results=3, include_text=True)
-            parsed = json.loads(raw)
-            self.assertEqual(parsed["provider"], "firecrawl")
-            self.assertEqual(parsed["query"], "test query")
-            self.assertEqual(parsed["total"], 1)
-            self.assertEqual(parsed["results"][0]["url"], "https://example.com")
-            self.assertIn("text", parsed["results"][0])
-
-    def test_fetch_url_with_mocked_firecrawl_response(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            root = Path(tmpdir)
-            tools = WorkspaceTools(
-                root=root,
-                web_search_provider="firecrawl",
-                firecrawl_api_key="fc-key",
-            )
-            mocked = {
-                "data": {
-                    "url": "https://example.com",
-                    "metadata": {"title": "Example"},
-                    "markdown": "Page body",
-                }
-            }
-            with patch.object(WorkspaceTools, "_firecrawl_request", return_value=mocked):
-                raw = tools.fetch_url(["https://example.com"])
-            parsed = json.loads(raw)
-            self.assertEqual(parsed["provider"], "firecrawl")
-            self.assertEqual(parsed["total"], 1)
-            self.assertEqual(parsed["pages"][0]["url"], "https://example.com")
-            self.assertEqual(parsed["pages"][0]["text"], "Page body")
-
-    def test_web_search_with_mocked_brave_response(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            root = Path(tmpdir)
-            tools = WorkspaceTools(
-                root=root,
-                web_search_provider="brave",
-                brave_api_key="brave-key",
-            )
-            mocked = {
-                "web": {
-                    "results": [
-                        {
-                            "url": "https://example.com/brave",
-                            "title": "Brave Result",
-                            "description": "Snippet",
-                            "extra_snippets": ["Extra context"],
-                        }
-                    ]
-                }
-            }
-            with patch.object(WorkspaceTools, "_brave_request", return_value=mocked):
-                raw = tools.web_search("test query", num_results=3, include_text=True)
-            parsed = json.loads(raw)
-            self.assertEqual(parsed["provider"], "brave")
-            self.assertEqual(parsed["query"], "test query")
-            self.assertEqual(parsed["total"], 1)
-            self.assertEqual(parsed["results"][0]["url"], "https://example.com/brave")
-            self.assertIn("Extra context", parsed["results"][0]["text"])
-
-    def test_fetch_url_with_mocked_brave_response(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            root = Path(tmpdir)
-            tools = WorkspaceTools(
-                root=root,
-                web_search_provider="brave",
-            )
-            mocked = {
-                "url": "https://example.com/brave",
-                "title": "Brave Example",
-                "text": "Page body",
-            }
-            with patch.object(WorkspaceTools, "_fetch_url_direct", return_value=mocked):
-                raw = tools.fetch_url(["https://example.com/brave"])
-            parsed = json.loads(raw)
-            self.assertEqual(parsed["provider"], "brave")
-            self.assertEqual(parsed["total"], 1)
-            self.assertEqual(parsed["pages"][0]["title"], "Brave Example")
-            self.assertEqual(parsed["pages"][0]["text"], "Page body")
-
-    def test_web_search_with_mocked_tavily_response(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            root = Path(tmpdir)
-            tools = WorkspaceTools(
-                root=root,
-                web_search_provider="tavily",
-                tavily_api_key="tavily-key",
-            )
-            mocked = {
-                "results": [
-                    {
-                        "url": "https://example.com/tavily",
-                        "title": "Tavily Result",
-                        "content": "Snippet",
-                        "raw_content": "Long markdown body",
-                    }
-                ]
-            }
-            with patch.object(WorkspaceTools, "_tavily_request", return_value=mocked):
-                raw = tools.web_search("test query", num_results=3, include_text=True)
-            parsed = json.loads(raw)
-            self.assertEqual(parsed["provider"], "tavily")
-            self.assertEqual(parsed["query"], "test query")
-            self.assertEqual(parsed["total"], 1)
-            self.assertEqual(parsed["results"][0]["url"], "https://example.com/tavily")
-            self.assertEqual(parsed["results"][0]["snippet"], "Snippet")
-            self.assertEqual(parsed["results"][0]["text"], "Long markdown body")
-
-    def test_fetch_url_with_mocked_tavily_response(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            root = Path(tmpdir)
-            tools = WorkspaceTools(
-                root=root,
-                web_search_provider="tavily",
-                tavily_api_key="tavily-key",
-            )
-            mocked = {
-                "results": [
-                    {
-                        "url": "https://example.com/tavily",
-                        "title": "Tavily Example",
-                        "raw_content": "Page body",
-                    }
-                ]
-            }
-            with patch.object(WorkspaceTools, "_tavily_request", return_value=mocked):
-                raw = tools.fetch_url(["https://example.com/tavily"])
-            parsed = json.loads(raw)
-            self.assertEqual(parsed["provider"], "tavily")
-            self.assertEqual(parsed["total"], 1)
-            self.assertEqual(parsed["pages"][0]["title"], "Tavily Example")
-            self.assertEqual(parsed["pages"][0]["text"], "Page body")
-
     def test_web_search_without_exa_key(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)
@@ -263,27 +109,6 @@ def test_web_search_without_exa_key(self) -> None:
             out = tools.web_search("test")
             self.assertIn("EXA_API_KEY not configured", out)
 
-    def test_web_search_without_firecrawl_key(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            root = Path(tmpdir)
-            tools = WorkspaceTools(root=root, web_search_provider="firecrawl", firecrawl_api_key=None)
-            out = tools.web_search("test")
-            self.assertIn("FIRECRAWL_API_KEY not configured", out)
-
-    def test_web_search_without_brave_key(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            root = Path(tmpdir)
-            tools = WorkspaceTools(root=root, web_search_provider="brave", brave_api_key=None)
-            out = tools.web_search("test")
-            self.assertIn("BRAVE_API_KEY not configured", out)
-
-    def test_web_search_without_tavily_key(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            root = Path(tmpdir)
-            tools = WorkspaceTools(root=root, web_search_provider="tavily", tavily_api_key=None)
-            out = tools.web_search("test")
-            self.assertIn("TAVILY_API_KEY not configured", out)
-
     def test_repo_map_python_symbols(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
             root = Path(tmpdir)
diff --git a/tests/test_tools_complex.py b/tests/test_tools_complex.py
index bf1352ff..bfd85ddf 100644
--- a/tests/test_tools_complex.py
+++ b/tests/test_tools_complex.py
@@ -126,34 +126,6 @@ def test_web_search_clamps_num_results(self) -> None:
                 payload = mock_exa.call_args[0][1]
                 self.assertEqual(payload["numResults"], 20)
 
-    def test_web_search_clamps_num_results_firecrawl(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            tools = WorkspaceTools(
-                root=Path(tmpdir), web_search_provider="firecrawl", firecrawl_api_key="test-key"
-            )
-            mock_response = {"data": []}
-            with patch.object(
-                WorkspaceTools, "_firecrawl_request", return_value=mock_response
-            ) as mock_fc:
-                tools.web_search("test query", num_results=50)
-                mock_fc.assert_called_once()
-                payload = mock_fc.call_args[0][1]
-                self.assertEqual(payload["limit"], 20)
-
-    def test_web_search_clamps_num_results_brave(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            tools = WorkspaceTools(
-                root=Path(tmpdir), web_search_provider="brave", brave_api_key="test-key"
-            )
-            mock_response = {"web": {"results": []}}
-            with patch.object(
-                WorkspaceTools, "_brave_request", return_value=mock_response
-            ) as mock_brave:
-                tools.web_search("test query", num_results=50)
-                mock_brave.assert_called_once()
-                payload = mock_brave.call_args[0][1]
-                self.assertEqual(payload["count"], 20)
-
     # 12
     def test_fetch_url_non_list_returns_error(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:
@@ -192,20 +164,6 @@ def test_exa_request_no_key_raises(self) -> None:
                 tools._exa_request("/search", {"query": "test"})
             self.assertIn("EXA_API_KEY not configured", str(ctx.exception))
 
-    def test_firecrawl_request_no_key_raises(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            tools = WorkspaceTools(root=Path(tmpdir), firecrawl_api_key=None)
-            with self.assertRaises(ToolError) as ctx:
-                tools._firecrawl_request("/search", {"query": "test"})
-            self.assertIn("FIRECRAWL_API_KEY not configured", str(ctx.exception))
-
-    def test_brave_request_no_key_raises(self) -> None:
-        with tempfile.TemporaryDirectory() as tmpdir:
-            tools = WorkspaceTools(root=Path(tmpdir), brave_api_key=None)
-            with self.assertRaises(ToolError) as ctx:
-                tools._brave_request("/web/search", {"q": "test"})
-            self.assertIn("BRAVE_API_KEY not configured", str(ctx.exception))
-
     # 16
     def test_write_file_creates_nested_dirs(self) -> None:
         with tempfile.TemporaryDirectory() as tmpdir:

From da6c1a820e2198e7a8e3ebcb512ec11efbc8e41c Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 16:06:50 -0400
Subject: [PATCH 54/58] Remove provider-only status display from PR1 UI

---
 openplanter-desktop/frontend/src/components/App.ts | 4 +---
 openplanter-desktop/frontend/src/main.ts           | 4 ----
 2 files changed, 1 insertion(+), 7 deletions(-)

diff --git a/openplanter-desktop/frontend/src/components/App.ts b/openplanter-desktop/frontend/src/components/App.ts
index 3e8537d5..a2766096 100644
--- a/openplanter-desktop/frontend/src/components/App.ts
+++ b/openplanter-desktop/frontend/src/components/App.ts
@@ -67,8 +67,6 @@ export function createApp(root: HTMLElement): void {
     settingsDisplay.innerHTML = [
       `<div><span class="label">provider:</span> <span class="value">${s.provider || "auto"}</span></div>`,
       `<div><span class="label">model:</span> <span class="value">${s.model || "\u2014"}</span></div>`,
-      `<div><span class="label">z.ai plan:</span> <span class="value">${s.zaiPlan || "paygo"}</span></div>`,
-      `<div><span class="label">web search:</span> <span class="value">${s.webSearchProvider || "exa"}</span></div>`,
       `<div><span class="label">reasoning:</span> <span class="value">${s.reasoningEffort ?? "off"}</span></div>`,
       `<div><span class="label">mode:</span> <span class="value">${s.recursive ? "recursive" : "flat"}</span></div>`,
     ].join("");
@@ -308,7 +306,7 @@ async function loadCredentials(container: HTMLElement): Promise<void> {
   try {
     const status = await getCredentialsStatus();
     container.innerHTML = "";
-    const providers = ["openai", "anthropic", "openrouter", "cerebras", "zai", "ollama", "exa", "firecrawl", "brave", "tavily", "voyage"];
+    const providers = ["openai", "anthropic", "openrouter", "cerebras", "ollama", "exa"];
     for (const p of providers) {
       const row = document.createElement("div");
       const hasKey = status[p] ?? false;
diff --git a/openplanter-desktop/frontend/src/main.ts b/openplanter-desktop/frontend/src/main.ts
index e0d68bdf..193ba796 100644
--- a/openplanter-desktop/frontend/src/main.ts
+++ b/openplanter-desktop/frontend/src/main.ts
@@ -36,8 +36,6 @@ async function init() {
       ...s,
       provider: config.provider,
       model: config.model,
-      zaiPlan: config.zai_plan,
-      webSearchProvider: config.web_search_provider,
       sessionId: config.session_id,
       reasoningEffort: config.reasoning_effort,
       recursive: config.recursive,
@@ -69,8 +67,6 @@ async function init() {
         content: [
           `provider: ${provider || "auto"}`,
           `model: ${model || "—"}`,
-          `z.ai plan: ${state.zaiPlan || "paygo"}`,
-          `web search: ${state.webSearchProvider || "exa"}`,
           `reasoning: ${reasoningLabel}`,
           `mode: ${modeLabel}`,
           `workspace: ${state.workspace || "."}`,

From 57a98112622bbabfdb9af1893a2a1452a54151f4 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 16:07:36 -0400
Subject: [PATCH 55/58] Restore provider-only frontend command files on PR1

---
 .../frontend/src/api/invoke.test.ts           | 50 +++---------
 .../src/commands/completionRegistry.test.ts   | 23 ------
 .../src/commands/completionRegistry.ts        | 23 ------
 .../frontend/src/commands/reasoning.test.ts   |  8 --
 .../frontend/src/commands/reasoning.ts        |  6 +-
 .../frontend/src/commands/slash.test.ts       | 28 -------
 .../frontend/src/commands/slash.ts            | 19 -----
 .../frontend/src/commands/webSearch.test.ts   | 76 ------------------
 .../frontend/src/commands/webSearch.ts        | 58 --------------
 .../frontend/src/commands/zaiPlan.test.ts     | 79 -------------------
 .../frontend/src/commands/zaiPlan.ts          | 62 ---------------
 .../frontend/src/components/StatusBar.test.ts | 50 ------------
 .../frontend/src/components/StatusBar.ts      | 20 +----
 13 files changed, 12 insertions(+), 490 deletions(-)
 delete mode 100644 openplanter-desktop/frontend/src/commands/webSearch.test.ts
 delete mode 100644 openplanter-desktop/frontend/src/commands/webSearch.ts
 delete mode 100644 openplanter-desktop/frontend/src/commands/zaiPlan.test.ts
 delete mode 100644 openplanter-desktop/frontend/src/commands/zaiPlan.ts

diff --git a/openplanter-desktop/frontend/src/api/invoke.test.ts b/openplanter-desktop/frontend/src/api/invoke.test.ts
index a67ad6c1..7a8318d2 100644
--- a/openplanter-desktop/frontend/src/api/invoke.test.ts
+++ b/openplanter-desktop/frontend/src/api/invoke.test.ts
@@ -46,74 +46,54 @@ describe("invoke wrappers", () => {
   it("getConfig returns config", async () => {
     __setHandler("get_config", () => ({
       provider: "anthropic",
-      model: "anthropic-foundry/claude-opus-4-6",
-      zai_plan: "paygo",
+      model: "claude-opus-4-6",
       workspace: ".",
       session_id: null,
       recursive: true,
       max_depth: 4,
       max_steps_per_call: 100,
       reasoning_effort: "high",
-      web_search_provider: "exa",
       demo: false,
     }));
     const config = await getConfig();
     expect(config.provider).toBe("anthropic");
-    expect(config.model).toBe("anthropic-foundry/claude-opus-4-6");
-    expect(config.zai_plan).toBe("paygo");
-    expect(config.web_search_provider).toBe("exa");
+    expect(config.model).toBe("claude-opus-4-6");
   });
 
   it("updateConfig sends partial and returns config", async () => {
     __setHandler("update_config", ({ partial }: any) => {
-      expect(partial.model).toBe("azure-foundry/gpt-5.3-codex");
+      expect(partial.model).toBe("gpt-5.2");
       return {
         provider: "openai",
-        model: "azure-foundry/gpt-5.3-codex",
-        zai_plan: "coding",
+        model: "gpt-5.2",
         workspace: ".",
         session_id: null,
         recursive: true,
         max_depth: 4,
         max_steps_per_call: 100,
         reasoning_effort: null,
-        web_search_provider: "firecrawl",
         demo: false,
       };
     });
-    const config = await updateConfig({ model: "azure-foundry/gpt-5.3-codex" });
-    expect(config.model).toBe("azure-foundry/gpt-5.3-codex");
-    expect(config.zai_plan).toBe("coding");
-    expect(config.web_search_provider).toBe("firecrawl");
+    const config = await updateConfig({ model: "gpt-5.2" });
+    expect(config.model).toBe("gpt-5.2");
   });
 
   it("listModels sends provider filter", async () => {
     __setHandler("list_models", ({ provider }: any) => {
       expect(provider).toBe("openai");
-      return [
-        {
-          id: "azure-foundry/gpt-5.3-codex",
-          name: "GPT-5.3 Codex (Foundry)",
-          provider: "openai",
-        },
-      ];
+      return [{ id: "gpt-5.2", name: "GPT-5.2", provider: "openai" }];
     });
     const models = await listModels("openai");
     expect(models).toHaveLength(1);
-    expect(models[0].id).toBe("azure-foundry/gpt-5.3-codex");
+    expect(models[0].id).toBe("gpt-5.2");
   });
 
   it("saveSettings sends settings object", async () => {
     __setHandler("save_settings", ({ settings }: any) => {
-      expect(settings.default_model_zai).toBe("glm-5");
-      expect(settings.zai_plan).toBe("coding");
-      expect(settings.web_search_provider).toBe("firecrawl");
-    });
-    await saveSettings({
-      default_model_zai: "glm-5",
-      zai_plan: "coding",
-      web_search_provider: "firecrawl",
+      expect(settings.model).toBe("claude-opus-4-6");
     });
+    await saveSettings({ model: "claude-opus-4-6" } as any);
   });
 
   it("getCredentialsStatus returns provider map", async () => {
@@ -122,22 +102,12 @@ describe("invoke wrappers", () => {
       anthropic: true,
       openrouter: false,
       cerebras: false,
-      zai: true,
       ollama: true,
       exa: false,
-      firecrawl: true,
-      brave: false,
-      tavily: true,
-      voyage: true,
     }));
     const status = await getCredentialsStatus();
     expect(status.openai).toBe(true);
     expect(status.openrouter).toBe(false);
-    expect(status.zai).toBe(true);
-    expect(status.firecrawl).toBe(true);
-    expect(status.brave).toBe(false);
-    expect(status.tavily).toBe(true);
-    expect(status.voyage).toBe(true);
   });
 
   it("listSessions sends limit", async () => {
diff --git a/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts b/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
index 4ef78cf7..cd1e5a1d 100644
--- a/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
+++ b/openplanter-desktop/frontend/src/commands/completionRegistry.test.ts
@@ -23,8 +23,6 @@ describe("completionRegistry", () => {
     expect(values).toContain("/exit");
     expect(values).toContain("/status");
     expect(values).toContain("/model");
-    expect(values).toContain("/zai-plan");
-    expect(values).toContain("/web-search");
     expect(values).toContain("/reasoning");
   });
 
@@ -62,7 +60,6 @@ describe("completionRegistry", () => {
     expect(providerValues).toContain("openai");
     expect(providerValues).toContain("anthropic");
     expect(providerValues).toContain("ollama");
-    expect(providerValues).toContain("zai");
   });
 
   it("model alias children have --save flag", () => {
@@ -81,26 +78,6 @@ describe("completionRegistry", () => {
     expect(childValues).toEqual(["low", "medium", "high", "off"]);
   });
 
-  it("/web-search has exa, firecrawl, brave, and tavily children", () => {
-    const webSearchCmd = COMMAND_COMPLETIONS.find((c) => c.value === "/web-search");
-    expect(webSearchCmd).toBeDefined();
-    expect(webSearchCmd!.children).toBeDefined();
-
-    const childValues = webSearchCmd!.children!.map((c) => c.value);
-    expect(childValues).toEqual(["exa", "firecrawl", "brave", "tavily"]);
-    expect(webSearchCmd!.children![0].children?.[0].value).toBe("--save");
-  });
-
-  it("/zai-plan has paygo and coding children", () => {
-    const zaiPlanCmd = COMMAND_COMPLETIONS.find((c) => c.value === "/zai-plan");
-    expect(zaiPlanCmd).toBeDefined();
-    expect(zaiPlanCmd!.children).toBeDefined();
-
-    const childValues = zaiPlanCmd!.children!.map((c) => c.value);
-    expect(childValues).toEqual(["paygo", "coding"]);
-    expect(zaiPlanCmd!.children![0].children?.[0].value).toBe("--save");
-  });
-
   it("reasoning level children have --save flag", () => {
     const reasoningCmd = COMMAND_COMPLETIONS.find((c) => c.value === "/reasoning")!;
     for (const level of reasoningCmd.children!) {
diff --git a/openplanter-desktop/frontend/src/commands/completionRegistry.ts b/openplanter-desktop/frontend/src/commands/completionRegistry.ts
index 973dc00e..6318f4c1 100644
--- a/openplanter-desktop/frontend/src/commands/completionRegistry.ts
+++ b/openplanter-desktop/frontend/src/commands/completionRegistry.ts
@@ -13,7 +13,6 @@ const PROVIDER_FILTERS: CompletionItem[] = [
   { value: "anthropic", description: "Anthropic models" },
   { value: "ollama", description: "Local Ollama models" },
   { value: "cerebras", description: "Cerebras models" },
-  { value: "zai", description: "Z.AI models" },
   { value: "openrouter", description: "OpenRouter models" },
 ];
 
@@ -36,18 +35,6 @@ const REASONING_LEVELS: CompletionItem[] = [
   { value: "off", description: "Disable reasoning", children: SAVE_FLAG },
 ];
 
-const WEB_SEARCH_PROVIDERS: CompletionItem[] = [
-  { value: "exa", description: "Use Exa for web search", children: SAVE_FLAG },
-  { value: "firecrawl", description: "Use Firecrawl for web search", children: SAVE_FLAG },
-  { value: "brave", description: "Use Brave Search for web search", children: SAVE_FLAG },
-  { value: "tavily", description: "Use Tavily for web search", children: SAVE_FLAG },
-];
-
-const ZAI_PLANS: CompletionItem[] = [
-  { value: "paygo", description: "Use the Z.AI PAYGO endpoint", children: SAVE_FLAG },
-  { value: "coding", description: "Use the Z.AI Coding Plan endpoint", children: SAVE_FLAG },
-];
-
 export const COMMAND_COMPLETIONS: CompletionItem[] = [
   { value: "/help", description: "Show available commands" },
   { value: "/new", description: "Start a new session" },
@@ -63,16 +50,6 @@ export const COMMAND_COMPLETIONS: CompletionItem[] = [
       ...MODEL_ALIAS_ITEMS,
     ],
   },
-  {
-    value: "/zai-plan",
-    description: "Show or switch the Z.AI endpoint family",
-    children: ZAI_PLANS,
-  },
-  {
-    value: "/web-search",
-    description: "Show or switch the web search provider",
-    children: WEB_SEARCH_PROVIDERS,
-  },
   {
     value: "/reasoning",
     description: "Set reasoning effort",
diff --git a/openplanter-desktop/frontend/src/commands/reasoning.test.ts b/openplanter-desktop/frontend/src/commands/reasoning.test.ts
index 6df705f1..cfd5743f 100644
--- a/openplanter-desktop/frontend/src/commands/reasoning.test.ts
+++ b/openplanter-desktop/frontend/src/commands/reasoning.test.ts
@@ -38,7 +38,6 @@ describe("handleReasoningCommand", () => {
       return {
         provider: "anthropic",
         model: "claude-opus-4-6",
-        zai_plan: "paygo",
         reasoning_effort: "low",
         workspace: ".",
         session_id: null,
@@ -58,7 +57,6 @@ describe("handleReasoningCommand", () => {
     __setHandler("update_config", ({ partial }: any) => ({
       provider: "anthropic",
       model: "claude-opus-4-6",
-      zai_plan: "coding",
       reasoning_effort: "high",
       workspace: ".",
       session_id: null,
@@ -79,7 +77,6 @@ describe("handleReasoningCommand", () => {
       return {
         provider: "anthropic",
         model: "claude-opus-4-6",
-        zai_plan: "paygo",
         reasoning_effort: null,
         workspace: ".",
         session_id: null,
@@ -106,7 +103,6 @@ describe("handleReasoningCommand", () => {
       return {
         provider: "anthropic",
         model: "claude-opus-4-6",
-        zai_plan: "coding",
         reasoning_effort: "high",
         workspace: ".",
         session_id: null,
@@ -126,7 +122,6 @@ describe("handleReasoningCommand", () => {
     __setHandler("update_config", ({ partial }: any) => ({
       provider: "anthropic",
       model: "claude-opus-4-6",
-      zai_plan: "coding",
       reasoning_effort: "high",
       workspace: ".",
       session_id: null,
@@ -135,9 +130,6 @@ describe("handleReasoningCommand", () => {
       max_steps_per_call: 100,
       demo: false,
     }));
-    __setHandler("save_settings", ({ settings }: any) => {
-      expect(settings.default_reasoning_effort).toBe("high");
-    });
 
     const result = await handleReasoningCommand("high --save");
     expect(result.action).toBe("handled");
diff --git a/openplanter-desktop/frontend/src/commands/reasoning.ts b/openplanter-desktop/frontend/src/commands/reasoning.ts
index 22b568f9..1e2c1ad6 100644
--- a/openplanter-desktop/frontend/src/commands/reasoning.ts
+++ b/openplanter-desktop/frontend/src/commands/reasoning.ts
@@ -1,5 +1,5 @@
 /** /reasoning slash command handler. */
-import { saveSettings, updateConfig } from "../api/invoke";
+import { updateConfig } from "../api/invoke";
 import { appState } from "../state/store";
 import type { CommandResult } from "./model";
 
@@ -41,14 +41,10 @@ export async function handleReasoningCommand(args: string): Promise<CommandResul
     appState.update((s) => ({
       ...s,
       reasoningEffort: config.reasoning_effort,
-      zaiPlan: config.zai_plan,
     }));
 
     const lines = [`Reasoning effort set to: ${config.reasoning_effort ?? "off"}`];
     if (save) {
-      await saveSettings({
-        default_reasoning_effort: config.reasoning_effort,
-      });
       lines.push("(Settings saved)");
     }
 
diff --git a/openplanter-desktop/frontend/src/commands/slash.test.ts b/openplanter-desktop/frontend/src/commands/slash.test.ts
index e95062f4..495d0974 100644
--- a/openplanter-desktop/frontend/src/commands/slash.test.ts
+++ b/openplanter-desktop/frontend/src/commands/slash.test.ts
@@ -17,8 +17,6 @@ describe("dispatchSlashCommand", () => {
       ...originalState,
       provider: "anthropic",
       model: "claude-opus-4-6",
-      zaiPlan: "paygo",
-      webSearchProvider: "exa",
       sessionId: "20260101-120000-deadbeef",
       reasoningEffort: "medium",
     });
@@ -72,18 +70,6 @@ describe("dispatchSlashCommand", () => {
     expect(result!.lines.some((l) => l.includes("Session:"))).toBe(true);
   });
 
-  it("status shows web search provider", async () => {
-    const result = await dispatchSlashCommand("/status");
-    expect(result).not.toBeNull();
-    expect(result!.lines.some((l) => l.includes("Web search:"))).toBe(true);
-  });
-
-  it("status shows zai plan", async () => {
-    const result = await dispatchSlashCommand("/status");
-    expect(result).not.toBeNull();
-    expect(result!.lines.some((l) => l.includes("Z.AI plan:"))).toBe(true);
-  });
-
   it("unknown command", async () => {
     const result = await dispatchSlashCommand("/foobar");
     expect(result).not.toBeNull();
@@ -126,20 +112,6 @@ describe("dispatchSlashCommand", () => {
     ).toBe(true);
   });
 
-  it("web search dispatches", async () => {
-    const result = await dispatchSlashCommand("/web-search");
-    expect(result).not.toBeNull();
-    expect(result!.action).toBe("handled");
-    expect(result!.lines.some((l) => l.includes("Web search provider:"))).toBe(true);
-  });
-
-  it("zai plan dispatches", async () => {
-    const result = await dispatchSlashCommand("/zai-plan");
-    expect(result).not.toBeNull();
-    expect(result!.action).toBe("handled");
-    expect(result!.lines.some((l) => l.includes("Z.AI plan:"))).toBe(true);
-  });
-
   it("new creates session", async () => {
     __setHandler(
       "open_session",
diff --git a/openplanter-desktop/frontend/src/commands/slash.ts b/openplanter-desktop/frontend/src/commands/slash.ts
index fb5cb23d..1da7cb66 100644
--- a/openplanter-desktop/frontend/src/commands/slash.ts
+++ b/openplanter-desktop/frontend/src/commands/slash.ts
@@ -3,8 +3,6 @@ import { appState } from "../state/store";
 import { openSession } from "../api/invoke";
 import { handleModelCommand, type CommandResult } from "./model";
 import { handleReasoningCommand } from "./reasoning";
-import { handleWebSearchCommand } from "./webSearch";
-import { handleZaiPlanCommand } from "./zaiPlan";
 
 /** Dispatch a slash command. Returns null if not a slash command. */
 export async function dispatchSlashCommand(input: string): Promise<CommandResult | null> {
@@ -30,12 +28,6 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
           "  /model <name>       Switch model (auto-detects provider)",
           "  /model <name> --save  Switch and persist",
           "  /model list [provider]  List available models",
-          "  /zai-plan          Show current Z.AI endpoint family",
-          "  /zai-plan <plan>   Set Z.AI endpoint family (paygo, coding)",
-          "  /zai-plan <plan> --save  Set and persist",
-          "  /web-search        Show current web search provider",
-          "  /web-search <provider>  Set web search provider (exa, firecrawl, brave, tavily)",
-          "  /web-search <provider> --save  Set and persist",
           "  /reasoning          Show/set reasoning effort",
           "  /reasoning <level>  Set level (low, medium, high, off)",
         ],
@@ -52,9 +44,6 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
           outputTokens: 0,
           currentStep: 0,
           currentDepth: 0,
-          loopHealth: null,
-          lastLoopMetrics: null,
-          lastCompletion: null,
           inputQueue: [],
         }));
         window.dispatchEvent(new CustomEvent("session-changed", { detail: { isNew: true } }));
@@ -86,8 +75,6 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
         lines: [
           `Provider:    ${s.provider || "auto"}`,
           `Model:       ${s.model || "—"}`,
-          `Z.AI plan:   ${s.zaiPlan || "paygo"}`,
-          `Web search:  ${s.webSearchProvider || "exa"}`,
           `Reasoning:   ${s.reasoningEffort ?? "off"}`,
           `Mode:        ${s.recursive ? "recursive" : "flat"}`,
           `Max depth:   ${s.maxDepth}`,
@@ -104,12 +91,6 @@ export async function dispatchSlashCommand(input: string): Promise<CommandResult
     case "/model":
       return handleModelCommand(args);
 
-    case "/zai-plan":
-      return handleZaiPlanCommand(args);
-
-    case "/web-search":
-      return handleWebSearchCommand(args);
-
     case "/reasoning":
       return handleReasoningCommand(args);
 
diff --git a/openplanter-desktop/frontend/src/commands/webSearch.test.ts b/openplanter-desktop/frontend/src/commands/webSearch.test.ts
deleted file mode 100644
index 70d08e6d..00000000
--- a/openplanter-desktop/frontend/src/commands/webSearch.test.ts
+++ /dev/null
@@ -1,76 +0,0 @@
-import { vi, describe, it, expect, beforeEach, afterEach } from "vitest";
-import { __setHandler, __clearHandlers } from "../__mocks__/tauri";
-
-vi.mock("@tauri-apps/api/core", async () => {
-  const mock = await import("../__mocks__/tauri");
-  return { invoke: mock.invoke };
-});
-
-import { appState } from "../state/store";
-import { handleWebSearchCommand } from "./webSearch";
-
-describe("handleWebSearchCommand", () => {
-  const originalState = appState.get();
-
-  beforeEach(() => {
-    appState.set({
-      ...originalState,
-      webSearchProvider: "exa",
-    });
-  });
-
-  afterEach(() => {
-    __clearHandlers();
-    appState.set(originalState);
-  });
-
-  it("no args shows current provider", async () => {
-    const result = await handleWebSearchCommand("");
-    expect(result.lines).toContain("Web search provider: exa");
-  });
-
-  it("switches provider for the current session", async () => {
-    __setHandler("update_config", ({ partial }: { partial: Record<string, string> }) => {
-      expect(partial.web_search_provider).toBe("tavily");
-      return {
-        provider: "anthropic",
-        model: "claude-opus-4-6",
-        zai_plan: "paygo",
-        workspace: ".",
-        session_id: null,
-        recursive: true,
-        max_depth: 4,
-        max_steps_per_call: 100,
-        reasoning_effort: "high",
-        web_search_provider: "tavily",
-        demo: false,
-      };
-    });
-
-    const result = await handleWebSearchCommand("tavily");
-    expect(result.lines).toContain("Web search provider set to: tavily");
-    expect(appState.get().webSearchProvider).toBe("tavily");
-  });
-
-  it("save persists the selected provider", async () => {
-    __setHandler("update_config", () => ({
-      provider: "anthropic",
-      model: "claude-opus-4-6",
-      zai_plan: "coding",
-      workspace: ".",
-      session_id: null,
-      recursive: true,
-      max_depth: 4,
-      max_steps_per_call: 100,
-      reasoning_effort: "high",
-      web_search_provider: "tavily",
-      demo: false,
-    }));
-    __setHandler("save_settings", ({ settings }: { settings: Record<string, string> }) => {
-      expect(settings.web_search_provider).toBe("tavily");
-    });
-
-    const result = await handleWebSearchCommand("tavily --save");
-    expect(result.lines).toContain("(Settings saved)");
-  });
-});
diff --git a/openplanter-desktop/frontend/src/commands/webSearch.ts b/openplanter-desktop/frontend/src/commands/webSearch.ts
deleted file mode 100644
index 9db4fdf4..00000000
--- a/openplanter-desktop/frontend/src/commands/webSearch.ts
+++ /dev/null
@@ -1,58 +0,0 @@
-/** /web-search slash command handler. */
-import { saveSettings, updateConfig } from "../api/invoke";
-import { appState } from "../state/store";
-import type { CommandResult } from "./model";
-
-const VALID_WEB_SEARCH_PROVIDERS = ["exa", "firecrawl", "brave", "tavily"];
-
-/** Handle /web-search [provider] [--save]. */
-export async function handleWebSearchCommand(args: string): Promise<CommandResult> {
-  const parts = args.trim().split(/\s+/).filter(Boolean);
-  const requestedProvider = parts[0]?.toLowerCase() ?? "";
-  const save = parts.includes("--save");
-
-  if (!requestedProvider) {
-    const current = appState.get().webSearchProvider || "exa";
-    return {
-      action: "handled",
-      lines: [
-        `Web search provider: ${current}`,
-        `Valid providers: ${VALID_WEB_SEARCH_PROVIDERS.join(", ")}`,
-      ],
-    };
-  }
-
-  if (!VALID_WEB_SEARCH_PROVIDERS.includes(requestedProvider)) {
-    return {
-      action: "handled",
-      lines: [
-        `Invalid web search provider "${requestedProvider}". Expected: ${VALID_WEB_SEARCH_PROVIDERS.join(", ")}`,
-      ],
-    };
-  }
-
-  try {
-    const config = await updateConfig({
-      web_search_provider: requestedProvider,
-    });
-
-    appState.update((s) => ({
-      ...s,
-      zaiPlan: config.zai_plan,
-      webSearchProvider: config.web_search_provider,
-    }));
-
-    const lines = [`Web search provider set to: ${config.web_search_provider}`];
-    if (save) {
-      await saveSettings({ web_search_provider: config.web_search_provider });
-      lines.push("(Settings saved)");
-    }
-
-    return { action: "handled", lines };
-  } catch (e) {
-    return {
-      action: "handled",
-      lines: [`Failed to set web search provider: ${e}`],
-    };
-  }
-}
diff --git a/openplanter-desktop/frontend/src/commands/zaiPlan.test.ts b/openplanter-desktop/frontend/src/commands/zaiPlan.test.ts
deleted file mode 100644
index 2021900f..00000000
--- a/openplanter-desktop/frontend/src/commands/zaiPlan.test.ts
+++ /dev/null
@@ -1,79 +0,0 @@
-import { vi, describe, it, expect, beforeEach, afterEach } from "vitest";
-import { __setHandler, __clearHandlers } from "../__mocks__/tauri";
-
-vi.mock("@tauri-apps/api/core", async () => {
-  const mock = await import("../__mocks__/tauri");
-  return { invoke: mock.invoke };
-});
-
-import { appState } from "../state/store";
-import { handleZaiPlanCommand } from "./zaiPlan";
-
-describe("handleZaiPlanCommand", () => {
-  const originalState = appState.get();
-
-  beforeEach(() => {
-    appState.set({
-      ...originalState,
-      provider: "zai",
-      model: "glm-5",
-      zaiPlan: "paygo",
-    });
-  });
-
-  afterEach(() => {
-    __clearHandlers();
-    appState.set(originalState);
-  });
-
-  it("no args shows current plan", async () => {
-    const result = await handleZaiPlanCommand("");
-    expect(result.lines).toContain("Z.AI plan: paygo");
-  });
-
-  it("switches plan for the current session", async () => {
-    __setHandler("update_config", ({ partial }: { partial: Record<string, string> }) => {
-      expect(partial.zai_plan).toBe("coding");
-      return {
-        provider: "zai",
-        model: "glm-5",
-        zai_plan: "coding",
-        workspace: ".",
-        session_id: null,
-        recursive: true,
-        max_depth: 4,
-        max_steps_per_call: 100,
-        reasoning_effort: "high",
-        web_search_provider: "firecrawl",
-        demo: false,
-      };
-    });
-
-    const result = await handleZaiPlanCommand("coding");
-    expect(result.lines).toContain("Z.AI plan set to: coding");
-    expect(result.lines).toContain("Endpoint family: https://api.z.ai/api/coding/paas/v4");
-    expect(appState.get().zaiPlan).toBe("coding");
-  });
-
-  it("save persists the selected plan", async () => {
-    __setHandler("update_config", () => ({
-      provider: "zai",
-      model: "glm-5",
-      zai_plan: "paygo",
-      workspace: ".",
-      session_id: null,
-      recursive: true,
-      max_depth: 4,
-      max_steps_per_call: 100,
-      reasoning_effort: "high",
-      web_search_provider: "firecrawl",
-      demo: false,
-    }));
-    __setHandler("save_settings", ({ settings }: { settings: Record<string, string> }) => {
-      expect(settings.zai_plan).toBe("paygo");
-    });
-
-    const result = await handleZaiPlanCommand("paygo --save");
-    expect(result.lines).toContain("(Settings saved)");
-  });
-});
diff --git a/openplanter-desktop/frontend/src/commands/zaiPlan.ts b/openplanter-desktop/frontend/src/commands/zaiPlan.ts
deleted file mode 100644
index c29006c6..00000000
--- a/openplanter-desktop/frontend/src/commands/zaiPlan.ts
+++ /dev/null
@@ -1,62 +0,0 @@
-/** /zai-plan slash command handler. */
-import { saveSettings, updateConfig } from "../api/invoke";
-import { appState } from "../state/store";
-import type { CommandResult } from "./model";
-
-const VALID_ZAI_PLANS = ["paygo", "coding"];
-
-/** Handle /zai-plan [plan] [--save]. */
-export async function handleZaiPlanCommand(args: string): Promise<CommandResult> {
-  const parts = args.trim().split(/\s+/).filter(Boolean);
-  const requestedPlan = parts[0]?.toLowerCase() ?? "";
-  const save = parts.includes("--save");
-
-  if (!requestedPlan) {
-    const current = appState.get().zaiPlan || "paygo";
-    return {
-      action: "handled",
-      lines: [
-        `Z.AI plan: ${current}`,
-        `Valid plans: ${VALID_ZAI_PLANS.join(", ")}`,
-      ],
-    };
-  }
-
-  if (!VALID_ZAI_PLANS.includes(requestedPlan)) {
-    return {
-      action: "handled",
-      lines: [
-        `Invalid Z.AI plan "${requestedPlan}". Expected: ${VALID_ZAI_PLANS.join(", ")}`,
-      ],
-    };
-  }
-
-  try {
-    const config = await updateConfig({
-      zai_plan: requestedPlan,
-    });
-
-    appState.update((s) => ({
-      ...s,
-      zaiPlan: config.zai_plan,
-      provider: config.provider,
-      model: config.model,
-    }));
-
-    const lines = [
-      `Z.AI plan set to: ${config.zai_plan}`,
-      `Endpoint family: ${config.zai_plan === "coding" ? "https://api.z.ai/api/coding/paas/v4" : "https://api.z.ai/api/paas/v4"}`,
-    ];
-    if (save) {
-      await saveSettings({ zai_plan: config.zai_plan });
-      lines.push("(Settings saved)");
-    }
-
-    return { action: "handled", lines };
-  } catch (e) {
-    return {
-      action: "handled",
-      lines: [`Failed to set Z.AI plan: ${e}`],
-    };
-  }
-}
diff --git a/openplanter-desktop/frontend/src/components/StatusBar.test.ts b/openplanter-desktop/frontend/src/components/StatusBar.test.ts
index 8b495eaa..507ea6cd 100644
--- a/openplanter-desktop/frontend/src/components/StatusBar.test.ts
+++ b/openplanter-desktop/frontend/src/components/StatusBar.test.ts
@@ -24,7 +24,6 @@ describe("createStatusBar", () => {
     expect(bar.querySelector(".provider")).not.toBeNull();
     expect(bar.querySelector(".model")).not.toBeNull();
     expect(bar.querySelector(".reasoning")).not.toBeNull();
-    expect(bar.querySelector(".zai-plan")).not.toBeNull();
     expect(bar.querySelector(".mode")).not.toBeNull();
     expect(bar.querySelector(".session")).not.toBeNull();
     expect(bar.querySelector(".tokens")).not.toBeNull();
@@ -55,18 +54,6 @@ describe("createStatusBar", () => {
     expect(bar.querySelector(".reasoning")!.textContent).toBe("");
   });
 
-  it("renders Z.AI plan when provider is zai", () => {
-    appState.update((s) => ({ ...s, provider: "zai", zaiPlan: "coding" }));
-    const bar = createStatusBar();
-    expect(bar.querySelector(".zai-plan")!.textContent).toBe("zai:coding");
-  });
-
-  it("hides Z.AI plan when provider is not zai", () => {
-    appState.update((s) => ({ ...s, provider: "anthropic", zaiPlan: "coding" }));
-    const bar = createStatusBar();
-    expect(bar.querySelector(".zai-plan")!.textContent).toBe("");
-  });
-
   it("renders recursive mode", () => {
     appState.update((s) => ({ ...s, recursive: true }));
     const bar = createStatusBar();
@@ -97,43 +84,6 @@ describe("createStatusBar", () => {
     expect(bar.querySelector(".session")!.textContent).toBe("step 3 depth 1");
   });
 
-  it("shows loop health details when telemetry is present", () => {
-    appState.update((s) => ({
-      ...s,
-      isRunning: true,
-      currentStep: 4,
-      currentDepth: 0,
-      loopHealth: {
-        depth: 0,
-        step: 4,
-        phase: "investigate",
-        metrics: {
-          steps: 4,
-          model_turns: 4,
-          tool_calls: 2,
-          investigate_steps: 3,
-          build_steps: 0,
-          iterate_steps: 0,
-          finalize_steps: 0,
-          recon_streak: 3,
-          max_recon_streak: 3,
-          guardrail_warnings: 1,
-          final_rejections: 2,
-          extensions_granted: 1,
-          extension_eligible_checks: 1,
-          extension_denials_no_progress: 0,
-          extension_denials_cap: 0,
-          termination_reason: "success",
-        },
-        is_final: false,
-      },
-    }));
-    const bar = createStatusBar();
-    expect(bar.querySelector(".session")!.textContent).toBe(
-      "step 4 depth 0 investigate recon:3 reject:2 guard:1"
-    );
-  });
-
   it("renders token counts", () => {
     appState.update((s) => ({ ...s, inputTokens: 5000, outputTokens: 2500 }));
     const bar = createStatusBar();
diff --git a/openplanter-desktop/frontend/src/components/StatusBar.ts b/openplanter-desktop/frontend/src/components/StatusBar.ts
index 2bd3aa36..c45963e0 100644
--- a/openplanter-desktop/frontend/src/components/StatusBar.ts
+++ b/openplanter-desktop/frontend/src/components/StatusBar.ts
@@ -14,9 +14,6 @@ export function createStatusBar(): HTMLElement {
   const reasoningEl = document.createElement("span");
   reasoningEl.className = "reasoning";
 
-  const zaiPlanEl = document.createElement("span");
-  zaiPlanEl.className = "zai-plan";
-
   const modeEl = document.createElement("span");
   modeEl.className = "mode";
 
@@ -29,7 +26,6 @@ export function createStatusBar(): HTMLElement {
   bar.appendChild(providerEl);
   bar.appendChild(modelEl);
   bar.appendChild(reasoningEl);
-  bar.appendChild(zaiPlanEl);
   bar.appendChild(modeEl);
   bar.appendChild(sessionEl);
   bar.appendChild(tokensEl);
@@ -41,25 +37,11 @@ export function createStatusBar(): HTMLElement {
     reasoningEl.textContent = s.reasoningEffort
       ? `reasoning:${s.reasoningEffort}`
       : "";
-    zaiPlanEl.textContent =
-      s.provider === "zai" ? `zai:${s.zaiPlan || "paygo"}` : "";
     modeEl.textContent = s.recursive ? "recursive" : "flat";
     sessionEl.textContent = s.sessionId ? `session ${s.sessionId.slice(0, 8)}` : "";
 
     if (s.isRunning && s.currentStep > 0) {
-      const health = s.loopHealth;
-      if (health) {
-        const guardrailText =
-          health.metrics.guardrail_warnings > 0
-            ? ` guard:${health.metrics.guardrail_warnings}`
-            : "";
-        sessionEl.textContent =
-          `step ${s.currentStep} depth ${s.currentDepth} ` +
-          `${health.phase} recon:${health.metrics.recon_streak} ` +
-          `reject:${health.metrics.final_rejections}${guardrailText}`;
-      } else {
-        sessionEl.textContent = `step ${s.currentStep} depth ${s.currentDepth}`;
-      }
+      sessionEl.textContent = `step ${s.currentStep} depth ${s.currentDepth}`;
     }
 
     const inK = (s.inputTokens / 1000).toFixed(1);

From a41c712811c18b2b2e7586ec5e61c1214b5713be Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 16:42:25 -0400
Subject: [PATCH 56/58] Finish PR1 provider cleanup and runtime repair

---
 agent/config.py                               | 163 ++------
 agent/model.py                                | 168 ++++++++-
 .../crates/op-core/src/config.rs              | 356 +++---------------
 .../crates/op-core/src/events.rs              |   4 -
 .../crates/op-core/src/model/mod.rs           |  11 +
 .../crates/op-core/src/model/openai.rs        | 206 +++++++++-
 .../crates/op-core/src/tools/mod.rs           |  54 +++
 .../op-core/tests/test_model_streaming.rs     |  26 +-
 openplanter-desktop/frontend/src/api/types.ts |   7 -
 .../frontend/src/commands/model.test.ts       |  46 +--
 .../frontend/src/components/App.test.ts       |  18 +-
 .../frontend/src/state/store.ts               |   4 -
 tests/test_user_stories.py                    |   2 +-
 13 files changed, 521 insertions(+), 544 deletions(-)

diff --git a/agent/config.py b/agent/config.py
index 7f1f0740..83239de2 100644
--- a/agent/config.py
+++ b/agent/config.py
@@ -4,118 +4,34 @@
 from dataclasses import dataclass
 from pathlib import Path
 
-AZURE_FOUNDRY_MODEL_PREFIX = "azure-foundry/"
-ANTHROPIC_FOUNDRY_MODEL_PREFIX = "anthropic-foundry/"
-FOUNDRY_OPENAI_BASE_URL = "https://foundry-proxy.cheetah-koi.ts.net/openai/v1"
-FOUNDRY_ANTHROPIC_BASE_URL = "https://foundry-proxy.cheetah-koi.ts.net/anthropic/v1"
-FOUNDRY_OPENAI_API_KEY_PLACEHOLDER = "dont-worry-this-key-will-be-auto-injected"
-FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER = "dont-worry-it-will-be-injected"
-ZAI_PAYGO_BASE_URL = "https://api.z.ai/api/paas/v4"
-ZAI_CODING_BASE_URL = "https://api.z.ai/api/coding/paas/v4"
-
 PROVIDER_DEFAULT_MODELS: dict[str, str] = {
-    "openai": "azure-foundry/gpt-5.3-codex",
-    "anthropic": "anthropic-foundry/claude-opus-4-6",
+    "openai": "gpt-5.2",
+    "anthropic": "claude-opus-4-6",
     "openrouter": "anthropic/claude-sonnet-4-5",
     "cerebras": "qwen-3-235b-a22b-instruct-2507",
-    "zai": "glm-5",
     "ollama": "llama3.2",
 }
 
-def normalize_zai_plan(value: str | None) -> str:
-    text = (value or "").strip().lower()
-    if text in {"paygo", "coding"}:
-        return text
-    return "paygo"
-
-
-def resolve_zai_base_url(
-    plan: str,
-    *,
-    paygo_base_url: str = ZAI_PAYGO_BASE_URL,
-    coding_base_url: str = ZAI_CODING_BASE_URL,
-) -> str:
-    return coding_base_url if normalize_zai_plan(plan) == "coding" else paygo_base_url
-
-
-def _normalize_base_url(url: str) -> str:
-    return url.strip().rstrip("/")
-
-
-def is_foundry_openai_base_url(url: str) -> bool:
-    return _normalize_base_url(url) == FOUNDRY_OPENAI_BASE_URL
-
-
-def is_foundry_anthropic_base_url(url: str) -> bool:
-    return _normalize_base_url(url) == FOUNDRY_ANTHROPIC_BASE_URL
-
-
-def resolve_openai_api_key(api_key: str | None, base_url: str) -> str | None:
-    key = (api_key or "").strip() or None
-    if key == FOUNDRY_OPENAI_API_KEY_PLACEHOLDER and not is_foundry_openai_base_url(base_url):
-        return None
-    if key:
-        return key
-    if is_foundry_openai_base_url(base_url):
-        return FOUNDRY_OPENAI_API_KEY_PLACEHOLDER
-    return None
-
-
-def resolve_anthropic_api_key(api_key: str | None, base_url: str) -> str | None:
-    key = (api_key or "").strip() or None
-    if (
-        key == FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER
-        and not is_foundry_anthropic_base_url(base_url)
-    ):
-        return None
-    if key:
-        return key
-    if is_foundry_anthropic_base_url(base_url):
-        return FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER
-    return None
-
-
-def strip_foundry_model_prefix(model: str) -> str:
-    text = model.strip()
-    lower = text.lower()
-    if lower.startswith(AZURE_FOUNDRY_MODEL_PREFIX):
-        return text[len(AZURE_FOUNDRY_MODEL_PREFIX):]
-    if lower.startswith(ANTHROPIC_FOUNDRY_MODEL_PREFIX):
-        return text[len(ANTHROPIC_FOUNDRY_MODEL_PREFIX):]
-    return text
-
 
 @dataclass(slots=True)
 class AgentConfig:
     workspace: Path
     provider: str = "auto"
-    model: str = "anthropic-foundry/claude-opus-4-6"
+    model: str = "claude-opus-4-6"
     reasoning_effort: str | None = "high"
-    base_url: str = FOUNDRY_OPENAI_BASE_URL  # Legacy alias for OpenAI-compatible base URL.
+    base_url: str = "https://api.openai.com/v1"  # Legacy alias for OpenAI-compatible base URL.
     api_key: str | None = None  # Legacy alias for OpenAI key.
-    openai_base_url: str = FOUNDRY_OPENAI_BASE_URL
-    anthropic_base_url: str = FOUNDRY_ANTHROPIC_BASE_URL
+    openai_base_url: str = "https://api.openai.com/v1"
+    anthropic_base_url: str = "https://api.anthropic.com/v1"
     openrouter_base_url: str = "https://openrouter.ai/api/v1"
     cerebras_base_url: str = "https://api.cerebras.ai/v1"
-    zai_plan: str = "paygo"
-    zai_paygo_base_url: str = ZAI_PAYGO_BASE_URL
-    zai_coding_base_url: str = ZAI_CODING_BASE_URL
-    zai_base_url: str = ZAI_PAYGO_BASE_URL
     ollama_base_url: str = "http://localhost:11434/v1"
     exa_base_url: str = "https://api.exa.ai"
-    firecrawl_base_url: str = "https://api.firecrawl.dev/v1"
-    brave_base_url: str = "https://api.search.brave.com/res/v1"
-    tavily_base_url: str = "https://api.tavily.com"
     openai_api_key: str | None = None
     anthropic_api_key: str | None = None
     openrouter_api_key: str | None = None
     cerebras_api_key: str | None = None
-    zai_api_key: str | None = None
     exa_api_key: str | None = None
-    firecrawl_api_key: str | None = None
-    brave_api_key: str | None = None
-    tavily_api_key: str | None = None
-    web_search_provider: str = "exa"
     voyage_api_key: str | None = None
     max_depth: int = 4
     max_steps_per_call: int = 100
@@ -133,7 +49,6 @@ class AgentConfig:
     max_persisted_observations: int = 400
     max_solve_seconds: int = 0
     rate_limit_max_retries: int = 12
-    zai_stream_max_retries: int = 10
     rate_limit_backoff_base_sec: float = 1.0
     rate_limit_backoff_max_sec: float = 60.0
     rate_limit_retry_after_cap_sec: float = 120.0
@@ -144,13 +59,6 @@ class AgentConfig:
     max_turn_summaries: int = 50
     demo: bool = False
 
-    def __post_init__(self) -> None:
-        self.openai_api_key = resolve_openai_api_key(self.openai_api_key, self.openai_base_url)
-        self.anthropic_api_key = resolve_anthropic_api_key(
-            self.anthropic_api_key, self.anthropic_base_url
-        )
-        self.api_key = resolve_openai_api_key(self.api_key, self.base_url)
-
     @classmethod
     def from_env(cls, workspace: str | Path) -> "AgentConfig":
         ws = Path(workspace).expanduser().resolve()
@@ -161,38 +69,16 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
         anthropic_api_key = os.getenv("OPENPLANTER_ANTHROPIC_API_KEY") or os.getenv("ANTHROPIC_API_KEY")
         openrouter_api_key = os.getenv("OPENPLANTER_OPENROUTER_API_KEY") or os.getenv("OPENROUTER_API_KEY")
         cerebras_api_key = os.getenv("OPENPLANTER_CEREBRAS_API_KEY") or os.getenv("CEREBRAS_API_KEY")
-        zai_api_key = os.getenv("OPENPLANTER_ZAI_API_KEY") or os.getenv("ZAI_API_KEY")
         exa_api_key = os.getenv("OPENPLANTER_EXA_API_KEY") or os.getenv("EXA_API_KEY")
-        firecrawl_api_key = os.getenv("OPENPLANTER_FIRECRAWL_API_KEY") or os.getenv("FIRECRAWL_API_KEY")
-        brave_api_key = os.getenv("OPENPLANTER_BRAVE_API_KEY") or os.getenv("BRAVE_API_KEY")
-        tavily_api_key = os.getenv("OPENPLANTER_TAVILY_API_KEY") or os.getenv("TAVILY_API_KEY")
         voyage_api_key = os.getenv("OPENPLANTER_VOYAGE_API_KEY") or os.getenv("VOYAGE_API_KEY")
         openai_base_url = os.getenv("OPENPLANTER_OPENAI_BASE_URL") or os.getenv(
             "OPENPLANTER_BASE_URL",
-            FOUNDRY_OPENAI_BASE_URL,
-        )
-        anthropic_base_url = os.getenv(
-            "OPENPLANTER_ANTHROPIC_BASE_URL",
-            FOUNDRY_ANTHROPIC_BASE_URL,
+            "https://api.openai.com/v1",
         )
-        openai_api_key = resolve_openai_api_key(openai_api_key, openai_base_url)
-        anthropic_api_key = resolve_anthropic_api_key(anthropic_api_key, anthropic_base_url)
-        zai_plan = normalize_zai_plan(os.getenv("OPENPLANTER_ZAI_PLAN", "paygo"))
-        zai_paygo_base_url = os.getenv("OPENPLANTER_ZAI_PAYGO_BASE_URL", ZAI_PAYGO_BASE_URL)
-        zai_coding_base_url = os.getenv("OPENPLANTER_ZAI_CODING_BASE_URL", ZAI_CODING_BASE_URL)
-        zai_base_url_override = (os.getenv("OPENPLANTER_ZAI_BASE_URL", "") or "").strip()
-        zai_base_url = (
-            zai_base_url_override
-            or resolve_zai_base_url(
-                zai_plan,
-                paygo_base_url=zai_paygo_base_url,
-                coding_base_url=zai_coding_base_url,
-            )
+        budget_extension_enabled = (
+            os.getenv("OPENPLANTER_BUDGET_EXTENSION_ENABLED", "true").strip().lower()
+            in {"1", "true", "yes"}
         )
-        web_search_provider = (os.getenv("OPENPLANTER_WEB_SEARCH_PROVIDER", "exa").strip().lower() or "exa")
-        if web_search_provider not in {"exa", "firecrawl", "brave", "tavily"}:
-            web_search_provider = "exa"
-        budget_extension_enabled = (os.getenv("OPENPLANTER_BUDGET_EXTENSION_ENABLED", "true").strip().lower() in {"1", "true", "yes"})
         budget_extension_block_steps = max(
             1,
             int(os.getenv("OPENPLANTER_BUDGET_EXTENSION_BLOCK_STEPS", "20")),
@@ -204,33 +90,21 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
         return cls(
             workspace=ws,
             provider=os.getenv("OPENPLANTER_PROVIDER", "auto").strip().lower() or "auto",
-            model=os.getenv("OPENPLANTER_MODEL", PROVIDER_DEFAULT_MODELS["anthropic"]),
+            model=os.getenv("OPENPLANTER_MODEL", "claude-opus-4-6"),
             reasoning_effort=(os.getenv("OPENPLANTER_REASONING_EFFORT", "high").strip().lower() or None),
             base_url=openai_base_url,
             api_key=openai_api_key,
             openai_base_url=openai_base_url,
-            anthropic_base_url=anthropic_base_url,
+            anthropic_base_url=os.getenv("OPENPLANTER_ANTHROPIC_BASE_URL", "https://api.anthropic.com/v1"),
             openrouter_base_url=os.getenv("OPENPLANTER_OPENROUTER_BASE_URL", "https://openrouter.ai/api/v1"),
             cerebras_base_url=os.getenv("OPENPLANTER_CEREBRAS_BASE_URL", "https://api.cerebras.ai/v1"),
-            zai_plan=zai_plan,
-            zai_paygo_base_url=zai_paygo_base_url,
-            zai_coding_base_url=zai_coding_base_url,
-            zai_base_url=zai_base_url,
             ollama_base_url=os.getenv("OPENPLANTER_OLLAMA_BASE_URL", "http://localhost:11434/v1"),
             exa_base_url=os.getenv("OPENPLANTER_EXA_BASE_URL", "https://api.exa.ai"),
-            firecrawl_base_url=os.getenv("OPENPLANTER_FIRECRAWL_BASE_URL", "https://api.firecrawl.dev/v1"),
-            brave_base_url=os.getenv("OPENPLANTER_BRAVE_BASE_URL", "https://api.search.brave.com/res/v1"),
-            tavily_base_url=os.getenv("OPENPLANTER_TAVILY_BASE_URL", "https://api.tavily.com"),
             openai_api_key=openai_api_key,
             anthropic_api_key=anthropic_api_key,
             openrouter_api_key=openrouter_api_key,
             cerebras_api_key=cerebras_api_key,
-            zai_api_key=zai_api_key,
             exa_api_key=exa_api_key,
-            firecrawl_api_key=firecrawl_api_key,
-            brave_api_key=brave_api_key,
-            tavily_api_key=tavily_api_key,
-            web_search_provider=web_search_provider,
             voyage_api_key=voyage_api_key,
             max_depth=int(os.getenv("OPENPLANTER_MAX_DEPTH", "4")),
             max_steps_per_call=int(os.getenv("OPENPLANTER_MAX_STEPS", "100")),
@@ -248,10 +122,15 @@ def from_env(cls, workspace: str | Path) -> "AgentConfig":
             max_persisted_observations=int(os.getenv("OPENPLANTER_MAX_PERSISTED_OBS", "400")),
             max_solve_seconds=int(os.getenv("OPENPLANTER_MAX_SOLVE_SECONDS", "0")),
             rate_limit_max_retries=int(os.getenv("OPENPLANTER_RATE_LIMIT_MAX_RETRIES", "12")),
-            zai_stream_max_retries=int(os.getenv("OPENPLANTER_ZAI_STREAM_MAX_RETRIES", "10")),
-            rate_limit_backoff_base_sec=float(os.getenv("OPENPLANTER_RATE_LIMIT_BACKOFF_BASE_SEC", "1.0")),
-            rate_limit_backoff_max_sec=float(os.getenv("OPENPLANTER_RATE_LIMIT_BACKOFF_MAX_SEC", "60.0")),
-            rate_limit_retry_after_cap_sec=float(os.getenv("OPENPLANTER_RATE_LIMIT_RETRY_AFTER_CAP_SEC", "120.0")),
+            rate_limit_backoff_base_sec=float(
+                os.getenv("OPENPLANTER_RATE_LIMIT_BACKOFF_BASE_SEC", "1.0")
+            ),
+            rate_limit_backoff_max_sec=float(
+                os.getenv("OPENPLANTER_RATE_LIMIT_BACKOFF_MAX_SEC", "60.0")
+            ),
+            rate_limit_retry_after_cap_sec=float(
+                os.getenv("OPENPLANTER_RATE_LIMIT_RETRY_AFTER_CAP_SEC", "120.0")
+            ),
             recursive=os.getenv("OPENPLANTER_RECURSIVE", "true").strip().lower() in ("1", "true", "yes"),
             min_subtask_depth=int(os.getenv("OPENPLANTER_MIN_SUBTASK_DEPTH", "0")),
             acceptance_criteria=os.getenv("OPENPLANTER_ACCEPTANCE_CRITERIA", "true").strip().lower() in ("1", "true", "yes"),
diff --git a/agent/model.py b/agent/model.py
index 30bc3ff7..f67b4d2b 100644
--- a/agent/model.py
+++ b/agent/model.py
@@ -6,6 +6,7 @@
 import urllib.request
 from dataclasses import dataclass, field
 from datetime import datetime, timezone
+from email.utils import parsedate_to_datetime
 from typing import Any, Callable, Protocol
 
 from .tool_defs import TOOL_DEFINITIONS, to_anthropic_tools, to_openai_tools
@@ -15,6 +16,27 @@ class ModelError(RuntimeError):
     pass
 
 
+class HTTPModelError(ModelError):
+    def __init__(
+        self,
+        message: str,
+        *,
+        status_code: int | None = None,
+        provider_code: str | int | None = None,
+        body: str = "",
+        retry_after_sec: float | None = None,
+    ) -> None:
+        super().__init__(message)
+        self.status_code = status_code
+        self.provider_code = provider_code
+        self.body = body
+        self.retry_after_sec = retry_after_sec
+
+
+class RateLimitError(HTTPModelError):
+    pass
+
+
 # ---------------------------------------------------------------------------
 # Core data types
 # ---------------------------------------------------------------------------
@@ -103,6 +125,132 @@ def _extract_content(content: object) -> str:
     return ""
 
 
+def _parse_json_object(text: str) -> dict[str, Any] | None:
+    try:
+        parsed = json.loads(text)
+    except json.JSONDecodeError:
+        return None
+    if isinstance(parsed, dict):
+        return parsed
+    return None
+
+
+def _parse_retry_after_value(value: object) -> float | None:
+    if value is None:
+        return None
+    if isinstance(value, (int, float)):
+        return max(float(value), 0.0)
+    if isinstance(value, str):
+        text = value.strip()
+        if not text:
+            return None
+        try:
+            return max(float(text), 0.0)
+        except ValueError:
+            pass
+        try:
+            dt = parsedate_to_datetime(text)
+        except (TypeError, ValueError, IndexError):
+            return None
+        if dt.tzinfo is None:
+            dt = dt.replace(tzinfo=timezone.utc)
+        return max((dt - datetime.now(timezone.utc)).total_seconds(), 0.0)
+    return None
+
+
+def _parse_retry_after(headers: Any) -> float | None:
+    if headers is None:
+        return None
+    getter = getattr(headers, "get", None)
+    if not callable(getter):
+        return None
+    return _parse_retry_after_value(getter("Retry-After"))
+
+
+def _extract_openai_style_error(
+    payload: dict[str, Any],
+) -> tuple[str, str | int | None, float | None]:
+    error = payload.get("error")
+    if isinstance(error, dict):
+        message = str(error.get("message", "")).strip()
+        provider_code = error.get("code")
+        retry_after = _parse_retry_after_value(error.get("retry_after"))
+        if retry_after is None:
+            retry_after = _parse_retry_after_value(payload.get("retry_after"))
+        return message, provider_code, retry_after
+    return "", None, _parse_retry_after_value(payload.get("retry_after"))
+
+
+def _is_rate_limit_error(
+    status_code: int | None,
+    provider_code: str | int | None,
+    message: str,
+) -> bool:
+    if status_code == 429:
+        return True
+    if provider_code is not None:
+        code_text = str(provider_code).strip().lower()
+        if code_text in {"1302", "429", "rate_limit", "rate_limit_exceeded", "too_many_requests"}:
+            return True
+    lower = message.lower()
+    return "rate limit" in lower or "too many requests" in lower
+
+
+def _raise_http_error(url: str, status_code: int, body: str, headers: Any) -> None:
+    parsed = _parse_json_object(body)
+    message = ""
+    provider_code: str | int | None = None
+    body_retry_after: float | None = None
+    if parsed is not None:
+        message, provider_code, body_retry_after = _extract_openai_style_error(parsed)
+    retry_after = _parse_retry_after(headers)
+    if retry_after is None:
+        retry_after = body_retry_after
+    text = message or body
+    exc_cls = RateLimitError if _is_rate_limit_error(status_code, provider_code, text) else HTTPModelError
+    raise exc_cls(
+        f"HTTP {status_code} calling {url}: {body}",
+        status_code=status_code,
+        provider_code=provider_code,
+        body=body,
+        retry_after_sec=retry_after,
+    )
+
+
+def _raise_sse_error(data_dict: dict[str, Any]) -> None:
+    if data_dict.get("type") == "error":
+        err = data_dict.get("error")
+        if isinstance(err, dict):
+            err_msg = str(err.get("message", str(data_dict)))
+            provider_code = err.get("code")
+            retry_after = _parse_retry_after_value(err.get("retry_after"))
+            if _is_rate_limit_error(None, provider_code, err_msg):
+                raise RateLimitError(
+                    f"Stream error: {err_msg}",
+                    status_code=None,
+                    provider_code=provider_code,
+                    body=json.dumps(data_dict, ensure_ascii=True),
+                    retry_after_sec=retry_after,
+                )
+            raise ModelError(f"Stream error: {err_msg}")
+        raise ModelError(f"Stream error: {data_dict}")
+
+    err = data_dict.get("error")
+    if isinstance(err, dict):
+        err_msg = str(err.get("message", str(data_dict)))
+        provider_code = err.get("code")
+        retry_after = _parse_retry_after_value(err.get("retry_after"))
+        if _is_rate_limit_error(None, provider_code, err_msg):
+            raise RateLimitError(
+                f"Stream error: {err_msg}",
+                status_code=None,
+                provider_code=provider_code,
+                body=json.dumps(data_dict, ensure_ascii=True),
+                retry_after_sec=retry_after,
+            )
+        raise ModelError(f"Stream error: {err_msg}")
+
+
 def _http_json(
     url: str,
     method: str,
@@ -121,7 +269,7 @@ def _http_json(
             raw = resp.read().decode("utf-8", errors="replace")
     except urllib.error.HTTPError as exc:  # pragma: no cover - network path
         body = exc.read().decode("utf-8", errors="replace")
-        raise ModelError(f"HTTP {exc.code} calling {url}: {body}") from exc
+        _raise_http_error(url, exc.code, body, exc.headers)
     except urllib.error.URLError as exc:  # pragma: no cover - network path
         raise ModelError(f"Connection error calling {url}: {exc}") from exc
     except OSError as exc:  # pragma: no cover - bare socket.timeout, etc.
@@ -176,10 +324,7 @@ def _read_sse_events(
                 except json.JSONDecodeError:
                     data_dict = {"_raw": joined}
                 if isinstance(data_dict, dict):
-                    # Check for Anthropic error events
-                    if data_dict.get("type") == "error":
-                        err_msg = data_dict.get("error", {}).get("message", str(data_dict))
-                        raise ModelError(f"Stream error: {err_msg}")
+                    _raise_sse_error(data_dict)
                     events.append((current_event, data_dict))
                     if on_sse_event:
                         try:
@@ -198,9 +343,7 @@ def _read_sse_events(
         except json.JSONDecodeError:
             data_dict = {"_raw": joined}
         if isinstance(data_dict, dict):
-            if data_dict.get("type") == "error":
-                err_msg = data_dict.get("error", {}).get("message", str(data_dict))
-                raise ModelError(f"Stream error: {err_msg}")
+            _raise_sse_error(data_dict)
             events.append((current_event, data_dict))
             if on_sse_event:
                 try:
@@ -231,7 +374,7 @@ def _http_stream_sse(
             resp = urllib.request.urlopen(req, timeout=first_byte_timeout)
         except urllib.error.HTTPError as exc:
             body = exc.read().decode("utf-8", errors="replace")
-            raise ModelError(f"HTTP {exc.code} calling {url}: {body}") from exc
+            _raise_http_error(url, exc.code, body, exc.headers)
         except (socket.timeout, urllib.error.URLError, OSError) as exc:
             # Timeout or connection error — retry
             last_exc = exc
@@ -754,6 +897,13 @@ def _forward_delta(_event_type: str, data: dict[str, Any]) -> None:
             raise ModelError(f"Model response missing content: {parsed}") from exc
 
         finish_reason = parsed["choices"][0].get("finish_reason", "")
+        if finish_reason == "rate_limit":
+            raise RateLimitError(
+                "Model finish_reason=rate_limit",
+                status_code=429,
+                provider_code="rate_limit",
+                body=json.dumps(parsed, ensure_ascii=True),
+            )
 
         # Parse tool calls
         raw_tool_calls = message.get("tool_calls")
diff --git a/openplanter-desktop/crates/op-core/src/config.rs b/openplanter-desktop/crates/op-core/src/config.rs
index 841a2f20..194e9a16 100644
--- a/openplanter-desktop/crates/op-core/src/config.rs
+++ b/openplanter-desktop/crates/op-core/src/config.rs
@@ -5,27 +5,14 @@ use std::sync::LazyLock;
 
 use serde::{Deserialize, Serialize};
 
-pub const AZURE_FOUNDRY_MODEL_PREFIX: &str = "azure-foundry/";
-pub const ANTHROPIC_FOUNDRY_MODEL_PREFIX: &str = "anthropic-foundry/";
-pub const FOUNDRY_OPENAI_BASE_URL: &str = "https://foundry-proxy.cheetah-koi.ts.net/openai/v1";
-pub const FOUNDRY_ANTHROPIC_BASE_URL: &str =
-    "https://foundry-proxy.cheetah-koi.ts.net/anthropic/v1";
-pub const FOUNDRY_OPENAI_API_KEY_PLACEHOLDER: &str = "dont-worry-this-key-will-be-auto-injected";
-pub const FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER: &str = "dont-worry-it-will-be-injected";
-pub const ZAI_PAYGO_BASE_URL: &str = "https://api.z.ai/api/paas/v4";
-pub const ZAI_CODING_BASE_URL: &str = "https://api.z.ai/api/coding/paas/v4";
-pub const BRAVE_BASE_URL: &str = "https://api.search.brave.com/res/v1";
-pub const TAVILY_BASE_URL: &str = "https://api.tavily.com";
-
 /// Default model for each supported provider.
 pub static PROVIDER_DEFAULT_MODELS: LazyLock<HashMap<&'static str, &'static str>> =
     LazyLock::new(|| {
         HashMap::from([
-            ("openai", "azure-foundry/gpt-5.3-codex"),
-            ("anthropic", "anthropic-foundry/claude-opus-4-6"),
+            ("openai", "gpt-5.2"),
+            ("anthropic", "claude-opus-4-6"),
             ("openrouter", "anthropic/claude-sonnet-4-5"),
             ("cerebras", "qwen-3-235b-a22b-instruct-2507"),
-            ("zai", "glm-5"),
             ("ollama", "llama3.2"),
         ])
     });
@@ -59,94 +46,6 @@ fn env_bool(key: &str, default: bool) -> bool {
     }
 }
 
-pub fn normalize_zai_plan(value: Option<&str>) -> String {
-    match value.unwrap_or_default().trim().to_lowercase().as_str() {
-        "coding" => "coding".to_string(),
-        _ => "paygo".to_string(),
-    }
-}
-
-pub fn resolve_zai_base_url(plan: &str, paygo_base_url: &str, coding_base_url: &str) -> String {
-    if normalize_zai_plan(Some(plan)) == "coding" {
-        coding_base_url.to_string()
-    } else {
-        paygo_base_url.to_string()
-    }
-}
-
-pub fn normalize_web_search_provider(value: Option<&str>) -> String {
-    match value.unwrap_or_default().trim().to_lowercase().as_str() {
-        "firecrawl" => "firecrawl".to_string(),
-        "brave" => "brave".to_string(),
-        "tavily" => "tavily".to_string(),
-        _ => "exa".to_string(),
-    }
-}
-
-fn normalize_base_url(value: &str) -> String {
-    value.trim().trim_end_matches('/').to_string()
-}
-
-pub fn is_foundry_openai_base_url(value: &str) -> bool {
-    normalize_base_url(value) == FOUNDRY_OPENAI_BASE_URL
-}
-
-pub fn is_foundry_anthropic_base_url(value: &str) -> bool {
-    normalize_base_url(value) == FOUNDRY_ANTHROPIC_BASE_URL
-}
-
-pub fn resolve_openai_api_key(api_key: Option<String>, base_url: &str) -> Option<String> {
-    let normalized = api_key
-        .as_deref()
-        .map(str::trim)
-        .filter(|value| !value.is_empty())
-        .map(str::to_string);
-    if normalized.as_deref() == Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER)
-        && !is_foundry_openai_base_url(base_url)
-    {
-        return None;
-    }
-    if normalized.is_some() {
-        return normalized;
-    }
-    if is_foundry_openai_base_url(base_url) {
-        return Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.to_string());
-    }
-    None
-}
-
-pub fn resolve_anthropic_api_key(api_key: Option<String>, base_url: &str) -> Option<String> {
-    let normalized = api_key
-        .as_deref()
-        .map(str::trim)
-        .filter(|value| !value.is_empty())
-        .map(str::to_string);
-    if normalized.as_deref() == Some(FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER)
-        && !is_foundry_anthropic_base_url(base_url)
-    {
-        return None;
-    }
-    if normalized.is_some() {
-        return normalized;
-    }
-    if is_foundry_anthropic_base_url(base_url) {
-        return Some(FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER.to_string());
-    }
-    None
-}
-
-pub fn strip_foundry_model_prefix(model: &str) -> String {
-    let trimmed = model.trim();
-    let lower = trimmed.to_lowercase();
-    if lower.starts_with(AZURE_FOUNDRY_MODEL_PREFIX) {
-        return trimmed[AZURE_FOUNDRY_MODEL_PREFIX.len()..].to_string();
-    }
-    if lower.starts_with(ANTHROPIC_FOUNDRY_MODEL_PREFIX) {
-        return trimmed[ANTHROPIC_FOUNDRY_MODEL_PREFIX.len()..].to_string();
-    }
-    trimmed.to_string()
-}
-
 /// Central configuration for the OpenPlanter agent.
 ///
 /// Mirrors the Python `AgentConfig` dataclass field-for-field.
@@ -163,15 +62,8 @@ pub struct AgentConfig {
     pub anthropic_base_url: String,
     pub openrouter_base_url: String,
     pub cerebras_base_url: String,
-    pub zai_plan: String,
-    pub zai_paygo_base_url: String,
-    pub zai_coding_base_url: String,
-    pub zai_base_url: String,
     pub ollama_base_url: String,
     pub exa_base_url: String,
-    pub firecrawl_base_url: String,
-    pub brave_base_url: String,
-    pub tavily_base_url: String,
 
     // API keys
     pub api_key: Option<String>,
@@ -179,12 +71,7 @@ pub struct AgentConfig {
     pub anthropic_api_key: Option<String>,
     pub openrouter_api_key: Option<String>,
     pub cerebras_api_key: Option<String>,
-    pub zai_api_key: Option<String>,
     pub exa_api_key: Option<String>,
-    pub firecrawl_api_key: Option<String>,
-    pub brave_api_key: Option<String>,
-    pub tavily_api_key: Option<String>,
-    pub web_search_provider: String,
     pub voyage_api_key: Option<String>,
 
     // Limits
@@ -207,7 +94,6 @@ pub struct AgentConfig {
     pub rate_limit_backoff_base_sec: f64,
     pub rate_limit_backoff_max_sec: f64,
     pub rate_limit_retry_after_cap_sec: f64,
-    pub zai_stream_max_retries: i64,
     pub recursive: bool,
     pub min_subtask_depth: i64,
     pub acceptance_criteria: bool,
@@ -221,33 +107,21 @@ impl Default for AgentConfig {
         Self {
             workspace: PathBuf::from("."),
             provider: "auto".into(),
-            model: "anthropic-foundry/claude-opus-4-6".into(),
+            model: "claude-opus-4-6".into(),
             reasoning_effort: Some("high".into()),
-            base_url: FOUNDRY_OPENAI_BASE_URL.into(),
-            openai_base_url: FOUNDRY_OPENAI_BASE_URL.into(),
-            anthropic_base_url: FOUNDRY_ANTHROPIC_BASE_URL.into(),
+            base_url: "https://api.openai.com/v1".into(),
+            openai_base_url: "https://api.openai.com/v1".into(),
+            anthropic_base_url: "https://api.anthropic.com/v1".into(),
             openrouter_base_url: "https://openrouter.ai/api/v1".into(),
             cerebras_base_url: "https://api.cerebras.ai/v1".into(),
-            zai_plan: "paygo".into(),
-            zai_paygo_base_url: ZAI_PAYGO_BASE_URL.into(),
-            zai_coding_base_url: ZAI_CODING_BASE_URL.into(),
-            zai_base_url: ZAI_PAYGO_BASE_URL.into(),
             ollama_base_url: "http://localhost:11434/v1".into(),
             exa_base_url: "https://api.exa.ai".into(),
-            firecrawl_base_url: "https://api.firecrawl.dev/v1".into(),
-            brave_base_url: BRAVE_BASE_URL.into(),
-            tavily_base_url: TAVILY_BASE_URL.into(),
-            api_key: Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.into()),
-            openai_api_key: Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER.into()),
-            anthropic_api_key: Some(FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER.into()),
+            api_key: None,
+            openai_api_key: None,
+            anthropic_api_key: None,
             openrouter_api_key: None,
             cerebras_api_key: None,
-            zai_api_key: None,
             exa_api_key: None,
-            firecrawl_api_key: None,
-            brave_api_key: None,
-            tavily_api_key: None,
-            web_search_provider: "exa".into(),
             voyage_api_key: None,
             max_depth: 4,
             max_steps_per_call: 100,
@@ -268,7 +142,6 @@ impl Default for AgentConfig {
             rate_limit_backoff_base_sec: 1.0,
             rate_limit_backoff_max_sec: 60.0,
             rate_limit_retry_after_cap_sec: 120.0,
-            zai_stream_max_retries: 10,
             recursive: true,
             min_subtask_depth: 0,
             acceptance_criteria: true,
@@ -284,39 +157,27 @@ impl AgentConfig {
     pub fn from_env(workspace: impl AsRef<Path>) -> Self {
         let ws = dunce_canonicalize(workspace.as_ref());
 
-        let openai_api_key =
-            env_opt("OPENPLANTER_OPENAI_API_KEY").or_else(|| env_opt("OPENAI_API_KEY"));
-
-        let anthropic_api_key =
-            env_opt("OPENPLANTER_ANTHROPIC_API_KEY").or_else(|| env_opt("ANTHROPIC_API_KEY"));
-
-        let openrouter_api_key =
-            env_opt("OPENPLANTER_OPENROUTER_API_KEY").or_else(|| env_opt("OPENROUTER_API_KEY"));
+        let openai_api_key = env_opt("OPENPLANTER_OPENAI_API_KEY")
+            .or_else(|| env_opt("OPENAI_API_KEY"));
 
-        let cerebras_api_key =
-            env_opt("OPENPLANTER_CEREBRAS_API_KEY").or_else(|| env_opt("CEREBRAS_API_KEY"));
+        let anthropic_api_key = env_opt("OPENPLANTER_ANTHROPIC_API_KEY")
+            .or_else(|| env_opt("ANTHROPIC_API_KEY"));
 
-        let zai_api_key = env_opt("OPENPLANTER_ZAI_API_KEY").or_else(|| env_opt("ZAI_API_KEY"));
+        let openrouter_api_key = env_opt("OPENPLANTER_OPENROUTER_API_KEY")
+            .or_else(|| env_opt("OPENROUTER_API_KEY"));
 
-        let exa_api_key = env_opt("OPENPLANTER_EXA_API_KEY").or_else(|| env_opt("EXA_API_KEY"));
+        let cerebras_api_key = env_opt("OPENPLANTER_CEREBRAS_API_KEY")
+            .or_else(|| env_opt("CEREBRAS_API_KEY"));
 
-        let firecrawl_api_key =
-            env_opt("OPENPLANTER_FIRECRAWL_API_KEY").or_else(|| env_opt("FIRECRAWL_API_KEY"));
-        let brave_api_key =
-            env_opt("OPENPLANTER_BRAVE_API_KEY").or_else(|| env_opt("BRAVE_API_KEY"));
-        let tavily_api_key =
-            env_opt("OPENPLANTER_TAVILY_API_KEY").or_else(|| env_opt("TAVILY_API_KEY"));
+        let exa_api_key = env_opt("OPENPLANTER_EXA_API_KEY")
+            .or_else(|| env_opt("EXA_API_KEY"));
 
-        let voyage_api_key =
-            env_opt("OPENPLANTER_VOYAGE_API_KEY").or_else(|| env_opt("VOYAGE_API_KEY"));
+        let voyage_api_key = env_opt("OPENPLANTER_VOYAGE_API_KEY")
+            .or_else(|| env_opt("VOYAGE_API_KEY"));
 
         let openai_base_url = env_opt("OPENPLANTER_OPENAI_BASE_URL")
             .or_else(|| env_opt("OPENPLANTER_BASE_URL"))
-            .unwrap_or_else(|| FOUNDRY_OPENAI_BASE_URL.into());
-        let anthropic_base_url =
-            env_or("OPENPLANTER_ANTHROPIC_BASE_URL", FOUNDRY_ANTHROPIC_BASE_URL);
-        let openai_api_key = resolve_openai_api_key(openai_api_key, &openai_base_url);
-        let anthropic_api_key = resolve_anthropic_api_key(anthropic_api_key, &anthropic_base_url);
+            .unwrap_or_else(|| "https://api.openai.com/v1".into());
 
         let reasoning_effort_raw = env_or("OPENPLANTER_REASONING_EFFORT", "high")
             .trim()
@@ -327,31 +188,27 @@ impl AgentConfig {
             Some(reasoning_effort_raw)
         };
 
-        let provider_raw = env_or("OPENPLANTER_PROVIDER", "auto").trim().to_lowercase();
+        let provider_raw = env_or("OPENPLANTER_PROVIDER", "auto")
+            .trim()
+            .to_lowercase();
         let provider = if provider_raw.is_empty() {
             "auto".into()
         } else {
             provider_raw
         };
 
-        let zai_plan = normalize_zai_plan(env_opt("OPENPLANTER_ZAI_PLAN").as_deref());
-        let zai_paygo_base_url = env_or("OPENPLANTER_ZAI_PAYGO_BASE_URL", ZAI_PAYGO_BASE_URL);
-        let zai_coding_base_url = env_or("OPENPLANTER_ZAI_CODING_BASE_URL", ZAI_CODING_BASE_URL);
-        let zai_base_url = env_opt("OPENPLANTER_ZAI_BASE_URL").unwrap_or_else(|| {
-            resolve_zai_base_url(&zai_plan, &zai_paygo_base_url, &zai_coding_base_url)
-        });
-        let web_search_provider =
-            normalize_web_search_provider(env_opt("OPENPLANTER_WEB_SEARCH_PROVIDER").as_deref());
-
         Self {
             workspace: ws,
             provider,
-            model: env_or("OPENPLANTER_MODEL", PROVIDER_DEFAULT_MODELS["anthropic"]),
+            model: env_or("OPENPLANTER_MODEL", "claude-opus-4-6"),
             reasoning_effort,
             base_url: openai_base_url.clone(),
             api_key: openai_api_key.clone(),
             openai_base_url,
-            anthropic_base_url,
+            anthropic_base_url: env_or(
+                "OPENPLANTER_ANTHROPIC_BASE_URL",
+                "https://api.anthropic.com/v1",
+            ),
             openrouter_base_url: env_or(
                 "OPENPLANTER_OPENROUTER_BASE_URL",
                 "https://openrouter.ai/api/v1",
@@ -360,28 +217,16 @@ impl AgentConfig {
                 "OPENPLANTER_CEREBRAS_BASE_URL",
                 "https://api.cerebras.ai/v1",
             ),
-            zai_plan,
-            zai_paygo_base_url,
-            zai_coding_base_url,
-            zai_base_url,
-            ollama_base_url: env_or("OPENPLANTER_OLLAMA_BASE_URL", "http://localhost:11434/v1"),
-            exa_base_url: env_or("OPENPLANTER_EXA_BASE_URL", "https://api.exa.ai"),
-            firecrawl_base_url: env_or(
-                "OPENPLANTER_FIRECRAWL_BASE_URL",
-                "https://api.firecrawl.dev/v1",
+            ollama_base_url: env_or(
+                "OPENPLANTER_OLLAMA_BASE_URL",
+                "http://localhost:11434/v1",
             ),
-            brave_base_url: env_or("OPENPLANTER_BRAVE_BASE_URL", BRAVE_BASE_URL),
-            tavily_base_url: env_or("OPENPLANTER_TAVILY_BASE_URL", TAVILY_BASE_URL),
+            exa_base_url: env_or("OPENPLANTER_EXA_BASE_URL", "https://api.exa.ai"),
             openai_api_key,
             anthropic_api_key,
             openrouter_api_key,
             cerebras_api_key,
-            zai_api_key,
             exa_api_key,
-            firecrawl_api_key,
-            brave_api_key,
-            tavily_api_key,
-            web_search_provider,
             voyage_api_key,
             max_depth: env_int("OPENPLANTER_MAX_DEPTH", 4),
             max_steps_per_call: env_int("OPENPLANTER_MAX_STEPS", 100),
@@ -407,7 +252,6 @@ impl AgentConfig {
                 "OPENPLANTER_RATE_LIMIT_RETRY_AFTER_CAP_SEC",
                 120.0,
             ),
-            zai_stream_max_retries: env_int("OPENPLANTER_ZAI_STREAM_MAX_RETRIES", 10),
             recursive: env_bool("OPENPLANTER_RECURSIVE", true),
             min_subtask_depth: env_int("OPENPLANTER_MIN_SUBTASK_DEPTH", 0),
             acceptance_criteria: env_bool("OPENPLANTER_ACCEPTANCE_CRITERIA", true),
@@ -448,27 +292,13 @@ mod tests {
     fn test_default_config() {
         let cfg = AgentConfig::default();
         assert_eq!(cfg.provider, "auto");
-        assert_eq!(cfg.model, "anthropic-foundry/claude-opus-4-6");
+        assert_eq!(cfg.model, "claude-opus-4-6");
         assert_eq!(cfg.reasoning_effort, Some("high".into()));
-        assert_eq!(cfg.openai_base_url, FOUNDRY_OPENAI_BASE_URL);
-        assert_eq!(cfg.anthropic_base_url, FOUNDRY_ANTHROPIC_BASE_URL);
-        assert_eq!(
-            cfg.openai_api_key.as_deref(),
-            Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER)
-        );
-        assert_eq!(
-            cfg.anthropic_api_key.as_deref(),
-            Some(FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER)
-        );
         assert_eq!(cfg.max_depth, 4);
         assert_eq!(cfg.max_steps_per_call, 100);
-        assert_eq!(cfg.zai_plan, "paygo");
-        assert_eq!(cfg.zai_base_url, ZAI_PAYGO_BASE_URL);
-        assert_eq!(cfg.web_search_provider, "exa");
-        assert_eq!(cfg.brave_base_url, BRAVE_BASE_URL);
-        assert!(cfg.brave_api_key.is_none());
-        assert_eq!(cfg.tavily_base_url, TAVILY_BASE_URL);
-        assert!(cfg.tavily_api_key.is_none());
+        assert!(cfg.budget_extension_enabled);
+        assert_eq!(cfg.budget_extension_block_steps, 20);
+        assert_eq!(cfg.budget_extension_max_blocks, 2);
         assert_eq!(cfg.rate_limit_max_retries, 12);
         assert_eq!(cfg.rate_limit_backoff_base_sec, 1.0);
         assert_eq!(cfg.rate_limit_backoff_max_sec, 60.0);
@@ -480,13 +310,10 @@ mod tests {
 
     #[test]
     fn test_provider_default_models() {
-        assert_eq!(
-            PROVIDER_DEFAULT_MODELS.get("openai"),
-            Some(&"azure-foundry/gpt-5.3-codex")
-        );
+        assert_eq!(PROVIDER_DEFAULT_MODELS.get("openai"), Some(&"gpt-5.2"));
         assert_eq!(
             PROVIDER_DEFAULT_MODELS.get("anthropic"),
-            Some(&"anthropic-foundry/claude-opus-4-6")
+            Some(&"claude-opus-4-6")
         );
         assert_eq!(
             PROVIDER_DEFAULT_MODELS.get("openrouter"),
@@ -496,7 +323,6 @@ mod tests {
             PROVIDER_DEFAULT_MODELS.get("cerebras"),
             Some(&"qwen-3-235b-a22b-instruct-2507")
         );
-        assert_eq!(PROVIDER_DEFAULT_MODELS.get("zai"), Some(&"glm-5"));
         assert_eq!(PROVIDER_DEFAULT_MODELS.get("ollama"), Some(&"llama3.2"));
     }
 
@@ -510,36 +336,24 @@ mod tests {
             "OPENPLANTER_REASONING_EFFORT",
             "OPENPLANTER_OPENAI_API_KEY",
             "OPENAI_API_KEY",
-            "OPENPLANTER_OPENAI_BASE_URL",
-            "OPENPLANTER_BASE_URL",
             "OPENPLANTER_ANTHROPIC_API_KEY",
             "ANTHROPIC_API_KEY",
-            "OPENPLANTER_ANTHROPIC_BASE_URL",
-            "OPENPLANTER_ZAI_API_KEY",
-            "ZAI_API_KEY",
             "OPENPLANTER_MAX_DEPTH",
             "OPENPLANTER_BUDGET_EXTENSION_ENABLED",
             "OPENPLANTER_BUDGET_EXTENSION_BLOCK_STEPS",
             "OPENPLANTER_BUDGET_EXTENSION_MAX_BLOCKS",
             "OPENPLANTER_RECURSIVE",
             "OPENPLANTER_DEMO",
-            "OPENPLANTER_WEB_SEARCH_PROVIDER",
-            "OPENPLANTER_BRAVE_API_KEY",
-            "BRAVE_API_KEY",
-            "OPENPLANTER_BRAVE_BASE_URL",
-            "OPENPLANTER_TAVILY_API_KEY",
-            "TAVILY_API_KEY",
-            "OPENPLANTER_TAVILY_BASE_URL",
-            "OPENPLANTER_ZAI_PLAN",
-            "OPENPLANTER_ZAI_BASE_URL",
             "OPENPLANTER_RATE_LIMIT_MAX_RETRIES",
             "OPENPLANTER_RATE_LIMIT_BACKOFF_BASE_SEC",
             "OPENPLANTER_RATE_LIMIT_BACKOFF_MAX_SEC",
             "OPENPLANTER_RATE_LIMIT_RETRY_AFTER_CAP_SEC",
-            "OPENPLANTER_ZAI_STREAM_MAX_RETRIES",
         ];
         // Save original values
-        let saved: Vec<_> = keys.iter().map(|k| (*k, env::var(k).ok())).collect();
+        let saved: Vec<_> = keys
+            .iter()
+            .map(|k| (*k, env::var(k).ok()))
+            .collect();
 
         // SAFETY: test-only; combined into one test to avoid parallel env mutation
         unsafe {
@@ -551,37 +365,25 @@ mod tests {
 
         let cfg = AgentConfig::from_env("/tmp");
         assert_eq!(cfg.provider, "auto");
-        assert_eq!(cfg.model, "anthropic-foundry/claude-opus-4-6");
+        assert_eq!(cfg.model, "claude-opus-4-6");
         assert_eq!(cfg.reasoning_effort, Some("high".into()));
         assert_eq!(cfg.max_depth, 4);
         assert!(cfg.budget_extension_enabled);
         assert_eq!(cfg.budget_extension_block_steps, 20);
         assert_eq!(cfg.budget_extension_max_blocks, 2);
-        assert!(cfg.recursive);
-        assert!(!cfg.demo);
-        assert_eq!(
-            cfg.openai_api_key.as_deref(),
-            Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER)
-        );
-        assert_eq!(
-            cfg.anthropic_api_key.as_deref(),
-            Some(FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER)
-        );
-        assert!(cfg.zai_api_key.is_none());
-        assert!(cfg.brave_api_key.is_none());
-        assert!(cfg.tavily_api_key.is_none());
-        assert_eq!(cfg.openai_base_url, FOUNDRY_OPENAI_BASE_URL);
-        assert_eq!(cfg.anthropic_base_url, FOUNDRY_ANTHROPIC_BASE_URL);
-        assert_eq!(cfg.web_search_provider, "exa");
         assert_eq!(cfg.rate_limit_max_retries, 12);
         assert_eq!(cfg.rate_limit_backoff_base_sec, 1.0);
         assert_eq!(cfg.rate_limit_backoff_max_sec, 60.0);
         assert_eq!(cfg.rate_limit_retry_after_cap_sec, 120.0);
+        assert!(cfg.recursive);
+        assert!(!cfg.demo);
+        assert!(cfg.openai_api_key.is_none());
+        assert!(cfg.anthropic_api_key.is_none());
 
         unsafe {
             // --- Phase 2: test custom values ---
             env::set_var("OPENPLANTER_PROVIDER", "openai");
-            env::set_var("OPENPLANTER_MODEL", "azure-foundry/gpt-5.3-codex");
+            env::set_var("OPENPLANTER_MODEL", "gpt-5.2");
             env::set_var("OPENPLANTER_REASONING_EFFORT", "low");
             env::set_var("OPENPLANTER_MAX_DEPTH", "8");
             env::set_var("OPENPLANTER_BUDGET_EXTENSION_ENABLED", "false");
@@ -590,42 +392,27 @@ mod tests {
             env::set_var("OPENPLANTER_RECURSIVE", "false");
             env::set_var("OPENPLANTER_DEMO", "true");
             env::set_var("OPENAI_API_KEY", "sk-test123");
-            env::set_var("ZAI_API_KEY", "zai-test123");
-            env::set_var("BRAVE_API_KEY", "brave-test123");
-            env::set_var("TAVILY_API_KEY", "tavily-test123");
-            env::set_var("OPENPLANTER_WEB_SEARCH_PROVIDER", "tavily");
             env::set_var("OPENPLANTER_RATE_LIMIT_MAX_RETRIES", "5");
             env::set_var("OPENPLANTER_RATE_LIMIT_BACKOFF_BASE_SEC", "2.5");
             env::set_var("OPENPLANTER_RATE_LIMIT_BACKOFF_MAX_SEC", "30.0");
             env::set_var("OPENPLANTER_RATE_LIMIT_RETRY_AFTER_CAP_SEC", "90.0");
-            env::set_var("OPENPLANTER_ZAI_PLAN", "coding");
-            env::set_var("OPENPLANTER_ZAI_STREAM_MAX_RETRIES", "7");
-            env::set_var("OPENPLANTER_TAVILY_BASE_URL", "https://tavily.example");
         }
 
         let cfg = AgentConfig::from_env("/tmp");
         assert_eq!(cfg.provider, "openai");
-        assert_eq!(cfg.model, "azure-foundry/gpt-5.3-codex");
+        assert_eq!(cfg.model, "gpt-5.2");
         assert_eq!(cfg.reasoning_effort, Some("low".into()));
         assert_eq!(cfg.max_depth, 8);
         assert!(!cfg.budget_extension_enabled);
         assert_eq!(cfg.budget_extension_block_steps, 9);
         assert_eq!(cfg.budget_extension_max_blocks, 1);
-        assert!(!cfg.recursive);
-        assert!(cfg.demo);
-        assert_eq!(cfg.openai_api_key, Some("sk-test123".into()));
-        assert_eq!(cfg.zai_api_key, Some("zai-test123".into()));
-        assert_eq!(cfg.brave_api_key, Some("brave-test123".into()));
-        assert_eq!(cfg.tavily_api_key, Some("tavily-test123".into()));
-        assert_eq!(cfg.zai_plan, "coding");
-        assert_eq!(cfg.zai_base_url, ZAI_CODING_BASE_URL);
-        assert_eq!(cfg.zai_stream_max_retries, 7);
-        assert_eq!(cfg.web_search_provider, "tavily");
-        assert_eq!(cfg.tavily_base_url, "https://tavily.example");
         assert_eq!(cfg.rate_limit_max_retries, 5);
         assert_eq!(cfg.rate_limit_backoff_base_sec, 2.5);
         assert_eq!(cfg.rate_limit_backoff_max_sec, 30.0);
         assert_eq!(cfg.rate_limit_retry_after_cap_sec, 90.0);
+        assert!(!cfg.recursive);
+        assert!(cfg.demo);
+        assert_eq!(cfg.openai_api_key, Some("sk-test123".into()));
 
         // Restore original values
         for (k, v) in saved {
@@ -637,39 +424,4 @@ mod tests {
             }
         }
     }
-
-    #[test]
-    fn test_normalizers() {
-        assert_eq!(normalize_zai_plan(Some("coding")), "coding");
-        assert_eq!(normalize_zai_plan(Some("bad-value")), "paygo");
-        assert_eq!(
-            resolve_zai_base_url("coding", "https://paygo.example", "https://coding.example"),
-            "https://coding.example"
-        );
-        assert_eq!(
-            normalize_web_search_provider(Some("firecrawl")),
-            "firecrawl"
-        );
-        assert_eq!(normalize_web_search_provider(Some("brave")), "brave");
-        assert_eq!(normalize_web_search_provider(Some("tavily")), "tavily");
-        assert_eq!(normalize_web_search_provider(Some("other")), "exa");
-        assert!(is_foundry_openai_base_url(FOUNDRY_OPENAI_BASE_URL));
-        assert!(is_foundry_anthropic_base_url(FOUNDRY_ANTHROPIC_BASE_URL));
-        assert_eq!(
-            resolve_openai_api_key(None, FOUNDRY_OPENAI_BASE_URL).as_deref(),
-            Some(FOUNDRY_OPENAI_API_KEY_PLACEHOLDER)
-        );
-        assert_eq!(
-            resolve_anthropic_api_key(None, FOUNDRY_ANTHROPIC_BASE_URL).as_deref(),
-            Some(FOUNDRY_ANTHROPIC_API_KEY_PLACEHOLDER)
-        );
-        assert_eq!(
-            strip_foundry_model_prefix("azure-foundry/gpt-5.3-codex"),
-            "gpt-5.3-codex"
-        );
-        assert_eq!(
-            strip_foundry_model_prefix("anthropic-foundry/claude-opus-4-6"),
-            "claude-opus-4-6"
-        );
-    }
 }
diff --git a/openplanter-desktop/crates/op-core/src/events.rs b/openplanter-desktop/crates/op-core/src/events.rs
index a93593dd..5434e4a1 100644
--- a/openplanter-desktop/crates/op-core/src/events.rs
+++ b/openplanter-desktop/crates/op-core/src/events.rs
@@ -199,8 +199,6 @@ pub struct ConfigView {
     pub provider: String,
     pub model: String,
     pub reasoning_effort: Option<String>,
-    pub zai_plan: String,
-    pub web_search_provider: String,
     pub workspace: String,
     pub session_id: Option<String>,
     pub recursive: bool,
@@ -215,8 +213,6 @@ pub struct PartialConfig {
     pub provider: Option<String>,
     pub model: Option<String>,
     pub reasoning_effort: Option<String>,
-    pub zai_plan: Option<String>,
-    pub web_search_provider: Option<String>,
 }
 
 /// Model information for the model list.
diff --git a/openplanter-desktop/crates/op-core/src/model/mod.rs b/openplanter-desktop/crates/op-core/src/model/mod.rs
index 4f2781ec..616c910a 100644
--- a/openplanter-desktop/crates/op-core/src/model/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/model/mod.rs
@@ -8,6 +8,17 @@ use serde::{Deserialize, Serialize};
 use crate::events::DeltaEvent;
 use tokio_util::sync::CancellationToken;
 
+/// Structured model error for provider rate limiting.
+#[derive(Debug, Clone, thiserror::Error)]
+#[error("{message}")]
+pub struct RateLimitError {
+    pub message: String,
+    pub status_code: Option<u16>,
+    pub provider_code: Option<String>,
+    pub body: String,
+    pub retry_after_sec: Option<f64>,
+}
+
 /// A single tool call returned by the model.
 #[derive(Debug, Clone, Serialize, Deserialize)]
 pub struct ToolCall {
diff --git a/openplanter-desktop/crates/op-core/src/model/openai.rs b/openplanter-desktop/crates/op-core/src/model/openai.rs
index 4b1353f6..4eca9ac0 100644
--- a/openplanter-desktop/crates/op-core/src/model/openai.rs
+++ b/openplanter-desktop/crates/op-core/src/model/openai.rs
@@ -5,11 +5,12 @@
 use std::collections::HashMap;
 
 use anyhow::{anyhow, Context};
+use chrono::{DateTime, Utc};
 use reqwest_eventsource::{Event, RequestBuilderExt};
 use tokio_util::sync::CancellationToken;
 
 use crate::events::{DeltaEvent, DeltaKind};
-use super::{BaseModel, Message, ModelTurn, ToolCall};
+use super::{BaseModel, Message, ModelTurn, RateLimitError, ToolCall};
 
 pub struct OpenAIModel {
     client: reqwest::Client,
@@ -131,6 +132,202 @@ impl OpenAIModel {
 
         payload
     }
+
+    fn parse_retry_after_text(text: &str) -> Option<f64> {
+        let trimmed = text.trim();
+        if trimmed.is_empty() {
+            return None;
+        }
+        if let Ok(seconds) = trimmed.parse::<f64>() {
+            return Some(seconds.max(0.0));
+        }
+        let parsed = DateTime::parse_from_rfc2822(trimmed).ok()?;
+        Some(
+            (parsed.with_timezone(&Utc) - Utc::now())
+                .num_milliseconds()
+                .max(0) as f64
+                / 1000.0,
+        )
+    }
+
+    fn parse_retry_after_value(value: Option<&serde_json::Value>) -> Option<f64> {
+        match value {
+            Some(serde_json::Value::Number(num)) => num.as_f64().map(|v| v.max(0.0)),
+            Some(serde_json::Value::String(text)) => Self::parse_retry_after_text(text),
+            _ => None,
+        }
+    }
+
+    fn parse_retry_after_header(headers: &reqwest::header::HeaderMap) -> Option<f64> {
+        let value = headers.get(reqwest::header::RETRY_AFTER)?;
+        let text = value.to_str().ok()?;
+        Self::parse_retry_after_text(text)
+    }
+
+    fn extract_provider_code(value: Option<&serde_json::Value>) -> Option<String> {
+        match value {
+            Some(serde_json::Value::String(text)) => {
+                let trimmed = text.trim();
+                (!trimmed.is_empty()).then(|| trimmed.to_string())
+            }
+            Some(serde_json::Value::Number(num)) => Some(num.to_string()),
+            Some(other) => {
+                let rendered = other.to_string();
+                let trimmed = rendered.trim();
+                (!trimmed.is_empty()).then(|| trimmed.to_string())
+            }
+            None => None,
+        }
+    }
+
+    fn extract_openai_style_error(
+        payload: &serde_json::Value,
+    ) -> (String, Option<String>, Option<f64>) {
+        if let Some(error) = payload.get("error").and_then(|value| value.as_object()) {
+            let message = error
+                .get("message")
+                .and_then(|value| value.as_str())
+                .unwrap_or_default()
+                .trim()
+                .to_string();
+            let provider_code = Self::extract_provider_code(error.get("code"));
+            let retry_after = Self::parse_retry_after_value(error.get("retry_after"))
+                .or_else(|| Self::parse_retry_after_value(payload.get("retry_after")));
+            return (message, provider_code, retry_after);
+        }
+        (
+            String::new(),
+            None,
+            Self::parse_retry_after_value(payload.get("retry_after")),
+        )
+    }
+
+    fn is_rate_limit_error(
+        status_code: Option<u16>,
+        provider_code: Option<&str>,
+        message: &str,
+    ) -> bool {
+        if status_code == Some(429) {
+            return true;
+        }
+        if let Some(code) = provider_code {
+            let code = code.trim().to_lowercase();
+            if matches!(
+                code.as_str(),
+                "1302" | "429" | "rate_limit" | "rate_limit_exceeded" | "too_many_requests"
+            ) {
+                return true;
+            }
+        }
+        let text = message.to_lowercase();
+        text.contains("rate limit") || text.contains("too many requests")
+    }
+
+    fn classify_stream_payload_error(payload: &serde_json::Value) -> Option<anyhow::Error> {
+        let is_error_type = payload
+            .get("type")
+            .and_then(|value| value.as_str())
+            .is_some_and(|value| value == "error");
+        let error = payload.get("error")?;
+        let message = error
+            .get("message")
+            .and_then(|value| value.as_str())
+            .map(str::trim)
+            .filter(|value| !value.is_empty())
+            .map(str::to_string)
+            .unwrap_or_else(|| payload.to_string());
+        let provider_code = Self::extract_provider_code(error.get("code"));
+        let retry_after = Self::parse_retry_after_value(error.get("retry_after"));
+        let prefixed_message = format!("Stream error: {message}");
+
+        if Self::is_rate_limit_error(None, provider_code.as_deref(), &message) {
+            return Some(anyhow::Error::new(RateLimitError {
+                message: prefixed_message,
+                status_code: None,
+                provider_code,
+                body: payload.to_string(),
+                retry_after_sec: retry_after,
+            }));
+        }
+
+        if is_error_type || provider_code.is_some() || payload.get("retry_after").is_some() {
+            return Some(anyhow!(prefixed_message));
+        }
+
+        None
+    }
+
+    async fn classify_sse_error(
+        &self,
+        url: &str,
+        error: reqwest_eventsource::Error,
+    ) -> anyhow::Error {
+        match error {
+            reqwest_eventsource::Error::InvalidStatusCode(status, response) => {
+                self.classify_invalid_status(url, status, response).await
+            }
+            other => anyhow!("SSE stream error: {other}"),
+        }
+    }
+
+    async fn classify_invalid_status(
+        &self,
+        url: &str,
+        status: reqwest::StatusCode,
+        response: reqwest::Response,
+    ) -> anyhow::Error {
+        let response_url = response.url().clone();
+        let headers = response.headers().clone();
+        let body = response.text().await.unwrap_or_default();
+        let parsed = serde_json::from_str::<serde_json::Value>(&body).ok();
+        let mut message = String::new();
+        let mut provider_code = None;
+        let mut retry_after = Self::parse_retry_after_header(&headers);
+
+        if let Some(ref payload) = parsed {
+            let (body_message, body_code, body_retry_after) =
+                Self::extract_openai_style_error(payload);
+            message = body_message;
+            provider_code = body_code;
+            if retry_after.is_none() {
+                retry_after = body_retry_after;
+            }
+        }
+
+        let detail = if !message.is_empty() {
+            message.clone()
+        } else if !body.trim().is_empty() {
+            body.clone()
+        } else {
+            status.to_string()
+        };
+
+        if Self::is_rate_limit_error(Some(status.as_u16()), provider_code.as_deref(), &detail) {
+            return anyhow::Error::new(RateLimitError {
+                message: format!(
+                    "HTTP {} calling {}: {}",
+                    status.as_u16(),
+                    response_url,
+                    detail
+                ),
+                status_code: Some(status.as_u16()),
+                provider_code,
+                body,
+                retry_after_sec: retry_after,
+            });
+        }
+
+        anyhow!(
+            "HTTP {} calling {}: {}",
+            status.as_u16(),
+            if response_url.as_str().is_empty() {
+                url
+            } else {
+                response_url.as_str()
+            },
+            detail
+        )
+    }
 }
 
 #[async_trait::async_trait]
@@ -193,7 +390,7 @@ impl BaseModel for OpenAIModel {
                 Some(Err(reqwest_eventsource::Error::StreamEnded)) => break,
                 Some(Err(e)) => {
                     es.close();
-                    return Err(anyhow!("SSE stream error: {e}"));
+                    return Err(self.classify_sse_error(&url, e).await);
                 }
                 None => break,
             };
@@ -208,6 +405,11 @@ impl BaseModel for OpenAIModel {
                     let chunk: serde_json::Value = serde_json::from_str(&msg.data)
                         .with_context(|| format!("Failed to parse SSE chunk: {}", &msg.data))?;
 
+                    if let Some(error) = Self::classify_stream_payload_error(&chunk) {
+                        es.close();
+                        return Err(error);
+                    }
+
                     // Extract usage from any chunk that has it
                     if let Some(usage) = chunk.get("usage") {
                         if let Some(pt) = usage.get("prompt_tokens").and_then(|v| v.as_u64()) {
diff --git a/openplanter-desktop/crates/op-core/src/tools/mod.rs b/openplanter-desktop/crates/op-core/src/tools/mod.rs
index 6781f4e2..6ae2065d 100644
--- a/openplanter-desktop/crates/op-core/src/tools/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/tools/mod.rs
@@ -37,9 +37,16 @@ impl ToolResult {
     }
 }
 
+#[derive(Debug, Clone)]
+enum ToolScope {
+    FullWorkspace,
+    CuratorWikiOnly { allowed_root: PathBuf },
+}
+
 /// Central dispatcher for workspace tools.
 pub struct WorkspaceTools {
     root: PathBuf,
+    scope: ToolScope,
     shell_path: String,
     command_timeout_sec: u64,
     max_shell_output_chars: usize,
@@ -57,6 +64,7 @@ impl WorkspaceTools {
     pub fn new(config: &AgentConfig) -> Self {
         Self {
             root: config.workspace.clone(),
+            scope: ToolScope::FullWorkspace,
             shell_path: config.shell.clone(),
             command_timeout_sec: config.command_timeout_sec as u64,
             max_shell_output_chars: config.max_shell_output_chars as usize,
@@ -71,6 +79,46 @@ impl WorkspaceTools {
         }
     }
 
+    pub fn new_curator(config: &AgentConfig) -> Self {
+        let allowed_root = filesystem::resolve_path(
+            &config.workspace,
+            &format!("{}/wiki", config.session_root_dir),
+        )
+        .unwrap_or_else(|_| config.workspace.join(&config.session_root_dir).join("wiki"));
+        Self {
+            root: config.workspace.clone(),
+            scope: ToolScope::CuratorWikiOnly { allowed_root },
+            shell_path: config.shell.clone(),
+            command_timeout_sec: config.command_timeout_sec as u64,
+            max_shell_output_chars: config.max_shell_output_chars as usize,
+            max_file_chars: config.max_file_chars as usize,
+            max_files_listed: config.max_files_listed as usize,
+            max_search_hits: config.max_search_hits as usize,
+            max_observation_chars: config.max_observation_chars as usize,
+            exa_api_key: config.exa_api_key.clone(),
+            exa_base_url: config.exa_base_url.clone(),
+            files_read: HashSet::new(),
+            bg_jobs: shell::BgJobs::new(),
+        }
+    }
+
+    fn enforce_write_scope(&self, raw_path: &str) -> Result<(), ToolResult> {
+        match &self.scope {
+            ToolScope::FullWorkspace => Ok(()),
+            ToolScope::CuratorWikiOnly { allowed_root } => {
+                let resolved =
+                    filesystem::resolve_path(&self.root, raw_path).map_err(ToolResult::error)?;
+                if resolved == *allowed_root || resolved.starts_with(allowed_root) {
+                    Ok(())
+                } else {
+                    Err(ToolResult::error(
+                        "Curator writes are restricted to .openplanter/wiki/**".to_string(),
+                    ))
+                }
+            }
+        }
+    }
+
     /// Execute a tool by name with JSON arguments string.
     /// Returns the tool result, clipped to max_observation_chars.
     pub async fn execute(&mut self, name: &str, args_json: &str) -> ToolResult {
@@ -93,12 +141,18 @@ impl WorkspaceTools {
             "write_file" => {
                 let path = args.get("path").and_then(|v| v.as_str()).unwrap_or("");
                 let content = args.get("content").and_then(|v| v.as_str()).unwrap_or("");
+                if let Err(result) = self.enforce_write_scope(path) {
+                    return result;
+                }
                 filesystem::write_file(&self.root, path, content, &mut self.files_read)
             }
             "edit_file" => {
                 let path = args.get("path").and_then(|v| v.as_str()).unwrap_or("");
                 let old_text = args.get("old_text").and_then(|v| v.as_str()).unwrap_or("");
                 let new_text = args.get("new_text").and_then(|v| v.as_str()).unwrap_or("");
+                if let Err(result) = self.enforce_write_scope(path) {
+                    return result;
+                }
                 filesystem::edit_file(
                     &self.root,
                     path,
diff --git a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
index 4e0adf27..cb44a683 100644
--- a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
+++ b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
@@ -464,18 +464,13 @@ async fn test_openai_rate_limit_error_includes_retry_after() {
     }])
     .await;
     let model = OpenAIModel::new(
-        "glm-5".to_string(),
-        "zai".to_string(),
+        "gpt-4o".to_string(),
+        "openai".to_string(),
         format!("http://{addr}"),
-        "zai-key".to_string(),
+        "test-key".to_string(),
         Some("high".to_string()),
         HashMap::new(),
-    )
-    .with_zai_runtime(op_core::model::openai::ZaiRuntimeConfig {
-        paygo_base_url: format!("http://{addr}"),
-        coding_base_url: format!("http://{addr}"),
-        stream_max_retries: 1,
-    });
+    );
 
     let cancel = CancellationToken::new();
     let error = model
@@ -849,17 +844,16 @@ async fn test_solve_rate_limit_retry_eventually_completes() {
     };
 
     let cfg = AgentConfig {
-        provider: "zai".into(),
-        model: "glm-5".into(),
-        zai_api_key: Some("zai-key".into()),
-        zai_base_url: format!("http://{addr}"),
-        zai_paygo_base_url: format!("http://{addr}"),
-        zai_coding_base_url: format!("http://{addr}"),
+        provider: "openai".into(),
+        model: "gpt-4o".into(),
+        api_key: Some("test-key".into()),
+        openai_api_key: Some("test-key".into()),
+        base_url: format!("http://{addr}"),
+        openai_base_url: format!("http://{addr}"),
         rate_limit_max_retries: 1,
         rate_limit_backoff_base_sec: 0.0,
         rate_limit_backoff_max_sec: 0.0,
         rate_limit_retry_after_cap_sec: 0.0,
-        zai_stream_max_retries: 1,
         demo: false,
         ..Default::default()
     };
diff --git a/openplanter-desktop/frontend/src/api/types.ts b/openplanter-desktop/frontend/src/api/types.ts
index bce28406..6464f98c 100644
--- a/openplanter-desktop/frontend/src/api/types.ts
+++ b/openplanter-desktop/frontend/src/api/types.ts
@@ -108,8 +108,6 @@ export interface ConfigView {
   provider: string;
   model: string;
   reasoning_effort: string | null;
-  zai_plan: string;
-  web_search_provider: string;
   workspace: string;
   session_id: string | null;
   recursive: boolean;
@@ -122,8 +120,6 @@ export interface PartialConfig {
   provider?: string;
   model?: string;
   reasoning_effort?: string;
-  zai_plan?: string;
-  web_search_provider?: string;
 }
 
 export interface ModelInfo {
@@ -146,10 +142,7 @@ export interface PersistentSettings {
   default_model_anthropic?: string | null;
   default_model_openrouter?: string | null;
   default_model_cerebras?: string | null;
-  default_model_zai?: string | null;
   default_model_ollama?: string | null;
-  zai_plan?: string | null;
-  web_search_provider?: string | null;
 }
 
 export interface SlashResult {
diff --git a/openplanter-desktop/frontend/src/commands/model.test.ts b/openplanter-desktop/frontend/src/commands/model.test.ts
index f98dfb86..1e8bc2bd 100644
--- a/openplanter-desktop/frontend/src/commands/model.test.ts
+++ b/openplanter-desktop/frontend/src/commands/model.test.ts
@@ -12,12 +12,10 @@ import { appState } from "../state/store";
 describe("inferProvider", () => {
   it("claude returns anthropic", () => {
     expect(inferProvider("claude-opus-4-6")).toBe("anthropic");
-    expect(inferProvider("anthropic-foundry/claude-opus-4-6")).toBe("anthropic");
   });
 
   it("gpt returns openai", () => {
     expect(inferProvider("gpt-5.2")).toBe("openai");
-    expect(inferProvider("azure-foundry/gpt-5.3-codex")).toBe("openai");
   });
 
   it("o1 returns openai", () => {
@@ -36,11 +34,6 @@ describe("inferProvider", () => {
     expect(inferProvider("qwen-3-235b-a22b-instruct-2507")).toBe("cerebras");
   });
 
-  it("glm returns zai", () => {
-    expect(inferProvider("glm-5")).toBe("zai");
-    expect(inferProvider("zai-glm-4.6")).toBe("zai");
-  });
-
   it("qwen without 3 returns ollama", () => {
     expect(inferProvider("qwen2")).toBe("ollama");
   });
@@ -59,15 +52,11 @@ describe("MODEL_ALIASES", () => {
   });
 
   it("opus alias", () => {
-    expect(MODEL_ALIASES["opus"]).toBe("anthropic-foundry/claude-opus-4-6");
+    expect(MODEL_ALIASES["opus"]).toBe("claude-opus-4-6");
   });
 
   it("gpt5 alias", () => {
-    expect(MODEL_ALIASES["gpt5"]).toBe("azure-foundry/gpt-5.3-codex");
-  });
-
-  it("zai alias", () => {
-    expect(MODEL_ALIASES["zai"]).toBe("glm-5");
+    expect(MODEL_ALIASES["gpt5"]).toBe("gpt-5.2");
   });
 });
 
@@ -79,7 +68,6 @@ describe("handleModelCommand", () => {
       ...originalState,
       provider: "anthropic",
       model: "claude-opus-4-6",
-      webSearchProvider: "exa",
     });
   });
 
@@ -107,34 +95,4 @@ describe("handleModelCommand", () => {
     expect(result.action).toBe("handled");
     expect(result.lines.some((l) => l.includes("gpt-5.2"))).toBe(true);
   });
-
-  it("save persists provider-specific model default", async () => {
-    __setHandler("update_config", ({ partial }: { partial: Record<string, string> }) => {
-      expect(partial.model).toBe("glm-5");
-      expect(partial.provider).toBe("zai");
-      return {
-        provider: "zai",
-        model: "glm-5",
-        zai_plan: "coding",
-        workspace: ".",
-        session_id: null,
-        recursive: true,
-        max_depth: 4,
-        max_steps_per_call: 100,
-        reasoning_effort: "high",
-        web_search_provider: "exa",
-        demo: false,
-      };
-    });
-    __setHandler("save_settings", ({ settings }: { settings: Record<string, string> }) => {
-      expect(settings.default_model).toBe("glm-5");
-      expect(settings.default_model_zai).toBe("glm-5");
-    });
-
-    const result = await handleModelCommand("zai --save");
-    expect(result.lines).toContain("(Settings saved)");
-    expect(appState.get().provider).toBe("zai");
-    expect(appState.get().model).toBe("glm-5");
-    expect(appState.get().zaiPlan).toBe("coding");
-  });
 });
diff --git a/openplanter-desktop/frontend/src/components/App.test.ts b/openplanter-desktop/frontend/src/components/App.test.ts
index 1a3d0bd6..5e5e399c 100644
--- a/openplanter-desktop/frontend/src/components/App.test.ts
+++ b/openplanter-desktop/frontend/src/components/App.test.ts
@@ -48,7 +48,7 @@ describe("createApp", () => {
     __setHandler("list_sessions", () => [SESSION_B, SESSION_A]);
     __setHandler("get_credentials_status", () => ({
       openai: true, anthropic: true, openrouter: false,
-      cerebras: false, zai: true, ollama: true, exa: false, firecrawl: true, brave: false, tavily: true, voyage: true,
+      cerebras: false, ollama: true, exa: false,
     }));
     __setHandler("open_session", () => ({
       id: "20260227-120000-cccc3333",
@@ -79,21 +79,13 @@ describe("createApp", () => {
   });
 
   it("renders settings display", () => {
-    appState.update((s) => ({
-      ...s,
-      provider: "zai",
-      model: "glm-5",
-      zaiPlan: "coding",
-      webSearchProvider: "firecrawl",
-    }));
+    appState.update((s) => ({ ...s, provider: "anthropic", model: "claude-opus-4-6" }));
     const root = document.createElement("div");
     createApp(root);
     const settings = root.querySelector(".settings-display");
     expect(settings).not.toBeNull();
-    expect(settings!.textContent).toContain("zai");
-    expect(settings!.textContent).toContain("glm-5");
-    expect(settings!.textContent).toContain("coding");
-    expect(settings!.textContent).toContain("firecrawl");
+    expect(settings!.textContent).toContain("anthropic");
+    expect(settings!.textContent).toContain("claude-opus-4-6");
   });
 
   it("renders credential status", async () => {
@@ -103,7 +95,7 @@ describe("createApp", () => {
 
     await vi.waitFor(() => {
       const creds = root.querySelector(".cred-status");
-      expect(creds!.children.length).toBe(11);
+      expect(creds!.children.length).toBe(6);
       expect(creds!.querySelector(".cred-ok")!.textContent).toContain("openai");
       expect(creds!.querySelector(".cred-missing")!.textContent).toContain("openrouter");
     });
diff --git a/openplanter-desktop/frontend/src/state/store.ts b/openplanter-desktop/frontend/src/state/store.ts
index 8f9a9b2a..5f5cc6ba 100644
--- a/openplanter-desktop/frontend/src/state/store.ts
+++ b/openplanter-desktop/frontend/src/state/store.ts
@@ -66,8 +66,6 @@ export interface ChatMessage {
 export interface AppState {
   provider: string;
   model: string;
-  zaiPlan: string;
-  webSearchProvider: string;
   sessionId: string | null;
   inputTokens: number;
   outputTokens: number;
@@ -90,8 +88,6 @@ export interface AppState {
 export const appState = new Store<AppState>({
   provider: "",
   model: "",
-  zaiPlan: "paygo",
-  webSearchProvider: "exa",
   sessionId: null,
   inputTokens: 0,
   outputTokens: 0,
diff --git a/tests/test_user_stories.py b/tests/test_user_stories.py
index 528e0c27..10513874 100644
--- a/tests/test_user_stories.py
+++ b/tests/test_user_stories.py
@@ -939,7 +939,7 @@ def test_model_alias_resolution(self) -> None:
             ctx = ChatContext(runtime=runtime, cfg=cfg, settings_store=settings_store)
 
             lines = handle_model_command("opus", ctx)
-            self.assertEqual(cfg.model, "anthropic-foundry/claude-opus-4-6")
+            self.assertEqual(cfg.model, "claude-opus-4-6")
             self.assertTrue(any("alias" in l.lower() for l in lines))
 
     def test_reasoning_change_rebuilds_engine(self) -> None:

From 9de15e58a9b6b84a9ad61f376ec3bf1a8e96e923 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 17:51:16 -0400
Subject: [PATCH 57/58] Remove fork-only docs and provider hardening from PR1

---
 .github/prompts/codex-fork-sync.prompt.md     |   30 -
 .github/workflows/codex-fork-sync.yml         |  139 --
 .gitignore                                    |   41 +-
 LICENSE                                       |   21 +
 README.md                                     |   76 +-
 VISION.md                                     |  728 ----------
 agent/model.py                                |  168 +--
 docs/rfcs/0001-typed-investigation-state.md   |  399 ------
 ...research-normalization-and-action-layer.md |  617 ---------
 openplanter-desktop/Cargo.lock                |    1 +
 .../crates/op-core/src/model/mod.rs           |   11 -
 .../crates/op-core/src/model/openai.rs        |  206 +--
 .../op-core/tests/test_model_streaming.rs     | 1174 +----------------
 .../crates/op-tauri/Cargo.toml                |    1 +
 .../frontend/e2e/streaming.spec.ts            |   52 -
 .../frontend/package-lock.json                |    3 -
 .../frontend/src/styles/main.css              |   29 +-
 openplanter-desktop/package.json              |   10 -
 pyproject.toml                                |    7 -
 tests/test_streaming.py                       |   82 --
 uv.lock                                       |  509 -------
 21 files changed, 115 insertions(+), 4189 deletions(-)
 delete mode 100644 .github/prompts/codex-fork-sync.prompt.md
 delete mode 100644 .github/workflows/codex-fork-sync.yml
 create mode 100644 LICENSE
 delete mode 100644 VISION.md
 delete mode 100644 docs/rfcs/0001-typed-investigation-state.md
 delete mode 100644 docs/rfcs/0002-research-normalization-and-action-layer.md
 delete mode 100644 openplanter-desktop/package.json
 delete mode 100644 uv.lock

diff --git a/.github/prompts/codex-fork-sync.prompt.md b/.github/prompts/codex-fork-sync.prompt.md
deleted file mode 100644
index 105e84d6..00000000
--- a/.github/prompts/codex-fork-sync.prompt.md
+++ /dev/null
@@ -1,30 +0,0 @@
-You are running inside GitHub Actions for the fork of the `OpenPlanter` repository.
-
-Your job is to sync the fork with upstream and rebase active fork branches on top of the latest upstream main branch.
-
-Repository layout:
-- `origin` is the fork: `ThomsenDrake/OpenPlanter`
-- `upstream` is the source repo: `ShinMegamiBoson/OpenPlanter`
-
-Constraints:
-- Operate only on refs that have already been fetched locally.
-- Do not run network commands.
-- Do not edit product code, docs, or workflow files.
-- Do not add untracked files.
-- Only manipulate git branches and commits.
-- Leave the repository on the local `main` branch with a clean working tree and no staged changes.
-
-Required outcome:
-1. If `origin/main` already matches `upstream/main`, make no changes and say so.
-2. Otherwise, move local `main` to exactly `upstream/main`.
-3. For every fork branch that exists as `origin/chore/*`:
-   - Create or refresh a matching local `chore/*` branch from the remote branch.
-   - Determine whether it has commits not already contained in `upstream/main`.
-   - If it has unique commits, rebase those commits onto `upstream/main`.
-   - If it is already fully contained in `upstream/main`, leave it alone.
-4. If any rebase hits conflicts, stop immediately and report the branch name plus the conflicting files.
-
-Guidance:
-- Because this is a clean CI checkout, it is acceptable to force local branch pointers when needed.
-- Favor deterministic git commands over exploratory edits.
-- Keep a short summary of what you changed, including branch names and resulting commit SHAs.
diff --git a/.github/workflows/codex-fork-sync.yml b/.github/workflows/codex-fork-sync.yml
deleted file mode 100644
index a9e1f602..00000000
--- a/.github/workflows/codex-fork-sync.yml
+++ /dev/null
@@ -1,139 +0,0 @@
-name: Codex Fork Sync
-
-on:
-  schedule:
-    - cron: "17 * * * *"
-  workflow_dispatch:
-    inputs:
-      force:
-        description: Run even if upstream/main has not moved
-        required: false
-        default: false
-        type: boolean
-
-permissions:
-  contents: write
-
-concurrency:
-  group: codex-fork-sync
-  cancel-in-progress: false
-
-jobs:
-  sync:
-    runs-on: ubuntu-latest
-
-    steps:
-      - name: Check out fork
-        uses: actions/checkout@v5
-        with:
-          fetch-depth: 0
-          ref: main
-
-      - name: Ensure Codex secret exists
-        if: ${{ secrets.OPENAI_API_KEY == '' }}
-        run: |
-          echo "Set the OPENAI_API_KEY repository secret to enable Codex fork sync." >> "$GITHUB_STEP_SUMMARY"
-          echo "Missing OPENAI_API_KEY secret." >&2
-          exit 1
-
-      - name: Prepare git state
-        id: prepare
-        run: |
-          set -euo pipefail
-
-          git remote add upstream https://github.com/ShinMegamiBoson/OpenPlanter.git 2>/dev/null || \
-            git remote set-url upstream https://github.com/ShinMegamiBoson/OpenPlanter.git
-
-          git fetch --prune --no-tags origin '+refs/heads/*:refs/remotes/origin/*'
-          git fetch --prune --no-tags upstream '+refs/heads/*:refs/remotes/upstream/*'
-
-          git config user.name "github-actions[bot]"
-          git config user.email "41898282+github-actions[bot]@users.noreply.github.com"
-
-          upstream_sha="$(git rev-parse upstream/main)"
-          fork_sha="$(git rev-parse origin/main)"
-          changed=false
-
-          if [ "$upstream_sha" != "$fork_sha" ]; then
-            changed=true
-          fi
-
-          if [ "${{ github.event_name }}" = "workflow_dispatch" ] && [ "${{ inputs.force }}" = "true" ]; then
-            changed=true
-          fi
-
-          echo "upstream_sha=$upstream_sha" >> "$GITHUB_OUTPUT"
-          echo "fork_sha=$fork_sha" >> "$GITHUB_OUTPUT"
-          echo "changed=$changed" >> "$GITHUB_OUTPUT"
-
-      - name: Report no-op
-        if: steps.prepare.outputs.changed != 'true'
-        run: |
-          {
-            echo "### Codex Fork Sync"
-            echo
-            echo "No sync needed."
-            echo
-            echo "- upstream/main: \`${{ steps.prepare.outputs.upstream_sha }}\`"
-            echo "- fork/main: \`${{ steps.prepare.outputs.fork_sha }}\`"
-          } >> "$GITHUB_STEP_SUMMARY"
-
-      - name: Run Codex in GitHub Actions
-        if: steps.prepare.outputs.changed == 'true'
-        id: codex
-        uses: openai/codex-action@v1
-        with:
-          openai-api-key: ${{ secrets.OPENAI_API_KEY }}
-          prompt-file: .github/prompts/codex-fork-sync.prompt.md
-          output-file: .codex-fork-sync-summary.md
-          working-directory: .
-          sandbox: danger-full-access
-          safety-strategy: drop-sudo
-          allow-bots: true
-
-      - name: Require clean worktree after Codex
-        if: steps.prepare.outputs.changed == 'true' && success()
-        run: |
-          set -euo pipefail
-          git diff --quiet
-          git diff --cached --quiet
-
-      - name: Push synced branches
-        if: steps.prepare.outputs.changed == 'true' && success()
-        run: |
-          set -euo pipefail
-
-          git push origin main:main
-
-          while IFS= read -r branch; do
-            remote_ref="refs/remotes/origin/${branch}"
-            if ! git show-ref --verify --quiet "$remote_ref"; then
-              continue
-            fi
-
-            local_sha="$(git rev-parse "$branch")"
-            remote_sha="$(git rev-parse "origin/${branch}")"
-
-            if [ "$local_sha" != "$remote_sha" ]; then
-              git push --force-with-lease origin "${branch}:${branch}"
-            fi
-          done < <(git for-each-ref --format='%(refname:short)' refs/heads/chore/)
-
-      - name: Publish Codex summary
-        if: steps.prepare.outputs.changed == 'true' && always()
-        run: |
-          {
-            echo "### Codex Fork Sync"
-            echo
-            echo "- upstream/main before sync: \`${{ steps.prepare.outputs.upstream_sha }}\`"
-            echo "- fork/main before sync: \`${{ steps.prepare.outputs.fork_sha }}\`"
-            echo
-          } >> "$GITHUB_STEP_SUMMARY"
-
-          if [ -f .codex-fork-sync-summary.md ]; then
-            cat .codex-fork-sync-summary.md >> "$GITHUB_STEP_SUMMARY"
-          elif [ "${{ steps.codex.outcome }}" = "success" ]; then
-            echo "Codex completed without a written summary." >> "$GITHUB_STEP_SUMMARY"
-          else
-            echo "Codex did not complete successfully." >> "$GITHUB_STEP_SUMMARY"
-          fi
diff --git a/.gitignore b/.gitignore
index 13fd2565..6c4fc33f 100644
--- a/.gitignore
+++ b/.gitignore
@@ -1,44 +1,11 @@
-# Local environment and workspace state
 .env
 .env.*
-.venv/
-.python-version
-.direnv/
-.openplanter/
-/workspace/
-
-# Python caches and build artifacts
+node_modules/
 __pycache__/
-*.py[cod]
+*.pyc
 *.egg-info/
-.pytest_cache/
-.coverage
-.coverage.*
-htmlcov/
-.mypy_cache/
-.ruff_cache/
-.hypothesis/
-.tox/
-.nox/
-build/
 dist/
-pip-wheel-metadata/
-
-# Frontend and test artifacts
-node_modules/
-coverage/
-playwright-report/
-test-results/
-
-# Rust / Tauri build output
-target/
-
-# Generated captures
+build/
 *.cast
 *.mp4
-git-apply-*.txt
-
-# Editor and OS cruft
-.DS_Store
-.idea/
-.vscode/
+.openplanter/
diff --git a/LICENSE b/LICENSE
new file mode 100644
index 00000000..e8b35c70
--- /dev/null
+++ b/LICENSE
@@ -0,0 +1,21 @@
+MIT License
+
+Copyright (c) 2026 OpenPlanter Contributors
+
+Permission is hereby granted, free of charge, to any person obtaining a copy
+of this software and associated documentation files (the "Software"), to deal
+in the Software without restriction, including without limitation the rights
+to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
+copies of the Software, and to permit persons to whom the Software is
+furnished to do so, subject to the following conditions:
+
+The above copyright notice and this permission notice shall be included in all
+copies or substantial portions of the Software.
+
+THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
+AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
+OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
+SOFTWARE.
diff --git a/README.md b/README.md
index 9775c447..9fa92c1a 100644
--- a/README.md
+++ b/README.md
@@ -1,5 +1,3 @@
-[![Ask DeepWiki](https://deepwiki.com/badge.svg)](https://deepwiki.com/ThomsenDrake/OpenPlanter)
-
 # OpenPlanter
 
 A recursive-language-model investigation agent with a desktop GUI and terminal interface. OpenPlanter ingests heterogeneous datasets — corporate registries, campaign finance records, lobbying disclosures, government contracts, and more — resolves entities across them, and surfaces non-obvious connections through evidence-backed analysis. It operates autonomously with file I/O, shell execution, web search, and recursive sub-agent delegation.
@@ -27,7 +25,7 @@ The desktop app (`openplanter-desktop/`) is a Tauri 2 application with a three-p
 - **Live knowledge graph** — Entities and connections render in real time as the agent works. Switch between force-directed, hierarchical, and circular layouts. Search and filter by category.
 - **Wiki source drawer** — Click any source node to read the full markdown document in a slide-out panel. Internal wiki links navigate between documents and focus the corresponding graph node.
 - **Session persistence** — Investigations are saved automatically. Resume previous sessions or start new ones from the sidebar.
-- **Checkpointed wiki curator synthesizer** — A focused synthesizer runs at explicit loop phase boundaries and projects typed state deltas into concise, provenance-aware wiki updates.
+- **Background wiki curator** — A lightweight agent runs in the background to keep wiki documents consistent and cross-linked.
 - **Multi-provider support** — Switch between OpenAI, Anthropic, OpenRouter, Cerebras, and Ollama (local) from the sidebar.
 
 ### Building from Source
@@ -38,9 +36,6 @@ cd openplanter-desktop
 # Install frontend dependencies
 cd frontend && npm install && cd ..
 
-# Install the Tauri Cargo subcommand
-cargo install tauri-cli --version "^2"
-
 # Run in development mode
 cargo tauri dev
 
@@ -48,7 +43,7 @@ cargo tauri dev
 cargo tauri build
 ```
 
-Requires: Rust stable, Node.js 20+, the Tauri CLI, and platform-specific Tauri dependencies ([see Tauri prerequisites](https://v2.tauri.app/start/prerequisites/)).
+Requires: Rust stable, Node.js 20+, and platform-specific Tauri dependencies ([see Tauri prerequisites](https://v2.tauri.app/start/prerequisites/)).
 
 ## CLI Agent
 
@@ -86,18 +81,12 @@ The container mounts `./workspace` as the agent's working directory.
 
 | Provider | Default Model | Env Var |
 |----------|---------------|---------|
-| OpenAI | `azure-foundry/gpt-5.3-codex` | `OPENAI_API_KEY` |
-| Anthropic | `anthropic-foundry/claude-opus-4-6` | `ANTHROPIC_API_KEY` |
+| OpenAI | `gpt-5.2` | `OPENAI_API_KEY` |
+| Anthropic | `claude-opus-4-6` | `ANTHROPIC_API_KEY` |
 | OpenRouter | `anthropic/claude-sonnet-4-5` | `OPENROUTER_API_KEY` |
 | Cerebras | `qwen-3-235b-a22b-instruct-2507` | `CEREBRAS_API_KEY` |
-| Z.AI | `glm-5` | `ZAI_API_KEY` |
 | Ollama | `llama3.2` | (none — local) |
 
-OpenAI-compatible requests now default to the Azure Foundry proxy at
-`https://foundry-proxy.cheetah-koi.ts.net/openai/v1`, and Anthropic requests
-default to the Anthropic Foundry proxy at
-`https://foundry-proxy.cheetah-koi.ts.net/anthropic/v1`.
-
 ### Local Models (Ollama)
 
 [Ollama](https://ollama.com) runs models locally with no API key. Install Ollama, pull a model (`ollama pull llama3.2`), then:
@@ -110,50 +99,9 @@ openplanter-agent --provider ollama --list-models
 
 The base URL defaults to `http://localhost:11434/v1` and can be overridden with `OPENPLANTER_OLLAMA_BASE_URL` or `--base-url`. The first request may be slow while Ollama loads the model into memory; a 120-second first-byte timeout is used automatically.
 
-### Z.AI Endpoint Plans
-
-Z.AI has two distinct endpoint plans:
-
-- PAYGO endpoint: `https://api.z.ai/api/paas/v4`
-- Coding plan endpoint: `https://api.z.ai/api/coding/paas/v4`
-
-Choose the plan explicitly:
-
-```bash
-export OPENPLANTER_ZAI_PLAN=paygo   # or coding
-```
-
-Or per run:
-
-```bash
-openplanter-agent --provider zai --model glm-5 --zai-plan coding
-```
-
-Advanced overrides:
-
-```bash
-export OPENPLANTER_ZAI_PAYGO_BASE_URL=https://api.z.ai/api/paas/v4
-export OPENPLANTER_ZAI_CODING_BASE_URL=https://api.z.ai/api/coding/paas/v4
-```
-
-`OPENPLANTER_ZAI_BASE_URL` still overrides both plans when set.
-
-### Z.AI Reliability Tuning
-
-Z.AI rate limits (`HTTP 429`, code `1302`) are retried with capped backoff and jitter. For Z.AI streaming connection issues, OpenPlanter also retries up to `OPENPLANTER_ZAI_STREAM_MAX_RETRIES` times.
-
-```bash
-export OPENPLANTER_RATE_LIMIT_MAX_RETRIES=12
-export OPENPLANTER_RATE_LIMIT_BACKOFF_BASE_SEC=1.0
-export OPENPLANTER_RATE_LIMIT_BACKOFF_MAX_SEC=60.0
-export OPENPLANTER_RATE_LIMIT_RETRY_AFTER_CAP_SEC=120.0
-export OPENPLANTER_ZAI_STREAM_MAX_RETRIES=10
-```
-
-Additional service keys: `EXA_API_KEY`, `FIRECRAWL_API_KEY`, `BRAVE_API_KEY`, `TAVILY_API_KEY` (web search), `VOYAGE_API_KEY` (embeddings).
+Additional service keys: `EXA_API_KEY` (web search), `VOYAGE_API_KEY` (embeddings).
 
 All keys can also be set with an `OPENPLANTER_` prefix (e.g. `OPENPLANTER_OPENAI_API_KEY`), via `.env` files in the workspace, or via CLI flags.
-Provider base URLs can also be overridden with `OPENPLANTER_*_BASE_URL`, including `OPENPLANTER_TAVILY_BASE_URL`.
 
 ## Agent Tools
 
@@ -163,7 +111,7 @@ The agent has access to 19 tools, organized around its investigation workflow:
 
 **Shell execution** — `run_shell`, `run_shell_bg`, `check_shell_bg`, `kill_shell_bg` — run analysis scripts, data pipelines, and validation checks.
 
-**Web** — `web_search` (Exa, Firecrawl, Brave, or Tavily), `fetch_url` — pull public records, verify entities, and retrieve supplementary data.
+**Web** — `web_search` (Exa), `fetch_url` — pull public records, verify entities, and retrieve supplementary data.
 
 **Planning & delegation** — `think`, `subtask`, `execute`, `list_artifacts`, `read_artifact` — decompose investigations into focused sub-tasks, each with acceptance criteria and independent verification.
 
@@ -188,9 +136,8 @@ openplanter-agent [options]
 
 | Flag | Description |
 |------|-------------|
-| `--provider NAME` | `auto`, `openai`, `anthropic`, `openrouter`, `cerebras`, `zai`, `ollama` |
+| `--provider NAME` | `auto`, `openai`, `anthropic`, `openrouter`, `cerebras`, `ollama` |
 | `--model NAME` | Model name or `newest` to auto-select |
-| `--zai-plan PLAN` | Z.AI endpoint plan: `paygo` or `coding` |
 | `--reasoning-effort LEVEL` | `low`, `medium`, `high`, or `none` |
 | `--list-models` | Fetch available models from the provider API |
 
@@ -285,11 +232,8 @@ cargo test
 ### CLI Agent
 
 ```bash
-# Install in editable mode with test dependencies
-pip install -e ".[dev]"
-
-# Optional: include Textual extras for UI-focused tests
-pip install -e ".[dev,textual]"
+# Install in editable mode
+pip install -e .
 
 # Run tests
 python -m pytest tests/
@@ -298,7 +242,7 @@ python -m pytest tests/
 python -m pytest tests/ --ignore=tests/test_live_models.py --ignore=tests/test_integration_live.py
 ```
 
-Requires Python 3.10+. Runtime dependencies: `rich`, `prompt_toolkit`, `pyfiglet`.
+Requires Python 3.10+. Dependencies: `rich`, `prompt_toolkit`, `pyfiglet`.
 
 ## License
 
diff --git a/VISION.md b/VISION.md
deleted file mode 100644
index d35d7ccc..00000000
--- a/VISION.md
+++ /dev/null
@@ -1,728 +0,0 @@
-# OpenPlanter: Vision Document
-
-**An Open-Source Intelligence & Data Operations Platform**
-
-*Version 0.1 -- February 2026*
-
----
-
-## Table of Contents
-
-1. [Executive Summary](#1-executive-summary)
-2. [Understanding the Landscape: What Palantir Does](#2-understanding-the-landscape-what-palantir-does)
-3. [Existing Alternatives and Gaps](#3-existing-alternatives-and-gaps)
-4. [Mission Statement](#4-mission-statement)
-5. [Core Feature Set](#5-core-feature-set)
-6. [Architecture Ideas](#6-architecture-ideas)
-7. [What Makes OpenPlanter Different](#7-what-makes-openplanter-different)
-8. [Potential Use Cases](#8-potential-use-cases)
-9. [Phased Roadmap](#9-phased-roadmap)
-10. [Existing Open-Source Building Blocks](#10-existing-open-source-building-blocks)
-11. [Research Sources](#11-research-sources)
-
----
-
-## 1. Executive Summary
-
-Palantir Technologies has built a multi-billion dollar business around a deceptively simple insight: organizations drown in data not because they lack storage or compute, but because they lack a **unified semantic layer** that connects disparate data sources into a coherent model of reality -- and then lets humans and AI agents **act** on that model.
-
-Palantir's moat is not any single algorithm. It is the *integration* -- the ontology layer that turns raw tables into entities and relationships, the visualization tools that let analysts explore those relationships across graphs, maps, and timelines, the action framework that lets decisions flow back into operational systems, and the deployment machinery that makes all of this work in sensitive, air-gapped environments.
-
-No single open-source project replicates this today. But the building blocks exist. **OpenPlanter** is a vision for composing those building blocks into a coherent, open-source platform that delivers Palantir-class capabilities to organizations that cannot afford Palantir, do not want vendor lock-in, or need the transparency that only open source provides.
-
----
-
-## 2. Understanding the Landscape: What Palantir Does
-
-### 2.1 Palantir Gotham (Intelligence & Defense)
-
-Gotham is Palantir's original product, built for intelligence agencies and military organizations. Its core capabilities include:
-
-- **Data Integration**: Connectors to structured sources (databases, ERP, CRM), semi-structured (logs, XML), and unstructured (PDFs, emails, imagery), with heavy investment in deduplication and entity resolution.
-- **Ontology / Entity Graph**: A dynamic ontology that tags entities (persons, phone numbers, addresses, organizations, assets) and places links between them. This is the "digital twin" of the intelligence domain.
-- **Link Analysis (Graph)**: A network analysis canvas where analysts create visual representations of networked data. Users can view aggregated property statistics, organize and style graphs, and annotate them as part of collaborative workflows.
-- **Geospatial Analysis**: Map layers showing entity locations, event timelines, and movement patterns.
-- **Object Explorer**: Top-down analysis enabling users to find entities with similar characteristics and visualize relationships across millions of records.
-- **Collaboration**: Real-time concurrent analysis within Graph and other applications. Shared canvases, annotations, and presentation workflows.
-
-### 2.2 Palantir Foundry (Commercial & Government Operations)
-
-Foundry is the commercial platform -- a "data operating system" for enterprises:
-
-- **Data Integration**: Pipeline-based ingestion from any source, with data transformation and cleaning.
-- **Ontology Layer**: The signature feature. The Foundry Ontology sits on top of datasets and models, connecting them to their real-world counterparts (factories, equipment, products, orders, transactions). It contains both semantic elements (objects, properties, links) and kinetic elements (actions, functions, dynamic security).
-- **Ontology Architecture**: A microservices backend with the Ontology Metadata Service (OMS) defining object types, link types, and action types; the Object Data Funnel orchestrating data writes and indexing; and Object Storage V2 separating indexing from querying for horizontal scalability.
-- **Application Building**: Low-code/no-code tools for building operational applications on top of the ontology.
-- **Workshop & Quiver**: Drag-and-drop application builders for dashboards and operational workflows.
-
-### 2.3 Palantir AIP (Artificial Intelligence Platform)
-
-AIP integrates LLMs and AI agents into the ontology:
-
-- **Ontology-Grounded AI**: AI agents reason over the ontology's entities, relationships, and business logic rather than raw data. The ontology provides "the nouns" (entities) and "the verbs" (actions) of the enterprise.
-- **AIP Agent Studio**: Build, test, and deploy AI agents that can read from and write to the ontology. Agents are sandboxed with specific permissions on data and tools.
-- **AIP Logic**: A no-code environment for building LLM-powered functions that leverage the ontology.
-- **Agents as Functions**: Agents can be published as Functions, making them composable and reusable across the platform.
-
-### 2.4 Palantir Apollo (Continuous Delivery & Operations)
-
-Apollo is the deployment and operations layer:
-
-- **Hub and Spoke Architecture**: A central Apollo Hub manages multiple Spoke environments, each running a Spoke Control Plane that reports telemetry and executes deployment plans.
-- **Pull-Based Deployment**: Instead of pushing code, environments pull updates via subscriptions to Release Channels.
-- **Air-Gapped Support**: Manages software across connected and disconnected environments, critical for defense and regulated industries.
-- **Compliance-Aware**: Built-in controls for FedRAMP, IL5, IL6 accreditation frameworks.
-
-### 2.5 The Palantir "Secret Sauce"
-
-The real power is not any individual product but their integration:
-
-1. **Data goes in** (any format, any source)
-2. **Ontology maps it** to real-world entities and relationships
-3. **Humans explore it** via graphs, maps, timelines, dashboards
-4. **AI reasons over it** grounded in the ontology
-5. **Actions flow back** into operational systems
-6. **Apollo deploys it** anywhere, including air-gapped environments
-7. **Security governs it** at every layer with fine-grained access control
-
----
-
-## 3. Existing Alternatives and Gaps
-
-### 3.1 Commercial Alternatives
-
-| Product | Strengths | Gaps vs. Palantir |
-|---------|-----------|-------------------|
-| **Databricks** | Unified analytics, Delta Lake, MLflow | No ontology layer, no link analysis, no investigative UI |
-| **Snowflake** | Data warehousing, data sharing | Pure storage/compute, no semantic layer |
-| **Dataiku** | End-to-end data science | Weaker on ontology and operational applications |
-| **d.AP (digetiers)** | Ontology-grounded on RDF/OWL open standards | Newer, smaller ecosystem |
-| **DataWalk** | Link analysis, investigative analysis | Proprietary, narrower scope |
-| **Siren** | Investigative intelligence, link analysis | Proprietary, Elasticsearch-based |
-| **C3 AI** | Enterprise AI applications | Proprietary, expensive |
-
-### 3.2 Open-Source Landscape
-
-**What exists today:**
-
-- **Data Integration/ETL**: Apache Airflow, Apache NiFi, Apache Hop, Apache Kafka, Apache Beam, Airbyte, dbt
-- **Data Catalogs/Metadata**: OpenMetadata, DataHub (LinkedIn), Amundsen (Lyft), Apache Atlas
-- **Graph Databases**: Neo4j (Community Edition), JanusGraph, Apache TinkerPop, Apache AGE (Postgres extension)
-- **Entity Resolution**: Zingg (ML-based), Splink (probabilistic), Dedupe (Python)
-- **Knowledge Graphs**: WhyHow Knowledge Graph Studio, Graphiti, KBpedia
-- **Visualization**: Apache Superset (dashboards), Grafana (monitoring), Kepler.gl (geospatial), Gephi (graph), Sigma.js (graph/web)
-- **AI/LLM Frameworks**: LangChain, LlamaIndex, LangGraph, CrewAI, Dify
-- **Authorization**: Casbin, Ory Keto, Permify (Zanzibar-inspired RBAC)
-- **Deployment**: ArgoCD, Flux, Kubernetes
-
-**The critical gap:** No single open-source project or composition of projects provides the **ontology-as-operating-system** experience -- the unified semantic layer that sits between raw data and applications/AI, with integrated entity resolution, link analysis visualization, and action frameworks. Projects exist in silos. The integration *is* the product, and that integration does not exist in open source.
-
-### 3.3 The Closest Attempts
-
-- **Dashjoin**: An open-source low-code platform that establishes a linked data graph over data sources with browsing, searching, editing, AI integration, and GitOps delivery. The closest thing to an integrated Palantir alternative in open source, but significantly smaller in scope and community.
-- **Apache Atlas + JanusGraph + Superset**: A common open-source stack for metadata governance and visualization, but lacks the ontology-driven application layer and investigative UI.
-
----
-
-## 4. Mission Statement
-
-### The Problem
-
-Organizations of all sizes face the same fundamental challenge that Palantir solves for the world's largest governments and enterprises: **their data is fragmented across dozens of systems, in incompatible formats, with no unified way to understand what the data represents in the real world, explore relationships, or act on insights.**
-
-Today, solving this problem requires either (a) paying millions for Palantir, (b) assembling a bespoke stack from dozens of open-source tools with no integration layer, or (c) going without.
-
-### The Mission
-
-**OpenPlanter is a free, open-source data operations platform that unifies data integration, semantic modeling, entity resolution, visual analysis, AI reasoning, and operational action into a single coherent system.**
-
-OpenPlanter makes it possible for any organization -- investigative journalists, humanitarian NGOs, academic researchers, mid-sized enterprises, local governments, open-source intelligence analysts -- to turn fragmented data into an entity-relationship model of their domain, explore it visually, reason over it with AI, and take action.
-
-### Core Principles
-
-1. **Open Source, Always**: Apache 2.0 or similar permissive license. No open-core bait-and-switch.
-2. **Ontology-First**: The semantic model is the core abstraction. Everything else -- ingestion, visualization, AI, actions -- operates through the ontology.
-3. **Composable**: Built as a set of well-defined services with clean APIs. Use the whole platform or individual components.
-4. **AI-Native**: LLM and agent integration is not an afterthought -- it is a first-class capability grounded in the ontology.
-5. **Security by Design**: Fine-grained access control (RBAC + ABAC), audit logging, and data provenance from day one.
-6. **Deploy Anywhere**: Cloud, on-premise, air-gapped, edge. Kubernetes-native with support for disconnected environments.
-
----
-
-## 5. Core Feature Set
-
-### 5.1 Data Integration & Ingestion
-
-**Goal**: Connect to any data source and bring data into the platform with minimal friction.
-
-| Capability | Description | Priority |
-|-----------|-------------|----------|
-| Connectors | Pre-built connectors for databases (Postgres, MySQL, SQL Server, Oracle), cloud storage (S3, GCS, Azure Blob), APIs (REST, GraphQL), files (CSV, JSON, Parquet, XML), messaging (Kafka, RabbitMQ) | MVP |
-| Custom Connectors | SDK for building custom connectors | v1.0 |
-| Stream Ingestion | Real-time data ingestion from streaming sources | v1.0 |
-| Data Transformation | Pipeline-based transformation with versioning | MVP |
-| Incremental Sync | Change data capture and incremental updates | v1.0 |
-| Unstructured Ingestion | PDF, email, document, and image ingestion with AI-powered extraction | v1.5 |
-
-### 5.2 Data Modeling & Ontology
-
-**Goal**: Provide a semantic layer that maps raw data to real-world entities and relationships.
-
-This is the heart of OpenPlanter and the primary differentiator from "just another data tool."
-
-| Capability | Description | Priority |
-|-----------|-------------|----------|
-| Object Types | Define entity types (Person, Organization, Vehicle, Transaction, Event, etc.) with typed properties | MVP |
-| Link Types | Define relationship types between object types (employs, owns, communicated_with, located_at) with properties | MVP |
-| Ontology Editor | Visual and code-based tools for defining and editing the ontology schema | MVP |
-| Data Mapping | Map raw dataset columns to ontology object properties, with transformation rules | MVP |
-| Entity Resolution | ML-assisted deduplication and entity resolution across data sources | MVP |
-| Interface Types | Polymorphic interfaces (like Palantir's) for consistent modeling across object types that share common shapes | v1.0 |
-| Ontology Versioning | Schema versioning with migration support | v1.0 |
-| Derived Properties | Computed properties based on linked objects, aggregations, or functions | v1.0 |
-| Temporal Modeling | First-class support for time-varying properties and historical states | v1.5 |
-
-**Ontology Data Model (Conceptual)**:
-
-```
-ObjectType
-  - id: UUID
-  - name: string (e.g., "Person", "Organization")
-  - properties: PropertyDefinition[]
-  - interfaces: InterfaceType[]
-  - datasource_mappings: DataSourceMapping[]
-
-LinkType
-  - id: UUID
-  - name: string (e.g., "employed_by", "called")
-  - source_type: ObjectType
-  - target_type: ObjectType
-  - properties: PropertyDefinition[]
-  - cardinality: ONE_TO_ONE | ONE_TO_MANY | MANY_TO_MANY
-
-Object (instance)
-  - id: UUID
-  - type: ObjectType
-  - properties: { [key]: value }
-  - provenance: DataSource[]  -- which sources contributed to this object
-  - confidence: float          -- entity resolution confidence
-  - timestamps: { created, modified, valid_from, valid_to }
-
-Link (instance)
-  - id: UUID
-  - type: LinkType
-  - source: Object
-  - target: Object
-  - properties: { [key]: value }
-  - provenance: DataSource[]
-```
-
-### 5.3 Search & Discovery
-
-**Goal**: Find any entity, relationship, or pattern across the entire ontology.
-
-| Capability | Description | Priority |
-|-----------|-------------|----------|
-| Full-Text Search | Search across all object properties with relevance ranking | MVP |
-| Faceted Search | Filter by object type, property values, date ranges, data source | MVP |
-| Graph Traversal Search | "Find all entities within N hops of entity X" | MVP |
-| Saved Searches | Save and share search queries | v1.0 |
-| Natural Language Search | AI-powered "ask a question in plain English" search | v1.0 |
-| Pattern Search | Find subgraph patterns (e.g., "person connected to organization through phone number") | v1.5 |
-
-### 5.4 Visualization & Analytics
-
-**Goal**: Multiple visual paradigms for exploring the ontology -- because different questions require different views.
-
-| Capability | Description | Priority |
-|-----------|-------------|----------|
-| **Graph View** | Interactive link analysis canvas. Expand entities, explore connections, filter, cluster, style nodes/edges. The primary investigative interface. | MVP |
-| **Table View** | Spreadsheet-like view of object collections with sorting, filtering, grouping | MVP |
-| **Map View** | Geospatial visualization of entities with location properties. Layers, clustering, heatmaps. | MVP |
-| **Timeline View** | Temporal visualization of events and entity activity | v1.0 |
-| **Dashboard Builder** | Drag-and-drop dashboard composition from charts, tables, maps, and graphs | v1.0 |
-| **Object Profile** | Detailed view of a single entity with all properties, linked entities, activity timeline, and source provenance | MVP |
-| **Histogram / Charts** | Bar, line, pie, scatter, and other statistical visualizations over ontology data | v1.0 |
-| **Notebook Integration** | Jupyter-style notebook for ad-hoc analysis with access to ontology APIs | v1.5 |
-
-### 5.5 Collaboration
-
-**Goal**: Multiple users working together on investigations, analyses, and operational workflows.
-
-| Capability | Description | Priority |
-|-----------|-------------|----------|
-| Workspaces | Shared project spaces for team collaboration | MVP |
-| Annotations | Add notes, tags, and assessments to any entity or relationship | MVP |
-| Canvas Sharing | Share and co-edit graph, map, and timeline canvases | v1.0 |
-| Comments | Threaded comments on any object, link, or analysis artifact | v1.0 |
-| Activity Feed | See what teammates have been exploring, annotating, or modifying | v1.0 |
-| Audit Trail | Full history of who viewed, modified, or exported what data | MVP |
-
-### 5.6 AI / ML Integration
-
-**Goal**: AI agents that can reason over the ontology, answer questions, and take actions -- grounded in real data, not hallucinations.
-
-| Capability | Description | Priority |
-|-----------|-------------|----------|
-| Ontology-Grounded RAG | LLM queries answered using ontology entities and relationships as context | MVP |
-| Natural Language Query | "Show me all transactions over $10K between Company A and any entity flagged as high-risk" | v1.0 |
-| Entity Extraction (NER) | AI-powered extraction of entities and relationships from unstructured text | v1.0 |
-| AI Agent Framework | Agents with tool-calling that can search the ontology, traverse graphs, create annotations, and suggest actions | v1.0 |
-| Anomaly Detection | ML models that identify unusual patterns in entity behavior or relationships | v1.5 |
-| Agent Sandboxing | Fine-grained permissions for what data and actions agents can access | v1.0 |
-| Model Registry | Register and version ML models, connect outputs to ontology | v1.5 |
-| Bring Your Own LLM | Support for OpenAI, Anthropic, local models (Ollama, vLLM), or any OpenAI-compatible API | MVP |
-
-### 5.7 Actions & Operational Integration
-
-**Goal**: Move from insight to action -- write changes back to source systems, trigger workflows, and automate operational responses.
-
-| Capability | Description | Priority |
-|-----------|-------------|----------|
-| Action Types | Define typed actions (approve, escalate, flag, update, notify) with input/output schemas | v1.0 |
-| Action Execution | Execute actions that write back to source systems via connectors | v1.0 |
-| Workflow Engine | Multi-step workflows triggered by events, schedules, or human decisions | v1.5 |
-| Webhooks | Outbound webhooks on ontology events (entity created, link added, property changed) | v1.0 |
-| Notifications | Alerts and notifications based on ontology events or AI agent findings | v1.0 |
-
-### 5.8 Access Control & Security
-
-**Goal**: Enterprise-grade security that operates at the ontology level, not just the data level.
-
-| Capability | Description | Priority |
-|-----------|-------------|----------|
-| Authentication | SSO (SAML, OIDC), local accounts, API keys | MVP |
-| RBAC | Role-based access control (admin, analyst, viewer, etc.) | MVP |
-| Object-Level Permissions | Control who can see/edit specific object types | MVP |
-| Property-Level Masking | Mask sensitive properties (SSN, financial data) based on role | v1.0 |
-| Row-Level Security | Filter visible objects based on user attributes (department, clearance, geography) | v1.0 |
-| Marking/Classification | Apply classification markings to data and enforce handling rules | v1.5 |
-| Audit Logging | Immutable audit log of all data access, modifications, and exports | MVP |
-| Data Provenance | Track which source contributed each property value, with lineage | MVP |
-
----
-
-## 6. Architecture Ideas
-
-### 6.1 High-Level Architecture
-
-```
-+------------------------------------------------------------------+
-|                        OpenPlanter Platform                       |
-+------------------------------------------------------------------+
-|                                                                    |
-|  +-------------------+  +-------------------+  +----------------+ |
-|  |   Web UI (SPA)    |  |   CLI / SDK       |  |  REST/GraphQL  | |
-|  |   React + D3/     |  |   Python / TS     |  |  API Gateway   | |
-|  |   Sigma.js/Deck.gl|  |                   |  |                | |
-|  +--------+----------+  +--------+----------+  +-------+--------+ |
-|           |                       |                      |         |
-|  +--------v-----------------------v----------------------v------+  |
-|  |                    API Layer (Gateway)                        |  |
-|  |             Authentication | Rate Limiting | Routing          |  |
-|  +---+----------+----------+----------+----------+-----------+--+  |
-|      |          |          |          |          |           |      |
-|  +---v---+ +---v----+ +--v----+ +---v----+ +---v-----+ +--v---+  |
-|  |Ontology| |Search  | |Visual | |  AI    | |Actions  | |Auth  |  |
-|  |Service | |Service | |Service| |Service | |Service  | |Svc   |  |
-|  +---+---+ +---+----+ +--+----+ +---+----+ +---+-----+ +--+---+  |
-|      |         |          |          |          |           |      |
-|  +---v---------v----------v----------v----------v-----------v---+  |
-|  |              Ontology Storage Layer                           |  |
-|  |  +-------------+  +------------+  +-----------------------+  |  |
-|  |  | Graph DB     |  | Search     |  | Object/Relational    |  |  |
-|  |  | (Neo4j/      |  | (Elastic/  |  | Store (Postgres)     |  |  |
-|  |  |  JanusGraph)  |  |  Typesense)|  |                      |  |  |
-|  |  +-------------+  +------------+  +-----------------------+  |  |
-|  +--------------------------------------------------------------+  |
-|                                                                    |
-|  +--------------------------------------------------------------+  |
-|  |              Data Integration Layer                           |  |
-|  |  +----------+  +----------+  +----------+  +-------------+  |  |
-|  |  | Connectors|  | Transform|  | Entity   |  | Pipeline    |  |  |
-|  |  | (Airbyte) |  | (dbt)    |  | Resolver |  | Orchestrator|  |  |
-|  |  |           |  |          |  | (Zingg/  |  | (Airflow/   |  |  |
-|  |  |           |  |          |  |  Splink) |  |  Temporal)  |  |  |
-|  |  +----------+  +----------+  +----------+  +-------------+  |  |
-|  +--------------------------------------------------------------+  |
-|                                                                    |
-|  +--------------------------------------------------------------+  |
-|  |              Infrastructure Layer                             |  |
-|  |  Kubernetes | Helm Charts | Monitoring (Prometheus/Grafana)   |  |
-|  |  Object Storage (MinIO/S3) | Message Queue (Kafka/NATS)      |  |
-|  +--------------------------------------------------------------+  |
-+------------------------------------------------------------------+
-```
-
-### 6.2 Key Architectural Decisions
-
-**Decision 1: Ontology Storage -- Polyglot Persistence**
-
-The ontology needs to be queryable in multiple ways simultaneously:
-- **Graph traversals** (follow relationships N hops) --> Graph database
-- **Full-text search** (find entities by keyword) --> Search engine
-- **Aggregations and analytics** (count, sum, group) --> Relational/columnar database
-- **High-volume writes** (ingest pipelines) --> Write-optimized store
-
-Rather than picking one database, use a **polyglot persistence** approach with an Ontology Storage Layer that writes to multiple backends and keeps them in sync via an event bus:
-
-- **PostgreSQL** (with Apache AGE extension for graph queries): Primary store of record for object and link instances. Proven, reliable, rich ecosystem. AGE adds Cypher query support directly in Postgres.
-- **Elasticsearch or Typesense**: Full-text search index, kept in sync via change data capture.
-- **Neo4j Community Edition or JanusGraph**: Dedicated graph store for deep traversal queries. Neo4j CE for simpler deployments; JanusGraph for distributed scale.
-
-**Decision 2: Ontology Service -- The Central Nervous System**
-
-A dedicated Ontology Service acts as the single API for reading and writing ontology data. All other services (search, visualization, AI, actions) interact with the ontology through this service. This ensures:
-- Consistent schema enforcement
-- Centralized access control
-- Event emission for all mutations (enabling downstream sync and audit)
-
-**Decision 3: Event-Driven Architecture**
-
-All ontology mutations produce events on a message bus (Kafka or NATS):
-- `object.created`, `object.updated`, `object.deleted`
-- `link.created`, `link.updated`, `link.deleted`
-- `action.executed`
-
-This enables:
-- Search index updates
-- Graph database sync
-- Audit logging
-- Webhook delivery
-- AI agent triggers
-- Real-time UI updates via WebSockets
-
-**Decision 4: Frontend -- React with Specialized Visualization Libraries**
-
-- **Core Framework**: React (TypeScript)
-- **Graph Visualization**: Sigma.js (WebGL-based, handles large graphs) or Cytoscape.js
-- **Geospatial**: Deck.gl (WebGL, large-scale) or Leaflet (simpler)
-- **Charts/Dashboards**: Apache ECharts or Recharts
-- **Timeline**: vis-timeline or custom D3-based
-- **Layout**: A workspace model (like VS Code) where users can arrange panels
-
-**Decision 5: AI Integration -- Plugin Architecture**
-
-Rather than hardcoding LLM providers:
-- Define an **LLM Provider Interface** that abstracts model calls
-- Ship adapters for OpenAI, Anthropic, Ollama (local), vLLM
-- Use LangChain or LlamaIndex internally for RAG pipeline
-- Agents use a **Tool** abstraction that maps to ontology operations (search, traverse, annotate, execute action)
-
-### 6.3 Proposed Tech Stack
-
-| Layer | Technology | License | Rationale |
-|-------|-----------|---------|-----------|
-| **Frontend** | React + TypeScript | MIT | Industry standard, massive ecosystem |
-| **Graph Viz** | Sigma.js | MIT | WebGL performance for large graphs |
-| **Geo Viz** | Deck.gl | MIT | High-performance geospatial |
-| **Charts** | Apache ECharts | Apache 2.0 | Rich chart types, good performance |
-| **API Gateway** | Kong or Traefik | Apache 2.0 | API management, auth, rate limiting |
-| **Backend Services** | Python (FastAPI) or Go | MIT / BSD | FastAPI for rapid development; Go for performance-critical services |
-| **Primary DB** | PostgreSQL + Apache AGE | PostgreSQL / Apache 2.0 | Relational + graph in one, proven at scale |
-| **Search** | Typesense or Elasticsearch | GPL-3 / SSPL | Typesense is simpler and truly open; Elasticsearch has larger ecosystem |
-| **Graph DB** (optional) | Neo4j CE or JanusGraph | GPL-3 / Apache 2.0 | Deep traversal queries; optional if AGE suffices |
-| **Message Bus** | NATS or Apache Kafka | Apache 2.0 | NATS for simplicity; Kafka for scale |
-| **Object Storage** | MinIO | AGPL-3.0 | S3-compatible, for documents and files |
-| **Pipeline Orchestration** | Apache Airflow or Temporal | Apache 2.0 / MIT | Airflow for batch; Temporal for event-driven workflows |
-| **Data Connectors** | Airbyte | MIT (Elv2 for some) | 300+ pre-built connectors |
-| **Entity Resolution** | Zingg or Splink | AGPL-3.0 / MIT | ML-based dedup and entity resolution |
-| **AI/RAG** | LangChain + LlamaIndex | MIT | RAG pipeline and agent framework |
-| **Auth** | Keycloak + Casbin | Apache 2.0 | SSO + fine-grained policy engine |
-| **Deployment** | Kubernetes + Helm | Apache 2.0 | Standard cloud-native deployment |
-| **Monitoring** | Prometheus + Grafana | Apache 2.0 | Observability |
-
----
-
-## 7. What Makes OpenPlanter Different
-
-### 7.1 vs. Palantir
-
-| Dimension | Palantir | OpenPlanter |
-|-----------|----------|-------------|
-| **Cost** | Millions per year | Free (self-hosted) |
-| **Transparency** | Proprietary black box | Full source code visibility |
-| **Vendor Lock-in** | Extreme -- data model tied to platform | Open formats, standard APIs, portable ontology |
-| **Customization** | Services engagement required | Fork it, extend it, contribute back |
-| **Community** | Palantir employees only | Open contributor community |
-| **AI Models** | Palantir-selected models | Bring your own -- local, cloud, or any provider |
-| **Deployment** | Palantir-managed | Self-managed with Helm charts, or managed by community providers |
-
-### 7.2 vs. Other Open-Source Tools
-
-| Dimension | Typical OSS Stack | OpenPlanter |
-|-----------|-------------------|-------------|
-| **Integration** | Assemble 10+ tools yourself, build glue code | Integrated platform with shared ontology |
-| **Ontology** | Each tool has its own data model | Single semantic ontology layer across all features |
-| **Entity Resolution** | Run separately, reconcile manually | Built-in, continuous ER feeding the ontology |
-| **Visualization** | Superset for charts, Gephi for graphs, Kepler for maps -- disconnected | Unified workspace with graph, map, timeline, charts sharing one ontology |
-| **AI Grounding** | RAG over raw data | RAG over the ontology -- entities and relationships, not raw tables |
-| **Access Control** | Bolt-on per tool | Ontology-level security that governs all views |
-
-### 7.3 The Core Differentiator
-
-**OpenPlanter's differentiator is the ontology as the universal API.** Every feature -- ingestion, search, visualization, AI, actions, security -- speaks the language of entities and relationships, not tables and columns. This is what makes Palantir powerful, and it is what no open-source project currently provides as a unified, integrated experience.
-
----
-
-## 8. Potential Use Cases
-
-### 8.1 Investigative Journalism
-
-Journalists investigating financial crime, political corruption, or corporate misconduct need to connect entities (people, companies, addresses, bank accounts) from leaked documents, public records, and proprietary databases. OpenPlanter would provide the graph analysis, entity resolution, and document ingestion to do this -- capabilities currently available only through expensive tools or manual effort.
-
-*Example: A newsroom integrates Panama Papers data, corporate registries, and political donation records. OpenPlanter resolves entities across sources and reveals hidden ownership networks.*
-
-### 8.2 Humanitarian & NGO Operations
-
-Organizations like the UNHCR, Red Cross, or Doctors Without Borders manage operations across fragmented data systems -- beneficiary registries, supply chain databases, field reports, geospatial data. OpenPlanter could unify this into a coherent operational picture.
-
-*Example: An NGO integrates refugee registration data, supply depot inventories, and field incident reports to optimize resource allocation and identify underserved areas.*
-
-### 8.3 Open-Source Intelligence (OSINT)
-
-OSINT analysts -- whether in journalism, civil society, or academic research -- need to collect, structure, and analyze publicly available information. OpenPlanter would provide the entity resolution, link analysis, and geospatial tools that are currently locked in expensive proprietary platforms.
-
-*Example: Researchers tracking the spread of disinformation map social media accounts, websites, and funding sources to reveal coordinated influence networks.*
-
-### 8.4 Academic & Scientific Research
-
-Researchers studying complex systems (epidemiology, climate, social networks, supply chains) need to integrate diverse datasets and explore relationships. OpenPlanter's ontology and visualization tools would serve as a research platform.
-
-*Example: Epidemiologists integrate hospital records, genomic data, and mobility data to model disease transmission networks.*
-
-### 8.5 Small/Medium Enterprise Operations
-
-Mid-sized companies that cannot afford Palantir but need to connect their CRM, ERP, supply chain, and financial systems into a coherent view. OpenPlanter could serve as the "data operating system" for companies with 100-10,000 employees.
-
-*Example: A manufacturing company connects their ERP, IoT sensor data, supplier database, and quality control system to get end-to-end visibility into production issues.*
-
-### 8.6 Local Government & Public Sector
-
-City and county governments managing public safety, infrastructure, permits, and social services across disconnected systems. OpenPlanter could provide the unified view that large federal agencies get from Palantir.
-
-*Example: A city government integrates building permits, code violations, fire inspections, and 311 complaints to identify properties that pose safety risks.*
-
-### 8.7 Fraud Detection & Compliance
-
-Financial institutions, insurance companies, and regulatory bodies that need to detect complex fraud patterns across entity networks.
-
-*Example: A credit union integrates transaction data, account records, and external watchlists. OpenPlanter's entity resolution links related accounts, and graph analysis reveals suspicious transaction patterns.*
-
----
-
-## 9. Phased Roadmap
-
-### Phase 0: Foundation (Months 1-3)
-
-**Goal**: Core infrastructure and ontology service that proves the concept.
-
-- [ ] Project scaffolding: monorepo, CI/CD, contribution guidelines, governance
-- [ ] **Ontology Service**: Core API for defining object types, link types, and properties
-- [ ] **PostgreSQL + Apache AGE** storage backend for objects, links, and graph queries
-- [ ] **Basic data ingestion**: CSV and JSON file upload, manual data entry
-- [ ] **Basic entity resolution**: Rule-based deduplication (exact match, fuzzy match on key fields)
-- [ ] **REST API**: Full CRUD on ontology schema and instances
-- [ ] **Authentication**: Basic auth and API keys (Keycloak integration in Phase 1)
-- [ ] **Minimal Web UI**: Object type browser, entity list view, single entity detail page
-
-**Deliverable**: A working ontology service with API, basic ingestion, and a minimal UI that lets you define a schema, import data, resolve entities, and browse entities and their relationships.
-
-### Phase 1: Core Visualization & Search (Months 4-8)
-
-**Goal**: The investigative experience -- graph, map, search, and collaboration.
-
-- [ ] **Graph Visualization**: Interactive link analysis canvas (Sigma.js-based)
-  - Expand/collapse nodes, filter by type, layout algorithms, styling
-  - Select entity in list view --> "Explore in Graph"
-- [ ] **Map View**: Geospatial visualization for entities with location properties (Deck.gl)
-- [ ] **Full-Text Search**: Elasticsearch/Typesense integration with faceted search
-- [ ] **Object Profile Page**: Comprehensive entity view with properties, links, timeline, provenance
-- [ ] **Keycloak SSO Integration**: SAML/OIDC authentication
-- [ ] **RBAC**: Role-based access control at the object type level
-- [ ] **Workspace & Annotations**: Shared workspaces, entity annotations, tagging
-- [ ] **Audit Logging**: Immutable log of all data access and modifications
-- [ ] **Connector SDK**: Framework for building data source connectors
-- [ ] **First connectors**: PostgreSQL, MySQL, REST API, S3/file system
-
-**Deliverable**: An analyst can ingest data from multiple sources, search across entities, explore relationships in a graph canvas, view entities on a map, and collaborate with teammates in shared workspaces.
-
-### Phase 2: AI & Advanced Analytics (Months 9-14)
-
-**Goal**: AI-powered analysis and richer visualization.
-
-- [ ] **LLM Integration**: Configurable LLM provider (OpenAI, Anthropic, Ollama)
-- [ ] **Ontology-Grounded RAG**: "Ask a question" interface that retrieves relevant entities/links as context
-- [ ] **Natural Language Query**: Convert natural language to ontology queries
-- [ ] **Entity Extraction (NER)**: Extract entities and relationships from unstructured text documents
-- [ ] **ML Entity Resolution**: Zingg or Splink integration for probabilistic entity resolution
-- [ ] **Timeline View**: Temporal visualization of entity activity and events
-- [ ] **Dashboard Builder**: Drag-and-drop composition of charts, tables, maps, and graphs
-- [ ] **Row-Level Security**: Filter visible objects based on user attributes
-- [ ] **Pipeline Orchestration**: Airflow/Temporal integration for scheduled ingestion pipelines
-- [ ] **Airbyte Integration**: Access to 300+ data source connectors
-- [ ] **Webhook System**: Outbound webhooks on ontology events
-
-**Deliverable**: An analyst can ask questions in natural language, have AI agents traverse the ontology to find answers, ingest and extract entities from documents, build dashboards, and set up automated data pipelines.
-
-### Phase 3: Actions, Agents & Operational Workflows (Months 15-20)
-
-**Goal**: Transform from an analytical platform into an operational one.
-
-- [ ] **Action Framework**: Define typed actions that write back to source systems
-- [ ] **AI Agent Studio**: Build and deploy agents that can read/write the ontology with tool-calling
-- [ ] **Agent Sandboxing**: Fine-grained permissions for AI agents
-- [ ] **Workflow Engine**: Multi-step, event-triggered workflows
-- [ ] **Notification System**: Alerts based on ontology events or anomalies
-- [ ] **Pattern Search**: Find subgraph patterns across the ontology
-- [ ] **Anomaly Detection**: ML-based detection of unusual patterns
-- [ ] **Property-Level Masking**: Column-level security with data masking
-- [ ] **Classification Markings**: Data classification and handling rules
-- [ ] **Notebook Integration**: Jupyter notebook with ontology SDK
-
-**Deliverable**: The platform is operational -- insights lead to actions, workflows automate responses, AI agents work alongside human analysts, and the security model supports sensitive use cases.
-
-### Phase 4: Scale, Deploy Anywhere & Ecosystem (Months 21+)
-
-**Goal**: Production hardening, deployment flexibility, and community ecosystem.
-
-- [ ] **Horizontal Scaling**: Sharded ontology storage for very large datasets
-- [ ] **Air-Gapped Deployment**: Full functionality without internet access
-- [ ] **Edge Deployment**: Lightweight deployment for resource-constrained environments
-- [ ] **Plugin Marketplace**: Community-contributed connectors, visualizations, AI agents
-- [ ] **Multi-Tenancy**: Shared infrastructure with isolated ontologies
-- [ ] **Federated Ontologies**: Connect multiple OpenPlanter instances while respecting access boundaries
-- [ ] **Compliance Frameworks**: FedRAMP, SOC 2, GDPR compliance tooling
-- [ ] **Mobile UI**: Responsive interface for field use
-- [ ] **Real-Time Collaboration**: Google Docs-style concurrent editing of canvases and annotations
-
----
-
-## 10. Existing Open-Source Building Blocks
-
-One of OpenPlanter's strategic advantages is that it does not need to build everything from scratch. The following projects can serve as foundations:
-
-### 10.1 Data Integration & Pipeline
-
-| Project | What It Provides | How OpenPlanter Uses It | License |
-|---------|------------------|------------------------|---------|
-| **Airbyte** | 300+ pre-built data connectors | Data ingestion from any source | Elv2 (core) / MIT |
-| **Apache Airflow** | Workflow orchestration, DAGs, scheduling | Pipeline orchestration for batch ingestion | Apache 2.0 |
-| **Temporal** | Durable execution, event-driven workflows | Action execution and operational workflows | MIT |
-| **dbt** | SQL-based data transformation | Transform raw data before ontology mapping | Apache 2.0 |
-| **Apache Kafka / NATS** | Event streaming, message bus | Internal event bus for ontology mutations | Apache 2.0 |
-| **Apache NiFi** | Data flow management, visual pipeline builder | Alternative/complement to Airflow for stream processing | Apache 2.0 |
-
-### 10.2 Storage & Search
-
-| Project | What It Provides | How OpenPlanter Uses It | License |
-|---------|------------------|------------------------|---------|
-| **PostgreSQL** | Relational database | Primary store for ontology objects and metadata | PostgreSQL |
-| **Apache AGE** | Graph query extension for PostgreSQL | Graph traversal queries within Postgres | Apache 2.0 |
-| **Neo4j Community** | Native graph database | Deep traversal queries (optional) | GPL-3.0 |
-| **JanusGraph** | Distributed graph database | Large-scale graph workloads (alternative to Neo4j) | Apache 2.0 |
-| **Elasticsearch** | Search engine | Full-text search and faceted filtering | SSPL |
-| **Typesense** | Search engine (simpler, truly open) | Full-text search (alternative to ES) | GPL-3.0 |
-| **MinIO** | S3-compatible object storage | Document and file storage | AGPL-3.0 |
-
-### 10.3 Entity Resolution & Knowledge Graphs
-
-| Project | What It Provides | How OpenPlanter Uses It | License |
-|---------|------------------|------------------------|---------|
-| **Zingg** | ML-based entity resolution at scale | Deduplication and entity matching across sources | AGPL-3.0 |
-| **Splink** | Probabilistic record linkage | Scalable entity resolution (Python, multiple backends) | MIT |
-| **Dedupe** | Python entity resolution library | Lightweight ER for smaller datasets | MIT |
-| **WhyHow KG Studio** | Knowledge graph construction with entity resolution | Reference architecture for ontology management | MIT |
-
-### 10.4 Visualization
-
-| Project | What It Provides | How OpenPlanter Uses It | License |
-|---------|------------------|------------------------|---------|
-| **Sigma.js** | WebGL graph rendering for the web | Link analysis / graph exploration canvas | MIT |
-| **Cytoscape.js** | Graph theory library for visualization | Alternative graph renderer with rich layout algorithms | MIT |
-| **Deck.gl** | WebGL-powered large-scale geospatial visualization | Map view for entities with location data | MIT |
-| **Leaflet** | Lightweight interactive maps | Simpler geospatial view (alternative to Deck.gl) | BSD-2 |
-| **Apache ECharts** | Rich charting library | Dashboard charts and statistical visualizations | Apache 2.0 |
-| **vis-timeline** | Interactive timeline visualization | Timeline view for temporal entity data | MIT/Apache 2.0 |
-| **Gephi** | Desktop graph analysis tool (reference) | Architectural inspiration for graph analysis features | GPL |
-| **Apache Superset** | Dashboard and visualization platform | Reference architecture; possible embed for dashboarding | Apache 2.0 |
-
-### 10.5 AI & ML
-
-| Project | What It Provides | How OpenPlanter Uses It | License |
-|---------|------------------|------------------------|---------|
-| **LangChain** | LLM application framework | RAG pipeline, agent framework, tool integration | MIT |
-| **LlamaIndex** | Data indexing and retrieval for LLMs | Ontology-aware indexing for AI queries | MIT |
-| **LangGraph** | Graph-based agent workflows | Multi-step agent reasoning over ontology | MIT |
-| **Dify** | LLM app development platform | Reference architecture for AI integration | Apache 2.0 |
-| **Ollama** | Local LLM serving | Run models locally for air-gapped deployments | MIT |
-| **vLLM** | High-performance LLM serving | Production LLM inference | Apache 2.0 |
-
-### 10.6 Security & Auth
-
-| Project | What It Provides | How OpenPlanter Uses It | License |
-|---------|------------------|------------------------|---------|
-| **Keycloak** | Identity and access management, SSO | Authentication (SAML, OIDC, LDAP) | Apache 2.0 |
-| **Casbin** | Authorization library (RBAC, ABAC) | Fine-grained policy enforcement | Apache 2.0 |
-| **Permify** | Google Zanzibar-inspired authorization | Relationship-based access control (alternative to Casbin) | Apache 2.0 |
-| **Open Policy Agent (OPA)** | Policy engine | Policy-as-code for complex authorization rules | Apache 2.0 |
-
-### 10.7 Deployment & Operations
-
-| Project | What It Provides | How OpenPlanter Uses It | License |
-|---------|------------------|------------------------|---------|
-| **Kubernetes** | Container orchestration | Deployment platform | Apache 2.0 |
-| **Helm** | Kubernetes package manager | Deployment packaging | Apache 2.0 |
-| **ArgoCD** | GitOps continuous delivery | Automated deployment from Git | Apache 2.0 |
-| **Prometheus + Grafana** | Monitoring and observability | Platform health monitoring | Apache 2.0 |
-
-### 10.8 Data Catalogs (Reference Architecture)
-
-| Project | What It Provides | Relevance |
-|---------|------------------|-----------|
-| **OpenMetadata** | Unified metadata platform | Reference for metadata management and lineage |
-| **DataHub** | Event-driven metadata management | Reference for real-time metadata sync |
-| **Apache Atlas** | Metadata governance for Hadoop | Reference for classification and security integration |
-
----
-
-## 11. Research Sources
-
-- [Palantir Technologies - Wikipedia](https://en.wikipedia.org/wiki/Palantir_Technologies)
-- [What Is Palantir? - Built In](https://builtin.com/articles/what-is-palantir)
-- [Palantir Ontology Overview](https://www.palantir.com/docs/foundry/ontology/overview)
-- [Palantir Ontology Architecture](https://www.palantir.com/docs/foundry/object-backend/overview)
-- [Palantir Ontology Core Concepts](https://www.palantir.com/docs/foundry/ontology/core-concepts)
-- [Understanding Palantir's Ontology: Semantic, Kinetic, and Dynamic Layers](https://pythonebasta.medium.com/understanding-palantirs-ontology-semantic-kinetic-and-dynamic-layers-explained-c1c25b39ea3c)
-- [Palantir AIP Overview](https://www.palantir.com/docs/foundry/aip/overview)
-- [AIP Agent Studio Overview](https://www.palantir.com/docs/foundry/agent-studio/overview)
-- [Palantir Apollo Platform](https://www.palantir.com/platforms/apollo/)
-- [Palantir Gotham Platform](https://www.palantir.com/platforms/gotham/)
-- [Inside Palantir: Gotham - Golding Research](https://goldingresearch.substack.com/p/inside-palantir-gotham)
-- [Demystifying Palantir: Features and Open Source Alternatives - Dashjoin](https://dashjoin.medium.com/demystifying-palantir-features-and-open-source-alternatives-ed3ed39432f9)
-- [8 Best Alternatives to Palantir Foundry in 2026 - d.AP Blog](https://www.digetiers-dap.com/post/palantir-foundry-alternatives)
-- [Top 5 Alternatives to Palantir Foundry - Orchestra](https://www.getorchestra.io/guides/top-5-alternatives-to-palantir-foundry-a-data-engineering-experts-guide)
-- [Dashjoin Platform - GitHub](https://github.com/dashjoin/platform)
-- [WhyHow Knowledge Graph Studio - GitHub](https://github.com/whyhow-ai/knowledge-graph-studio)
-- [Graphiti - Real-Time Knowledge Graphs - GitHub](https://github.com/getzep/graphiti)
-- [Zingg - Entity Resolution - GitHub](https://github.com/zinggAI/zingg)
-- [10 Best Open Source Graph Databases in 2026](https://www.index.dev/blog/top-10-open-source-graph-databases)
-- [JanusGraph vs Neo4j Comparison](https://www.puppygraph.com/blog/janusgraph-vs-neo4j)
-- [Open Source Data Governance Frameworks Analysis](https://thedataguy.pro/blog/2025/08/open-source-data-governance-frameworks/)
-- [Open Source Data Catalog: 2025 Guide](https://atlan.com/open-source-data-catalog-tools/)
-- [Top Open Source ETL Frameworks in 2026](https://www.integrate.io/blog/open-source-etl-frameworks-revolutionizing-data-integration/)
-- [12 Best Open-Source Data Orchestration Tools in 2026](https://airbyte.com/top-etl-tools-for-sources/data-orchestration-tools)
-- [15 Best Open-Source RAG Frameworks in 2026](https://www.firecrawl.dev/blog/best-open-source-rag-frameworks)
-- [Top 5 Open-Source Agentic AI Frameworks in 2026](https://aimultiple.com/agentic-frameworks)
-- [Best Open Source Data Visualization Tools for 2025](https://implex.dev/blog/top-13-best-open-source-data-visualization-tools-for-2025)
-- [Kepler.gl - Geospatial Data Visualization](https://kepler.gl/)
-- [Open Visualization Foundation](https://www.openvisualization.org/)
-- [Top 10 Open Source RBAC Tools in 2026](https://aimultiple.com/open-source-rbac)
-- [Apache Hop - Orchestration Platform](https://hop.apache.org/)
-- [Apache Beam](https://beam.apache.org/)
-- [Siren: Alternative to Palantir](https://siren.io/siren-the-only-true-alternative-to-palantir/)
-- [DataWalk: Palantir Alternative](https://datawalk.com/palantir-alternative/)
-
----
-
-*This document is a living artifact. It represents the initial vision for OpenPlanter and should be revised as the project evolves, the community grows, and real-world usage reveals what matters most.*
diff --git a/agent/model.py b/agent/model.py
index f67b4d2b..30bc3ff7 100644
--- a/agent/model.py
+++ b/agent/model.py
@@ -6,7 +6,6 @@
 import urllib.request
 from dataclasses import dataclass, field
 from datetime import datetime, timezone
-from email.utils import parsedate_to_datetime
 from typing import Any, Callable, Protocol
 
 from .tool_defs import TOOL_DEFINITIONS, to_anthropic_tools, to_openai_tools
@@ -16,27 +15,6 @@ class ModelError(RuntimeError):
     pass
 
 
-class HTTPModelError(ModelError):
-    def __init__(
-        self,
-        message: str,
-        *,
-        status_code: int | None = None,
-        provider_code: str | int | None = None,
-        body: str = "",
-        retry_after_sec: float | None = None,
-    ) -> None:
-        super().__init__(message)
-        self.status_code = status_code
-        self.provider_code = provider_code
-        self.body = body
-        self.retry_after_sec = retry_after_sec
-
-
-class RateLimitError(HTTPModelError):
-    pass
-
-
 # ---------------------------------------------------------------------------
 # Core data types
 # ---------------------------------------------------------------------------
@@ -125,132 +103,6 @@ def _extract_content(content: object) -> str:
     return ""
 
 
-def _parse_json_object(text: str) -> dict[str, Any] | None:
-    try:
-        parsed = json.loads(text)
-    except json.JSONDecodeError:
-        return None
-    if isinstance(parsed, dict):
-        return parsed
-    return None
-
-
-def _parse_retry_after_value(value: object) -> float | None:
-    if value is None:
-        return None
-    if isinstance(value, (int, float)):
-        return max(float(value), 0.0)
-    if isinstance(value, str):
-        text = value.strip()
-        if not text:
-            return None
-        try:
-            return max(float(text), 0.0)
-        except ValueError:
-            pass
-        try:
-            dt = parsedate_to_datetime(text)
-        except (TypeError, ValueError, IndexError):
-            return None
-        if dt.tzinfo is None:
-            dt = dt.replace(tzinfo=timezone.utc)
-        return max((dt - datetime.now(timezone.utc)).total_seconds(), 0.0)
-    return None
-
-
-def _parse_retry_after(headers: Any) -> float | None:
-    if headers is None:
-        return None
-    getter = getattr(headers, "get", None)
-    if not callable(getter):
-        return None
-    return _parse_retry_after_value(getter("Retry-After"))
-
-
-def _extract_openai_style_error(
-    payload: dict[str, Any],
-) -> tuple[str, str | int | None, float | None]:
-    error = payload.get("error")
-    if isinstance(error, dict):
-        message = str(error.get("message", "")).strip()
-        provider_code = error.get("code")
-        retry_after = _parse_retry_after_value(error.get("retry_after"))
-        if retry_after is None:
-            retry_after = _parse_retry_after_value(payload.get("retry_after"))
-        return message, provider_code, retry_after
-    return "", None, _parse_retry_after_value(payload.get("retry_after"))
-
-
-def _is_rate_limit_error(
-    status_code: int | None,
-    provider_code: str | int | None,
-    message: str,
-) -> bool:
-    if status_code == 429:
-        return True
-    if provider_code is not None:
-        code_text = str(provider_code).strip().lower()
-        if code_text in {"1302", "429", "rate_limit", "rate_limit_exceeded", "too_many_requests"}:
-            return True
-    lower = message.lower()
-    return "rate limit" in lower or "too many requests" in lower
-
-
-def _raise_http_error(url: str, status_code: int, body: str, headers: Any) -> None:
-    parsed = _parse_json_object(body)
-    message = ""
-    provider_code: str | int | None = None
-    body_retry_after: float | None = None
-    if parsed is not None:
-        message, provider_code, body_retry_after = _extract_openai_style_error(parsed)
-    retry_after = _parse_retry_after(headers)
-    if retry_after is None:
-        retry_after = body_retry_after
-    text = message or body
-    exc_cls = RateLimitError if _is_rate_limit_error(status_code, provider_code, text) else HTTPModelError
-    raise exc_cls(
-        f"HTTP {status_code} calling {url}: {body}",
-        status_code=status_code,
-        provider_code=provider_code,
-        body=body,
-        retry_after_sec=retry_after,
-    )
-
-
-def _raise_sse_error(data_dict: dict[str, Any]) -> None:
-    if data_dict.get("type") == "error":
-        err = data_dict.get("error")
-        if isinstance(err, dict):
-            err_msg = str(err.get("message", str(data_dict)))
-            provider_code = err.get("code")
-            retry_after = _parse_retry_after_value(err.get("retry_after"))
-            if _is_rate_limit_error(None, provider_code, err_msg):
-                raise RateLimitError(
-                    f"Stream error: {err_msg}",
-                    status_code=None,
-                    provider_code=provider_code,
-                    body=json.dumps(data_dict, ensure_ascii=True),
-                    retry_after_sec=retry_after,
-                )
-            raise ModelError(f"Stream error: {err_msg}")
-        raise ModelError(f"Stream error: {data_dict}")
-
-    err = data_dict.get("error")
-    if isinstance(err, dict):
-        err_msg = str(err.get("message", str(data_dict)))
-        provider_code = err.get("code")
-        retry_after = _parse_retry_after_value(err.get("retry_after"))
-        if _is_rate_limit_error(None, provider_code, err_msg):
-            raise RateLimitError(
-                f"Stream error: {err_msg}",
-                status_code=None,
-                provider_code=provider_code,
-                body=json.dumps(data_dict, ensure_ascii=True),
-                retry_after_sec=retry_after,
-            )
-        raise ModelError(f"Stream error: {err_msg}")
-
-
 def _http_json(
     url: str,
     method: str,
@@ -269,7 +121,7 @@ def _http_json(
             raw = resp.read().decode("utf-8", errors="replace")
     except urllib.error.HTTPError as exc:  # pragma: no cover - network path
         body = exc.read().decode("utf-8", errors="replace")
-        _raise_http_error(url, exc.code, body, exc.headers)
+        raise ModelError(f"HTTP {exc.code} calling {url}: {body}") from exc
     except urllib.error.URLError as exc:  # pragma: no cover - network path
         raise ModelError(f"Connection error calling {url}: {exc}") from exc
     except OSError as exc:  # pragma: no cover - bare socket.timeout, etc.
@@ -324,7 +176,10 @@ def _read_sse_events(
                 except json.JSONDecodeError:
                     data_dict = {"_raw": joined}
                 if isinstance(data_dict, dict):
-                    _raise_sse_error(data_dict)
+                    # Check for Anthropic error events
+                    if data_dict.get("type") == "error":
+                        err_msg = data_dict.get("error", {}).get("message", str(data_dict))
+                        raise ModelError(f"Stream error: {err_msg}")
                     events.append((current_event, data_dict))
                     if on_sse_event:
                         try:
@@ -343,7 +198,9 @@ def _read_sse_events(
         except json.JSONDecodeError:
             data_dict = {"_raw": joined}
         if isinstance(data_dict, dict):
-            _raise_sse_error(data_dict)
+            if data_dict.get("type") == "error":
+                err_msg = data_dict.get("error", {}).get("message", str(data_dict))
+                raise ModelError(f"Stream error: {err_msg}")
             events.append((current_event, data_dict))
             if on_sse_event:
                 try:
@@ -374,7 +231,7 @@ def _http_stream_sse(
             resp = urllib.request.urlopen(req, timeout=first_byte_timeout)
         except urllib.error.HTTPError as exc:
             body = exc.read().decode("utf-8", errors="replace")
-            _raise_http_error(url, exc.code, body, exc.headers)
+            raise ModelError(f"HTTP {exc.code} calling {url}: {body}") from exc
         except (socket.timeout, urllib.error.URLError, OSError) as exc:
             # Timeout or connection error — retry
             last_exc = exc
@@ -897,13 +754,6 @@ def _forward_delta(_event_type: str, data: dict[str, Any]) -> None:
             raise ModelError(f"Model response missing content: {parsed}") from exc
 
         finish_reason = parsed["choices"][0].get("finish_reason", "")
-        if finish_reason == "rate_limit":
-            raise RateLimitError(
-                "Model finish_reason=rate_limit",
-                status_code=429,
-                provider_code="rate_limit",
-                body=json.dumps(parsed, ensure_ascii=True),
-            )
 
         # Parse tool calls
         raw_tool_calls = message.get("tool_calls")
diff --git a/docs/rfcs/0001-typed-investigation-state.md b/docs/rfcs/0001-typed-investigation-state.md
deleted file mode 100644
index ac7c22e1..00000000
--- a/docs/rfcs/0001-typed-investigation-state.md
+++ /dev/null
@@ -1,399 +0,0 @@
-# RFC 0001: Typed `InvestigationState` (Ontology-First Session Memory)
-
-- **Status:** Proposed
-- **Authors:** OpenPlanter team
-- **Created:** 2026-03-13
-- **Target release:** staged rollout over 3 milestones
-- **Scope:** session persistence (`state.json` successor), event/replay projection, runtime APIs for Python + Rust
-
-## 1. Summary
-
-This RFC defines an implementation-ready, typed `InvestigationState` to replace today’s mostly append-only text memory model with an ontology-first graph model centered on:
-
-- entities
-- links
-- claims
-- evidence
-- hypotheses
-- open questions
-- tasks/actions
-- provenance
-- confidence
-
-The current session state is predominantly `external_observations: string[]` with optional turn summaries and loop metrics, which biases memory toward late synthesis and makes structured reasoning (e.g., “which evidence supports this claim?”) difficult to perform incrementally. The new state introduces typed records with stable IDs, lifecycle fields, and confidence/provenance semantics that can be updated throughout the investigation.
-
-## 2. Motivation and Current Gaps
-
-## 2.1 Current Python session state is string-heavy and late-structured
-
-`SessionRuntime._persist_state()` persists `external_observations` as plain strings, plus `turn_history` and `loop_metrics`; no typed entities/claims/evidence graph exists in persisted state. The runtime loads this into `ExternalContext(observations=list[str])`, then injects summaries into prompts for later synthesis. This is useful for continuity, but it is not ontology-native. 
-
-## 2.2 Current events and replay logs are rich but not canonicalized into typed state
-
-- `events.jsonl` captures `objective`, `trace`, `step`, `result`, and artifacts.
-- `replay.jsonl` captures model call records (`header`, `call`, message snapshots/deltas, responses, token usage).
-
-These logs provide temporal traceability, but they are not normalized into first-class analytical objects (claims/evidence/hypotheses/tasks) that can be reasoned over directly.
-
-## 2.3 Python/Rust state model divergence
-
-Rust’s `ExternalContext` currently expects `observations: Vec<Observation{source,timestamp,content}>` from `state.json`, while Python writes `external_observations: string[]`. This creates an interoperability mismatch and makes cross-runtime typed state consumption brittle.
-
-## 2.4 Consequences
-
-- hard to query support/opposition relationships for claims
-- weak provenance granularity (source spans, extraction method, derived-from chain)
-- confidence tracked informally in text, not as updateable fields
-- poor lifecycle tracking for open questions, hypotheses, and tasks
-- expensive/fragile “read all logs, then synthesize” behavior
-
-## 3. Goals and Non-Goals
-
-### 3.1 Goals
-
-1. Define a versioned, typed, ontology-first `InvestigationState` schema.
-2. Preserve append-only logs (`events.jsonl`, `replay.jsonl`) as immutable trace, while introducing a mutable canonical state projection.
-3. Provide deterministic migration from legacy `state.json` and optional bootstrap from replay/events logs.
-4. Define runtime consumption contracts for both Python and Rust.
-5. Enable incremental updates throughout the loop (investigate/build/iterate/finalize), not only final summarization.
-
-### 3.2 Non-Goals
-
-1. Replacing replay/events logging.
-2. Building a global cross-session knowledge graph in this RFC.
-3. Defining UI-level rendering details beyond data contract implications.
-
-## 4. Proposed Data Model
-
-## 4.1 File layout
-
-Within each session directory:
-
-- `investigation_state.json` (**new canonical typed state**)
-- `state.json` (legacy compatibility; transitional)
-- `events.jsonl` (append-only trace, unchanged)
-- `replay.jsonl` (append-only model transcript, unchanged)
-
-## 4.2 Top-level schema
-
-```json
-{
-  "schema_version": "1.0.0",
-  "session_id": "20260313-120000-abc123",
-  "created_at": "2026-03-13T12:00:00Z",
-  "updated_at": "2026-03-13T12:05:00Z",
-  "objective": "Investigate relationships between X and Y",
-  "ontology": {
-    "namespace": "openplanter.core",
-    "version": "2026-03"
-  },
-  "entities": {},
-  "links": {},
-  "claims": {},
-  "evidence": {},
-  "hypotheses": {},
-  "questions": {},
-  "tasks": {},
-  "actions": {},
-  "provenance_nodes": {},
-  "confidence_profiles": {},
-  "timeline": [],
-  "indexes": {
-    "by_external_ref": {},
-    "by_tag": {}
-  },
-  "legacy": {
-    "external_observations": [],
-    "turn_history": [],
-    "loop_metrics": {}
-  }
-}
-```
-
-Design choice: object maps keyed by stable IDs (`ent_`, `clm_`, `ev_`, etc.) rather than only arrays to allow O(1) merge/update and conflict resolution.
-
-## 4.3 Core record types
-
-### 4.3.1 Entity
-
-Represents person/org/location/asset/document/event/concept.
-
-Required fields:
-
-- `id`, `kind`, `canonical_name`, `status`
-- `created_at`, `updated_at`
-- `provenance_ids[]`
-- `confidence_id`
-
-Optional:
-
-- aliases, attributes, external_refs, tags
-
-```json
-{
-  "id": "ent_01H...",
-  "kind": "organization",
-  "canonical_name": "Acme Holdings LLC",
-  "aliases": ["Acme Holdings"],
-  "attributes": {"jurisdiction": "DE"},
-  "external_refs": [{"system": "sec_cik", "value": "0000123456"}],
-  "status": "active",
-  "provenance_ids": ["prov_..."],
-  "confidence_id": "conf_...",
-  "created_at": "...",
-  "updated_at": "..."
-}
-```
-
-### 4.3.2 Link
-
-Typed relationship between two entities (or entity↔claim where needed).
-
-- `source_entity_id`, `target_entity_id`, `predicate`
-- `directional` (bool), `valid_time` (optional interval)
-- provenance + confidence
-
-### 4.3.3 Claim
-
-Atomic proposition that may be supported or contradicted.
-
-- `text`, `claim_type` (`factual`, `attribution`, `quantitative`, etc.)
-- `subject_refs[]` (entity/link IDs)
-- `status` (`proposed`, `supported`, `contested`, `retracted`)
-- `evidence_support_ids[]`, `evidence_contra_ids[]`
-- provenance + confidence
-
-### 4.3.4 Evidence
-
-Observation/excerpt/document-derived fact unit.
-
-- `evidence_type` (`document`, `api_response`, `tool_output`, `human_note`)
-- `content` (normalized value or excerpt)
-- `source_uri`/`artifact_path`/`event_ref`
-- `extraction` metadata (`method`, `extractor_version`, `span`)
-- `hash` (optional dedupe)
-- provenance + confidence
-
-### 4.3.5 Hypothesis
-
-Testable explanatory model composed of one or more claims.
-
-- `statement`
-- `claim_ids[]`
-- `status` (`open`, `plausible`, `weakened`, `rejected`, `accepted`)
-- `test_plan_task_ids[]`
-- provenance + confidence
-
-### 4.3.6 Open Question
-
-Resolvable question with lifecycle.
-
-- `question_text`
-- `priority` (`low|medium|high|critical`)
-- `status` (`open|in_progress|blocked|resolved|won't_fix`)
-- `resolution_claim_id` (optional)
-- `related_entity_ids[]`, `related_hypothesis_ids[]`
-- provenance + confidence
-
-### 4.3.7 Task / Action
-
-Task = planned unit of work. Action = executed step/tool invocation.
-
-Task fields:
-
-- `title`, `description`, `status`, `assignee` (agent/human/system)
-- `depends_on_task_ids[]`, `produced_ids[]`, `consumed_ids[]`
-- `opened_by_question_id`/`opened_by_hypothesis_id`
-
-Action fields:
-
-- `task_id`, `action_type` (`tool_call`, `manual_edit`, `analysis_step`)
-- `started_at`, `ended_at`, `outcome`
-- `event_refs[]`, `replay_refs[]`, `artifact_paths[]`
-
-### 4.3.8 Provenance node
-
-First-class provenance object for source and transformation lineage.
-
-- `source_kind` (`event_log`, `replay_log`, `artifact`, `external_api`, `user_input`)
-- `source_ref` (e.g., `events.jsonl#line:120`, URI, file path)
-- `captured_at`
-- `derived_from_ids[]`
-- `method` (parser/model/tool), `method_version`
-
-### 4.3.9 Confidence profile
-
-Shared representation for confidence + rationale.
-
-- `score` (0.0-1.0)
-- `grade` (`very_low|low|medium|high|very_high`)
-- `dimensions` (source reliability, corroboration, recency, extraction certainty)
-- `rationale` (short text)
-- `updated_by` (agent/tool/user)
-
-## 4.4 Cross-object invariants
-
-1. All referenced IDs MUST exist.
-2. `updated_at >= created_at`.
-3. Closed objects (`resolved/rejected/retracted`) MUST include closure metadata (`closed_at`, `closed_reason`).
-4. Claim status transition to `supported` requires at least one support evidence reference.
-5. Evidence used by claims MUST include provenance.
-6. Confidence profile referenced by object MUST exist (or explicit `null` if unknown is allowed by configuration).
-
-## 5. Lifecycle Model
-
-Each turn updates typed state continuously:
-
-1. **Ingest**: parse tool outputs/events into candidate evidence/entities.
-2. **Normalize**: dedupe, entity resolution, link extraction.
-3. **Assert**: create/update claims and hypothesis weights.
-4. **Plan**: open/close questions; generate/update tasks.
-5. **Act**: execute actions and attach provenance/replay refs.
-6. **Review**: recompute confidence and status transitions.
-7. **Persist**: atomic write of `investigation_state.json` + event emission.
-
-State updates are **idempotent upserts** keyed by IDs or deterministic signatures.
-
-## 6. Migration Plan
-
-## 6.1 Legacy inputs
-
-- `state.json` (primary): `external_observations`, `turn_history`, `loop_metrics`
-- `events.jsonl` (optional enrichment)
-- `replay.jsonl` (optional deep enrichment)
-
-## 6.2 Migration phases
-
-### Phase A (compatibility + scaffold)
-
-- Introduce writer for `investigation_state.json` with top-level metadata and `legacy` block copied from current `state.json`.
-- Build pseudo-evidence from each legacy observation:
-  - `evidence_type = "legacy_observation"`
-  - content = observation string
-  - provenance source = `state.json#external_observations[i]`
-  - confidence = default baseline (e.g., 0.4, low)
-
-### Phase B (log projection backfill)
-
-- Parse `events.jsonl` to synthesize tasks/actions timeline:
-  - `objective` -> task roots
-  - `step` -> action nodes
-  - `result` -> claim/hypothesis candidate notes
-- Parse `replay.jsonl` for optional high-fidelity provenance edges:
-  - map model/tool turns to `action.replay_refs`
-  - attach token/time diagnostics to action metadata
-
-### Phase C (native typed operation)
-
-- Runtime writes typed objects directly during investigation loop.
-- Legacy `state.json` becomes derived compatibility projection (or frozen fallback).
-
-## 6.3 Deterministic ID strategy
-
-Use ULID/UUIDv7 for new runtime objects; for migrated objects optionally derive stable hash IDs from `(session_id, source_ref, normalized_content)` to avoid duplicate backfills.
-
-## 6.4 Conflict handling
-
-- If object exists: merge by field precedence (`new structured parse` > `legacy text parse` > `defaults`).
-- If confidence differs: keep latest score and append to confidence history (optional extension field).
-
-## 7. Runtime Consumption Contracts
-
-## 7.1 Python runtime contract
-
-Add a typed state layer in Python:
-
-- `InvestigationState` dataclasses / pydantic models.
-- Loader order:
-  1. load `investigation_state.json` if present and version-compatible
-  2. else migrate from `state.json` (+ optional logs)
-- During `solve()`, update typed graph incrementally from steps/results.
-- Persist both:
-  - canonical `investigation_state.json`
-  - compatibility `state.json` (minimal projection for older consumers)
-
-Recommended module boundaries:
-
-- `agent/investigation_state/schema.py`
-- `agent/investigation_state/store.py`
-- `agent/investigation_state/migrate.py`
-- `agent/investigation_state/projectors.py` (events/replay -> typed)
-
-## 7.2 Rust runtime contract
-
-Replace/extend `engine::context::ExternalContext` usage with typed equivalents:
-
-- `InvestigationState` serde structs mirroring schema version 1.
-- tolerant deserialization with `#[serde(default)]` for forward-compatible additive fields.
-- loader order identical to Python.
-- provide read APIs for prompt assembly:
-  - high-confidence active claims
-  - unresolved high-priority questions
-  - active hypotheses + recent supporting evidence
-
-Recommended modules:
-
-- `op-core/src/engine/investigation_state.rs`
-- `op-core/src/engine/investigation_migrate.rs`
-- keep `context.rs` as compatibility facade during transition
-
-## 7.3 Interop guarantees
-
-1. Shared JSON schema version and semantic rules.
-2. Unknown fields ignored, known fields validated.
-3. Both runtimes can round-trip without lossy deletion of unknown extension fields.
-
-## 8. Schema Governance and Validation
-
-- Publish JSON Schema at `docs/schemas/investigation_state.schema.json` (follow-up RFC task).
-- Enforce `schema_version` and migration matrix.
-- Add golden session fixtures (legacy + migrated + native typed) for Python/Rust parity tests.
-
-## 9. Rollout Plan
-
-### Milestone 1 (1-2 sprints)
-
-- Write/read scaffold + migration from `state.json`.
-- No prompt changes required yet.
-
-### Milestone 2 (1-2 sprints)
-
-- Event/replay projector for tasks/actions/provenance.
-- Prompt/context assembly begins consuming typed slices.
-
-### Milestone 3 (2+ sprints)
-
-- Full ontology-native loop updates and confidence lifecycle.
-- `state.json` reduced to compatibility export; deprecation notice.
-
-## 10. Backward Compatibility
-
-- Existing sessions remain readable.
-- If only `state.json` exists, runtime auto-migrates in-memory and writes typed file.
-- Legacy clients can continue reading `state.json` until formal removal.
-
-## 11. Risks and Mitigations
-
-- **Risk:** schema over-complexity slows iteration.
-  - **Mitigation:** strict v1 core + extension points.
-- **Risk:** noisy auto-extraction creates low-quality entities/claims.
-  - **Mitigation:** confidence gating and status `proposed` until corroborated.
-- **Risk:** Python/Rust drift.
-  - **Mitigation:** shared fixture suite + contract tests in CI.
-
-## 12. Open Design Questions
-
-1. Should confidence history be first-class now or deferred to v1.1?
-2. Should we store denormalized indexes on disk or rebuild at load?
-3. What minimum evidence requirements are needed before a claim can influence final answers?
-
-## 13. Implementation Checklist
-
-- [ ] Add canonical typed state file and loader in Python
-- [ ] Add migration path from legacy `state.json`
-- [ ] Add optional projectors from `events.jsonl` and `replay.jsonl`
-- [ ] Add canonical typed state structs and loader in Rust
-- [ ] Add compatibility projection writer to legacy `state.json`
-- [ ] Add schema validation + fixtures + parity tests
-- [ ] Update prompt/context assembly to consume typed state slices
-
diff --git a/docs/rfcs/0002-research-normalization-and-action-layer.md b/docs/rfcs/0002-research-normalization-and-action-layer.md
deleted file mode 100644
index d1e57419..00000000
--- a/docs/rfcs/0002-research-normalization-and-action-layer.md
+++ /dev/null
@@ -1,617 +0,0 @@
-# RFC 0002: Research Normalization and Action Planning Extensions to `InvestigationState`
-
-- **Status:** Proposed
-- **Authors:** OpenPlanter contributors
-- **Created:** 2026-03-13
-- **Last Updated:** 2026-03-13
-- **Depends On:** RFC 0001 (`Typed InvestigationState`)
-- **Audience:** Agent/runtime, ontology, and workflow maintainers
-
-## 1. Summary
-
-RFC 0001 established `investigation_state.json` as the canonical persisted session model for ontology-first investigations. This RFC extends that model with two implementation-ready capabilities:
-
-1. **Research normalization**: a deterministic adapter contract for turning heterogeneous research inputs into canonical RFC 0001 state updates.
-2. **Action planning**: a deterministic planning contract for turning unresolved questions into ranked, provenance-backed canonical tasks and subsequent executed actions.
-
-This RFC does **not** introduce a second persisted schema for evidence, claims, questions, or actions. The source of truth remains RFC 0001. Stage 5 defines how source-specific ingestion and planning logic project into that canonical state.
-
-## 2. Relationship to RFC 0001
-
-### 2.1 Source of truth
-
-RFC 0001 remains the authoritative persistence contract:
-
-- `investigation_state.json` is the only canonical mutable session state.
-- `events.jsonl` and `replay.jsonl` remain immutable append-only traces.
-- Python and Rust runtimes MUST persist and read canonical objects using RFC 0001 IDs and top-level collections.
-
-RFC 0002 adds normalization and planning rules for populating these RFC 0001 collections:
-
-- `evidence`
-- `claims`
-- `questions`
-- `tasks`
-- `actions`
-- `provenance_nodes`
-- `confidence_profiles`
-
-### 2.2 No competing top-level records
-
-This RFC intentionally avoids creating new top-level persisted collections such as:
-
-- `next_actions`
-- `normalized_evidence`
-- `claim_queue`
-
-Instead:
-
-- a **normalized evidence envelope** is an adapter-side contract that compiles into canonical RFC 0001 `evidence`, `provenance_nodes`, and `confidence_profiles`;
-- a **next action** is a planner concept that compiles into a canonical RFC 0001 `task`;
-- an executed task produces canonical RFC 0001 `actions`.
-
-### 2.3 Terminology mapping
-
-For the rest of this RFC:
-
-- **Evidence envelope** means an adapter-produced intermediate structure before canonical persistence.
-- **Canonical evidence** means an entry in `InvestigationState.evidence`.
-- **Next action** means a ranked proposed step before admission to state.
-- **Task** means the admitted planned step stored in `InvestigationState.tasks`.
-- **Action** means an executed step stored in `InvestigationState.actions`.
-
-## 3. Goals
-
-1. Define a single normalization contract that all ingestion paths can implement.
-2. Preserve provenance and derivation without introducing a second persistence model.
-3. Standardize how freshness, source reliability, and extraction confidence feed RFC 0001 `confidence_profiles`.
-4. Standardize how unresolved questions produce canonical `tasks`.
-5. Keep the contract deterministic enough that Python and Rust produce the same state shape from the same inputs.
-6. Keep the design compatible with the ontology-first product vision: evidence -> claims -> questions -> tasks -> actions.
-
-## 4. Non-goals
-
-- Replacing RFC 0001.
-- Defining a storage backend.
-- Defining UI pixel details for action queues or lineage views.
-- Replacing domain-specific fetchers, extractors, or entity-resolution systems.
-- Defining a single universal ranking model beyond the default baseline in this RFC.
-
-## 5. Canonical Extension Rules
-
-### 5.1 Canonical persisted objects
-
-RFC 0002 refines, but does not replace, these RFC 0001 objects:
-
-- `Evidence`
-- `Claim`
-- `Question`
-- `Task`
-- `Action`
-- `ProvenanceNode`
-- `ConfidenceProfile`
-
-### 5.2 Status vocabulary alignment
-
-All runtimes MUST use RFC 0001 status vocabularies when persisting canonical objects.
-
-#### Canonical claim statuses
-
-Claims MUST use:
-
-- `proposed`
-- `supported`
-- `contested`
-- `retracted`
-
-This RFC does **not** introduce `disputed` or `rejected` as canonical claim statuses.
-
-#### Canonical question statuses
-
-Questions MUST use:
-
-- `open`
-- `in_progress`
-- `blocked`
-- `resolved`
-- `won't_fix`
-
-This RFC does **not** introduce `abandoned` as a canonical persisted question status. Planner-side abandonment should persist as `won't_fix`.
-
-#### Canonical task statuses
-
-RFC 0001 left `task.status` open-ended. RFC 0002 standardizes research/planning tasks to:
-
-- `open`
-- `ready`
-- `blocked`
-- `running`
-- `completed`
-- `failed`
-- `superseded`
-- `won't_do`
-
-Executed `actions` continue to record actual outcome and trace references.
-
-## 6. Research Normalization Contract
-
-### 6.1 Adapter-side envelope
-
-Each ingestion path MUST first normalize source material into a temporary adapter-side envelope. This envelope is not a new persisted top-level object; it is a write contract for producing canonical RFC 0001 state updates.
-
-```yaml
-NormalizedEvidenceEnvelope:
-  envelope_id: nev_<ULID>
-
-  source:
-    kind: [local_file, web_fetch, transcript, api_response, search_result, analyst_note]
-    source_uri: <file://... | https://... | api://provider/endpoint | note://session/...>
-    title: <best available title>
-    publisher: <org/person/system optional>
-
-  content:
-    raw_ref: <pointer to immutable raw bytes/blob/artifact>
-    normalized_text_ref: <pointer to text projection optional>
-    normalized_structured_ref: <pointer to JSON/table projection optional>
-    primary_excerpt: <short excerpt for canonical Evidence.content>
-    chunks:
-      - chunk_id: ch_<ULID>
-        kind: [paragraph, table_row, json_path, timestamped_utterance, search_hit]
-        locator: <offset/span/xpath/jsonpath/timestamp>
-        text: <chunk text>
-        hash: <sha256>
-
-  provenance:
-    acquisition:
-      observed_at: <UTC>
-      retrieved_at: <UTC>
-      method: <tool name>
-      method_version: <semver/git sha>
-      request_fingerprint: <hash optional>
-      response_fingerprint: <hash optional>
-    derivation:
-      parent_evidence_ids: [ev_...]
-      stage: [decode, ocr, asr, parse, chunk, extract, summarize]
-      run_id: <pipeline run id optional>
-
-  freshness:
-    published_at: <UTC optional>
-    effective_from: <UTC optional>
-    effective_to: <UTC optional>
-    stale_after: <UTC optional>
-    decay_policy: [none, linear, exponential, source_defined]
-    recency_score: <0..1>
-
-  reliability:
-    source_reliability_score: <0..1>
-    extraction_confidence: <0..1>
-    corroboration_score: <0..1 optional>
-    integrity:
-      checksum: <sha256 optional>
-      signature_verified: <bool optional>
-
-  extraction:
-    entity_mentions: [...]
-    relation_mentions: [...]
-    claim_hints: [...]
-
-  governance:
-    sensitivity: [public, internal, restricted]
-    license: <SPDX or source term optional>
-
-  normalization_version: v1
-```
-
-### 6.2 Required envelope fields
-
-At minimum, adapters MUST provide:
-
-- `source.kind`
-- `source.source_uri`
-- `provenance.acquisition.retrieved_at`
-- one of:
-  - `content.raw_ref`
-  - `content.normalized_text_ref`
-  - `content.normalized_structured_ref`
-- `normalization_version`
-
-### 6.3 Canonical projection into RFC 0001
-
-For each envelope, runtimes MUST project into canonical RFC 0001 state as follows:
-
-| Envelope data | Canonical destination |
-| --- | --- |
-| `source.kind`, `primary_excerpt`, source refs | `InvestigationState.evidence[ev_*]` |
-| acquisition + derivation lineage | `InvestigationState.provenance_nodes[prov_*]` |
-| reliability + freshness + corroboration inputs | `InvestigationState.confidence_profiles[conf_*]` |
-| extracted entity mentions / relations | `entities` and `links` updates, when confidence threshold is met |
-| claim hints or verified assertions | `claims` updates |
-| detected uncertainty | `questions` updates |
-
-### 6.4 Canonical `Evidence` extension fields
-
-RFC 0001 defined `Evidence` at a high level. RFC 0002 standardizes these additive fields inside canonical evidence records:
-
-```yaml
-Evidence:
-  id: ev_<ULID>
-  evidence_type: [document, api_response, tool_output, human_note]
-  content: <short normalized excerpt or summary>
-  source_uri: <canonical source URI optional>
-  artifact_path: <workspace/session artifact path optional>
-  event_ref: <events.jsonl ref optional>
-
-  extraction:
-    method: <tool/parser/asr/ocr/extractor>
-    extractor_version: <semver/git sha>
-    span: <primary locator optional>
-    modality: [text, html, json, pdf, audio, video, table, mixed]
-    normalized_text_ref: <artifact/blob ref optional>
-    normalized_structured_ref: <artifact/blob ref optional>
-    chunk_refs: [chunk_id...]
-
-  normalization:
-    kind: [local_file, web_fetch, transcript, api_response, search_result, analyst_note]
-    raw_ref: <artifact/blob ref optional>
-    normalization_version: v1 | legacy-v1
-
-  freshness:
-    published_at: <UTC optional>
-    effective_from: <UTC optional>
-    effective_to: <UTC optional>
-    stale_after: <UTC optional>
-    decay_policy: [none, linear, exponential, source_defined]
-
-  reliability:
-    source_reliability_score: <0..1>
-    extraction_confidence: <0..1>
-    corroboration_score: <0..1 optional>
-
-  governance:
-    sensitivity: [public, internal, restricted]
-    license: <SPDX or source term optional>
-
-  provenance_ids: [prov_...]
-  confidence_id: conf_<...>
-```
-
-These fields are additive refinements to RFC 0001, not a second evidence schema.
-
-### 6.5 Broad evidence type mapping
-
-To avoid fragmenting canonical types, adapters MUST map source kinds into RFC 0001 `evidence_type` as follows:
-
-| Source kind | Canonical `evidence_type` | Canonical `normalization.kind` |
-| --- | --- | --- |
-| `local_file` | `document` | `local_file` |
-| `web_fetch` | `document` | `web_fetch` |
-| `transcript` | `document` | `transcript` |
-| `api_response` | `api_response` | `api_response` |
-| `search_result` | `tool_output` | `search_result` |
-| `analyst_note` | `human_note` | `analyst_note` |
-
-This preserves a compact canonical evidence taxonomy while retaining source-specific semantics in `normalization.kind`.
-
-## 7. Provenance and Derivation
-
-### 7.1 Canonical provenance nodes
-
-Every canonical evidence record used by claims or questions MUST reference one or more RFC 0001 provenance nodes.
-
-At minimum, each envelope MUST produce:
-
-1. one acquisition provenance node describing the original source observation/fetch;
-2. one derivation provenance node when the evidence is derived from prior evidence or transformed content.
-
-### 7.2 Derivation requirements
-
-Derived evidence MUST persist derivation via provenance nodes using RFC 0001 `derived_from_ids[]`.
-
-This requirement applies to:
-
-- OCR output from PDFs/images
-- ASR output from audio/video
-- extracted chunks from structured or unstructured documents
-- search result records derived from a provider response
-- summaries or transformed projections used for downstream claim extraction
-
-### 7.3 Search result lineage
-
-Search result evidence MUST remain distinct from fetched-page evidence.
-
-If a search result leads to a later fetch:
-
-- the search result remains canonical evidence;
-- the fetched page becomes a second canonical evidence record;
-- derivation/provenance links connect the later fetch to the originating search result.
-
-This preserves replayability and ranking provenance.
-
-## 8. Confidence and Freshness Composition
-
-### 8.1 Source of truth
-
-Raw confidence-related signals may live on canonical `Evidence`, but the authoritative merged score for downstream reasoning MUST be the RFC 0001 `confidence_profile` referenced by `confidence_id`.
-
-### 8.2 Required confidence dimensions
-
-The canonical confidence profile produced from normalized evidence MUST include these dimensions when available:
-
-- `source_reliability`
-- `extraction_certainty`
-- `recency`
-- `corroboration`
-
-### 8.3 Default composition rule
-
-Unless an investigation profile explicitly overrides it, runtimes MUST compute:
-
-`score = (0.35 * source_reliability) + (0.30 * extraction_certainty) + (0.20 * recency) + (0.15 * corroboration)`
-
-Rules:
-
-- if a dimension is unavailable, treat it as unknown rather than zero;
-- renormalize weights across known dimensions;
-- store both the final score and the per-dimension values in the confidence profile.
-
-### 8.4 Freshness semantics
-
-Freshness affects confidence as a weighting factor, not a hard validity switch, unless the source itself defines an explicit validity window.
-
-Default decay policies:
-
-- `none`: historical facts with stable long-term validity
-- `linear`: slow decay for routine public records
-- `exponential`: rapidly aging operational or news-like data
-- `source_defined`: provider-specific explicit staleness rules
-
-Domain-specific presets may be added later, but all runtimes MUST support the same four baseline policies.
-
-## 9. Claims, Questions, and Uncertainty
-
-### 9.1 Claims
-
-Claims generated from normalized evidence MUST persist as RFC 0001 `claims` and MUST follow RFC 0001 invariants:
-
-- `supported` requires at least one support evidence reference;
-- `contested` is used when contradictory evidence materially exists;
-- `retracted` is used when the claim should no longer participate in active reasoning.
-
-### 9.2 Question creation triggers
-
-Runtimes MUST open or update canonical RFC 0001 questions when any of the following occur:
-
-- an entity remains unresolved after resolution attempts;
-- a material claim lacks sufficient supporting evidence;
-- support and contradiction evidence materially conflict;
-- required freshness threshold is not met for a claim-critical evidence set;
-- a task cannot proceed because required inputs are missing.
-
-### 9.3 Canonical question extension fields
-
-RFC 0002 adds these optional question fields:
-
-```yaml
-Question:
-  origin:
-    evidence_ids: [ev_...]
-    claim_ids: [cl_...]
-    trigger: [missing_evidence, unresolved_entity, contradiction, freshness_risk, dependency_gap]
-```
-
-Canonical question priority remains RFC 0001 `priority`:
-
-- `low`
-- `medium`
-- `high`
-- `critical`
-
-## 10. Action Planning as Canonical Tasks
-
-### 10.1 Core rule
-
-A "next action" is a planner concept, not a persisted top-level schema object.
-
-When admitted to canonical state, a next action MUST be persisted as an RFC 0001 `task`. When executed, that task produces one or more RFC 0001 `actions`.
-
-### 10.2 Canonical task planning extension
-
-RFC 0002 standardizes these additive task fields:
-
-```yaml
-Task:
-  title: <short user-facing action description>
-  description: <why this task exists>
-  status: [open, ready, blocked, running, completed, failed, superseded, won't_do]
-  assignee: [agent, human, system]
-  depends_on_task_ids: [task_...]
-  produced_ids: [claim_id | evidence_id | entity_id ...]
-  consumed_ids: [claim_id | evidence_id | entity_id ...]
-  opened_by_question_id: q_<...>
-
-  planning:
-    action_type: [
-      fetch,
-      search,
-      extract,
-      resolve_entity,
-      verify_claim,
-      request_human_input,
-      external_write,
-      monitor
-    ]
-    required_inputs:
-      evidence_ids: [ev_...]
-      entity_ids: [ent_...]
-      claim_ids: [cl_...]
-      external_dependencies: [api_key:provider, tool:ocr_v2]
-    payoff:
-      uncertainty_reduction: <0..1>
-      decision_impact: <0..1>
-      graph_expansion_value: <0..1>
-      estimated_cost: <normalized scalar or structured estimate>
-      payoff_score: <normalized scalar>
-    suggested_tools: [web_search, fetch_url, read_file, ...]
-    acceptance_criteria:
-      - <completion criterion>
-    stop_conditions:
-      - <stop condition>
-    generated_by: <planner component + version>
-    generated_at: <UTC>
-```
-
-### 10.3 Task readiness
-
-Task readiness rules:
-
-- `ready`: all required inputs and dependencies are available;
-- `blocked`: one or more required inputs or dependencies are unresolved;
-- `open`: admitted to state but not yet scheduled;
-- `running`: currently being executed;
-- `completed` / `failed` / `superseded` / `won't_do`: closed outcomes.
-
-Blocked tasks SHOULD include dependency hints in `description` or `planning.required_inputs`.
-
-### 10.4 Default payoff scoring
-
-Unless a profile override exists, planners MUST compute:
-
-`payoff_score = (0.45 * uncertainty_reduction) + (0.35 * decision_impact) + (0.20 * graph_expansion_value) - cost_penalty`
-
-Where:
-
-- `cost_penalty` is normalized from estimated latency, compute, API spend, and human effort;
-- payoff is advisory for ranking, not a replacement for policy constraints or explicit human ordering.
-
-## 11. Executed Actions
-
-When a task is executed, runtimes MUST persist canonical RFC 0001 `actions` with:
-
-- `task_id`
-- `action_type`
-- `started_at`
-- `ended_at`
-- `outcome`
-- `event_refs[]`
-- `replay_refs[]`
-- `artifact_paths[]`
-
-This is the only canonical record of execution. Planner metadata stays on the task; execution trace stays on actions and append-only logs.
-
-## 12. Source-Specific Adapter Rules
-
-### 12.1 Local files
-
-- MUST produce `normalization.kind=local_file`
-- SHOULD fingerprint raw bytes
-- SHOULD emit paragraph or structured chunks when feasible
-
-### 12.2 Web fetches
-
-- MUST preserve the final canonical URL in `source_uri`
-- SHOULD preserve redirect and HTTP metadata in provenance details
-- SHOULD retain raw HTML/PDF bytes plus extracted text projection when possible
-
-### 12.3 Transcripts
-
-- MUST record ASR engine and version in provenance
-- SHOULD emit `timestamped_utterance` chunks
-- SHOULD persist diarization metadata when available
-
-### 12.4 API responses
-
-- MUST persist request fingerprint and endpoint identity
-- SHOULD retain normalized structured projection as the primary representation
-- SHOULD capture pagination context when relevant
-
-### 12.5 Search results
-
-- MUST persist each result item as separate canonical evidence
-- MUST record provider, rank, and score in provenance or extraction metadata
-- MUST remain distinct from follow-up fetch evidence
-
-### 12.6 Analyst notes
-
-Human-authored notes are standardized as:
-
-- `evidence_type=human_note`
-- `normalization.kind=analyst_note`
-- provenance `source_kind=user_input` or equivalent compatible source
-
-This resolves the earlier ambiguity around modeling notes.
-
-## 13. Workflow Integration
-
-RFC 0002 extends the RFC 0001 lifecycle, not replaces it:
-
-1. **Ingest**: fetch/read/receive source data.
-2. **Normalize**: emit `NormalizedEvidenceEnvelope`.
-3. **Project**: write canonical evidence, provenance nodes, confidence profiles, and derived entities/claims/questions.
-4. **Plan**: rank candidate next actions and admit selected ones as canonical tasks.
-5. **Act**: execute tasks and persist canonical actions plus append-only trace references.
-6. **Review**: recompute claim status, question status, and confidence after new evidence arrives.
-7. **Persist**: atomically update `investigation_state.json`.
-
-## 14. Backward Compatibility and Migration
-
-### 14.1 Legacy adapters
-
-Existing fetch/extract scripts remain valid if they can emit the adapter-side envelope defined here.
-
-### 14.2 Legacy normalization marker
-
-Legacy data MUST use:
-
-- `Evidence.normalization.normalization_version = legacy-v1`
-
-This replaces the ambiguous earlier `normalization_version=legacy` wording.
-
-### 14.3 Migration boundary
-
-Migration still follows RFC 0001:
-
-- legacy records are projected into canonical `investigation_state.json`;
-- this RFC only refines how evidence and planning fields are populated during that migration and during native operation.
-
-## 15. Minimal Implementation Plan
-
-### Phase 1: Canonical evidence extension
-
-- Add adapter interfaces that emit `NormalizedEvidenceEnvelope`.
-- Extend canonical RFC 0001 `Evidence` writes with `normalization`, `freshness`, `reliability`, and `governance`.
-- Extend canonical provenance and confidence writers to support derivation and confidence composition.
-
-### Phase 2: Claim/question projection
-
-- Project extraction output into canonical `claims`, `questions`, `entities`, and `links`.
-- Enforce RFC 0001 claim and question vocabularies.
-
-### Phase 3: Task planning
-
-- Add planner that ranks candidate next actions.
-- Admit ranked candidates as canonical `tasks` with `planning` metadata.
-- Preserve execution traces as canonical `actions`.
-
-### Phase 4: Observability
-
-- Add lineage views for claim -> evidence -> provenance -> raw source.
-- Add task diagnostics for blocked inputs, ranking rationale, and payoff fields.
-
-## 16. Acceptance Criteria
-
-This RFC is accepted when:
-
-1. Every ingestion pathway can emit the adapter-side envelope and persist canonical RFC 0001 evidence/provenance/confidence updates.
-2. No new competing top-level persisted collection is introduced for normalized evidence or next actions.
-3. Every claim persisted from normalized evidence uses RFC 0001 claim statuses and is traceable to canonical evidence plus provenance nodes.
-4. Every high/critical open question can produce at least one canonical task with planning metadata, unless explicitly marked `won't_fix`.
-5. Executed tasks produce canonical actions with event and replay references.
-6. Python and Rust runtimes can project the same source input into materially equivalent canonical state.
-
-## 17. Deferred Questions
-
-The following are intentionally deferred because they do not block the core contract in this RFC:
-
-1. Domain-specific freshness presets beyond the baseline decay policies.
-2. Profile-specific payoff weighting beyond the default baseline.
-3. Whether search-result deduplication should collapse visually in the UI while remaining distinct canonically in state.
diff --git a/openplanter-desktop/Cargo.lock b/openplanter-desktop/Cargo.lock
index 503aecf9..39951ed9 100644
--- a/openplanter-desktop/Cargo.lock
+++ b/openplanter-desktop/Cargo.lock
@@ -2469,6 +2469,7 @@ dependencies = [
  "tempfile",
  "tokio",
  "tokio-util",
+ "uuid",
 ]
 
 [[package]]
diff --git a/openplanter-desktop/crates/op-core/src/model/mod.rs b/openplanter-desktop/crates/op-core/src/model/mod.rs
index 616c910a..4f2781ec 100644
--- a/openplanter-desktop/crates/op-core/src/model/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/model/mod.rs
@@ -8,17 +8,6 @@ use serde::{Deserialize, Serialize};
 use crate::events::DeltaEvent;
 use tokio_util::sync::CancellationToken;
 
-/// Structured model error for provider rate limiting.
-#[derive(Debug, Clone, thiserror::Error)]
-#[error("{message}")]
-pub struct RateLimitError {
-    pub message: String,
-    pub status_code: Option<u16>,
-    pub provider_code: Option<String>,
-    pub body: String,
-    pub retry_after_sec: Option<f64>,
-}
-
 /// A single tool call returned by the model.
 #[derive(Debug, Clone, Serialize, Deserialize)]
 pub struct ToolCall {
diff --git a/openplanter-desktop/crates/op-core/src/model/openai.rs b/openplanter-desktop/crates/op-core/src/model/openai.rs
index 4eca9ac0..4b1353f6 100644
--- a/openplanter-desktop/crates/op-core/src/model/openai.rs
+++ b/openplanter-desktop/crates/op-core/src/model/openai.rs
@@ -5,12 +5,11 @@
 use std::collections::HashMap;
 
 use anyhow::{anyhow, Context};
-use chrono::{DateTime, Utc};
 use reqwest_eventsource::{Event, RequestBuilderExt};
 use tokio_util::sync::CancellationToken;
 
 use crate::events::{DeltaEvent, DeltaKind};
-use super::{BaseModel, Message, ModelTurn, RateLimitError, ToolCall};
+use super::{BaseModel, Message, ModelTurn, ToolCall};
 
 pub struct OpenAIModel {
     client: reqwest::Client,
@@ -132,202 +131,6 @@ impl OpenAIModel {
 
         payload
     }
-
-    fn parse_retry_after_text(text: &str) -> Option<f64> {
-        let trimmed = text.trim();
-        if trimmed.is_empty() {
-            return None;
-        }
-        if let Ok(seconds) = trimmed.parse::<f64>() {
-            return Some(seconds.max(0.0));
-        }
-        let parsed = DateTime::parse_from_rfc2822(trimmed).ok()?;
-        Some(
-            (parsed.with_timezone(&Utc) - Utc::now())
-                .num_milliseconds()
-                .max(0) as f64
-                / 1000.0,
-        )
-    }
-
-    fn parse_retry_after_value(value: Option<&serde_json::Value>) -> Option<f64> {
-        match value {
-            Some(serde_json::Value::Number(num)) => num.as_f64().map(|v| v.max(0.0)),
-            Some(serde_json::Value::String(text)) => Self::parse_retry_after_text(text),
-            _ => None,
-        }
-    }
-
-    fn parse_retry_after_header(headers: &reqwest::header::HeaderMap) -> Option<f64> {
-        let value = headers.get(reqwest::header::RETRY_AFTER)?;
-        let text = value.to_str().ok()?;
-        Self::parse_retry_after_text(text)
-    }
-
-    fn extract_provider_code(value: Option<&serde_json::Value>) -> Option<String> {
-        match value {
-            Some(serde_json::Value::String(text)) => {
-                let trimmed = text.trim();
-                (!trimmed.is_empty()).then(|| trimmed.to_string())
-            }
-            Some(serde_json::Value::Number(num)) => Some(num.to_string()),
-            Some(other) => {
-                let rendered = other.to_string();
-                let trimmed = rendered.trim();
-                (!trimmed.is_empty()).then(|| trimmed.to_string())
-            }
-            None => None,
-        }
-    }
-
-    fn extract_openai_style_error(
-        payload: &serde_json::Value,
-    ) -> (String, Option<String>, Option<f64>) {
-        if let Some(error) = payload.get("error").and_then(|value| value.as_object()) {
-            let message = error
-                .get("message")
-                .and_then(|value| value.as_str())
-                .unwrap_or_default()
-                .trim()
-                .to_string();
-            let provider_code = Self::extract_provider_code(error.get("code"));
-            let retry_after = Self::parse_retry_after_value(error.get("retry_after"))
-                .or_else(|| Self::parse_retry_after_value(payload.get("retry_after")));
-            return (message, provider_code, retry_after);
-        }
-        (
-            String::new(),
-            None,
-            Self::parse_retry_after_value(payload.get("retry_after")),
-        )
-    }
-
-    fn is_rate_limit_error(
-        status_code: Option<u16>,
-        provider_code: Option<&str>,
-        message: &str,
-    ) -> bool {
-        if status_code == Some(429) {
-            return true;
-        }
-        if let Some(code) = provider_code {
-            let code = code.trim().to_lowercase();
-            if matches!(
-                code.as_str(),
-                "1302" | "429" | "rate_limit" | "rate_limit_exceeded" | "too_many_requests"
-            ) {
-                return true;
-            }
-        }
-        let text = message.to_lowercase();
-        text.contains("rate limit") || text.contains("too many requests")
-    }
-
-    fn classify_stream_payload_error(payload: &serde_json::Value) -> Option<anyhow::Error> {
-        let is_error_type = payload
-            .get("type")
-            .and_then(|value| value.as_str())
-            .is_some_and(|value| value == "error");
-        let error = payload.get("error")?;
-        let message = error
-            .get("message")
-            .and_then(|value| value.as_str())
-            .map(str::trim)
-            .filter(|value| !value.is_empty())
-            .map(str::to_string)
-            .unwrap_or_else(|| payload.to_string());
-        let provider_code = Self::extract_provider_code(error.get("code"));
-        let retry_after = Self::parse_retry_after_value(error.get("retry_after"));
-        let prefixed_message = format!("Stream error: {message}");
-
-        if Self::is_rate_limit_error(None, provider_code.as_deref(), &message) {
-            return Some(anyhow::Error::new(RateLimitError {
-                message: prefixed_message,
-                status_code: None,
-                provider_code,
-                body: payload.to_string(),
-                retry_after_sec: retry_after,
-            }));
-        }
-
-        if is_error_type || provider_code.is_some() || payload.get("retry_after").is_some() {
-            return Some(anyhow!(prefixed_message));
-        }
-
-        None
-    }
-
-    async fn classify_sse_error(
-        &self,
-        url: &str,
-        error: reqwest_eventsource::Error,
-    ) -> anyhow::Error {
-        match error {
-            reqwest_eventsource::Error::InvalidStatusCode(status, response) => {
-                self.classify_invalid_status(url, status, response).await
-            }
-            other => anyhow!("SSE stream error: {other}"),
-        }
-    }
-
-    async fn classify_invalid_status(
-        &self,
-        url: &str,
-        status: reqwest::StatusCode,
-        response: reqwest::Response,
-    ) -> anyhow::Error {
-        let response_url = response.url().clone();
-        let headers = response.headers().clone();
-        let body = response.text().await.unwrap_or_default();
-        let parsed = serde_json::from_str::<serde_json::Value>(&body).ok();
-        let mut message = String::new();
-        let mut provider_code = None;
-        let mut retry_after = Self::parse_retry_after_header(&headers);
-
-        if let Some(ref payload) = parsed {
-            let (body_message, body_code, body_retry_after) =
-                Self::extract_openai_style_error(payload);
-            message = body_message;
-            provider_code = body_code;
-            if retry_after.is_none() {
-                retry_after = body_retry_after;
-            }
-        }
-
-        let detail = if !message.is_empty() {
-            message.clone()
-        } else if !body.trim().is_empty() {
-            body.clone()
-        } else {
-            status.to_string()
-        };
-
-        if Self::is_rate_limit_error(Some(status.as_u16()), provider_code.as_deref(), &detail) {
-            return anyhow::Error::new(RateLimitError {
-                message: format!(
-                    "HTTP {} calling {}: {}",
-                    status.as_u16(),
-                    response_url,
-                    detail
-                ),
-                status_code: Some(status.as_u16()),
-                provider_code,
-                body,
-                retry_after_sec: retry_after,
-            });
-        }
-
-        anyhow!(
-            "HTTP {} calling {}: {}",
-            status.as_u16(),
-            if response_url.as_str().is_empty() {
-                url
-            } else {
-                response_url.as_str()
-            },
-            detail
-        )
-    }
 }
 
 #[async_trait::async_trait]
@@ -390,7 +193,7 @@ impl BaseModel for OpenAIModel {
                 Some(Err(reqwest_eventsource::Error::StreamEnded)) => break,
                 Some(Err(e)) => {
                     es.close();
-                    return Err(self.classify_sse_error(&url, e).await);
+                    return Err(anyhow!("SSE stream error: {e}"));
                 }
                 None => break,
             };
@@ -405,11 +208,6 @@ impl BaseModel for OpenAIModel {
                     let chunk: serde_json::Value = serde_json::from_str(&msg.data)
                         .with_context(|| format!("Failed to parse SSE chunk: {}", &msg.data))?;
 
-                    if let Some(error) = Self::classify_stream_payload_error(&chunk) {
-                        es.close();
-                        return Err(error);
-                    }
-
                     // Extract usage from any chunk that has it
                     if let Some(usage) = chunk.get("usage") {
                         if let Some(pt) = usage.get("prompt_tokens").and_then(|v| v.as_u64()) {
diff --git a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
index cb44a683..5e792de0 100644
--- a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
+++ b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
@@ -6,17 +6,17 @@ use std::collections::HashMap;
 use std::net::SocketAddr;
 use std::sync::{Arc, Mutex};
 
-use axum::Router;
 use axum::body::Body;
 use axum::http::StatusCode;
 use axum::response::Response;
 use axum::routing::post;
+use axum::Router;
 use tokio_util::sync::CancellationToken;
 
 use op_core::events::{DeltaEvent, DeltaKind};
-use op_core::model::anthropic::AnthropicModel;
 use op_core::model::openai::OpenAIModel;
-use op_core::model::{BaseModel, Message, RateLimitError};
+use op_core::model::anthropic::AnthropicModel;
+use op_core::model::{BaseModel, Message};
 
 // ─── Helpers ───
 
@@ -81,62 +81,10 @@ async fn start_error_server(status: u16, body: &'static str) -> SocketAddr {
     addr
 }
 
-#[derive(Clone)]
-struct MockHttpResponse {
-    status: u16,
-    content_type: &'static str,
-    body: &'static str,
-    headers: Vec<(&'static str, &'static str)>,
-}
-
-async fn start_stateful_http_server(responses: Vec<MockHttpResponse>) -> SocketAddr {
-    let counter = Arc::new(Mutex::new(0usize));
-    let responses = Arc::new(responses);
-
-    let app = Router::new().route(
-        "/{*path}",
-        post(move || {
-            let counter = counter.clone();
-            let responses = responses.clone();
-            async move {
-                let mut idx = counter.lock().unwrap();
-                let response = if *idx < responses.len() {
-                    responses[*idx].clone()
-                } else {
-                    responses
-                        .last()
-                        .expect("expected at least one HTTP response")
-                        .clone()
-                };
-                *idx += 1;
-
-                let mut builder = Response::builder()
-                    .status(StatusCode::from_u16(response.status).unwrap())
-                    .header("content-type", response.content_type);
-                for (name, value) in &response.headers {
-                    builder = builder.header(*name, *value);
-                }
-                builder.body(Body::from(response.body)).unwrap()
-            }
-        }),
-    );
-
-    let listener = tokio::net::TcpListener::bind("127.0.0.1:0").await.unwrap();
-    let addr = listener.local_addr().unwrap();
-    tokio::spawn(async move {
-        axum::serve(listener, app).await.unwrap();
-    });
-    addr
-}
-
 fn simple_messages() -> Vec<Message> {
     vec![
-        Message::System {
-            content: "You are helpful.".to_string(),
-        },
-        Message::User {
-            content: "Say hello".to_string(),
-        },
+        Message::System { content: "You are helpful.".to_string() },
+        Message::User { content: "Say hello".to_string() },
     ]
 }
 
@@ -402,10 +350,7 @@ async fn test_openai_chat_non_streaming() {
     );
 
     // chat() should internally call chat_stream with no-op callback
-    let turn = model
-        .chat(&simple_messages(), &[])
-        .await
-        .expect("chat should succeed");
+    let turn = model.chat(&simple_messages(), &[]).await.expect("chat should succeed");
     assert_eq!(turn.text, "Hello world");
     assert_eq!(turn.input_tokens, 10);
 }
@@ -420,10 +365,7 @@ async fn test_anthropic_chat_non_streaming() {
         None,
     );
 
-    let turn = model
-        .chat(&simple_messages(), &[])
-        .await
-        .expect("chat should succeed");
+    let turn = model.chat(&simple_messages(), &[]).await.expect("chat should succeed");
     assert_eq!(turn.text, "Hello from Claude");
     assert_eq!(turn.input_tokens, 25);
 }
@@ -435,8 +377,7 @@ async fn test_openai_http_error() {
     let addr = start_error_server(
         401,
         r#"{"error":{"message":"Invalid API key","type":"invalid_request_error"}}"#,
-    )
-    .await;
+    ).await;
     let model = OpenAIModel::new(
         "gpt-4o".to_string(),
         "openai".to_string(),
@@ -454,45 +395,12 @@ async fn test_openai_http_error() {
     assert!(result.is_err(), "should fail with HTTP error");
 }
 
-#[tokio::test]
-async fn test_openai_rate_limit_error_includes_retry_after() {
-    let addr = start_stateful_http_server(vec![MockHttpResponse {
-        status: 429,
-        content_type: "application/json",
-        body: r#"{"error":{"message":"Too many requests","code":"1302"}}"#,
-        headers: vec![("retry-after", "3")],
-    }])
-    .await;
-    let model = OpenAIModel::new(
-        "gpt-4o".to_string(),
-        "openai".to_string(),
-        format!("http://{addr}"),
-        "test-key".to_string(),
-        Some("high".to_string()),
-        HashMap::new(),
-    );
-
-    let cancel = CancellationToken::new();
-    let error = model
-        .chat_stream(&simple_messages(), &[], &|_| {}, &cancel)
-        .await
-        .expect_err("should fail with a structured rate-limit error");
-
-    let rate_limit = error
-        .downcast_ref::<RateLimitError>()
-        .expect("expected a structured rate-limit error");
-    assert_eq!(rate_limit.status_code, Some(429));
-    assert_eq!(rate_limit.provider_code.as_deref(), Some("1302"));
-    assert_eq!(rate_limit.retry_after_sec, Some(3.0));
-}
-
 #[tokio::test]
 async fn test_anthropic_http_error() {
     let addr = start_error_server(
         401,
         r#"{"type":"error","error":{"type":"authentication_error","message":"invalid x-api-key"}}"#,
-    )
-    .await;
+    ).await;
     let model = AnthropicModel::new(
         "claude-sonnet-4-5".to_string(),
         format!("http://{addr}"),
@@ -513,13 +421,12 @@ async fn test_anthropic_http_error() {
 #[tokio::test]
 async fn test_solve_with_mock_anthropic() {
     use op_core::config::AgentConfig;
-    use op_core::engine::{SolveEmitter, solve};
+    use op_core::engine::{solve, SolveEmitter};
     use op_core::events::StepEvent;
 
     let addr = start_mock_sse_server(ANTHROPIC_SSE_SIMPLE).await;
 
     #[derive(Debug, Clone)]
-    #[allow(dead_code)]
     enum Ev {
         Trace(String),
         Delta(DeltaEvent),
@@ -533,10 +440,7 @@ async fn test_solve_with_mock_anthropic() {
     }
     impl SolveEmitter for TestEmitter {
         fn emit_trace(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev::Trace(message.to_string()));
+            self.events.lock().unwrap().push(Ev::Trace(message.to_string()));
         }
         fn emit_delta(&self, event: DeltaEvent) {
             self.events.lock().unwrap().push(Ev::Delta(event));
@@ -544,24 +448,16 @@ async fn test_solve_with_mock_anthropic() {
         fn emit_step(&self, event: StepEvent) {
             self.events.lock().unwrap().push(Ev::Step(event));
         }
-        fn emit_complete(&self, result: &str, _loop_metrics: Option<op_core::events::LoopMetrics>, _completion: Option<op_core::events::CompletionMeta>) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev::Complete(result.to_string()));
+        fn emit_complete(&self, result: &str) {
+            self.events.lock().unwrap().push(Ev::Complete(result.to_string()));
         }
         fn emit_error(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev::Error(message.to_string()));
+            self.events.lock().unwrap().push(Ev::Error(message.to_string()));
         }
     }
 
     let events = Arc::new(Mutex::new(Vec::new()));
-    let emitter = TestEmitter {
-        events: events.clone(),
-    };
+    let emitter = TestEmitter { events: events.clone() };
 
     let cfg = AgentConfig {
         provider: "anthropic".into(),
@@ -579,9 +475,7 @@ async fn test_solve_with_mock_anthropic() {
 
     // Should have a trace
     assert!(
-        recorded
-            .iter()
-            .any(|e| matches!(e, Ev::Trace(m) if m.contains("anthropic"))),
+        recorded.iter().any(|e| matches!(e, Ev::Trace(m) if m.contains("anthropic"))),
         "should have a trace mentioning anthropic"
     );
 
@@ -597,17 +491,13 @@ async fn test_solve_with_mock_anthropic() {
 
     // Should have a step
     assert!(
-        recorded
-            .iter()
-            .any(|e| matches!(e, Ev::Step(s) if s.is_final && s.tokens.input_tokens == 25)),
+        recorded.iter().any(|e| matches!(e, Ev::Step(s) if s.is_final && s.tokens.input_tokens == 25)),
         "should have a final step with correct token count"
     );
 
     // Should have complete with the full text
     assert!(
-        recorded
-            .iter()
-            .any(|e| matches!(e, Ev::Complete(t) if t == "Hello from Claude")),
+        recorded.iter().any(|e| matches!(e, Ev::Complete(t) if t == "Hello from Claude")),
         "should complete with full text"
     );
 
@@ -621,7 +511,7 @@ async fn test_solve_with_mock_anthropic() {
 #[tokio::test]
 async fn test_solve_with_mock_openai() {
     use op_core::config::AgentConfig;
-    use op_core::engine::{SolveEmitter, solve};
+    use op_core::engine::{solve, SolveEmitter};
     use op_core::events::StepEvent;
 
     let addr = start_mock_sse_server(OPENAI_SSE_SIMPLE).await;
@@ -641,10 +531,7 @@ async fn test_solve_with_mock_openai() {
     }
     impl SolveEmitter for TestEmitter2 {
         fn emit_trace(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev2::Trace(message.to_string()));
+            self.events.lock().unwrap().push(Ev2::Trace(message.to_string()));
         }
         fn emit_delta(&self, event: DeltaEvent) {
             self.events.lock().unwrap().push(Ev2::Delta(event));
@@ -652,24 +539,16 @@ async fn test_solve_with_mock_openai() {
         fn emit_step(&self, event: StepEvent) {
             self.events.lock().unwrap().push(Ev2::Step(event));
         }
-        fn emit_complete(&self, result: &str, _loop_metrics: Option<op_core::events::LoopMetrics>, _completion: Option<op_core::events::CompletionMeta>) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev2::Complete(result.to_string()));
+        fn emit_complete(&self, result: &str) {
+            self.events.lock().unwrap().push(Ev2::Complete(result.to_string()));
         }
         fn emit_error(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev2::Error(message.to_string()));
+            self.events.lock().unwrap().push(Ev2::Error(message.to_string()));
         }
     }
 
     let events = Arc::new(Mutex::new(Vec::new()));
-    let emitter = TestEmitter2 {
-        events: events.clone(),
-    };
+    let emitter = TestEmitter2 { events: events.clone() };
 
     let cfg = AgentConfig {
         provider: "openai".into(),
@@ -688,17 +567,9 @@ async fn test_solve_with_mock_openai() {
 
     // Should have a trace mentioning openai
     assert!(
-        recorded
-            .iter()
-            .any(|e| matches!(e, Ev2::Trace(m) if m.contains("openai"))),
+        recorded.iter().any(|e| matches!(e, Ev2::Trace(m) if m.contains("openai"))),
         "should have a trace mentioning openai, got: {:?}",
-        recorded
-            .iter()
-            .filter_map(|e| match e {
-                Ev2::Trace(m) => Some(m.clone()),
-                _ => None,
-            })
-            .collect::<Vec<_>>()
+        recorded.iter().filter_map(|e| match e { Ev2::Trace(m) => Some(m.clone()), _ => None }).collect::<Vec<_>>()
     );
 
     // Should have text deltas that spell "Hello world"
@@ -713,17 +584,13 @@ async fn test_solve_with_mock_openai() {
 
     // Should have a step with correct tokens
     assert!(
-        recorded
-            .iter()
-            .any(|e| matches!(e, Ev2::Step(s) if s.is_final && s.tokens.input_tokens == 10)),
+        recorded.iter().any(|e| matches!(e, Ev2::Step(s) if s.is_final && s.tokens.input_tokens == 10)),
         "should have a final step with 10 input tokens"
     );
 
     // Should complete with the full text
     assert!(
-        recorded
-            .iter()
-            .any(|e| matches!(e, Ev2::Complete(t) if t == "Hello world")),
+        recorded.iter().any(|e| matches!(e, Ev2::Complete(t) if t == "Hello world")),
         "should complete with 'Hello world'"
     );
 
@@ -737,10 +604,13 @@ async fn test_solve_with_mock_openai() {
 #[tokio::test]
 async fn test_solve_http_error_emits_error() {
     use op_core::config::AgentConfig;
-    use op_core::engine::{SolveEmitter, solve};
+    use op_core::engine::{solve, SolveEmitter};
     use op_core::events::StepEvent;
 
-    let addr = start_error_server(401, r#"{"error":{"message":"Invalid API key"}}"#).await;
+    let addr = start_error_server(
+        401,
+        r#"{"error":{"message":"Invalid API key"}}"#,
+    ).await;
 
     struct ErrorEmitter {
         errors: Arc<Mutex<Vec<String>>>,
@@ -749,16 +619,14 @@ async fn test_solve_http_error_emits_error() {
         fn emit_trace(&self, _: &str) {}
         fn emit_delta(&self, _: DeltaEvent) {}
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, _: &str, _: Option<op_core::events::LoopMetrics>, _: Option<op_core::events::CompletionMeta>) {}
+        fn emit_complete(&self, _: &str) {}
         fn emit_error(&self, msg: &str) {
             self.errors.lock().unwrap().push(msg.to_string());
         }
     }
 
     let errors = Arc::new(Mutex::new(Vec::new()));
-    let emitter = ErrorEmitter {
-        errors: errors.clone(),
-    };
+    let emitter = ErrorEmitter { errors: errors.clone() };
 
     let cfg = AgentConfig {
         provider: "openai".into(),
@@ -774,116 +642,16 @@ async fn test_solve_http_error_emits_error() {
     solve("Test", &cfg, &emitter, cancel).await;
 
     let recorded = errors.lock().unwrap().clone();
-    assert!(!recorded.is_empty(), "should emit an error for HTTP 401");
-}
-
-#[tokio::test]
-async fn test_solve_rate_limit_retry_eventually_completes() {
-    use op_core::config::AgentConfig;
-    use op_core::engine::{SolveEmitter, solve};
-    use op_core::events::StepEvent;
-
-    #[derive(Debug, Clone)]
-    #[allow(dead_code)]
-    enum Ev {
-        Trace(String),
-        Complete(String),
-        Error(String),
-    }
-
-    struct RetryEmitter {
-        events: Arc<Mutex<Vec<Ev>>>,
-    }
-
-    impl SolveEmitter for RetryEmitter {
-        fn emit_trace(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev::Trace(message.to_string()));
-        }
-
-        fn emit_delta(&self, _: DeltaEvent) {}
-
-        fn emit_step(&self, _: StepEvent) {}
-
-        fn emit_complete(&self, result: &str, _loop_metrics: Option<op_core::events::LoopMetrics>, _completion: Option<op_core::events::CompletionMeta>) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev::Complete(result.to_string()));
-        }
-
-        fn emit_error(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev::Error(message.to_string()));
-        }
-    }
-
-    let addr = start_stateful_http_server(vec![
-        MockHttpResponse {
-            status: 429,
-            content_type: "application/json",
-            body: r#"{"error":{"message":"Too many requests","code":"1302"}}"#,
-            headers: vec![("retry-after", "0")],
-        },
-        MockHttpResponse {
-            status: 200,
-            content_type: "text/event-stream",
-            body: OPENAI_SSE_SIMPLE,
-            headers: vec![("cache-control", "no-cache")],
-        },
-    ])
-    .await;
-
-    let events = Arc::new(Mutex::new(Vec::new()));
-    let emitter = RetryEmitter {
-        events: events.clone(),
-    };
-
-    let cfg = AgentConfig {
-        provider: "openai".into(),
-        model: "gpt-4o".into(),
-        api_key: Some("test-key".into()),
-        openai_api_key: Some("test-key".into()),
-        base_url: format!("http://{addr}"),
-        openai_base_url: format!("http://{addr}"),
-        rate_limit_max_retries: 1,
-        rate_limit_backoff_base_sec: 0.0,
-        rate_limit_backoff_max_sec: 0.0,
-        rate_limit_retry_after_cap_sec: 0.0,
-        demo: false,
-        ..Default::default()
-    };
-
-    let cancel = CancellationToken::new();
-    solve("Test", &cfg, &emitter, cancel).await;
-
-    let recorded = events.lock().unwrap().clone();
-    assert!(
-        recorded.iter().any(|event| {
-            matches!(event, Ev::Trace(message) if message.contains("rate limited (1302)"))
-        }),
-        "expected a retry trace after the 429, got: {recorded:?}"
-    );
-    assert!(
-        recorded
-            .iter()
-            .any(|event| matches!(event, Ev::Complete(text) if text == "Hello world")),
-        "expected the solve to complete after retry, got: {recorded:?}"
-    );
     assert!(
-        !recorded.iter().any(|event| matches!(event, Ev::Error(_))),
-        "did not expect an error after retry success, got: {recorded:?}"
+        !recorded.is_empty(),
+        "should emit an error for HTTP 401"
     );
 }
 
 #[tokio::test]
 async fn test_solve_cancel_emits_cancelled() {
     use op_core::config::AgentConfig;
-    use op_core::engine::{SolveEmitter, solve};
+    use op_core::engine::{solve, SolveEmitter};
     use op_core::events::StepEvent;
 
     // Use a server that returns data but we cancel before processing
@@ -896,16 +664,14 @@ async fn test_solve_cancel_emits_cancelled() {
         fn emit_trace(&self, _: &str) {}
         fn emit_delta(&self, _: DeltaEvent) {}
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, _: &str, _: Option<op_core::events::LoopMetrics>, _: Option<op_core::events::CompletionMeta>) {}
+        fn emit_complete(&self, _: &str) {}
         fn emit_error(&self, msg: &str) {
             self.events.lock().unwrap().push(msg.to_string());
         }
     }
 
     let events = Arc::new(Mutex::new(Vec::new()));
-    let emitter = CancelEmitter {
-        events: events.clone(),
-    };
+    let emitter = CancelEmitter { events: events.clone() };
 
     let cfg = AgentConfig {
         provider: "anthropic".into(),
@@ -931,7 +697,7 @@ async fn test_solve_cancel_emits_cancelled() {
 #[tokio::test]
 async fn test_solve_demo_mode_bypasses_llm() {
     use op_core::config::AgentConfig;
-    use op_core::engine::{SolveEmitter, solve};
+    use op_core::engine::{solve, SolveEmitter};
     use op_core::events::StepEvent;
 
     struct TestEmitter {
@@ -941,7 +707,7 @@ async fn test_solve_demo_mode_bypasses_llm() {
         fn emit_trace(&self, _: &str) {}
         fn emit_delta(&self, _: DeltaEvent) {}
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, result: &str, _loop_metrics: Option<op_core::events::LoopMetrics>, _completion: Option<op_core::events::CompletionMeta>) {
+        fn emit_complete(&self, result: &str) {
             self.events.lock().unwrap().push(result.to_string());
         }
         fn emit_error(&self, msg: &str) {
@@ -950,9 +716,7 @@ async fn test_solve_demo_mode_bypasses_llm() {
     }
 
     let events = Arc::new(Mutex::new(Vec::new()));
-    let emitter = TestEmitter {
-        events: events.clone(),
-    };
+    let emitter = TestEmitter { events: events.clone() };
 
     let cfg = AgentConfig {
         demo: true,
@@ -972,7 +736,7 @@ async fn test_solve_demo_mode_bypasses_llm() {
 #[tokio::test]
 async fn test_solve_missing_key_emits_error() {
     use op_core::config::AgentConfig;
-    use op_core::engine::{SolveEmitter, solve};
+    use op_core::engine::{solve, SolveEmitter};
     use op_core::events::StepEvent;
 
     struct TestEmitter {
@@ -982,24 +746,18 @@ async fn test_solve_missing_key_emits_error() {
         fn emit_trace(&self, _: &str) {}
         fn emit_delta(&self, _: DeltaEvent) {}
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, _: &str, _: Option<op_core::events::LoopMetrics>, _: Option<op_core::events::CompletionMeta>) {}
+        fn emit_complete(&self, _: &str) {}
         fn emit_error(&self, msg: &str) {
             self.errors.lock().unwrap().push(msg.to_string());
         }
     }
 
     let errors = Arc::new(Mutex::new(Vec::new()));
-    let emitter = TestEmitter {
-        errors: errors.clone(),
-    };
+    let emitter = TestEmitter { errors: errors.clone() };
 
     let cfg = AgentConfig {
         provider: "openai".into(),
         model: "gpt-4o".into(),
-        base_url: "https://api.openai.com/v1".into(),
-        openai_base_url: "https://api.openai.com/v1".into(),
-        api_key: None,
-        openai_api_key: None,
         demo: false,
         // No API key set
         ..Default::default()
@@ -1034,20 +792,6 @@ event: content_block_stop\ndata: {\"type\":\"content_block_stop\",\"index\":1}\n
 event: message_delta\ndata: {\"type\":\"message_delta\",\"delta\":{\"stop_reason\":\"tool_use\"},\"usage\":{\"output_tokens\":12}}\n\n\
 event: message_stop\ndata: {\"type\":\"message_stop\"}\n\n";
 
-const ANTHROPIC_SSE_TWO_TOOL_LIST: &str = "\
-event: message_start\ndata: {\"type\":\"message_start\",\"message\":{\"id\":\"msg_loop_multi\",\"type\":\"message\",\"role\":\"assistant\",\"content\":[],\"usage\":{\"input_tokens\":60}}}\n\n\
-event: content_block_start\ndata: {\"type\":\"content_block_start\",\"index\":0,\"content_block\":{\"type\":\"text\",\"text\":\"\"}}\n\n\
-event: content_block_delta\ndata: {\"type\":\"content_block_delta\",\"index\":0,\"delta\":{\"type\":\"text_delta\",\"text\":\"Let me inspect that twice.\"}}\n\n\
-event: content_block_stop\ndata: {\"type\":\"content_block_stop\",\"index\":0}\n\n\
-event: content_block_start\ndata: {\"type\":\"content_block_start\",\"index\":1,\"content_block\":{\"type\":\"tool_use\",\"id\":\"toolu_loop_multi_1\",\"name\":\"list_files\",\"input\":{}}}\n\n\
-event: content_block_delta\ndata: {\"type\":\"content_block_delta\",\"index\":1,\"delta\":{\"type\":\"input_json_delta\",\"partial_json\":\"{}\"}}\n\n\
-event: content_block_stop\ndata: {\"type\":\"content_block_stop\",\"index\":1}\n\n\
-event: content_block_start\ndata: {\"type\":\"content_block_start\",\"index\":2,\"content_block\":{\"type\":\"tool_use\",\"id\":\"toolu_loop_multi_2\",\"name\":\"list_files\",\"input\":{}}}\n\n\
-event: content_block_delta\ndata: {\"type\":\"content_block_delta\",\"index\":2,\"delta\":{\"type\":\"input_json_delta\",\"partial_json\":\"{}\"}}\n\n\
-event: content_block_stop\ndata: {\"type\":\"content_block_stop\",\"index\":2}\n\n\
-event: message_delta\ndata: {\"type\":\"message_delta\",\"delta\":{\"stop_reason\":\"tool_use\"},\"usage\":{\"output_tokens\":18}}\n\n\
-event: message_stop\ndata: {\"type\":\"message_stop\"}\n\n";
-
 /// SSE body for the follow-up Anthropic response (final text answer after tool result).
 const ANTHROPIC_SSE_FINAL_ANSWER: &str = "\
 event: message_start\ndata: {\"type\":\"message_start\",\"message\":{\"id\":\"msg_loop2\",\"type\":\"message\",\"role\":\"assistant\",\"content\":[],\"usage\":{\"input_tokens\":80}}}\n\n\
@@ -1057,30 +801,15 @@ event: content_block_stop\ndata: {\"type\":\"content_block_stop\",\"index\":0}\n
 event: message_delta\ndata: {\"type\":\"message_delta\",\"delta\":{\"stop_reason\":\"end_turn\"},\"usage\":{\"output_tokens\":10}}\n\n\
 event: message_stop\ndata: {\"type\":\"message_stop\"}\n\n";
 
-const ANTHROPIC_SSE_CURATOR_NOOP: &str = "\
-event: message_start\ndata: {\"type\":\"message_start\",\"message\":{\"id\":\"msg_curator_1\",\"type\":\"message\",\"role\":\"assistant\",\"content\":[],\"usage\":{\"input_tokens\":20}}}\n\n\
-event: content_block_start\ndata: {\"type\":\"content_block_start\",\"index\":0,\"content_block\":{\"type\":\"text\",\"text\":\"\"}}\n\n\
-event: content_block_delta\ndata: {\"type\":\"content_block_delta\",\"index\":0,\"delta\":{\"type\":\"text_delta\",\"text\":\"No wiki updates needed\"}}\n\n\
-event: content_block_stop\ndata: {\"type\":\"content_block_stop\",\"index\":0}\n\n\
-event: message_delta\ndata: {\"type\":\"message_delta\",\"delta\":{\"stop_reason\":\"end_turn\"},\"usage\":{\"output_tokens\":5}}\n\n\
-event: message_stop\ndata: {\"type\":\"message_stop\"}\n\n";
-
 /// Start a stateful mock server that returns different SSE bodies on successive calls.
 async fn start_stateful_mock_server(responses: Vec<&'static str>) -> SocketAddr {
-    start_stateful_mock_server_with_counter(responses).await.0
-}
-
-async fn start_stateful_mock_server_with_counter(
-    responses: Vec<&'static str>,
-) -> (SocketAddr, Arc<Mutex<usize>>) {
     let counter = Arc::new(Mutex::new(0usize));
-    let counter_for_app = counter.clone();
     let responses = Arc::new(responses);
 
     let app = Router::new().route(
         "/{*path}",
         post(move || {
-            let counter = counter_for_app.clone();
+            let counter = counter.clone();
             let responses = responses.clone();
             async move {
                 let mut idx = counter.lock().unwrap();
@@ -1105,18 +834,20 @@ async fn start_stateful_mock_server_with_counter(
     tokio::spawn(async move {
         axum::serve(listener, app).await.unwrap();
     });
-    (addr, counter)
+    addr
 }
 
 #[tokio::test]
 async fn test_solve_multi_step_agentic_loop() {
     use op_core::config::AgentConfig;
-    use op_core::engine::{SolveEmitter, solve};
-    use op_core::events::{LoopMetrics, LoopPhase, StepEvent};
+    use op_core::engine::{solve, SolveEmitter};
+    use op_core::events::StepEvent;
 
     // Mock server: first call → tool call, second call → final answer
-    let addr =
-        start_stateful_mock_server(vec![ANTHROPIC_SSE_TOOL_LIST, ANTHROPIC_SSE_FINAL_ANSWER]).await;
+    let addr = start_stateful_mock_server(vec![
+        ANTHROPIC_SSE_TOOL_LIST,
+        ANTHROPIC_SSE_FINAL_ANSWER,
+    ]).await;
 
     #[derive(Debug, Clone)]
     #[allow(dead_code)]
@@ -1124,10 +855,7 @@ async fn test_solve_multi_step_agentic_loop() {
         Trace(String),
         Delta(DeltaEvent),
         Step(StepEvent),
-        Complete {
-            result: String,
-            loop_metrics: Option<LoopMetrics>,
-        },
+        Complete(String),
         Error(String),
     }
 
@@ -1136,10 +864,7 @@ async fn test_solve_multi_step_agentic_loop() {
     }
     impl SolveEmitter for TestEmitter3 {
         fn emit_trace(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev3::Trace(message.to_string()));
+            self.events.lock().unwrap().push(Ev3::Trace(message.to_string()));
         }
         fn emit_delta(&self, event: DeltaEvent) {
             self.events.lock().unwrap().push(Ev3::Delta(event));
@@ -1147,24 +872,16 @@ async fn test_solve_multi_step_agentic_loop() {
         fn emit_step(&self, event: StepEvent) {
             self.events.lock().unwrap().push(Ev3::Step(event));
         }
-        fn emit_complete(&self, result: &str, loop_metrics: Option<op_core::events::LoopMetrics>, _completion: Option<op_core::events::CompletionMeta>) {
-            self.events.lock().unwrap().push(Ev3::Complete {
-                result: result.to_string(),
-                loop_metrics,
-            });
+        fn emit_complete(&self, result: &str) {
+            self.events.lock().unwrap().push(Ev3::Complete(result.to_string()));
         }
         fn emit_error(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev3::Error(message.to_string()));
+            self.events.lock().unwrap().push(Ev3::Error(message.to_string()));
         }
     }
 
     let events = Arc::new(Mutex::new(Vec::new()));
-    let emitter = TestEmitter3 {
-        events: events.clone(),
-    };
+    let emitter = TestEmitter3 { events: events.clone() };
 
     // Use a temp dir as workspace so list_files has something to work with
     let tmp = tempfile::TempDir::new().unwrap();
@@ -1211,43 +928,16 @@ async fn test_solve_multi_step_agentic_loop() {
         Some("list_files"),
         "first step should show list_files tool"
     );
-    assert_eq!(steps[0].loop_phase, Some(LoopPhase::Investigate));
-    assert_eq!(
-        steps[0]
-            .loop_metrics
-            .as_ref()
-            .map(|metrics| metrics.tool_calls),
-        Some(1)
-    );
-    assert_eq!(
-        steps[0]
-            .loop_metrics
-            .as_ref()
-            .map(|metrics| metrics.recon_streak),
-        Some(1)
-    );
 
     // Last step should be final
-    assert!(steps.last().unwrap().is_final, "last step should be final");
-    assert_eq!(steps.last().unwrap().loop_phase, Some(LoopPhase::Finalize));
-    assert_eq!(
-        steps
-            .last()
-            .unwrap()
-            .loop_metrics
-            .as_ref()
-            .map(|metrics| metrics.tool_calls),
-        Some(1)
+    assert!(
+        steps.last().unwrap().is_final,
+        "last step should be final"
     );
 
     // Should have tool execution trace
-    let has_tool_trace = recorded
-        .iter()
-        .any(|e| matches!(e, Ev3::Trace(m) if m.contains("list_files")));
-    assert!(
-        has_tool_trace,
-        "should have a trace mentioning list_files tool execution"
-    );
+    let has_tool_trace = recorded.iter().any(|e| matches!(e, Ev3::Trace(m) if m.contains("list_files")));
+    assert!(has_tool_trace, "should have a trace mentioning list_files tool execution");
 
     // Should have text deltas from both steps
     let text_content: String = recorded
@@ -1268,12 +958,7 @@ async fn test_solve_multi_step_agentic_loop() {
 
     // Should complete with the final answer text
     assert!(
-        recorded.iter().any(|e| matches!(
-            e,
-            Ev3::Complete { result, loop_metrics }
-                if result.contains("Here is the answer")
-                    && loop_metrics.as_ref().map(|metrics| metrics.tool_calls) == Some(1)
-        )),
+        recorded.iter().any(|e| matches!(e, Ev3::Complete(t) if t.contains("Here is the answer"))),
         "should complete with the final answer"
     );
 
@@ -1291,730 +976,3 @@ async fn test_solve_multi_step_agentic_loop() {
         errors
     );
 }
-
-#[tokio::test]
-async fn test_solve_flushes_final_curator_checkpoint_before_complete() {
-    use op_core::config::AgentConfig;
-    use op_core::engine::{SolveEmitter, solve};
-    use op_core::events::LoopMetrics;
-
-    let addr = start_stateful_mock_server(vec![
-        ANTHROPIC_SSE_TOOL_LIST,
-        ANTHROPIC_SSE_FINAL_ANSWER,
-        ANTHROPIC_SSE_CURATOR_NOOP,
-    ])
-    .await;
-
-    #[derive(Debug, Clone)]
-    #[allow(dead_code)]
-    enum Ev {
-        Trace(String),
-        Complete(String),
-        Error(String),
-    }
-
-    struct TestEmitter {
-        events: Arc<Mutex<Vec<Ev>>>,
-    }
-
-    impl SolveEmitter for TestEmitter {
-        fn emit_trace(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev::Trace(message.to_string()));
-        }
-
-        fn emit_delta(&self, _: DeltaEvent) {}
-
-        fn emit_step(&self, _: op_core::events::StepEvent) {}
-
-        fn emit_complete(&self, result: &str, _: Option<LoopMetrics>, _: Option<op_core::events::CompletionMeta>) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev::Complete(result.to_string()));
-        }
-
-        fn emit_error(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev::Error(message.to_string()));
-        }
-    }
-
-    let events = Arc::new(Mutex::new(Vec::new()));
-    let emitter = TestEmitter {
-        events: events.clone(),
-    };
-    let tmp = tempfile::TempDir::new().unwrap();
-    std::fs::write(tmp.path().join("hello.txt"), "world").unwrap();
-
-    let cfg = AgentConfig {
-        provider: "anthropic".into(),
-        model: "claude-sonnet-4-5".into(),
-        anthropic_api_key: Some("test-key".into()),
-        anthropic_base_url: format!("http://{addr}"),
-        demo: false,
-        workspace: tmp.path().to_path_buf(),
-        ..Default::default()
-    };
-
-    solve(
-        "List the files in this directory",
-        &cfg,
-        &emitter,
-        CancellationToken::new(),
-    )
-    .await;
-
-    let recorded = events.lock().unwrap().clone();
-    let finalize_trace = recorded
-        .iter()
-        .position(|event| matches!(event, Ev::Trace(message) if message.contains("checkpoint at finalize")))
-        .expect("expected finalize curator trace");
-    let complete = recorded
-        .iter()
-        .position(|event| matches!(event, Ev::Complete(_)))
-        .expect("expected complete event");
-    assert!(
-        finalize_trace < complete,
-        "finalize checkpoint should be flushed before complete: {recorded:?}"
-    );
-    assert!(
-        !recorded.iter().any(|event| matches!(event, Ev::Error(_))),
-        "did not expect errors, got: {recorded:?}"
-    );
-}
-
-#[tokio::test]
-async fn test_solve_flushes_cancelled_checkpoint_before_error() {
-    use op_core::config::AgentConfig;
-    use op_core::engine::{SolveEmitter, solve};
-    use op_core::events::{LoopMetrics, StepEvent};
-
-    let (addr, request_count) = start_stateful_mock_server_with_counter(vec![
-        ANTHROPIC_SSE_TOOL_LIST,
-        ANTHROPIC_SSE_CURATOR_NOOP,
-    ])
-    .await;
-
-    #[derive(Debug, Clone)]
-    #[allow(dead_code)]
-    enum Ev {
-        Trace(String),
-        Error(String),
-    }
-
-    struct TestEmitter {
-        events: Arc<Mutex<Vec<Ev>>>,
-        cancel: CancellationToken,
-    }
-
-    impl SolveEmitter for TestEmitter {
-        fn emit_trace(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev::Trace(message.to_string()));
-        }
-
-        fn emit_delta(&self, _: DeltaEvent) {}
-
-        fn emit_step(&self, event: StepEvent) {
-            if !event.is_final {
-                self.cancel.cancel();
-            }
-        }
-
-        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>, _: Option<op_core::events::CompletionMeta>) {}
-
-        fn emit_error(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev::Error(message.to_string()));
-        }
-    }
-
-    let events = Arc::new(Mutex::new(Vec::new()));
-    let cancel = CancellationToken::new();
-    let emitter = TestEmitter {
-        events: events.clone(),
-        cancel: cancel.clone(),
-    };
-    let tmp = tempfile::TempDir::new().unwrap();
-    std::fs::write(tmp.path().join("hello.txt"), "world").unwrap();
-
-    let cfg = AgentConfig {
-        provider: "anthropic".into(),
-        model: "claude-sonnet-4-5".into(),
-        anthropic_api_key: Some("test-key".into()),
-        anthropic_base_url: format!("http://{addr}"),
-        demo: false,
-        workspace: tmp.path().to_path_buf(),
-        ..Default::default()
-    };
-
-    solve("List the files in this directory", &cfg, &emitter, cancel).await;
-
-    let recorded = events.lock().unwrap().clone();
-    let cancelled_trace = recorded
-        .iter()
-        .position(|event| matches!(event, Ev::Trace(message) if message.contains("checkpoint at cancelled")))
-        .expect("expected cancelled curator trace");
-    let error = recorded
-        .iter()
-        .position(|event| matches!(event, Ev::Error(message) if message == "Cancelled"))
-        .expect("expected cancelled error");
-    assert!(
-        cancelled_trace < error,
-        "cancelled checkpoint should flush before error: {recorded:?}"
-    );
-    assert_eq!(
-        *request_count.lock().unwrap(),
-        1,
-        "cancelled solve should not issue a curator model request"
-    );
-}
-
-#[tokio::test]
-async fn test_solve_flushes_model_error_checkpoint_before_error() {
-    use op_core::config::AgentConfig;
-    use op_core::engine::{SolveEmitter, solve};
-    use op_core::events::LoopMetrics;
-
-    let addr = start_stateful_http_server(vec![
-        MockHttpResponse {
-            status: 200,
-            content_type: "text/event-stream",
-            body: ANTHROPIC_SSE_TOOL_LIST,
-            headers: vec![("cache-control", "no-cache")],
-        },
-        MockHttpResponse {
-            status: 500,
-            content_type: "application/json",
-            body: "{\"error\":{\"message\":\"boom\"}}",
-            headers: vec![],
-        },
-        MockHttpResponse {
-            status: 200,
-            content_type: "text/event-stream",
-            body: ANTHROPIC_SSE_CURATOR_NOOP,
-            headers: vec![("cache-control", "no-cache")],
-        },
-    ])
-    .await;
-
-    #[derive(Debug, Clone)]
-    #[allow(dead_code)]
-    enum Ev {
-        Trace(String),
-        Error(String),
-    }
-
-    struct TestEmitter {
-        events: Arc<Mutex<Vec<Ev>>>,
-    }
-
-    impl SolveEmitter for TestEmitter {
-        fn emit_trace(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev::Trace(message.to_string()));
-        }
-
-        fn emit_delta(&self, _: DeltaEvent) {}
-
-        fn emit_step(&self, _: op_core::events::StepEvent) {}
-
-        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>, _: Option<op_core::events::CompletionMeta>) {}
-
-        fn emit_error(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev::Error(message.to_string()));
-        }
-    }
-
-    let events = Arc::new(Mutex::new(Vec::new()));
-    let emitter = TestEmitter {
-        events: events.clone(),
-    };
-    let tmp = tempfile::TempDir::new().unwrap();
-    std::fs::write(tmp.path().join("hello.txt"), "world").unwrap();
-
-    let cfg = AgentConfig {
-        provider: "anthropic".into(),
-        model: "claude-sonnet-4-5".into(),
-        anthropic_api_key: Some("test-key".into()),
-        anthropic_base_url: format!("http://{addr}"),
-        demo: false,
-        workspace: tmp.path().to_path_buf(),
-        ..Default::default()
-    };
-
-    solve(
-        "List the files in this directory",
-        &cfg,
-        &emitter,
-        CancellationToken::new(),
-    )
-    .await;
-
-    let recorded = events.lock().unwrap().clone();
-    let model_error_trace = recorded
-        .iter()
-        .position(|event| matches!(event, Ev::Trace(message) if message.contains("checkpoint at model_error")))
-        .expect("expected model_error curator trace");
-    let error = recorded
-        .iter()
-        .position(|event| matches!(event, Ev::Error(_)))
-        .expect("expected error event");
-    assert!(
-        model_error_trace < error,
-        "model_error checkpoint should flush before error: {recorded:?}"
-    );
-}
-
-#[tokio::test]
-async fn test_solve_flushes_tool_loop_cancel_checkpoint_before_error() {
-    use op_core::config::AgentConfig;
-    use op_core::engine::{SolveEmitter, solve};
-    use op_core::events::LoopMetrics;
-
-    let (addr, request_count) = start_stateful_mock_server_with_counter(vec![
-        ANTHROPIC_SSE_TOOL_LIST,
-        ANTHROPIC_SSE_TWO_TOOL_LIST,
-        ANTHROPIC_SSE_CURATOR_NOOP,
-    ])
-    .await;
-
-    #[derive(Debug, Clone)]
-    #[allow(dead_code)]
-    enum Ev {
-        Trace(String),
-        Error(String),
-    }
-
-    struct TestEmitter {
-        events: Arc<Mutex<Vec<Ev>>>,
-        cancel: CancellationToken,
-        tool_exec_traces: Arc<Mutex<u32>>,
-    }
-
-    impl SolveEmitter for TestEmitter {
-        fn emit_trace(&self, message: &str) {
-            if message.contains("Executing tool: list_files") {
-                let mut count = self.tool_exec_traces.lock().unwrap();
-                *count += 1;
-                if *count == 2 {
-                    self.cancel.cancel();
-                }
-            }
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev::Trace(message.to_string()));
-        }
-
-        fn emit_delta(&self, _: DeltaEvent) {}
-
-        fn emit_step(&self, _: op_core::events::StepEvent) {}
-
-        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>, _: Option<op_core::events::CompletionMeta>) {}
-
-        fn emit_error(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev::Error(message.to_string()));
-        }
-    }
-
-    let events = Arc::new(Mutex::new(Vec::new()));
-    let cancel = CancellationToken::new();
-    let emitter = TestEmitter {
-        events: events.clone(),
-        cancel: cancel.clone(),
-        tool_exec_traces: Arc::new(Mutex::new(0)),
-    };
-    let tmp = tempfile::TempDir::new().unwrap();
-    std::fs::write(tmp.path().join("hello.txt"), "world").unwrap();
-
-    let cfg = AgentConfig {
-        provider: "anthropic".into(),
-        model: "claude-sonnet-4-5".into(),
-        anthropic_api_key: Some("test-key".into()),
-        anthropic_base_url: format!("http://{addr}"),
-        demo: false,
-        workspace: tmp.path().to_path_buf(),
-        ..Default::default()
-    };
-
-    solve("List the files in this directory", &cfg, &emitter, cancel).await;
-
-    let recorded = events.lock().unwrap().clone();
-    let cancelled_trace = recorded
-        .iter()
-        .position(|event| matches!(event, Ev::Trace(message) if message.contains("checkpoint at cancelled")))
-        .expect("expected cancelled curator trace");
-    let error = recorded
-        .iter()
-        .position(|event| matches!(event, Ev::Error(message) if message == "Cancelled"))
-        .expect("expected cancelled error");
-    assert!(
-        cancelled_trace < error,
-        "tool-loop cancel checkpoint should flush before error: {recorded:?}"
-    );
-    assert_eq!(
-        *request_count.lock().unwrap(),
-        2,
-        "tool-loop cancellation should not issue a curator model request"
-    );
-}
-
-const ANTHROPIC_SSE_META_FINAL: &str = "\
-event: message_start\ndata: {\"type\":\"message_start\",\"message\":{\"id\":\"msg_meta_1\",\"type\":\"message\",\"role\":\"assistant\",\"content\":[],\"usage\":{\"input_tokens\":40}}}\n\n\
-event: content_block_start\ndata: {\"type\":\"content_block_start\",\"index\":0,\"content_block\":{\"type\":\"text\",\"text\":\"\"}}\n\n\
-event: content_block_delta\ndata: {\"type\":\"content_block_delta\",\"index\":0,\"delta\":{\"type\":\"text_delta\",\"text\":\"Here is my plan for finishing the task.\"}}\n\n\
-event: content_block_stop\ndata: {\"type\":\"content_block_stop\",\"index\":0}\n\n\
-event: message_delta\ndata: {\"type\":\"message_delta\",\"delta\":{\"stop_reason\":\"end_turn\"},\"usage\":{\"output_tokens\":9}}\n\n\
-event: message_stop\ndata: {\"type\":\"message_stop\"}\n\n";
-
-const ANTHROPIC_SSE_CONCRETE_FINAL: &str = "\
-event: message_start\ndata: {\"type\":\"message_start\",\"message\":{\"id\":\"msg_meta_2\",\"type\":\"message\",\"role\":\"assistant\",\"content\":[],\"usage\":{\"input_tokens\":55}}}\n\n\
-event: content_block_start\ndata: {\"type\":\"content_block_start\",\"index\":0,\"content_block\":{\"type\":\"text\",\"text\":\"\"}}\n\n\
-event: content_block_delta\ndata: {\"type\":\"content_block_delta\",\"index\":0,\"delta\":{\"type\":\"text_delta\",\"text\":\"Completed the task and produced the requested answer.\"}}\n\n\
-event: content_block_stop\ndata: {\"type\":\"content_block_stop\",\"index\":0}\n\n\
-event: message_delta\ndata: {\"type\":\"message_delta\",\"delta\":{\"stop_reason\":\"end_turn\"},\"usage\":{\"output_tokens\":11}}\n\n\
-event: message_stop\ndata: {\"type\":\"message_stop\"}\n\n";
-
-const ANTHROPIC_SSE_META_FINAL_WITH_PROCESS: &str = "\
-event: message_start\ndata: {\"type\":\"message_start\",\"message\":{\"id\":\"msg_meta_3\",\"type\":\"message\",\"role\":\"assistant\",\"content\":[],\"usage\":{\"input_tokens\":45}}}\n\n\
-event: content_block_start\ndata: {\"type\":\"content_block_start\",\"index\":0,\"content_block\":{\"type\":\"text\",\"text\":\"\"}}\n\n\
-event: content_block_delta\ndata: {\"type\":\"content_block_delta\",\"index\":0,\"delta\":{\"type\":\"text_delta\",\"text\":\"Here is my plan: I will inspect files and then implement the fix.\"}}\n\n\
-event: content_block_stop\ndata: {\"type\":\"content_block_stop\",\"index\":0}\n\n\
-event: message_delta\ndata: {\"type\":\"message_delta\",\"delta\":{\"stop_reason\":\"end_turn\"},\"usage\":{\"output_tokens\":12}}\n\n\
-event: message_stop\ndata: {\"type\":\"message_stop\"}\n\n";
-
-#[tokio::test]
-async fn test_solve_rejects_meta_final_until_concrete_completion() {
-    use op_core::config::AgentConfig;
-    use op_core::engine::{SolveEmitter, solve};
-    use op_core::events::{LoopMetrics, StepEvent};
-
-    let addr =
-        start_stateful_mock_server(vec![ANTHROPIC_SSE_META_FINAL, ANTHROPIC_SSE_CONCRETE_FINAL])
-            .await;
-
-    #[derive(Debug, Clone)]
-    #[allow(dead_code)]
-    enum Ev4 {
-        Trace(String),
-        Step(StepEvent),
-        Complete {
-            result: String,
-            loop_metrics: Option<LoopMetrics>,
-        },
-        Error(String),
-    }
-
-    struct TestEmitter4 {
-        events: Arc<Mutex<Vec<Ev4>>>,
-    }
-
-    impl SolveEmitter for TestEmitter4 {
-        fn emit_trace(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev4::Trace(message.to_string()));
-        }
-
-        fn emit_delta(&self, _: DeltaEvent) {}
-
-        fn emit_step(&self, event: StepEvent) {
-            self.events.lock().unwrap().push(Ev4::Step(event));
-        }
-
-        fn emit_complete(&self, result: &str, loop_metrics: Option<LoopMetrics>, _completion: Option<op_core::events::CompletionMeta>) {
-            self.events.lock().unwrap().push(Ev4::Complete {
-                result: result.to_string(),
-                loop_metrics,
-            });
-        }
-
-        fn emit_error(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev4::Error(message.to_string()));
-        }
-    }
-
-    let events = Arc::new(Mutex::new(Vec::new()));
-    let emitter = TestEmitter4 {
-        events: events.clone(),
-    };
-
-    let cfg = AgentConfig {
-        provider: "anthropic".into(),
-        model: "claude-sonnet-4-5".into(),
-        anthropic_api_key: Some("test-key".into()),
-        anthropic_base_url: format!("http://{addr}"),
-        demo: false,
-        ..Default::default()
-    };
-
-    let cancel = CancellationToken::new();
-    solve("Produce the final answer directly", &cfg, &emitter, cancel).await;
-
-    let recorded = events.lock().unwrap().clone();
-    assert!(
-        recorded.iter().any(|event| matches!(
-            event,
-            Ev4::Trace(message) if message.contains("rejected meta final answer")
-        )),
-        "expected a meta-final rejection trace, got: {recorded:?}"
-    );
-
-    let steps: Vec<&StepEvent> = recorded
-        .iter()
-        .filter_map(|event| match event {
-            Ev4::Step(step) => Some(step),
-            _ => None,
-        })
-        .collect();
-    assert_eq!(steps.len(), 1, "only the concrete final should emit a step");
-    assert!(
-        steps[0].is_final,
-        "the emitted step should be the concrete final"
-    );
-    assert_eq!(
-        steps[0]
-            .loop_metrics
-            .as_ref()
-            .map(|metrics| metrics.final_rejections),
-        Some(1)
-    );
-
-    assert!(
-        recorded.iter().any(|event| matches!(
-            event,
-            Ev4::Complete { result, loop_metrics }
-                if result.contains("Completed the task")
-                    && loop_metrics.as_ref().map(|metrics| metrics.final_rejections) == Some(1)
-        )),
-        "expected completion after the rejection loop, got: {recorded:?}"
-    );
-    assert!(
-        !recorded.iter().any(|event| matches!(event, Ev4::Error(_))),
-        "did not expect errors, got: {recorded:?}"
-    );
-}
-
-#[tokio::test]
-async fn test_solve_allows_structural_meta_for_plan_objectives() {
-    use op_core::config::AgentConfig;
-    use op_core::engine::{SolveEmitter, solve};
-    use op_core::events::{LoopMetrics, StepEvent};
-
-    let addr = start_stateful_mock_server(vec![ANTHROPIC_SSE_META_FINAL]).await;
-
-    #[derive(Debug, Clone)]
-    #[allow(dead_code)]
-    enum Ev5 {
-        Trace(String),
-        Step(StepEvent),
-        Complete {
-            result: String,
-            loop_metrics: Option<LoopMetrics>,
-        },
-        Error(String),
-    }
-
-    struct TestEmitter5 {
-        events: Arc<Mutex<Vec<Ev5>>>,
-    }
-
-    impl SolveEmitter for TestEmitter5 {
-        fn emit_trace(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev5::Trace(message.to_string()));
-        }
-
-        fn emit_delta(&self, _: DeltaEvent) {}
-
-        fn emit_step(&self, event: StepEvent) {
-            self.events.lock().unwrap().push(Ev5::Step(event));
-        }
-
-        fn emit_complete(&self, result: &str, loop_metrics: Option<LoopMetrics>, _completion: Option<op_core::events::CompletionMeta>) {
-            self.events.lock().unwrap().push(Ev5::Complete {
-                result: result.to_string(),
-                loop_metrics,
-            });
-        }
-
-        fn emit_error(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev5::Error(message.to_string()));
-        }
-    }
-
-    let events = Arc::new(Mutex::new(Vec::new()));
-    let emitter = TestEmitter5 {
-        events: events.clone(),
-    };
-
-    let cfg = AgentConfig {
-        provider: "anthropic".into(),
-        model: "claude-sonnet-4-5".into(),
-        anthropic_api_key: Some("test-key".into()),
-        anthropic_base_url: format!("http://{addr}"),
-        demo: false,
-        ..Default::default()
-    };
-
-    let cancel = CancellationToken::new();
-    solve(
-        "Write a plan for finishing the task",
-        &cfg,
-        &emitter,
-        cancel,
-    )
-    .await;
-
-    let recorded = events.lock().unwrap().clone();
-    assert!(
-        !recorded.iter().any(|event| matches!(
-            event,
-            Ev5::Trace(message) if message.contains("rejected meta final answer")
-        )),
-        "did not expect a meta-final rejection trace, got: {recorded:?}"
-    );
-    assert!(
-        recorded.iter().any(|event| matches!(
-            event,
-            Ev5::Complete { result, loop_metrics }
-                if result.contains("Here is my plan")
-                    && loop_metrics.as_ref().map(|metrics| metrics.final_rejections) == Some(0)
-        )),
-        "expected structural plan response to complete cleanly, got: {recorded:?}"
-    );
-    assert!(
-        !recorded.iter().any(|event| matches!(event, Ev5::Error(_))),
-        "did not expect errors, got: {recorded:?}"
-    );
-}
-
-#[tokio::test]
-async fn test_solve_rejects_process_meta_even_for_plan_objectives() {
-    use op_core::config::AgentConfig;
-    use op_core::engine::{SolveEmitter, solve};
-    use op_core::events::{LoopMetrics, StepEvent};
-
-    let addr = start_stateful_mock_server(vec![
-        ANTHROPIC_SSE_META_FINAL_WITH_PROCESS,
-        ANTHROPIC_SSE_CONCRETE_FINAL,
-    ])
-    .await;
-
-    #[derive(Debug, Clone)]
-    #[allow(dead_code)]
-    enum Ev6 {
-        Trace(String),
-        Step(StepEvent),
-        Complete {
-            result: String,
-            loop_metrics: Option<LoopMetrics>,
-        },
-        Error(String),
-    }
-
-    struct TestEmitter6 {
-        events: Arc<Mutex<Vec<Ev6>>>,
-    }
-
-    impl SolveEmitter for TestEmitter6 {
-        fn emit_trace(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev6::Trace(message.to_string()));
-        }
-
-        fn emit_delta(&self, _: DeltaEvent) {}
-
-        fn emit_step(&self, event: StepEvent) {
-            self.events.lock().unwrap().push(Ev6::Step(event));
-        }
-
-        fn emit_complete(&self, result: &str, loop_metrics: Option<LoopMetrics>, _completion: Option<op_core::events::CompletionMeta>) {
-            self.events.lock().unwrap().push(Ev6::Complete {
-                result: result.to_string(),
-                loop_metrics,
-            });
-        }
-
-        fn emit_error(&self, message: &str) {
-            self.events
-                .lock()
-                .unwrap()
-                .push(Ev6::Error(message.to_string()));
-        }
-    }
-
-    let events = Arc::new(Mutex::new(Vec::new()));
-    let emitter = TestEmitter6 {
-        events: events.clone(),
-    };
-
-    let cfg = AgentConfig {
-        provider: "anthropic".into(),
-        model: "claude-sonnet-4-5".into(),
-        anthropic_api_key: Some("test-key".into()),
-        anthropic_base_url: format!("http://{addr}"),
-        demo: false,
-        ..Default::default()
-    };
-
-    let cancel = CancellationToken::new();
-    solve(
-        "Write a plan for finishing the task",
-        &cfg,
-        &emitter,
-        cancel,
-    )
-    .await;
-
-    let recorded = events.lock().unwrap().clone();
-    assert!(
-        recorded.iter().any(|event| matches!(
-            event,
-            Ev6::Trace(message) if message.contains("rejected meta final answer")
-        )),
-        "expected a meta-final rejection trace, got: {recorded:?}"
-    );
-    assert!(
-        recorded.iter().any(|event| matches!(
-            event,
-            Ev6::Complete { result, loop_metrics }
-                if result.contains("Completed the task")
-                    && loop_metrics.as_ref().map(|metrics| metrics.final_rejections) == Some(1)
-        )),
-        "expected completion after rejecting process-meta response, got: {recorded:?}"
-    );
-    assert!(
-        !recorded.iter().any(|event| matches!(event, Ev6::Error(_))),
-        "did not expect errors, got: {recorded:?}"
-    );
-}
diff --git a/openplanter-desktop/crates/op-tauri/Cargo.toml b/openplanter-desktop/crates/op-tauri/Cargo.toml
index a70210ef..8b7200bb 100644
--- a/openplanter-desktop/crates/op-tauri/Cargo.toml
+++ b/openplanter-desktop/crates/op-tauri/Cargo.toml
@@ -11,6 +11,7 @@ tauri-plugin-shell = "2"
 tokio = { workspace = true }
 serde = { workspace = true }
 serde_json = { workspace = true }
+uuid = { workspace = true }
 chrono = { workspace = true }
 tokio-util = { workspace = true }
 regex = { workspace = true }
diff --git a/openplanter-desktop/frontend/e2e/streaming.spec.ts b/openplanter-desktop/frontend/e2e/streaming.spec.ts
index e328249f..9afe59a4 100644
--- a/openplanter-desktop/frontend/e2e/streaming.spec.ts
+++ b/openplanter-desktop/frontend/e2e/streaming.spec.ts
@@ -113,27 +113,6 @@ async function sendStep(
   );
 }
 
-async function expectGraphPaneVisibleAndStable(page: Page) {
-  const graphPane = page.locator(".graph-pane");
-  await expect(graphPane).toBeVisible();
-
-  const box = await graphPane.boundingBox();
-  expect(box).not.toBeNull();
-
-  const viewport = page.viewportSize();
-  expect(viewport).not.toBeNull();
-
-  expect(box!.width).toBeGreaterThan(150);
-  expect(box!.x).toBeGreaterThanOrEqual(0);
-  expect(box!.x + box!.width).toBeLessThanOrEqual(viewport!.width + 1);
-
-  const appMetrics = await page.locator("#app").evaluate((el) => ({
-    clientWidth: el.clientWidth,
-    scrollWidth: el.scrollWidth,
-  }));
-  expect(appMetrics.scrollWidth).toBeLessThanOrEqual(appMetrics.clientWidth + 1);
-}
-
 test.describe("Streaming Display", () => {
   test.beforeEach(async ({ page }) => {
     await injectTauriMocks(page);
@@ -314,35 +293,4 @@ test.describe("Streaming Display", () => {
       path: "e2e/screenshots/35-activity-elapsed.png",
     });
   });
-
-  test("long streamed preview text does not push graph pane off-screen", async ({
-    page,
-  }) => {
-    const longPreview = `Investigating_${"CentralFlorida".repeat(120)}`;
-
-    await sendDelta(page, "thinking", longPreview);
-    await expect(page.locator(".activity-preview")).toContainText("Investigating_");
-
-    await expectGraphPaneVisibleAndStable(page);
-  });
-
-  test("long tool call rows do not push graph pane off-screen", async ({
-    page,
-  }) => {
-    const longCommand = `find_${"central_florida_workspace".repeat(80)}`;
-
-    await sendDelta(page, "tool_call_start", "run_shell");
-    await sendDelta(
-      page,
-      "tool_call_args",
-      JSON.stringify({ command: longCommand })
-    );
-    await sendStep(page, 1, 6400, 1200);
-
-    const toolLine = page.locator(".step-tool-line").first();
-    await expect(toolLine).toBeVisible();
-    await expect(toolLine).toContainText("run_shell");
-
-    await expectGraphPaneVisibleAndStable(page);
-  });
 });
diff --git a/openplanter-desktop/frontend/package-lock.json b/openplanter-desktop/frontend/package-lock.json
index 387190b3..841a0662 100644
--- a/openplanter-desktop/frontend/package-lock.json
+++ b/openplanter-desktop/frontend/package-lock.json
@@ -1092,7 +1092,6 @@
       "resolved": "https://registry.npmjs.org/cytoscape/-/cytoscape-3.33.1.tgz",
       "integrity": "sha512-iJc4TwyANnOGR1OmWhsS9ayRS3s+XQ185FmuHObThD+5AeJCakAAbWv8KimMTt08xCCLNgneQwFp+JRJOr9qGQ==",
       "license": "MIT",
-      "peer": true,
       "engines": {
         "node": ">=0.10"
       }
@@ -1398,7 +1397,6 @@
       "integrity": "sha512-5gTmgEY/sqK6gFXLIsQNH19lWb4ebPDLA4SdLP7dsWkIXHWlG66oPuVvXSGFPppYZz8ZDZq0dYYrbHfBCVUb1Q==",
       "dev": true,
       "license": "MIT",
-      "peer": true,
       "engines": {
         "node": ">=12"
       },
@@ -1644,7 +1642,6 @@
       "integrity": "sha512-+Oxm7q9hDoLMyJOYfUYBuHQo+dkAloi33apOPP56pzj+vsdJDzr+j1NISE5pyaAuKL4A3UD34qd0lx5+kfKp2g==",
       "dev": true,
       "license": "MIT",
-      "peer": true,
       "dependencies": {
         "esbuild": "^0.25.0",
         "fdir": "^6.4.4",
diff --git a/openplanter-desktop/frontend/src/styles/main.css b/openplanter-desktop/frontend/src/styles/main.css
index eae58ebc..8f3fa2b6 100644
--- a/openplanter-desktop/frontend/src/styles/main.css
+++ b/openplanter-desktop/frontend/src/styles/main.css
@@ -19,7 +19,7 @@ html, body {
 #app {
   display: grid;
   grid-template-rows: var(--statusbar-height) 1fr;
-  grid-template-columns: var(--sidebar-width) minmax(0, 3fr) minmax(0, 2fr);
+  grid-template-columns: var(--sidebar-width) 3fr 2fr;
   height: 100vh;
   gap: 1px;
   background: var(--border);
@@ -151,13 +151,11 @@ html, body {
   font-family: var(--font-mono);
   font-size: 13px;
   line-height: 1.5;
-  min-width: 0;
   min-height: 0;
 }
 
 .chat-messages {
   flex: 1;
-  min-width: 0;
   min-height: 0;
   overflow-y: auto;
   padding: 12px 16px;
@@ -168,11 +166,9 @@ html, body {
 
 .message {
   width: 100%;
-  min-width: 0;
   padding: 2px 0;
   white-space: pre-wrap;
   word-break: break-word;
-  overflow-wrap: anywhere;
 }
 
 .message.user {
@@ -275,8 +271,6 @@ html, body {
   border-radius: var(--radius);
   padding: 8px 12px;
   margin: 6px 0;
-  max-width: 100%;
-  min-width: 0;
   overflow-x: auto;
 }
 
@@ -338,7 +332,6 @@ html, body {
   font-size: 12px;
   color: var(--text-secondary);
   white-space: nowrap;
-  min-width: 0;
   overflow: hidden;
   text-overflow: ellipsis;
 }
@@ -346,15 +339,10 @@ html, body {
 .tool-call-block .tool-fn {
   color: var(--warning);
   font-weight: 600;
-  flex-shrink: 0;
 }
 
 .tool-call-block .tool-arg {
-  flex: 1 1 auto;
-  min-width: 0;
   color: var(--text-muted);
-  overflow: hidden;
-  text-overflow: ellipsis;
 }
 
 .tool-result-wrapper {
@@ -369,7 +357,6 @@ html, body {
   color: var(--text-muted);
   white-space: pre-wrap;
   word-break: break-word;
-  overflow-wrap: anywhere;
   max-height: 6em;
   overflow: hidden;
 }
@@ -414,7 +401,6 @@ html, body {
 .activity-indicator {
   padding: 4px 0;
   margin: 2px 0;
-  min-width: 0;
 }
 
 .activity-row {
@@ -422,7 +408,6 @@ html, body {
   align-items: center;
   gap: 8px;
   font-size: 12px;
-  min-width: 0;
 }
 
 .activity-icon {
@@ -488,7 +473,6 @@ html, body {
   padding-left: 20px;
   white-space: pre-wrap;
   word-break: break-word;
-  overflow-wrap: anywhere;
   max-height: 3.6em;
   overflow: hidden;
   line-height: 1.2;
@@ -517,7 +501,6 @@ html, body {
   padding: 2px 0;
   white-space: pre-wrap;
   word-break: break-word;
-  overflow-wrap: anywhere;
   max-height: 3em;
   overflow: hidden;
 }
@@ -529,11 +512,8 @@ html, body {
 }
 
 .step-tool-line {
-  display: flex;
-  align-items: baseline;
   color: var(--text-secondary);
   white-space: nowrap;
-  min-width: 0;
   overflow: hidden;
   text-overflow: ellipsis;
   line-height: 1.7;
@@ -542,21 +522,15 @@ html, body {
 .step-tool-line .tool-fn {
   color: var(--warning);
   font-weight: 600;
-  flex-shrink: 0;
 }
 
 .step-tool-line .tool-arg {
-  flex: 1 1 auto;
-  min-width: 0;
   color: var(--text-muted);
-  overflow: hidden;
-  text-overflow: ellipsis;
 }
 
 .step-tool-line .tool-elapsed {
   color: var(--text-muted);
   font-size: 11px;
-  flex-shrink: 0;
 }
 
 /* Graph pane */
@@ -568,7 +542,6 @@ html, body {
   overflow: hidden;
   display: flex;
   flex-direction: column;
-  min-width: 0;
 }
 
 /* Graph toolbar */
diff --git a/openplanter-desktop/package.json b/openplanter-desktop/package.json
deleted file mode 100644
index 36278c4a..00000000
--- a/openplanter-desktop/package.json
+++ /dev/null
@@ -1,10 +0,0 @@
-{
-  "name": "openplanter-desktop",
-  "private": true,
-  "scripts": {
-    "dev": "npm --prefix frontend run dev",
-    "build": "npm --prefix frontend run build",
-    "test": "npm --prefix frontend run test",
-    "test:e2e": "npm --prefix frontend run test:e2e"
-  }
-}
diff --git a/pyproject.toml b/pyproject.toml
index b145e35b..8a21583b 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -15,16 +15,9 @@ dependencies = [
 ]
 
 [project.optional-dependencies]
-dev = [
-    "pytest>=8.0",
-    "pytest-asyncio>=0.23",
-    "networkx>=3.2",
-    "numpy>=1.26",
-]
 textual = [
     "textual>=0.89",
     "networkx>=3.2",
-    "numpy>=1.26",
 ]
 
 [project.scripts]
diff --git a/tests/test_streaming.py b/tests/test_streaming.py
index 293f6e5d..ac031f85 100644
--- a/tests/test_streaming.py
+++ b/tests/test_streaming.py
@@ -8,9 +8,7 @@
 from unittest.mock import MagicMock, patch
 
 from agent.model import (
-    HTTPModelError,
     ModelError,
-    RateLimitError,
     _accumulate_anthropic_stream,
     _accumulate_openai_stream,
     _http_stream_sse,
@@ -79,15 +77,6 @@ def test_anthropic_error_event_raises(self) -> None:
             _read_sse_events(resp)
         self.assertIn("Overloaded", str(ctx.exception))
 
-    def test_openai_style_rate_limit_error_event_raises(self) -> None:
-        resp = self._make_resp([
-            'data: {"error":{"code":"1302","message":"Rate limit reached for requests"}}',
-            '',
-        ])
-        with self.assertRaises(RateLimitError) as ctx:
-            _read_sse_events(resp)
-        self.assertIn("Rate limit", str(ctx.exception))
-
     def test_done_terminates_early(self) -> None:
         resp = self._make_resp([
             'data: {"choices":[{"delta":{"content":"a"}}]}',
@@ -281,77 +270,6 @@ def fake_urlopen(req, timeout=None):
         # Should only be called once — no retries on HTTP errors
         self.assertEqual(call_count, 1)
 
-    def test_http_429_raises_rate_limit_error(self) -> None:
-        call_count = 0
-
-        def fake_urlopen(req, timeout=None):
-            nonlocal call_count
-            call_count += 1
-            import urllib.error
-            raise urllib.error.HTTPError(
-                url="http://test",
-                code=429,
-                msg="Too Many Requests",
-                hdrs={"Retry-After": "2"},
-                fp=io.BytesIO(b'{"error":{"message":"Too many requests","code":"rate_limit_exceeded"}}'),
-            )
-
-        with patch("agent.model.urllib.request.urlopen", fake_urlopen):
-            with self.assertRaises(RateLimitError) as ctx:
-                _http_stream_sse(
-                    url="http://test/v1/chat/completions",
-                    method="POST",
-                    headers={},
-                    payload={"model": "test"},
-                    max_retries=3,
-                )
-            self.assertEqual(ctx.exception.status_code, 429)
-        self.assertEqual(call_count, 1)
-
-    def test_http_400_with_code_1302_raises_rate_limit_error(self) -> None:
-        def fake_urlopen(req, timeout=None):
-            import urllib.error
-            raise urllib.error.HTTPError(
-                url="http://test",
-                code=400,
-                msg="Bad Request",
-                hdrs={},
-                fp=io.BytesIO(b'{"error":{"message":"Rate limit reached for requests","code":"1302"}}'),
-            )
-
-        with patch("agent.model.urllib.request.urlopen", fake_urlopen):
-            with self.assertRaises(RateLimitError) as ctx:
-                _http_stream_sse(
-                    url="http://test/v1/chat/completions",
-                    method="POST",
-                    headers={},
-                    payload={"model": "test"},
-                    max_retries=3,
-                )
-            self.assertEqual(ctx.exception.provider_code, "1302")
-
-    def test_http_400_non_rate_limit_raises_http_model_error(self) -> None:
-        def fake_urlopen(req, timeout=None):
-            import urllib.error
-            raise urllib.error.HTTPError(
-                url="http://test",
-                code=400,
-                msg="Bad Request",
-                hdrs={},
-                fp=io.BytesIO(b'{"error":{"message":"bad request","code":"invalid_request"}}'),
-            )
-
-        with patch("agent.model.urllib.request.urlopen", fake_urlopen):
-            with self.assertRaises(HTTPModelError) as ctx:
-                _http_stream_sse(
-                    url="http://test/v1/chat/completions",
-                    method="POST",
-                    headers={},
-                    payload={"model": "test"},
-                    max_retries=3,
-                )
-            self.assertEqual(ctx.exception.status_code, 400)
-
 
 if __name__ == "__main__":
     unittest.main()
diff --git a/uv.lock b/uv.lock
deleted file mode 100644
index c4b747eb..00000000
--- a/uv.lock
+++ /dev/null
@@ -1,509 +0,0 @@
-version = 1
-revision = 3
-requires-python = ">=3.10"
-resolution-markers = [
-    "python_full_version >= '3.11'",
-    "python_full_version < '3.11'",
-]
-
-[[package]]
-name = "backports-asyncio-runner"
-version = "1.2.0"
-source = { registry = "https://pypi.org/simple" }
-sdist = { url = "https://files.pythonhosted.org/packages/8e/ff/70dca7d7cb1cbc0edb2c6cc0c38b65cba36cccc491eca64cabd5fe7f8670/backports_asyncio_runner-1.2.0.tar.gz", hash = "sha256:a5aa7b2b7d8f8bfcaa2b57313f70792df84e32a2a746f585213373f900b42162", size = 69893, upload-time = "2025-07-02T02:27:15.685Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/a0/59/76ab57e3fe74484f48a53f8e337171b4a2349e506eabe136d7e01d059086/backports_asyncio_runner-1.2.0-py3-none-any.whl", hash = "sha256:0da0a936a8aeb554eccb426dc55af3ba63bcdc69fa1a600b5bb305413a4477b5", size = 12313, upload-time = "2025-07-02T02:27:14.263Z" },
-]
-
-[[package]]
-name = "colorama"
-version = "0.4.6"
-source = { registry = "https://pypi.org/simple" }
-sdist = { url = "https://files.pythonhosted.org/packages/d8/53/6f443c9a4a8358a93a6792e2acffb9d9d5cb0a5cfd8802644b7b1c9a02e4/colorama-0.4.6.tar.gz", hash = "sha256:08695f5cb7ed6e0531a20572697297273c47b8cae5a63ffc6d6ed5c201be6e44", size = 27697, upload-time = "2022-10-25T02:36:22.414Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/d1/d6/3965ed04c63042e047cb6a3e6ed1a63a35087b6a609aa3a15ed8ac56c221/colorama-0.4.6-py2.py3-none-any.whl", hash = "sha256:4f1d9991f5acc0ca119f9d443620b77f9d6b33703e51011c16baf57afb285fc6", size = 25335, upload-time = "2022-10-25T02:36:20.889Z" },
-]
-
-[[package]]
-name = "exceptiongroup"
-version = "1.3.1"
-source = { registry = "https://pypi.org/simple" }
-dependencies = [
-    { name = "typing-extensions", marker = "python_full_version < '3.11'" },
-]
-sdist = { url = "https://files.pythonhosted.org/packages/50/79/66800aadf48771f6b62f7eb014e352e5d06856655206165d775e675a02c9/exceptiongroup-1.3.1.tar.gz", hash = "sha256:8b412432c6055b0b7d14c310000ae93352ed6754f70fa8f7c34141f91c4e3219", size = 30371, upload-time = "2025-11-21T23:01:54.787Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/8a/0e/97c33bf5009bdbac74fd2beace167cab3f978feb69cc36f1ef79360d6c4e/exceptiongroup-1.3.1-py3-none-any.whl", hash = "sha256:a7a39a3bd276781e98394987d3a5701d0c4edffb633bb7a5144577f82c773598", size = 16740, upload-time = "2025-11-21T23:01:53.443Z" },
-]
-
-[[package]]
-name = "iniconfig"
-version = "2.3.0"
-source = { registry = "https://pypi.org/simple" }
-sdist = { url = "https://files.pythonhosted.org/packages/72/34/14ca021ce8e5dfedc35312d08ba8bf51fdd999c576889fc2c24cb97f4f10/iniconfig-2.3.0.tar.gz", hash = "sha256:c76315c77db068650d49c5b56314774a7804df16fee4402c1f19d6d15d8c4730", size = 20503, upload-time = "2025-10-18T21:55:43.219Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/cb/b1/3846dd7f199d53cb17f49cba7e651e9ce294d8497c8c150530ed11865bb8/iniconfig-2.3.0-py3-none-any.whl", hash = "sha256:f631c04d2c48c52b84d0d0549c99ff3859c98df65b3101406327ecc7d53fbf12", size = 7484, upload-time = "2025-10-18T21:55:41.639Z" },
-]
-
-[[package]]
-name = "linkify-it-py"
-version = "2.1.0"
-source = { registry = "https://pypi.org/simple" }
-dependencies = [
-    { name = "uc-micro-py" },
-]
-sdist = { url = "https://files.pythonhosted.org/packages/2e/c9/06ea13676ef354f0af6169587ae292d3e2406e212876a413bf9eece4eb23/linkify_it_py-2.1.0.tar.gz", hash = "sha256:43360231720999c10e9328dc3691160e27a718e280673d444c38d7d3aaa3b98b", size = 29158, upload-time = "2026-03-01T07:48:47.683Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/b4/de/88b3be5c31b22333b3ca2f6ff1de4e863d8fe45aaea7485f591970ec1d3e/linkify_it_py-2.1.0-py3-none-any.whl", hash = "sha256:0d252c1594ecba2ecedc444053db5d3a9b7ec1b0dd929c8f1d74dce89f86c05e", size = 19878, upload-time = "2026-03-01T07:48:46.098Z" },
-]
-
-[[package]]
-name = "markdown-it-py"
-version = "4.0.0"
-source = { registry = "https://pypi.org/simple" }
-dependencies = [
-    { name = "mdurl" },
-]
-sdist = { url = "https://files.pythonhosted.org/packages/5b/f5/4ec618ed16cc4f8fb3b701563655a69816155e79e24a17b651541804721d/markdown_it_py-4.0.0.tar.gz", hash = "sha256:cb0a2b4aa34f932c007117b194e945bd74e0ec24133ceb5bac59009cda1cb9f3", size = 73070, upload-time = "2025-08-11T12:57:52.854Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/94/54/e7d793b573f298e1c9013b8c4dade17d481164aa517d1d7148619c2cedbf/markdown_it_py-4.0.0-py3-none-any.whl", hash = "sha256:87327c59b172c5011896038353a81343b6754500a08cd7a4973bb48c6d578147", size = 87321, upload-time = "2025-08-11T12:57:51.923Z" },
-]
-
-[package.optional-dependencies]
-linkify = [
-    { name = "linkify-it-py" },
-]
-
-[[package]]
-name = "mdit-py-plugins"
-version = "0.5.0"
-source = { registry = "https://pypi.org/simple" }
-dependencies = [
-    { name = "markdown-it-py" },
-]
-sdist = { url = "https://files.pythonhosted.org/packages/b2/fd/a756d36c0bfba5f6e39a1cdbdbfdd448dc02692467d83816dff4592a1ebc/mdit_py_plugins-0.5.0.tar.gz", hash = "sha256:f4918cb50119f50446560513a8e311d574ff6aaed72606ddae6d35716fe809c6", size = 44655, upload-time = "2025-08-11T07:25:49.083Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/fb/86/dd6e5db36df29e76c7a7699123569a4a18c1623ce68d826ed96c62643cae/mdit_py_plugins-0.5.0-py3-none-any.whl", hash = "sha256:07a08422fc1936a5d26d146759e9155ea466e842f5ab2f7d2266dd084c8dab1f", size = 57205, upload-time = "2025-08-11T07:25:47.597Z" },
-]
-
-[[package]]
-name = "mdurl"
-version = "0.1.2"
-source = { registry = "https://pypi.org/simple" }
-sdist = { url = "https://files.pythonhosted.org/packages/d6/54/cfe61301667036ec958cb99bd3efefba235e65cdeb9c84d24a8293ba1d90/mdurl-0.1.2.tar.gz", hash = "sha256:bb413d29f5eea38f31dd4754dd7377d4465116fb207585f97bf925588687c1ba", size = 8729, upload-time = "2022-08-14T12:40:10.846Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/b3/38/89ba8ad64ae25be8de66a6d463314cf1eb366222074cfda9ee839c56a4b4/mdurl-0.1.2-py3-none-any.whl", hash = "sha256:84008a41e51615a49fc9966191ff91509e3c40b939176e643fd50a5c2196b8f8", size = 9979, upload-time = "2022-08-14T12:40:09.779Z" },
-]
-
-[[package]]
-name = "networkx"
-version = "3.4.2"
-source = { registry = "https://pypi.org/simple" }
-resolution-markers = [
-    "python_full_version < '3.11'",
-]
-sdist = { url = "https://files.pythonhosted.org/packages/fd/1d/06475e1cd5264c0b870ea2cc6fdb3e37177c1e565c43f56ff17a10e3937f/networkx-3.4.2.tar.gz", hash = "sha256:307c3669428c5362aab27c8a1260aa8f47c4e91d3891f48be0141738d8d053e1", size = 2151368, upload-time = "2024-10-21T12:39:38.695Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/b9/54/dd730b32ea14ea797530a4479b2ed46a6fb250f682a9cfb997e968bf0261/networkx-3.4.2-py3-none-any.whl", hash = "sha256:df5d4365b724cf81b8c6a7312509d0c22386097011ad1abe274afd5e9d3bbc5f", size = 1723263, upload-time = "2024-10-21T12:39:36.247Z" },
-]
-
-[[package]]
-name = "networkx"
-version = "3.6.1"
-source = { registry = "https://pypi.org/simple" }
-resolution-markers = [
-    "python_full_version >= '3.11'",
-]
-sdist = { url = "https://files.pythonhosted.org/packages/6a/51/63fe664f3908c97be9d2e4f1158eb633317598cfa6e1fc14af5383f17512/networkx-3.6.1.tar.gz", hash = "sha256:26b7c357accc0c8cde558ad486283728b65b6a95d85ee1cd66bafab4c8168509", size = 2517025, upload-time = "2025-12-08T17:02:39.908Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/9e/c9/b2622292ea83fbb4ec318f5b9ab867d0a28ab43c5717bb85b0a5f6b3b0a4/networkx-3.6.1-py3-none-any.whl", hash = "sha256:d47fbf302e7d9cbbb9e2555a0d267983d2aa476bac30e90dfbe5669bd57f3762", size = 2068504, upload-time = "2025-12-08T17:02:38.159Z" },
-]
-
-[[package]]
-name = "numpy"
-version = "2.2.6"
-source = { registry = "https://pypi.org/simple" }
-resolution-markers = [
-    "python_full_version < '3.11'",
-]
-sdist = { url = "https://files.pythonhosted.org/packages/76/21/7d2a95e4bba9dc13d043ee156a356c0a8f0c6309dff6b21b4d71a073b8a8/numpy-2.2.6.tar.gz", hash = "sha256:e29554e2bef54a90aa5cc07da6ce955accb83f21ab5de01a62c8478897b264fd", size = 20276440, upload-time = "2025-05-17T22:38:04.611Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/9a/3e/ed6db5be21ce87955c0cbd3009f2803f59fa08df21b5df06862e2d8e2bdd/numpy-2.2.6-cp310-cp310-macosx_10_9_x86_64.whl", hash = "sha256:b412caa66f72040e6d268491a59f2c43bf03eb6c96dd8f0307829feb7fa2b6fb", size = 21165245, upload-time = "2025-05-17T21:27:58.555Z" },
-    { url = "https://files.pythonhosted.org/packages/22/c2/4b9221495b2a132cc9d2eb862e21d42a009f5a60e45fc44b00118c174bff/numpy-2.2.6-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:8e41fd67c52b86603a91c1a505ebaef50b3314de0213461c7a6e99c9a3beff90", size = 14360048, upload-time = "2025-05-17T21:28:21.406Z" },
-    { url = "https://files.pythonhosted.org/packages/fd/77/dc2fcfc66943c6410e2bf598062f5959372735ffda175b39906d54f02349/numpy-2.2.6-cp310-cp310-macosx_14_0_arm64.whl", hash = "sha256:37e990a01ae6ec7fe7fa1c26c55ecb672dd98b19c3d0e1d1f326fa13cb38d163", size = 5340542, upload-time = "2025-05-17T21:28:30.931Z" },
-    { url = "https://files.pythonhosted.org/packages/7a/4f/1cb5fdc353a5f5cc7feb692db9b8ec2c3d6405453f982435efc52561df58/numpy-2.2.6-cp310-cp310-macosx_14_0_x86_64.whl", hash = "sha256:5a6429d4be8ca66d889b7cf70f536a397dc45ba6faeb5f8c5427935d9592e9cf", size = 6878301, upload-time = "2025-05-17T21:28:41.613Z" },
-    { url = "https://files.pythonhosted.org/packages/eb/17/96a3acd228cec142fcb8723bd3cc39c2a474f7dcf0a5d16731980bcafa95/numpy-2.2.6-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:efd28d4e9cd7d7a8d39074a4d44c63eda73401580c5c76acda2ce969e0a38e83", size = 14297320, upload-time = "2025-05-17T21:29:02.78Z" },
-    { url = "https://files.pythonhosted.org/packages/b4/63/3de6a34ad7ad6646ac7d2f55ebc6ad439dbbf9c4370017c50cf403fb19b5/numpy-2.2.6-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:fc7b73d02efb0e18c000e9ad8b83480dfcd5dfd11065997ed4c6747470ae8915", size = 16801050, upload-time = "2025-05-17T21:29:27.675Z" },
-    { url = "https://files.pythonhosted.org/packages/07/b6/89d837eddef52b3d0cec5c6ba0456c1bf1b9ef6a6672fc2b7873c3ec4e2e/numpy-2.2.6-cp310-cp310-musllinux_1_2_aarch64.whl", hash = "sha256:74d4531beb257d2c3f4b261bfb0fc09e0f9ebb8842d82a7b4209415896adc680", size = 15807034, upload-time = "2025-05-17T21:29:51.102Z" },
-    { url = "https://files.pythonhosted.org/packages/01/c8/dc6ae86e3c61cfec1f178e5c9f7858584049b6093f843bca541f94120920/numpy-2.2.6-cp310-cp310-musllinux_1_2_x86_64.whl", hash = "sha256:8fc377d995680230e83241d8a96def29f204b5782f371c532579b4f20607a289", size = 18614185, upload-time = "2025-05-17T21:30:18.703Z" },
-    { url = "https://files.pythonhosted.org/packages/5b/c5/0064b1b7e7c89137b471ccec1fd2282fceaae0ab3a9550f2568782d80357/numpy-2.2.6-cp310-cp310-win32.whl", hash = "sha256:b093dd74e50a8cba3e873868d9e93a85b78e0daf2e98c6797566ad8044e8363d", size = 6527149, upload-time = "2025-05-17T21:30:29.788Z" },
-    { url = "https://files.pythonhosted.org/packages/a3/dd/4b822569d6b96c39d1215dbae0582fd99954dcbcf0c1a13c61783feaca3f/numpy-2.2.6-cp310-cp310-win_amd64.whl", hash = "sha256:f0fd6321b839904e15c46e0d257fdd101dd7f530fe03fd6359c1ea63738703f3", size = 12904620, upload-time = "2025-05-17T21:30:48.994Z" },
-    { url = "https://files.pythonhosted.org/packages/da/a8/4f83e2aa666a9fbf56d6118faaaf5f1974d456b1823fda0a176eff722839/numpy-2.2.6-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:f9f1adb22318e121c5c69a09142811a201ef17ab257a1e66ca3025065b7f53ae", size = 21176963, upload-time = "2025-05-17T21:31:19.36Z" },
-    { url = "https://files.pythonhosted.org/packages/b3/2b/64e1affc7972decb74c9e29e5649fac940514910960ba25cd9af4488b66c/numpy-2.2.6-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:c820a93b0255bc360f53eca31a0e676fd1101f673dda8da93454a12e23fc5f7a", size = 14406743, upload-time = "2025-05-17T21:31:41.087Z" },
-    { url = "https://files.pythonhosted.org/packages/4a/9f/0121e375000b5e50ffdd8b25bf78d8e1a5aa4cca3f185d41265198c7b834/numpy-2.2.6-cp311-cp311-macosx_14_0_arm64.whl", hash = "sha256:3d70692235e759f260c3d837193090014aebdf026dfd167834bcba43e30c2a42", size = 5352616, upload-time = "2025-05-17T21:31:50.072Z" },
-    { url = "https://files.pythonhosted.org/packages/31/0d/b48c405c91693635fbe2dcd7bc84a33a602add5f63286e024d3b6741411c/numpy-2.2.6-cp311-cp311-macosx_14_0_x86_64.whl", hash = "sha256:481b49095335f8eed42e39e8041327c05b0f6f4780488f61286ed3c01368d491", size = 6889579, upload-time = "2025-05-17T21:32:01.712Z" },
-    { url = "https://files.pythonhosted.org/packages/52/b8/7f0554d49b565d0171eab6e99001846882000883998e7b7d9f0d98b1f934/numpy-2.2.6-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:b64d8d4d17135e00c8e346e0a738deb17e754230d7e0810ac5012750bbd85a5a", size = 14312005, upload-time = "2025-05-17T21:32:23.332Z" },
-    { url = "https://files.pythonhosted.org/packages/b3/dd/2238b898e51bd6d389b7389ffb20d7f4c10066d80351187ec8e303a5a475/numpy-2.2.6-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:ba10f8411898fc418a521833e014a77d3ca01c15b0c6cdcce6a0d2897e6dbbdf", size = 16821570, upload-time = "2025-05-17T21:32:47.991Z" },
-    { url = "https://files.pythonhosted.org/packages/83/6c/44d0325722cf644f191042bf47eedad61c1e6df2432ed65cbe28509d404e/numpy-2.2.6-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:bd48227a919f1bafbdda0583705e547892342c26fb127219d60a5c36882609d1", size = 15818548, upload-time = "2025-05-17T21:33:11.728Z" },
-    { url = "https://files.pythonhosted.org/packages/ae/9d/81e8216030ce66be25279098789b665d49ff19eef08bfa8cb96d4957f422/numpy-2.2.6-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:9551a499bf125c1d4f9e250377c1ee2eddd02e01eac6644c080162c0c51778ab", size = 18620521, upload-time = "2025-05-17T21:33:39.139Z" },
-    { url = "https://files.pythonhosted.org/packages/6a/fd/e19617b9530b031db51b0926eed5345ce8ddc669bb3bc0044b23e275ebe8/numpy-2.2.6-cp311-cp311-win32.whl", hash = "sha256:0678000bb9ac1475cd454c6b8c799206af8107e310843532b04d49649c717a47", size = 6525866, upload-time = "2025-05-17T21:33:50.273Z" },
-    { url = "https://files.pythonhosted.org/packages/31/0a/f354fb7176b81747d870f7991dc763e157a934c717b67b58456bc63da3df/numpy-2.2.6-cp311-cp311-win_amd64.whl", hash = "sha256:e8213002e427c69c45a52bbd94163084025f533a55a59d6f9c5b820774ef3303", size = 12907455, upload-time = "2025-05-17T21:34:09.135Z" },
-    { url = "https://files.pythonhosted.org/packages/82/5d/c00588b6cf18e1da539b45d3598d3557084990dcc4331960c15ee776ee41/numpy-2.2.6-cp312-cp312-macosx_10_13_x86_64.whl", hash = "sha256:41c5a21f4a04fa86436124d388f6ed60a9343a6f767fced1a8a71c3fbca038ff", size = 20875348, upload-time = "2025-05-17T21:34:39.648Z" },
-    { url = "https://files.pythonhosted.org/packages/66/ee/560deadcdde6c2f90200450d5938f63a34b37e27ebff162810f716f6a230/numpy-2.2.6-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:de749064336d37e340f640b05f24e9e3dd678c57318c7289d222a8a2f543e90c", size = 14119362, upload-time = "2025-05-17T21:35:01.241Z" },
-    { url = "https://files.pythonhosted.org/packages/3c/65/4baa99f1c53b30adf0acd9a5519078871ddde8d2339dc5a7fde80d9d87da/numpy-2.2.6-cp312-cp312-macosx_14_0_arm64.whl", hash = "sha256:894b3a42502226a1cac872f840030665f33326fc3dac8e57c607905773cdcde3", size = 5084103, upload-time = "2025-05-17T21:35:10.622Z" },
-    { url = "https://files.pythonhosted.org/packages/cc/89/e5a34c071a0570cc40c9a54eb472d113eea6d002e9ae12bb3a8407fb912e/numpy-2.2.6-cp312-cp312-macosx_14_0_x86_64.whl", hash = "sha256:71594f7c51a18e728451bb50cc60a3ce4e6538822731b2933209a1f3614e9282", size = 6625382, upload-time = "2025-05-17T21:35:21.414Z" },
-    { url = "https://files.pythonhosted.org/packages/f8/35/8c80729f1ff76b3921d5c9487c7ac3de9b2a103b1cd05e905b3090513510/numpy-2.2.6-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:f2618db89be1b4e05f7a1a847a9c1c0abd63e63a1607d892dd54668dd92faf87", size = 14018462, upload-time = "2025-05-17T21:35:42.174Z" },
-    { url = "https://files.pythonhosted.org/packages/8c/3d/1e1db36cfd41f895d266b103df00ca5b3cbe965184df824dec5c08c6b803/numpy-2.2.6-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:fd83c01228a688733f1ded5201c678f0c53ecc1006ffbc404db9f7a899ac6249", size = 16527618, upload-time = "2025-05-17T21:36:06.711Z" },
-    { url = "https://files.pythonhosted.org/packages/61/c6/03ed30992602c85aa3cd95b9070a514f8b3c33e31124694438d88809ae36/numpy-2.2.6-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:37c0ca431f82cd5fa716eca9506aefcabc247fb27ba69c5062a6d3ade8cf8f49", size = 15505511, upload-time = "2025-05-17T21:36:29.965Z" },
-    { url = "https://files.pythonhosted.org/packages/b7/25/5761d832a81df431e260719ec45de696414266613c9ee268394dd5ad8236/numpy-2.2.6-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:fe27749d33bb772c80dcd84ae7e8df2adc920ae8297400dabec45f0dedb3f6de", size = 18313783, upload-time = "2025-05-17T21:36:56.883Z" },
-    { url = "https://files.pythonhosted.org/packages/57/0a/72d5a3527c5ebffcd47bde9162c39fae1f90138c961e5296491ce778e682/numpy-2.2.6-cp312-cp312-win32.whl", hash = "sha256:4eeaae00d789f66c7a25ac5f34b71a7035bb474e679f410e5e1a94deb24cf2d4", size = 6246506, upload-time = "2025-05-17T21:37:07.368Z" },
-    { url = "https://files.pythonhosted.org/packages/36/fa/8c9210162ca1b88529ab76b41ba02d433fd54fecaf6feb70ef9f124683f1/numpy-2.2.6-cp312-cp312-win_amd64.whl", hash = "sha256:c1f9540be57940698ed329904db803cf7a402f3fc200bfe599334c9bd84a40b2", size = 12614190, upload-time = "2025-05-17T21:37:26.213Z" },
-    { url = "https://files.pythonhosted.org/packages/f9/5c/6657823f4f594f72b5471f1db1ab12e26e890bb2e41897522d134d2a3e81/numpy-2.2.6-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:0811bb762109d9708cca4d0b13c4f67146e3c3b7cf8d34018c722adb2d957c84", size = 20867828, upload-time = "2025-05-17T21:37:56.699Z" },
-    { url = "https://files.pythonhosted.org/packages/dc/9e/14520dc3dadf3c803473bd07e9b2bd1b69bc583cb2497b47000fed2fa92f/numpy-2.2.6-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:287cc3162b6f01463ccd86be154f284d0893d2b3ed7292439ea97eafa8170e0b", size = 14143006, upload-time = "2025-05-17T21:38:18.291Z" },
-    { url = "https://files.pythonhosted.org/packages/4f/06/7e96c57d90bebdce9918412087fc22ca9851cceaf5567a45c1f404480e9e/numpy-2.2.6-cp313-cp313-macosx_14_0_arm64.whl", hash = "sha256:f1372f041402e37e5e633e586f62aa53de2eac8d98cbfb822806ce4bbefcb74d", size = 5076765, upload-time = "2025-05-17T21:38:27.319Z" },
-    { url = "https://files.pythonhosted.org/packages/73/ed/63d920c23b4289fdac96ddbdd6132e9427790977d5457cd132f18e76eae0/numpy-2.2.6-cp313-cp313-macosx_14_0_x86_64.whl", hash = "sha256:55a4d33fa519660d69614a9fad433be87e5252f4b03850642f88993f7b2ca566", size = 6617736, upload-time = "2025-05-17T21:38:38.141Z" },
-    { url = "https://files.pythonhosted.org/packages/85/c5/e19c8f99d83fd377ec8c7e0cf627a8049746da54afc24ef0a0cb73d5dfb5/numpy-2.2.6-cp313-cp313-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:f92729c95468a2f4f15e9bb94c432a9229d0d50de67304399627a943201baa2f", size = 14010719, upload-time = "2025-05-17T21:38:58.433Z" },
-    { url = "https://files.pythonhosted.org/packages/19/49/4df9123aafa7b539317bf6d342cb6d227e49f7a35b99c287a6109b13dd93/numpy-2.2.6-cp313-cp313-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:1bc23a79bfabc5d056d106f9befb8d50c31ced2fbc70eedb8155aec74a45798f", size = 16526072, upload-time = "2025-05-17T21:39:22.638Z" },
-    { url = "https://files.pythonhosted.org/packages/b2/6c/04b5f47f4f32f7c2b0e7260442a8cbcf8168b0e1a41ff1495da42f42a14f/numpy-2.2.6-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:e3143e4451880bed956e706a3220b4e5cf6172ef05fcc397f6f36a550b1dd868", size = 15503213, upload-time = "2025-05-17T21:39:45.865Z" },
-    { url = "https://files.pythonhosted.org/packages/17/0a/5cd92e352c1307640d5b6fec1b2ffb06cd0dabe7d7b8227f97933d378422/numpy-2.2.6-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:b4f13750ce79751586ae2eb824ba7e1e8dba64784086c98cdbbcc6a42112ce0d", size = 18316632, upload-time = "2025-05-17T21:40:13.331Z" },
-    { url = "https://files.pythonhosted.org/packages/f0/3b/5cba2b1d88760ef86596ad0f3d484b1cbff7c115ae2429678465057c5155/numpy-2.2.6-cp313-cp313-win32.whl", hash = "sha256:5beb72339d9d4fa36522fc63802f469b13cdbe4fdab4a288f0c441b74272ebfd", size = 6244532, upload-time = "2025-05-17T21:43:46.099Z" },
-    { url = "https://files.pythonhosted.org/packages/cb/3b/d58c12eafcb298d4e6d0d40216866ab15f59e55d148a5658bb3132311fcf/numpy-2.2.6-cp313-cp313-win_amd64.whl", hash = "sha256:b0544343a702fa80c95ad5d3d608ea3599dd54d4632df855e4c8d24eb6ecfa1c", size = 12610885, upload-time = "2025-05-17T21:44:05.145Z" },
-    { url = "https://files.pythonhosted.org/packages/6b/9e/4bf918b818e516322db999ac25d00c75788ddfd2d2ade4fa66f1f38097e1/numpy-2.2.6-cp313-cp313t-macosx_10_13_x86_64.whl", hash = "sha256:0bca768cd85ae743b2affdc762d617eddf3bcf8724435498a1e80132d04879e6", size = 20963467, upload-time = "2025-05-17T21:40:44Z" },
-    { url = "https://files.pythonhosted.org/packages/61/66/d2de6b291507517ff2e438e13ff7b1e2cdbdb7cb40b3ed475377aece69f9/numpy-2.2.6-cp313-cp313t-macosx_11_0_arm64.whl", hash = "sha256:fc0c5673685c508a142ca65209b4e79ed6740a4ed6b2267dbba90f34b0b3cfda", size = 14225144, upload-time = "2025-05-17T21:41:05.695Z" },
-    { url = "https://files.pythonhosted.org/packages/e4/25/480387655407ead912e28ba3a820bc69af9adf13bcbe40b299d454ec011f/numpy-2.2.6-cp313-cp313t-macosx_14_0_arm64.whl", hash = "sha256:5bd4fc3ac8926b3819797a7c0e2631eb889b4118a9898c84f585a54d475b7e40", size = 5200217, upload-time = "2025-05-17T21:41:15.903Z" },
-    { url = "https://files.pythonhosted.org/packages/aa/4a/6e313b5108f53dcbf3aca0c0f3e9c92f4c10ce57a0a721851f9785872895/numpy-2.2.6-cp313-cp313t-macosx_14_0_x86_64.whl", hash = "sha256:fee4236c876c4e8369388054d02d0e9bb84821feb1a64dd59e137e6511a551f8", size = 6712014, upload-time = "2025-05-17T21:41:27.321Z" },
-    { url = "https://files.pythonhosted.org/packages/b7/30/172c2d5c4be71fdf476e9de553443cf8e25feddbe185e0bd88b096915bcc/numpy-2.2.6-cp313-cp313t-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:e1dda9c7e08dc141e0247a5b8f49cf05984955246a327d4c48bda16821947b2f", size = 14077935, upload-time = "2025-05-17T21:41:49.738Z" },
-    { url = "https://files.pythonhosted.org/packages/12/fb/9e743f8d4e4d3c710902cf87af3512082ae3d43b945d5d16563f26ec251d/numpy-2.2.6-cp313-cp313t-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:f447e6acb680fd307f40d3da4852208af94afdfab89cf850986c3ca00562f4fa", size = 16600122, upload-time = "2025-05-17T21:42:14.046Z" },
-    { url = "https://files.pythonhosted.org/packages/12/75/ee20da0e58d3a66f204f38916757e01e33a9737d0b22373b3eb5a27358f9/numpy-2.2.6-cp313-cp313t-musllinux_1_2_aarch64.whl", hash = "sha256:389d771b1623ec92636b0786bc4ae56abafad4a4c513d36a55dce14bd9ce8571", size = 15586143, upload-time = "2025-05-17T21:42:37.464Z" },
-    { url = "https://files.pythonhosted.org/packages/76/95/bef5b37f29fc5e739947e9ce5179ad402875633308504a52d188302319c8/numpy-2.2.6-cp313-cp313t-musllinux_1_2_x86_64.whl", hash = "sha256:8e9ace4a37db23421249ed236fdcdd457d671e25146786dfc96835cd951aa7c1", size = 18385260, upload-time = "2025-05-17T21:43:05.189Z" },
-    { url = "https://files.pythonhosted.org/packages/09/04/f2f83279d287407cf36a7a8053a5abe7be3622a4363337338f2585e4afda/numpy-2.2.6-cp313-cp313t-win32.whl", hash = "sha256:038613e9fb8c72b0a41f025a7e4c3f0b7a1b5d768ece4796b674c8f3fe13efff", size = 6377225, upload-time = "2025-05-17T21:43:16.254Z" },
-    { url = "https://files.pythonhosted.org/packages/67/0e/35082d13c09c02c011cf21570543d202ad929d961c02a147493cb0c2bdf5/numpy-2.2.6-cp313-cp313t-win_amd64.whl", hash = "sha256:6031dd6dfecc0cf9f668681a37648373bddd6421fff6c66ec1624eed0180ee06", size = 12771374, upload-time = "2025-05-17T21:43:35.479Z" },
-    { url = "https://files.pythonhosted.org/packages/9e/3b/d94a75f4dbf1ef5d321523ecac21ef23a3cd2ac8b78ae2aac40873590229/numpy-2.2.6-pp310-pypy310_pp73-macosx_10_15_x86_64.whl", hash = "sha256:0b605b275d7bd0c640cad4e5d30fa701a8d59302e127e5f79138ad62762c3e3d", size = 21040391, upload-time = "2025-05-17T21:44:35.948Z" },
-    { url = "https://files.pythonhosted.org/packages/17/f4/09b2fa1b58f0fb4f7c7963a1649c64c4d315752240377ed74d9cd878f7b5/numpy-2.2.6-pp310-pypy310_pp73-macosx_14_0_x86_64.whl", hash = "sha256:7befc596a7dc9da8a337f79802ee8adb30a552a94f792b9c9d18c840055907db", size = 6786754, upload-time = "2025-05-17T21:44:47.446Z" },
-    { url = "https://files.pythonhosted.org/packages/af/30/feba75f143bdc868a1cc3f44ccfa6c4b9ec522b36458e738cd00f67b573f/numpy-2.2.6-pp310-pypy310_pp73-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:ce47521a4754c8f4593837384bd3424880629f718d87c5d44f8ed763edd63543", size = 16643476, upload-time = "2025-05-17T21:45:11.871Z" },
-    { url = "https://files.pythonhosted.org/packages/37/48/ac2a9584402fb6c0cd5b5d1a91dcf176b15760130dd386bbafdbfe3640bf/numpy-2.2.6-pp310-pypy310_pp73-win_amd64.whl", hash = "sha256:d042d24c90c41b54fd506da306759e06e568864df8ec17ccc17e9e884634fd00", size = 12812666, upload-time = "2025-05-17T21:45:31.426Z" },
-]
-
-[[package]]
-name = "numpy"
-version = "2.4.3"
-source = { registry = "https://pypi.org/simple" }
-resolution-markers = [
-    "python_full_version >= '3.11'",
-]
-sdist = { url = "https://files.pythonhosted.org/packages/10/8b/c265f4823726ab832de836cdd184d0986dcf94480f81e8739692a7ac7af2/numpy-2.4.3.tar.gz", hash = "sha256:483a201202b73495f00dbc83796c6ae63137a9bdade074f7648b3e32613412dd", size = 20727743, upload-time = "2026-03-09T07:58:53.426Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/f9/51/5093a2df15c4dc19da3f79d1021e891f5dcf1d9d1db6ba38891d5590f3fe/numpy-2.4.3-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:33b3bf58ee84b172c067f56aeadc7ee9ab6de69c5e800ab5b10295d54c581adb", size = 16957183, upload-time = "2026-03-09T07:55:57.774Z" },
-    { url = "https://files.pythonhosted.org/packages/b5/7c/c061f3de0630941073d2598dc271ac2f6cbcf5c83c74a5870fea07488333/numpy-2.4.3-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:8ba7b51e71c05aa1f9bc3641463cd82308eab40ce0d5c7e1fd4038cbf9938147", size = 14968734, upload-time = "2026-03-09T07:56:00.494Z" },
-    { url = "https://files.pythonhosted.org/packages/ef/27/d26c85cbcd86b26e4f125b0668e7a7c0542d19dd7d23ee12e87b550e95b5/numpy-2.4.3-cp311-cp311-macosx_14_0_arm64.whl", hash = "sha256:a1988292870c7cb9d0ebb4cc96b4d447513a9644801de54606dc7aabf2b7d920", size = 5475288, upload-time = "2026-03-09T07:56:02.857Z" },
-    { url = "https://files.pythonhosted.org/packages/2b/09/3c4abbc1dcd8010bf1a611d174c7aa689fc505585ec806111b4406f6f1b1/numpy-2.4.3-cp311-cp311-macosx_14_0_x86_64.whl", hash = "sha256:23b46bb6d8ecb68b58c09944483c135ae5f0e9b8d8858ece5e4ead783771d2a9", size = 6805253, upload-time = "2026-03-09T07:56:04.53Z" },
-    { url = "https://files.pythonhosted.org/packages/21/bc/e7aa3f6817e40c3f517d407742337cbb8e6fc4b83ce0b55ab780c829243b/numpy-2.4.3-cp311-cp311-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:a016db5c5dba78fa8fe9f5d80d6708f9c42ab087a739803c0ac83a43d686a470", size = 15969479, upload-time = "2026-03-09T07:56:06.638Z" },
-    { url = "https://files.pythonhosted.org/packages/78/51/9f5d7a41f0b51649ddf2f2320595e15e122a40610b233d51928dd6c92353/numpy-2.4.3-cp311-cp311-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:715de7f82e192e8cae5a507a347d97ad17598f8e026152ca97233e3666daaa71", size = 16901035, upload-time = "2026-03-09T07:56:09.405Z" },
-    { url = "https://files.pythonhosted.org/packages/64/6e/b221dd847d7181bc5ee4857bfb026182ef69499f9305eb1371cbb1aea626/numpy-2.4.3-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:2ddb7919366ee468342b91dea2352824c25b55814a987847b6c52003a7c97f15", size = 17325657, upload-time = "2026-03-09T07:56:12.067Z" },
-    { url = "https://files.pythonhosted.org/packages/eb/b8/8f3fd2da596e1063964b758b5e3c970aed1949a05200d7e3d46a9d46d643/numpy-2.4.3-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:a315e5234d88067f2d97e1f2ef670a7569df445d55400f1e33d117418d008d52", size = 18635512, upload-time = "2026-03-09T07:56:14.629Z" },
-    { url = "https://files.pythonhosted.org/packages/5c/24/2993b775c37e39d2f8ab4125b44337ab0b2ba106c100980b7c274a22bee7/numpy-2.4.3-cp311-cp311-win32.whl", hash = "sha256:2b3f8d2c4589b1a2028d2a770b0fc4d1f332fb5e01521f4de3199a896d158ddd", size = 6238100, upload-time = "2026-03-09T07:56:17.243Z" },
-    { url = "https://files.pythonhosted.org/packages/76/1d/edccf27adedb754db7c4511d5eac8b83f004ae948fe2d3509e8b78097d4c/numpy-2.4.3-cp311-cp311-win_amd64.whl", hash = "sha256:77e76d932c49a75617c6d13464e41203cd410956614d0a0e999b25e9e8d27eec", size = 12609816, upload-time = "2026-03-09T07:56:19.089Z" },
-    { url = "https://files.pythonhosted.org/packages/92/82/190b99153480076c8dce85f4cfe7d53ea84444145ffa54cb58dcd460d66b/numpy-2.4.3-cp311-cp311-win_arm64.whl", hash = "sha256:eb610595dd91560905c132c709412b512135a60f1851ccbd2c959e136431ff67", size = 10485757, upload-time = "2026-03-09T07:56:21.753Z" },
-    { url = "https://files.pythonhosted.org/packages/a9/ed/6388632536f9788cea23a3a1b629f25b43eaacd7d7377e5d6bc7b9deb69b/numpy-2.4.3-cp312-cp312-macosx_10_13_x86_64.whl", hash = "sha256:61b0cbabbb6126c8df63b9a3a0c4b1f44ebca5e12ff6997b80fcf267fb3150ef", size = 16669628, upload-time = "2026-03-09T07:56:24.252Z" },
-    { url = "https://files.pythonhosted.org/packages/74/1b/ee2abfc68e1ce728b2958b6ba831d65c62e1b13ce3017c13943f8f9b5b2e/numpy-2.4.3-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:7395e69ff32526710748f92cd8c9849b361830968ea3e24a676f272653e8983e", size = 14696872, upload-time = "2026-03-09T07:56:26.991Z" },
-    { url = "https://files.pythonhosted.org/packages/ba/d1/780400e915ff5638166f11ca9dc2c5815189f3d7cf6f8759a1685e586413/numpy-2.4.3-cp312-cp312-macosx_14_0_arm64.whl", hash = "sha256:abdce0f71dcb4a00e4e77f3faf05e4616ceccfe72ccaa07f47ee79cda3b7b0f4", size = 5203489, upload-time = "2026-03-09T07:56:29.414Z" },
-    { url = "https://files.pythonhosted.org/packages/0b/bb/baffa907e9da4cc34a6e556d6d90e032f6d7a75ea47968ea92b4858826c4/numpy-2.4.3-cp312-cp312-macosx_14_0_x86_64.whl", hash = "sha256:48da3a4ee1336454b07497ff7ec83903efa5505792c4e6d9bf83d99dc07a1e18", size = 6550814, upload-time = "2026-03-09T07:56:32.225Z" },
-    { url = "https://files.pythonhosted.org/packages/7b/12/8c9f0c6c95f76aeb20fc4a699c33e9f827fa0d0f857747c73bb7b17af945/numpy-2.4.3-cp312-cp312-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:32e3bef222ad6b052280311d1d60db8e259e4947052c3ae7dd6817451fc8a4c5", size = 15666601, upload-time = "2026-03-09T07:56:34.461Z" },
-    { url = "https://files.pythonhosted.org/packages/bd/79/cc665495e4d57d0aa6fbcc0aa57aa82671dfc78fbf95fe733ed86d98f52a/numpy-2.4.3-cp312-cp312-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:e7dd01a46700b1967487141a66ac1a3cf0dd8ebf1f08db37d46389401512ca97", size = 16621358, upload-time = "2026-03-09T07:56:36.852Z" },
-    { url = "https://files.pythonhosted.org/packages/a8/40/b4ecb7224af1065c3539f5ecfff879d090de09608ad1008f02c05c770cb3/numpy-2.4.3-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:76f0f283506c28b12bba319c0fab98217e9f9b54e6160e9c79e9f7348ba32e9c", size = 17016135, upload-time = "2026-03-09T07:56:39.337Z" },
-    { url = "https://files.pythonhosted.org/packages/f7/b1/6a88e888052eed951afed7a142dcdf3b149a030ca59b4c71eef085858e43/numpy-2.4.3-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:737f630a337364665aba3b5a77e56a68cc42d350edd010c345d65a3efa3addcc", size = 18345816, upload-time = "2026-03-09T07:56:42.31Z" },
-    { url = "https://files.pythonhosted.org/packages/f3/8f/103a60c5f8c3d7fc678c19cd7b2476110da689ccb80bc18050efbaeae183/numpy-2.4.3-cp312-cp312-win32.whl", hash = "sha256:26952e18d82a1dbbc2f008d402021baa8d6fc8e84347a2072a25e08b46d698b9", size = 5960132, upload-time = "2026-03-09T07:56:44.851Z" },
-    { url = "https://files.pythonhosted.org/packages/d7/7c/f5ee1bf6ed888494978046a809df2882aad35d414b622893322df7286879/numpy-2.4.3-cp312-cp312-win_amd64.whl", hash = "sha256:65f3c2455188f09678355f5cae1f959a06b778bc66d535da07bf2ef20cd319d5", size = 12316144, upload-time = "2026-03-09T07:56:47.057Z" },
-    { url = "https://files.pythonhosted.org/packages/71/46/8d1cb3f7a00f2fb6394140e7e6623696e54c6318a9d9691bb4904672cf42/numpy-2.4.3-cp312-cp312-win_arm64.whl", hash = "sha256:2abad5c7fef172b3377502bde47892439bae394a71bc329f31df0fd829b41a9e", size = 10220364, upload-time = "2026-03-09T07:56:49.849Z" },
-    { url = "https://files.pythonhosted.org/packages/b6/d0/1fe47a98ce0df229238b77611340aff92d52691bcbc10583303181abf7fc/numpy-2.4.3-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:b346845443716c8e542d54112966383b448f4a3ba5c66409771b8c0889485dd3", size = 16665297, upload-time = "2026-03-09T07:56:52.296Z" },
-    { url = "https://files.pythonhosted.org/packages/27/d9/4e7c3f0e68dfa91f21c6fb6cf839bc829ec920688b1ce7ec722b1a6202fb/numpy-2.4.3-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:2629289168f4897a3c4e23dc98d6f1731f0fc0fe52fb9db19f974041e4cc12b9", size = 14691853, upload-time = "2026-03-09T07:56:54.992Z" },
-    { url = "https://files.pythonhosted.org/packages/3a/66/bd096b13a87549683812b53ab211e6d413497f84e794fb3c39191948da97/numpy-2.4.3-cp313-cp313-macosx_14_0_arm64.whl", hash = "sha256:bb2e3cf95854233799013779216c57e153c1ee67a0bf92138acca0e429aefaee", size = 5198435, upload-time = "2026-03-09T07:56:57.184Z" },
-    { url = "https://files.pythonhosted.org/packages/a2/2f/687722910b5a5601de2135c891108f51dfc873d8e43c8ed9f4ebb440b4a2/numpy-2.4.3-cp313-cp313-macosx_14_0_x86_64.whl", hash = "sha256:7f3408ff897f8ab07a07fbe2823d7aee6ff644c097cc1f90382511fe982f647f", size = 6546347, upload-time = "2026-03-09T07:56:59.531Z" },
-    { url = "https://files.pythonhosted.org/packages/bf/ec/7971c4e98d86c564750393fab8d7d83d0a9432a9d78bb8a163a6dc59967a/numpy-2.4.3-cp313-cp313-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:decb0eb8a53c3b009b0962378065589685d66b23467ef5dac16cbe818afde27f", size = 15664626, upload-time = "2026-03-09T07:57:01.385Z" },
-    { url = "https://files.pythonhosted.org/packages/7e/eb/7daecbea84ec935b7fc732e18f532073064a3816f0932a40a17f3349185f/numpy-2.4.3-cp313-cp313-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:d5f51900414fc9204a0e0da158ba2ac52b75656e7dce7e77fb9f84bfa343b4cc", size = 16608916, upload-time = "2026-03-09T07:57:04.008Z" },
-    { url = "https://files.pythonhosted.org/packages/df/58/2a2b4a817ffd7472dca4421d9f0776898b364154e30c95f42195041dc03b/numpy-2.4.3-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:6bd06731541f89cdc01b261ba2c9e037f1543df7472517836b78dfb15bd6e476", size = 17015824, upload-time = "2026-03-09T07:57:06.347Z" },
-    { url = "https://files.pythonhosted.org/packages/4a/ca/627a828d44e78a418c55f82dd4caea8ea4a8ef24e5144d9e71016e52fb40/numpy-2.4.3-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:22654fe6be0e5206f553a9250762c653d3698e46686eee53b399ab90da59bd92", size = 18334581, upload-time = "2026-03-09T07:57:09.114Z" },
-    { url = "https://files.pythonhosted.org/packages/cd/c0/76f93962fc79955fcba30a429b62304332345f22d4daec1cb33653425643/numpy-2.4.3-cp313-cp313-win32.whl", hash = "sha256:d71e379452a2f670ccb689ec801b1218cd3983e253105d6e83780967e899d687", size = 5958618, upload-time = "2026-03-09T07:57:11.432Z" },
-    { url = "https://files.pythonhosted.org/packages/b1/3c/88af0040119209b9b5cb59485fa48b76f372c73068dbf9254784b975ac53/numpy-2.4.3-cp313-cp313-win_amd64.whl", hash = "sha256:0a60e17a14d640f49146cb38e3f105f571318db7826d9b6fef7e4dce758faecd", size = 12312824, upload-time = "2026-03-09T07:57:13.586Z" },
-    { url = "https://files.pythonhosted.org/packages/58/ce/3d07743aced3d173f877c3ef6a454c2174ba42b584ab0b7e6d99374f51ed/numpy-2.4.3-cp313-cp313-win_arm64.whl", hash = "sha256:c9619741e9da2059cd9c3f206110b97583c7152c1dc9f8aafd4beb450ac1c89d", size = 10221218, upload-time = "2026-03-09T07:57:16.183Z" },
-    { url = "https://files.pythonhosted.org/packages/62/09/d96b02a91d09e9d97862f4fc8bfebf5400f567d8eb1fe4b0cc4795679c15/numpy-2.4.3-cp313-cp313t-macosx_11_0_arm64.whl", hash = "sha256:7aa4e54f6469300ebca1d9eb80acd5253cdfa36f2c03d79a35883687da430875", size = 14819570, upload-time = "2026-03-09T07:57:18.564Z" },
-    { url = "https://files.pythonhosted.org/packages/b5/ca/0b1aba3905fdfa3373d523b2b15b19029f4f3031c87f4066bd9d20ef6c6b/numpy-2.4.3-cp313-cp313t-macosx_14_0_arm64.whl", hash = "sha256:d1b90d840b25874cf5cd20c219af10bac3667db3876d9a495609273ebe679070", size = 5326113, upload-time = "2026-03-09T07:57:21.052Z" },
-    { url = "https://files.pythonhosted.org/packages/c0/63/406e0fd32fcaeb94180fd6a4c41e55736d676c54346b7efbce548b94a914/numpy-2.4.3-cp313-cp313t-macosx_14_0_x86_64.whl", hash = "sha256:a749547700de0a20a6718293396ec237bb38218049cfce788e08fcb716e8cf73", size = 6646370, upload-time = "2026-03-09T07:57:22.804Z" },
-    { url = "https://files.pythonhosted.org/packages/b6/d0/10f7dc157d4b37af92720a196be6f54f889e90dcd30dce9dc657ed92c257/numpy-2.4.3-cp313-cp313t-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:94f3c4a151a2e529adf49c1d54f0f57ff8f9b233ee4d44af623a81553ab86368", size = 15723499, upload-time = "2026-03-09T07:57:24.693Z" },
-    { url = "https://files.pythonhosted.org/packages/66/f1/d1c2bf1161396629701bc284d958dc1efa3a5a542aab83cf11ee6eb4cba5/numpy-2.4.3-cp313-cp313t-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:22c31dc07025123aedf7f2db9e91783df13f1776dc52c6b22c620870dc0fab22", size = 16657164, upload-time = "2026-03-09T07:57:27.676Z" },
-    { url = "https://files.pythonhosted.org/packages/1a/be/cca19230b740af199ac47331a21c71e7a3d0ba59661350483c1600d28c37/numpy-2.4.3-cp313-cp313t-musllinux_1_2_aarch64.whl", hash = "sha256:148d59127ac95979d6f07e4d460f934ebdd6eed641db9c0db6c73026f2b2101a", size = 17081544, upload-time = "2026-03-09T07:57:30.664Z" },
-    { url = "https://files.pythonhosted.org/packages/b9/c5/9602b0cbb703a0936fb40f8a95407e8171935b15846de2f0776e08af04c7/numpy-2.4.3-cp313-cp313t-musllinux_1_2_x86_64.whl", hash = "sha256:a97cbf7e905c435865c2d939af3d93f99d18eaaa3cabe4256f4304fb51604349", size = 18380290, upload-time = "2026-03-09T07:57:33.763Z" },
-    { url = "https://files.pythonhosted.org/packages/ed/81/9f24708953cd30be9ee36ec4778f4b112b45165812f2ada4cc5ea1c1f254/numpy-2.4.3-cp313-cp313t-win32.whl", hash = "sha256:be3b8487d725a77acccc9924f65fd8bce9af7fac8c9820df1049424a2115af6c", size = 6082814, upload-time = "2026-03-09T07:57:36.491Z" },
-    { url = "https://files.pythonhosted.org/packages/e2/9e/52f6eaa13e1a799f0ab79066c17f7016a4a8ae0c1aefa58c82b4dab690b4/numpy-2.4.3-cp313-cp313t-win_amd64.whl", hash = "sha256:1ec84fd7c8e652b0f4aaaf2e6e9cc8eaa9b1b80a537e06b2e3a2fb176eedcb26", size = 12452673, upload-time = "2026-03-09T07:57:38.281Z" },
-    { url = "https://files.pythonhosted.org/packages/c4/04/b8cece6ead0b30c9fbd99bb835ad7ea0112ac5f39f069788c5558e3b1ab2/numpy-2.4.3-cp313-cp313t-win_arm64.whl", hash = "sha256:120df8c0a81ebbf5b9020c91439fccd85f5e018a927a39f624845be194a2be02", size = 10290907, upload-time = "2026-03-09T07:57:40.747Z" },
-    { url = "https://files.pythonhosted.org/packages/70/ae/3936f79adebf8caf81bd7a599b90a561334a658be4dcc7b6329ebf4ee8de/numpy-2.4.3-cp314-cp314-macosx_10_15_x86_64.whl", hash = "sha256:5884ce5c7acfae1e4e1b6fde43797d10aa506074d25b531b4f54bde33c0c31d4", size = 16664563, upload-time = "2026-03-09T07:57:43.817Z" },
-    { url = "https://files.pythonhosted.org/packages/9b/62/760f2b55866b496bb1fa7da2a6db076bef908110e568b02fcfc1422e2a3a/numpy-2.4.3-cp314-cp314-macosx_11_0_arm64.whl", hash = "sha256:297837823f5bc572c5f9379b0c9f3a3365f08492cbdc33bcc3af174372ebb168", size = 14702161, upload-time = "2026-03-09T07:57:46.169Z" },
-    { url = "https://files.pythonhosted.org/packages/32/af/a7a39464e2c0a21526fb4fb76e346fb172ebc92f6d1c7a07c2c139cc17b1/numpy-2.4.3-cp314-cp314-macosx_14_0_arm64.whl", hash = "sha256:a111698b4a3f8dcbe54c64a7708f049355abd603e619013c346553c1fd4ca90b", size = 5208738, upload-time = "2026-03-09T07:57:48.506Z" },
-    { url = "https://files.pythonhosted.org/packages/29/8c/2a0cf86a59558fa078d83805589c2de490f29ed4fb336c14313a161d358a/numpy-2.4.3-cp314-cp314-macosx_14_0_x86_64.whl", hash = "sha256:4bd4741a6a676770e0e97fe9ab2e51de01183df3dcbcec591d26d331a40de950", size = 6543618, upload-time = "2026-03-09T07:57:50.591Z" },
-    { url = "https://files.pythonhosted.org/packages/aa/b8/612ce010c0728b1c363fa4ea3aa4c22fe1c5da1de008486f8c2f5cb92fae/numpy-2.4.3-cp314-cp314-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:54f29b877279d51e210e0c80709ee14ccbbad647810e8f3d375561c45ef613dd", size = 15680676, upload-time = "2026-03-09T07:57:52.34Z" },
-    { url = "https://files.pythonhosted.org/packages/a9/7e/4f120ecc54ba26ddf3dc348eeb9eb063f421de65c05fc961941798feea18/numpy-2.4.3-cp314-cp314-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:679f2a834bae9020f81534671c56fd0cc76dd7e5182f57131478e23d0dc59e24", size = 16613492, upload-time = "2026-03-09T07:57:54.91Z" },
-    { url = "https://files.pythonhosted.org/packages/2c/86/1b6020db73be330c4b45d5c6ee4295d59cfeef0e3ea323959d053e5a6909/numpy-2.4.3-cp314-cp314-musllinux_1_2_aarch64.whl", hash = "sha256:d84f0f881cb2225c2dfd7f78a10a5645d487a496c6668d6cc39f0f114164f3d0", size = 17031789, upload-time = "2026-03-09T07:57:57.641Z" },
-    { url = "https://files.pythonhosted.org/packages/07/3a/3b90463bf41ebc21d1b7e06079f03070334374208c0f9a1f05e4ae8455e7/numpy-2.4.3-cp314-cp314-musllinux_1_2_x86_64.whl", hash = "sha256:d213c7e6e8d211888cc359bab7199670a00f5b82c0978b9d1c75baf1eddbeac0", size = 18339941, upload-time = "2026-03-09T07:58:00.577Z" },
-    { url = "https://files.pythonhosted.org/packages/a8/74/6d736c4cd962259fd8bae9be27363eb4883a2f9069763747347544c2a487/numpy-2.4.3-cp314-cp314-win32.whl", hash = "sha256:52077feedeff7c76ed7c9f1a0428558e50825347b7545bbb8523da2cd55c547a", size = 6007503, upload-time = "2026-03-09T07:58:03.331Z" },
-    { url = "https://files.pythonhosted.org/packages/48/39/c56ef87af669364356bb011922ef0734fc49dad51964568634c72a009488/numpy-2.4.3-cp314-cp314-win_amd64.whl", hash = "sha256:0448e7f9caefb34b4b7dd2b77f21e8906e5d6f0365ad525f9f4f530b13df2afc", size = 12444915, upload-time = "2026-03-09T07:58:06.353Z" },
-    { url = "https://files.pythonhosted.org/packages/9d/1f/ab8528e38d295fd349310807496fabb7cf9fe2e1f70b97bc20a483ea9d4a/numpy-2.4.3-cp314-cp314-win_arm64.whl", hash = "sha256:b44fd60341c4d9783039598efadd03617fa28d041fc37d22b62d08f2027fa0e7", size = 10494875, upload-time = "2026-03-09T07:58:08.734Z" },
-    { url = "https://files.pythonhosted.org/packages/e6/ef/b7c35e4d5ef141b836658ab21a66d1a573e15b335b1d111d31f26c8ef80f/numpy-2.4.3-cp314-cp314t-macosx_11_0_arm64.whl", hash = "sha256:0a195f4216be9305a73c0e91c9b026a35f2161237cf1c6de9b681637772ea657", size = 14822225, upload-time = "2026-03-09T07:58:11.034Z" },
-    { url = "https://files.pythonhosted.org/packages/cd/8d/7730fa9278cf6648639946cc816e7cc89f0d891602584697923375f801ed/numpy-2.4.3-cp314-cp314t-macosx_14_0_arm64.whl", hash = "sha256:cd32fbacb9fd1bf041bf8e89e4576b6f00b895f06d00914820ae06a616bdfef7", size = 5328769, upload-time = "2026-03-09T07:58:13.67Z" },
-    { url = "https://files.pythonhosted.org/packages/47/01/d2a137317c958b074d338807c1b6a383406cdf8b8e53b075d804cc3d211d/numpy-2.4.3-cp314-cp314t-macosx_14_0_x86_64.whl", hash = "sha256:2e03c05abaee1f672e9d67bc858f300b5ccba1c21397211e8d77d98350972093", size = 6649461, upload-time = "2026-03-09T07:58:15.912Z" },
-    { url = "https://files.pythonhosted.org/packages/5c/34/812ce12bc0f00272a4b0ec0d713cd237cb390666eb6206323d1cc9cedbb2/numpy-2.4.3-cp314-cp314t-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:7d1ce23cce91fcea443320a9d0ece9b9305d4368875bab09538f7a5b4131938a", size = 15725809, upload-time = "2026-03-09T07:58:17.787Z" },
-    { url = "https://files.pythonhosted.org/packages/25/c0/2aed473a4823e905e765fee3dc2cbf504bd3e68ccb1150fbdabd5c39f527/numpy-2.4.3-cp314-cp314t-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:c59020932feb24ed49ffd03704fbab89f22aa9c0d4b180ff45542fe8918f5611", size = 16655242, upload-time = "2026-03-09T07:58:20.476Z" },
-    { url = "https://files.pythonhosted.org/packages/f2/c8/7e052b2fc87aa0e86de23f20e2c42bd261c624748aa8efd2c78f7bb8d8c6/numpy-2.4.3-cp314-cp314t-musllinux_1_2_aarch64.whl", hash = "sha256:9684823a78a6cd6ad7511fc5e25b07947d1d5b5e2812c93fe99d7d4195130720", size = 17080660, upload-time = "2026-03-09T07:58:23.067Z" },
-    { url = "https://files.pythonhosted.org/packages/f3/3d/0876746044db2adcb11549f214d104f2e1be00f07a67edbb4e2812094847/numpy-2.4.3-cp314-cp314t-musllinux_1_2_x86_64.whl", hash = "sha256:0200b25c687033316fb39f0ff4e3e690e8957a2c3c8d22499891ec58c37a3eb5", size = 18380384, upload-time = "2026-03-09T07:58:25.839Z" },
-    { url = "https://files.pythonhosted.org/packages/07/12/8160bea39da3335737b10308df4f484235fd297f556745f13092aa039d3b/numpy-2.4.3-cp314-cp314t-win32.whl", hash = "sha256:5e10da9e93247e554bb1d22f8edc51847ddd7dde52d85ce31024c1b4312bfba0", size = 6154547, upload-time = "2026-03-09T07:58:28.289Z" },
-    { url = "https://files.pythonhosted.org/packages/42/f3/76534f61f80d74cc9cdf2e570d3d4eeb92c2280a27c39b0aaf471eda7b48/numpy-2.4.3-cp314-cp314t-win_amd64.whl", hash = "sha256:45f003dbdffb997a03da2d1d0cb41fbd24a87507fb41605c0420a3db5bd4667b", size = 12633645, upload-time = "2026-03-09T07:58:30.384Z" },
-    { url = "https://files.pythonhosted.org/packages/1f/b6/7c0d4334c15983cec7f92a69e8ce9b1e6f31857e5ee3a413ac424e6bd63d/numpy-2.4.3-cp314-cp314t-win_arm64.whl", hash = "sha256:4d382735cecd7bcf090172489a525cd7d4087bc331f7df9f60ddc9a296cf208e", size = 10565454, upload-time = "2026-03-09T07:58:33.031Z" },
-    { url = "https://files.pythonhosted.org/packages/64/e4/4dab9fb43c83719c29241c535d9e07be73bea4bc0c6686c5816d8e1b6689/numpy-2.4.3-pp311-pypy311_pp73-macosx_10_15_x86_64.whl", hash = "sha256:c6b124bfcafb9e8d3ed09130dbee44848c20b3e758b6bbf006e641778927c028", size = 16834892, upload-time = "2026-03-09T07:58:35.334Z" },
-    { url = "https://files.pythonhosted.org/packages/c9/29/f8b6d4af90fed3dfda84ebc0df06c9833d38880c79ce954e5b661758aa31/numpy-2.4.3-pp311-pypy311_pp73-macosx_11_0_arm64.whl", hash = "sha256:76dbb9d4e43c16cf9aa711fcd8de1e2eeb27539dcefb60a1d5e9f12fae1d1ed8", size = 14893070, upload-time = "2026-03-09T07:58:37.7Z" },
-    { url = "https://files.pythonhosted.org/packages/9a/04/a19b3c91dbec0a49269407f15d5753673a09832daed40c45e8150e6fa558/numpy-2.4.3-pp311-pypy311_pp73-macosx_14_0_arm64.whl", hash = "sha256:29363fbfa6f8ee855d7569c96ce524845e3d726d6c19b29eceec7dd555dab152", size = 5399609, upload-time = "2026-03-09T07:58:39.853Z" },
-    { url = "https://files.pythonhosted.org/packages/79/34/4d73603f5420eab89ea8a67097b31364bf7c30f811d4dd84b1659c7476d9/numpy-2.4.3-pp311-pypy311_pp73-macosx_14_0_x86_64.whl", hash = "sha256:bc71942c789ef415a37f0d4eab90341425a00d538cd0642445d30b41023d3395", size = 6714355, upload-time = "2026-03-09T07:58:42.365Z" },
-    { url = "https://files.pythonhosted.org/packages/58/ad/1100d7229bb248394939a12a8074d485b655e8ed44207d328fdd7fcebc7b/numpy-2.4.3-pp311-pypy311_pp73-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:7e58765ad74dcebd3ef0208a5078fba32dc8ec3578fe84a604432950cd043d79", size = 15800434, upload-time = "2026-03-09T07:58:44.837Z" },
-    { url = "https://files.pythonhosted.org/packages/0c/fd/16d710c085d28ba4feaf29ac60c936c9d662e390344f94a6beaa2ac9899b/numpy-2.4.3-pp311-pypy311_pp73-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:8e236dbda4e1d319d681afcbb136c0c4a8e0f1a5c58ceec2adebb547357fe857", size = 16729409, upload-time = "2026-03-09T07:58:47.972Z" },
-    { url = "https://files.pythonhosted.org/packages/57/a7/b35835e278c18b85206834b3aa3abe68e77a98769c59233d1f6300284781/numpy-2.4.3-pp311-pypy311_pp73-win_amd64.whl", hash = "sha256:4b42639cdde6d24e732ff823a3fa5b701d8acad89c4142bc1d0bd6dc85200ba5", size = 12504685, upload-time = "2026-03-09T07:58:50.525Z" },
-]
-
-[[package]]
-name = "openplanter-agent"
-version = "0.1.0"
-source = { editable = "." }
-dependencies = [
-    { name = "prompt-toolkit" },
-    { name = "pyfiglet" },
-    { name = "rich" },
-]
-
-[package.optional-dependencies]
-dev = [
-    { name = "networkx", version = "3.4.2", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version < '3.11'" },
-    { name = "networkx", version = "3.6.1", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version >= '3.11'" },
-    { name = "numpy", version = "2.2.6", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version < '3.11'" },
-    { name = "numpy", version = "2.4.3", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version >= '3.11'" },
-    { name = "pytest" },
-    { name = "pytest-asyncio" },
-]
-textual = [
-    { name = "networkx", version = "3.4.2", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version < '3.11'" },
-    { name = "networkx", version = "3.6.1", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version >= '3.11'" },
-    { name = "numpy", version = "2.2.6", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version < '3.11'" },
-    { name = "numpy", version = "2.4.3", source = { registry = "https://pypi.org/simple" }, marker = "python_full_version >= '3.11'" },
-    { name = "textual" },
-]
-
-[package.metadata]
-requires-dist = [
-    { name = "networkx", marker = "extra == 'dev'", specifier = ">=3.2" },
-    { name = "networkx", marker = "extra == 'textual'", specifier = ">=3.2" },
-    { name = "numpy", marker = "extra == 'dev'", specifier = ">=1.26" },
-    { name = "numpy", marker = "extra == 'textual'", specifier = ">=1.26" },
-    { name = "prompt-toolkit", specifier = ">=3.0" },
-    { name = "pyfiglet", specifier = ">=1.0" },
-    { name = "pytest", marker = "extra == 'dev'", specifier = ">=8.0" },
-    { name = "pytest-asyncio", marker = "extra == 'dev'", specifier = ">=0.23" },
-    { name = "rich", specifier = ">=13.0" },
-    { name = "textual", marker = "extra == 'textual'", specifier = ">=0.89" },
-]
-provides-extras = ["dev", "textual"]
-
-[[package]]
-name = "packaging"
-version = "26.0"
-source = { registry = "https://pypi.org/simple" }
-sdist = { url = "https://files.pythonhosted.org/packages/65/ee/299d360cdc32edc7d2cf530f3accf79c4fca01e96ffc950d8a52213bd8e4/packaging-26.0.tar.gz", hash = "sha256:00243ae351a257117b6a241061796684b084ed1c516a08c48a3f7e147a9d80b4", size = 143416, upload-time = "2026-01-21T20:50:39.064Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/b7/b9/c538f279a4e237a006a2c98387d081e9eb060d203d8ed34467cc0f0b9b53/packaging-26.0-py3-none-any.whl", hash = "sha256:b36f1fef9334a5588b4166f8bcd26a14e521f2b55e6b9de3aaa80d3ff7a37529", size = 74366, upload-time = "2026-01-21T20:50:37.788Z" },
-]
-
-[[package]]
-name = "platformdirs"
-version = "4.9.2"
-source = { registry = "https://pypi.org/simple" }
-sdist = { url = "https://files.pythonhosted.org/packages/1b/04/fea538adf7dbbd6d186f551d595961e564a3b6715bdf276b477460858672/platformdirs-4.9.2.tar.gz", hash = "sha256:9a33809944b9db043ad67ca0db94b14bf452cc6aeaac46a88ea55b26e2e9d291", size = 28394, upload-time = "2026-02-16T03:56:10.574Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/48/31/05e764397056194206169869b50cf2fee4dbbbc71b344705b9c0d878d4d8/platformdirs-4.9.2-py3-none-any.whl", hash = "sha256:9170634f126f8efdae22fb58ae8a0eaa86f38365bc57897a6c4f781d1f5875bd", size = 21168, upload-time = "2026-02-16T03:56:08.891Z" },
-]
-
-[[package]]
-name = "pluggy"
-version = "1.6.0"
-source = { registry = "https://pypi.org/simple" }
-sdist = { url = "https://files.pythonhosted.org/packages/f9/e2/3e91f31a7d2b083fe6ef3fa267035b518369d9511ffab804f839851d2779/pluggy-1.6.0.tar.gz", hash = "sha256:7dcc130b76258d33b90f61b658791dede3486c3e6bfb003ee5c9bfb396dd22f3", size = 69412, upload-time = "2025-05-15T12:30:07.975Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/54/20/4d324d65cc6d9205fabedc306948156824eb9f0ee1633355a8f7ec5c66bf/pluggy-1.6.0-py3-none-any.whl", hash = "sha256:e920276dd6813095e9377c0bc5566d94c932c33b27a3e3945d8389c374dd4746", size = 20538, upload-time = "2025-05-15T12:30:06.134Z" },
-]
-
-[[package]]
-name = "prompt-toolkit"
-version = "3.0.52"
-source = { registry = "https://pypi.org/simple" }
-dependencies = [
-    { name = "wcwidth" },
-]
-sdist = { url = "https://files.pythonhosted.org/packages/a1/96/06e01a7b38dce6fe1db213e061a4602dd6032a8a97ef6c1a862537732421/prompt_toolkit-3.0.52.tar.gz", hash = "sha256:28cde192929c8e7321de85de1ddbe736f1375148b02f2e17edd840042b1be855", size = 434198, upload-time = "2025-08-27T15:24:02.057Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/84/03/0d3ce49e2505ae70cf43bc5bb3033955d2fc9f932163e84dc0779cc47f48/prompt_toolkit-3.0.52-py3-none-any.whl", hash = "sha256:9aac639a3bbd33284347de5ad8d68ecc044b91a762dc39b7c21095fcd6a19955", size = 391431, upload-time = "2025-08-27T15:23:59.498Z" },
-]
-
-[[package]]
-name = "pyfiglet"
-version = "1.0.4"
-source = { registry = "https://pypi.org/simple" }
-sdist = { url = "https://files.pythonhosted.org/packages/c8/e3/0a86276ad2c383ce08d76110a8eec2fe22e7051c4b8ba3fa163a0b08c428/pyfiglet-1.0.4.tar.gz", hash = "sha256:db9c9940ed1bf3048deff534ed52ff2dafbbc2cd7610b17bb5eca1df6d4278ef", size = 1560615, upload-time = "2025-08-15T18:32:47.302Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/9f/5c/fe9f95abd5eaedfa69f31e450f7e2768bef121dbdf25bcddee2cd3087a16/pyfiglet-1.0.4-py3-none-any.whl", hash = "sha256:65b57b7a8e1dff8a67dc8e940a117238661d5e14c3e49121032bd404d9b2b39f", size = 1806118, upload-time = "2025-08-15T18:32:45.556Z" },
-]
-
-[[package]]
-name = "pygments"
-version = "2.19.2"
-source = { registry = "https://pypi.org/simple" }
-sdist = { url = "https://files.pythonhosted.org/packages/b0/77/a5b8c569bf593b0140bde72ea885a803b82086995367bf2037de0159d924/pygments-2.19.2.tar.gz", hash = "sha256:636cb2477cec7f8952536970bc533bc43743542f70392ae026374600add5b887", size = 4968631, upload-time = "2025-06-21T13:39:12.283Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/c7/21/705964c7812476f378728bdf590ca4b771ec72385c533964653c68e86bdc/pygments-2.19.2-py3-none-any.whl", hash = "sha256:86540386c03d588bb81d44bc3928634ff26449851e99741617ecb9037ee5ec0b", size = 1225217, upload-time = "2025-06-21T13:39:07.939Z" },
-]
-
-[[package]]
-name = "pytest"
-version = "9.0.2"
-source = { registry = "https://pypi.org/simple" }
-dependencies = [
-    { name = "colorama", marker = "sys_platform == 'win32'" },
-    { name = "exceptiongroup", marker = "python_full_version < '3.11'" },
-    { name = "iniconfig" },
-    { name = "packaging" },
-    { name = "pluggy" },
-    { name = "pygments" },
-    { name = "tomli", marker = "python_full_version < '3.11'" },
-]
-sdist = { url = "https://files.pythonhosted.org/packages/d1/db/7ef3487e0fb0049ddb5ce41d3a49c235bf9ad299b6a25d5780a89f19230f/pytest-9.0.2.tar.gz", hash = "sha256:75186651a92bd89611d1d9fc20f0b4345fd827c41ccd5c299a868a05d70edf11", size = 1568901, upload-time = "2025-12-06T21:30:51.014Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/3b/ab/b3226f0bd7cdcf710fbede2b3548584366da3b19b5021e74f5bde2a8fa3f/pytest-9.0.2-py3-none-any.whl", hash = "sha256:711ffd45bf766d5264d487b917733b453d917afd2b0ad65223959f59089f875b", size = 374801, upload-time = "2025-12-06T21:30:49.154Z" },
-]
-
-[[package]]
-name = "pytest-asyncio"
-version = "1.3.0"
-source = { registry = "https://pypi.org/simple" }
-dependencies = [
-    { name = "backports-asyncio-runner", marker = "python_full_version < '3.11'" },
-    { name = "pytest" },
-    { name = "typing-extensions", marker = "python_full_version < '3.13'" },
-]
-sdist = { url = "https://files.pythonhosted.org/packages/90/2c/8af215c0f776415f3590cac4f9086ccefd6fd463befeae41cd4d3f193e5a/pytest_asyncio-1.3.0.tar.gz", hash = "sha256:d7f52f36d231b80ee124cd216ffb19369aa168fc10095013c6b014a34d3ee9e5", size = 50087, upload-time = "2025-11-10T16:07:47.256Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/e5/35/f8b19922b6a25bc0880171a2f1a003eaeb93657475193ab516fd87cac9da/pytest_asyncio-1.3.0-py3-none-any.whl", hash = "sha256:611e26147c7f77640e6d0a92a38ed17c3e9848063698d5c93d5aa7aa11cebff5", size = 15075, upload-time = "2025-11-10T16:07:45.537Z" },
-]
-
-[[package]]
-name = "rich"
-version = "14.3.3"
-source = { registry = "https://pypi.org/simple" }
-dependencies = [
-    { name = "markdown-it-py" },
-    { name = "pygments" },
-]
-sdist = { url = "https://files.pythonhosted.org/packages/b3/c6/f3b320c27991c46f43ee9d856302c70dc2d0fb2dba4842ff739d5f46b393/rich-14.3.3.tar.gz", hash = "sha256:b8daa0b9e4eef54dd8cf7c86c03713f53241884e814f4e2f5fb342fe520f639b", size = 230582, upload-time = "2026-02-19T17:23:12.474Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/14/25/b208c5683343959b670dc001595f2f3737e051da617f66c31f7c4fa93abc/rich-14.3.3-py3-none-any.whl", hash = "sha256:793431c1f8619afa7d3b52b2cdec859562b950ea0d4b6b505397612db8d5362d", size = 310458, upload-time = "2026-02-19T17:23:13.732Z" },
-]
-
-[[package]]
-name = "textual"
-version = "8.0.2"
-source = { registry = "https://pypi.org/simple" }
-dependencies = [
-    { name = "markdown-it-py", extra = ["linkify"] },
-    { name = "mdit-py-plugins" },
-    { name = "platformdirs" },
-    { name = "pygments" },
-    { name = "rich" },
-    { name = "typing-extensions" },
-]
-sdist = { url = "https://files.pythonhosted.org/packages/be/08/c6bcb1e3c4c9528ec9049f4ac685afdafc72866664270f0deb416ccbba2a/textual-8.0.2.tar.gz", hash = "sha256:7b342f3ee9a5f2f1bd42d7b598cae00ff1275da68536769510db4b7fe8cabf5d", size = 6099270, upload-time = "2026-03-03T20:23:46.858Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/77/bc/0cd17f96f00b6e8bfbca64c574088c85f3c614912b3030f313752e30a099/textual-8.0.2-py3-none-any.whl", hash = "sha256:4ceadbe0e8a30eb80f9995000f4d031f711420a31b02da38f3482957b7c50ce4", size = 719174, upload-time = "2026-03-03T20:23:50.46Z" },
-]
-
-[[package]]
-name = "tomli"
-version = "2.4.0"
-source = { registry = "https://pypi.org/simple" }
-sdist = { url = "https://files.pythonhosted.org/packages/82/30/31573e9457673ab10aa432461bee537ce6cef177667deca369efb79df071/tomli-2.4.0.tar.gz", hash = "sha256:aa89c3f6c277dd275d8e243ad24f3b5e701491a860d5121f2cdd399fbb31fc9c", size = 17477, upload-time = "2026-01-11T11:22:38.165Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/3c/d9/3dc2289e1f3b32eb19b9785b6a006b28ee99acb37d1d47f78d4c10e28bf8/tomli-2.4.0-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:b5ef256a3fd497d4973c11bf142e9ed78b150d36f5773f1ca6088c230ffc5867", size = 153663, upload-time = "2026-01-11T11:21:45.27Z" },
-    { url = "https://files.pythonhosted.org/packages/51/32/ef9f6845e6b9ca392cd3f64f9ec185cc6f09f0a2df3db08cbe8809d1d435/tomli-2.4.0-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:5572e41282d5268eb09a697c89a7bee84fae66511f87533a6f88bd2f7b652da9", size = 148469, upload-time = "2026-01-11T11:21:46.873Z" },
-    { url = "https://files.pythonhosted.org/packages/d6/c2/506e44cce89a8b1b1e047d64bd495c22c9f71f21e05f380f1a950dd9c217/tomli-2.4.0-cp311-cp311-manylinux2014_aarch64.manylinux_2_17_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:551e321c6ba03b55676970b47cb1b73f14a0a4dce6a3e1a9458fd6d921d72e95", size = 236039, upload-time = "2026-01-11T11:21:48.503Z" },
-    { url = "https://files.pythonhosted.org/packages/b3/40/e1b65986dbc861b7e986e8ec394598187fa8aee85b1650b01dd925ca0be8/tomli-2.4.0-cp311-cp311-manylinux2014_x86_64.manylinux_2_17_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:5e3f639a7a8f10069d0e15408c0b96a2a828cfdec6fca05296ebcdcc28ca7c76", size = 243007, upload-time = "2026-01-11T11:21:49.456Z" },
-    { url = "https://files.pythonhosted.org/packages/9c/6f/6e39ce66b58a5b7ae572a0f4352ff40c71e8573633deda43f6a379d56b3e/tomli-2.4.0-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:1b168f2731796b045128c45982d3a4874057626da0e2ef1fdd722848b741361d", size = 240875, upload-time = "2026-01-11T11:21:50.755Z" },
-    { url = "https://files.pythonhosted.org/packages/aa/ad/cb089cb190487caa80204d503c7fd0f4d443f90b95cf4ef5cf5aa0f439b0/tomli-2.4.0-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:133e93646ec4300d651839d382d63edff11d8978be23da4cc106f5a18b7d0576", size = 246271, upload-time = "2026-01-11T11:21:51.81Z" },
-    { url = "https://files.pythonhosted.org/packages/0b/63/69125220e47fd7a3a27fd0de0c6398c89432fec41bc739823bcc66506af6/tomli-2.4.0-cp311-cp311-win32.whl", hash = "sha256:b6c78bdf37764092d369722d9946cb65b8767bfa4110f902a1b2542d8d173c8a", size = 96770, upload-time = "2026-01-11T11:21:52.647Z" },
-    { url = "https://files.pythonhosted.org/packages/1e/0d/a22bb6c83f83386b0008425a6cd1fa1c14b5f3dd4bad05e98cf3dbbf4a64/tomli-2.4.0-cp311-cp311-win_amd64.whl", hash = "sha256:d3d1654e11d724760cdb37a3d7691f0be9db5fbdaef59c9f532aabf87006dbaa", size = 107626, upload-time = "2026-01-11T11:21:53.459Z" },
-    { url = "https://files.pythonhosted.org/packages/2f/6d/77be674a3485e75cacbf2ddba2b146911477bd887dda9d8c9dfb2f15e871/tomli-2.4.0-cp311-cp311-win_arm64.whl", hash = "sha256:cae9c19ed12d4e8f3ebf46d1a75090e4c0dc16271c5bce1c833ac168f08fb614", size = 94842, upload-time = "2026-01-11T11:21:54.831Z" },
-    { url = "https://files.pythonhosted.org/packages/3c/43/7389a1869f2f26dba52404e1ef13b4784b6b37dac93bac53457e3ff24ca3/tomli-2.4.0-cp312-cp312-macosx_10_13_x86_64.whl", hash = "sha256:920b1de295e72887bafa3ad9f7a792f811847d57ea6b1215154030cf131f16b1", size = 154894, upload-time = "2026-01-11T11:21:56.07Z" },
-    { url = "https://files.pythonhosted.org/packages/e9/05/2f9bf110b5294132b2edf13fe6ca6ae456204f3d749f623307cbb7a946f2/tomli-2.4.0-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:7d6d9a4aee98fac3eab4952ad1d73aee87359452d1c086b5ceb43ed02ddb16b8", size = 149053, upload-time = "2026-01-11T11:21:57.467Z" },
-    { url = "https://files.pythonhosted.org/packages/e8/41/1eda3ca1abc6f6154a8db4d714a4d35c4ad90adc0bcf700657291593fbf3/tomli-2.4.0-cp312-cp312-manylinux2014_aarch64.manylinux_2_17_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:36b9d05b51e65b254ea6c2585b59d2c4cb91c8a3d91d0ed0f17591a29aaea54a", size = 243481, upload-time = "2026-01-11T11:21:58.661Z" },
-    { url = "https://files.pythonhosted.org/packages/d2/6d/02ff5ab6c8868b41e7d4b987ce2b5f6a51d3335a70aa144edd999e055a01/tomli-2.4.0-cp312-cp312-manylinux2014_x86_64.manylinux_2_17_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:1c8a885b370751837c029ef9bc014f27d80840e48bac415f3412e6593bbc18c1", size = 251720, upload-time = "2026-01-11T11:22:00.178Z" },
-    { url = "https://files.pythonhosted.org/packages/7b/57/0405c59a909c45d5b6f146107c6d997825aa87568b042042f7a9c0afed34/tomli-2.4.0-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:8768715ffc41f0008abe25d808c20c3d990f42b6e2e58305d5da280ae7d1fa3b", size = 247014, upload-time = "2026-01-11T11:22:01.238Z" },
-    { url = "https://files.pythonhosted.org/packages/2c/0e/2e37568edd944b4165735687cbaf2fe3648129e440c26d02223672ee0630/tomli-2.4.0-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:7b438885858efd5be02a9a133caf5812b8776ee0c969fea02c45e8e3f296ba51", size = 251820, upload-time = "2026-01-11T11:22:02.727Z" },
-    { url = "https://files.pythonhosted.org/packages/5a/1c/ee3b707fdac82aeeb92d1a113f803cf6d0f37bdca0849cb489553e1f417a/tomli-2.4.0-cp312-cp312-win32.whl", hash = "sha256:0408e3de5ec77cc7f81960c362543cbbd91ef883e3138e81b729fc3eea5b9729", size = 97712, upload-time = "2026-01-11T11:22:03.777Z" },
-    { url = "https://files.pythonhosted.org/packages/69/13/c07a9177d0b3bab7913299b9278845fc6eaaca14a02667c6be0b0a2270c8/tomli-2.4.0-cp312-cp312-win_amd64.whl", hash = "sha256:685306e2cc7da35be4ee914fd34ab801a6acacb061b6a7abca922aaf9ad368da", size = 108296, upload-time = "2026-01-11T11:22:04.86Z" },
-    { url = "https://files.pythonhosted.org/packages/18/27/e267a60bbeeee343bcc279bb9e8fbed0cbe224bc7b2a3dc2975f22809a09/tomli-2.4.0-cp312-cp312-win_arm64.whl", hash = "sha256:5aa48d7c2356055feef06a43611fc401a07337d5b006be13a30f6c58f869e3c3", size = 94553, upload-time = "2026-01-11T11:22:05.854Z" },
-    { url = "https://files.pythonhosted.org/packages/34/91/7f65f9809f2936e1f4ce6268ae1903074563603b2a2bd969ebbda802744f/tomli-2.4.0-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:84d081fbc252d1b6a982e1870660e7330fb8f90f676f6e78b052ad4e64714bf0", size = 154915, upload-time = "2026-01-11T11:22:06.703Z" },
-    { url = "https://files.pythonhosted.org/packages/20/aa/64dd73a5a849c2e8f216b755599c511badde80e91e9bc2271baa7b2cdbb1/tomli-2.4.0-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:9a08144fa4cba33db5255f9b74f0b89888622109bd2776148f2597447f92a94e", size = 149038, upload-time = "2026-01-11T11:22:07.56Z" },
-    { url = "https://files.pythonhosted.org/packages/9e/8a/6d38870bd3d52c8d1505ce054469a73f73a0fe62c0eaf5dddf61447e32fa/tomli-2.4.0-cp313-cp313-manylinux2014_aarch64.manylinux_2_17_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:c73add4bb52a206fd0c0723432db123c0c75c280cbd67174dd9d2db228ebb1b4", size = 242245, upload-time = "2026-01-11T11:22:08.344Z" },
-    { url = "https://files.pythonhosted.org/packages/59/bb/8002fadefb64ab2669e5b977df3f5e444febea60e717e755b38bb7c41029/tomli-2.4.0-cp313-cp313-manylinux2014_x86_64.manylinux_2_17_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:1fb2945cbe303b1419e2706e711b7113da57b7db31ee378d08712d678a34e51e", size = 250335, upload-time = "2026-01-11T11:22:09.951Z" },
-    { url = "https://files.pythonhosted.org/packages/a5/3d/4cdb6f791682b2ea916af2de96121b3cb1284d7c203d97d92d6003e91c8d/tomli-2.4.0-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:bbb1b10aa643d973366dc2cb1ad94f99c1726a02343d43cbc011edbfac579e7c", size = 245962, upload-time = "2026-01-11T11:22:11.27Z" },
-    { url = "https://files.pythonhosted.org/packages/f2/4a/5f25789f9a460bd858ba9756ff52d0830d825b458e13f754952dd15fb7bb/tomli-2.4.0-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:4cbcb367d44a1f0c2be408758b43e1ffb5308abe0ea222897d6bfc8e8281ef2f", size = 250396, upload-time = "2026-01-11T11:22:12.325Z" },
-    { url = "https://files.pythonhosted.org/packages/aa/2f/b73a36fea58dfa08e8b3a268750e6853a6aac2a349241a905ebd86f3047a/tomli-2.4.0-cp313-cp313-win32.whl", hash = "sha256:7d49c66a7d5e56ac959cb6fc583aff0651094ec071ba9ad43df785abc2320d86", size = 97530, upload-time = "2026-01-11T11:22:13.865Z" },
-    { url = "https://files.pythonhosted.org/packages/3b/af/ca18c134b5d75de7e8dc551c5234eaba2e8e951f6b30139599b53de9c187/tomli-2.4.0-cp313-cp313-win_amd64.whl", hash = "sha256:3cf226acb51d8f1c394c1b310e0e0e61fecdd7adcb78d01e294ac297dd2e7f87", size = 108227, upload-time = "2026-01-11T11:22:15.224Z" },
-    { url = "https://files.pythonhosted.org/packages/22/c3/b386b832f209fee8073c8138ec50f27b4460db2fdae9ffe022df89a57f9b/tomli-2.4.0-cp313-cp313-win_arm64.whl", hash = "sha256:d20b797a5c1ad80c516e41bc1fb0443ddb5006e9aaa7bda2d71978346aeb9132", size = 94748, upload-time = "2026-01-11T11:22:16.009Z" },
-    { url = "https://files.pythonhosted.org/packages/f3/c4/84047a97eb1004418bc10bdbcfebda209fca6338002eba2dc27cc6d13563/tomli-2.4.0-cp314-cp314-macosx_10_15_x86_64.whl", hash = "sha256:26ab906a1eb794cd4e103691daa23d95c6919cc2fa9160000ac02370cc9dd3f6", size = 154725, upload-time = "2026-01-11T11:22:17.269Z" },
-    { url = "https://files.pythonhosted.org/packages/a8/5d/d39038e646060b9d76274078cddf146ced86dc2b9e8bbf737ad5983609a0/tomli-2.4.0-cp314-cp314-macosx_11_0_arm64.whl", hash = "sha256:20cedb4ee43278bc4f2fee6cb50daec836959aadaf948db5172e776dd3d993fc", size = 148901, upload-time = "2026-01-11T11:22:18.287Z" },
-    { url = "https://files.pythonhosted.org/packages/73/e5/383be1724cb30f4ce44983d249645684a48c435e1cd4f8b5cded8a816d3c/tomli-2.4.0-cp314-cp314-manylinux2014_aarch64.manylinux_2_17_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:39b0b5d1b6dd03684b3fb276407ebed7090bbec989fa55838c98560c01113b66", size = 243375, upload-time = "2026-01-11T11:22:19.154Z" },
-    { url = "https://files.pythonhosted.org/packages/31/f0/bea80c17971c8d16d3cc109dc3585b0f2ce1036b5f4a8a183789023574f2/tomli-2.4.0-cp314-cp314-manylinux2014_x86_64.manylinux_2_17_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:a26d7ff68dfdb9f87a016ecfd1e1c2bacbe3108f4e0f8bcd2228ef9a766c787d", size = 250639, upload-time = "2026-01-11T11:22:20.168Z" },
-    { url = "https://files.pythonhosted.org/packages/2c/8f/2853c36abbb7608e3f945d8a74e32ed3a74ee3a1f468f1ffc7d1cb3abba6/tomli-2.4.0-cp314-cp314-musllinux_1_2_aarch64.whl", hash = "sha256:20ffd184fb1df76a66e34bd1b36b4a4641bd2b82954befa32fe8163e79f1a702", size = 246897, upload-time = "2026-01-11T11:22:21.544Z" },
-    { url = "https://files.pythonhosted.org/packages/49/f0/6c05e3196ed5337b9fe7ea003e95fd3819a840b7a0f2bf5a408ef1dad8ed/tomli-2.4.0-cp314-cp314-musllinux_1_2_x86_64.whl", hash = "sha256:75c2f8bbddf170e8effc98f5e9084a8751f8174ea6ccf4fca5398436e0320bc8", size = 254697, upload-time = "2026-01-11T11:22:23.058Z" },
-    { url = "https://files.pythonhosted.org/packages/f3/f5/2922ef29c9f2951883525def7429967fc4d8208494e5ab524234f06b688b/tomli-2.4.0-cp314-cp314-win32.whl", hash = "sha256:31d556d079d72db7c584c0627ff3a24c5d3fb4f730221d3444f3efb1b2514776", size = 98567, upload-time = "2026-01-11T11:22:24.033Z" },
-    { url = "https://files.pythonhosted.org/packages/7b/31/22b52e2e06dd2a5fdbc3ee73226d763b184ff21fc24e20316a44ccc4d96b/tomli-2.4.0-cp314-cp314-win_amd64.whl", hash = "sha256:43e685b9b2341681907759cf3a04e14d7104b3580f808cfde1dfdb60ada85475", size = 108556, upload-time = "2026-01-11T11:22:25.378Z" },
-    { url = "https://files.pythonhosted.org/packages/48/3d/5058dff3255a3d01b705413f64f4306a141a8fd7a251e5a495e3f192a998/tomli-2.4.0-cp314-cp314-win_arm64.whl", hash = "sha256:3d895d56bd3f82ddd6faaff993c275efc2ff38e52322ea264122d72729dca2b2", size = 96014, upload-time = "2026-01-11T11:22:26.138Z" },
-    { url = "https://files.pythonhosted.org/packages/b8/4e/75dab8586e268424202d3a1997ef6014919c941b50642a1682df43204c22/tomli-2.4.0-cp314-cp314t-macosx_10_15_x86_64.whl", hash = "sha256:5b5807f3999fb66776dbce568cc9a828544244a8eb84b84b9bafc080c99597b9", size = 163339, upload-time = "2026-01-11T11:22:27.143Z" },
-    { url = "https://files.pythonhosted.org/packages/06/e3/b904d9ab1016829a776d97f163f183a48be6a4deb87304d1e0116a349519/tomli-2.4.0-cp314-cp314t-macosx_11_0_arm64.whl", hash = "sha256:c084ad935abe686bd9c898e62a02a19abfc9760b5a79bc29644463eaf2840cb0", size = 159490, upload-time = "2026-01-11T11:22:28.399Z" },
-    { url = "https://files.pythonhosted.org/packages/e3/5a/fc3622c8b1ad823e8ea98a35e3c632ee316d48f66f80f9708ceb4f2a0322/tomli-2.4.0-cp314-cp314t-manylinux2014_aarch64.manylinux_2_17_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:0f2e3955efea4d1cfbcb87bc321e00dc08d2bcb737fd1d5e398af111d86db5df", size = 269398, upload-time = "2026-01-11T11:22:29.345Z" },
-    { url = "https://files.pythonhosted.org/packages/fd/33/62bd6152c8bdd4c305ad9faca48f51d3acb2df1f8791b1477d46ff86e7f8/tomli-2.4.0-cp314-cp314t-manylinux2014_x86_64.manylinux_2_17_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:0e0fe8a0b8312acf3a88077a0802565cb09ee34107813bba1c7cd591fa6cfc8d", size = 276515, upload-time = "2026-01-11T11:22:30.327Z" },
-    { url = "https://files.pythonhosted.org/packages/4b/ff/ae53619499f5235ee4211e62a8d7982ba9e439a0fb4f2f351a93d67c1dd2/tomli-2.4.0-cp314-cp314t-musllinux_1_2_aarch64.whl", hash = "sha256:413540dce94673591859c4c6f794dfeaa845e98bf35d72ed59636f869ef9f86f", size = 273806, upload-time = "2026-01-11T11:22:32.56Z" },
-    { url = "https://files.pythonhosted.org/packages/47/71/cbca7787fa68d4d0a9f7072821980b39fbb1b6faeb5f5cf02f4a5559fa28/tomli-2.4.0-cp314-cp314t-musllinux_1_2_x86_64.whl", hash = "sha256:0dc56fef0e2c1c470aeac5b6ca8cc7b640bb93e92d9803ddaf9ea03e198f5b0b", size = 281340, upload-time = "2026-01-11T11:22:33.505Z" },
-    { url = "https://files.pythonhosted.org/packages/f5/00/d595c120963ad42474cf6ee7771ad0d0e8a49d0f01e29576ee9195d9ecdf/tomli-2.4.0-cp314-cp314t-win32.whl", hash = "sha256:d878f2a6707cc9d53a1be1414bbb419e629c3d6e67f69230217bb663e76b5087", size = 108106, upload-time = "2026-01-11T11:22:34.451Z" },
-    { url = "https://files.pythonhosted.org/packages/de/69/9aa0c6a505c2f80e519b43764f8b4ba93b5a0bbd2d9a9de6e2b24271b9a5/tomli-2.4.0-cp314-cp314t-win_amd64.whl", hash = "sha256:2add28aacc7425117ff6364fe9e06a183bb0251b03f986df0e78e974047571fd", size = 120504, upload-time = "2026-01-11T11:22:35.764Z" },
-    { url = "https://files.pythonhosted.org/packages/b3/9f/f1668c281c58cfae01482f7114a4b88d345e4c140386241a1a24dcc9e7bc/tomli-2.4.0-cp314-cp314t-win_arm64.whl", hash = "sha256:2b1e3b80e1d5e52e40e9b924ec43d81570f0e7d09d11081b797bc4692765a3d4", size = 99561, upload-time = "2026-01-11T11:22:36.624Z" },
-    { url = "https://files.pythonhosted.org/packages/23/d1/136eb2cb77520a31e1f64cbae9d33ec6df0d78bdf4160398e86eec8a8754/tomli-2.4.0-py3-none-any.whl", hash = "sha256:1f776e7d669ebceb01dee46484485f43a4048746235e683bcdffacdf1fb4785a", size = 14477, upload-time = "2026-01-11T11:22:37.446Z" },
-]
-
-[[package]]
-name = "typing-extensions"
-version = "4.15.0"
-source = { registry = "https://pypi.org/simple" }
-sdist = { url = "https://files.pythonhosted.org/packages/72/94/1a15dd82efb362ac84269196e94cf00f187f7ed21c242792a923cdb1c61f/typing_extensions-4.15.0.tar.gz", hash = "sha256:0cea48d173cc12fa28ecabc3b837ea3cf6f38c6d1136f85cbaaf598984861466", size = 109391, upload-time = "2025-08-25T13:49:26.313Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/18/67/36e9267722cc04a6b9f15c7f3441c2363321a3ea07da7ae0c0707beb2a9c/typing_extensions-4.15.0-py3-none-any.whl", hash = "sha256:f0fa19c6845758ab08074a0cfa8b7aecb71c999ca73d62883bc25cc018c4e548", size = 44614, upload-time = "2025-08-25T13:49:24.86Z" },
-]
-
-[[package]]
-name = "uc-micro-py"
-version = "2.0.0"
-source = { registry = "https://pypi.org/simple" }
-sdist = { url = "https://files.pythonhosted.org/packages/78/67/9a363818028526e2d4579334460df777115bdec1bb77c08f9db88f6389f2/uc_micro_py-2.0.0.tar.gz", hash = "sha256:c53691e495c8db60e16ffc4861a35469b0ba0821fe409a8a7a0a71864d33a811", size = 6611, upload-time = "2026-03-01T06:31:27.526Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/61/73/d21edf5b204d1467e06500080a50f79d49ef2b997c79123a536d4a17d97c/uc_micro_py-2.0.0-py3-none-any.whl", hash = "sha256:3603a3859af53e5a39bc7677713c78ea6589ff188d70f4fee165db88e22b242c", size = 6383, upload-time = "2026-03-01T06:31:26.257Z" },
-]
-
-[[package]]
-name = "wcwidth"
-version = "0.6.0"
-source = { registry = "https://pypi.org/simple" }
-sdist = { url = "https://files.pythonhosted.org/packages/35/a2/8e3becb46433538a38726c948d3399905a4c7cabd0df578ede5dc51f0ec2/wcwidth-0.6.0.tar.gz", hash = "sha256:cdc4e4262d6ef9a1a57e018384cbeb1208d8abbc64176027e2c2455c81313159", size = 159684, upload-time = "2026-02-06T19:19:40.919Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/68/5a/199c59e0a824a3db2b89c5d2dade7ab5f9624dbf6448dc291b46d5ec94d3/wcwidth-0.6.0-py3-none-any.whl", hash = "sha256:1a3a1e510b553315f8e146c54764f4fb6264ffad731b3d78088cdb1478ffbdad", size = 94189, upload-time = "2026-02-06T19:19:39.646Z" },
-]

From eb2513327a3b531253a33897299aaebef98983e5 Mon Sep 17 00:00:00 2001
From: Drake <drake@draket.xyz>
Date: Mon, 16 Mar 2026 18:10:21 -0400
Subject: [PATCH 58/58] Restore rate limit error types after stack cleanup

---
 agent/model.py                                | 17 +++++++++
 .../crates/op-core/src/model/mod.rs           | 18 ++++++++++
 .../op-core/tests/test_model_streaming.rs     | 36 ++++++++++++++-----
 3 files changed, 63 insertions(+), 8 deletions(-)

diff --git a/agent/model.py b/agent/model.py
index 30bc3ff7..a029dae1 100644
--- a/agent/model.py
+++ b/agent/model.py
@@ -15,6 +15,23 @@ class ModelError(RuntimeError):
     pass
 
 
+class RateLimitError(ModelError):
+    def __init__(
+        self,
+        message: str,
+        *,
+        status_code: int | None = None,
+        provider_code: str | int | None = None,
+        body: str = "",
+        retry_after_sec: float | None = None,
+    ) -> None:
+        super().__init__(message)
+        self.status_code = status_code
+        self.provider_code = provider_code
+        self.body = body
+        self.retry_after_sec = retry_after_sec
+
+
 # ---------------------------------------------------------------------------
 # Core data types
 # ---------------------------------------------------------------------------
diff --git a/openplanter-desktop/crates/op-core/src/model/mod.rs b/openplanter-desktop/crates/op-core/src/model/mod.rs
index 4f2781ec..81b04ca3 100644
--- a/openplanter-desktop/crates/op-core/src/model/mod.rs
+++ b/openplanter-desktop/crates/op-core/src/model/mod.rs
@@ -8,6 +8,24 @@ use serde::{Deserialize, Serialize};
 use crate::events::DeltaEvent;
 use tokio_util::sync::CancellationToken;
 
+/// Structured model error for provider rate limiting.
+#[derive(Debug, Clone)]
+pub struct RateLimitError {
+    pub message: String,
+    pub status_code: Option<u16>,
+    pub provider_code: Option<String>,
+    pub body: String,
+    pub retry_after_sec: Option<f64>,
+}
+
+impl std::fmt::Display for RateLimitError {
+    fn fmt(&self, f: &mut std::fmt::Formatter<'_>) -> std::fmt::Result {
+        write!(f, "{}", self.message)
+    }
+}
+
+impl std::error::Error for RateLimitError {}
+
 /// A single tool call returned by the model.
 #[derive(Debug, Clone, Serialize, Deserialize)]
 pub struct ToolCall {
diff --git a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
index 5e792de0..2b8eab1a 100644
--- a/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
+++ b/openplanter-desktop/crates/op-core/tests/test_model_streaming.rs
@@ -13,7 +13,7 @@ use axum::routing::post;
 use axum::Router;
 use tokio_util::sync::CancellationToken;
 
-use op_core::events::{DeltaEvent, DeltaKind};
+use op_core::events::{CompletionMeta, DeltaEvent, DeltaKind, LoopMetrics};
 use op_core::model::openai::OpenAIModel;
 use op_core::model::anthropic::AnthropicModel;
 use op_core::model::{BaseModel, Message};
@@ -448,7 +448,12 @@ async fn test_solve_with_mock_anthropic() {
         fn emit_step(&self, event: StepEvent) {
             self.events.lock().unwrap().push(Ev::Step(event));
         }
-        fn emit_complete(&self, result: &str) {
+        fn emit_complete(
+            &self,
+            result: &str,
+            _: Option<LoopMetrics>,
+            _: Option<CompletionMeta>,
+        ) {
             self.events.lock().unwrap().push(Ev::Complete(result.to_string()));
         }
         fn emit_error(&self, message: &str) {
@@ -539,7 +544,12 @@ async fn test_solve_with_mock_openai() {
         fn emit_step(&self, event: StepEvent) {
             self.events.lock().unwrap().push(Ev2::Step(event));
         }
-        fn emit_complete(&self, result: &str) {
+        fn emit_complete(
+            &self,
+            result: &str,
+            _: Option<LoopMetrics>,
+            _: Option<CompletionMeta>,
+        ) {
             self.events.lock().unwrap().push(Ev2::Complete(result.to_string()));
         }
         fn emit_error(&self, message: &str) {
@@ -619,7 +629,7 @@ async fn test_solve_http_error_emits_error() {
         fn emit_trace(&self, _: &str) {}
         fn emit_delta(&self, _: DeltaEvent) {}
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, _: &str) {}
+        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>, _: Option<CompletionMeta>) {}
         fn emit_error(&self, msg: &str) {
             self.errors.lock().unwrap().push(msg.to_string());
         }
@@ -664,7 +674,7 @@ async fn test_solve_cancel_emits_cancelled() {
         fn emit_trace(&self, _: &str) {}
         fn emit_delta(&self, _: DeltaEvent) {}
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, _: &str) {}
+        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>, _: Option<CompletionMeta>) {}
         fn emit_error(&self, msg: &str) {
             self.events.lock().unwrap().push(msg.to_string());
         }
@@ -707,7 +717,12 @@ async fn test_solve_demo_mode_bypasses_llm() {
         fn emit_trace(&self, _: &str) {}
         fn emit_delta(&self, _: DeltaEvent) {}
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, result: &str) {
+        fn emit_complete(
+            &self,
+            result: &str,
+            _: Option<LoopMetrics>,
+            _: Option<CompletionMeta>,
+        ) {
             self.events.lock().unwrap().push(result.to_string());
         }
         fn emit_error(&self, msg: &str) {
@@ -746,7 +761,7 @@ async fn test_solve_missing_key_emits_error() {
         fn emit_trace(&self, _: &str) {}
         fn emit_delta(&self, _: DeltaEvent) {}
         fn emit_step(&self, _: StepEvent) {}
-        fn emit_complete(&self, _: &str) {}
+        fn emit_complete(&self, _: &str, _: Option<LoopMetrics>, _: Option<CompletionMeta>) {}
         fn emit_error(&self, msg: &str) {
             self.errors.lock().unwrap().push(msg.to_string());
         }
@@ -872,7 +887,12 @@ async fn test_solve_multi_step_agentic_loop() {
         fn emit_step(&self, event: StepEvent) {
             self.events.lock().unwrap().push(Ev3::Step(event));
         }
-        fn emit_complete(&self, result: &str) {
+        fn emit_complete(
+            &self,
+            result: &str,
+            _: Option<LoopMetrics>,
+            _: Option<CompletionMeta>,
+        ) {
             self.events.lock().unwrap().push(Ev3::Complete(result.to_string()));
         }
         fn emit_error(&self, message: &str) {