[M3] Agent Evaluation Dataset + Tracing setup

## Overview
Set up Gradient Evaluations with test cases and enable Tracing for pipeline debugging.

## Acceptance Criteria
- [ ] Evaluation dataset (CSV) with 6+ test cases:
  - Simple CRUD app → expected GO
  - Stock trading AI → expected NO-GO
  - Portfolio website → expected GO
  - Video conferencing → expected CONDITIONAL
  - Blockchain voting → expected NO-GO
  - Recipe community → expected GO
- [ ] Evaluations configured in Gradient console
- [ ] Tracing enabled (automatic via LangGraph nodes)
- [ ] Token usage tracked per run
- [ ] Cost tracking per run

## Dependencies
- #15 (complete pipeline to evaluate)

## Reference
- \`docs/reference/10-technical-plan.md\` — Agent Evaluation Dataset
- \`docs/reference/05-digitalocean-gradient-ai.md\` — Evaluations, Tracing

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[M3] Agent Evaluation Dataset + Tracing setup #22

Overview

Acceptance Criteria

Dependencies

Reference

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

[M3] Agent Evaluation Dataset + Tracing setup #22

Description

Overview

Acceptance Criteria

Dependencies

Reference

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions