| Fase 1 — Base funcional | - ✓ Ingesta PDF/notebook operativa
- ✓ Embeddings text-embedding-3-small
- ✓ Chroma persistente
- ✓ Endpoints /api/query y /api/study conectados
- ✓ Citas y confidence en respuesta
| - ○ Robustecer tests end-to-end del flujo completo de ingesta -> query en entorno local reproducible
| Media | Suite E2E mínima que valide ingest + query + citas sobre un fixture controlado |
| Fase 2 — Relación teoría/práctica | - ✓ Parser de notebooks
- ✓ topic_extractor bilingüe
- ✓ related_labs integrado en síntesis de respuesta
| - ○ Enriquecer metadatos pedagógicos (module, class_title, difficulty, week, related_lab) de forma consistente en todos los chunks
| Alta | Definir y aplicar schema de metadatos ricos en ingesta + backfill de índice actual |
| Fase 3 — UX de aprendizaje | - ✓ UI inicial en Next.js para chat, study y quiz
- ✓ Agentes tutor/coder/quiz funcionando
- ✓ Endpoint /api/study/quiz estabilizado
| - ○ Persistencia de historial/memoria de conversación y cierre de UI específica para study mode/quiz mode con estados guardados
| Alta | Persistir conversaciones (API + storage) y mostrar historial en frontend con recuperación por sesión |
| Fase 4 — Evaluación | - ✓ Endpoint /api/eval implementado
- ✓ retrieval_eval.py implementado con hit@k, mrr y cobertura por módulo
- ✓ Benchmark dataset seed creado
| - ○ Completar dataset benchmark real (30-50 preguntas del diplomado)
- ○ Implementar answer_eval.py y report.py
- ○ Automatizar corrida única de evals por script e integrar LangSmith para trazas y comparación de corridas
| Crítica | Cerrar benchmark real + pipeline de evaluación reproducible + baseline de LangSmith |
| Fase 5 — Agentic layer | - ✓ Grafo LangGraph productivo con routing por intención
- ✓ CRAG (grade_documents, rewrite_query, handle_no_context) y multiagente
| - ○ Manejo de estados conversacionales complejos (memoria multi-turn)
- ○ Observabilidad de decisiones del grafo y evaluación específica del layer agentic
| Media | Instrumentar trazas del grafo y definir métricas de decisión (routing accuracy y retry quality) |