ARQUITECTURA DE SISTEMA: AI STUDY COPILOT

Diagrama de arquitectura: AI Study Copilot

Arquitectura de alto nivel del AI Study Copilot.

Diagrama de arquitectura: AI Study Copilot

Pipeline de Recuperación (Retrieve) y Generación con LangGraph.

Diagrama de arquitectura: AI Study Copilot

Pipeline de Ingestión de documentos.

[ROADMAP:ESTADO_ACTUAL]

Fase	Completado	Falta	Prioridad	Próximo Entregable
Fase 1 — Base funcional	✓ Ingesta PDF/notebook operativa ✓ Embeddings text-embedding-3-small ✓ Chroma persistente ✓ Endpoints /api/query y /api/study conectados ✓ Citas y confidence en respuesta	○ Robustecer tests end-to-end del flujo completo de ingesta -> query en entorno local reproducible	Media	Suite E2E mínima que valide ingest + query + citas sobre un fixture controlado
Fase 2 — Relación teoría/práctica	✓ Parser de notebooks ✓ topic_extractor bilingüe ✓ related_labs integrado en síntesis de respuesta	○ Enriquecer metadatos pedagógicos (module, class_title, difficulty, week, related_lab) de forma consistente en todos los chunks	Alta	Definir y aplicar schema de metadatos ricos en ingesta + backfill de índice actual
Fase 3 — UX de aprendizaje	✓ UI inicial en Next.js para chat, study y quiz ✓ Agentes tutor/coder/quiz funcionando ✓ Endpoint /api/study/quiz estabilizado	○ Persistencia de historial/memoria de conversación y cierre de UI específica para study mode/quiz mode con estados guardados	Alta	Persistir conversaciones (API + storage) y mostrar historial en frontend con recuperación por sesión
Fase 4 — Evaluación	✓ Endpoint /api/eval implementado ✓ retrieval_eval.py implementado con hit@k, mrr y cobertura por módulo ✓ Benchmark dataset seed creado	○ Completar dataset benchmark real (30-50 preguntas del diplomado) ○ Implementar answer_eval.py y report.py ○ Automatizar corrida única de evals por script e integrar LangSmith para trazas y comparación de corridas	Crítica	Cerrar benchmark real + pipeline de evaluación reproducible + baseline de LangSmith
Fase 5 — Agentic layer	✓ Grafo LangGraph productivo con routing por intención ✓ CRAG (grade_documents, rewrite_query, handle_no_context) y multiagente	○ Manejo de estados conversacionales complejos (memoria multi-turn) ○ Observabilidad de decisiones del grafo y evaluación específica del layer agentic	Media	Instrumentar trazas del grafo y definir métricas de decisión (routing accuracy y retry quality)