ARQUITECTURA DE SISTEMA: AI STUDY COPILOT

Diagrama de arquitectura: AI Study Copilot

Arquitectura de alto nivel del AI Study Copilot.

Diagrama de arquitectura: AI Study Copilot

Pipeline de Recuperación (Retrieve) y Generación con LangGraph.

Diagrama de arquitectura: AI Study Copilot

Pipeline de Ingestión de documentos.

[ROADMAP:ESTADO_ACTUAL]
Fase Completado Falta Prioridad Próximo Entregable
Fase 1 — Base funcional
  • Ingesta PDF/notebook operativa
  • Embeddings text-embedding-3-small
  • Chroma persistente
  • Endpoints /api/query y /api/study conectados
  • Citas y confidence en respuesta
  • Robustecer tests end-to-end del flujo completo de ingesta -> query en entorno local reproducible
Media

Suite E2E mínima que valide ingest + query + citas sobre un fixture controlado

Fase 2 — Relación teoría/práctica
  • Parser de notebooks
  • topic_extractor bilingüe
  • related_labs integrado en síntesis de respuesta
  • Enriquecer metadatos pedagógicos (module, class_title, difficulty, week, related_lab) de forma consistente en todos los chunks
Alta

Definir y aplicar schema de metadatos ricos en ingesta + backfill de índice actual

Fase 3 — UX de aprendizaje
  • UI inicial en Next.js para chat, study y quiz
  • Agentes tutor/coder/quiz funcionando
  • Endpoint /api/study/quiz estabilizado
  • Persistencia de historial/memoria de conversación y cierre de UI específica para study mode/quiz mode con estados guardados
Alta

Persistir conversaciones (API + storage) y mostrar historial en frontend con recuperación por sesión

Fase 4 — Evaluación
  • Endpoint /api/eval implementado
  • retrieval_eval.py implementado con hit@k, mrr y cobertura por módulo
  • Benchmark dataset seed creado
  • Completar dataset benchmark real (30-50 preguntas del diplomado)
  • Implementar answer_eval.py y report.py
  • Automatizar corrida única de evals por script e integrar LangSmith para trazas y comparación de corridas
Crítica

Cerrar benchmark real + pipeline de evaluación reproducible + baseline de LangSmith

Fase 5 — Agentic layer
  • Grafo LangGraph productivo con routing por intención
  • CRAG (grade_documents, rewrite_query, handle_no_context) y multiagente
  • Manejo de estados conversacionales complejos (memoria multi-turn)
  • Observabilidad de decisiones del grafo y evaluación específica del layer agentic
Media

Instrumentar trazas del grafo y definir métricas de decisión (routing accuracy y retry quality)