Always On Memory Agent: memoria IA sin vector databases

El problema que todos ignoraban: la memoria de los agentes de IA

Cualquier founder que haya intentado construir un agente de IA en producción sabe bien el dolor: cada nueva conversación empieza desde cero. Sin contexto previo, sin historial de decisiones, sin memoria de lo que el usuario dijo la semana pasada. La solución tradicional —integrar una base de datos vectorial como Pinecone, ChromaDB o FAISS— agrega complejidad operativa, costos de infraestructura y una dependencia de la nube que muchos equipos simplemente no pueden justificar en etapas tempranas.

Ahí es donde entra en juego una propuesta que está generando conversación en el ecosistema de IA: el Always On Memory Agent, un proyecto open-source impulsado por Shubham Saboo, Product Manager en Google, que plantea una alternativa radicalmente más simple.

Qué es el Always On Memory Agent y cómo funciona

El Always On Memory Agent es un sistema de memoria persistente para agentes de IA que opera como un servicio siempre activo. Su propuesta central es directa: en lugar de depender de costosas y complejas bases de datos vectoriales, usa el propio modelo de lenguaje (LLM) para gestionar, consolidar y consultar memorias estructuradas almacenadas en SQLite, una base de datos liviana que corre localmente sin infraestructura adicional.

El agente está construido sobre el Google Agent Development Kit (ADK), el mismo framework open-source que ya corre internamente en productos de Google como Agentspace y Customer Engagement Suite. Para el procesamiento, utiliza Gemini Flash-Lite, un modelo optimizado para velocidad y bajo costo, capaz de ejecutarse incluso en hardware de bajo consumo.

La arquitectura en tres pasos

El flujo de trabajo del agente sigue una lógica clara que cualquier desarrollador puede entender y adaptar:

Ingesta: el agente captura información de múltiples tipos de archivos y conversaciones, estructurándola en tablas SQL.
Consolidación: el LLM procesa y refina los registros almacenados, eliminando duplicados y priorizando información relevante.
Consulta: cuando el agente necesita contexto, realiza búsquedas SQL filtradas por usuario, tipo de memoria y recencia, y el modelo reordena los resultados según relevancia semántica.

El resultado es un sistema de memoria persistente que funciona offline, no depende de la nube y consume recursos mínimos —del orden de 5 MB por cada mil sesiones, frente a los más de 150 MB que requieren soluciones basadas en bases de datos vectoriales tradicionales.

Por qué esto importa: vector databases vs. memoria gestionada por LLM

El debate entre ambos enfoques no es trivial. Las bases de datos vectoriales siguen siendo la opción más poderosa para búsquedas semánticas a escala masiva, especialmente en empresas con millones de usuarios o volúmenes gigantescos de datos no estructurados. Pero tienen un costo real:

Latencia de indexación que puede superar los 100 ms.
Dependencia de servicios cloud externos.
Almacenamiento de embeddings que escala en gigabytes.
Curva de aprendizaje y operación especializada.

La propuesta del Always On Memory Agent no pretende reemplazar a Pinecone o Milvus en todos los casos. Apunta a un segmento muy concreto: equipos pequeños, productos en etapas tempranas o casos de uso donde la privacidad y la simplicidad operativa son prioritarias. Para un agente que necesita recordar preferencias de usuario, historial de decisiones o contexto de sesiones anteriores sin escalar a millones de registros, SQLite + Gemini Flash-Lite es una combinación sorprendentemente efectiva.

El Google ADK: el framework que lo hace posible

Un componente clave de este proyecto es el Google Agent Development Kit (ADK), lanzado en 2025 y disponible como open-source. El ADK resuelve de forma nativa uno de los problemas más recurrentes en el desarrollo de agentes: la separación entre memoria de corto plazo (datos de sesión activa) y memoria de largo plazo (información persistente entre sesiones).

El ADK ofrece dos interfaces principales para esto:

SessionService: gestiona datos temporales de la conversación en curso, borrados automáticamente al cerrar la sesión.
MemoryService / BaseMemoryService: almacena conocimiento estructurado y buscable que persiste entre sesiones, con soporte para múltiples backends.

Lo que hace Saboo con el Always On Memory Agent es aprovechar estas abstracciones del ADK y conectarlas con SQLite como backend de persistencia, delegando al modelo Gemini Flash-Lite la tarea de reordenar y priorizar memorias relevantes. El resultado es un stack completo de memoria sin una sola línea de configuración de infraestructura vectorial.

Impacto real para founders y equipos de producto

Para equipos que construyen sobre IA, este tipo de solución tiene implicaciones prácticas inmediatas:

Reducción de tiempo de implementación: sin configurar vectorstores, bases de datos externas ni pipelines de embeddings complejos.
Costos operativos menores: SQLite corre en el mismo servidor o dispositivo del agente; no hay costos de API vectorial.
Mayor privacidad: la memoria vive localmente, lo que simplifica el cumplimiento de regulaciones como GDPR en contextos empresariales.
Portabilidad: el agente puede ejecutarse en entornos sin acceso a internet, desde servidores on-premise hasta dispositivos edge.

Por supuesto, el enfoque no está exento de desafíos. La gobernanza de datos, la gestión de accesos y el cumplimiento normativo siguen siendo consideraciones críticas que cada equipo debe resolver según su contexto. En despliegues empresariales con múltiples usuarios y datos sensibles, la simplicidad de SQLite puede convertirse en un cuello de botella.

El código es abierto: ¿cómo empezar?

El proyecto está disponible en GitHub bajo licencia Apache 2.0, lo que significa que cualquier equipo puede usarlo, modificarlo y construir sobre él sin restricciones comerciales. La instalación está diseñada para ser accesible con un solo comando y el repositorio incluye notebooks de inicio rápido y ejemplos de integración con el ADK.

Para founders tech que buscan agregar memoria persistente a sus agentes de IA sin la sobrecarga de una base de datos vectorial, este es un punto de partida concreto y evaluable. El ecosistema de herramientas alrededor del Google ADK está madurando rápidamente, y proyectos como este marcan la dirección hacia agentes más autónomos, más livianos y más fáciles de operar.

Conclusión

El Always On Memory Agent de Shubham Saboo representa algo más que un proyecto open-source interesante: es un síntoma de hacia dónde va el desarrollo de agentes de IA en 2026. La tendencia apunta a sistemas más livianos, más privados y con menor dependencia de infraestructura compleja. El hecho de que un Product Manager de Google lo construya sobre el propio ADK de la compañía y lo libere como open-source envía una señal clara: la memoria persistente para agentes ya no es un lujo de grandes empresas, sino una capacidad accesible para cualquier equipo que sepa dónde buscar.

Si estás construyendo productos con IA o evaluando arquitecturas de agentes autónomos, este proyecto merece estar en tu radar esta semana.

Descubre cómo otros founders implementan estas soluciones de IA en sus productos y comparte lo que estás construyendo en nuestra comunidad gratuita.

Aprender con founders