💰 Cómo Ahorrar Tokens en OpenCode
Uno de los conceptos más importantes cuando trabajas con agentes de IA es entender cómo gestionar el consumo de tokens.
Los tokens son el recurso principal que utilizan los modelos para procesar información y generar respuestas. Cuantos más tokens consumas, más costosas y lentas pueden resultar tus interacciones.
Por eso, una de las habilidades más valiosas al trabajar con OpenCode es aprender a reducir el contexto innecesario.
👀 Visualizando el consumo de contexto
Una característica muy útil de OpenCode es que muestra de forma visual cuántos tokens estás utilizando durante una conversación.
En la interfaz puedes ver información como:
- El contexto consumido hasta el momento
- El porcentaje de la ventana de contexto utilizada
- El título de la sesión actual
- Información relacionada con el coste de la conversación
Esto permite tener siempre una referencia clara de cuánto contexto se está enviando al modelo.
🧠 Los tokens son el recurso más importante
Durante el trabajo diario con agentes es importante recordar que:
Los tokens son las unidades de información que se envían al modelo y son la base sobre la que se calcula el coste de uso.
Por este motivo, conviene evitar peticiones excesivamente generales cuando ya sabemos dónde se encuentra la información que necesitamos.
🎯 Sé específico siempre que puedas
Uno de los errores más comunes consiste en realizar preguntas demasiado abiertas.
Por ejemplo:
- “Explícame el proyecto”
- “Busca dónde está este comportamiento”
- “¿Estoy bloqueando Google?”
Cuando hacemos preguntas generales, el agente necesita:
- Buscar archivos relevantes.
- Analizar múltiples fuentes.
- Construir contexto adicional.
- Determinar dónde se encuentra la respuesta.
Todo esto implica más tokens, más tiempo y más coste.
📁 Utiliza referencias directas a archivos
OpenCode permite referenciar archivos concretos utilizando la sintaxis con @.
Al hacerlo, puedes indicarle exactamente sobre qué archivo debe trabajar.
Por ejemplo:
@public/robots.txt
Después puedes formular preguntas específicas relacionadas con ese archivo.
De esta forma el agente:
- Lee únicamente el archivo indicado.
- Utiliza mucho menos contexto.
- Responde más rápido.
- Consume menos tokens.
⚡ La diferencia de rendimiento es notable
Cuando OpenCode recibe una referencia directa a un archivo:
- No necesita buscar información adicional.
- El contexto es mucho más pequeño.
- El tiempo de respuesta disminuye considerablemente.
En el ejemplo mostrado durante la clase, una consulta específica tardó aproximadamente 2,8 segundos mientras que la misma pregunta formulada de forma general requirió varios pasos adicionales y alrededor de 8 segundos para completarse.
La diferencia puede parecer pequeña en un proyecto sencillo, pero se multiplica rápidamente cuando trabajas con bases de código grandes.
🔍 Cómo trabaja el agente cuando no eres específico
Si preguntas algo como:
“¿Estoy bloqueando el bot de Google?”
sin indicar el archivo correspondiente, el agente tendrá que:
- Buscar posibles archivos relacionados.
- Localizar el archivo
robots.txt. - Leer su contenido.
- Analizarlo.
- Generar la respuesta.
Cada uno de esos pasos consume tokens adicionales.
📋 Copiado automático en OpenCode
Durante la clase también se menciona un comportamiento interesante de OpenCode:
Cuando seleccionas texto dentro de la terminal, el contenido se copia automáticamente al portapapeles.
No es necesario utilizar:
Ctrl + CCmd + C
La selección ya queda disponible para pegarse posteriormente.
Es un pequeño detalle que mejora mucho la experiencia de trabajo diaria.
🚀 La regla de oro para ahorrar tokens
La mejor estrategia para reducir consumo es muy sencilla:
Cuanto más específico seas, menos trabajo tendrá que realizar el agente.
Siempre que conozcas:
- El archivo
- La carpeta
- El componente
- La función
indícalo explícitamente.
Esto hará que OpenCode trabaje con un contexto mucho más pequeño y eficiente.
📌 Ideas clave de esta clase
Quédate con estos conceptos:
- OpenCode muestra visualmente el uso de tokens.
- Los tokens representan el contexto enviado al modelo.
- Menos contexto significa menor coste.
- Las preguntas generales consumen más tokens.
- Referenciar archivos con
@reduce el trabajo del agente. - Las respuestas llegan más rápido cuando el contexto es específico.
- El agente necesita menos pasos para resolver la tarea.
- Ser específico es la mejor estrategia para ahorrar tokens.
🎯 Conclusión
Trabajar con agentes de IA no consiste únicamente en obtener respuestas correctas.
También implica aprender a comunicarse de forma eficiente con ellos.
Cuanto más preciso seas al indicar dónde debe buscar información OpenCode, menos tokens consumirá, más rápidas serán las respuestas y mejor será la experiencia de desarrollo.
💡 Tip: Antes de hacer una pregunta, pregúntate si ya sabes en qué archivo o componente está la información. Si la respuesta es sí, indícaselo directamente al agente usando
@archivo. Ahorrarás tiempo, contexto y dinero.