Cómo Ahorrar Tokens en OpenCode

Aprende cómo reducir el consumo de tokens en OpenCode utilizando contexto específico, referencias directas a archivos y buenas prácticas para trabajar de forma más eficiente con agentes de IA.

💰 Cómo Ahorrar Tokens en OpenCode

Uno de los conceptos más importantes cuando trabajas con agentes de IA es entender cómo gestionar el consumo de tokens.

Los tokens son el recurso principal que utilizan los modelos para procesar información y generar respuestas. Cuantos más tokens consumas, más costosas y lentas pueden resultar tus interacciones.

Por eso, una de las habilidades más valiosas al trabajar con OpenCode es aprender a reducir el contexto innecesario.

👀 Visualizando el consumo de contexto

Una característica muy útil de OpenCode es que muestra de forma visual cuántos tokens estás utilizando durante una conversación.

En la interfaz puedes ver información como:

El contexto consumido hasta el momento
El porcentaje de la ventana de contexto utilizada
El título de la sesión actual
Información relacionada con el coste de la conversación

Esto permite tener siempre una referencia clara de cuánto contexto se está enviando al modelo.

🧠 Los tokens son el recurso más importante

Durante el trabajo diario con agentes es importante recordar que:

Los tokens son las unidades de información que se envían al modelo y son la base sobre la que se calcula el coste de uso.

Por este motivo, conviene evitar peticiones excesivamente generales cuando ya sabemos dónde se encuentra la información que necesitamos.

🎯 Sé específico siempre que puedas

Uno de los errores más comunes consiste en realizar preguntas demasiado abiertas.

Por ejemplo:

“Explícame el proyecto”
“Busca dónde está este comportamiento”
“¿Estoy bloqueando Google?”

Cuando hacemos preguntas generales, el agente necesita:

Buscar archivos relevantes.
Analizar múltiples fuentes.
Construir contexto adicional.
Determinar dónde se encuentra la respuesta.

Todo esto implica más tokens, más tiempo y más coste.

📁 Utiliza referencias directas a archivos

OpenCode permite referenciar archivos concretos utilizando la sintaxis con @.

Al hacerlo, puedes indicarle exactamente sobre qué archivo debe trabajar.

Por ejemplo:

@public/robots.txt

Después puedes formular preguntas específicas relacionadas con ese archivo.

De esta forma el agente:

Lee únicamente el archivo indicado.
Utiliza mucho menos contexto.
Responde más rápido.
Consume menos tokens.

⚡ La diferencia de rendimiento es notable

Cuando OpenCode recibe una referencia directa a un archivo:

No necesita buscar información adicional.
El contexto es mucho más pequeño.
El tiempo de respuesta disminuye considerablemente.

En el ejemplo mostrado durante la clase, una consulta específica tardó aproximadamente 2,8 segundos mientras que la misma pregunta formulada de forma general requirió varios pasos adicionales y alrededor de 8 segundos para completarse.

La diferencia puede parecer pequeña en un proyecto sencillo, pero se multiplica rápidamente cuando trabajas con bases de código grandes.

🔍 Cómo trabaja el agente cuando no eres específico

Si preguntas algo como:

“¿Estoy bloqueando el bot de Google?”

sin indicar el archivo correspondiente, el agente tendrá que:

Buscar posibles archivos relacionados.
Localizar el archivo robots.txt.
Leer su contenido.
Analizarlo.
Generar la respuesta.

Cada uno de esos pasos consume tokens adicionales.

📋 Copiado automático en OpenCode

Durante la clase también se menciona un comportamiento interesante de OpenCode:

Cuando seleccionas texto dentro de la terminal, el contenido se copia automáticamente al portapapeles.

No es necesario utilizar:

Ctrl + C
Cmd + C

La selección ya queda disponible para pegarse posteriormente.

Es un pequeño detalle que mejora mucho la experiencia de trabajo diaria.

🚀 La regla de oro para ahorrar tokens

La mejor estrategia para reducir consumo es muy sencilla:

Cuanto más específico seas, menos trabajo tendrá que realizar el agente.

Siempre que conozcas:

El archivo
La carpeta
El componente
La función

indícalo explícitamente.

Esto hará que OpenCode trabaje con un contexto mucho más pequeño y eficiente.

📌 Ideas clave de esta clase

Quédate con estos conceptos:

OpenCode muestra visualmente el uso de tokens.
Los tokens representan el contexto enviado al modelo.
Menos contexto significa menor coste.
Las preguntas generales consumen más tokens.
Referenciar archivos con @ reduce el trabajo del agente.
Las respuestas llegan más rápido cuando el contexto es específico.
El agente necesita menos pasos para resolver la tarea.
Ser específico es la mejor estrategia para ahorrar tokens.

🎯 Conclusión

Trabajar con agentes de IA no consiste únicamente en obtener respuestas correctas.

También implica aprender a comunicarse de forma eficiente con ellos.

Cuanto más preciso seas al indicar dónde debe buscar información OpenCode, menos tokens consumirá, más rápidas serán las respuestas y mejor será la experiencia de desarrollo.

💡 Tip: Antes de hacer una pregunta, pregúntate si ya sabes en qué archivo o componente está la información. Si la respuesta es sí, indícaselo directamente al agente usando @archivo. Ahorrarás tiempo, contexto y dinero.