Todos los artículos
Recorta la Factura de Tokens

Recorta la Factura de Tokens

Dos herramientas pequeñas que se suman: Caveman recorta lo que el agent te responde, RTK recorta lo que la terminal manda de vuelta. Mismo context window, el doble de espacio.

Toda sesión agéntica quema tokens en dos direcciones. El agent te responde. La terminal escupe output. Mismo context window, fugas por los dos lados.

Estira lo suficiente y chocas con el muro. La calidad cae. Los costes suben.

Dos herramientas arreglaron casi todo. Una recorta lo que el agent dice. La otra recorta lo que vuelve desde la shell.

Mismo modelo. Mismos prompts. Factura más ligera.

Dos fugas en la misma ventana

Los bloques más grandes en cualquier transcripción de sesión: respuestas del agent y output de herramientas. No tus prompts.

  • Respuestas del agent: cortesías, vacilaciones, repeticiones, “Sure! Happy to help…”.
  • Output de herramientas: logs de npm install, muros de texto de git status, volcados de grep con rutas completas.

Los dos se acumulan. Los dos alejan la señal útil del modelo.

Caveman recorta la salida

Caveman es un skill de Claude Code. Un comando, /caveman full, y el agent deja caer artículos, rellenos y cortesías. Los fragmentos son bienvenidos. Los términos técnicos se mantienen exactos.

Instalación:

curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash

Lo que muere:

  • Artículos: a, an, the.
  • Rellenos: just, really, basically, actually, simply.
  • Cortesías: sure, of course, happy to.
  • Vacilaciones: might, perhaps, it depends.

Lo que sobrevive:

  • Bloques de código, errores exactos, rutas de archivo, comandos.
  • Avisos de seguridad y operaciones destructivas (el skill se aclara solo).

Misma respuesta. Una fracción de la prosa.

Deep Dive: Antes y después

Modo normal:

Sure! I’d be happy to help you with that. The issue you’re experiencing is likely caused by an off-by-one error in your token expiry check. The middleware compares the current time using < when it should really be using <=. Here’s the fix:

Modo caveman:

Bug in auth middleware. Token expiry check use < not <=. Fix:

Mismo fix. Mismo bloque de código a continuación. Un cuarto de prosa.

Niveles: lite, full, ultra. Empieza en full. Ultra se lee como un telegrama.

El agent no pierde inteligencia cuando le quitas la cháchara.

RTK recorta la entrada

RTK (Rust Token Killer) envuelve los comandos que ejecuta tu agent. Un hook reescribe git status a rtk git status. Transparente. Cero overhead.

Instalación:

brew install rtk
rtk init -g    # instala el hook que reescribe los comandos

La versión envuelta quita el ruido antes de llegar al agent. Códigos de color. Separadores repetidos. Banners de npm install. Timestamps verbosos.

El mismo git status, en crudo vs envuelto:

$ rtk proxy git status
On branch main
Your branch is up to date with 'origin/main'.

Untracked files:
  (use "git add <file>..." to include in what will be committed)
	content/blog/new-draft.md

nothing added to commit but untracked files present (use "git add" to track)
$ rtk git status
* main...origin/main
? Untracked: 1 file
   content/blog/new-draft.md

Misma información. La mitad de líneas. En un repo con movimiento la diferencia escala: decenas de untracked files, pistas de branch, líneas de instrucciones, todo colapsa en un bloque.

rtk gain              # ver cuántos tokens te ha ahorrado
rtk gain --history    # desglose por comando
rtk discover          # escanea tu historial de Claude Code buscando ganancias

Ejecuta rtk gain tras un uso real para ver tu propio ahorro. RTK reporta 60-90% menos tokens en los comandos de desarrollo habituales.

El output que tú no lees sigue siendo output que el modelo tiene que leer.

Por qué la combinación suma

Cada herramienta tapa una fuga. Juntas multiplican.

Un turno: prompt, pensar, ejecutar comando, output de terminal, leer, responder. RTK encoge el output de la herramienta. Caveman encoge la respuesta. Turnos más pequeños, más turnos en la misma ventana.

La compactación llega más tarde. El inicio cacheado de la conversación se mantiene barato. Solo las partes nuevas cuestan.

Prueba real con el plan Claude Max de 100$/mes. Antes de las dos herramientas: llegaba al límite semanal a menudo, a veces con un solo proyecto. Después: varios proyectos en paralelo y el límite casi no aparece.

Cuándo no comprimir

Las dos herramientas saben cuándo hacerse a un lado.

Caveman vuelve a prosa normal para:

  • Avisos de seguridad y operaciones destructivas.
  • Secuencias multi-paso donde los fragmentos pueden malinterpretarse.
  • Cuando le pides al agent que aclare o repita.

RTK nunca toca el payload. Quita el ruido a su alrededor. Los errores y stack traces se mantienen exactos. Si algún filtro alguna vez se come algo que necesitas, sáltatelo para esa llamada:

rtk proxy <cmd>   # output crudo, sin filtrar

Si una respuesta queda demasiado seca, escribe normal mode.

La compresión es para la cháchara. Nunca para la sustancia.

Empieza con una, añade la otra

No necesitas las dos el primer día. Elige la fuga que más duela.

¿El agent escribe ensayos largos por cada fix? Instala Caveman primero.

¿Cada grep o npm install inunda la ventana? Instala RTK primero.

Luego añade la otra. No entran en conflicto.

Dos herramientas. Dos fugas. Una ventana de contexto que dura el doble.

blog-footer

Atajos de Teclado

Movimiento vim hjkl

hArtículo anterior← left
jBajar↓ down
kSubir↑ up
lArtículo siguiente→ right
ggIr arriba
GIr al final
nSiguiente secciónnext heading
NSección anteriorprevious heading

Ir a g = go

ghIniciogo home
gbBloggo blog
grLecturasgo readings
gcCVgo cv

Acciones

/Buscarvim search
dCambiar temadark mode
tMostrar/ocultar índicetable of contents
iCambiar idiomai18n
mAlternar resaltadomark text

General

?Mostrar ayuda
EscCerrar
:Terminalvim command mode
↑↑↓↓←→←→BA???