0:00
/
Transcripción

Buenas prácticas contra los tokens cada vez más caros

Cuando todo parece subir de precio es momento para abrir la mente.

Hemos estado viviendo un sueño de tokens subvencionados en nuestras suscripciones a Copilot, Claude Code y otros.

Y aunque se firmen acuerdos como el de Anthropic con SpaceX para tener más computación, la tendencia parece indicar que usar la IA se encarecerá.

José Manuel nos acompaña hoy para dar juntos una buena pensada a otras formas de pensar en el uso de los agentes de IA para que no nos afecte tanto y aprovechar mejor los recursos.

👋 Soy Dani de Web Reactiva y puedes escuchar nuestra conversación en podcast. Dale al play en Spotify, Apple Podcasts o en cualquier podcatcher.

Más abajo encontrarás recursazos únicos para aumentar tu productividad con skills y aprender a utilizar las herramientas con astucia. Solo tienes que hacer scoll.

Tres grupos de buenas prácticas para plantarle cara

Lo que Dani y José Manuel han ido destilando se puede agrupar en tres bloques temáticos. No hace falta hacerlo todo: cada uno coge lo que le encaje según su contexto.

🎯 Elegir el modelo correcto para cada tarea

“Pisar otra moqueta” de vez en cuando. Ollama ofrece una suscripción de 20 dólares al mes que abre la puerta a usar modelos chinos como Kimi K2.6, DeepSeek V4 Pro o GLM 5.1 dentro de OpenCode (o con el binario de Claude Code).

¿Funcionan bien? Mira más abajo, te comparto una comparativa.

No usar la cubertería de plata para abrir un yogur. Sonnet no es “el modelo barato del montón”, es el segundo mejor de Anthropic. Resuelve la inmensa mayoría de las tareas sin alucinar y, lo más importante, te alarga la semana brutalmente. Reservar Opus para cuando de verdad lo necesitas es el primer ejercicio de responsabilidad.

Lo caro para planificar, lo barato para implementar. Hace unos meses esto era práctica común: Opus para hacer el plan, Sonnet para ejecutarlo. O un modelo razonador para explorar y uno más barato para escribir el código.

JM lo aplica en quieroformarme.com y nos recuerda lo que decía Feynman, “lo que no puedo crear, no lo puedo entender”. Si forzamos al modelo a entender el problema antes de escribir la solución, gastamos menos tokens corrigiendo después.

Abstraerse de la herramienta concreta. Cuanto más vinculado estés a un único producto, peor lo vas a pasar cuando cambien las reglas del juego. Open Code es open source y te permite cambiar de modelo y proveedor casi sin límite (a Anthropic no le gusta mucho que lo hagas).

💡 En Open Code hay incluso un modelo gratuito que viene con la cuenta de Zen, BigPickle (sí, “pepinillo gordo”) y que merece la pena descubrir.

🧩 Reducir el alcance de cada petición

Si vamos a usar modelos menos potentes, hay que trocear más finamente lo que les pedimos.

Desarrollo por “olas” con el principio SRP de SOLID. Prohibido pedir funcionalidades completas. Cada interacción con la IA debe tener una única responsabilidad: una ola = una función completa. Es el mismo SRP de toda la vida, aplicado a cómo redactas el prompt.

Iteraciones pequeñas estilo Elephant Carpaccio. Para no saturar la memoria del modelo, troceas el desarrollo en pasos microscópicos. En vez de pasarle el contexto de toda la aplicación, le pasas únicamente la pieza aislada que tiene que tocar.

🔧 Trabajar con arquitecturas fragmentadas (como en los microfrontends donde el enrutamiento y las dependencias ya están contenidos) es ideal para esto: el contexto que necesita la IA es mínimo y los errores se aíslan solos.

🛡️ Construir redes deterministas que atrapen los errores

Aquí es donde las buenas prácticas pasan a estrategias de supervivencia, como dice José Manuel. Si no puedes confiar en que el modelo siempre acierte, automatiza la verificación.

TDD y Quality Gates de integración como director de orquesta. Tests pequeñitos pegados a funciones pequeñas. Es el QA con esteroides en la era de la IA. Nunca un test de integración estuvo más valorado.

Linters deterministas contra el sesgo de entrenamiento. Los modelos se han entrenado con toneladas de código mediocre de internet. Para que no te reproduzcan malas prácticas, impón reglas estrictas que fallen de forma determinista.

Por ejemplo: una regla que bloquee el pipeline si la IA abusa de los useEffect en React, o que fuerce las convenciones de naming del equipo.

Análisis estático implacable. Las IA menos capaces tienden a repetir lógica o a saltarse los límites de tu Clean Architecture. Integra analizadores estáticos (SonarQube y compañía) que detecten código no usado, duplicación, complejidad ciclomática excesiva y, sobre todo, violaciones entre capas de tu arquitectura.

Observabilidad intencional innegociable. Que el código generado incluya trazas y logs estratégicos. Si esto se omite, resolver un error en producción de un código que no has escrito tú es imposible.

Integración continua como barrera final. Ninguna de las medidas anteriores sirve si depende de la buena voluntad del developer. Todos los gates de calidad, el análisis estático y los linters deben estar automatizados en el pipeline. Si la IA genera algo que rompe las reglas, el CI rechaza la integración sin debate.

Colofón

Hay mucho ruido por ahí. Vídeos diciendo que volvemos a la edad de piedra, que se acabó la IA, que toca hacerse agricultor en el pinar.

Calma.

Toca pensar más antes de lanzar peticiones, elegir mejor qué modelo usar para cada cosa y volver a unas buenas prácticas que, francamente, nunca dejaron de ser buenas prácticas.

Y los modelos open source no se van a ningún lado. Qwen, DeepSeek, GLM, Mistral, Gemma… ahí están. Tarde o temprano serán como la luz: un servicio que pagas, sí, pero que no se corta.

A no ser que haya apagón, ¿verdad? ;)

Y además, en el podcast:

El Rincón Reactionario de José Manuel viene cargadito:

  • 💸 El drama de Vercel en Quieroformarme.com: las caches de ISR disparadas, los robots chinos atacando, el firewall por país y por qué los builds de Vercel están carísimos por defecto (spoiler: se puede bajar de tier sin notarlo).

  • ⚛️ TanStack Start ya tiene server functions: la pieza que le faltaba al framework para competir de verdad con Next. Y Railway ya se ha migrado.

  • 🦀 El compilador de React reescrito en Rust: 10x más rápido, una PR de 330 commits y la mayoría escrita por IA. ¿De cuál? No lo dicen.

Dani sigue experimentando:

  • 🎨 Claude Design: probado a fondo y... ¡meh!. No sustituye a Figma, gasta tokens a cholón y no respeta el sistema de diseño que le pasas.

  • 🤖 Open Claw (sí, con W): el superagente orquestador que prometía hacerte el trabajo y de momento solo da más trabajo.


Francesc Box vive en la Sierra de Cameros y trabaja desde el corazón de La Rioja sin presupuestos de ciudad. Si conoces a alguien en la comarca con ganas de afrontar la transformación digital de su negocio, Francesc está allí mismo, en camerosdigital.com

🧡 Gracias a Paco Caja por revelarme que los enlaces al podcast no funcionaban.


💊 Recursos a tutiplén

🔌 SKILLS

Superpowers, una metodología completa para tu agente de IA

Estas skills automatizan flujos de trabajo profesionales como TDD (desarrollo dirigido por tests), planificación, depuración y revisión de código.

👉 Mira en español como funciona superpowers

⚡️ ASOMBROSICO

Controla NotebookLM desde la terminal

Una app tan gratis como maravillosa de Google no podía quedarse sin un CLI aunque sea no oficial. Genera pódcast, presentaciones, mapas mentales o flashcards desde Python o desde Claude Code, Codex u OpenCode.

🎢 CARRERA PROFESIONAL

El superpoder de preguntar como un idiota

Luminousmen defiende que la mayoría de fallos en ingeniería ocurren porque alguien tuvo miedo a parecer tonto.
Cuatro preguntas idiotas pueden ahorrarte semanas de trabajo:

  • ¿Qué pasa cuando falla?

  • ¿Cómo sabemos si está funcionando bien?

  • ¿Cuándo sabemos que está bien?

  • ¿Puedes enseñarme un ejemplo?

🛠 HERRAMIENTAS

Convierte un canal público de Telegram en feed RSS

Pegas el handle del canal (sin @), copias la URL que te genera y la metes en tu lector de RSS favorito. Sin registro, sin API key, sin pelearte con la Bot API de Telegram.

🔌 SKILLS

Genera vídeos con HTML gracias a Hyperframes

Aunque no tengas ni idea de crear vídeos te explico con un ejemplo como crear vídeos con bonitos efectos y más orientados a sacar provecho de las skills oficiales con la IA.

🎢 CARRERA PROFESIONAL

Adiós Mac, hola Chromebook (versión developer)

John Ozbay cuenta cómo huyó del Liquid Glass de Apple al Lenovo Chromebook Plus 14. El procesador MediaTek/ARM aguanta 10-12h de batería, el trackpad le parece gusta como el de Apple y disfruta con las apps.

🤖 IA PRÁCTICA

Comparativa: Kimi K2.6 vs DeepSeek vs GLM-5.1 en Ollama Cloud

Los modelos chinos ya son una alternativa para muchas tareas y Ollama Cloud es una suscripción donde tienes la posibilidad de usarlos más allá de la instalación local.

😎 PARA FARDAR

Devrage cuenta cuántas veces le has “faltado” a tu agente

Una CLI de TypeScript con SQLite que registra cada palabrota, exabrupto o “¡¡no borres eso!!” que sueltas mientras estás con Claude Code, Cursor o Codex.

🤸‍♂️ ALTERNATIVAS OPEN SOURCE

Keychron libera el diseño industrial de sus teclados y ratones

Más de 100 modelos con archivos CAD en STEP, DXF, DWG y PDF. Sirve para imprimir en 3D una funda, diseñar plates compatibles, accesorios o solo para curiosear cómo está hecho un teclado de verdad.

😲 CURIOSO

¿Qué pasa si instalas las 84.000 extensiones de Firefox a la vez?

Amplio tutorial con estadísticas curiosas: el 76% son open source, el 34% no tiene ningún usuario diario, y un 19% son extensiones fantasma sin reseñas, capturas ni icono. Raro.

🔰 PARA APRENDER

Un AI-Harness en 400 líneas de código

El Harness Engineering comienza por experimentos como pu.sh. 200MB de Claude Code frente a 37KB (sí, kilobytes) .

👉 Analizamos cómo está hecho para aprender la arquitectura

🤖 IA PRÁCTICA

OneCLI, esconde las API keys a tus agentes

Limitar el acceso a las claves es una buena práctica para estar más seguros y con el cifrado de OneCLI dejas a los LLM con las manos fuera de los secretos.

🎨 PLANTILLAS

92 prompts de UI listos para copiar y pegar

Los componentes típicos descritos como prompts estructurales para pegar en tu agente de IA y que aparezcan de forma mágica formularios de login y bento cards.

El recurso más popular de la publicación anterior fue…

🚀 Skills para hacer la Declaración de la Renta en España


PD: Nada de IA hoy aquí y me lo ha recomendado, con astucia, el algoritmo de X: Stop motion con una cerilla y unos papeles. De verdad que la vida puede ser maravillosa con tan poco…

#388

Y para acabar, si algún día necesitas mi ayuda…

¿Dudas en cómo aplicar la IA a tu carrera profesional como developer? ¿No encuentras el trabajo que esperabas?

Te alquilo mi cerebro durante 55 minuts para que te lleves una hoja de ruta personalizada y cargada de dinamita de la buena.

— Reserva una sesión de Consultoría 1 a 1 conmigo

La programación ya no es como la de 2024 y en Web Reactiva lo sabemos.

Aprende herramientas de nuestro tiempo, rodéate de personas que están donde te gustaría estar y construye proyectos que te saquen del montón.

— Entra y conoce lo que ofrecemos en Web Reactiva Premium

Si has llegado hasta aquí no te vayas sin suscribirte. Es gratis y todas las semanas tendrás tu recompensa ;)

Discusión sobre este video

Avatar de User

Por supuesto, sigue adelante.