Blog de Vibe Arcade

Historias de desarrollo, diseño de juegos y el arte de construir con IA

Cuando los Niños Hacen Playtest de Tus Juegos con IA, No Mienten

La mejor retroalimentación de producto viene de usuarios que no tolerarán UX malo, no leerán instrucciones, y te dirán directamente cuando algo está mal. Nuestros niños son ese usuario.

· Vibe Arcade

diseño de juegos playtesting UX tras bastidores

El Equipo de QA Accidental

Nunca hubo un plan de construir un programa de playtesting. Construimos juegos, y hay niños en nuestra casa. Mis hijos, sus primos, sus amigos. Cuando un juego nuevo sale, alguien dice "¿puedo probarlo?" y luego están jugando. Observamos. Hablan. Y sin proponérselo, se han convertido en el equipo de QA más efectivo con el que hemos trabajado.

Esto no es testing de usabilidad estructurado. Nadie está llenando una encuesta. Es un niño en una tablet en el sofá, o tres niños amontonados alrededor de un teléfono discutiendo de quién es el turno. La retroalimentación es inmediata, sin filtrar y a menudo ruidosa. Cuando algo no funciona, no presentan un reporte de bug — simplemente cierran la pestaña y se van. Esa señal es la más útil de todas.

Durante el último año, este loop accidental de retroalimentación ha impulsado más mejoras significativas que cualquier test automatizado o dashboard de analítica. A los niños no les importa qué tan astuto sea tu código. Les importa si el juego es divertido, si es justo y si funciona en el dispositivo que están sosteniendo. Si alguna de esas respuestas es no, terminaron.

"No Es Justo Si Alguien en Fácil Saca Una Puntuación Más Alta Que Yo"

Varios de nuestros juegos tienen múltiples modos — fácil, medio, difícil, diferentes tamaños de tablero, cronometrados y sin cronometrar. Cuando lanzamos los leaderboards inicialmente, todas las puntuaciones iban al mismo ranking sin importar el modo. Sabíamos que era una simplificación, pero parecía bien para una primera pasada.

Los niños encontraron el problema en unos diez minutos.

"No es justo si alguien jugando en fácil saca una puntuación más alta que yo en difícil."

Entregado con la absoluta certeza moral que solo un niño puede reunir, esa oración describía un problema arquitectónico que habíamos estado evadiendo. Un leaderboard que mezcla puntuaciones de diferentes modos de dificultad no es solo impreciso — es injusto. ¿Por qué alguien jugaría en difícil si las puntuaciones de fácil rankean más alto?

El arreglo no fue trivial. Significó repensar cómo los leaderboards almacenaban y consultaban puntuaciones, soportar rankings por modo en cada juego que tenía múltiples modos, y actualizar la visualización para permitir a los jugadores filtrar por el modo que les importaba. Un cambio arquitectónico real — y hizo el producto genuinamente mejor. Todo porque un niño se negó a aceptar algo que no era justo.

Los adultos lo habrían notado eventualmente. Pero los adultos toleran la imperfección en el software. Los niños no. Ven la injusticia y la nombran inmediatamente, sin matices.

El Éxito Sorpresa Que Nadie Planeó

No nos propusimos construir un idle clicker. Pulse vino de la investigación de IA que identificó un hueco en nuestra biblioteca — juegos de acción, juegos de puzle, juegos de estrategia, pero nada idle. La IA diseñó el sistema de progresión, las mecánicas de energía, los loops de prestigio. Lo construimos y lo subimos.

Entre los niños, Pulse se convirtió en el juego más jugado casi de la noche a la mañana.

Volvían sin que se les pidiera preguntando "¿puedo revisar mi energía?" Comparaban progreso entre ellos — quién había desbloqueado más generadores, quién había alcanzado un tier más alto de prestigio. El elemento competitivo no era algo que diseñamos; ellos lo inventaron convirtiendo un juego idle de un jugador en un concurso social.

Los idle clickers típicamente se asocian con audiencias mayores que entienden el crecimiento exponencial y la optimización. Pero "toca, observa el número subir, vuelve después y ha subido más" resultó ser universalmente convincente. Los niños no necesitaban entender las matemáticas de prestigio para disfrutar la progresión. La IA había diseñado algo genuinamente adictivo, y los niños lo probaron.

UX Mobile-First: Bugs Que Solo Salen en Dispositivos de Niños

Los niños mayormente juegan en tablets y teléfonos. No escritorios. Tablets en el sofá, teléfonos en el coche, dispositivos heredados con navegadores más viejos. Nuestro desarrollo y pruebas ocurrían en escritorio. La brecha entre esos entornos resultó ser donde vivían los bugs más consecuentes.

Pulse tenía un problema donde la generación de energía se rompía cuando la pantalla de la tablet se apagaba. En escritorio, cierras la pestaña y la vuelves a abrir — el juego calcula el progreso offline. En una tablet, la pantalla se apaga con la pestaña aún abierta, entrando en un estado suspendido que la lógica offline no manejaba. Los niños encontraron esto inmediatamente porque así es como usan las tablets: jugar, soltarla, recogerla después, esperar progreso.

Prism Break funcionaba perfectamente con clicks de ratón pero no con gestos de swipe. En una tablet, la interacción natural es deslizar, y el juego no lo registraba. Los niños no se adaptan al mal input — no piensan "debería tocar en lugar de deslizar." Simplemente deslizan, no funciona, y se van.

El problema de respuesta de tap fue el más generalizado. A través de múltiples juegos, los elementos interactivos tenían un retraso sutil en móvil. El arreglo fue una sola regla CSS aplicada globalmente — identificada porque observamos a niños tocando impacientemente en pantallas sin respuesta. Los adultos tocan una vez, esperan, tocan de nuevo. Los niños tocan cinco veces rápido y declaran el juego "roto." Solo una respuesta te fuerza a arreglar el problema.

"¿Qué Hace Esto?" — El Problema del Cómo Jugar

Los adultos que juegan juegos cargan décadas de conocimiento acumulado de género. Saben qué significa "prestigio" en un juego idle. Saben que emparejar tres de algo los limpia. Pueden descifrar mecánicas a través de prueba y error, lo que enmascara muchas brechas instructivas.

Los niños no tienen esa biblioteca de convenciones. Un niño mirando una cuadrícula de nonogram llena de números no va a intuir las reglas — va a preguntar "¿qué significan los números?" y si nadie lo explica, van a cerrar la pestaña.

Esta retroalimentación impulsó secciones de cómo jugar a través de múltiples juegos. No manuales largos — los niños tampoco los leerán — sino explicaciones claras e inmediatas de mecánicas centrales. ¿Qué tocas? ¿Qué intentas lograr? ¿Qué significan los símbolos? Los juegos que tenían esto desde el principio se desempeñaron mejor con el grupo de prueba de niños. Los juegos que asumían familiaridad de género perdían jugadores en los primeros treinta segundos.

La lección se extendió más allá de los tutoriales. Si una mecánica no es auto-explicativa solo desde los visuales, necesita una explicación. Si la explicación es más larga que dos oraciones, la mecánica podría ser demasiado compleja. Los niños nos enseñaron eso simplemente al no entender cosas que pensábamos que eran obvias.

Lo Que los Niños Te Enseñan Que la Analítica No Puede

La analítica te dice qué pasó pero no por qué. Una alta tasa de rebote podría significar que el juego es malo, que el tiempo de carga es lento o que el botón de empezar es difícil de encontrar. Los niños sentados frente a ti eliminan esa ambigüedad. Ves el momento exacto en que se confunden. Escuchas "esto es aburrido" o "esto es genial" o "eso no es justo." Los observas ignorar un popup de tutorial y atascarse en exactamente lo que estaba explicando.

Los niños también piden activamente cosas. "Haz un juego de trivia." "Haz un juego de carreras." "¿Puedes hacer uno donde dibujes cosas?" Algunas se alinean con lo que nuestra investigación de IA identificó como huecos. Algunas son completamente nuevas. Nuestro sistema de ideas comunitarias existe en parte por esto — la realización de que los jugadores tienen opiniones fuertes sobre qué debería construirse a continuación, y esas opiniones valen la pena capturarse.

Por Qué Seguimos Haciéndolo Así

Hay una versión de esto que se ve más profesional — sesiones estructuradas, tests A/B, investigación formal de usuarios. Probablemente llegaremos ahí eventualmente. Pero ahora mismo, la retroalimentación más valiosa viene de entregar una tablet a un niño y observar qué pasa.

La arquitectura del leaderboard que soporta rankings por modo — esa vino de un niño. Las secciones de cómo jugar que hicieron varios juegos accesibles — esas vinieron de observar a niños atascarse. Los arreglos de UX móvil que hicieron cada juego más responsivo — niños tocando impacientemente en pantallas.

El patrón es consistente: los niños identifican problemas más rápido, los articulan más contundentemente y tienen tolerancia cero para workarounds. No leerán tus instrucciones. No se adaptarán a tu mal UX. No te darán el beneficio de la duda. Y te dirán exactamente qué está mal, usualmente a un volumen que asegura que lo escuches.

Cada juego en Vibe Arcade se construye con IA. Pero los juegos mejoran por los humanos que los juegan — y los humanos más jóvenes, más ruidosos y menos pacientes consistentemente nos han dado la mejor retroalimentación. No lo planeamos así. Nos alegra que pasara.


Lectura relacionada: Cómo Construimos Pulse · Cómo Construimos Prism Break · ¿Qué Es Vibe Coding? · Herramientas de Vibe Coding: De Chatbots a IDEs con IA