Claude vs ChatGPT para QA: cuál te ayuda más a encontrar bugs (y cuál solo te da respuestas útiles)

Mi querido amigo y amiga de la calidad, hace unas semanas alguien me escribió un mensaje privado a mi cuenta de IG que me pareció muy interesante: “Winston, ¿tú usas ChatGPT o Claude? Es que los probé los dos y no sé cuál es mejor para mi trabajo como QA.”

Y mi respuesta fue esta: depende de cómo trabajas. Debo confesar que no habia usado mucho Claude en ese momento, porque estaba “casado” con ChatGPT. Pero después de usar ambas herramientas, gracias a la insistencia de ustedes, durante varios meses en situaciones reales de QA, sí tengo una opinión formada. Y en este artículo quiero compartirla contigo de forma práctica, con ejemplos concretos, para que puedas decidir cuál encaja mejor en tu forma de trabajar.

Antes de comparar: ¿qué tienen en común?

Ambas son herramientas de inteligencia artificial con las que puedes conversar en lenguaje natural. Les escribes lo que necesitas y te responden. Puedes pedirles que generen casos de prueba, que analicen un requerimiento, que expliquen un bug o que te ayuden a redactar un reporte de defectos.

Y los dos lo hacen bien. Ese es el punto de partida honesto.

La diferencia aparece cuando el trabajo se vuelve más específico, más técnico, más cercano a cómo funcionamos realmente los profesionales de calidad.

Diferencia 1: cómo recopilan el contexto antes de ayudarte

Aquí hay algo que he notado mucho en la práctica y que creo que es la diferencia más subestimada entre las dos herramientas.

Cuando le pides ayuda a ChatGPT, la herramienta espera que tú le des todo el contexto desde el principio. Si el prompt es vago, la respuesta también lo es. La responsabilidad de construir una buena instrucción cae completamente sobre ti.

Claude funciona de forma diferente. En lugar de esperar que tú lo expliques todo, hace preguntas. Y no preguntas abiertas que te obligan a escribir párrafos, sino opciones concretas que puedes seleccionar con un clic.

Por ejemplo, si le dices a Claude: “Quiero crear contenido para mi canal sobre QA”, en lugar de pedirte que describas tu audiencia, te pregunta directamente: ¿Tu audiencia son jóvenes de 18-25 años, profesionales de 25-40, emprendedores o audiencia mixta? Tú eliges una opción y Claude ya tiene ese dato incorporado para todo lo que sigue.

Para un QA, esto tiene una aplicación directa. Imagina que le pides ayuda para generar casos de prueba. En lugar de que tú construyas un prompt largo explicando el tipo de sistema, los roles de usuario y los criterios de aceptación, Claude puede guiarte con preguntas precisas hasta tener el contexto necesario. El resultado es más útil desde la primera respuesta.

Diferencia 2: cómo mantiene el hilo de la conversación

Aquí hay otro punto que me parece muy valioso para el trabajo de QA.

Cuando tienes una conversación larga con Claude, en la que vas dando contexto poco a poco, definiendo el sistema, los usuarios, las restricciones, Claude mantiene ese hilo. No tienes que repetirle quién eres, qué proyecto estás revisando o cuál era el requerimiento original cada vez que haces una pregunta nueva.

Esto es especialmente útil en sesiones de análisis de riesgos o en refinamientos donde la conversación evoluciona y cada pregunta depende de lo que se habló antes.

Con ChatGPT también puedes tener conversaciones largas, pero la experiencia es que tiende a perder el hilo con más facilidad en intercambios extensos, lo que te obliga a recordarle el contexto con más frecuencia.

En mi caso, incluso debo refinar algunas respuestas y pedirle especificamente “recuerda estos cambios para el futuro”

Diferencia 3: Los slash commands, la IA aprende tus reglas

Aquí viene algo que, en mi opinión, cambia completamente la forma de trabajar.

Claude Code tiene un sistema de comandos personalizados que se llaman slash commands. La idea es sencilla: tú creas un archivo de texto con instrucciones, lo guardas en una carpeta específica del proyecto, y ese archivo se convierte en un comando que puedes invocar con una barra diagonal.

Por ejemplo, imagina que en tu proyecto siempre generas casos de prueba siguiendo el mismo formato: escenario positivo, escenario negativo, caso borde y precondiciones. En lugar de explicárselo a Claude cada vez que lo necesitas, puedes crear un archivo que se llame generar-caso.md con esas instrucciones, guardarlo en la carpeta .claude/commands/, y desde ese momento solo tienes que escribir /generar-caso para que Claude lo ejecute siguiendo exactamente tus reglas.

Es como enseñarle una vez y que nunca olvide.

Y esto no se limita solo a casos de prueba. Puedes crear comandos para revisar código antes de un release, para analizar riesgos en una historia de usuario, para verificar que los selectores de tus pruebas automatizadas siguen los estándares del equipo. Lo que necesites y lo que tu equipo haga repetidamente, puede convertirse en un comando.

ChatGPT no tiene un equivalente directo a esto. Tiene algo llamado instrucciones personalizadas, pero son más limitadas y no se integran con tu proyecto de la misma forma.

Diferencia 4: Claude Code y el trabajo directo con tu repositorio

Hasta aquí hemos hablado de Claude como herramienta de chat. Pero hay algo más que ChatGPT no tiene y que cambia completamente la forma de trabajar con código.

Se llama Claude Code, y vive en tu terminal.

En lugar de abrir una pestaña del navegador y copiar y pegar fragmentos de código, Claude Code se conecta directamente con tu proyecto. Le puedes escribir: “Ponme al día con este repositorio”, y Claude lee la estructura de archivos, revisa los cambios recientes y te da un resumen de lo que está ocurriendo, sin que tengas que explicarle nada desde cero.

Para un QA que trabaja con automatización de pruebas, esto tiene aplicaciones muy concretas:

Ejemplo 1: revisar pruebas antes de un release En lugar de abrir cada archivo de pruebas manualmente, le puedes pedir a Claude Code que revise todos los tests del proyecto e identifique cuáles podrían tener problemas con los últimos cambios del código.

Ejemplo 2: análisis de cobertura Puedes pedirle que identifique qué partes del sistema tienen pruebas y cuáles no, directamente sobre tu repositorio real, sin necesidad de copiar ni pegar nada.

Ejemplo 3: crear un comando personalizado para casos de prueba Claude Code tiene un sistema de comandos que se llaman slash commands. Puedes crear un archivo llamado generar-caso.md con las instrucciones de cómo quieres que se generen tus casos de prueba, el formato, los campos requeridos, los tipos de escenarios. Ese archivo se guarda en una carpeta del proyecto y se convierte en un comando. Desde ese momento, solo escribes /generar-caso y Claude genera los casos siguiendo exactamente tus reglas, sin tener que explicarlo cada vez.

Es como entrenar a un asistente una sola vez y que nunca olvide.

ChatGPT no tiene un equivalente directo a esto. Tiene un intérprete de código que funciona en un entorno aislado, pero no se conecta con tus archivos reales ni mantiene reglas específicas de tu proyecto.

Diferencia 5: el archivo CLAUDE.md, la memoria del equipo

Hay un último elemento que quiero mencionar porque me parece especialmente valioso para equipos de QA que buscan consistencia.

En Claude Code puedes crear un archivo llamado CLAUDE.md en la raíz de tu proyecto. Ese archivo funciona como un manual de instrucciones permanente. Ahí defines las reglas que Claude debe seguir siempre:

Que los selectores de pruebas automatizadas usen data-testid y nunca clases CSS
Que cada caso de prueba incluya escenario positivo, negativo y caso borde
Que al analizar riesgos siempre considere el impacto en el usuario final
Los estándares de nomenclatura y estructura que usa el equipo

Claude lee ese archivo al inicio de cada sesión. No tienes que repetir las reglas. No tienes que recordarle el contexto. Todo el equipo trabaja con las mismas instrucciones.

Entonces, ¿cuál elegir?

Si usas la IA principalmente para conversar, buscar ideas rápidas o generar contenido visual, ChatGPT tiene un ecosistema muy amplio con generación de imágenes e integraciones variadas que pueden ser muy útiles.

Pero si tu trabajo ocurre dentro de proyectos reales, con repositorios, con código, con equipos que necesitan consistencia y con la necesidad de mantener el hilo de conversaciones complejas, Claude ofrece ventajas concretas que se notan en el día a día.

Y como QAs, ese segundo contexto es el que describe nuestro trabajo.

Este artículo fue escrito con el apoyo de Claude como herramienta de investigación y redacción. Si quieres entender cómo funcionan estas herramientas desde cero, te recomiendo el libro AI for Absolute Beginners de Anne Hansen. Está en inglés, pero es de las lecturas más accesibles que he encontrado sobre el tema. Vale la pena tenerlo como referencia.

¿Ya probaste alguna de estas herramientas en tu trabajo como QA? ¿Cuál ha sido tu experiencia y qué diferencias has notado tú? Te leo en los comentarios. Y nos vemos la proxima semana con otro blog sobre estas herraminetas y como utilizarlas. Dejame saber en los comentarios si esta informacion te ha sido útil para seguir creando post similares.

Antes de comparar: ¿qué tienen en común?

Diferencia 1: cómo recopilan el contexto antes de ayudarte

Diferencia 2: cómo mantiene el hilo de la conversación

Diferencia 3: Los slash commands, la IA aprende tus reglas

Diferencia 4: Claude Code y el trabajo directo con tu repositorio

Diferencia 5: el archivo CLAUDE.md, la memoria del equipo

Entonces, ¿cuál elegir?

Related Posts

VLOG: Razones por las qué la calidad del software es un TRABAJO DE EQUIPO

Por qué productos técnicamente “perfectos” fracasan (y cómo QA puede evitarlo)

Sensacionales consejos para crear reportes de errores de alto valor

Leave a Reply Cancel reply