Voice Coding

Cómo tripliqué mi velocidad de programación usando voz en Cursor

La experiencia real de un desarrollador usando escritura por voz en Cursor IDE. Aprende los flujos de trabajo que triplicaron la productividad al programar.

Murmur TeamFebruary 19, 20268 min readprogramación por voz, Cursor, productividad para desarrolladores, programación con IA, flujo de trabajo

Resumen: Escribir prompts detallados para la IA de Cursor era mi mayor cuello de botella. Al cambiar a entrada por voz para prompts, comentarios y documentación, tripliqué mi velocidad efectiva de programación. Aquí explico exactamente cómo.

El cuello de botella que no veía

Pensaba que era rápido. Teclado mecánico, atajos de Vim, cada shortcut memorizado. Podía navegar un repositorio como un caza. Pero cuando Cursor se convirtió en mi herramienta principal, noté algo: pasaba más tiempo escribiendo instrucciones para la IA que escribiendo código.

Una sesión típica en Cursor se veía así:

  1. Abrir un archivo, identificar qué necesita cambiar
  2. Presionar Ctrl+K o Ctrl+L para abrir el panel de IA
  3. Escribir un prompt explicando lo que quiero
  4. Esperar la generación
  5. Revisar, aceptar o refinar
  6. Repetir

Los pasos 1, 4 y 5 eran rápidos. El paso 3 era el cuello de botella. Y peor aún, inconscientemente escribía prompts más cortos y vagos porque escribir instrucciones detalladas era lento. Prompts cortos significaban peores resultados, lo que significaba más iteraciones.

El experimento

Instalé Murmur un lunes por la mañana. La configuración tomó unos dos minutos. Ctrl+Espacio para activar, hablar, soltar. Ese es todo el flujo de trabajo.

Decidí medir mi productividad durante dos semanas: una semana solo tecleando, una semana con voz para todos los prompts de IA.

Semana 1: Solo teclado (línea base)

  • Longitud promedio del prompt: 15-25 palabras
  • Iteraciones promedio por funcionalidad: 3-4
  • Funcionalidades completadas por día: 4-5
  • Prompt típico: "Add error handling to the login function"

Semana 2: Voz para todos los prompts

  • Longitud promedio del prompt: 50-80 palabras
  • Iteraciones promedio por funcionalidad: 1-2
  • Funcionalidades completadas por día: 12-15
  • Prompt típico: "The login function in auth.ts needs proper error handling. It should catch network errors separately from auth errors, show a user-friendly toast message for each case, and log the full error to our monitoring service. Keep the existing retry logic but add a maximum of three retries for network errors only."

La mejora de 3x provino de dos efectos compuestos: los prompts se producían más rápido, y eran tan superiores que la salida de la IA requería menos iteraciones.

Flujos de trabajo en Cursor que más se benefician de la voz

1. Ediciones en línea (Ctrl+K)

La función de edición en línea de Cursor es donde la voz brilla con más fuerza. Seleccionas código, presionas Ctrl+K y describes lo que quieres cambiar.

Escenario tecleando: Seleccionas una función. Escribes: "refactor to use async/await." Cursor intenta adivinar. No es del todo correcto. Escribes otro prompt. Dos iteraciones más.

Escenario con voz: Seleccionas la misma función. Presionas tu atajo de Murmur y dices: "Refactor this function to use async/await instead of promise chains. Keep the error handling but convert the .catch blocks to try-catch. Also rename the variable 'res' to 'response' for clarity and add a return type annotation."

Una iteración. Listo. Quince segundos hablando reemplazaron tres rondas de escribir y revisar.

2. Conversaciones en el panel de chat (Ctrl+L)

El panel de chat es para conversaciones más largas sobre arquitectura, depuración y planificación. Estas conversaciones se benefician enormemente de la voz porque puedes explicar el contexto como lo harías con un colega.

En vez de escribir un escueto "why is this failing", puedes decir:

"I am getting a TypeScript error on line 34 of the UserService class. The error says Property 'email' does not exist on type 'unknown'. I think the issue is that the API response type is not properly narrowed after the fetch call. Can you show me how to add a type guard that validates the response shape before accessing properties?"

Ese nivel de contexto significa que Cursor te da la respuesta correcta de inmediato, con una implementación adecuada del type guard, no una sugerencia genérica.

3. Ediciones multi-archivo con Composer

El modo Composer de Cursor te permite hacer cambios en múltiples archivos. Los prompts para esto necesitan ser detallados porque describes cambios en varios archivos a la vez.

Un prompt por voz para Composer podría sonar así:

"I need to add a new API endpoint for user preferences. Create a route in routes/preferences.ts that handles GET and PUT requests. Add a PreferencesService in services/preferences.ts with methods to fetch and update preferences. Create a Zod schema in schemas/preferences.ts for validation. Update the route index file to include the new routes. Use the same patterns as the existing user routes."

Teclear eso tomaría un minuto o más. Decirlo toma unos 20 segundos. Y naturalmente incluyes más contexto arquitectónico cuando hablas.

4. Explicar bugs y problemas

Cuando encuentras un bug, explicarlo verbalmente es más natural que teclearlo. Tiendes a incluir más contexto sobre lo que esperabas, lo que realmente sucedió y lo que ya intentaste.

Prompt por voz: "This component re-renders every time the parent updates even though its props have not changed. I already wrapped it in React.memo but the issue persists. I suspect the problem is that the onClick handler is being recreated on every render because it is an inline arrow function. Can you refactor this to use useCallback and check if there are any other props that might cause unnecessary re-renders?"

Consejos para dictar prompts efectivos a Cursor

Sé específico con rutas de archivos y nombres

En vez de decir "the auth file", di "the auth middleware in middleware/auth.ts." Cursor tiene contexto sobre tu proyecto, y las referencias específicas a archivos le ayudan a localizar el código correcto.

Describe el patrón, no solo el resultado

En vez de: "Make this work."

Di: "Follow the same error handling pattern used in the UserController. Wrap the database call in a try-catch, map known error codes to HTTP status codes using the errorMapper utility, and let unknown errors propagate to the global error handler."

Incluye restricciones

Al hablar, menciona naturalmente lo que NO quieres:

"Add pagination to this endpoint. Use cursor-based pagination, not offset. Do not change the existing response format, just add a 'nextCursor' field. Keep backward compatibility for clients that do not send a cursor parameter."

Piensa en voz alta

Una de las mayores ventajas de la voz es que puedes pensar en voz alta. No necesitas tener un prompt perfectamente formulado antes de empezar a hablar.

"Okay so this function is supposed to validate the input but it is not handling the edge case where the array is empty. Actually, it is also not handling null. Let me think... I think the cleanest approach is to add a guard clause at the top that checks for null or empty array and returns an empty result early. Then the rest of the function can assume it has valid data."

Cursor maneja bien este estilo de flujo de conciencia porque extrae la intención del habla natural.

¿Listo para probar el dictado por voz?

Prueba Murmur gratis durante 7 dias con todas las funciones Pro. Dicta en cualquier app.

Descargar gratis

El flujo de trabajo híbrido

Después de un mes, encontré mi ritmo:

  • Voz: Todos los prompts de IA, mensajes de commit, descripciones de PR, documentación, comentarios de code review
  • Teclado: Navegación, ediciones pequeñas, atajos, aceptar/rechazar sugerencias de IA
  • Ratón: Seleccionar bloques de código para refactorizar, hacer clic en las sugerencias de Cursor

La voz maneja quizás el 40% de mi entrada por volumen, pero ahorra el 60% de mi tiempo porque apunta a las actividades de mayor fricción.

Números después de un mes

Aquí están mis estadísticas aproximadas antes/después:

MétricaSolo tecladoCon voz
Prompts por hora1535
Longitud promedio del prompt20 palabras65 palabras
Iteraciones de IA por tarea3.21.4
Funcionalidades completadas/día514
Tiempo en documentación45 min/día15 min/día

El aumento de velocidad no se trata solo de hablar más rápido que teclear. Se trata del efecto compuesto de mejores prompts que producen mejor salida de IA que requiere menos iteraciones.

Cómo empezar

Si quieres replicar este flujo de trabajo:

  1. Descarga Murmur y configura el atajo de teclado
  2. Empieza usando voz solo para el panel de chat de Cursor (Ctrl+L)
  3. Después de unos días, empieza a usarla también para ediciones en línea (Ctrl+K)
  4. Eventualmente úsala para mensajes de commit, documentación y todo lo demás

El primer día se siente extraño. Para el tercer día se siente natural. Para la segunda semana te preguntarás por qué alguna vez tecleaste los prompts.

Conclusión

La afirmación de velocidad 3x no se trata de velocidad de escritura. Ya tecleaba a más de 100 PPM. La ganancia de velocidad viene de eliminar la fricción entre tus pensamientos y la IA de Cursor. Cuando el costo de un prompt detallado baja de 60 segundos tecleando a 15 segundos hablando, naturalmente escribes mejores prompts. Mejores prompts producen mejor código. Mejor código necesita menos iteraciones.

La entrada por voz no está reemplazando mi teclado. Está llenando el vacío en el que los teclados fallan: expresar rápidamente instrucciones complejas y matizadas a herramientas de IA. Si usas Cursor todos los días, agregar entrada por voz es probablemente el cambio con mayor retorno de inversión que puedes hacer en tu flujo de trabajo.

¿Listo para probar el dictado por voz?

Prueba Murmur gratis durante 7 dias con todas las funciones Pro. Dicta en cualquier app.

Descargar gratis

Related Articles