Cómo aislar y guardar voces de pistas musicales con Audacity

Enlaces rápidos
- Una advertencia
- El proceso
Una advertencia
Aislar la voz funciona con la misma técnica básica que eliminarla: se combinan dos formas de onda y se invierte la fase de una para “restar” los elementos no deseados. Para que esta técnica funcione correctamente necesitas una versión instrumental de estudio que coincida lo más fielmente posible con la pista original con voz. Si primero intentaste quitar la voz para obtener el instrumental y luego quisiste aislar la voz a partir de ese instrumental procesado, normalmente no funcionará.
Muchos sellos y servicios liberan pistas instrumentales (algunas incluyen coros de respaldo y otras no). Hay lugares donde puedes comprar o descargar instrumentales, y en algunos discos la cara B incluye la pista instrumental. Usar instrumentales de calidad y sin procesado excesivo mejora mucho el resultado.
Importante: evita pistas con mucho recorte (clipping). El recorte rompe la forma de onda y arruina la cancelación de fase sobre esas secciones. En Audacity puedes mostrar dónde ocurre el recorte desde el menú Ver > Mostrar recorte (View > Show Clipping).
A diferencia del resultado mono típico de algunas técnicas de eliminación de voz, este método conserva una pista estéreo final. Por eso es crucial igualar la calidad, frecuencia de muestreo y longitud de ambas pistas antes de intentar la cancelación.
El proceso
- Abre Audacity e importa tanto la pista con voz (original) como la pista instrumental (sin voz).
- Selecciona la herramienta Time Shift Tool (Herramienta de desplazamiento de tiempo) y alinea las pistas de forma aproximada.
- Haz zoom muy de cerca hasta ver la forma de onda con claridad. Luego céntrate en alinear picos y valles; la precisión importa.
- Busca un pico o un valle evidente en el canal izquierdo y empata ese punto, muestra contra muestra. Si la alineación es imprecisa, la cancelación de fase fallará o dejará artefactos.
Consejo: trabaja en secciones cortas si la pista tiene fluctuaciones o si una versión instrumental tiene ligeros cambios de tempo.
Vuelve a la herramienta Selección. Haz doble clic en la pista instrumental para seleccionar solo esa pista.
Ve a Efecto > Invertir (Effect > Invert) para invertir la fase de la pista instrumental.
- Pulsa Ctrl+A para seleccionar ambas pistas. Ve a Pistas > Mezclar y renderizar (Tracks > Mix and Render).
- Obtendrás una pista combinada en la que la instrumentación debería verse disminuida y la voz más presente.
- Escucha con atención. Si oyes artefactos, vuelve a intentarlo y perfecciona la alineación. La parte más difícil es conseguir una coincidencia fase/tiempo lo más perfecta posible.
Problemas comunes y cuándo falla
- El instrumental no coincide exactamente con la versión con voz (diferente mezcla, compresión o ecualización): la cancelación quedará incompleta.
- El instrumental incluye coros de respaldo u otros elementos vocales: no podrás aislar solo la voz principal sin artefactos.
- Clipping en MP3 o en pistas muy comprimidas: el recorte arruina la inversión de fase en esas zonas.
- Diferente frecuencia de muestreo o bit depth entre pistas: siempre conviértelas a la misma frecuencia y profundidad antes de alinear.
Alternativas y enfoques complementarios
- Herramientas basadas en aprendizaje automático: Spleeter, Demucs u otros separadores de fuentes suelen dar buenos resultados sin necesidad de un instrumental exacto. Son útiles cuando no hay un instrumental disponible.
- Plugins y software profesional: iZotope RX y similares ofrecen módulos de separación de fuentes y extracción de voz con controles finos.
- Mid/Side y procesamiento de fase: si la voz está muy centrada, procesar la señal mid/side y atenuar el mid puede ayudar, pero suele generar una salida mono o con pérdida de estéreo.
- Restauración manual: ecualizar y automatizar ganancias para reducir instrumentos en ciertas bandas si solo necesitas partes concretas.
Mini-metodología rápida (resumen de pasos)
- Preparar: comprueba frecuencias de muestreo y bit depth (por ejemplo 44.1 kHz o 48 kHz; 16/24 bits).
- Alinear: usar Time Shift y zoom para empatar picos en el canal izquierdo.
- Invertir: seleccionar la pista instrumental y aplicar Efecto > Invertir.
- Mezclar: seleccionar todo y Pistas > Mezclar y renderizar.
- Verificar: escuchar, ajustar y repetir si hace falta.
Lista de comprobación por rol
- Productor:
- ¿Tienes la versión instrumental original? ¿Coincide la mezcla?
- ¿Las pistas están en la misma frecuencia de muestreo?
- Ingeniero de mezcla:
- ¿Hay clipping o compresión agresiva? Si es así, busca una fuente mejor.
- ¿La alineación temporal está hecha a nivel de muestra? (zoom máximo)
- Editor/audiorestaurador:
- ¿Se necesita limpieza adicional (reducción de ruido, de-essing) después de la separación?
Criterios de aceptación
- La voz principal es claramente audible y ocupa la mayor parte del espectro vocal.
- La mayoría de la instrumentación está atenuada, sin saltos bruscos ni silbidos.
- No hay secciones con pérdida total de señal ni clipping residual evidente.
Caja de datos clave
- Frecuencias de muestreo comunes: 44.1 kHz, 48 kHz, 96 kHz.
- Profundidades de bit comunes: 16 bits (CD), 24 bits (estudio).
- Herramientas alternativas a considerar: Spleeter, Demucs, iZotope RX.
Consejos finales y riesgos
- Riesgo: nunca compartas o publiques material con derechos sin permiso. Aislar la voz para uso personal y estudio suele estar bien; su uso público o comercial puede requerir licencia.
- Si trabajas con versiones MP3 muy comprimidas, exporta a WAV a la mayor calidad posible antes de procesar.
Glosario rápido
- Invertir: invertir la fase de una señal para cancelar componentes comunes.
- Clipping: distorsión por recorte de la señal cuando supera el rango máximo.
- Mid/Side: técnica que separa la información central (mid) de la lateral (side).
Resumen: con una buena versión instrumental y paciencia en la alineación, puedes extraer voces limpias usando Audacity. Si no hay instrumental exacto, considera herramientas de separación basadas en IA o plugins profesionales.
Materiales similares

Malware a nivel de kernel: guía de protección

Ver contador de 'No me gusta' en YouTube
FreeRADIUS + LinOTP 2: Autenticación 2FA con OTP

Mantener el PC despierto con Caffeine

Aislar voces con Audacity
