MIT OpenCourseWare


6.542J Curso práctico en fisiología, acústica y percepción del discurso.

Página principal
¿Qué es OCW?
Ayuda
Feedback
Preguntas frecuentes
Glosario
 
 
Página principal del curso
Programa
Horario de prácticas
 Lecturas obligatorias
Software para las prácticas
Base de datos de las prácticas
 Proyectos

   MIT

  
 

Base de datos de las prácticas

Esta página contiene ficheros de media digitalizados para que los pueda usar en las prácticas. La mayoría de los ficheros son datos de audio, pero hay también ficheros con imágenes y otros tipos de datos.

Para algunas de las prácticas, le pediremos que grabe su propia voz. Si no se ha hecho con las herramientas para realizar estas grabaciones, le damos ejemplos de enunciados emitidos por un hablante de sexo femenino y por otro de sexo masculino. Los ficheros de audio se muestran más abajo asociados a su práctica.

Datos de las prácticas: 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15
Práctica 1: cómo grabar la voz en una habitación tratada acústicamente. Análisis espectral y edición de la forma de onda por ordenador.

En la práctica 1 grabará una base de datos de enunciados de voz para que pueda utilizarla a lo largo del semestre. A continuación tiene una serie de enlaces a bases de datos de muestra grabadas por dos hablantes, uno de sexo femenino (HH) y otro de sexo masculino (KS).

Dése cuenta de que aunque estos ficheros tienen un sufijo .wav, están en formato Klatt para poder ser usados con las herramientas de análisis de voz de Klatt (xkl); NO están en el formato .wav de Microsoft. (Si tiene interés en usar estos ficheros con herramientas de análisis que requieran el formato .wav de MS, lo tendremos en cuenta y en el futuro se facilitarán ambos formatos).

Puede descargarse los ficheros tar de una base de datos completa aquí:

base de datos de muestra de una voz femenina
base de datos de muestra de una voz masculina

Los ficheros individuales pueden descargarse haciendo clic en los enlaces que se muestran a continuación:

  1. Vocales del inglés

     FemeninoMasculino
    1beatbitbeatbit
    2baitbetbaitbet
    3potbutpot but
    4boatboughtboatbought
    5putbootputboot
    6batBertbatBert
    7buyboybuyboy
    8about about 


  2. Consonantes del inglés

     FemeninoMasculino
    9the puttthe bugthe puttthe bug
    10the tugthe duckthe tugthe duck
    11the cutthe gutthe cutthe gut
    12the mugthe nutthe mugthe nut
    13the fussthe vanillathe fussthe vanilla
    14the thugthe "the"the thugthe "the"
    15the supperthe shutterthe supperthe shutter
    16the rug the lugthe rug the lug
    17the wonderthe youngthe wonderthe young
    18the chumpthe jumpthe chumpthe jump
    19the hutsung a songthe hutsung a song
    20the /zah/the /zhah/the /zah/the /zhah/


  3. Oraciones

     FemeninoMasculino
    21teacherteacher
    22He wanted to rebelHe wanted to rebel
    23schoolschool
    24high school teacherhigh school teacher
    25He stopped the rebel He stopped the rebel
    26school teacherschool teacher
    27tall school teachertall school teacher
    28Was he a high school teacher?Was he a high school teacher?
    29The tall school teacher left early.The tall school teacher left early.
    30teachteach
    31We live in Cambridge and we study at MITWe live in Cambridge and we study at MIT
    32He won those shoes.He won those shoes.


  4. pasaje de Rainbow, voz femenina
    pasaje de Rainbow, voz masculina


  5. discurso espontáneo, voz femenina
    discurso espontáneo, voz masculina
    [volver al principio]

 

Práctica 2: estudio espectrográfico y análisis del espectro del sistema vocálico del inglés.

Utilizará los siguientes enunciados de voz que fueron grabados durante la práctica 1:

  • la palabra "shutter"
  • los pares de vocales simples (Puntos 1-7)

[volver al principio]


Práctica 3: análisis espectral en banda ancha de las consonantes sonorantes.

Utilizará al menos uno de los siguientes subgrupos de enunciados de voz grabados durante la práctica 1:

  • Las palabras "mug", "nut", y "sung"
  • Las palabras "rug" y "lug"
  • Las palabras "wonder" y "young"

[volver al principio]

Práctica 4 : análisis espectral de consonantes oclusivas y fricativas: generación de sonido cuando se produce fricción en el tracto vocal.

Utilizará al menos uno de los siguientes subgrupos de enunciados de voz grabados durante la práctica 1:

  • Las palabras "bug", "duck", "gut", "putt", "tug", "cut", "hut"
  • Las palabras "fuss", "thug", "supper", "shutter", "vanilla", "the", /z/, //
  • Las palabras "chump", "jump", "tug", "duck", "shutter", //
[volver al principio]
Práctica 5 : generación de sonido en la laringe: características de la fuente glotal.
  • Parte A: usará las palabras "bat" y "pat" que han sido grabadas por 5 hablantes. Estos enunciados se han grabado y guardado ya, y están en la cuenta labc. Los tiene más abajo por si los quiere descargar.

  • Partes B-C: grabará las palabras "pat", "pad", y "bad" durante la clase práctica. Si no puede hacer grabaciones nuevas, puede descargar los ejemplos grabados por un hablante de sexo femenino (HH) que se muestran abajo.

    Descargue un fichero tar/zip de los enunciados (formato xkl) que se necesitan para esta clase práctica.

[volver al principio]
Práctica 6: cálculos de frecuencia de formantes a partir de datos de función del área.

No se necesitan enunciados de voz para esta práctica.

[volver al principio]


Práctica 7: reducción del segmento de sonido.

Utilizará el discurso espontáneo que se grabó durante la práctica 1.

Si no tiene sus propias grabaciones, puede descargar muestras de discurso que contienen claras interpretaciones de varias palabras, con más interpretaciones de las mismas producidas con segmentos reducidos. El fichero tar presenta ejemplos de los mismos hablantes masculino y femenino (KS y HH) que grabaron las muestras de discursos para la práctica 1.

Descargue los ejemplos de la práctica 7 (formato xkl) aquí. (fichero zip/tar)

[volver al principio]

Práctica 8: prosodia: pruebas acústicas para la estructura prosódica del constituyente.

Utilizará los siguientes enunciados emitidos por cuatro hablantes y guardados en la cuenta labc:

  • Parte A: por favor diga Maine or Duke and Rice will play.
  • Parte B: por favor diga Thomas or Kenneth and Lucas will stay.

Cada oración ha sido emitida con dos formas prosódicas distintas, y cada forma prosódica ha sido emitida dos veces por cada hablante para un total de 32 enunciados. Los enunciados están disponibles en dos formatos, Xwaves (ficheros .sd y .f0) y Xkl (ficheros .wav de Klatt).

Descargue un fichero tar/zip con los enunciados de voz que se necesitan para esta clase práctica.

[volver al principio]

Práctica 9: etiquetado de entonación O factores que afectan a la duración.

Utilizará los enunciados de voz para la parte A o aquellos para la parte B:

  • Parte A:
    1) Enunciados 3 a 10 en los ficheros lcorn.16k (formato Xwaves), que se encuentran en la cuenta labc (Descargue de aquí los ficheros lcorn.16k y lcorn.f0)
    2) Enunciados de la práctica 8, Parte A
  • Parte B:
    Las siguientes palabras, grabadas por dos hablantes: "fat", "fad", "fade", "cup", "cub", "coop", "pick", "pig", "peak", "men", "main', "mate", "tuck", "tug", "take". Estos archivos están en dos formatos, Xwaves (ficheros .sd) y Xkl (ficheros .wav de Klatt). (Descargue aquí un archivo con los enunciados).

[volver al principio]

Práctica 10: inteligibilidad del habla y matrices de confusión.

En esta práctica usted participará como sujeto en dos tipos de tests de inteligibilidad. Si asiste a la clase práctica escuchará los estímulos en una cinta de audio. Si no asiste a clase puede bajarse los archivos de audio de los tests que verá a continuación. Para ejecutar los tests por su cuenta, tendrá que bajarse las hojas para las respuestas y las respuestas en sí, de la página de la Práctica 10.

Hay un tercer tipo de test disponible, aunque no se ha presentado en clase. Tendrá que bajar las hojas para las respuestas y las hojas con las respuestas de la página de la práctica 10.

[volver al principio]

Práctica 11: introducción a los trastornos del habla.

Utilizará enunciados producidos por niños y adultos con diferentes tipos de trastornos de habla. Todos se encuentran en formato Xkl (Klatt .wav ):

[volver al principio]

Práctica 12: interpretación de películas cinerradiográficas de enunciados seleccionados.

En esta práctica utilizará ficheros .gif de imágenes cinerradiográficas. Dado que la base de datos en su totalidad es bastante grande, sólo estará a disposición de los estudiantes que asistan a la clase práctica. Los ficheros .gif de ejemplo pueden descargarse aquí:

descargue archivo KNS_6400995.gif, /a/ en "he'tat"
descargue el archivo KNS 6401423.gif, /a/ en "soggy"
descargue el archivo KNS_6400919.gif, /u/ en "he'tu"
descargue el archivo KNS_6401621.gif, /u/ en "shoes"

[volver al principio]

Práctica 13: síntesis de voz mediante el uso de un sintetizador por formantes.

Para esta práctica los estudiantes grabarán enunciados nuevos. Si usted no sabe grabar datos nuevos, puede usar los enunciados de ejemplo que se facilitaron para la práctica 5, parte B (o "pat" o "bad").

[volver al principio]

Práctica 14: cómo medir los movimientos del habla utilizando datos de un sistema Microbeam de rayos X.

En esta práctica usará los datos grabados por un sistema Microbeam de rayos X. Están disponibles los datos de dos hablantes y se encuentran en formato MATLAB (ficheros .mat):

Datos Microbeam del hablante JW16 (cuatro ficheros .mat en un fichero comprimido)
Datos Microbeam del hablante JW18 (cuatro ficheros .mat en un fichero comprimido)

[volver al principio]

Práctica 15: síntesis de alto nivel con un sintetizador por formantes utilizando parámetros quasi articulatorios.

No hay enunciados para esta clase.

[volver al principio]

Massachusetts Institute of Technology © 2003 MIT | Información Jurídica | Privacidad
Todo uso del sitio de MIT OpenCourseWare y sus materiales de curso queda sujeto a las condiciones y términos de uso detallados
en la sección sobre Información Jurídica
Copyright © 2003 Portal Universia S.A. Todos los derechos reservados
(Avda. de Cantabria s/n - Edif. Arrecife, planta 00.28660 Boadilla del Monte) - Madrid. España.
Contacta con nosotros: Usuarios | Empresas-Instituciones-Medios comunicación
Código Ético | Aviso Legal | Política de confidencialidad | Quiénes somos: Sala de Prensa