| |
Base de datos de las prácticasEsta
página contiene ficheros de media digitalizados para que los pueda usar
en las prácticas. La mayoría de los ficheros son datos de audio,
pero hay también ficheros con imágenes y otros tipos de datos.
Para algunas de las prácticas, le pediremos
que grabe su propia voz. Si no se ha hecho con las herramientas para realizar
estas grabaciones, le damos ejemplos de enunciados emitidos por un hablante de
sexo femenino y por otro de sexo masculino. Los ficheros de audio se muestran
más abajo asociados a su práctica. Datos
de las prácticas: 1 | 2 | 3
| 4 | 5 | 6 | 7
| 8 | 9 | 10 | 11
| 12 | 13 | 14
| 15 Práctica
1: cómo grabar la voz en una habitación tratada acústicamente.
Análisis espectral y edición de la forma de onda por ordenador.En
la práctica 1 grabará una base de datos de enunciados de voz para
que pueda utilizarla a lo largo del semestre. A continuación tiene una
serie de enlaces a bases de datos de muestra grabadas por dos hablantes, uno de
sexo femenino (HH) y otro de sexo masculino (KS). Dése
cuenta de que aunque estos ficheros tienen un sufijo .wav, están en formato
Klatt para poder ser usados con las herramientas de análisis de voz de
Klatt (xkl); NO están en el formato .wav de Microsoft. (Si tiene interés
en usar estos ficheros con herramientas de análisis que requieran el formato
.wav de MS, lo tendremos en cuenta y en el futuro se facilitarán ambos
formatos). Puede descargarse los ficheros
tar de una base de datos completa aquí: base
de datos de muestra de una voz femenina base
de datos de muestra de una voz masculina Los
ficheros individuales pueden descargarse haciendo clic en los enlaces que se muestran
a continuación: -
Vocales del inglés
- Consonantes
del inglés
-
Oraciones
-
pasaje de Rainbow, voz femenina
pasaje
de Rainbow, voz masculina
-
discurso
espontáneo, voz femenina
discurso
espontáneo, voz masculina [volver
al principio] Práctica
2: estudio espectrográfico y análisis del espectro del sistema
vocálico del inglés. Utilizará
los siguientes enunciados de voz que fueron grabados durante la práctica
1: - la palabra "shutter"
- los
pares de vocales simples (Puntos 1-7)
[volver
al principio] Práctica
3: análisis espectral en banda ancha de las consonantes sonorantes.
Utilizará
al menos uno de los siguientes subgrupos de enunciados de voz grabados durante
la práctica 1: - Las
palabras "mug", "nut", y "sung"
- Las
palabras "rug" y "lug"
-
Las palabras "wonder" y "young"
[volver
al principio] Práctica
4 : análisis espectral de consonantes oclusivas y fricativas: generación
de sonido cuando se produce fricción en el tracto vocal.Utilizará
al menos uno de los siguientes subgrupos de enunciados de voz grabados durante
la práctica 1: - Las
palabras "bug", "duck", "gut", "putt",
"tug", "cut", "hut"
- Las
palabras "fuss", "thug", "supper", "shutter",
"vanilla", "the", /z
/,
/ /
- Las palabras "chump", "jump",
"tug", "duck", "shutter", /
 /
[volver al principio]
Práctica
5 : generación de sonido en la laringe: características de la
fuente glotal.[volver
al principio] Práctica
6: cálculos
de frecuencia de formantes a partir de datos de función del área.
No se necesitan enunciados de
voz para esta práctica. [volver
al principio] Práctica
7: reducción del segmento de sonido.
Utilizará
el discurso espontáneo que se grabó durante la práctica
1. Si no tiene sus propias grabaciones, puede descargar
muestras de discurso que contienen claras interpretaciones de varias palabras,
con más interpretaciones de las mismas producidas con segmentos reducidos.
El fichero tar presenta ejemplos de los mismos hablantes masculino y femenino
(KS y HH) que grabaron las muestras de discursos para la práctica 1. Descargue
los ejemplos de la práctica 7 (formato xkl) aquí. (fichero zip/tar) [volver
al principio] Práctica
8: prosodia: pruebas acústicas para la estructura prosódica
del constituyente.Utilizará los siguientes
enunciados emitidos por cuatro hablantes y guardados en la cuenta labc:
- Parte A: por favor diga Maine or Duke and Rice will
play.
- Parte B: por favor diga Thomas or Kenneth
and Lucas will stay.
Cada oración ha sido
emitida con dos formas prosódicas distintas, y cada forma prosódica
ha sido emitida dos veces por cada hablante para un total de 32 enunciados. Los
enunciados están disponibles en dos formatos, Xwaves (ficheros .sd y .f0)
y Xkl (ficheros .wav de Klatt). Descargue
un fichero tar/zip con los enunciados de voz que se necesitan para esta clase
práctica. [volver al principio]
Práctica
9: etiquetado de entonación O factores que afectan a la duración.Utilizará
los enunciados de voz para la parte A o aquellos para la parte B: - Parte
A:
1) Enunciados 3 a 10 en los ficheros lcorn.16k (formato Xwaves), que se
encuentran en la cuenta labc (Descargue de aquí los ficheros lcorn.16k
y lcorn.f0)
2) Enunciados de la práctica 8, Parte A - Parte
B:
Las siguientes palabras, grabadas por dos hablantes: "fat",
"fad", "fade", "cup", "cub", "coop",
"pick", "pig", "peak", "men", "main',
"mate", "tuck", "tug", "take". Estos archivos
están en dos formatos, Xwaves (ficheros .sd) y Xkl (ficheros .wav de Klatt).
(Descargue aquí un archivo con los
enunciados). [volver al principio]
Práctica
10: inteligibilidad del habla y matrices de confusión.En
esta práctica usted participará como sujeto en dos tipos de tests
de inteligibilidad. Si asiste a la clase práctica escuchará los
estímulos en una cinta de audio. Si no asiste a clase puede bajarse los
archivos de audio de los tests que verá a continuación. Para ejecutar
los tests por su cuenta, tendrá que bajarse las hojas
para las respuestas y las respuestas en sí, de la página
de la Práctica 10. Hay un tercer tipo
de test disponible, aunque no se ha presentado en clase. Tendrá que bajar
las hojas para las respuestas y las hojas con las respuestas de la página
de la práctica 10. [volver
al principio] Práctica
11: introducción a los trastornos del habla.Utilizará
enunciados producidos por niños y adultos con diferentes tipos de trastornos
de habla. Todos se encuentran en formato Xkl (Klatt .wav ): [volver
al principio] Práctica
12: interpretación de películas cinerradiográficas de
enunciados seleccionados.En esta práctica
utilizará ficheros .gif de imágenes cinerradiográficas. Dado
que la base de datos en su totalidad es bastante grande, sólo estará
a disposición de los estudiantes que asistan a la clase práctica.
Los ficheros .gif de ejemplo pueden descargarse aquí: descargue
archivo KNS_6400995.gif, /a/ en "he'tat" descargue
el archivo KNS 6401423.gif, /a/ en "soggy" descargue
el archivo KNS_6400919.gif, /u/ en "he'tu" descargue
el archivo KNS_6401621.gif, /u/ en "shoes" [volver
al principio] Práctica
13: síntesis de voz mediante el uso de un sintetizador por formantes.Para
esta práctica los estudiantes grabarán enunciados nuevos. Si usted
no sabe grabar datos nuevos, puede usar los enunciados de ejemplo que se facilitaron
para la práctica 5, parte B (o "pat" o "bad"). [volver
al principio] Práctica
14: cómo medir los movimientos del habla utilizando datos de un
sistema Microbeam de rayos X.En esta
práctica usará los datos grabados por un sistema
Microbeam de rayos X. Están disponibles los datos de dos hablantes
y se encuentran en formato MATLAB (ficheros .mat): Datos
Microbeam del hablante
JW16 (cuatro ficheros .mat en un fichero
comprimido) Datos Microbeam del hablante
JW18 (cuatro ficheros .mat en un fichero
comprimido) [volver al principio]
Práctica
15: síntesis de alto nivel con un sintetizador por formantes utilizando
parámetros quasi articulatorios.No hay enunciados
para esta clase. [volver al principio]
|