Los
estudiantes se dispondrán en grupos de 2 ó 3 miembros. Las sesiones
de prácticas suelen durar de 2 a 3 horas. Se facilitarán series
de lecturas para cada práctica, con el fin de tenerlas leídas antes
de clase. Algunas lecturas se encuentran en el libro de texto. El resto se les
entregarán en los boletines.
En clase se tratarán
temas relacionados con las prácticas, dentro de las siguientes áreas:
Acústica y análisis acústico
del habla Fisiología de la producción del habla Fenómenos
a nivel de oraciones La percepción del habla Trastornos del habla
Síntesis y reconocimiento de voz
Trabajos
escritos
Breve informe sobre cada práctica:
resuma e interprete los resultados que obtuvo, sin entrar en detalles acerca del
método empleado. El informe deberá entregarse en clase el día
siguiente a la práctica.
Trabajo breve: elija
un tema a mitad de semestre en el que proponga un experimento limitado; un informe
oral sobre los resultados durante las útimas clases del curso; entregue
una versión por escrito (en el mismo formato del Journal of the Acoustical
Society) al final del curso.
No habrá examen:
el 40% de la nota provendrá del trabajo final y el resto de la misma se
basará en los informes de las prácticas y en la participación
en clase.
Otros libros de
consulta
J.L. Flanagan, Speech Analysis, Synthesis
and Perception, Springer-Verlag, 1972
N.
Chomsky y M. Halle, The Sound Pattern of English, Harper and Row, 1968
L. Beranek, Acoustics, Wiley, 1954
D.
O'Shaughnessy, Speech Communications: Human and Machine, 2ª ed. IEEE
Press, 2000
W.J. Hardcastle y J. Laver, The
Handbook of Phonetic Sciences, Blackwell, 1997
Kent,
Atal y Miller (eds). Papers in Speech Communication: Speech Production
Miller, Kent y Atal (eds). Papers in Speech
Communication: Speech Perception
Atal, Miller
y Kent (eds). Papers in Speech Communication: Speech Processing
Los
tres últimos libros han sido publicados por Acoustical Society of America
(1991).
La cadena del habla
El estudio del habla se ha venido tratando normalmente como el estudio de una
cadena de eventos que comienza por lo que pasa por el cerebro de un hablante cuando
éste se dispone a emitir un enunciado, trasladándose por la acústica
del habla y acabando con los pasos que se suceden en el cerebro del oyente, que
dan como resultado la comprensión del mensaje emitido.
Este enfoque aclara la diversidad de temas que
uno debe entender con cierta profundidad para llevar a cabo una investigación
básica en temas relacionados con el habla.
Diversidad
de temas que se relacionan con la investigación del habla
Lingüística
Semántica el significado de las
palabras y las relaciones entre ellas.
Sintaxis
el orden de las palabras, el papel de los conectores o palabras funcionales.
Fonología segmentos fonémicos
individuales, rasgos, vocales acentuadas y no acentuadas.
Por ejemplo,
¿Cuál es el inventario
fonémico del inglés?
¿Cómo
funciona? El concepto de contraste o pares mínimos (ej. pat vs bat).
¿Por
qué pensamos que es psicológicamente real?
¿Por
qué el mismo fonema da lugar a diferentes realizaciones acústicas
en enunciados distintos? (Ej., en un discurso fluido, en la oración "Joe
ate his soup", se pierde la /h/ de "his" y la /t/ de "ate"
no se parece a la /t/ de "Tom").
¿Cuáles
son los principios que llevan a modificaciones de los segmentos en diferentes
entornos?
¿Cómo se traducen los
fonemas a representaciones fonéticas normalmente descritas como rasgos?
(Ej., /z/ es + sonora, /s/ es - sonora; la misma relación se da en pares
como f-v; los patrones de sonidos quedan perfectamente capturados por el concepto
rasgo). Se pretenden relacionar temas de lingüística
con datos sobre el análisis acústico, con los mecanismos de la producción
del habla humana y el procesamiento del habla. Sin embargo, esto no es para nada
tarea fácil.
Fisiología
de la producción del habla. Estructuras capaces de generar y modificar
los sonidos del habla.
Acústica
General
(fuentes de sonido; vocales conseguidas por vibración de las cuerdas vocales;
algunos sonidos se producen con turbulencia de la fuente de sonido; diferencias
entre vocales por cambio en el tamaño y la forma del tracto vocal).
Características resonantes del tracto vocal.
Propagación del sonido en los labios.
La acústica de los sonidos del habla cuando
van a través del aire.
Fonética
acústica. Descripción de los atributos importantes de los sonidos
del habla, particularmente de los sonidos del inglés; también la
prosodia (es decir, duraciones, frecuencia fundamental de la vibración
de las cuerdas vocales, amplitud).
Sistema nervioso
auditivo
El oído medio e interno del
sistema nervioso periférico; progresos recientes obtenidos al grabar
señales procedentes del oído de un gato. Podemos decir que conocemos
bastante bien ese código. Tiene implicaciones a la hora de decidir qué
propiedades acústicas de los sonidos del habla pueden discriminarse.
Sistema nervioso central Conocemos poco de
éste, se confía mayormente en la Psicofísica y en la Psicología
Cognitiva.
Psicofísica y psicología
cognitiva
Estas disciplinas se centran en los estudios
de las respuestas de las personas a sonidos simples y complejos (nos revelan muchas
cosas, pero dejan muchas otras por conocer).
Resumen
de los temas más importantes para la investigación del habla
Lingüística
Fisiología
de la producción del habla y sistemas de percepción
Acústica
general
Características acústicas
de los sonidos del habla
Psicofísica y
el sistema auditivo
Psicología Cognitiva
Computación y algoritmos computacionales
En este curso se hará hincapié en el uso de algoritmos computacionales,
en su potencia individual y en sus puntos débiles, y no en los aspectos
matemáticos de los algoritmos en sí. (Libros de consulta disponibles).
Servicio
informático disponible
La mayoría de
los laboratorios de prácticas que usan ordenadores tendrán Linux
como sistema operativo. En algunas prácticas necesitaremos grabar materiales
de habla con ordenadores Vax.
El nombre de la cuenta
del PC es labc; en el ordenador Vax, es labcourse. Las contraseñas son:
-------------------------------------------
en el PC
------------------------------------------
en el Vax
Temas a tratar
A.
Introducción
1: organización;
la cadena del habla. Cómo grabar la voz en una habitación insonorizada;
la teoría acústica; NPS (Nivel de presión sonora); dB (decibelios).
Digitalización, edición de la forma de onda y análisis espectral
mediante el uso del ordenador; teorema del muestreo, visualización de la
forma de onda.
B. Análisis acústico
de vocales y consonantes
2: análisis
espectral en banda ancha de las vocales del inglés; funciones de transferencia
del tracto vocal para las vocales; nasalización de las vocales. Cap. 3,
cap. 6.
3: análisis espectral en banda
ancha de las consonantes sonorantes del inglés; nasales, líquidas
y glides; fuentes de sonido y funciones de transferencia para las consonantes.
Cap. 9.
4: generación de sonido con fricción
en el tracto vocal; análisis espectral de consonantes fricativas y oclusivas;
ruido de fricación y de aspiración. Cap. 7, cap. 8.
5:
generación de sonido en la laringe; filtrado inverso y espectro de la fuente
glotal; resultado de la fuente glotal sobre las vocales del espectro. Cap. 2.
C.
Teoría cuántica y rasgos
6: naturaleza
cuántica de las relaciones articulatorias y acústicas; teoría
cuántica sobre el lugar de articulación de las consonantes y de
las vocales.
D. Fenónemos a nivel
de oración
7: duración
de las vocales y consonantes en la oración; reglas de duración para
el inglés.
8: fenómenos de reducción
y asimilación en el discurso fluido; resultados del acento. Cap. 10.
9: prosodia en la oración; medición
e interpretación de los contornos de frecuencia fundamental, restricciones
respiratorias.
E. Percepción del habla
10: evaluación de la inteligibilidad del segmento;
inteligibilidad, comprensión, naturalidad, carga cognitiva de las palabras
en las oraciones.
F. Trastornos del habla
11: trastornos del habla. Análisis e interpretación
del habla de niños con trastornos articulatorios.
12:
trastornos del habla. Análisis de consonantes, vocales y características
pasajeras de hablantes con trastornos neuromotores.
G.
Movimientos del habla, flujo de aire
13:
interpretación de películas cinerradiográficas; anatomía
y fisiología del aparato de producción del habla. Cap. 1.
14:
estudios sobre los movimientos del habla; análisis de los movimientos de
la mandíbula y de los labios en la pronunciación de consonantes
oclusivas. Cap. 1.
15: presión de la
boca, flujo y respiración durante el habla; análisis e interpretación
de flujos y presiones durante la pronunciación de consonantes seleccionadas.
H. Síntesis y reconocimiento
de voz
16: síntesis de
voz mediante el uso de un sintetizador por formantes; evaluación de la
teoría acústica de la producción de habla, síntesis
por formantes; cómo sintetizar por sílabas.
17:
síntesis de alto nivel con un sintetizador por formantes utilizando parámetros
quasi-articulatorios.
18: prolongación
de las prácticas de síntesis de voz.
19:
elección de un tema para el proyecto final de investigación individual;
cada estudiante describirá su propuesta de investigación.
20:
utilización de puntos de referencia y rasgos
en reconocimiento de voz; etiquetado de oraciones; reglas para la modificación
de rasgos.
I. Proyectos finales
21: Proyecto final de investigación
individual; no habrá clase ni práctica.
22:
Proyecto final de investigación individual; no habrá clase ni práctica.
23: Proyecto final de investigación individual;
no habrá clase ni práctica.
24:
Informes orales sobre los resultados del proyecto final.
25:
Informes orales sobre los resultados del proyecto final.
26:
Informes orales sobre los resultados del proyecto final.
Información
Jurídica |Privacidad Todo uso del sitio de MIT OpenCourseWare y sus
materiales de curso queda sujeto a las condiciones y términos de
uso detallados
en la sección sobre Información Jurídica
Los documentos en este portal son considerados valiosos por muchos de nuestros usuarios, por lo que hemos decidido mantenerlos como información histórica