MIT OpenCourseWare


6.542J Curso práctico en fisiología, acústica y percepción del discurso.

 
 
Página principal del curso
Programa
Horario de prácticas
Lecturas obligatorias
Software para las prácticas
Base de datos para las prácticas
 Proyectos

   MIT

  
 

Programa

versión para imprimir (PDF)

Organización del curso: clases y prácticas

2 clases de 1 hora a la semana

2 prácticas a la semana

Los estudiantes se dispondrán en grupos de 2 ó 3 miembros. Las sesiones de prácticas suelen durar de 2 a 3 horas. Se facilitarán series de lecturas para cada práctica, con el fin de tenerlas leídas antes de clase. Algunas lecturas se encuentran en el libro de texto. El resto se les entregarán en los boletines.

En clase se tratarán temas relacionados con las prácticas, dentro de las siguientes áreas:

Acústica y análisis acústico del habla
Fisiología de la producción del habla
Fenómenos a nivel de oraciones
La percepción del habla
Trastornos del habla
Síntesis y reconocimiento de voz

Trabajos escritos

Breve informe sobre cada práctica: resuma e interprete los resultados que obtuvo, sin entrar en detalles acerca del método empleado. El informe deberá entregarse en clase el día siguiente a la práctica.

Trabajo breve: elija un tema a mitad de semestre en el que proponga un experimento limitado; un informe oral sobre los resultados durante las útimas clases del curso; entregue una versión por escrito (en el mismo formato del Journal of the Acoustical Society) al final del curso.

No habrá examen: el 40% de la nota provendrá del trabajo final y el resto de la misma se basará en los informes de las prácticas y en la participación en clase.

 

Otros libros de consulta

  • J.L. Flanagan, Speech Analysis, Synthesis and Perception, Springer-Verlag, 1972
  • N. Chomsky y M. Halle, The Sound Pattern of English, Harper and Row, 1968
  • L. Beranek, Acoustics, Wiley, 1954
  • D. O'Shaughnessy, Speech Communications: Human and Machine, 2ª ed. IEEE Press, 2000
  • W.J. Hardcastle y J. Laver, The Handbook of Phonetic Sciences, Blackwell, 1997
  • Kent, Atal y Miller (eds). Papers in Speech Communication: Speech Production
  • Miller, Kent y Atal (eds). Papers in Speech Communication: Speech Perception
  • Atal, Miller y Kent (eds). Papers in Speech Communication: Speech Processing

Los tres últimos libros han sido publicados por Acoustical Society of America (1991).

La cadena del habla

El estudio del habla se ha venido tratando normalmente como el estudio de una cadena de eventos que comienza por lo que pasa por el cerebro de un hablante cuando éste se dispone a emitir un enunciado, trasladándose por la acústica del habla y acabando con los pasos que se suceden en el cerebro del oyente, que dan como resultado la comprensión del mensaje emitido.

The Speech Chain Diagram

Este enfoque aclara la diversidad de temas que uno debe entender con cierta profundidad para llevar a cabo una investigación básica en temas relacionados con el habla.

Diversidad de temas que se relacionan con la investigación del habla

Lingüística

  • Semántica el significado de las palabras y las relaciones entre ellas.
  • Sintaxis el orden de las palabras, el papel de los conectores o palabras funcionales.
  • Fonología segmentos fonémicos individuales, rasgos, vocales acentuadas y no acentuadas.

    Por ejemplo,

    • ¿Cuál es el inventario fonémico del inglés?
    • ¿Cómo funciona? El concepto de contraste o pares mínimos (ej. pat vs bat).
    • ¿Por qué pensamos que es psicológicamente real?
    • ¿Por qué el mismo fonema da lugar a diferentes realizaciones acústicas en enunciados distintos? (Ej., en un discurso fluido, en la oración "Joe ate his soup", se pierde la /h/ de "his" y la /t/ de "ate" no se parece a la /t/ de "Tom").
    • ¿Cuáles son los principios que llevan a modificaciones de los segmentos en diferentes entornos?
    • ¿Cómo se traducen los fonemas a representaciones fonéticas normalmente descritas como rasgos? (Ej., /z/ es + sonora, /s/ es - sonora; la misma relación se da en pares como f-v; los patrones de sonidos quedan perfectamente capturados por el concepto rasgo).
      Se pretenden relacionar temas de lingüística con datos sobre el análisis acústico, con los mecanismos de la producción del habla humana y el procesamiento del habla. Sin embargo, esto no es para nada tarea fácil.

Fisiología de la producción del habla. Estructuras capaces de generar y modificar los sonidos del habla.

Acústica

  • General (fuentes de sonido; vocales conseguidas por vibración de las cuerdas vocales; algunos sonidos se producen con turbulencia de la fuente de sonido; diferencias entre vocales por cambio en el tamaño y la forma del tracto vocal).
  • Características resonantes del tracto vocal.
  • Propagación del sonido en los labios.
  • La acústica de los sonidos del habla cuando van a través del aire.

Fonética acústica. Descripción de los atributos importantes de los sonidos del habla, particularmente de los sonidos del inglés; también la prosodia (es decir, duraciones, frecuencia fundamental de la vibración de las cuerdas vocales, amplitud).


Sistema nervioso auditivo

  • El oído medio e interno del sistema nervioso periférico; progresos recientes obtenidos al grabar señales procedentes del oído de un gato. Podemos decir que conocemos bastante bien ese código. Tiene implicaciones a la hora de decidir qué propiedades acústicas de los sonidos del habla pueden discriminarse.
  • Sistema nervioso central Conocemos poco de éste, se confía mayormente en la Psicofísica y en la Psicología Cognitiva.

Psicofísica y psicología cognitiva

Estas disciplinas se centran en los estudios de las respuestas de las personas a sonidos simples y complejos (nos revelan muchas cosas, pero dejan muchas otras por conocer).

Resumen de los temas más importantes para la investigación del habla

  • Lingüística
  • Fisiología de la producción del habla y sistemas de percepción
  • Acústica general
  • Características acústicas de los sonidos del habla
  • Psicofísica y el sistema auditivo
  • Psicología Cognitiva
  • Computación y algoritmos computacionales
    En este curso se hará hincapié en el uso de algoritmos computacionales, en su potencia individual y en sus puntos débiles, y no en los aspectos matemáticos de los algoritmos en sí. (Libros de consulta disponibles).

Servicio informático disponible

La mayoría de los laboratorios de prácticas que usan ordenadores tendrán Linux como sistema operativo. En algunas prácticas necesitaremos grabar materiales de habla con ordenadores Vax.

El nombre de la cuenta del PC es labc; en el ordenador Vax, es labcourse. Las contraseñas son:

------------------------------------------- en el PC

------------------------------------------ en el Vax

Temas a tratar

A. Introducción

  • 1: organización; la cadena del habla. Cómo grabar la voz en una habitación insonorizada; la teoría acústica; NPS (Nivel de presión sonora); dB (decibelios). Digitalización, edición de la forma de onda y análisis espectral mediante el uso del ordenador; teorema del muestreo, visualización de la forma de onda.

B. Análisis acústico de vocales y consonantes

  • 2: análisis espectral en banda ancha de las vocales del inglés; funciones de transferencia del tracto vocal para las vocales; nasalización de las vocales. Cap. 3, cap. 6.
  • 3: análisis espectral en banda ancha de las consonantes sonorantes del inglés; nasales, líquidas y glides; fuentes de sonido y funciones de transferencia para las consonantes. Cap. 9.
  • 4: generación de sonido con fricción en el tracto vocal; análisis espectral de consonantes fricativas y oclusivas; ruido de fricación y de aspiración. Cap. 7, cap. 8.
  • 5: generación de sonido en la laringe; filtrado inverso y espectro de la fuente glotal; resultado de la fuente glotal sobre las vocales del espectro. Cap. 2.

C. Teoría cuántica y rasgos

  • 6: naturaleza cuántica de las relaciones articulatorias y acústicas; teoría cuántica sobre el lugar de articulación de las consonantes y de las vocales.

D. Fenónemos a nivel de oración

  • 7: duración de las vocales y consonantes en la oración; reglas de duración para el inglés.
  • 8: fenómenos de reducción y asimilación en el discurso fluido; resultados del acento. Cap. 10.
  • 9: prosodia en la oración; medición e interpretación de los contornos de frecuencia fundamental, restricciones respiratorias.

E. Percepción del habla

  • 10: evaluación de la inteligibilidad del segmento; inteligibilidad, comprensión, naturalidad, carga cognitiva de las palabras en las oraciones.

F. Trastornos del habla

  • 11: trastornos del habla. Análisis e interpretación del habla de niños con trastornos articulatorios.
  • 12: trastornos del habla. Análisis de consonantes, vocales y características pasajeras de hablantes con trastornos neuromotores.

G. Movimientos del habla, flujo de aire

  • 13: interpretación de películas cinerradiográficas; anatomía y fisiología del aparato de producción del habla. Cap. 1.
  • 14: estudios sobre los movimientos del habla; análisis de los movimientos de la mandíbula y de los labios en la pronunciación de consonantes oclusivas. Cap. 1.
  • 15: presión de la boca, flujo y respiración durante el habla; análisis e interpretación de flujos y presiones durante la pronunciación de consonantes seleccionadas.

H. Síntesis y reconocimiento de voz

  • 16: síntesis de voz mediante el uso de un sintetizador por formantes; evaluación de la teoría acústica de la producción de habla, síntesis por formantes; cómo sintetizar por sílabas.
  • 17: síntesis de alto nivel con un sintetizador por formantes utilizando parámetros quasi-articulatorios.
  • 18: prolongación de las prácticas de síntesis de voz.
  • 19: elección de un tema para el proyecto final de investigación individual; cada estudiante describirá su propuesta de investigación.
  • 20: utilización de puntos de referencia y rasgos en reconocimiento de voz; etiquetado de oraciones; reglas para la modificación de rasgos.

I. Proyectos finales

  • 21: Proyecto final de investigación individual; no habrá clase ni práctica.
  • 22: Proyecto final de investigación individual; no habrá clase ni práctica.
  • 23: Proyecto final de investigación individual; no habrá clase ni práctica.
  • 24: Informes orales sobre los resultados del proyecto final.
  • 25: Informes orales sobre los resultados del proyecto final.
  • 26: Informes orales sobre los resultados del proyecto final.

Información Jurídica | Privacidad
Todo uso del sitio de MIT OpenCourseWare y sus materiales de curso queda sujeto a las condiciones y términos de uso detallados
en la sección sobre Información Jurídica

Los documentos en este portal son considerados valiosos por muchos de nuestros usuarios, por lo que hemos decidido mantenerlos como información histórica

Contacta con nosotros: Usuarios | Empresas-Instituciones-Medios comunicación
Código Ético | Aviso Legal | Política de confidencialidad | Quiénes somos: Sala de Prensa