El curso 6.345 pertenece al grupo
de Ingeniería bioeléctrica del departamento.
Presenta una serie completa de clases
tipo transparencia, junto con muestras de discurso,
además de trabajos
para casa y otros materiales utilizados en
el curso.
Descripción del curso
El curso 6.345 inicia al estudiante
en un campo de creciente y rápido desarrollo,
como es el reconocimiento automático del habla.
Su contenido se divide en tres partes. La 1ª parte
se centra en los antecedentes de la teoría acústica
de la producción del habla, en la fonética-acústica
y en la representación de la señal. La
2ª parte describe los aspectos algorítmicos
de los sistemas de reconocimiento del habla, entre los
que se incluyen la clasificación de patrones,
algoritmos de búsqueda, modelos estocásticos
y técnicas de modelado del lenguaje. La 3ª
parte compara y contrasta los distintos enfoques para
el reconocimiento del habla y define las técnicas
avanzadas que se utilizan en el modelado fonético-acústico,
el reconocimiento robusto del habla, la adaptación
del hablante, el procesamiento de información
paralingüística, la comprensión del
discurso y el procesamiento multimodal.
RealOne™ es una marca comercial o una marca comercial
registrada de RealNetworks, Inc.
QuickTime® es una marca comercial de Apple Computer,
Inc., registrada en los EE.UU. y otros países.
Windows Media® es una marca comercial registrada
o marca comercial de Microsoft Corporation en los EE.UU.
y/o en otros países.
Información
Jurídica |Privacidad Todo uso del sitio de MIT OpenCourseWare y sus
materiales de curso queda sujeto a las condiciones y términos de
uso detallados
en la sección sobre Información Jurídica
Los documentos en este portal son considerados valiosos por muchos de nuestros usuarios, por lo que hemos decidido mantenerlos como información histórica