Resumen:
Gracias a la comunicación oral el ser humano ha logrado, entre otras cosas, la transmisión de
ideas y conocimientos. Sin embargo, la buena comunicación, independientemente del idioma,
debe ser clara, objetiva y expresiva con el fin de que lo que se quiere expresar sea lo que el
oyente entienda.
Hace algunas décadas se pensaba que educar la voz era asunto de los comentaristas, locutores,
reporteros, entre otros. Hoy en día, sin embargo, no se puede dejar este asunto para aquellas
áreas antes mencionadas sino que cualquier persona necesita hablar un lenguaje correcto, claro
y natural.
El reconocimiento de voz se basa en el estudio sobre el proceso del habla y la comunicación,
y la forma en que este conocimiento puede ser aplicado como herramienta para diversas finalidades.
El enfoque de esta investigación es la aplicación de Modelos Ocultos de Markov con la finalidad
de realizar pruebas de dicción en el idioma español de palabras aisladas. Para ello se
propone el uso de tres diferentes métodos que son modificaciones en la aplicación de Modelos
Ocultos de Markov los cuales son Modelos Ocultos de Markov con DTW (MDTW), Modelos
Ocultos de Markov con DTW aproximado por izquierda y derecha (MID) y Modelos
Ocultos de Markov con relleno de palabras (MRP).
Mediante esta investigación para reconocimiento del habla se hace posible el distinguir entre
calidades de dicción y con una eficiencia de reconocimiento por encima del 90 % para
cualquiera de los métodos propuestos.
Descripción:
By oral communication , human beings have achieved, among other things, the transmission
of ideas and knowledge. However, good communication regardless of the language, should be
clear, objective and expressive so that what is meant is what the listener understands.
A few decades ago it was thought that training the voice was matter of commentators, announcers,
reporters, and others. Today, however, we can’t leave this matter to those areas; instead,
anyone needs to talk a correct, clear and natural language.
Speech recognition is based on the research of the process of speech and communication, and
how this knowledge can be applied as a tool for different purposes.
The focus of this research is the use of Hidden Markov Models in order to perform tests of
diction in the Spanish language on isolated words. To do so, we propose three different methods
which are modifications in the application of Hidden Markov Models which are Hidden
Markov Models with DTW (MDTW), Hidden Markov Models with DTW approximated
by left and right (MID) and Hidden Markov Models filling words (MRP).
Through this research for speech recognition, becomes possible to distinguish between qualities
of diction and a recognition efficiency above 90 % for any of the proposed methods.