Aplicación de modelos ocultos de Markov en pruebas de dicción de palabras aisladas del idioma  español

Pedroza Ramírez, Angel David

Aplicación de modelos ocultos de Markov en pruebas de dicción de palabras aisladas del idioma español

Pedroza Ramírez, Angel David

URI: http://ricaxcan.uaz.edu.mx/jspui/handle/20.500.11845/1774

Fecha: 2015-08-15

Resumen:

Gracias a la comunicación oral el ser humano ha logrado, entre otras cosas, la transmisión de ideas y conocimientos. Sin embargo, la buena comunicación, independientemente del idioma, debe ser clara, objetiva y expresiva con el fin de que lo que se quiere expresar sea lo que el oyente entienda. Hace algunas décadas se pensaba que educar la voz era asunto de los comentaristas, locutores, reporteros, entre otros. Hoy en día, sin embargo, no se puede dejar este asunto para aquellas áreas antes mencionadas sino que cualquier persona necesita hablar un lenguaje correcto, claro y natural. El reconocimiento de voz se basa en el estudio sobre el proceso del habla y la comunicación, y la forma en que este conocimiento puede ser aplicado como herramienta para diversas finalidades. El enfoque de esta investigación es la aplicación de Modelos Ocultos de Markov con la finalidad de realizar pruebas de dicción en el idioma español de palabras aisladas. Para ello se propone el uso de tres diferentes métodos que son modificaciones en la aplicación de Modelos Ocultos de Markov los cuales son Modelos Ocultos de Markov con DTW (MDTW), Modelos Ocultos de Markov con DTW aproximado por izquierda y derecha (MID) y Modelos Ocultos de Markov con relleno de palabras (MRP). Mediante esta investigación para reconocimiento del habla se hace posible el distinguir entre calidades de dicción y con una eficiencia de reconocimiento por encima del 90 % para cualquiera de los métodos propuestos.

Descripción:

By oral communication , human beings have achieved, among other things, the transmission of ideas and knowledge. However, good communication regardless of the language, should be clear, objective and expressive so that what is meant is what the listener understands. A few decades ago it was thought that training the voice was matter of commentators, announcers, reporters, and others. Today, however, we can’t leave this matter to those areas; instead, anyone needs to talk a correct, clear and natural language. Speech recognition is based on the research of the process of speech and communication, and how this knowledge can be applied as a tool for different purposes. The focus of this research is the use of Hidden Markov Models in order to perform tests of diction in the Spanish language on isolated words. To do so, we propose three different methods which are modifications in the application of Hidden Markov Models which are Hidden Markov Models with DTW (MDTW), Hidden Markov Models with DTW approximated by left and right (MID) and Hidden Markov Models filling words (MRP). Through this research for speech recognition, becomes possible to distinguish between qualities of diction and a recognition efficiency above 90 % for any of the proposed methods.

Mostrar el registro completo del ítem