PDA

Ver la Versión Completa : Reconocimiento de Voz (traducir de voz a palabras)


barrauda
31-03-2008, 16:13:12
Hola amigos, necesito preguntarles si es posible en Delphi hacer algún reconociemiento de voz que me traduzca de voz a comandos.
Por ejemplo: yo digo "hola" en el micrófono y que me aparezca escrito en un edit dicha palabra.
Muchas gracias por el dato

cHackAll
01-04-2008, 19:05:37
Desconozco las técnicas más actuales, pero se puede inducir una; cuando se utilizaba el Dragon Speak u otros uno debía dictarle una y otra vez un párrafo CONOCIDO al programa, hasta que el mismo reconozca tu voz. Esto significa que al dictarle una y otra vez el programa creaba asociaciones entre una onda y una frase finalmente desglosada en una palabra.

Con tal idea tenemos una palabra "hola" equivaldría a un vector, el cual posteriormente puede ser comparado con otro vector ya reconocido... el cual diferencia/error mínima equivaldria a la palabra que "suena como" más aproximada.

Saludos

Delphius
01-04-2008, 19:14:12
barrauda, espero que tengas a manos un chaleco anti-balas porque donde te estás metiendo es un tiroteo y vaya a saber uno si sale vivo de eso...

Puede que exista una posibilidad de que en Torry.net encuentres algún componente que te asista en esto.

Yo la verdad del tema no se, pero por lo poco que he conocido del tema (fue en una de las conferencias de las JAIIO, concretamente la 33ª), no me animaría... si no pude entender un vúmetro, menos voy a poder con algo como el reconocimiento de voz.

¿Ya Googleaste? Si no lo hiciste, hazlo... lamento no poder serte de ayuda. Pero para cosas como estas, San Google es el mejor asistente que vas a encontrar. Como consejo, mejor desiste de la idea de buscar en castellano.

Que tengas éxito, y que San Google te proteja!
Saludos,

gatosoft
02-04-2008, 00:12:32
Bueno Barrauda,

No creo que haya un componente en delphi (publicado) que te haga eso... Es por ley de probabilidades:

Probabilidad de que alguien que sepa delphi y maneje el tema haya hecho un componente (en delphi) y haya decidido publicarlo o venderlo...

pero como dice nuestro amigo Delphius, tal vez consigas por ahi algo que te ayude.

Pero tomando tu pregunta al pie de la letra ("¿es posible en Delphi hacer algún reconociemiento de voz que me traduzca de voz a comandos?") te digo que si es posible...

Pero para esto necesitas:

1. capturar la señal del microfono (se puede hacer en delphi)
2. convertirla en un archivo de audio.
3. leer el archivo de audio y convertir las ondas en datos numéricos
4. Analizar las señales (numeros) (con Transformada de Fourier o con Redes neuronales).
5. y listo..!

Existe un libro de la editorial alfa omega que tare ejemplos en pascal..!!!!

Este libro todavia lo puedes conseguir en la red (Editorial Alfa Omega), pero la verdad es que no se consigue... yo lo encontré en la biblioteca de mi universidad...

Saludos,


RECONOCIMIENTO DE VOZ Y FONÉTICA ACÚSTICA

BERNAL, Jesús; BOBADILLA, Jesús y GÓMEZ, Pedro
356 págs.
Rústica, 17 x 23 cm
ISBN 970-15-0541-7
Coedición: Alfaomega-Rama


Es una introducción al campo de la fonética acústica y tratamiento de voz. Un libro dirigido a lingüistas, fonetistas, informáticos, ingenieros y gente interesada en el tema. Aborda desde conceptos básicos del reconocimiento del habla, métodos y técnicas empleadas en los reconocedores de voz, la producción de la voz humana, pasando por los métodos para traspasar la señal de voz desde el dominio del tiempo al de la frecuencia con la Transformada de Fourier, hasta los principios y funcionamiento de las redes neuronales artificiales.

Incluye numerosos ejemplos, listados de programas, espectros de sonidos y gráficos representativos.

Describe conceptos fundamentales sobre el tratamiento digital de la señal de voz: procesamiento de la voz en el dominio del tiempo, estimación espectral por predicción lineal, banco de filtros, técnicas de cuantificación, entre otros.

Contiene el código fuente y las figuras del libro.

Resumen del contenido:

Conceptos generales - Introducción a la naturaleza, producción y percepción de la voz humana - Fonética acústica - Estudio de los sonidos basado en posiciones de formantes - Fundamentos del tratamiento digital de la señal de voz - La transformada de Fourier - Fundamentos informáticos relacionados con el tratamiento de voz - Aplicaciones informáticas del procesamiento de voz - Principios básicos sobre redes neuronales - Apéndice.