NESSR: a Neural Expert System for Speech Recognition. NESSR: un Système Neuroexpert pour la Reconnaissance de la Parole

NESSR: a Neural Expert System for Speech Recognition

NESSR: un Système Neuroexpert pour la Reconnaissance de la Parole

Halima Bahi

Laboratoire LRI, Département d’Informatique, Université de Annaba,Algérie

Page: 
59-67
|
Received: 
19 April 2005
|
Accepted: 
N/A
|
Published: 
28 February 2007
| Citation

OPEN ACCESS

Abstract: 

Artificial neural networks (ANNs) have found applications in large spectrum of fields.Satisfactory results are obtained particularly in classification problems.In speech recognition context,the use of ANNs is hard,this is essentially due to the absence of the temporal aspect in their structure.On the other hand,assuming a speech recognition task,a word could be recognized and well categorized or recognized and badly categorized; so the explanation of the decision is very important.In this paper,we address two limitations of ANNs:the lack of explicit knowledge and the absence of temporal aspect in their implementation.STN:is a model of a specialized temporal neuron,which includes both symbolic and temporal aspects.To illustrate the STN utility,we consider a system for speech recognition; we underline in this paper the explanation aspect of the system.

Résumé

Les réseaux de neurones ont été utilisés dans une large gamme d’applications. En particulier,des résultats satisfaisants ont été observés dans le domaine de la reconnaissance de formes. Toutefois,dans le contexte de la reconnaissance de la parole,l’utilisation des réseaux de neurones est difficile vue l’absence du paramètre temps dans leur structure. D’un autre point de vue,dans une application de reconnaissance de la parole,un mot peut être reconnu et bien classé ou reconnu et mal classé,il est donc impératif de pouvoir expliquer le raisonnement qui a conduit à cette décision.

Dans cet article,nous considérons deux insuffisances des réseaux de neurones artificiels:le manque de connaissances explicites du domaine d’application et l’absence de l’aspect temps dans la structure des réseaux.

À cet effet,nous proposons un modèle de neurone temporel et spécialisé,que nous appelons STN (pour specilized temporal neuron). Ce modèle est ensuite utilisé comme élément de base dans un réseau neuro-symbolique pour la reconnaissance de la parole.

Keywords: 

Artificial intelligence,machine learning,connectionism,speech recognition.

Mots clés 

Intelligence artificielle,réseaux de neurones artificiels,reconnaissance de la parole.

1. Introduction
2. Reconnaissance Automatique de la Parole et Réseaux de Neurones
3. Architecture Générale du Modèle Proposé
4. Le Niveau Acoustique
5. Le Niveau Phonétique
6. La Couche de Décision
7. Résultats Expérimentaux
8. Conclusion
  References

[1] H. BAHI, M. SELLAMI, Système expert connexionniste pour la reconnaissance de la parole,proceedings de RFIA,Vol 2,pp. 659-665, Toulouse, France, 2004. 

[2] C. BECCHITTI,L. p. RICOTTI,Speech recognition:theory and C++ implementation, John Wiley,Angleterre, 1999. 

[3] C. M. BISHOP, Neural networks for pattern recognition, Clarendon Press, Oxford, 1995. 

[4] H. BOURLARD, N. MORGAN, Hybrid HMM/ANN systems for speech recognition: Overview and new research directions, Lecture Notes In Computer Science; Vol. 1387, pp. 389-417, Springer-Verlag, London, UK, 1997. 

[5] S. DURAND,TOM, une architecture connexionniste de traitement de séquences. Application à la reconnaissance de la parole. PhD thesis, Université Henri Poincaré, Nancy I, 1995. 

[6] R. HECHT-NIELSON, Neurocomputing, Addisson-Wesley Publishing Company, 1989. 

[7] W. M. HUANG, R. LIPPMANN, Neural nets and traditional classifiers, Neural information processing systems, Ed. Anderson D., pp. 387-396, New-York, 1988. 

[8] L. RABINER, B. HWANG, Fundamentals of speech recognition, Prentice Hall, 1993. 

[9] R. SUN, F. ALEXANDRE, Connectionist-Symbolic Integration: From Unified to Hybrid Approaches, Lawrence Erlbaum Associates, 1997. 

[10] J. TEBELSKI, Speech recognition using neural networks, PhD thesis, Carnegie Mellon University, 1995. 

[11] E. TRENTIN, E. GORI, A survey of hybrid ANN/HMM models for automatic speech recognition, Neurocomputing 37, Ed. Elsevier, pp. 91-126, 2001. 

[12] A. WAIBEL, T. HANAZAWA, G. HINTON, K. SHIOKANO, K. J. LANG, Phoneme recognition using time-delay neural networks, IEEE Trans. On acoustics,speech,and signal processing,37(3),1989.