Les lèvres parlantes / IMIMA
Copyright
Grandes Image(s): 640*480
Image Jpeg (18 Ko) |
- Institut de la Communication Parlée - CNRS -
Université Stendhal
Projet : Synthèse de visages parlants
URL : http://ophale.icp.grenet.fr/synth.html
Film(s) et Image(s) Extraite(s): 320*240
Film 1 |
Video QuickTime -> |
(2.2 Mo) |
Images Jpeg -> |
(13 Ko) |
Film 2 |
Video QuickTime -> |
(3.0 Mo) |
Images Jpeg -> |
(11 Ko) |
(8 Ko) |
Description
Méthode d'analyse - synthèse de lèvres et visages
parlants
-
-
Mots Clefs :
- Lip-sync automatique
- Analyse-synthèse de visages parlants
- parole bimodale
-
Information d'ordre technique
Analyse d'image, synthèse d'image, synchronisation audio,
naturel-visage synthétique
Complément d'information
Bibliographie
:
cf Actes Imagina 1994, p144-163 : Perception, synthèse et
analyse des lèvres parlantes
Résumé
:
Un acteur virtuel ne peut prétendre à une qualité
"anthropomorphique" que si les mouvements de ses lèvres et de son visage
en général sont cohérents avec le message acoustique qu'il
est censé produirm
e. En effet la modalité auditive est dominante dans la perception de la
parole par les entendants normaux, mais la modalité visuelle leur permet
de mieux comprendre la parole : si l'information visue
lle fournie par les mouvements des lèvres, du menton, des dents, des joues,
etc...n'offre pas en tant que telle une intelligibilité normale de la parole,
en revanche la vue du visage de l'interlocuteur "restitue", par compensation naturelle,
une grande partie de l'information orale manquante quand les conditions de transmission
accoustique sont dégradées.
Nous avons quantifié le gain d'intelligibilité apporté par l'information visuelle à de la parole
dégradée par du bruit sous différentes conditions de test
incluant de la parole naturelle ou synthétique, synchronisée avec un visa
ou à différentes parties d'un visage synthétique (modelé
3D des lèvres de l'ICP et du visage de Parke).
Les paramètres anatomiques et géométriques les plus
caractéristiques de la production et de la perception de la parole
visuelle ont été identifiés à partir de l'analyse
multidimensionnelle d'un très
large corpus du français. Un logiciel d'extraction automatique de ces
paramètres a été implanté sur une station d'acquisition
et de traitement d'images...
Pointeurs
:
- Publications en analyse/synthèse de parole, acoustique et
visuelle
- http://ophale.icp.grenet.fr/publis.html
Commentaires supplementaires
:
ces informations proviennent d'un fax de C.Benoît.
|