Performance d'autres mesures de la qualité de la parole

Next: Évaluation de la qualité Up: La mesure de la Previous: Évaluation de la qualité Contents Index

Performance d'autres mesures de la qualité de la parole

À présent, pour avoir une idée de la performance des mesures objectives connues de qualité de la parole ; nous avons rassemblé dans cette section quelques données et figures de la littérature pour l'illustration. Les résultats rapportés sont présentés en deux groupes : le premier montre la performance de ces mesures à évaluer la qualité quand seulement les paramètres de codage sont considérés ; dans le second elles sont employées en prenant en compte les paramètres de codage et de réseau. Selon les données disponibles, les mesures comparées sont SNR, SNRseg, BSD, MBSD, EMBSD, PSQM, PSQM+, MNB(1,2), E-modèle et PAMS. Voir la version anglaise, section 3.1, pour plus de détails.

**Table:** Le coefficient de corrélation de quelques mesures objectives existantes de la qualité de la parole avec MOS. Les résultats sont issus de la littérature. Seuls les paramètres de codages sont considérés. Les sources sont [155, p. 103], [139, p. 84], [113, p. 1517] et [112, p. 10/7].
Les mesures objectives	corrélation avec MOS
SNR	0.226-0.523
SNRseg	0.221-521
BSD	0.367-0.919
PSQM	0.830-0.980
PSQM+	0.874-0.980
MNB2	0.740-.98
PAMS	0.640-0.895
MBSD	0.760
EMBSD	0.870

Dans le cas où ces mesures sont employées pour évaluer seulement les déformations dues aux paramètres de codage (voir le tableau 2), comme nous le voyons, les mesures simples comme SNR et SNRseg donnent une corrélation faible avec les essais subjectifs de qualité (entre 0,226 et 0,523 pour SNR et entre 0,221 et 521 pour SNRseg). MBS, MBSD et EMBSD donnent de meilleurs résultats que SNR ou SNRseg. Pour PSQM et sa version améliorée PSQM+, la performance est meilleure et elle est comparable à celle de PAMS et de MNB. Le coefficient de corrélation peut atteindre jusqu'à 0,98 pour certaines mesures. D'autre part, quand ces mesures sont employées pour évaluer la qualité en tenant compte des effets de réseau de codage, la performance se dégrade. Les seules données disponibles comparant la majorité de ces mesures sont trouvées dans [155, p. 106], voir tableau 3. Cependant, en raison de l'accord de projet, ils n'ont pas indiqué les noms de ces mesures comparées, exceptés MBSD et EMBSD. Nous pouvons voir qu'EMBSD donne un coefficient de corrélation de 0,54 dans ce cas-ci contre 0,87 dans le cas où il est appliqué au cas de codage seulement. La performance de MBSD est très mauvaise, environ 0,24 contre 0,760 pour le cas de codage seulement. La meilleure mesure est celle d'un coefficient de corrélation de 0,90 avec des résultats de MOS. Parmi ces mesures, seulement l'E-modèle de l'UIT n'a pas besoin de l'accès au signal original pour calculer la qualité. Ainsi, c'est la seule mesure disponible qui pourrait théoriquement être employée dans des applications temps réel comme notre méthode. Cependant, utilisée en prenant en compte les effets de codage et de réseau, elle est peu performante : le coefficient de corrélation est environ 0,70 [57]. En outre, le même travail présenté dans [57] compare les performances d'EMBSD, d'E-modèle et de MNB ; les résultats obtenus prouvent que la corrélation avec des données de MOS est très mauvaise comme le montre le tableau 4. Nous montrons également des nuages de points pour MNB2 et E-modèle en comparant les résultats obtenues par ces mesures avec celles de MOS sur les figures 5.11(a) et 5.11(b). Une mesure optimale doit donner de résultats qui corrèlent parfaitement avec le MOS (c.-à-d. tous les résultats devraient être dessinés sur une même ligne). Cependant, de ces deux figures, nous constatons trop de variations : pour la même valeur du MOS, il y a beaucoup de valeurs de ces deux mesures. Par exemple, pour MOS=2.5, le résultat de MNB2 varie de 0,1 à 0,7 (la plage de résultats est de 0 à 1) ; en ce concerne E-modèle, on observe une variation de 20 à 80 (la plage de résultat est 0/100). De même, pour le même résultat de mesure, il y a aussi beaucoup de valeurs de MOS qui peuvent le satisfaire. Par exemple, pour le résultat de MNB2 de 0,4, la valeur correspondante de MOS varie de 1,2 à 4,5 ; et pour le résultat d'E-modè de 80, la valeur de MOS varie de 1,1 à 4,5 (avec l'échelle de notes à 5). Comme nous pouvons voir, ceci réduit de manière significative la confiance de ces mesures pour évaluer la qualité.

**Table:** Le coefficient de corrélation de quelques mesures objectives existantes de la qualité de la parole avec MOS en considérant les paramètres de codage et de réseau. Les résultats sont issus de la littérature : la source est [155, p. 106]. Les lettres de A à F représentent les mesures objectives de qualité présentées en section 3.1. Le nom de chaque mesure n'a pas été mentionné en raison de l'accord de projet.
Les mesures objectives	corrélation avec MOS
A	0.87
B	0.85
C	0.56
D	0.86
E	0.90
F	0.86
MBSD	0.24
EMBSD	0.54

**Table:** Les coefficients de corrélation d'EMBSD, de MNB et d'E-model avec MOS en considérant les paramètres de réseau. La source est [57].
Les mesures objectives	corrélation avec MOS
EMBSD	0.38
MNB1	0.51
MNB2	0.54
E-model	0.70

Next: Évaluation de la qualité Up: La mesure de la Previous: Évaluation de la qualité Contents Index

Samir Mohamed 2003-01-08