Réalisations
Compression de la parole à très bas débits
Technologie ACELP® et ses dérivés
La technologie ACELP® fait référence à tout un ensemble de techniques avancées de codage de l'information, permettant de représenter efficacement l'information clé dans un signal de parole afin de le stocker ou le transmettre au plus bas débit numérique possible. À la base, ACELP®, un acronyme qui signifie en anglais « Algebraic Code Excited Linear Prediction », désigne une approche pour encoder (ou décrire) le signal d'excitation à l'entrée d'une série de filtres adaptatifs dont les paramètres sont calculés de façon à produire, à la sortie de ces filtres, un signal le plus proche possible d'un bloc de signal de parole que l'on désire transmettre à un éventuel décodeur. L'encodeur doit donc choisir, parmi un très grand nombre de possibilités (qui peut atteindre des dizaines de millions voire davantage) , le meilleur signal d'excitation qui, une fois passé à travers ces filtres, donnera le meilleur résultat. Au lieu de stocker un dictionnaire contenant toutes les possibilités de signaux d'excitation et d'essayer chaque entrée du dictionnaire, l'approche ACELP® impose une structure mathématique (en fait, algébrique) aux entrées du dictionnaire, ce qui élimine l'obligation de le stocker (essentiellement aucune mémoire requise). De plus, la structure algébrique de ses entrées fait en sorte que les algorithmes de recherche de la meilleure entrée du dictionnaire peuvent être très peu gourmands en complexité. Ces caractéristiques ont fait en sorte que les technologies ACELP® ont été intégrées dans la très grande majorité des standards de codage de parole déployés dans les réseaux de communications sans-fils.
Techniques de robustesse pour pallier aux imperfections réseaux
Dans tous les réseaux de transmission de données, en particuliers dans les réseaux sans-fils, des perturbations de toutes sortes perturbent à divers degrés l'intégrité des données transmises. Ainsi, certains bits sont inversés (un « 0 » transmis est reçu comme un « 1 », et inversement), et des paquets entiers (blocs de données) ne se rendent tout simplement pas à destination. Plusieurs solutions sont possibles, entrant dans deux catégories : soit le réseau prend en charge ces imperfections en ajoutant de la redondance (codes détecteurs et correcteurs d'erreur, retransmission de paquets, etc), soit les applications utilisant le service de transmission du réseau prennent en compte ces imperfections et tentent d'en minimiser l'effet. Dans le cas d'un codeur de parole, plusieurs techniques ont été développées par nos laboratoires afin de permettre au décodeur (le récepteur) de synthétiser un signal de parole de bonne qualité même si certains bits reçus sont réputés erronés, et même si un pourcentage des paquets transmis ne se rendent pas à destination (ou se rendent trop tard pour être décodés en temps-réel). Ces techniques exploitent les redondances et les niveaux de corrélation dans les signaux audio de même que les limites de la perception humaine. Les caractéristiques de différentes classes de signaux (voisés, non-voisés, stationnaires ou impulsifs, etc) ont également été soigneusement étudiées et exploitées afin de développer des technologies adaptées à ces conditions afin de limiter et même d'enrayer les effets des imperfections des canaux de transmissions.