Le prochain paradigme de communication piloté par la communication sémantique basée sur l'IA
Loi de Shannon
La communication actuelle s'est développée sur la base de la Loi de Shannon (Shannon's Law). Celle-ci est une théorie qui définit les limites de la communication réseau, et les tentatives visant à maximiser la capacité de canal de la formule décrite ci-après en sont la conséquence. On peut citer des technologies telles que le MIMO (Multiple Input Multiple Output). Ces technologies s'inscrivent dans le cadre des efforts visant à obtenir une capacité de canal supérieure, en se basant sur la théorie de Shannon.
La Loi de Shannon est exprimée par la formule suivante, qui permet de calculer la capacité de canal : author: yoonhyunwoo
Celles-ci représentent respectivement la Capacité de Canal (Channel Capacity), la Bande Passante (Bandwidth) et le Rapport Signal-sur-Bruit (Signal-to-Noise Ratio). Pour l'expliquer simplement, la Vitesse Maximale de Communication (C) est le produit de la quantité totale de ressources de fréquence physique utilisables par le système (B) par l'Efficacité (log₂(1 + S/N)), qui représente le nombre de bits d'information pouvant être transportés par 1 Hz de cette ressource, en fonction de la qualité du signal (S/N).
Avec l'émergence de cette loi pour le calcul de la capacité de canal, l'industrie des télécommunications a commencé à concentrer ses efforts sur l'augmentation de cette capacité. Ainsi, pendant environ 70 ans, la majorité des innovations en matière de communication ont porté sur l'amélioration de la capacité de canal.
Cependant, à l'ère actuelle, les ressources de traitement ont évolué de manière significative. La communication est passée de l'envoi de texte à l'envoi de vecteurs spatiaux. Des limites ont commencé à apparaître quant à la fiabilité de la fragmentation et de la transmission de toutes ces données. Par exemple, les données générées par une voiture autonome peuvent atteindre plusieurs téraoctets par jour, et il est presque impossible pour le réseau de communication actuel de supporter cela. Le simple fait d'installer davantage de câbles et de placer plus d'antennes atteint des limites économiques et physiques.
Ainsi, une nouvelle approche a commencé à être étudiée, s'éloignant du paradigme existant de transmission précise de la totalité des bits, et cherchant plutôt à transmettre uniquement le contexte en introduisant de l'intelligence dans la communication. (Le concept lui-même existe depuis des décennies.) Ce changement est dû à l'évolution puissante des modèles d'intelligence récents et à la nécessité de communiquer des volumes de données plus importants.
Ceci est appelé Communication Sémantique (Semantic Communication), car il s'agit d'une communication qui échange du sens (意味).
Communication Sémantique (Semantic communication)
La communication sémantique vise à transmettre uniquement le sens essentiel, c'est-à-dire le contexte, contenu dans les données, alors que les systèmes précédents transmettaient l'intégralité des données.
Ce problème avait déjà été soulevé par Shannon et Weaver dans leur modèle de communication, qui avaient divisé la maturité de la communication en trois niveaux :
- Problème technique : Quelle est la précision de la transmission du Symbole (Symbol) ? (Ceci est le domaine central de ma théorie.)
- Problème sémantique : Dans quelle mesure le symbole transmis délivre-t-il le 'sens' souhaité ?
- Problème d'efficacité : Dans quelle mesure le sens délivré influence-t-il efficacement l'action du récepteur ?
Jusqu'à présent, le développement de la communication a quasiment résolu le problème technique, et la tâche actuelle est de traduire les problèmes sémantiques et d'efficacité.
La différence entre le niveau de maturité 1 et les niveaux 2 et 3 (communication sémantique) est typiquement illustrée par l'exemple de la maison en feu.
Une maison est en feu.
Dans le paradigme de communication actuel, cette scène est méticuleusement transformée en données, puis transmise sous forme de photo.
Dans la communication sémantique, au lieu d'envoyer toutes les données comme "de la fumée noire sort de la fenêtre et on voit des flammes", on transmet uniquement le 'sens' essentiel : "Incendie en cours, intervention immédiate nécessaire". L'objectif est d'omettre radicalement les informations superflues et d'amener le récepteur à effectuer une action spécifique (l'intervention).
Si la communication se fait entre des terminaux partageant la même base de connaissances dans la catégorie des services d'incendie, cela permet de réduire de manière significative la quantité de données de transmission nécessaires pour comprendre la situation.
La logique clé d'encodage/décodage de cette communication sémantique, bien que relevant du paradigme de communication, opère au-dessus de la couche application (Application Layer). Du côté de l'émetteur, un encodeur sémantique convertit les données fournies en données sémantiques, et du côté du récepteur, un décodeur sémantique les traite sous une forme utilisable par la source en aval. Les deux seront probablement des formes de modèles d'inférence partageant la même base de connaissances, ce qui permettra une communication échangeant le sémantique sans nécessiter une transmission de données massive.
Il est évident que ceci est garanti par la complétude du paradigme de communication existant. Techniquement, il faut d'abord pouvoir transmettre le symbole avec précision, et ce niveau de maturité est déjà atteint. Le défi majeur est désormais de savoir dans quelle mesure le symbole transmis communique et interprète le sémantique de l'information, et la recherche ne fait que commencer.
Cependant, un système de communication basé sur ce contexte sémantique, contrairement aux systèmes de communication syntaxiques existants, dépend de l'IA pour la fiabilité (reliability), ce qui augmente considérablement le risque de problèmes. Même si les systèmes partagent la même Base de Connaissances (Knowledge Based), des interprétations différentes peuvent émerger de la zone de boîte noire (black box) du modèle.
Postface
Il est dit que la 6G (6e génération) de communication mobile intégrera cette communication sémantique pour devenir un système Internet intelligent. Cependant, il y a un point d'interrogation quant à la raison pour laquelle un paradigme fonctionnant au-dessus de la couche application devient un sujet de recherche pour les opérateurs de télécommunications mobiles. Mon intuition est que le rôle des opérateurs est d'assurer techniquement le niveau de maturité 1, où les symboles et les bits sont transmis avec précision, et que le moment où la communication sémantique opère relève déjà du domaine de l'application.
Par ailleurs, il existe également un doute quant à la possibilité qu'un tel nouveau paradigme puisse exister dans une technologie de communication qui doit avoir la fiabilité comme valeur fondamentale. Je partage moi aussi ces doutes et j'y suis personnellement quelque peu défavorable.
Néanmoins, la raison pour laquelle j'écris cet article est que la prochaine étape du paradigme de la communication mobile se développe sous une forme assez intrigante. L'introduction de l'Internet par satellite pour l'expansion de la capacité de canal est un fait acquis avec l'émergence de Project Kuiper, Starlink, etc., et la tentative de dépasser les limites imposées par la Loi de Shannon sous une nouvelle forme m'a semblé assez fascinante.