GoSuda

AI 기반 시맨틱 통신이 이끄는 넥스트 통신 패러다임

By yoonhyunwoo
views ...

섀넌의 법칙 (Shannon's Law)

오늘날의 통신은 섀넌의 법칙(Shannon's Law)을 기반으로 발전해 왔습니다. 이는 네트워크 통신의 한계를 구하는 이론이며, 후술할 수식의 채널 용량 최대치를 높이기 위한 시도들이었습니다. 이를테면 MIMO(Multiple Input Multiple Output)와 같은 기술들이 있습니다. 이러한 기술들은 섀넌의 이론에 기반하여 더 높은 채널 용량을 지니기 위한 노력의 일환입니다.

当今的通信是基于香农定律 (Shannon's Law) 发展而来的。该理论旨在确定网络通信的极限,并且是为提高后述公式中信道容量最大值而进行的尝试。例如,存在诸如 MIMO (Multiple Input Multiple Output) 之类的技术。这些技术是基于香农理论,旨在获得更高信道容量的努力的一部分。

섀넌의 법칙은 채널 용량을 계산하는 아래와 같은 수식으로 표현합니다.

香农定律通过以下用于计算信道容量的公式来表达。

equation

이들은 각각 채널 용량(Channel Capacity), 대역폭(Bandwidth) , 신호 대 잡음비(Signal-to-Noise Ratio) 를 의미합니다. 알기 쉽게 말로 풀어내 보면 최대 통신 속도(C) 는, 시스템이 사용할 수 있는 물리적인 주파수 자원의 총량(B)에, 신호 품질(S/N)에 따라 그 자원 1Hz당 몇 비트의 정보를 실어 나를 수 있는지에 대한 효율(log₂(1 + S/N)) 을 곱하는 것입니다.

它们分别代表信道容量 (Channel Capacity)带宽 (Bandwidth)信噪比 (Signal-to-Noise Ratio)。用通俗的语言解释,最大通信速度 (C) 是系统可用的物理频率资源总量 (B) 乘以根据信号质量 (S/N) 决定每 1Hz 资源能承载多少比特信息的效率 (log₂(1 + S/N))

이렇게 채널 용량을 계산하는 법칙이 등장하고, 통신 업계는 채널 용량을 늘리기 위해 힘을 쏟기 시작했습니다. 그렇게 대략 70여 년간 통신의 혁신은 대부분 채널 용량의 개선에서 이루어져 왔습니다.

随着这种计算信道容量的定律的出现,通信行业开始致力于增加信道容量。在大约 70 年的时间里,通信领域的创新大多是通过改善信道容量来实现的。

그러나 현시대에 이르러서 프로세싱의 리소스는 너무나 발전했습니다. 통신은 텍스트를 보내던 시절에서 이제 공간 벡터를 보내는 지경에 이르렀습니다. 이 모든 데이터를 신뢰성 있게 쪼개서 전송하기엔 한계가 생기기 시작했습니다. 예를들어 자율주행 자동차가 만들어내는 데이터는 하루에도 수 테라에 달할 수 있으며, 이를 현재의 통신망으로 버텨내기란 불가능에 가깝습니다. 단순히 더 많은 선을 포설하고 더 많은 안테나를 두며 해결하기엔 경제적/물리적 한계에 달하게 됩니다.

然而,到了当代,Processing 的资源已经极其发达。通信已经从发送文本的时代发展到发送空间向量的境地。以可靠的方式分割和传输所有这些数据开始出现局限性。例如,自动驾驶汽车每天产生的数据可能达到数 Tera,而当前的通信网络几乎不可能承受。仅仅通过铺设更多的线路和放置更多的天线来解决问题,将达到经济和物理上的极限。

이렇게 기존의 전체 비트를 정확하게 전송하기 위한 패러다임에서 벗어나 통신간의 지능을 도입함으로써 컨텍스트의 전송만을 꾀하는 패러다임이 연구되기 시작했습니다. (*개념 자체는 수십년전부터 존재했습니다) 그리고 이는 최근 지능 모델의 강력한 발전과 더 거대한 데이터의 통신이 필요해짐의 따른 변화입니다.

因此,一种新的范式开始被研究:它摆脱了现有精确传输全部比特的范式,转而通过在通信中引入智能来仅传输上下文 (context)。(*该概念本身已存在数十年) 这种转变是源于近期智能模型的强大发展以及对更庞大数据通信的需求。

이것은 의미를 주고받는 통신이라고 하여 Semantic Communication으로 불립니다.

这种交换意义的通信被称为语义通信 (Semantic Communication)

시맨틱 통신(Semantic communication)

시맨틱 통신은 기존에 데이터 전체를 전송했다면, 이제는 그 안에 담긴 핵심 의미, 즉 맥락만 전송하는 것을 목표로 합니다.

语义通信的目标是,如果传统上是传输整个数据,那么现在只传输其中包含的核心意义,即上下文

이러한 문제는 이미 섀넌과 위버의 통신모델에서 제기된 문제이며, 그들은 통신의 성숙도를 세개의 레벨로 분리했습니다.

这些问题在香农和韦弗的通信模型中已被提出,他们将通信的成熟度分为三个级别:

  1. 기술적 문제: 심벌(Symbol)을 얼마나 정확하게 전송할 수 있는가? (이것이 제 이론의 핵심 영역입니다.)

  2. 의미론적 문제: 전송된 심벌은 원하는 '의미'를 얼마나 정확하게 전달하는가?

  3. 효과성 문제: 전달된 의미는 수신자의 행동에 얼마나 효과적으로 영향을 미치는가?

  4. 技术问题:符号 (Symbol) 能否被精确地传输?(这是我理论的核心领域。)

  5. 语义问题:传输的符号能否精确地传达所需的“意义”?

  6. 有效性问题:传达的意义对接收者的行为产生了多大程度的有效影响?

지금까지 통신의 발전은 기술적 문제를 거의 해결하였고, 이젠 의미론적, 효과성 문제를 번역하는 과업을 수행합니다.

迄今为止,通信的发展几乎解决了技术问题,现在正进行着翻译语义和有效性问题的任务。

성숙도 1단계와, 2,3단계(시멘틱 통신)에서의 차이는 대표적으로 불타는 집 예시가 쓰입니다.

成熟度第 1 阶段与第 2、3 阶段(语义通信)之间的差异通常以着火的房屋为例来说明。

어떤 집이 불타고있습니다.

一栋房屋正在燃烧。

현재의 통신 패러다임에서는 이 장면을 한땀한땀 데이터화하고, 이를 사진으로 전송합니다.

在当前的通信范式中,这个场景被逐一数据化,并以照片的形式传输。

시멘틱 통신에서는 이를 창문에서 검은 연기가 나고 불꽃이 보인다"처럼 모든 데이터를 보내는 대신, "화재 발생, 즉시 출동 필요"라는 핵심 '의미'만 전달하는 방식입니다. 이는 불필요한 정보는 과감히 생略하고, 수신자가 특정 행동(출동)을 하도록 하는 데 목적을 둡니다.

在语义通信中,它不是发送所有数据,如“窗户冒出黑烟,可以看到火焰”,而是只传输核心“意义”,即“发生火灾,需要立即出动”。这种方式旨在果断省略不必要的信息,并促使接收者采取特定行动(出动)。

소방이라는 카테고리의 동일한 지식 베이스를 지니고 있는 종단간의 통신이라면 이는 사태 파악에 필요한 전송 데이터량을 획기적으로 줄일 수 있습니다.

如果是在消防这一类别中具有相同知识库 (Knowledge Base) 的端到端通信,这将能够显著减少掌握事态所需的传输数据量。

이러한 시멘틱 통신의 핵심 인코딩/디코딩 로직은 통신 패러다임이지만 응용 레이어 위에서 동작합니다. 송신 측에서는 시멘틱 인코더를 통해 주어진 데이터를 의미론적 데이터로 변환하고, 수신측에서는 시멘틱 디코더를 통해 이를 뒷단의 소스가 사용할 수 있는 형태로 가공합니다. 둘은 같은 지식베이스를 가지고있는 추론모델따위의 형태가 될 것이며, 이를 통해 거대한 데이터 전송 없이도 그 시멘틱을 주고받는 통신이 가능해집니다.

这种语义通信的核心编码/解码 (Encoding/Decoding) 逻辑虽然是一种通信范式,但它在应用层 (Application Layer) 上运行。在发送端,通过语义编码器 (Semantic Encoder) 将给定的数据转换为语义数据;在接收端,通过语义解码器 (Semantic Decoder) 将其加工成后端源 (Source) 可用的形式。两者将是拥有相同知识库推断模型 (Inference Model) 等形式,通过此,无需传输庞大的数据即可实现语义的交换。

당연하게도 이는 기존의 통신 패러다임의 완성도 위에서 보장됩니다. 먼저 기술적으로 심벌을 정확하게 전송할 수 있어야하고, 이러한 성숙도 레벨은 이미 달성된 상태입니다. 이젠 전송된 심벌이 정보의 시멘틱을 얼마나 잘 전달 및 해석하냐가 주요 과제로 자리잡았고, 이제 막 연구가 시작되는 상태입니다.

理所当然,这必须以现有通信范式的完善度为保证。首先,在技术上必须能够精确传输符号,而这种成熟度级别已经达成。现在,传输的符号如何良好地传达和解释信息的语义 (Semantic) 成为了主要课题,研究正处于起步阶段。

그러나 이러한 의미론적 맥락을 기반으로 하는 통신체계는 기존의 구문적 통신체계와 달리 신뢰성(reliability)AI 등에 의존하기 때문에 문제가 발생할 가능성이 매우 큽니다. 동일한 Knowledge Based를 지녔다고 해도 모델의 블랙박스(Black Box) 영역에서 다른 해석이 쏟아져나올 수 있습니다.

然而,这种基于语义上下文 (Context) 的通信体系与传统的句法通信体系不同,它将可靠性 (Reliability) 依赖于 AI 等,因此极有可能产生问题。即使拥有相同的 Knowledge Based,在模型的黑箱 (Black Box) 区域中也可能产生不同的解释。

후기

6G(6세대) 이동통신에서는 이러한 시멘틱 통신이 적용되어 지능형 인터넷 체계가 될거라고 하는데, 응용계층 위에서 동작하는 패러다임이 왜 이동통신사의 연구과제가 되는지에 대해서는 의문부호가 있습니다. 저의 직관에서는 이통사에서는 기술적으로 심벌과 비트가 정확하게 전송되는 1단계의 성숙도 레벨을 보장하는 역할이고, 의미론적 통신이 동작하는 시점은 이미 응용 프로그램의 영역이라고 생각됩니다.

后记

据说在 6G (第六代) 移动通信中将应用这种语义通信,成为智能互联网 (Internet) 体系。然而,对于一个在应用层之上运行的范式为何会成为移动通信公司的研究课题,我抱有疑问。根据我的直觉,我认为移动通信公司扮演的角色是保障技术上符号和比特 (Bit) 精确传输的第 1 阶段成熟度水平,而语义通信运行的时点已经属于应用程序 (Application Program) 的范畴。

한편으로는 신뢰성을 기본가치로 깔고가야하는 통신기술에서 이것이 신규 패러다임이 있을지에 대한 의문또한 존재합니다. 저도 역시 이러한 의문을 품고있으며 개인적으로는 조금 부정적인 입장입니다.

另一方面,对于一个必须以可靠性为基本价值的通信技术来说,它是否会成为一种新的范式,也存在疑问。我也持有这种疑问,个人来说持略微否定的立场。

그럼에도 이러한 글을 쓰게되는 이유는 이동통신의 넥스트 패러다임이 꽤나 흥미로운 형태로 전개되고있다고 생각합니다. 채널 용량의 확장을 위한 위성인터넷 도입이야 Project Kuiper , Starlink 등의 등장으로 사실상 기정사실화되어있는 사실이고 섀넌의 법칙에 구애받던 한계를 새로운 형태로 돌파하려는 시도는 꽤나 신기했습니다.