大家都知道,自从信息革命爆发以来,我们的信息量(数据量)就在不断膨胀。
文字、图片、音频、视频……越来越多的数据在不断产生,不仅占据着我们的硬盘空间,也充斥着整个通信网络。这些数据让我们的工作和生活更加便利,也推动着社会的进步和发展。进入21世纪后,在云计算、大数据、物联网和人工智能的共同刺激下,数据的增长趋势更加猛烈。根据IDC的报告,到2025年,全球数据总量将达到175ZB,约等于1750亿TB。而ITU则预测,全球移动数据流量的年增长速率将会在2030年达到55%。2030年的数据流量,将是2020年的100倍。
面对如此巨大的流量增长,人类现有的通信技术手段,已经疲于招架。1948年,祖师爷克劳德·香农(Claude Elwood Shannon)发表了那篇经典论文——《A Mathematics Theory of Communication(通信的数学理论)》,标志着信息论的诞生。后来,1949年,他又发表了《Communication in the Presence of Noise(噪声下的通信)》,阐明了通信的基本问题,给出了通信系统的模型,以及著名的香农公式。从那之后,我们就一直在信息论和香农公式的基础上,进行通信技术的研究。
经过70多年的积累,我们的通信技术已经无限接近于香农极限。以huffman编码、算法编码为代表的信源编码技术,把信源数据压缩到了极致。而以LDPC码、极化码为代表的信道编码技术,把信道也利用到了极致。那接下来,该怎么办呢?面对万物智联时代的数据洪流,我们的优质频谱资源越来越少,硬件和能耗成本越来越高,该如何应对?
一直以来,我们在通信技术上所做的努力,似乎都在做一件事情——把携带信息的符号,完整、准确、快速地从信源发送到信宿。这就好像一个勤劳的快递员,他的唯一使命,就是把寄件人交给他的货物,完好无损且快速地,送到收件人的手上。那么,当货物实在太多,快递员真的已经拿不动的时候,他会不会蹦出这么一个念头——这些货物,真的有必要全送吗?
你想在网上搜索一部好看的电影。你挑了一部,花了好久的时间,终于下载完成,结果,你打开一看,根本不是自己喜欢的。于是,你就只能删掉它。网络辛苦完成的数据传输工作,没有发挥价值。你的时间,也浪费了。是的,在这里,我们就会想到——通信的终极奥义,究竟是什么?事实上,早在现代通信理论奠基之际,先贤们就考虑到了这个问题。1938年,美国哲学家查尔斯·莫里斯(Charles William Morris)提出了符号论。他指出,符号应该包括了语法-语义-语用三元概念。克劳德·香农提出信息论后,和沃伦·韦弗(Warren Weaver)一起对自己的理论和模型进行延展完善。他们合著了一本书,名字仍然叫《通信的数学理论》。
他们俩当时就意识到,语义在通信中的重要性。于是,他们提出了通信的3个级别,即Level A/B/C。Level A:语法通信,解决技术问题,即通信符号如何保证正确传输;Level B:语义通信,解决语义问题,即发送的符号如何传递确切的含义;Level C:语用通信,解决有效性问题,即接收的含义如何以期望的方式影响系统行为。长期以来,经典信息论局限在语法信息传输层次,即Level A。也就是说,我们一直在研究怎么把数据传过去。如今,在传统通信已经进入瓶颈的情况下,我们就可以考虑一下——是不是可以在语义通信上,寻找突破点。语义通信(Semantic Communication),是以任务为主体,“先理解,后传输”的通信方式。它会对原始信号进行有选择的特征提取、压缩和传输,然后再利用语义层面信息进行通信。
如果我们把传统通信看成是形式通信的话,那么,语义通信就是“达意通信”、“内容通信”。通信的真正目的是什么,是让对方了解自己的意思。说话,只是一种表达方式。话的本身,也是为了表达意思。那么,就没有必要进抓着这句话不放,而是看如何更高效地传达意思。从学术上来说,降低接收者对信息的不确定性,或者说,使接收到的信息熵减少至0,让接收者正确理解发送者的信息内容,就是“达意”通信。大家平时沟通交流,也会注意到:对于陌生人,你需要千叮咛万嘱咐,确保自己的意思被理解。而对于你很亲近的人,有时候,一个眼神就足够了。不是吗?传统信源编码是对信息本身的压缩,它寻找数据的规律,通过算法进行数据精简。而语义通信,重在“理解和消化”,讲究的是“智能”。语义通信可以显著降低数据流量,提高通信效率。那么,它究竟是如何工作的呢?语义通信目前还处于早期研究阶段,不同的研究团队,有不同的语义通信架构设计。
而且,针对不同类型的通信(文本通信、图像通信、音视频通信等),不同目的的通信(是否有特定任务),也会有不同的语义通信模型和架构。早期的一种模型,是在传统经典通信系统上叠加语义通信。在发送端,信源产生的信息首先送入语义提取模块,产生语义表征序列。接着,送入语义信源编码器,对语义特征压缩编码。然后,送入信道编码器。最后,进入传输信道。在接收端,先信道译码,再语义译码。得到的语义表征序列,送入语义恢复与重建模块,最终得到信源数据。
另一种现在比较有代表的模型,是信源信道联合编码。这种方式,更有整体性,全盘思考。大家能看出来,相比传统通信,语义通信多了一个知识库。其实,有的模型并没有知识库,直接在语义编码器上硬刚。更多的系统模型,是基于知识库的。系统模型的性能和准确率,高度依赖于知识库。知识库就有点像密码本。如果两端的知识库不一致,那么,语义通信是无法正常工作的。知识库又不像密码本那样,内容固定且形式单一。知识库由很多的语义知识图谱组成,分为多个层级,可以对现实世界中的实体、概念、属性以及它们之间的关系进行建模。基于知识库,进行语义理解,就需要前面我们所说的“智能”。简单来说,就是让AI来完成语义理解的工作。语义编码与译码模块基于海量数据训练的知识库,通过深度学习网络来拟合语义的特征,可以高效提取与重建语义信息。
这也是为什么,最近十几年来,语义通信开始重新被提及的原因。
早在1956年,法国物理学家L.布里渊(L.Brillouin)就指出,经典信息论忽略语义通信,是因为工程需要(要先解决基本需求),并不意味着人们要永远忽视语义信息。如今,一方面传统信息论遇到瓶颈,另一方面AI人工智能技术日益成熟,所以,我们重提语义通信的时机就成熟了。特别值得一提的是,AI人工智能可以帮助语义通信,反过来,语义通信,也非常适合人工智能的发展。大家应该能够理解:同类型主体之间的通信,往往容易简化。就像人和人之间,通信肯定比人和牛之间简单。未来,我们正在朝着智能化的方向发展,AI人工智能批量应用之后,就会有很多的智能体。这些智能体之间,就会有大量的通信需求。而语义通信,本身就是AI在进行“翻译”,对于智能体通信,肯定会有更大的优势。
语义通信的发展前景,行业是一致看好的。但是,想要让这项技术投入实用,真正发挥价值,并不容易。
香农的信息论,给传统语法信息奠定了理论基础。他用一个简单的对数公式,就把信息(熵)明确定义出来;用香农公式,又把语法通信的信道容量边界也划定了。对于语义通信,还没有人完成这两项重要工作。相对于语法通信,语义通信缺失严谨的数学表征,没有扎实的理论依据。传统语法通信有误码率、丢包率之类的指标,用于衡量服务质量。语义通信关注“达意”,不关注“精准传输”,所以,这些指标都用不了。在语义通信中,只能会采用宏观的任务完成质量或语义准确率,来进行系统性能评估。
以目前现有的技术,即便是用上了AI人工智能,仍然无法做到完美的准确率。语义的识别与恢复,比想象中难得多。通信是一件复杂工作。数据是多样化的,有结构化数据,也有非结构化数据。文字、图片、音视频,还有一些特定的通信任务,混在一起,很难借助一个有范围限制性的知识库,进行语义提取。
例如,我们采用工业制造场景的知识库,去进行农林牧渔场景的语义通信,肯定不行。但是,通信场景的边界,又该如何精确划分?在现实情况下,如何维持两份高度一致的知识库?如果对知识库进行传递,会不会泄密?如何保障知识库不被入侵和扰乱?总而言之,语义通信面临的挑战还有很多。这些还都是理论研究上的问题,将来如果产业化,问题还会更多。前面说了,语义通信目前还处于早期研究阶段。2010年至今,这个概念的研究热度是越来越高的。在国内,很多高校都进行了一些语义通信模型的搭建,并取得了初步进展。
2022年左右,他们针对6G的智简演进需求,提出了一种新的语义信息表征模型——语义基(Seb)。语义基是语义信息的基本组织单元,类似于香农在传统信息论体系中的比特(Bit)。它以更为结构化、简约化、弹性化的方式对信息进行组织,为描述涉及网络意图的语义信息提供了新的视角。他们还提出了面向6G的“一面三层(语义智能平面、语义物理承载层、语义网络协议层、语义应用意图层)”智简网络协议架构,为语义通信的研究提供了重要参考。除了高校之外,部分企业也参与到语义通信的研究和实践中。以中国移动为例,他们和清华大学合作,搞了一个面向人脸场景的会话视频语义传输方案,在中移平安乡村网络中进行应用,效果不错。相比于传统H.264编码,针对人脸场景,语义通信在相同用户体验下将码率降低为10-20%,即降低到3KB也能获清晰流畅体验。它是通信系统设计思想、理念的一次重大变革,很可能彻底颠覆我们现有的信息通信技术体系。面向未来,语义通信到底是骡子是马,就让时间来告诉我们答案吧。
文章来源:鲜枣课堂