Chapter 9 : 离散无记忆信道的编码定理¶
约 1589 个字 4 张图片 预计阅读时间 8 分钟
复制信道¶
离散无记忆信道的编码¶
\(W=\{1,2,\cdots,M\}\)
编码速率(传信率):\(R=\frac{\log M}{n}\)
香农信道编码定理:如果信息传输速率 \(R\) 小于信道容量 \(C\),则总存在一种编码方法,使信息在该信道上无错误地可靠传输
所有低于信道容量 \(C\) 的速率 \(R\) 均是可达的,即当 \(R<C\) 时,总存在一系列码 \((2^{nR},n)\),当 \(n\rightarrow\infty\) 时,最大误码概率 \(\lambda^{(n)}\rightarrow 0\),即可以任意小
逆定理:具有 \(\lambda^{(n)}\rightarrow 0\) 的任何 \((2^{nR},n)\) 码必有 \(R\leq C\)
码率可达区 \(\Leftrightarrow\) 容量区內界,容量区內界如果与容量区外界相等,则为容量区
直观说明¶
\(M\approx\frac{2^{nH(Y)}}{2^{nH(Y|X)}}=2^{nI(X;Y)},R=\frac{\log M}{n}\approx I(X;Y)\leq C\)
基本定义¶
- 离散无记忆信道 \(\{\mathcal{X},p(y|x),\mathcal{Y}\}\) 上的一个 \((M,n)\) 码由如下组成:
- 一个与 \(M\) 个消息相对应的标号集合 \(W=\{1,2,\cdots,M\}\)
- 一个编码器,把消息 \(w\in\mathcal{W}\) 映射成码字 \(x^n\in\mathcal{X}^n\),所得到的码字为 \(X^n(1),X^n(2),\cdots,X^n(M)\);一个码的全体码字构成码书
- 一个译码器 \(g_1:\mathcal{Y}^n\rightarrow\mathcal{W}\):对应于确定的译码法则, 帮助接收者根据接收到的序列 \(Y_n\) 来确定发送消息是什么
- 发送第 \(i\) 个消息所发生的错误概率定义为 \(\lambda_i=P\{g(Y^n)\neq i|X^n=x^n(i)\}\),最大错误概率定义为 \(\lambda^{(n)}=\max\limits_{i\in\{1,2,\cdots,M\}}\lambda_i\),平均错误概率定义为 \(P_e^{(n)}=\frac{1}{M}\sum\limits_{i=1}^M\lambda_i\),编码速率定义为 \(R=\frac{\log M}{n}\) 比特/传输
- 如果存在一系列 \((2^{nR},n)\) 码,当 \(n\rightarrow\infty\) 时,最大错误概率 \(\lambda^{(n)}\rightarrow 0\),则称 \(R\) 是可达的
证明¶
证明思想:
- 所谓可靠通信是指错误概率可以任意小,但并非为零
- 信道上不是仅传输一个符号,而是传输一串很长的符号序列。由于多次使用信道,可以利用概率论中的大数定理
- 计算在一类随机选择的码书上的平均错误概率,平均错误概率与最大错误概率具有一样的意义
如果 \((2^{nR},n)\) 码的平均错误概率 \(\lambda^{(n)}<\epsilon\),则至少有一半的码字其最大错误概率小于 \(2\epsilon\),意味着 \((2^{nR}−1, n)\) 码的最大错误概率 \(\lambda(n)<2\epsilon\rightarrow 0\),则码率 \(\frac{nR-1}{n}=R-\frac{1}{n}\) 是可达的
联合典型列¶
相对于联合分布 \(p(x,y)\) 的联合典型列集合 \(A_{\epsilon}^{(n)}\) 是指具有下列性质的序列对 \((x^n,y^n)\) 的集合:
设 \(A_{\epsilon}^{(n)}\) 是与 \(p(x,y)\) 对应的联合典型列集合,若联合序列 \((X^n,Y^n)\) 的每一个符号对 \((x_i,y_i)\) 均是 按照联合分布 \(p(x,y)\) 独立选取,即 \((X^n,Y^n)∼p(x^n,y^n)\),则:
- \(Pr((X^n,Y^n)\in A_{\epsilon}^{(n)})\rightarrow 1\)
- \((1-\epsilon)2^{n(H(XY)-\epsilon)}\leq\big|A_{\epsilon}^{(n)}\big|\leq 2^{n(H(XY)+\epsilon)}\)
- 随机选择 \(y^n\),约有 \(2^{-nI(X;Y)}\) 的概率与 \(x^n\) 构成联合典型
- 如果联合序列 \((\tilde{Y^n},\tilde{Y^n})∼p(x^n)p(y^n)\),即 \(\tilde{X^n}\) 和 \(\tilde{Y^n}\) 分别按照 \(p(x,y)\) 的边缘分布 \(p(x)\) 和 \(p(y)\) 来独立选取,则 \((1-\epsilon)2^{-n(I(X;Y)+3\epsilon)}\leq Pr\big((\tilde{X^n},\tilde{Y^n})\big)\leq 2^{-n(I(X;Y)-3\epsilon)}\)
Proof
\((\tilde{Y^n},\tilde{Y^n})\) 与 \((X^n,Y^n)\) 有相同的边缘分布 \(p(x^n)\) 和 \(p(y^n)\),故:
二元对称信道¶
码书矩阵:
译码方法:如果接收到的 \(y^n\) 与某个码字 \(x_n(i)\) 的 Hamming 距离小于 \(r=n(p+\epsilon_2)\) 时,就宣称发送的是第 \(i\) 个码字,其中\(\epsilon_2\) 是任意小数,且满足 \(p+\epsilon_2<0.5\)
译码错误:\(y^n\) 与 \(x^n(i)\) 的 Hamming 距离大于 \(r=n(p+\epsilon_2)\),或者 \(y^n\) 与其它 \(x^n(j)\) 的 Hamming 距离小于 \(r=n(p+\epsilon_2)\)
\(P(E|i=1)=P\{\overline{E_1}\cup E_2\cup\cdots\cup E_{2^{nR}}\}=P(\overline{E_1})+\sum\limits_{i=2}^{2^{nR}}E_i\)
- 不妨令 \(i=1\) 为全 0 序列,则 \(P(\overline{E_1})\) 表示输出序列中 \(1\) 的个数超过 \(np\) 的概率,根据切比雪夫不等式,该概率可以任意小,即 \(P(\overline{E_1})<\frac{\epsilon}{2}\)
-
发送其它序列时,输出序列有 \(2^n\) 个,但只有 \(\sum\limits_{t=0}^r C_n^t\) 个落在半径为 \(r\) 的 Hamming 球内
\[ \begin{aligned} P(E_1)&<\frac{\epsilon}{2}+(2^{nR}-1)\frac{1}{2^n}\sum\limits_{t=0}^rC_n^t\\ &=\frac{\epsilon}{2}+(2^{nR}-1)\frac{1}{2^n}\sum\limits_{t=0}^{n\lambda}C_n^t,\lambda<\frac{1}{2}\\ &=\frac{\epsilon}{2}+2^{nR}2^{-n[1-H(\lambda)]}=\frac{\epsilon}{2}+2^{n(R-C)}\\ r&=n\lambda=n(p+\epsilon_2)\\ 1&\geq\sum\limits_{t=0}^{n\lambda}C_n^t\lambda^t(1-\lambda)^{n-t}\geq\sum\limits_{t=0}^{n\lambda}C_n^t\lambda^{n\lambda}(1-\lambda)^{n-n\lambda}=\sum\limits_{t=0}^{n\lambda}C_n^t2^{-nH(\lambda)} \end{aligned} \]