Supondo que um canal cuja entrada a cada momento seja uma variável aleatória contínua e sua saída seja , em que e seja independente de , então é a capacidade do canal de entrada contínua sob a restrição de energia
A informação mútua é maximizada (e é igual a ) quando .XY=X+ ZZ∼ N( 0 ,N)ZX
CCI-AWGN=12registro2( 1 +PN)
EX2≤ P
Eu( X; Y)CCI-AWGNX∼ N( 0 , P)
Isso significa que, se é uma variável aleatória Gaussiana contínua com a variação fornecida, a saída possui a maior informação mútua possível com a entrada. É isso aí!X
Quando a variável de entrada é discretizada (quantizada), uma nova formulação é necessária. De fato, as coisas podem facilmente se tornar difíceis. Para ver um pouco, pode-se considerar o caso simples de uma discritização muito grosseira de onde ele pode ter apenas dois valores. Então, suponha que seja selecionado de um alfabeto binário, por exemplo, deixeXXXX∈ { ± 1 }(ou uma versão em escala para satisfazer uma restrição de energia). Em termos de modulação, é idêntico ao BPSK.
Acontece que a capacidade (mesmo neste caso simples) não tem forma fechada. Relato de "Modern Coding Theory", de Richardson e Urbanke:
CBI-AWGN= 1 +1em( 2 )( (2N- 1 ) Q (1N--√) -2πN----√e-12 N+∑i = 1∞( - 1)Eui ( i + 1 )e2 i ( i + 1 )NQ (1 + 2 iN--√) ))
Uma comparação entre os dois casos pode ser vista na figura abaixo:
A fórmula da capacidade
Supondo que você tenha uma sequência de dados{an} para enviar, você precisa de um conjunto de formas de onda ortonormal {ϕn(t)} para modulação. Na modulação linear, a quem pertence a modificação M-ária,ϕn(t)=ϕ(t−nT) Onde T é a duração do símbolo e ϕ(t) é uma forma de onda protótipo para que o sinal TX de tempo contínuo da banda base se torne
Modulações típicas usam o caso especial que{ϕn(t)} satisfaz o critério Nyquist ISI com filtro correspondente para recuperaran . Um conhecidoϕ(t) Raiz é cosseno elevado .
O canal AWGN contínuo é um modelo que
Onden(t) é um processo estocástico branco gaussiano.
De (2), podemos ver quean é a projeção de x(t) em {ϕn(t)} . Faça a mesma coisa comn(t) , as projeções de n(t) em um conjunto ortonormal é uma sequência de variáveis aleatórias iid gaussianas wn=⟨n(t),ϕn(t)⟩ (Eu realmente acho que n(t) é definido a partir de suas projeções); e ligaryn=⟨y(t),ϕn(t)⟩ . Voilà, temos um modelo de tempo discreto equivalente
A fórmula (1) é indicada paraS e N são energia (variação se an e wn zero média) de an e wn , respectivamente. E sean e wn são gaussianos, yn e a capacidade é maximizada. (Eu posso adicionar uma prova simples, se você quiser).
o que significa que o sinal de entrada é gaussiano? Isso significa que a amplitude de cada símbolo de uma palavra de código deve ser retirada de um conjunto gaussiano?
Significa variáveis aleatóriasan são gaussianos.
Qual é a diferença entre usar um livro de códigos especial (neste caso, Gaussiano) e modular o sinal com sinalização M-ária, digamos MPSK?
A forma de ondaϕn(t) O conjunto precisa ser ortonormal, o que é verdade para o M-PSK, para que wn é um gaussiano.
fonte
Dizer que o sinal de entrada tem uma distribuição gaussiana significa que ele é distribuído como uma variável aleatória gaussiana. Na prática, confia-se na codificação de várias instâncias do canal (no tempo), em vez de depender de uma distribuição de entrada gaussiana. Existe uma bela teoria cheia de provas que está além do escopo desta resposta (Teoria da Informação). Os códigos de controle de erro (ou códigos de canal) geralmente dependem do uso de modulações familiares de QAM / PSK, mas, através da redundância do código e de vários usos de canal, eles podem abordar (embora não atinjam completamente) a capacidade do canal. Um esboço do raciocínio (sem detalhes completos) é fornecido a seguir.
A definição da capacidade do canal é
fonte