Capacidade do canal AWGN

9

Estou confuso ao entender os conceitos básicos de comunicação pelos canais AWGN. Eu sei que a capacidade de um canal AWGN de ​​tempo discreto é: e é alcançada quando o sinal de entrada tem Gaussian distribuição. Mas, o que significa que o sinal de entrada é gaussiano? Isso significa que a amplitude de cada símbolo de uma palavra de código deve ser retirada de um conjunto gaussiano? Qual é a diferença entre usar um livro de códigos especial (neste caso, Gaussiano) e modular o sinal com sinalização M-ária, digamos MPSK?

C=12log2(1+SN)
Mah
fonte

Respostas:

11

Supondo que um canal cuja entrada a cada momento seja uma variável aleatória contínua e sua saída seja , em que e seja independente de , então é a capacidade do canal de entrada contínua sob a restrição de energia A informação mútua é maximizada (e é igual a ) quando .XY=X+ZZN(0,N)ZX

CCI-AWGN=12registro2(1+PN)
EX2P
Eu(X;Y)CCI-AWGNXN(0 0,P)

Isso significa que, se é uma variável aleatória Gaussiana contínua com a variação fornecida, a saída possui a maior informação mútua possível com a entrada. É isso aí!X

Quando a variável de entrada é discretizada (quantizada), uma nova formulação é necessária. De fato, as coisas podem facilmente se tornar difíceis. Para ver um pouco, pode-se considerar o caso simples de uma discritização muito grosseira de onde ele pode ter apenas dois valores. Então, suponha que seja selecionado de um alfabeto binário, por exemplo, deixeXXXX{±1}(ou uma versão em escala para satisfazer uma restrição de energia). Em termos de modulação, é idêntico ao BPSK.

Acontece que a capacidade (mesmo neste caso simples) não tem forma fechada. Relato de "Modern Coding Theory", de Richardson e Urbanke:

CBI-AWGN=1+1em(2)((2N-1)Q(1N)-2πNe-12N+Eu=1(-1)EuEu(Eu+1)e2Eu(Eu+1)NQ(1+2EuN))
Uma comparação entre os dois casos pode ser vista na figura abaixo:

insira a descrição da imagem aqui

msm
fonte
O que você faria se quisesse se aproximar da capacidade? usando um esquema PSK de ordem superior?
Mah
@msm Sempre acreditei que o FEC é um conceito geral, incluindo o H-ARQ, ou o H-ARQ é apenas um truque para reduzir o comprimento da palavra de código por transmissão, ou seja, para reduzir a complexidade da decodificação, com o custo de um tempo total de transmissão mais longo, não é?
AlexTP3
@msm Por favor, pare de excluir suas postagens antigas e valiosas!
Peter K.
@msm Ao se inscrever no SP.SE, você concedeu ao site uma licença irrevogável para usar o conteúdo. Pare de excluir seu conteúdo valioso.
Peter K.
7

A fórmula da capacidade

(1)C=0.5log(1+SN)
é para canal de tempo discreto.

Supondo que você tenha uma sequência de dados {an} para enviar, você precisa de um conjunto de formas de onda ortonormal {ϕn(t)}para modulação. Na modulação linear, a quem pertence a modificação M-ária,ϕn(t)=ϕ(tnT) Onde T é a duração do símbolo e ϕ(t) é uma forma de onda protótipo para que o sinal TX de tempo contínuo da banda base se torne

(2)x(t)=nanϕ(tnT)

Modulações típicas usam o caso especial que {ϕn(t)}satisfaz o critério Nyquist ISI com filtro correspondente para recuperaran. Um conhecidoϕ(t)Raiz é cosseno elevado .

O canal AWGN contínuo é um modelo que

(3)y(t)=x(t)+n(t)

Onde n(t) é um processo estocástico branco gaussiano.

De (2), podemos ver que an é a projeção de x(t) em {ϕn(t)}. Faça a mesma coisa comn(t), as projeções de n(t) em um conjunto ortonormal é uma sequência de variáveis ​​aleatórias iid gaussianas wn=n(t),ϕn(t) (Eu realmente acho que n(t)é definido a partir de suas projeções); e ligaryn=y(t),ϕn(t). Voilà, temos um modelo de tempo discreto equivalente

(4)yn=an+wn

A fórmula (1) é indicada para S e N são energia (variação se an e wn zero média) de an e wn, respectivamente. E sean e wn são gaussianos, yne a capacidade é maximizada. (Eu posso adicionar uma prova simples, se você quiser).

o que significa que o sinal de entrada é gaussiano? Isso significa que a amplitude de cada símbolo de uma palavra de código deve ser retirada de um conjunto gaussiano?

Significa variáveis ​​aleatórias an são gaussianos.

Qual é a diferença entre usar um livro de códigos especial (neste caso, Gaussiano) e modular o sinal com sinalização M-ária, digamos MPSK?

A forma de onda ϕn(t) O conjunto precisa ser ortonormal, o que é verdade para o M-PSK, para que wn é um gaussiano.

Atualizar no entantoané quantizado e, em geral, não é mais gaussiano. Existem algumas pesquisas sobre esse tópico, como o uso de Lattice Gaussian Coding (link) .

AlexTP
fonte
@msm eu quis dizer "canal discreto". Sim, essas variáveis ​​aleatórias são contínuas, seu suporte é contínuo. Eu falei sobre tempo contínuo e tempo discreto porque o autor perguntou sobre modulação.
AlexTP
@msm meu (3) é contínuo e (4) é o equivalente discreto. Fisicamente em escala não quântica, estamos em (3). Para analisar, usamos (4). Estamos apenas falando de dois animais diferentes, suponho. Eu editei minha resposta para usar a terminologia correta.
AlexTP
1
O @msm viu sua resposta e descobriu que eu não entendi o que o autor da pergunta queria perguntar sobre modulação e o que você está me dizendo. Atualizei minha resposta para evitar a parte enganosa. Obrigado.
AlexTP
"Eu realmente acho que n (t) é definido a partir de suas projeções" - O problema é que o ruído branco tem dimensões infinitas. O interessante é que, para o problema de recuperaran, apenas a projeção em ϕn(t)é relevante - todas as outras projeções infinitas possíveis não ajudam. Veja o "teorema da irrelevância".
MBaz 2/17
@ MBaz sim, eu concordo. Teorema da irrelevância e teorema da amostragem são o par para estabelecer o modelo de canal de tempo discreto básico. A parte ortogonal não está correlacionada, portanto, independente sob a suposição gaussiana. No entanto, acho que não modificaria minha resposta porque esse material de projeção não se relaciona diretamente à pergunta. Obrigado por deixar claro.
AlexTP2
3

Dizer que o sinal de entrada tem uma distribuição gaussiana significa que ele é distribuído como uma variável aleatória gaussiana. Na prática, confia-se na codificação de várias instâncias do canal (no tempo), em vez de depender de uma distribuição de entrada gaussiana. Existe uma bela teoria cheia de provas que está além do escopo desta resposta (Teoria da Informação). Os códigos de controle de erro (ou códigos de canal) geralmente dependem do uso de modulações familiares de QAM / PSK, mas, através da redundância do código e de vários usos de canal, eles podem abordar (embora não atinjam completamente) a capacidade do canal. Um esboço do raciocínio (sem detalhes completos) é fornecido a seguir.

A definição da capacidade do canal é

C=suppX(x)I(X;Y)
Onde X pode ser vagamente referida como sua variável aleatória de entrada e Y pode ser vagamente referida como sua variável aleatória de saída e I(,)é a informação mútua deX e Y. Essa definição exige que pesquisemos todas as distribuições possíveis da entradapX(x)para distribuições que maximizam as informações mútuas. O canal AWGN discreto possui um relacionamento de entrada / saída definido como
Y=X+Z
Onde Z é um Gaussiano médio zero com variância σZ2 (notar que σZ2=N e σX2=Sna sua notação). Não tenho tempo para fornecer todos os detalhes agora. No entanto, qualquer livro sobre teoria da informação pode orientá-lo na prova que mostra que, seX é distribuído como um gaussiano então I(X;Y) (a informação mútua de X e Y) é maximizado. Por exemplo, consulte Elementos da teoria da informação de Thomas Cover. Se você ainda não o leu, o tratado original de Shannon, Uma teoria matemática da comunicação, é uma leitura válida, com raciocínio claro.
lúpulo
fonte
Nenhuma razão dada para o voto negativo?
saltos