Como se pode descrever matematicamente o tipo de representação de proteínas dos "desenhos animados"?

12

As proteínas são tipicamente representadas em forma de desenho animado, com folhas β como flechas e hélices α como bobinas:

Exemplo de representação de desenho animado de uma proteína

Gostaria de saber, existe em algum lugar uma referência que descreva a construção dessa representação? Ou seja, que objetos matemáticos são usados ​​para construir esses gráficos e em quais átomos / direções são construídos?

F'x
fonte

Respostas:

8

Alguns dos algoritmos estão disponíveis no código-fonte para os diferentes pacotes. PyMol é um desses, e a fonte do VMD também está acessível.

Eu implementei o algoritmo de faixa de opções do VMD nos anos 90. O primeiro passo é a determinação da estrutura - onde estão os aminoácidos? quais estão conectados em uma cadeia? onde estão os átomos de alfa-C?

Em seguida, como Kyle disse, é o spline. O VMD usa um spline Catmull – Rom, com os alfas C como pontos de controle. Este é um spline de 3ª ordem e os splines passam pelos C-alfas. Se você elaborar a matemática, há um único parâmetro livre, que corresponde à rigidez do spline em torno do ponto de controle. Tentei alguns valores até encontrar o que era esteticamente agradável.

Há também alguns truques sobre como lidar com o fim, que não têm C-alfas suficientes. Extrapolei para obter os outros pontos.

Isso dá o caminho. Uma extrusão circular ao longo do caminho dá um tubo. Você pode variar os raios da seção transversal para obter uma elipse e, com um pouco mais de trabalho, defina a faixa de opções.

O problema é encontrar a norma correta, para que as fitas estejam alinhadas com uma hélice alfa. Tentei várias coisas e desisti, olhei para a implementação do Raster3D, obtive permissão para usá-la e adicionei isso ao VMD. É uma soma cumulativa da norma anterior do vetor e da norma atual definida pelo rastreamento C-alfa. Eu teria que procurar na fonte como ele funciona novamente. Curiosamente, Ethan Merritt, o autor do Raster3D, apontou que ele recebeu esse pedaço de código da FRODO, por isso tem uma longa história.

O VMD agora tem "NewRibbons", que foi implementado após o meu tempo. Eu não sei como isso funciona.

A maneira mais fácil de fazer uma hélice alfa é desenhar uma linha do primeiro ao último resíduo; expulse um círculo ao longo da linha e você terá um cilindro. Você também pode fazer um ajuste linear à hélice, mas acho que isso causou problemas para hélices curtas. É provável que haja maneiras mais inteligentes de fazê-lo, incluindo maneiras como Kyle sugeriu, o que permite curvas suaves.

Os fios beta são fáceis. Existem dois caminhos de controle, um para cada lado. Aqueles definem o caminho da costa e o normal. Você precisa ter um pouco de cuidado com as torções, para que seu fio não torça 290 graus quando deve torcer 70 graus, mas isso não foi difícil de manusear.

Uma parte difícil, que você não mencionou, é como detectar onde as cadeias alfa-hélice e beta estão localizadas. Alguns registros PDB contêm isso, mas não todos. Punt e usei uma ferramenta de terceiros, STRIDE, para isso. Warren implementou seu próprio algoritmo. Roger Sayle implementou sua própria versão do DSSP para Raster3D.

Andrew Dalke
fonte
6

Vou dar uma facada nele.

A representação dos desenhos animados de proteínas (também conhecida como fita) consiste em três partes correspondentes aos três tipos de estrutura secundária da proteína.

  • Bobina aleatória (mostrada em verde) - Um spline B, geralmente da ordem 2 ou 3, passando pelos carbonos alfa de cada resíduo de aminoácido. Ocasionalmente, o spline também passará pelos amino-nitrogênio para mostrar mais de perto a conformação da proteína.
  • Alpha Helix (mostrado em vermelho) - Outro spline com uma forma de 'fita' achatada que envolve um cilindro imaginário formado pelos resíduos na hélice.
  • Folhas beta (mostradas em amarelo) - splines com a forma da seta larga e plana que passa pelo plano peptídico (o plano formado pelo carbono alfa, carbono carbonil e carbono carbonil). O vetor normal no topo da seta é o normal do plano peptídico. As setas apontam do terminal N para o terminal C da cadeia proteica.

A página da wikipedia em diagramas de faixa tem informações adicionais sobre as origens desse tipo de visualização para mostrar a estrutura da proteína.

Kyle Lutz
fonte