CASP

Exemplo de estrutura analisada no CASP8: estrutura alvo (exibida como cartoon) e 354 estruturas preditas sobrepostas (backbone exibido como linhas cinza)

O CASP (do inglês Critical Assessment of Structure Prediction, ou Avaliação Crítica da Predição de Estrutura) é uma competição mundial de predição de estrutura de proteínas que ocorre a cada dois anos, desde 1994, e envolve toda a comunidade científica.[1] O objetivo do CASP é oferecer aos grupos de pesquisa a oportunidade de testar seus métodos de predição de forma objetiva, além de fornecer uma avaliação independente e rigorosa do estado da arte em modelagem estrutural para pesquisadores e usuários de software.

Embora sua finalidade principal seja aprimorar os métodos de determinação da estrutura tridimensional de proteínas a partir de suas sequências de aminoácidos, muitos veem o CASP como um verdadeiro “campeonato mundial” dessa área. Mais de cem grupos de pesquisa participam regularmente da competição, e não é incomum que equipes inteiras suspendam outras atividades por meses para preparar seus servidores e realizar predições detalhadas ao longo do experimento.

Avaliação

O principal método de avaliação[2] no CASP consiste em comparar as posições dos átomos de carbono-alfa previstos pelos modelos com aquelas da estrutura alvo. Essa comparação é representada visualmente por meio de gráficos cumulativos de distância entre pares equivalentes de carbonos-α no alinhamento entre modelo e alvo (um modelo perfeito permaneceria próximo de zero ao longo de toda a curva). A partir desses dados, calcula-se a pontuação GDT-TS (Global Distance Test -Total Score), que expressa a porcentagem de resíduos corretamente modelados em relação à estrutura real.

A modelagem livre (isto é, predições sem o uso de moldes ou de novo) também é avaliada pelos examinadores de forma visual, já que métricas puramente numéricas não são tão eficazes para detectar semelhanças estruturais sutis nos casos mais desafiadores. Em CASPs anteriores, previsões baseadas em modelos de alta precisão foram analisadas quanto à sua aplicabilidade para substituição molecular na determinação de fases cristalográficas (CASP7), com diversos sucessos posteriormente confirmados. No CASP8, a avaliação passou a considerar a qualidade do modelo completo (e não apenas do traçado do carbono-α) e sua correspondência global com o alvo.

Categorias de avaliação

Os resultados do CASP são organizados nas seguintes categorias de predição:

  • Predição de estrutura terciária (todos os CASPs)
  • Predição de estrutura secundária (descontinuada após o CASP5)
  • Predição de complexos estruturais (avaliada apenas no CASP2; tema hoje tratado separadamente pelo CAPRI)
  • Predição de contatos resíduo-resíduo (introduzida no CASP4)
  • Predição de regiões desordenadas (a partir do CASP5)
  • Predição de limites de domínios (CASP6–CASP8)
  • Predição de função (a partir do CASP6)
  • Avaliação da qualidade do modelo (a partir do CASP7)
  • Refinamento do modelo (a partir do CASP7)
  • Predição de alta precisão baseada em modelos (a partir do CASP7)

A categoria de predição de estrutura terciária passou a incluir três subáreas:

  1. Modelagem por homologia (também chamada de modelagem comparativa)
  2. Reconhecimento de dobra (também chamado de fold recognition ou protein threading; note este nome é incorreto, pois “threading” é apenas um método específico)
  3. Predição de novo (atualmente denominada New fold, já que muitos métodos utilizam funções de pontuação influenciadas por conhecimento prévio de estruturas nativas, como redes neurais).

Evolução das categorias

A partir do CASP7, as categorias foram reestruturadas para refletir avanços na área:

  • Modelagem baseada em templates (TBM): inclui todos os modelos comparativos tradicionais, modelos baseados em dobras homólogas e alguns modelos construídos a partir de dobras análogas.
  • Modelagem sem templates (FM – Free Modeling): inclui modelos de proteínas com dobras inéditas ou baseados em dobras análogas altamente complexas.

Devido ao número limitado de alvos verdadeiramente sem templates, foi introduzido em 2011 o CASP ROLL (experimento contínuo voltado para a avaliação rigorosa de métodos de modelagem livre, com um volume maior de alvos fora da temporada principal do CASP). Diferentemente do LiveBench e do EVA, o CASP ROLL mantém o princípio da predição cega, avaliando modelos contra estruturas que ainda não foram divulgadas.

Publicação dos resultados

Os resultados completos do CASP são publicados como edições suplementares da revista Proteins, disponíveis no site oficial do CASP. Cada suplemento apresenta:

  • um artigo introdutório descrevendo os detalhes específicos daquela edição;
  • um artigo de síntese avaliando o progresso alcançado pela comunidade naquele ciclo.

AlphaFold

Em dezembro de 2018, o CASP13 ganhou destaque internacional quando o desafio foi vencido pelo AlphaFold, programa de inteligência artificial desenvolvido pela DeepMind. Em novembro de 2020, uma versão aprimorada da ferramenta, o AlphaFold2, conquistou novamente o primeiro lugar no CASP14. Segundo John Moult, um dos cofundadores do CASP, o AlphaFold2 alcançou cerca de 90 pontos em uma escala de 100 na precisão de predição para proteínas de dificuldade moderada.

O AlphaFold tornou-se código aberto em 2021,[3] e, no CASP15, realizado em 2022, embora a DeepMind não tenha participado, praticamente todas as equipes de alto desempenho utilizaram o AlphaFold ou variantes baseadas nele - evidenciando o impacto transformador da ferramenta na área.

Referências

  1. «Home - Prediction Center». predictioncenter.org (em inglês). Consultado em 21 de novembro de 2025 
  2. Cozzetto, Domenico; Kryshtafovych, Andriy; Fidelis, Krzysztof; Moult, John; Rost, Burkhard; Tramontano, Anna (janeiro de 2009). «Evaluation of template‐based models in CASP8 with standard measures». Proteins: Structure, Function, and Bioinformatics (em inglês) (S9): 18–28. ISSN 0887-3585. doi:10.1002/prot.22561. Consultado em 21 de novembro de 2025 
  3. Jumper, John; Evans, Richard; Pritzel, Alexander; Green, Tim; Figurnov, Michael; Ronneberger, Olaf; Tunyasuvunakool, Kathryn; Bates, Russ; Žídek, Augustin (15 de julho de 2021). «Highly accurate protein structure prediction with AlphaFold». Nature (7873): 583–589. ISSN 0028-0836. doi:10.1038/s41586-021-03819-2. Consultado em 21 de novembro de 2025