Un grupo de investigadores del Departament de Bioquímica i Biotecnologia de la URV han diseñado un modelo de inteligencia artificial que se adelanta a las próximas mutaciones del SARS-CoV-2 y predice cómo van a ser las futuras variantes del coronavirus que en 2020 generó la emergencia sanitaria.
«Se trata de una metodología que aprende de los centenares de miles de genomas del virus que se han obtenido en los últimos dos años y medio y que se encuentran en la base de datos Gisaid», indica el investigador Gerard Pujadas, profesor de Bioquímica y Biología Molecular.
El estudio se publicará en unos días en la revista ‘International Journal of Molecular Sciences’. El informe ha sido liderado por el profesor Santi Garcia-Vallvé, del Grupo de Investigación en Quimioinformática y Nutrición. Forma parte de la tesis del doctorando Bryan Saldivar. «Predecir las próximas mutaciones es muy útil para poder diseñar fármacos antivirales, o incluso vacunas que puedan ser de utilidad para las futuras variantes del SARS-CoV-2», explica Saldivar.
Garcia-Vallvé detalla el origen de la investigación: «Hay una serie de mutaciones debidas al azar o a errores cuando el virus se replica y que son muy difíciles de predecir. Pero nosotros y el resto de comunidad científica vimos que había un tipo de mutaciones que se daban más que otros cambios y que podrían estar causadas por nosotros, por enzimas que necesitamos y que pueden ser un mecanismo de defensa contra la infección».
Los científicos vieron que había mutaciones recurrentes: se daban más de una vez y de forma independiente. A partir de ahí vino el desarrollo del modelo predictivo. «Reservamos cuatro lugares importantes del genoma, como la parte que codifica la proteína Spike –la puerta de entrada a la infección– y vimos si podíamos predecir las mutaciones de estas zonas», apunta Garcia-Vallvé.
El grupo comprobó que el método tenía poder predictivo. «El modelo es lo suficientemente robusto para predecir mutaciones a largo plazo, ya que algunos falsos positivos dentro de un marco de tiempo limitado se convierten en verdaderos en un periodo prolongado de tiempo», explica el estudio. De alguna forma, el trabajo se estaba anticipando. «Cada vez se van acumulando más genomas en las bases de datos. Utilizamos los datos hasta enero de 2021. Algunas de las mutaciones que tenían que ser recurrentes, según nuestros patrones, no las observábamos en su momento pero sí vimos que se producían más tarde», apunta Garcia-Vallvé.
Anticipación
Anticiparse a las futuras cepas puede ser clave para la ciencia, puesto que en ocasiones la mutación provoca una optimización del virus. Nombres como Delta y Ómicron se han convertido en habituales durante las diferentes oleadas de la pandemia.
Además, es una puerta de entrada para localizar más componentes farmacológicos con los que combatir no solo la Covid. «Esta metodología nos sirve para estar más preparados, también de cara a futuras pandemias. Otros coronavirus funcionan igual, así que puede ser útil para predecir qué mutaciones se podrían observar», cuenta Garcia-Vallvé. «Estos resultados se pueden usar para encontrar medicamentos antivirales», apunta la publicación, fruto de tratar un ingente volumen de información. Para crear el modelo, se analizaron 877.000 genomas del virus y 4,6 millones para evaluarlo.