Gonzalo Jiménez-Oses
Profesor de investigación Ikerbasque en el Laboratorio de Química Computacional del CIC bioGUNE
El artículo describe un experimento que evalúa indirectamente —mediante un ensayo genómico celular basado en constructos de fusión— la capacidad de agregación de secuencias de aminoácidos aleatorias correspondientes a péptidos de 20 residuos. La gran mayoría de estas secuencias resultó no agregante. Sin embargo, el elevado número de secuencias analizadas permitió entrenar una red neuronal de arquitectura sencilla capaz de clasificar dichos péptidos como agregantes o no agregantes.
El modelo confirma conocimientos previos sobre algunos de los principales determinantes de la agregación, como los motivos hidrofóbicos y ricos en láminas β. Aunque su capacidad predictiva para proteínas nativas de mayor tamaño y estructura globular sigue siendo limitada, y existe una marcada dependencia posicional de la secuencia, el trabajo supone un avance en la investigación de la propensión intrínseca de agregación que pueden presentar los péptidos cortos, con aplicaciones en el ámbito farmacéutico.
Asimismo, ilustra la importancia de generar conjuntos de datos experimentales amplios, diversos y estandarizados de alta calidad para el desarrollo de modelos de IA aplicados a la biofísica de proteínas y, en general, a la ciencia.