Alfonso Valencia
Profesor ICREA y director de Ciencias de la Vida en el Centro Nacional de Supercomputación de Barcelona (BSC)
El objetivo del estudio es estudiar la utilidad del sistema de procesamiento de lenguaje natural (GPT-3) en la clasificación de casos de alzhéimer basándose en las características de las conversaciones (pausas, intervalos).
En concreto, el estudio compara los resultados del uso de la información destilada del GPT-3 (los llamados embeddings) con otros sistemas, incluyendo distintos embeddings y procesos de entramiento específicos. En todas estas pruebas el sistema basado en los embeddings es más eficaz distinguiendo los casos de los controles y también en pruebas específicas que cuantifican la severidad de los casos (MMSE score). Es concebible que estos resultados mejorarán aún más con sistemas de PLN (Procesamiento de Lenguaje Natural) más avanzados —estos días se habla de un posible GPT-4 en 2023— entrenados con más datos.
El fundamento de este tipo de aplicaciones es la capacidad para encontrar patrones a partir de las correlaciones entre elementos, en este caso, componentes de las conversaciones. Esta es la especialidad de los desarrollos de los sistemas de aprendizaje máquina y en particular lo que hace potentes los sistemas de PLN como el GTP-3 usado en este estudio.
Consideraciones a tener en cuenta son que los datos utilizados proceden de un conjunto de prueba habitualmente utilizado en este campo (ADReSSo Challenge) que tiene un tamaño muy limitado (237 conversaciones) y es muy homogéneo, sin mezclar pacientes de distintas enfermedades. Los autores reconocen la necesidad de validación en conjuntos externos al usado para el estudio. Este es un paso básico para la validación de cualquier sistema que en esta publicación parece haberse omitido.
La parte final de la nota de prensa y del artículo hablan sobre la posible aplicación práctica del sistema, con la desafortunada mención de un posible servidor público. Este sistema está muy lejos de dicha aplicabilidad y la instalación de un servidor público basado en estos resultados sería una muy mala idea con connotaciones éticas muy problemáticas. La posible aplicación médica de este tipo de sistemas, como de cualquier otro basado en AI/ML (Inteligencia Artificial/Machine Learning), es un tema mucho más complejo que requiere resultados robustos y validados sistemáticamente, además de superar una serie de cuestiones éticas sobre confidencialidad, fiabilidad y utilidad.
Siendo positivo, es interesante que estas tecnologías se apliquen a problemas médicos en los que pueden contribuir a la investigación sobre enfermedades como el alzhéimer, donde la capacidad de la AI/ML para detectar patrones complejos en los datos puede ser de gran utilidad.