La investigación podría conducir a una amplia abanico de objetivos farmacológicos
Investigadores de UT Southwestern y la Universidad de Washington dirigieron un equipo internacional que utilizó inteligencia artificial (IA) y análisis evolutivo para producir modelos 3D de interacciones de proteínas eucariotas. El estudio, publicado en Ciencias, identificó más de 100 complejos proteicos probables por primera vez y proporcionó modelos estructurales para más de 700 complejos previamente no caracterizados. La comprensión de cómo los pares o grupos de proteínas encajan para llevar a cabo procesos celulares podría conducir a una amplia gama de nuevos objetivos farmacológicos.
«Nuestros hallazgos representan un avance significativo en la nueva era de la biología estructural donde la computación juega un papel fundamental», dijo Qian Cong, Ph.D., profesor asistente en el Centro Eugene McDermott para el Crecimiento y el Desarrollo Humano con un título secundario en Biofísica.
La Dra. Cong realizó el estudio con David Baker, Ph.D., profesor de bioquímica y mentora postdoctoral de la Dra. Cong en la Universidad de Washington antes de su contratación en UT Southwestern. El estudio tiene cuatro coautores principales, incluido el biólogo computacional Jimin Pei, Ph.D. de UT Southwestern.
Las proteínas a menudo operan en pares o grupos conocidos como complejos para realizar cualquier tarea necesaria para mantener vivo a un organismo, explicó el Dr. Cong. Si bien algunas de estas interacciones están bien investigadas, muchas siguen siendo un misterio. La construcción de interactomas completos, o descripciones del conjunto completo de interacciones moleculares en una célula, arrojaría luz sobre muchos aspectos fundamentales de la biología y brindaría a los investigadores un nuevo punto de partida para el desarrollo de fármacos que fomenten o desalienten estas interacciones. El Dr. Cong trabaja en el campo emergente de la interactómica, que combina bioinformática y biología.
Hasta hace poco, una de las principales barreras para construir un interactoma era la incertidumbre sobre las estructuras de muchas proteínas, un problema que los científicos han estado tratando de resolver durante medio siglo. En 2020 y 2021, una empresa llamada DeepMind y el laboratorio del Dr. Baker lanzaron de forma independiente dos tecnologías de IA llamadas AlphaFold (AF) y RoseTTAFold (RF) que utilizan diferentes estrategias para predecir estructuras de proteínas basadas en las secuencias de los genes que las hacen producir.
En el estudio actual, el Dr. Cong, el Dr. Baker y sus colegas expandieron las herramientas de predicción de estructuras de la inteligencia artificial al modelar muchos complejos de proteínas de levadura. La levadura es un organismo modelo común para estudios biológicos fundamentales. Para encontrar proteínas que podrían haber interactuado, los científicos primero buscaron en los genomas de hongos relacionados genes que adquirieran mutaciones de una manera relacionada. Luego utilizaron las dos tecnologías de inteligencia artificial para determinar si estas proteínas podrían adaptarse juntas en estructuras 3D.
Su trabajo identificó 1.505 probables complejos de proteínas. De estos, 699 ya habían sido caracterizados estructuralmente, verificando la utilidad de su método. Sin embargo, solo había datos experimentales limitados que respaldaban 700 de las interacciones predichas, y otras 106 nunca se habían descrito.
Para comprender mejor estos complejos desconocidos o mal caracterizados, los equipos de la Universidad de Washington y UT Southwestern trabajaron con colegas de todo el mundo que ya estaban estudiando estas proteínas o proteínas similares. Al combinar los modelos 3D generados por los científicos en el estudio actual con información de los colaboradores, los equipos pudieron obtener nuevos conocimientos sobre los complejos de proteínas involucrados en el mantenimiento y procesamiento de la información genética, la construcción celular y los sistemas de transporte. En el metabolismo, el ADN reparación y otras áreas. También identificaron roles para proteínas cuyas funciones eran previamente desconocidas en base a sus interacciones recientemente identificadas con otras proteínas bien caracterizadas.
«El trabajo descrito en nuestro nuevo artículo sienta las bases para estudios similares sobre el interactoma humano y podría ayudar potencialmente en el desarrollo de nuevos tratamientos para enfermedades humanas», agregó el Dr. Cong.
El Dr. Cong señaló que las estructuras del complejo de proteínas predichas generadas en este estudio están disponibles para su descarga en ModelArchive (https://modelarchive.org/doi/10.5452/ma-bak-cepc). Estas estructuras y otras generadas con esta tecnología en estudios futuros serán una rica fuente de preguntas de investigación en los próximos años, dijo.
El Dr. Cong es un becario de la Southwestern Medical Foundation en investigación biomédica. Otros investigadores de UTSW que contribuyeron a este estudio incluyen a Jing Zhang y Josep Rizo, Ph.D., quien ocupa la Cátedra Virginia Lazenby O’Hara en Bioquímica.
Las instituciones colaboradoras incluyen: Harvard University, Wayne State University, Cornell University, MRC Laboratory of Molecular Biology, Memorial Sloan Kettering Cancer Center, Gerstner Sloan Kettering Graduate School of Biomedical Sciences, Fred Hutchinson Cancer Research Center, Columbia University, University of Würzburg en Alemania, St Jude Children’s Research Hospital, FIRC Institute of Molecular Oncology en Milán, Italia, y el National Research Council, Institute of Molecular Genetics en Roma, Italia.
Este trabajo fue apoyado por Southwestern Medical Foundation, Cancer Prevention and Research Institute of Texas (CPRIT) (RP210041), Amgen, Microsoft, Washington Research Foundation, Howard Hughes Medical Institute, National Science Foundation (DBI 1937533), National Institutes of Health (R35GM118026 , R01CA221858, R35GM136258, R21AI156595), Consejo de Investigación Médica del Reino Unido (MRC_UP_1201 / 10), Beca HHMI Gilliam, Deutsche Forschungsgemeinschaft (KI-562 / 11-1, KI-562 / 7-1), Consolidador del Consejo Europeo de Investigación y AIRC (IG23710 y 682190), Agencia de Reducción de Amenazas de Defensa (HDTRA1-21-1-0007) y Centro Nacional de Computación Científica de Investigación Energética.