Descubrimiento científico en la era de la inteligencia artificial
Nature volumen 620, páginas 47–60 (2023)Cite este artículo
197 altmétrico
Detalles de métricas
La inteligencia artificial (IA) se está integrando cada vez más en los descubrimientos científicos para aumentar y acelerar la investigación, ayudando a los científicos a generar hipótesis, diseñar experimentos, recopilar e interpretar grandes conjuntos de datos y obtener conocimientos que tal vez no hubieran sido posibles utilizando únicamente los métodos científicos tradicionales. Aquí examinamos los avances de la última década que incluyen el aprendizaje autosupervisado, que permite entrenar modelos con grandes cantidades de datos sin etiquetar, y el aprendizaje profundo geométrico, que aprovecha el conocimiento sobre la estructura de los datos científicos para mejorar la precisión y eficiencia del modelo. Los métodos de IA generativa pueden crear diseños, como proteínas y fármacos de moléculas pequeñas, mediante el análisis de diversas modalidades de datos, incluidas imágenes y secuencias. Discutimos cómo estos métodos pueden ayudar a los científicos a lo largo del proceso científico y las cuestiones centrales que persisten a pesar de tales avances. Tanto los desarrolladores como los usuarios de herramientas de IA necesitan comprender mejor cuándo es necesario mejorar dichos enfoques, y los desafíos planteados por la mala calidad y administración de los datos persisten. Estas cuestiones trascienden todas las disciplinas científicas y requieren el desarrollo de enfoques algorítmicos fundamentales que puedan contribuir a la comprensión científica o adquirirla de forma autónoma, lo que las convierte en áreas críticas de enfoque para la innovación en IA.
Esta es una vista previa del contenido de la suscripción, acceda a través de su institución
Acceda a Nature y a otras 54 revistas de Nature Portfolio
Obtenga Nature+, nuestra suscripción de acceso en línea con la mejor relación calidad-precio
$29.99 / 30 días
cancelar en cualquier momento
Suscríbete a esta revista
Reciba 51 números impresos y acceso en línea
$199.00 por año
sólo $3.90 por número
Alquila o compra este artículo
Los precios varían según el tipo de artículo.
desde $ 1,95
a$39.95
Los precios pueden estar sujetos a impuestos locales que se calculan durante el pago.
LeCun, Y., Bengio, Y. y Hinton, G. Aprendizaje profundo. Naturaleza 521, 436–444 (2015). Esta encuesta resume los elementos clave del aprendizaje profundo y su desarrollo en el reconocimiento de voz, la visión por computadora y el procesamiento del lenguaje natural.
Artículo ADS CAS PubMed Google Scholar
de Regt, HW Comprensión, valores y objetivos de la ciencia. Fil. Ciencia. 87, 921–932 (2020).
Artículo MathSciNet Google Scholar
Pickstone, JV Formas de conocer: una nueva historia de la ciencia, la tecnología y la medicina (Univ. Chicago Press, 2001).
Han, J. y col. Potencial profundo: una representación general de una superficie de energía potencial de muchos cuerpos. Comunitario. Computadora. Física. 23, 629–639 (2018). Este artículo presentó una arquitectura de red neuronal profunda que aprende la superficie de energía potencial de sistemas de muchos cuerpos respetando al mismo tiempo las simetrías subyacentes del sistema mediante la incorporación de la teoría de grupos.
Akiyama, K. y col. Primeros resultados del Telescopio Horizonte de Sucesos M87. IV. Imágenes del agujero negro supermasivo central. Astrofia. J. Lett. 875, L4 (2019).
Artículo ADS CAS Google Scholar
Wagner, AZ Construcciones en combinatoria mediante redes neuronales. Preimpresión en https://arxiv.org/abs/2104.14516 (2021).
Coley, CW y cols. Una plataforma robótica para la síntesis de flujo de compuestos orgánicos basada en la planificación de IA. Ciencia 365, eaax1566 (2019).
Artículo CAS PubMed Google Scholar
Bommasani, R. y col. Sobre las oportunidades y riesgos de los modelos de fundación. Preimpresión en https://arxiv.org/abs/2108.07258 (2021).
Davies, A. y col. Avanzar en las matemáticas guiando la intuición humana con IA. Naturaleza 600, 70–74 (2021). Este artículo explora cómo la IA puede ayudar al desarrollo de las matemáticas puras guiando la intuición matemática.
Artículo ADS CAS PubMed PubMed Central MATH Google Scholar
Saltador, J. et al. Predicción de estructura de proteínas de alta precisión con AlphaFold. Nature 596, 583–589 (2021). Este estudio fue el primero en demostrar la capacidad de predecir estructuras de plegamiento de proteínas utilizando métodos de IA con un alto grado de precisión, logrando resultados que están en la resolución experimental o cerca de ella. Este logro es particularmente digno de mención, ya que predecir el plegamiento de proteínas ha sido un gran desafío en el campo de la biología molecular durante más de 50 años.
Artículo ADS CAS PubMed PubMed Central Google Scholar
Stokes, JM y cols. Un enfoque de aprendizaje profundo para el descubrimiento de antibióticos. Celda 180, 688–702 (2020).
Artículo CAS PubMed PubMed Central Google Scholar
Bohacek, RS, McMartin, C. y Guida, WC El arte y la práctica del diseño de fármacos basado en estructuras: una perspectiva del modelado molecular. Medicina. Res. Rev. 16, 3–50 (1996).
3.0.CO;2-6" data-track-action="article reference" href="https://doi.org/10.1002%2F%28SICI%291098-1128%28199601%2916%3A1%3C3%3A%3AAID-MED1%3E3.0.CO%3B2-6" aria-label="Article reference 12" data-doi="10.1002/(SICI)1098-1128(199601)16:13.0.CO;2-6">Artículo CAS PubMed Google Scholar
Bileschi, ML et al. Utilizar el aprendizaje profundo para anotar el universo proteico. Nat. Biotecnología. 40, 932–937 (2022).
Bellemare, MG et al. Navegación autónoma de globos estratosféricos mediante aprendizaje por refuerzo. Naturaleza 588, 77–82 (2020). Este artículo describe un algoritmo de aprendizaje por refuerzo para navegar un globo de superpresión en la estratosfera, tomando decisiones en tiempo real en un entorno cambiante.
Artículo ADS CAS PubMed Google Scholar
Tshitoyan, V. et al. Las incrustaciones de palabras no supervisadas capturan conocimientos latentes de la literatura sobre ciencia de materiales. Naturaleza 571, 95–98 (2019).
Artículo ADS CAS PubMed Google Scholar
Zhang, L. y col. Dinámica molecular de potencial profundo: un modelo escalable con la precisión de la mecánica cuántica. Física. Rev. Lett. 120, 143001 (2018).
Artículo ADS CAS PubMed Google Scholar
Deiana, AM et al. Aplicaciones y técnicas para el aprendizaje automático rápido en ciencia. Frente. Grandes datos 5, 787421 (2022).
Karagiorgi, G. y col. Aprendizaje automático en la búsqueda de nueva física fundamental. Nat. Rev. Phys. 4, 399–412 (2022).
Zhou, C. & Paffenroth, RC Detección de anomalías con codificadores automáticos profundos y robustos. En Conferencia internacional ACM SIGKDD sobre descubrimiento de conocimientos y minería de datos 665–674 (2017).
Hinton, GE y Salakhutdinov, RR Reducción de la dimensionalidad de los datos con redes neuronales. Ciencia 313, 504–507 (2006).
Artículo ADS MathSciNet CAS PubMed MATH Google Scholar
Kasieczka, G. y col. Los Juegos Olímpicos del LHC 2020 son un desafío comunitario para la detección de anomalías en física de altas energías. Prog. Rep. Física. 84, 124201 (2021).
Artículo ADS CAS Google Scholar
Govorkova, E. y col. Codificadores automáticos en conjuntos de puertas programables en campo para la detección de nueva física no supervisada en tiempo real a 40 MHz en el Gran Colisionador de Hadrones. Nat. Mach. Intel. 4, 154-161 (2022).
Artículo de Google Scholar
Chamberland, M. y col. Detección de desviaciones microestructurales en individuos con tractometría de resonancia magnética de difusión profunda. Nat. Computadora. Ciencia. 1, 598–606 (2021).
Artículo PubMed PubMed Central Google Scholar
Rafique, M. et al. Regresor delegado, un enfoque sólido para la detección automatizada de anomalías en los datos de series temporales de radón del suelo. Ciencia. Rep. 10, 3004 (2020).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Pastore, VP et al. Aprendizaje de plancton sin anotaciones para clasificación y detección de anomalías. Ciencia. Rep. 10, 12142 (2020).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Naul, B. et al. Una red neuronal recurrente para la clasificación de estrellas variables muestreadas de manera desigual. Nat. Astron. 2, 151-155 (2018).
ADS del artículo Google Scholar
Lee, D.-H. et al. Pseudoetiqueta: el método de aprendizaje semisupervisado simple y eficiente para redes neuronales profundas. En Taller ICML sobre desafíos en el aprendizaje de representación (2013).
Zhou, D. y col. Aprender con consistencia local y global. En Avances en sistemas de procesamiento de información neuronal 16, 321–328 (2003).
Radivojac, P. y col. Una evaluación a gran escala de la predicción computacional de la función de proteínas. Nat. Métodos 10, 221–227 (2013).
Artículo CAS PubMed PubMed Central Google Scholar
Barkas, N. y col. Análisis conjunto de colecciones heterogéneas de conjuntos de datos de RNA-seq unicelulares. Nat. Métodos 16, 695–698 (2019).
Artículo CAS PubMed PubMed Central Google Scholar
Tran, K. & Ulissi, ZW Aprendizaje activo en intermetálicos para guiar el descubrimiento de electrocatalizadores para la reducción de CO2 y la evolución de H2. Nat. Catalán. 1, 696–703 (2018).
Artículo CAS Google Scholar
Jablonka, KM y cols. Aprendizaje activo multiobjetivo libre de prejuicios para el diseño y descubrimiento de materiales. Nat. Comunitario. 12, 2312 (2021).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Roussel, R. et al. Exploración espacial de parámetros restringidos llave en mano para aceleradores de partículas mediante aprendizaje activo bayesiano. Nat. Comunitario. 12, 5612 (2021).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Ratner, AJ y cols. Programación de datos: creación de grandes conjuntos de entrenamiento, rápidamente. En Avances en sistemas de procesamiento de información neuronal 29, 3567–3575 (2016).
Ratner, A. y col. Snorkel: creación rápida de datos de entrenamiento con supervisión débil. En Conferencia internacional sobre bases de datos muy grandes 11, 269–282 (2017). Este artículo presenta un sistema de inteligencia artificial débilmente supervisado diseñado para anotar cantidades masivas de datos mediante funciones de etiquetado.
Mantequilla, A. et al. Muestras de eventos GANplifying. SciPost Phys. 10, 139 (2021).
ADS del artículo Google Scholar
Brown, T. y col. Los modelos de lenguaje son aprendices de pocas oportunidades. En Avances en los sistemas de procesamiento de información neuronal 33, 1877–1901 (2020).
Ramesh, A. y col. Generación de texto a imagen de disparo cero. En Conferencia internacional sobre aprendizaje automático 139, 8821–8831 (2021).
Littman, ML El aprendizaje por refuerzo mejora el comportamiento a partir de la retroalimentación evaluativa. Naturaleza 521, 445–451 (2015).
Artículo ADS CAS PubMed Google Scholar
Cubuk, ED y cols. Aumento automático: aprendizaje de estrategias de aumento a partir de datos. En Conferencia IEEE sobre visión por computadora y reconocimiento de patrones 113–123 (2019).
Reed, CJ y cols. Selfaugment: políticas de aumento automático para el aprendizaje autosupervisado. En la Conferencia IEEE sobre visión por computadora y reconocimiento de patrones 2674–2683 (2021).
Colaboración ATLAS et al. Modelos generativos profundos para una rápida simulación de lluvia de fotones en ATLAS. Preimpresión en https://arxiv.org/abs/2210.06204 (2022).
Mahmood, F. y col. Entrenamiento adversario profundo para la segmentación de núcleos multiorgánicos en imágenes de histopatología. Traducción IEEE. Medicina. Imágenes 39, 3257–3267 (2019).
Artículo de Google Scholar
Teixeira, B. et al. Generación de imágenes de rayos X sintéticas de una persona a partir de la geometría de la superficie. En la Conferencia IEEE sobre visión por computadora y reconocimiento de patrones 9059–9067 (2018).
Lee, D., Moon, W.-J. & Ye, JC Evaluación de la importancia de los contrastes de resonancia magnética utilizando redes colaborativas generativas adversarias. Nat. Mach. Intel. 2, 34–42 (2020).
Artículo de Google Scholar
Kench, S. & Cooper, SJ Generación de estructuras tridimensionales a partir de un segmento bidimensional con expansión de dimensionalidad generativa basada en redes adversas. Nat. Mach. Intel. 3, 299–305 (2021).
Artículo de Google Scholar
Wan, C. & Jones, DT La predicción de la función de la proteína se mejora mediante la creación de muestras de características sintéticas con redes generativas adversarias. Nat. Mach. Intel. 2, 540–550 (2020).
Artículo de Google Scholar
Repečka, D. et al. Ampliar los espacios de secuencia de proteínas funcionales utilizando redes generativas adversarias. Nat. Mach. Intel. 3, 324–333 (2021).
Artículo de Google Scholar
Marouf, M. y col. Generación realista in silico y aumento de datos de secuenciación de ARN unicelulares utilizando redes generativas adversarias. Nat. Comunitario. 11, 166 (2020).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Ghahramani, Z. Aprendizaje automático probabilístico e inteligencia artificial. Nature 521, 452–459 (2015). Esta encuesta proporciona una introducción al aprendizaje automático probabilístico, que implica la representación y manipulación de la incertidumbre en modelos y predicciones, desempeñando un papel central en el análisis de datos científicos.
Artículo ADS CAS PubMed Google Scholar
Cogan, J. y col. Imágenes de jet: técnicas inspiradas en la visión por computadora para etiquetar jet. J. Física de alta energía. 2015, 118 (2015).
Artículo de Google Scholar
Zhao, W. y col. La deconvolución escasa mejora la resolución de la microscopía de fluorescencia de superresolución de células vivas. Nat. Biotecnología. 40, 606–617 (2022).
Artículo CAS PubMed Google Scholar
Brbić, M. et al. MARTE: descubrimiento de nuevos tipos de células a través de experimentos unicelulares heterogéneos. Nat. Métodos 17, 1200–1206 (2020).
Artículo PubMed Google Scholar
Qiao, C. y col. Evaluación y desarrollo de redes neuronales profundas para superresolución de imágenes en microscopía óptica. Nat. Métodos 18, 194–202 (2021).
Artículo CAS PubMed Google Scholar
Andreassen, A. et al. OmniFold: un método para desplegar simultáneamente todos los observables. Física. Rev. Lett. 124, 182001 (2020).
Artículo ADS CAS PubMed Google Scholar
Bergenstråhle, L. et al. Transcriptómica espacial súper resuelta mediante fusión profunda de datos. Nat. Biotecnología. 40, 476–479 (2021).
Vicente, P. et al. Extracción y composición de funciones sólidas con codificadores automáticos de eliminación de ruido. En Conferencia internacional sobre aprendizaje automático 1096–1103 (2008).
Kingma, DP y Welling, M. Bayes variacional de codificación automática. En Conferencia Internacional sobre Representaciones del Aprendizaje (2014).
Eraslan, G. et al. Eliminación de ruido de secuencia de ARN unicelular mediante un codificador automático de recuento profundo. Nat. Comunitario. 10, 390 (2019).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Goodfellow, I., Bengio, Y. y Courville, A. Aprendizaje profundo (MIT Press, 2016).
Olshausen, BA & Field, DJ Aparición de propiedades de campos receptivos de células simples mediante el aprendizaje de un código disperso para imágenes naturales. Naturaleza 381, 607–609 (1996).
Artículo ADS CAS PubMed Google Scholar
Bengio, Y. Aprendizaje profundo de representaciones para aprendizaje no supervisado y por transferencia. En Taller ICML sobre aprendizaje por transferencia y no supervisado (2012).
Detlefsen, NS, Hauberg, S. y Boomsma, W. Aprendizaje de representaciones significativas de secuencias de proteínas. Nat. Comunitario. 13, 1914 (2022).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Becht, E. et al. Reducción de dimensionalidad para visualizar datos de una sola celda usando UMAP. Nat. Biotecnología. 37, 38–44 (2019).
Artículo CAS Google Scholar
Bronstein, MM y cols. Aprendizaje profundo geométrico: yendo más allá de los datos euclidianos. Mag. de proceso de señal IEEE. 34, 18–42 (2017).
ADS del artículo Google Scholar
Anderson, PW Más es diferente: la simetría rota y la naturaleza de la estructura jerárquica de la ciencia. Ciencia 177, 393–396 (1972).
Artículo ADS CAS PubMed Google Scholar
Qiao, Z. y col. Informar el aprendizaje profundo geométrico con interacciones electrónicas para acelerar la química cuántica. Proc. Acad. Nacional. Ciencia. Estados Unidos 119, e2205221119 (2022).
Bogatskiy, A. et al. Arquitecturas equivariantes de grupos de simetría para física. Preimpresión en https://arxiv.org/abs/2203.06153 (2022).
Bronstein, MM y cols. Aprendizaje profundo geométrico: cuadrículas, grupos, gráficos, geodésicas y medidores. Preimpresión en https://arxiv.org/abs/2104.13478 (2021).
Townshend, RJL y cols. Aprendizaje profundo geométrico de la estructura del ARN. Ciencia 373, 1047–1051 (2021).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Wicky, BIM y otros. Alucinantes conjuntos de proteínas simétricos. Ciencia 378, 56–61 (2022).
Kipf, TN y Welling, M. Clasificación semisupervisada con redes convolucionales de gráficos. En Conferencia Internacional sobre Representaciones del Aprendizaje (2017).
Veličković, P. et al. Graficar redes de atención. En Conferencia Internacional sobre Representaciones del Aprendizaje (2018).
Hamilton, WL, Ying, Z. & Leskovec, J. Aprendizaje de representación inductiva en gráficos grandes. En Avances en sistemas de procesamiento de información neuronal 30, 1024–1034 (2017).
Gilmer, J. y col. Mensaje neuronal que pasa por la química cuántica. En Conferencia internacional sobre aprendizaje automático 1263–1272 (2017).
Li, MM, Huang, K. y Zitnik, M. Aprendizaje de representación gráfica en biomedicina y atención sanitaria. Nat. Biomédica. Ing. 6, 1353-1369 (2022).
Satorras, VG, Hoogeboom, E. & Welling, M. Redes neuronales de gráficos equivariantes E (n). En Conferencia internacional sobre aprendizaje automático 9323–9332 (2021). Este estudio incorpora principios de la física en el diseño de modelos neuronales, avanzando en el campo del aprendizaje automático equivariante.
Thomas, N. y col. Redes de campo tensorial: redes neuronales equivalentes de rotación y traslación para nubes de puntos 3D. Preimpresión en https://arxiv.org/abs/1802.08219 (2018).
Finzi, M. y col. Generalización de redes neuronales convolucionales para equivarianza para grupos de mentiras en datos continuos arbitrarios. En Conferencia internacional sobre aprendizaje automático 3165–3176 (2020).
Fuchs, F. y col. Transformadores SE (3): redes de atención equivariantes de rototraducción 3D. En Avances en sistemas de procesamiento de información neuronal 33, 1970-1981 (2020).
Zaheer, M. y col. Series profundas. En Avances en sistemas de procesamiento de información neuronal 30, 3391–3401 (2017). Este artículo es un estudio inicial que explora el uso de arquitecturas neuronales profundas en datos establecidos, que consisten en una lista desordenada de elementos.
Cohen, TS y cols. CNN esféricas. En Conferencia Internacional sobre Representaciones del Aprendizaje (2018).
Gordon, J. y col. Modelos equivariantes de permutación para la generalización compositiva en el lenguaje. En Conferencia Internacional sobre Representaciones del Aprendizaje (2019).
Finzi, M., Welling, M. & Wilson, AG Un método práctico para construir perceptrones multicapa equivariantes para grupos de matrices arbitrarios. En Conferencia internacional sobre aprendizaje automático 3318–3328 (2021).
Dijk, DV y cols. Recuperación de interacciones genéticas a partir de datos unicelulares mediante difusión de datos. Celda 174, 716–729 (2018).
Artículo PubMed PubMed Central Google Scholar
Gainza, P. et al. Descifrar huellas dactilares de interacción de superficies moleculares de proteínas mediante aprendizaje profundo geométrico. Nat. Métodos 17, 184–192 (2020).
Artículo CAS PubMed Google Scholar
Hatfield, PW y cols. El futuro impulsado por los datos de la física de alta densidad de energía. Naturaleza 593, 351–361 (2021).
Artículo ADS CAS PubMed Google Scholar
Bapst, V. y col. Revelando el poder predictivo de la estructura estática en sistemas vítreos. Nat. Física. 16, 448–454 (2020).
Artículo CAS Google Scholar
Zhang, R., Zhou, T. & Ma, J. Análisis Hi-C unicelular integrador y multiescala con Higashi. Nat. Biotecnología. 40, 254–261 (2022).
Artículo CAS PubMed Google Scholar
Sammut, S.-J. et al. Predictor de aprendizaje automático multiómico de la respuesta a la terapia del cáncer de mama. Naturaleza 601, 623–629 (2022).
Artículo ADS CAS PubMed Google Scholar
DeZoort, G. y col. Grafique redes neuronales en el Gran Colisionador de Hadrones. Nat. Rev. Phys. 5, 281–303 (2023).
Liu, S. y col. Representación de gráficos moleculares previos al entrenamiento con geometría 3D. En Conferencia Internacional sobre Representaciones del Aprendizaje (2022).
La colaboración científica LIGO. et al. Una medición de sirena estándar de ondas gravitacionales de la constante de Hubble. Naturaleza 551, 85–88 (2017).
Artículo de Google Scholar
Reichstein, M. y col. Aprendizaje profundo y comprensión de procesos para la ciencia del sistema terrestre basada en datos. Naturaleza 566, 195–204 (2019).
Artículo ADS CAS PubMed Google Scholar
Goenka, SD y cols. Identificación acelerada de variantes que causan enfermedades con secuenciación ultrarrápida del genoma de nanoporos. Nat. Biotecnología. 40, 1035-1041 (2022).
Bengio, Y. et al. Entrenamiento codicioso por capas de redes profundas. En Avances en los sistemas de procesamiento de información neuronal 19, 153–160 (2006).
Hinton, GE, Osindero, S. y Teh, Y.-W. Un algoritmo de aprendizaje rápido para redes de creencias profundas. Computación neuronal. 18, 1527-1554 (2006).
Artículo MathSciNet PubMed MATH Google Scholar
Jordan, MI y Mitchell, TM Aprendizaje automático: tendencias, perspectivas y perspectivas. Ciencia 349, 255–260 (2015).
Artículo ADS MathSciNet CAS PubMed MATH Google Scholar
Devlin, J. y col. BERT: preentrenamiento de transformadores bidireccionales profundos para la comprensión del lenguaje. En el Capítulo norteamericano de la Asociación de Lingüística Computacional 4171–4186 (2019).
Rives, A. et al. La estructura y función biológicas surgen de la ampliación del aprendizaje no supervisado a 250 millones de secuencias de proteínas. Proc. Acad. Nacional. Ciencia. Estados Unidos 118, e2016239118 (2021).
Elnaggar, A. y col. ProtTrans: busca descifrar el lenguaje del código de la vida mediante aprendizaje profundo autosupervisado y computación de alto rendimiento. En Transacciones IEEE sobre análisis de patrones e inteligencia artificial (2021).
Hola, B. et al. Aprendiendo el lenguaje de la evolución y el escape viral. Science 371, 284–288 (2021). En este artículo se modeló el escape viral con algoritmos de aprendizaje automático desarrollados originalmente para el lenguaje natural humano.
Artículo ADS MathSciNet CAS PubMed MATH Google Scholar
Biswas, S. y col. Ingeniería de proteínas con bajo contenido de N con aprendizaje profundo eficiente en datos. Nat. Métodos 18, 389–396 (2021).
Artículo CAS PubMed Google Scholar
Ferruz, N. & Höcker, B. Diseño de proteínas controlables con modelos de lenguaje. Nat. Mach. Intel. 4, 521–532 (2022).
Hsu, C. y col. Aprender el plegado inverso de millones de estructuras predichas. En Conferencia internacional sobre aprendizaje automático 8946–8970 (2022).
Baek, M. y col. Predicción precisa de estructuras e interacciones de proteínas utilizando una red neuronal de tres vías. Ciencia 373, 871–876 (2021). Inspirándose en AlphaFold2, este estudio informó sobre RoseTTAFold, un novedoso módulo neuronal de tres pistas capaz de procesar simultáneamente la secuencia, la distancia y las coordenadas de las proteínas.
Artículo ADS CAS PubMed PubMed Central Google Scholar
Weininger, D. SMILES, un lenguaje químico y un sistema de información. 1. Introducción a la metodología y reglas de codificación. J. química. inf. Computadora. Ciencia. 28, 31–36 (1988).
Artículo CAS Google Scholar
Lin, T.-S. et al. BigSMILES: una notación lineal basada estructuralmente para describir macromoléculas. Céntimo ACS. Ciencia. 5, 1523-1531 (2019).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Krenn, M. y col. SELFIES y el futuro de las representaciones de cuerdas moleculares. Patrones 3, 100588 (2022).
Flam-Shepherd, D., Zhu, K. y Aspuru-Guzik, A. Los modelos de lenguaje pueden aprender distribuciones moleculares complejas. Nat. Comunitario. 13, 3293 (2022).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Skinnider, MA y cols. Los modelos de lenguaje químico permiten la navegación en un espacio químico escasamente poblado. Nat. Mach. Intel. 3, 759–770 (2021).
Artículo de Google Scholar
Chithrananda, S., Grand, G. & Ramsundar, B. ChemBERTa: preentrenamiento autosupervisado a gran escala para la predicción de propiedades moleculares. En Taller de Aprendizaje Automático para Moléculas en NeurIPS (2020).
Schwaller, P. y col. Predecir rutas retrosintéticas utilizando modelos basados en transformadores y una estrategia de exploración de hipergráficos. Química. Ciencia. 11, 3316–3325 (2020).
Artículo CAS PubMed PubMed Central Google Scholar
Tetko, IV y cols. Modelos de transformadores PNL aumentados de última generación para retrosíntesis directa y de un solo paso. Nat. Comunitario. 11, 5575 (2020).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Schwaller, P. y col. Mapeo del espacio de reacciones químicas utilizando redes neuronales basadas en la atención. Nat. Mach. Intel. 3, 144-152 (2021).
Artículo de Google Scholar
Kovács, DP, McCorkindale, W. & Lee, AA La interpretación cuantitativa explica los modelos de aprendizaje automático para la predicción de reacciones químicas y descubre sesgos. Nat. Comunitario. 12, 1695 (2021).
Artículo ADS PubMed PubMed Central Google Scholar
Pesciullesi, G. et al. El aprendizaje por transferencia permite al transformador molecular predecir reacciones regio y estereoselectivas en los carbohidratos. Nat. Comunitario. 11, 4874 (2020).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Vaswani, A. y col. Atención es todo lo que necesitas. En Avances en sistemas de procesamiento de información neuronal 30, 5998–6008 (2017). Este artículo presentó el transformador, una arquitectura de red neuronal moderna que puede procesar datos secuenciales en paralelo, revolucionando el procesamiento del lenguaje natural y el modelado de secuencias.
Mousavi, SM et al. Transformador sísmico: un modelo atento de aprendizaje profundo para la detección simultánea de terremotos y la selección de fases. Nat. Comunitario. 11, 3952 (2020).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Avsec, Ž. et al. Predicción eficaz de la expresión genética a partir de una secuencia mediante la integración de interacciones de largo alcance. Nat. Métodos 18, 1196–1203 (2021).
Artículo CAS PubMed PubMed Central Google Scholar
Meier, J. y col. Los modelos de lenguaje permiten una predicción cero de los efectos de las mutaciones en la función de las proteínas. En Avances en sistemas de procesamiento de información neuronal 34, 29287–29303 (2021).
Kamienny, P.-A. et al. Regresión simbólica de extremo a extremo con transformadores. En Avances en sistemas de procesamiento de información neuronal 35, 10269–10281 (2022).
Jaegle, A. y col. Perceptor: percepción general con atención iterativa. En Conferencia internacional sobre aprendizaje automático 4651–4664 (2021).
Chen, L. y col. Transformador de decisiones: aprendizaje por refuerzo mediante modelado de secuencias. En Avances en sistemas de procesamiento de información neuronal 34, 15084–15097 (2021).
Dosovitskiy, A. et al. Una imagen vale 16x16 palabras: transformadores para el reconocimiento de imágenes a escala. En Conferencia Internacional sobre Representaciones del Aprendizaje (2020).
Choromanski, K. y col. Repensar la atención con los intérpretes. En Conferencia Internacional sobre Representaciones del Aprendizaje (2021).
Li, Z. y col. Operador neuronal de Fourier para ecuaciones diferenciales parciales paramétricas. En Conferencia Internacional sobre Representaciones del Aprendizaje (2021).
Kovachki, N. y col. Operador neuronal: aprendizaje de mapas entre espacios funcionales. J. Mach. Aprender. Res. 24, 1–97 (2023).
Russell, leyes del movimiento planetario de JL Kepler: 1609-1666. Hno. J. Hist. Ciencia. 2, 1–24 (1964).
Artículo de Google Scholar
Huang, K. y col. Fundamento de la inteligencia artificial para la ciencia terapéutica. Nat. Química. Biol. 18, 1033–1036 (2022).
Guimerà, R. et al. Un científico de máquinas bayesianas para ayudar en la solución de problemas científicos desafiantes. Ciencia. Adv. 6, eaav6971 (2020).
Artículo ADS PubMed PubMed Central Google Scholar
Liu, G. y col. Descubrimiento guiado por aprendizaje profundo de un antibiótico dirigido a Acinetobacter baumannii. Nat. Química. Biol. https://doi.org/10.1038/s41589-023-01349-8 (2023).
Gómez-Bombarelli, R. et al. Diseño de diodos emisores de luz orgánicos moleculares eficientes mediante un enfoque experimental y de detección virtual de alto rendimiento. Nat. Madre. 15, 1120-1127 (2016). Este artículo propone utilizar un predictor de IA de caja negra para acelerar la detección de moléculas de alto rendimiento en la ciencia de materiales.
Artículo ADS PubMed Google Scholar
Sadybekov, AA et al. Descubrimiento de ligandos basado en sintetizadores en bibliotecas virtuales de más de 11 mil millones de compuestos. Naturaleza 601, 452–459 (2022).
Artículo ADS CAS PubMed Google Scholar
La evidencia de colaboración NNPDF sobre quarks de encanto intrínsecos en el protón. Naturaleza 606, 483–487 (2022).
Artículo de Google Scholar
Graff, DE, Shakhnovich, EI y Coley, CW Aceleración de la detección virtual de alto rendimiento mediante el aprendizaje activo basado en grupos moleculares. Química. Ciencia. 12, 7866–7881 (2021).
Artículo CAS PubMed PubMed Central Google Scholar
Janet, JP y cols. Diseño multiobjetivo preciso en un espacio de millones de complejos de metales de transición con optimización global eficiente impulsada por redes neuronales. Céntimo ACS. Ciencia. 6, 513–524 (2020).
Artículo CAS PubMed PubMed Central Google Scholar
Tocino, F. Nuevo Organon vol. 1620 (2000).
Schmidt, M. & Lipson, H. Destilación de leyes naturales de forma libre a partir de datos experimentales. Ciencia 324, 81–85 (2009).
Artículo ADS CAS PubMed Google Scholar
Petersen, BK y cols. Regresión simbólica profunda: recuperación de expresiones matemáticas a partir de datos a través de gradientes de políticas de búsqueda de riesgos. En Conferencia Internacional sobre Representaciones del Aprendizaje (2020).
Zhavoronkov, A. y col. El aprendizaje profundo permite la identificación rápida de potentes inhibidores de la quinasa DDR1. Nat. Biotecnología. 37, 1038-1040 (2019). Este artículo describe un algoritmo de aprendizaje por refuerzo para navegar en espacios combinatorios moleculares y valida las moléculas generadas mediante experimentos en laboratorio húmedo.
Artículo CAS PubMed Google Scholar
Zhou, Z. y col. Optimización de moléculas mediante aprendizaje por refuerzo profundo. Ciencia. Rep. 9, 10752 (2019).
Artículo ADS PubMed PubMed Central Google Scholar
Usted, J. et al. Red de políticas convolucionales de gráficos para la generación de gráficos moleculares dirigidos a objetivos. En Avances en sistemas de procesamiento de información neuronal 31, 6412–6422 (2018).
Bengio, Y. et al. Fundamentos de GFlowNet. Preimpresión en https://arxiv.org/abs/2111.09266 (2021). Este artículo describe una red de flujo generativo que genera objetos tomándolos de una distribución optimizada para el diseño de fármacos.
Jain, M. y col. Diseño de secuencia biológica con GFlowNets. En Conferencia internacional sobre aprendizaje automático 9786–9801 (2022).
Malkin, N. y col. Balance de trayectoria: mejora de la asignación de créditos en GFlowNets. En Avances en sistemas de procesamiento de información neuronal 35, 5955–5967 (2022).
Borkowski, O. y col. Exploración guiada por aprendizaje activo a gran escala para la optimización de la producción de proteínas in vitro. Nat. Comunitario. 11, 1872 (2020). Este estudio introdujo un enfoque de programación dinámica para determinar las ubicaciones y capacidades óptimas de las represas hidroeléctricas en la cuenca del Amazonas, equilibrando la producción de energía y el impacto ambiental.
Artículo ADS CAS PubMed PubMed Central Google Scholar
Flecker, AS y cols. Reducir los impactos adversos de la expansión hidroeléctrica del Amazonas. Science 375, 753–760 (2022). Este estudio introdujo un enfoque de programación dinámica para determinar las ubicaciones y capacidades óptimas de las represas hidroeléctricas en la cuenca del Amazonas, logrando un equilibrio entre los beneficios de la producción de energía y los posibles impactos ambientales.
Artículo ADS CAS PubMed Google Scholar
Pion-Tonachini, L. et al. Aprender de las máquinas de aprendizaje: una nueva generación de tecnología de inteligencia artificial para satisfacer las necesidades de la ciencia. Preimpresión en https://arxiv.org/abs/2111.13786 (2021).
Kusner, MJ, Paige, B. & Hernández-Lobato, JM Autocodificador variacional gramatical. En Conferencia internacional sobre aprendizaje automático 1945-1954 (2017). Este artículo describe un autocodificador variacional gramatical que genera nuevas leyes simbólicas y moléculas de fármacos.
Brunton, SL, Proctor, JL y Kutz, JN Descubrimiento de ecuaciones rectoras a partir de datos mediante una identificación escasa de sistemas dinámicos no lineales. Proc. Acad. Nacional. Ciencia. Estados Unidos 113, 3932–3937 (2016).
Artículo ADS MathSciNet CAS PubMed PubMed Central MATH Google Scholar
Liu, Z. y Tegmark, M. Simetrías ocultas del aprendizaje automático. Física. Rev. Lett. 128, 180201 (2022).
Artículo ADS MathSciNet CAS PubMed Google Scholar
Gabbard, H. y col. Estimación de parámetros bayesianos utilizando codificadores automáticos variacionales condicionales para astronomía de ondas gravitacionales. Nat. Física. 18, 112-117 (2022).
Artículo CAS Google Scholar
Chen, D. y col. Automatizar el mapeo de fases de la estructura cristalina combinando el aprendizaje profundo con el razonamiento de restricciones. Nat. Mach. Intel. 3, 812–822 (2021).
Artículo de Google Scholar
Gómez-Bombarelli, R. et al. Diseño químico automático utilizando una representación continua de moléculas basada en datos. Céntimo ACS. Ciencia. 4, 268–276 (2018).
Anishchenko, I. et al. Diseño de proteínas de novo mediante alucinación de red profunda. Naturaleza 600, 547–552 (2021).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Fu, T. y col. Árbol de andamiaje diferenciable para optimización molecular. En Conferencia Internacional sobre Representaciones del Aprendizaje (2021).
Sanchez-Lengeling, B. & Aspuru-Guzik, A. Diseño molecular inverso mediante aprendizaje automático: modelos generativos para ingeniería de la materia. Ciencia 361, 360–365 (2018).
Artículo ADS CAS PubMed Google Scholar
Huang, K. y col. Therapeutics Data Commons: conjuntos de datos de aprendizaje automático y tareas para el descubrimiento y desarrollo de fármacos. En Conjuntos de datos y puntos de referencia de NeurIPS (2021). Este estudio describe una iniciativa con modelos abiertos de IA, conjuntos de datos y programas educativos para facilitar los avances en la ciencia terapéutica en todas las etapas del descubrimiento y desarrollo de fármacos.
Danza, A. Peligro de laboratorio. Naturaleza 458, 664–665 (2009).
Artículo CAS PubMed Google Scholar
Segler, MHS, Preuss, M. & Waller, MP Planificación de síntesis químicas con redes neuronales profundas e IA simbólica. Naturaleza 555, 604–610 (2018). Este artículo describe un enfoque que combina redes neuronales profundas con la búsqueda de árboles de Monte Carlo para planificar la síntesis química.
Artículo ADS CAS PubMed Google Scholar
Gao, W., Raghavan, P. y Coley, CW Plataformas autónomas para síntesis orgánica basada en datos. Nat. Comunitario. 13, 1075 (2022).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Kusne, AG y cols. Descubrimiento de materiales sobre la marcha en circuito cerrado mediante aprendizaje activo bayesiano. Nat. Comunitario. 11, 5966 (2020).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Gormley, AJ y Webb, MA Aprendizaje automático en química combinatoria de polímeros. Nat. Rev. Mater. 6, 642–644 (2021).
Artículo ADS CAS PubMed Google Scholar
Ament, S. et al. Síntesis autónoma de materiales mediante aprendizaje activo jerárquico de diagramas de fases de desequilibrio. Ciencia. Adv. 7, eabg4930 (2021).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Degrave, J. y col. Control magnético de plasmas tokamak mediante aprendizaje por refuerzo profundo. Nature 602, 414–419 (2022). Este artículo describe un enfoque para controlar los plasmas de tokamak, utilizando un agente de aprendizaje por refuerzo para comandar y controlar bobinas y satisfacer restricciones físicas y operativas.
Artículo ADS CAS PubMed PubMed Central Google Scholar
Melnikov, AA y cols. La máquina de aprendizaje activo aprende a crear nuevos experimentos cuánticos. Proc. Acad. Nacional. Ciencia. Estados Unidos 115, 1221-1226 (2018).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Smith, JS, Isayev, O. & Roitberg, AE ANI-1: un potencial de red neuronal extensible con precisión DFT al costo computacional del campo de fuerza. Química. Ciencia. 8, 3192–3203 (2017).
Artículo CAS PubMed PubMed Central Google Scholar
Wang, D. y col. Muestreo eficiente de paisajes de energía libre de alta dimensión utilizando dinámica reforzada adaptativa. Nat. Computadora. Ciencia. 2, 20–29 (2022). Este artículo describe una red neuronal para estimaciones confiables de incertidumbre en dinámica molecular, lo que permite un muestreo eficiente de paisajes de energía libre de alta dimensión.
Artículo CAS Google Scholar
Wang, W. & Gómez-Bombarelli, R. Autocodificadores de grano grueso para dinámica molecular. npj Computación. Madre. 5, 125 (2019).
ADS del artículo Google Scholar
Hermann, J., Schätzle, Z. y Noé, F. Solución de red neuronal profunda de la ecuación electrónica de Schrödinger. Nat. Química. 12, 891–897 (2020). Este artículo describe un método para aprender la función de onda de sistemas cuánticos utilizando redes neuronales profundas junto con Monte Carlo cuántico variacional.
Artículo CAS PubMed Google Scholar
Carleo, G. & Troyer, M. Resolver el problema cuántico de muchos cuerpos con redes neuronales artificiales. Ciencia 355, 602–606 (2017).
Artículo ADS MathSciNet CAS PubMed MATH Google Scholar
En Karniadakis, G. et al. Aprendizaje automático basado en la física. Nat. Rev. Phys. 3, 422–440 (2021).
Artículo de Google Scholar
Li, Z. y col. Operador neuronal con conocimientos de física para aprender ecuaciones diferenciales parciales. Preimpresión en https://arxiv.org/abs/2111.03794 (2021).
Kochkov, D. y col. Aprendizaje automático: dinámica de fluidos computacional acelerada. Proc. Acad. Nacional. Ciencia. Estados Unidos 118, e2101784118 (2021). Este artículo describe un enfoque para acelerar la dinámica de fluidos computacional mediante el entrenamiento de una red neuronal para interpolar de cuadrículas gruesas a finas y generalizar a diferentes funciones de forzado y números de Reynolds.
Ji, W. y col. Stiff-PINN: red neuronal basada en la física para una cinética química rígida. J. Física. Química. A 125, 8098–8106 (2021).
Artículo CAS PubMed Google Scholar
Smith, JD, Azizzadenesheli, K. & Ross, ZE EikoNet: resolución de la ecuación de Eikonal con redes neuronales profundas. Traducción IEEE. Geociencias. Sensores remotos 59, 10685–10696 (2020).
ADS del artículo Google Scholar
Waheed, UB y cols. PINNeik: solución Eikonal que utiliza redes neuronales basadas en la física. Computadora. Geociencias. 155, 104833 (2021).
Artículo de Google Scholar
Chen, RTQ y cols. Ecuaciones diferenciales ordinarias neuronales. En Avances en sistemas de procesamiento de información neuronal 31, 6572–6583 (2018). Este artículo estableció una conexión entre las redes neuronales y las ecuaciones diferenciales mediante la introducción del método adjunto para aprender sistemas dinámicos de tiempo continuo a partir de datos, reemplazando la retropropagación.
Raissi, M., Perdikaris, P. y Karniadakis, GE Redes neuronales basadas en física: un marco de aprendizaje profundo para resolver problemas directos e inversos que involucran ecuaciones diferenciales parciales no lineales. J. Computación. Física. 378, 686–707 (2019). Este artículo describe un enfoque de aprendizaje profundo para resolver problemas directos e inversos en ecuaciones diferenciales parciales no lineales y puede encontrar soluciones a ecuaciones diferenciales a partir de datos.
Artículo ADS MathSciNet MATH Google Scholar
Lu, L. y col. Aprendizaje de operadores no lineales a través de DeepONet basado en el teorema de aproximación universal de operadores. Nat. Mach. Intel. 3, 218–229 (2021).
Artículo de Google Scholar
Brandstetter, J., Worrall, D. & Welling, M. Solucionadores de PDE neuronales de paso de mensajes. En Conferencia Internacional sobre Representaciones del Aprendizaje (2022).
Noé, F. et al. Generadores de Boltzmann: muestreo de estados de equilibrio de sistemas de muchos cuerpos con aprendizaje profundo. Ciencia 365, eaaw1147 (2019). Este artículo presenta un algoritmo de muestreo eficiente que utiliza flujos de normalización para simular estados de equilibrio en sistemas de muchos cuerpos.
Rezende, D. & Mohamed, S. Inferencia variacional con flujos normalizadores. En Conferencia internacional sobre aprendizaje automático 37, 1530-1538, (2015).
Dinh, L., Sohl-Dickstein, J. & Bengio, S. Estimación de densidad utilizando NVP real. En Conferencia Internacional sobre Representaciones del Aprendizaje (2017).
Nicoli, KA et al. Estimación de observables termodinámicos en teorías de campos reticulares con modelos generativos profundos. Física. Rev. Lett. 126, 032001 (2021).
Artículo ADS MathSciNet CAS PubMed Google Scholar
Kanwar, G. y col. Muestreo equivalente basado en flujo para la teoría del calibre de red. Física. Rev. Lett. 125, 121601 (2020).
Artículo ADS MathSciNet CAS PubMed Google Scholar
Gabrié, M., Rotskoff, GM y Vanden-Eijnden, E. Monte Carlo adaptativo aumentado con flujos normalizados. Proc. Acad. Nacional. Ciencia. EE.UU. 119, e2109420119 (2022).
Artículo MathSciNet PubMed PubMed Central Google Scholar
Jasra, A., Holmes, CC y Stephens, DA Métodos de Monte Carlo en cadena de Markov y el problema de cambio de etiquetas en el modelado de mezclas bayesianas. Estadística. Ciencia. 20, 50–67 (2005).
Bengio, Y. et al. Mejor mezcla a través de representaciones profundas. En Conferencia internacional sobre aprendizaje automático 552–560 (2013).
Pompe, E., Holmes, C. y Łatuszyński, K. Un marco para MCMC adaptativo dirigido a distribuciones multimodales. Ana. Estadística. 48, 2930–2952 (2020).
Artículo MathSciNet MATEMÁTICAS Google Scholar
Townshend, RJL y cols. ATOM3D: tareas sobre moléculas en tres dimensiones. En Conjuntos de datos y puntos de referencia de NeurIPS (2021).
Kearnes, SM et al. La base de datos de reacciones abierta. Mermelada. Química. Soc. 143, 18820–18826 (2021).
Artículo CAS PubMed Google Scholar
Chanussot, L. et al. Conjunto de datos de Open Catalyst 2020 (OC20) y desafíos comunitarios. ACS Catal. 11, 6059–6072 (2021).
Artículo CAS Google Scholar
Brown, N. y col. GuacaMol: modelos de evaluación comparativa para el diseño molecular de novo. J. química. inf. Modelo. 59, 1096-1108 (2019).
Artículo ADS CAS PubMed Google Scholar
Notin, P. y col. Trancepción: predicción de la aptitud de las proteínas con transformadores autorregresivos y recuperación del tiempo de inferencia. En Conferencia internacional sobre aprendizaje automático 16990–17017 (2022).
Mitchell, M. y col. Tarjetas modelo para informes modelo. En Conferencia sobre equidad, responsabilidad y transparencia 220–229 (2019).
Gebru, T. y col. Hojas de datos para conjuntos de datos. Comunitario. ACM 64, 86–92 (2021).
Artículo de Google Scholar
Bai, X. y col. Avanzando en el diagnóstico de COVID-19 con una colaboración en inteligencia artificial que preserve la privacidad. Nat. Mach. Intel. 3, 1081–1089 (2021).
Artículo de Google Scholar
Warnat-Herresthal, S. et al. Aprendizaje enjambre para el aprendizaje automático clínico descentralizado y confidencial. Naturaleza 594, 265–270 (2021).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Hie, B., Cho, H. & Berger, B. Realización de una colaboración farmacológica práctica y privada. Ciencia 362, 347–350 (2018).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Rohrbach, S. y col. Digitalización y validación de una base de datos de literatura de síntesis química en la ChemPU. Ciencia 377, 172–180 (2022).
Artículo ADS CAS PubMed Google Scholar
Gysi, DM y cols. Marco de medicina en red para identificar oportunidades de reutilización de medicamentos para COVID-19. Proc. Acad. Nacional. Ciencia. Estados Unidos 118, e2025581118 (2021).
Artículo CAS Google Scholar
King, RD y cols. La automatización de la ciencia. Ciencia 324, 85–89 (2009).
Artículo ADS CAS PubMed Google Scholar
Mirdita, M. et al. ColabFold: hacer que el plegamiento de proteínas sea accesible para todos. Nat. Métodos 19, 679–682 (2022).
Doerr, S. y col. TorchMD: un marco de aprendizaje profundo para simulaciones moleculares. J. química. Computación teórica. 17, 2355–2363 (2021).
Artículo CAS PubMed PubMed Central Google Scholar
Schoenholz, SS y Cubuk, ED JAX MD: un marco para la física diferenciable. En Avances en sistemas de procesamiento de información neuronal 33, 11428–11441 (2020).
Peters, J., Janzing, D. & Schölkopf, B. Elementos de inferencia causal: fundamentos y algoritmos de aprendizaje (MIT Press, 2017).
Bengio, Y. et al. Un objetivo de metatransferencia para aprender a desenredar los mecanismos causales. En Conferencia Internacional sobre Representaciones del Aprendizaje (2020).
Schölkopf, B. y col. Hacia el aprendizaje de la representación causal. Proc. IEEE 109, 612–634 (2021).
Artículo de Google Scholar
Goyal, A. & Bengio, Y. Sesgos inductivos para el aprendizaje profundo de la cognición de nivel superior. Proc. R. Soc. A 478, 20210068 (2022).
Deleu, T. et al. Aprendizaje de estructuras bayesianas con redes de flujo generativo. En Conferencia sobre la incertidumbre en la inteligencia artificial 518–528 (2022).
Geirhos, R. et al. Aprendizaje abreviado en redes neuronales profundas. Nat. Mach. Intel. 2, 665–673 (2020).
Artículo de Google Scholar
Koh, PW y cols. WILDS: un punto de referencia de los cambios de distribución en la naturaleza. En Conferencia internacional sobre aprendizaje automático 5637–5664 (2021).
Luo, Z. y col. Etiquete el aprendizaje eficiente de representaciones transferibles entre dominios y tareas. En Avances en sistemas de procesamiento de información neuronal 30, 165-177 (2017).
Mahmood, R. y col. ¿Cuántos datos más necesito? Estimar los requisitos para las tareas posteriores. En Conferencia IEEE sobre visión por computadora y reconocimiento de patrones 275–284 (2022).
Coley, CW, Eyke, NS y Jensen, KF Descubrimiento autónomo en las ciencias químicas parte II: perspectivas. Angélica. Química. En t. Ed. 59, 23414–23436 (2020).
Artículo CAS Google Scholar
Gao, W. & Coley, CW La sintetizabilidad de moléculas propuestas por modelos generativos. J. química. inf. Modelo. 60, 5714–5723 (2020).
Artículo CAS PubMed Google Scholar
Kogler, R. y col. Subestructura de chorro en el Gran Colisionador de Hadrones. Mod. Rev. Física. 91, 045003 (2019).
Artículo ADS CAS Google Scholar
Acosta, J. N. et al. Multimodal biomedical AI. Nat. Med. 28, 1773–1784 (2022).
Alayrac, J.-B. et al. Flamingo: un modelo de lenguaje visual para el aprendizaje en pocas tomas. En Avances en sistemas de procesamiento de información neuronal 35, 23716–23736 (2022).
Elmarakeby, HA y cols. Red neuronal profunda biológicamente informada para el descubrimiento del cáncer de próstata. Naturaleza 598, 348–352 (2021).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Qin, Y. et al. Un mapa de múltiples escalas de la estructura celular que fusiona imágenes e interacciones de proteínas. Naturaleza 600, 536–542 (2021).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Schaffer, LV & Ideker, T. Mapeo de la estructura multiescala de los sistemas biológicos. Sistemas celulares 12, 622–635 (2021).
Artículo CAS PubMed PubMed Central Google Scholar
Stiglic, G. et al. Interpretabilidad de modelos de predicción basados en aprendizaje automático en el sector sanitario. Wiley Interdisciplinario. Rev. Datos Min. Conocimiento. Descubrimiento. 10, e1379 (2020).
Artículo de Google Scholar
Erion, G. y col. Un marco económico para el desarrollo de modelos de IA para aplicaciones sanitarias. Nat. Biomédica. Ing. 6, 1384-1398 (2022).
Lundberg, SM et al. Predicciones explicables de aprendizaje automático para la prevención de la hipoxemia durante la cirugía. Nat. Biomédica. Ing. 2, 749–760 (2018).
Artículo PubMed PubMed Central Google Scholar
Sanders, LM y cols. Más allá de la órbita terrestre baja: investigación biológica, inteligencia artificial y laboratorios autónomos. Preimpresión en https://arxiv.org/abs/2112.12582 (2021).
Gagne, DJ II y col. Aprendizaje profundo interpretable para el análisis espacial de granizadas severas. Lun. Tiempo Rev. 147, 2827–2845 (2019).
ADS del artículo Google Scholar
Rudin, C. Deje de explicar modelos de aprendizaje automático de caja negra para decisiones de alto riesgo y utilice modelos interpretables en su lugar. Nat. Mach. Intel. 1, 206–215 (2019).
Artículo PubMed PubMed Central Google Scholar
Koh, PW y Liang, P. Comprensión de las predicciones de caja negra mediante funciones de influencia. En Conferencia internacional sobre aprendizaje automático 1885–1894 (2017).
Mirzasoleiman, B., Bilmes, J. & Leskovec, J. Coresets para el entrenamiento eficiente de datos de modelos de aprendizaje automático. En Conferencia internacional sobre aprendizaje automático 6950–6960 (2020).
Kim, B. y col. Interpretabilidad más allá de la atribución de características: pruebas cuantitativas con vectores de activación de conceptos (TCAV). En Conferencia internacional sobre aprendizaje automático 2668–2677 (2018).
Plata, D. et al. Dominar el juego del go sin conocimiento humano. Naturaleza 550, 354–359 (2017).
Artículo ADS CAS PubMed Google Scholar
Baum, ZJ y cols. Inteligencia artificial en química: tendencias actuales y direcciones futuras. J. química. inf. Modelo. 61, 3197–3212 (2021).
Artículo CAS PubMed Google Scholar
Finlayson, SG y cols. Ataques contradictorios al aprendizaje automático médico. Ciencia 363, 1287-1289 (2019).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Urbina, F. et al. Uso dual del descubrimiento de fármacos impulsado por inteligencia artificial. Nat. Mach. Intel. 4, 189-191 (2022).
Artículo PubMed PubMed Central Google Scholar
Norgeot, B. y col. Información mínima sobre el modelado clínico de inteligencia artificial: la lista de verificación MI-CLAIM. Nat. Medicina. 26, 1320-1324 (2020).
Artículo CAS PubMed PubMed Central Google Scholar
Descargar referencias
MZ agradece el apoyo de los Institutos Nacionales de Salud bajo R01HD108794, la Fuerza Aérea de EE. UU. bajo FA8702-15-D-0001, los premios de Harvard Data Science Initiative, Amazon Faculty Research, Google Research Scholar Program, Bayer Early Excellence in Science, AstraZeneca Research , Alianza de Roche con Científicos Distinguidos y el Instituto Kempner para el Estudio de la Inteligencia Natural y Artificial. CPG y YD reconocen el apoyo de la Oficina de Investigación Científica de la Fuerza Aérea de EE. UU. en el marco del Programa de Iniciativas de Investigación Universitaria Multidisciplinaria (MURI) FA9550-18-1-0136, el Programa de Instrumentación de Investigación de la Universidad de Defensa (DURIP) FA9550-21-1-0316 y los premios del Agente de Razonamiento Científico Autónomo (SARA) y la IA para Asistente de Descubrimiento (AIDA). Cualquier opinión, hallazgo, conclusión o recomendación expresada en este material pertenece a los autores y no refleja necesariamente los puntos de vista de los financiadores. Agradecemos a D. Hassabis, A. Davies, S. Mohamed, Z. Li, K. Ma, Z. Qiao, E. Weinstein, AV Weller, Y. Zhong y AM Brandt por las discusiones sobre el artículo.
Hanchen Wang
Dirección actual: Departamento de Investigación y Desarrollo Temprano, Genentech Inc, South San Francisco, CA, EE. UU.
Hanchen Wang
Dirección actual: Departamento de Ciencias de la Computación, Universidad de Stanford, Stanford, CA, EE. UU.
Estos autores contribuyeron igualmente: Hanchen Wang, Tianfan Fu, Yuanqi Du
Departamento de Ingeniería, Universidad de Cambridge, Cambridge, Reino Unido
Hanchen Wang y Joan Lasenby
Departamento de Computación y Ciencias Matemáticas, Instituto de Tecnología de California, Pasadena, CA, EE. UU.
Hanchen Wang y Anima Anandkumar
Departamento de Ingeniería y Ciencias Computacionales, Instituto de Tecnología de Georgia, Atlanta, GA, EE. UU.
Tian Fan Fu
Departamento de Ciencias de la Computación, Universidad de Cornell, Ithaca, Nueva York, EE. UU.
Yuanqi Du y Carla P. Gomes
Departamento de Ingeniería Química, Instituto de Tecnología de Massachusetts, Cambridge, MA, EE. UU.
Wenhao Gao y Connor W. Coley
Departamento de Ciencias de la Computación, Universidad de Stanford, Stanford, CA, EE. UU.
Kexin Huang y Jure Leskovec
Departamento de Física, Instituto Tecnológico de Massachusetts, Cambridge, MA, EE.UU.
Ziming Liu
Programa Harvard-MIT en Ciencias y Tecnología de la Salud, Cambridge, MA, EE. UU.
Payal Chandak
Mila – Instituto de IA de Quebec, Montreal, Quebec, Canadá
Shengchao Liu, Andreea Deac, Jian Tang y Yoshua Bengio
Universidad de Montreal, Montreal, Quebec, Canadá
Shengchao Liu, Andreea Deac y Yoshua Bengio
Departamento de Ciencias de la Tierra, Ambientales y Planetarias, Universidad de Brown, Providence, RI, EE. UU.
Peter Van Katwyk y Karianne Bergen
Instituto de Ciencia de Datos, Universidad de Brown, Providence, Rhode Island, EE. UU.
Peter Van Katwyk y Karianne Bergen
NVIDIA, Santa Clara, CA, USA
anima anandkumar
Centro de Astrofísica Computacional, Flatiron Institute, Nueva York, NY, EE. UU.
Shirley Ho
Departamento de Ciencias Astrofísicas, Universidad de Princeton, Princeton, Nueva Jersey, EE. UU.
Shirley Ho
Departamento de Física, Universidad Carnegie Mellon, Pittsburgh, PA, EE. UU.
Shirley Ho
Departamento de Física y Centro de Ciencia de Datos, Universidad de Nueva York, Nueva York, NY, EE. UU.
Shirley Ho y Petar Velickovic
Google DeepMind, Londres, Reino Unido
Pushmeet Kohli
Investigación de Microsoft, Beijing, China
Tie-Yan Liu
Departamento de Informática Biomédica, Facultad de Medicina de Harvard, Boston, MA, EE. UU.
Arjun Manrai y Marinka Zitnik
Departamento de Biología de Sistemas, Facultad de Medicina de Harvard, Boston, MA, EE. UU.
Débora Marcas
Broad Institute del MIT y Harvard, Cambridge, MA, EE. UU.
Debora Marks y Marinka Zitnik
Deep Forest Sciences, Palo Alto, California, EE. UU.
Bharat Ramsundar
BioMapa, Beijing, China
y cancion
Universidad de Inteligencia Artificial Mohamed bin Zayed, Abu Dhabi, Emiratos Árabes Unidos
y cancion
Universidad de Illinois en Urbana-Champaign, Champaign, IL, EE. UU.
Jimeng Sun
HEC Montreal, Montreal, Quebec, Canadá
Jian Tang
Presidente de CIFAR AI, Toronto, Ontario, Canadá
Jian Tang
Departamento de Ciencia y Tecnología de la Computación, Universidad de Cambridge, Cambridge, Reino Unido
Petar Velickovic
Universidad de Amsterdam, Amsterdam, Países Bajos
Max Welling
Microsoft Research Ámsterdam, Ámsterdam, Países Bajos
Max Welling
Tecnología DP, Beijing, China
Lin Feng Zhang
Instituto de IA para la Ciencia, Beijing, China
Lin Feng Zhang
Departamento de Ingeniería Eléctrica y Ciencias de la Computación, Instituto de Tecnología de Massachusetts, Cambridge, MA, EE. UU.
Connor W. Coley
Iniciativa de ciencia de datos de Harvard, Cambridge, MA, EE. UU.
Marinka Zitnik
Instituto Kempner para el Estudio de la Inteligencia Natural y Artificial, Universidad de Harvard, Cambridge, MA, EE. UU.
Marinka Zitnik
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
Todos los autores contribuyeron al diseño y redacción del artículo, ayudaron a dar forma a la investigación, brindaron comentarios críticos y comentaron sobre el artículo y sus revisiones. HW, TF, YD y MZ concibieron el estudio y fueron responsables de la dirección y planificación generales. WG, KH y ZL contribuyeron igualmente a este trabajo (igual segunda autoría) y están enumerados en orden alfabético.
Correspondencia a Marinka Zitnik.
Los autores declaran no tener conflictos de intereses.
Nature agradece a Brian Gallagher y Benjamin Nachman por su contribución a la revisión por pares de este trabajo.
Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.
Springer Nature o su licenciante (por ejemplo, una sociedad u otro socio) posee los derechos exclusivos de este artículo en virtud de un acuerdo de publicación con los autores u otros titulares de derechos; El autoarchivo por parte del autor de la versión manuscrita aceptada de este artículo se rige únicamente por los términos de dicho acuerdo de publicación y la ley aplicable.
Reimpresiones y permisos
Wang, H., Fu, T., Du, Y. et al. Descubrimiento científico en la era de la inteligencia artificial. Naturaleza 620, 47–60 (2023). https://doi.org/10.1038/s41586-023-06221-2
Descargar cita
Recibido: 30 de marzo de 2022
Aceptado: 16 de mayo de 2023
Publicado: 02 de agosto de 2023
Fecha de emisión: 03 de agosto de 2023
DOI: https://doi.org/10.1038/s41586-023-06221-2
Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:
Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.
Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt
Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.