Descubrimiento científico en la era de la inteligencia artificial | Máquinas auxiliares Co., Ltd de Chongqing

Nature volumen 620, páginas 47–60 (2023)Cite este artículo

197 altmétrico

Detalles de métricas

La inteligencia artificial (IA) se está integrando cada vez más en los descubrimientos científicos para aumentar y acelerar la investigación, ayudando a los científicos a generar hipótesis, diseñar experimentos, recopilar e interpretar grandes conjuntos de datos y obtener conocimientos que tal vez no hubieran sido posibles utilizando únicamente los métodos científicos tradicionales. Aquí examinamos los avances de la última década que incluyen el aprendizaje autosupervisado, que permite entrenar modelos con grandes cantidades de datos sin etiquetar, y el aprendizaje profundo geométrico, que aprovecha el conocimiento sobre la estructura de los datos científicos para mejorar la precisión y eficiencia del modelo. Los métodos de IA generativa pueden crear diseños, como proteínas y fármacos de moléculas pequeñas, mediante el análisis de diversas modalidades de datos, incluidas imágenes y secuencias. Discutimos cómo estos métodos pueden ayudar a los científicos a lo largo del proceso científico y las cuestiones centrales que persisten a pesar de tales avances. Tanto los desarrolladores como los usuarios de herramientas de IA necesitan comprender mejor cuándo es necesario mejorar dichos enfoques, y los desafíos planteados por la mala calidad y administración de los datos persisten. Estas cuestiones trascienden todas las disciplinas científicas y requieren el desarrollo de enfoques algorítmicos fundamentales que puedan contribuir a la comprensión científica o adquirirla de forma autónoma, lo que las convierte en áreas críticas de enfoque para la innovación en IA.

Esta es una vista previa del contenido de la suscripción, acceda a través de su institución

Acceda a Nature y a otras 54 revistas de Nature Portfolio

Obtenga Nature+, nuestra suscripción de acceso en línea con la mejor relación calidad-precio

$29.99 / 30 días

cancelar en cualquier momento

Suscríbete a esta revista

Reciba 51 números impresos y acceso en línea

$199.00 por año

sólo $3.90 por número

Alquila o compra este artículo

Los precios varían según el tipo de artículo.

desde $ 1,95

a$39.95

Los precios pueden estar sujetos a impuestos locales que se calculan durante el pago.

LeCun, Y., Bengio, Y. y Hinton, G. Aprendizaje profundo. Naturaleza 521, 436–444 (2015). Esta encuesta resume los elementos clave del aprendizaje profundo y su desarrollo en el reconocimiento de voz, la visión por computadora y el procesamiento del lenguaje natural.

Artículo ADS CAS PubMed Google Scholar

de Regt, HW Comprensión, valores y objetivos de la ciencia. Fil. Ciencia. 87, 921–932 (2020).

Artículo MathSciNet Google Scholar

Pickstone, JV Formas de conocer: una nueva historia de la ciencia, la tecnología y la medicina (Univ. Chicago Press, 2001).

Han, J. y col. Potencial profundo: una representación general de una superficie de energía potencial de muchos cuerpos. Comunitario. Computadora. Física. 23, 629–639 (2018). Este artículo presentó una arquitectura de red neuronal profunda que aprende la superficie de energía potencial de sistemas de muchos cuerpos respetando al mismo tiempo las simetrías subyacentes del sistema mediante la incorporación de la teoría de grupos.

Akiyama, K. y col. Primeros resultados del Telescopio Horizonte de Sucesos M87. IV. Imágenes del agujero negro supermasivo central. Astrofia. J. Lett. 875, L4 (2019).

Artículo ADS CAS Google Scholar

Wagner, AZ Construcciones en combinatoria mediante redes neuronales. Preimpresión en https://arxiv.org/abs/2104.14516 (2021).

Coley, CW y cols. Una plataforma robótica para la síntesis de flujo de compuestos orgánicos basada en la planificación de IA. Ciencia 365, eaax1566 (2019).

Artículo CAS PubMed Google Scholar

Bommasani, R. y col. Sobre las oportunidades y riesgos de los modelos de fundación. Preimpresión en https://arxiv.org/abs/2108.07258 (2021).

Davies, A. y col. Avanzar en las matemáticas guiando la intuición humana con IA. Naturaleza 600, 70–74 (2021). Este artículo explora cómo la IA puede ayudar al desarrollo de las matemáticas puras guiando la intuición matemática.

Artículo ADS CAS PubMed PubMed Central MATH Google Scholar

Saltador, J. et al. Predicción de estructura de proteínas de alta precisión con AlphaFold. Nature 596, 583–589 (2021). Este estudio fue el primero en demostrar la capacidad de predecir estructuras de plegamiento de proteínas utilizando métodos de IA con un alto grado de precisión, logrando resultados que están en la resolución experimental o cerca de ella. Este logro es particularmente digno de mención, ya que predecir el plegamiento de proteínas ha sido un gran desafío en el campo de la biología molecular durante más de 50 años.

Artículo ADS CAS PubMed PubMed Central Google Scholar

Stokes, JM y cols. Un enfoque de aprendizaje profundo para el descubrimiento de antibióticos. Celda 180, 688–702 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Bohacek, RS, McMartin, C. y Guida, WC El arte y la práctica del diseño de fármacos basado en estructuras: una perspectiva del modelado molecular. Medicina. Res. Rev. 16, 3–50 (1996).

3.0.CO;2-6" data-track-action="article reference" href="https://doi.org/10.1002%2F%28SICI%291098-1128%28199601%2916%3A1%3C3%3A%3AAID-MED1%3E3.0.CO%3B2-6" aria-label="Article reference 12" data-doi="10.1002/(SICI)1098-1128(199601)16:13.0.CO;2-6">Artículo CAS PubMed Google Scholar

Bileschi, ML et al. Utilizar el aprendizaje profundo para anotar el universo proteico. Nat. Biotecnología. 40, 932–937 (2022).

Bellemare, MG et al. Navegación autónoma de globos estratosféricos mediante aprendizaje por refuerzo. Naturaleza 588, 77–82 (2020). Este artículo describe un algoritmo de aprendizaje por refuerzo para navegar un globo de superpresión en la estratosfera, tomando decisiones en tiempo real en un entorno cambiante.

Artículo ADS CAS PubMed Google Scholar

Tshitoyan, V. et al. Las incrustaciones de palabras no supervisadas capturan conocimientos latentes de la literatura sobre ciencia de materiales. Naturaleza 571, 95–98 (2019).

Artículo ADS CAS PubMed Google Scholar

Zhang, L. y col. Dinámica molecular de potencial profundo: un modelo escalable con la precisión de la mecánica cuántica. Física. Rev. Lett. 120, 143001 (2018).

Artículo ADS CAS PubMed Google Scholar

Deiana, AM et al. Aplicaciones y técnicas para el aprendizaje automático rápido en ciencia. Frente. Grandes datos 5, 787421 (2022).

Karagiorgi, G. y col. Aprendizaje automático en la búsqueda de nueva física fundamental. Nat. Rev. Phys. 4, 399–412 (2022).

Zhou, C. & Paffenroth, RC Detección de anomalías con codificadores automáticos profundos y robustos. En Conferencia internacional ACM SIGKDD sobre descubrimiento de conocimientos y minería de datos 665–674 (2017).

Hinton, GE y Salakhutdinov, RR Reducción de la dimensionalidad de los datos con redes neuronales. Ciencia 313, 504–507 (2006).

Artículo ADS MathSciNet CAS PubMed MATH Google Scholar

Kasieczka, G. y col. Los Juegos Olímpicos del LHC 2020 son un desafío comunitario para la detección de anomalías en física de altas energías. Prog. Rep. Física. 84, 124201 (2021).

Artículo ADS CAS Google Scholar

Govorkova, E. y col. Codificadores automáticos en conjuntos de puertas programables en campo para la detección de nueva física no supervisada en tiempo real a 40 MHz en el Gran Colisionador de Hadrones. Nat. Mach. Intel. 4, 154-161 (2022).

Artículo de Google Scholar

Chamberland, M. y col. Detección de desviaciones microestructurales en individuos con tractometría de resonancia magnética de difusión profunda. Nat. Computadora. Ciencia. 1, 598–606 (2021).

Artículo PubMed PubMed Central Google Scholar

Rafique, M. et al. Regresor delegado, un enfoque sólido para la detección automatizada de anomalías en los datos de series temporales de radón del suelo. Ciencia. Rep. 10, 3004 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Pastore, VP et al. Aprendizaje de plancton sin anotaciones para clasificación y detección de anomalías. Ciencia. Rep. 10, 12142 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Naul, B. et al. Una red neuronal recurrente para la clasificación de estrellas variables muestreadas de manera desigual. Nat. Astron. 2, 151-155 (2018).

ADS del artículo Google Scholar

Lee, D.-H. et al. Pseudoetiqueta: el método de aprendizaje semisupervisado simple y eficiente para redes neuronales profundas. En Taller ICML sobre desafíos en el aprendizaje de representación (2013).

Zhou, D. y col. Aprender con consistencia local y global. En Avances en sistemas de procesamiento de información neuronal 16, 321–328 (2003).

Radivojac, P. y col. Una evaluación a gran escala de la predicción computacional de la función de proteínas. Nat. Métodos 10, 221–227 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Barkas, N. y col. Análisis conjunto de colecciones heterogéneas de conjuntos de datos de RNA-seq unicelulares. Nat. Métodos 16, 695–698 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Tran, K. & Ulissi, ZW Aprendizaje activo en intermetálicos para guiar el descubrimiento de electrocatalizadores para la reducción de CO2 y la evolución de H2. Nat. Catalán. 1, 696–703 (2018).

Artículo CAS Google Scholar

Jablonka, KM y cols. Aprendizaje activo multiobjetivo libre de prejuicios para el diseño y descubrimiento de materiales. Nat. Comunitario. 12, 2312 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Roussel, R. et al. Exploración espacial de parámetros restringidos llave en mano para aceleradores de partículas mediante aprendizaje activo bayesiano. Nat. Comunitario. 12, 5612 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Ratner, AJ y cols. Programación de datos: creación de grandes conjuntos de entrenamiento, rápidamente. En Avances en sistemas de procesamiento de información neuronal 29, 3567–3575 (2016).

Ratner, A. y col. Snorkel: creación rápida de datos de entrenamiento con supervisión débil. En Conferencia internacional sobre bases de datos muy grandes 11, 269–282 (2017). Este artículo presenta un sistema de inteligencia artificial débilmente supervisado diseñado para anotar cantidades masivas de datos mediante funciones de etiquetado.

Mantequilla, A. et al. Muestras de eventos GANplifying. SciPost Phys. 10, 139 (2021).

ADS del artículo Google Scholar

Brown, T. y col. Los modelos de lenguaje son aprendices de pocas oportunidades. En Avances en los sistemas de procesamiento de información neuronal 33, 1877–1901 (2020).

Ramesh, A. y col. Generación de texto a imagen de disparo cero. En Conferencia internacional sobre aprendizaje automático 139, 8821–8831 (2021).

Littman, ML El aprendizaje por refuerzo mejora el comportamiento a partir de la retroalimentación evaluativa. Naturaleza 521, 445–451 (2015).

Artículo ADS CAS PubMed Google Scholar

Cubuk, ED y cols. Aumento automático: aprendizaje de estrategias de aumento a partir de datos. En Conferencia IEEE sobre visión por computadora y reconocimiento de patrones 113–123 (2019).

Reed, CJ y cols. Selfaugment: políticas de aumento automático para el aprendizaje autosupervisado. En la Conferencia IEEE sobre visión por computadora y reconocimiento de patrones 2674–2683 (2021).

Colaboración ATLAS et al. Modelos generativos profundos para una rápida simulación de lluvia de fotones en ATLAS. Preimpresión en https://arxiv.org/abs/2210.06204 (2022).

Mahmood, F. y col. Entrenamiento adversario profundo para la segmentación de núcleos multiorgánicos en imágenes de histopatología. Traducción IEEE. Medicina. Imágenes 39, 3257–3267 (2019).

Artículo de Google Scholar

Teixeira, B. et al. Generación de imágenes de rayos X sintéticas de una persona a partir de la geometría de la superficie. En la Conferencia IEEE sobre visión por computadora y reconocimiento de patrones 9059–9067 (2018).

Lee, D., Moon, W.-J. & Ye, JC Evaluación de la importancia de los contrastes de resonancia magnética utilizando redes colaborativas generativas adversarias. Nat. Mach. Intel. 2, 34–42 (2020).

Artículo de Google Scholar

Kench, S. & Cooper, SJ Generación de estructuras tridimensionales a partir de un segmento bidimensional con expansión de dimensionalidad generativa basada en redes adversas. Nat. Mach. Intel. 3, 299–305 (2021).

Artículo de Google Scholar

Wan, C. & Jones, DT La predicción de la función de la proteína se mejora mediante la creación de muestras de características sintéticas con redes generativas adversarias. Nat. Mach. Intel. 2, 540–550 (2020).

Artículo de Google Scholar

Repečka, D. et al. Ampliar los espacios de secuencia de proteínas funcionales utilizando redes generativas adversarias. Nat. Mach. Intel. 3, 324–333 (2021).

Artículo de Google Scholar

Marouf, M. y col. Generación realista in silico y aumento de datos de secuenciación de ARN unicelulares utilizando redes generativas adversarias. Nat. Comunitario. 11, 166 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Ghahramani, Z. Aprendizaje automático probabilístico e inteligencia artificial. Nature 521, 452–459 (2015). Esta encuesta proporciona una introducción al aprendizaje automático probabilístico, que implica la representación y manipulación de la incertidumbre en modelos y predicciones, desempeñando un papel central en el análisis de datos científicos.

Artículo ADS CAS PubMed Google Scholar

Cogan, J. y col. Imágenes de jet: técnicas inspiradas en la visión por computadora para etiquetar jet. J. Física de alta energía. 2015, 118 (2015).

Artículo de Google Scholar

Zhao, W. y col. La deconvolución escasa mejora la resolución de la microscopía de fluorescencia de superresolución de células vivas. Nat. Biotecnología. 40, 606–617 (2022).

Artículo CAS PubMed Google Scholar

Brbić, M. et al. MARTE: descubrimiento de nuevos tipos de células a través de experimentos unicelulares heterogéneos. Nat. Métodos 17, 1200–1206 (2020).

Artículo PubMed Google Scholar

Qiao, C. y col. Evaluación y desarrollo de redes neuronales profundas para superresolución de imágenes en microscopía óptica. Nat. Métodos 18, 194–202 (2021).

Artículo CAS PubMed Google Scholar

Andreassen, A. et al. OmniFold: un método para desplegar simultáneamente todos los observables. Física. Rev. Lett. 124, 182001 (2020).

Artículo ADS CAS PubMed Google Scholar

Bergenstråhle, L. et al. Transcriptómica espacial súper resuelta mediante fusión profunda de datos. Nat. Biotecnología. 40, 476–479 (2021).

Vicente, P. et al. Extracción y composición de funciones sólidas con codificadores automáticos de eliminación de ruido. En Conferencia internacional sobre aprendizaje automático 1096–1103 (2008).

Kingma, DP y Welling, M. Bayes variacional de codificación automática. En Conferencia Internacional sobre Representaciones del Aprendizaje (2014).

Eraslan, G. et al. Eliminación de ruido de secuencia de ARN unicelular mediante un codificador automático de recuento profundo. Nat. Comunitario. 10, 390 (2019).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Goodfellow, I., Bengio, Y. y Courville, A. Aprendizaje profundo (MIT Press, 2016).

Olshausen, BA & Field, DJ Aparición de propiedades de campos receptivos de células simples mediante el aprendizaje de un código disperso para imágenes naturales. Naturaleza 381, 607–609 (1996).

Artículo ADS CAS PubMed Google Scholar

Bengio, Y. Aprendizaje profundo de representaciones para aprendizaje no supervisado y por transferencia. En Taller ICML sobre aprendizaje por transferencia y no supervisado (2012).

Detlefsen, NS, Hauberg, S. y Boomsma, W. Aprendizaje de representaciones significativas de secuencias de proteínas. Nat. Comunitario. 13, 1914 (2022).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Becht, E. et al. Reducción de dimensionalidad para visualizar datos de una sola celda usando UMAP. Nat. Biotecnología. 37, 38–44 (2019).

Artículo CAS Google Scholar

Bronstein, MM y cols. Aprendizaje profundo geométrico: yendo más allá de los datos euclidianos. Mag. de proceso de señal IEEE. 34, 18–42 (2017).

ADS del artículo Google Scholar

Anderson, PW Más es diferente: la simetría rota y la naturaleza de la estructura jerárquica de la ciencia. Ciencia 177, 393–396 (1972).

Artículo ADS CAS PubMed Google Scholar

Qiao, Z. y col. Informar el aprendizaje profundo geométrico con interacciones electrónicas para acelerar la química cuántica. Proc. Acad. Nacional. Ciencia. Estados Unidos 119, e2205221119 (2022).

Bogatskiy, A. et al. Arquitecturas equivariantes de grupos de simetría para física. Preimpresión en https://arxiv.org/abs/2203.06153 (2022).

Bronstein, MM y cols. Aprendizaje profundo geométrico: cuadrículas, grupos, gráficos, geodésicas y medidores. Preimpresión en https://arxiv.org/abs/2104.13478 (2021).

Townshend, RJL y cols. Aprendizaje profundo geométrico de la estructura del ARN. Ciencia 373, 1047–1051 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Wicky, BIM y otros. Alucinantes conjuntos de proteínas simétricos. Ciencia 378, 56–61 (2022).

Kipf, TN y Welling, M. Clasificación semisupervisada con redes convolucionales de gráficos. En Conferencia Internacional sobre Representaciones del Aprendizaje (2017).

Veličković, P. et al. Graficar redes de atención. En Conferencia Internacional sobre Representaciones del Aprendizaje (2018).

Hamilton, WL, Ying, Z. & Leskovec, J. Aprendizaje de representación inductiva en gráficos grandes. En Avances en sistemas de procesamiento de información neuronal 30, 1024–1034 (2017).

Gilmer, J. y col. Mensaje neuronal que pasa por la química cuántica. En Conferencia internacional sobre aprendizaje automático 1263–1272 (2017).

Li, MM, Huang, K. y Zitnik, M. Aprendizaje de representación gráfica en biomedicina y atención sanitaria. Nat. Biomédica. Ing. 6, 1353-1369 (2022).

Satorras, VG, Hoogeboom, E. & Welling, M. Redes neuronales de gráficos equivariantes E (n). En Conferencia internacional sobre aprendizaje automático 9323–9332 (2021). Este estudio incorpora principios de la física en el diseño de modelos neuronales, avanzando en el campo del aprendizaje automático equivariante.

Thomas, N. y col. Redes de campo tensorial: redes neuronales equivalentes de rotación y traslación para nubes de puntos 3D. Preimpresión en https://arxiv.org/abs/1802.08219 (2018).

Finzi, M. y col. Generalización de redes neuronales convolucionales para equivarianza para grupos de mentiras en datos continuos arbitrarios. En Conferencia internacional sobre aprendizaje automático 3165–3176 (2020).

Fuchs, F. y col. Transformadores SE (3): redes de atención equivariantes de rototraducción 3D. En Avances en sistemas de procesamiento de información neuronal 33, 1970-1981 (2020).

Zaheer, M. y col. Series profundas. En Avances en sistemas de procesamiento de información neuronal 30, 3391–3401 (2017). Este artículo es un estudio inicial que explora el uso de arquitecturas neuronales profundas en datos establecidos, que consisten en una lista desordenada de elementos.

Cohen, TS y cols. CNN esféricas. En Conferencia Internacional sobre Representaciones del Aprendizaje (2018).

Gordon, J. y col. Modelos equivariantes de permutación para la generalización compositiva en el lenguaje. En Conferencia Internacional sobre Representaciones del Aprendizaje (2019).

Finzi, M., Welling, M. & Wilson, AG Un método práctico para construir perceptrones multicapa equivariantes para grupos de matrices arbitrarios. En Conferencia internacional sobre aprendizaje automático 3318–3328 (2021).

Dijk, DV y cols. Recuperación de interacciones genéticas a partir de datos unicelulares mediante difusión de datos. Celda 174, 716–729 (2018).

Artículo PubMed PubMed Central Google Scholar

Gainza, P. et al. Descifrar huellas dactilares de interacción de superficies moleculares de proteínas mediante aprendizaje profundo geométrico. Nat. Métodos 17, 184–192 (2020).

Artículo CAS PubMed Google Scholar

Hatfield, PW y cols. El futuro impulsado por los datos de la física de alta densidad de energía. Naturaleza 593, 351–361 (2021).

Artículo ADS CAS PubMed Google Scholar

Bapst, V. y col. Revelando el poder predictivo de la estructura estática en sistemas vítreos. Nat. Física. 16, 448–454 (2020).

Artículo CAS Google Scholar

Zhang, R., Zhou, T. & Ma, J. Análisis Hi-C unicelular integrador y multiescala con Higashi. Nat. Biotecnología. 40, 254–261 (2022).

Artículo CAS PubMed Google Scholar

Sammut, S.-J. et al. Predictor de aprendizaje automático multiómico de la respuesta a la terapia del cáncer de mama. Naturaleza 601, 623–629 (2022).

Artículo ADS CAS PubMed Google Scholar

DeZoort, G. y col. Grafique redes neuronales en el Gran Colisionador de Hadrones. Nat. Rev. Phys. 5, 281–303 (2023).

Liu, S. y col. Representación de gráficos moleculares previos al entrenamiento con geometría 3D. En Conferencia Internacional sobre Representaciones del Aprendizaje (2022).

La colaboración científica LIGO. et al. Una medición de sirena estándar de ondas gravitacionales de la constante de Hubble. Naturaleza 551, 85–88 (2017).

Artículo de Google Scholar

Reichstein, M. y col. Aprendizaje profundo y comprensión de procesos para la ciencia del sistema terrestre basada en datos. Naturaleza 566, 195–204 (2019).

Artículo ADS CAS PubMed Google Scholar

Goenka, SD y cols. Identificación acelerada de variantes que causan enfermedades con secuenciación ultrarrápida del genoma de nanoporos. Nat. Biotecnología. 40, 1035-1041 (2022).

Bengio, Y. et al. Entrenamiento codicioso por capas de redes profundas. En Avances en los sistemas de procesamiento de información neuronal 19, 153–160 (2006).

Hinton, GE, Osindero, S. y Teh, Y.-W. Un algoritmo de aprendizaje rápido para redes de creencias profundas. Computación neuronal. 18, 1527-1554 (2006).

Artículo MathSciNet PubMed MATH Google Scholar

Jordan, MI y Mitchell, TM Aprendizaje automático: tendencias, perspectivas y perspectivas. Ciencia 349, 255–260 (2015).

Artículo ADS MathSciNet CAS PubMed MATH Google Scholar

Devlin, J. y col. BERT: preentrenamiento de transformadores bidireccionales profundos para la comprensión del lenguaje. En el Capítulo norteamericano de la Asociación de Lingüística Computacional 4171–4186 (2019).

Rives, A. et al. La estructura y función biológicas surgen de la ampliación del aprendizaje no supervisado a 250 millones de secuencias de proteínas. Proc. Acad. Nacional. Ciencia. Estados Unidos 118, e2016239118 (2021).

Elnaggar, A. y col. ProtTrans: busca descifrar el lenguaje del código de la vida mediante aprendizaje profundo autosupervisado y computación de alto rendimiento. En Transacciones IEEE sobre análisis de patrones e inteligencia artificial (2021).

Hola, B. et al. Aprendiendo el lenguaje de la evolución y el escape viral. Science 371, 284–288 (2021). En este artículo se modeló el escape viral con algoritmos de aprendizaje automático desarrollados originalmente para el lenguaje natural humano.

Artículo ADS MathSciNet CAS PubMed MATH Google Scholar

Biswas, S. y col. Ingeniería de proteínas con bajo contenido de N con aprendizaje profundo eficiente en datos. Nat. Métodos 18, 389–396 (2021).

Artículo CAS PubMed Google Scholar

Ferruz, N. & Höcker, B. Diseño de proteínas controlables con modelos de lenguaje. Nat. Mach. Intel. 4, 521–532 (2022).

Hsu, C. y col. Aprender el plegado inverso de millones de estructuras predichas. En Conferencia internacional sobre aprendizaje automático 8946–8970 (2022).

Baek, M. y col. Predicción precisa de estructuras e interacciones de proteínas utilizando una red neuronal de tres vías. Ciencia 373, 871–876 (2021). Inspirándose en AlphaFold2, este estudio informó sobre RoseTTAFold, un novedoso módulo neuronal de tres pistas capaz de procesar simultáneamente la secuencia, la distancia y las coordenadas de las proteínas.

Artículo ADS CAS PubMed PubMed Central Google Scholar

Weininger, D. SMILES, un lenguaje químico y un sistema de información. 1. Introducción a la metodología y reglas de codificación. J. química. inf. Computadora. Ciencia. 28, 31–36 (1988).

Artículo CAS Google Scholar

Lin, T.-S. et al. BigSMILES: una notación lineal basada estructuralmente para describir macromoléculas. Céntimo ACS. Ciencia. 5, 1523-1531 (2019).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Krenn, M. y col. SELFIES y el futuro de las representaciones de cuerdas moleculares. Patrones 3, 100588 (2022).

Flam-Shepherd, D., Zhu, K. y Aspuru-Guzik, A. Los modelos de lenguaje pueden aprender distribuciones moleculares complejas. Nat. Comunitario. 13, 3293 (2022).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Skinnider, MA y cols. Los modelos de lenguaje químico permiten la navegación en un espacio químico escasamente poblado. Nat. Mach. Intel. 3, 759–770 (2021).

Artículo de Google Scholar

Chithrananda, S., Grand, G. & Ramsundar, B. ChemBERTa: preentrenamiento autosupervisado a gran escala para la predicción de propiedades moleculares. En Taller de Aprendizaje Automático para Moléculas en NeurIPS (2020).

Schwaller, P. y col. Predecir rutas retrosintéticas utilizando modelos basados en transformadores y una estrategia de exploración de hipergráficos. Química. Ciencia. 11, 3316–3325 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Tetko, IV y cols. Modelos de transformadores PNL aumentados de última generación para retrosíntesis directa y de un solo paso. Nat. Comunitario. 11, 5575 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Schwaller, P. y col. Mapeo del espacio de reacciones químicas utilizando redes neuronales basadas en la atención. Nat. Mach. Intel. 3, 144-152 (2021).

Artículo de Google Scholar

Kovács, DP, McCorkindale, W. & Lee, AA La interpretación cuantitativa explica los modelos de aprendizaje automático para la predicción de reacciones químicas y descubre sesgos. Nat. Comunitario. 12, 1695 (2021).

Artículo ADS PubMed PubMed Central Google Scholar

Pesciullesi, G. et al. El aprendizaje por transferencia permite al transformador molecular predecir reacciones regio y estereoselectivas en los carbohidratos. Nat. Comunitario. 11, 4874 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Vaswani, A. y col. Atención es todo lo que necesitas. En Avances en sistemas de procesamiento de información neuronal 30, 5998–6008 (2017). Este artículo presentó el transformador, una arquitectura de red neuronal moderna que puede procesar datos secuenciales en paralelo, revolucionando el procesamiento del lenguaje natural y el modelado de secuencias.

Mousavi, SM et al. Transformador sísmico: un modelo atento de aprendizaje profundo para la detección simultánea de terremotos y la selección de fases. Nat. Comunitario. 11, 3952 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Avsec, Ž. et al. Predicción eficaz de la expresión genética a partir de una secuencia mediante la integración de interacciones de largo alcance. Nat. Métodos 18, 1196–1203 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Meier, J. y col. Los modelos de lenguaje permiten una predicción cero de los efectos de las mutaciones en la función de las proteínas. En Avances en sistemas de procesamiento de información neuronal 34, 29287–29303 (2021).

Kamienny, P.-A. et al. Regresión simbólica de extremo a extremo con transformadores. En Avances en sistemas de procesamiento de información neuronal 35, 10269–10281 (2022).

Jaegle, A. y col. Perceptor: percepción general con atención iterativa. En Conferencia internacional sobre aprendizaje automático 4651–4664 (2021).

Chen, L. y col. Transformador de decisiones: aprendizaje por refuerzo mediante modelado de secuencias. En Avances en sistemas de procesamiento de información neuronal 34, 15084–15097 (2021).

Dosovitskiy, A. et al. Una imagen vale 16x16 palabras: transformadores para el reconocimiento de imágenes a escala. En Conferencia Internacional sobre Representaciones del Aprendizaje (2020).

Choromanski, K. y col. Repensar la atención con los intérpretes. En Conferencia Internacional sobre Representaciones del Aprendizaje (2021).

Li, Z. y col. Operador neuronal de Fourier para ecuaciones diferenciales parciales paramétricas. En Conferencia Internacional sobre Representaciones del Aprendizaje (2021).

Kovachki, N. y col. Operador neuronal: aprendizaje de mapas entre espacios funcionales. J. Mach. Aprender. Res. 24, 1–97 (2023).

Russell, leyes del movimiento planetario de JL Kepler: 1609-1666. Hno. J. Hist. Ciencia. 2, 1–24 (1964).

Artículo de Google Scholar

Huang, K. y col. Fundamento de la inteligencia artificial para la ciencia terapéutica. Nat. Química. Biol. 18, 1033–1036 (2022).

Guimerà, R. et al. Un científico de máquinas bayesianas para ayudar en la solución de problemas científicos desafiantes. Ciencia. Adv. 6, eaav6971 (2020).

Artículo ADS PubMed PubMed Central Google Scholar

Liu, G. y col. Descubrimiento guiado por aprendizaje profundo de un antibiótico dirigido a Acinetobacter baumannii. Nat. Química. Biol. https://doi.org/10.1038/s41589-023-01349-8 (2023).

Gómez-Bombarelli, R. et al. Diseño de diodos emisores de luz orgánicos moleculares eficientes mediante un enfoque experimental y de detección virtual de alto rendimiento. Nat. Madre. 15, 1120-1127 (2016). Este artículo propone utilizar un predictor de IA de caja negra para acelerar la detección de moléculas de alto rendimiento en la ciencia de materiales.

Artículo ADS PubMed Google Scholar

Sadybekov, AA et al. Descubrimiento de ligandos basado en sintetizadores en bibliotecas virtuales de más de 11 mil millones de compuestos. Naturaleza 601, 452–459 (2022).

Artículo ADS CAS PubMed Google Scholar

La evidencia de colaboración NNPDF sobre quarks de encanto intrínsecos en el protón. Naturaleza 606, 483–487 (2022).

Artículo de Google Scholar

Graff, DE, Shakhnovich, EI y Coley, CW Aceleración de la detección virtual de alto rendimiento mediante el aprendizaje activo basado en grupos moleculares. Química. Ciencia. 12, 7866–7881 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Janet, JP y cols. Diseño multiobjetivo preciso en un espacio de millones de complejos de metales de transición con optimización global eficiente impulsada por redes neuronales. Céntimo ACS. Ciencia. 6, 513–524 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Tocino, F. Nuevo Organon vol. 1620 (2000).

Schmidt, M. & Lipson, H. Destilación de leyes naturales de forma libre a partir de datos experimentales. Ciencia 324, 81–85 (2009).

Artículo ADS CAS PubMed Google Scholar

Petersen, BK y cols. Regresión simbólica profunda: recuperación de expresiones matemáticas a partir de datos a través de gradientes de políticas de búsqueda de riesgos. En Conferencia Internacional sobre Representaciones del Aprendizaje (2020).

Zhavoronkov, A. y col. El aprendizaje profundo permite la identificación rápida de potentes inhibidores de la quinasa DDR1. Nat. Biotecnología. 37, 1038-1040 (2019). Este artículo describe un algoritmo de aprendizaje por refuerzo para navegar en espacios combinatorios moleculares y valida las moléculas generadas mediante experimentos en laboratorio húmedo.

Artículo CAS PubMed Google Scholar

Zhou, Z. y col. Optimización de moléculas mediante aprendizaje por refuerzo profundo. Ciencia. Rep. 9, 10752 (2019).

Artículo ADS PubMed PubMed Central Google Scholar

Usted, J. et al. Red de políticas convolucionales de gráficos para la generación de gráficos moleculares dirigidos a objetivos. En Avances en sistemas de procesamiento de información neuronal 31, 6412–6422 (2018).

Bengio, Y. et al. Fundamentos de GFlowNet. Preimpresión en https://arxiv.org/abs/2111.09266 (2021). Este artículo describe una red de flujo generativo que genera objetos tomándolos de una distribución optimizada para el diseño de fármacos.

Jain, M. y col. Diseño de secuencia biológica con GFlowNets. En Conferencia internacional sobre aprendizaje automático 9786–9801 (2022).

Malkin, N. y col. Balance de trayectoria: mejora de la asignación de créditos en GFlowNets. En Avances en sistemas de procesamiento de información neuronal 35, 5955–5967 (2022).

Borkowski, O. y col. Exploración guiada por aprendizaje activo a gran escala para la optimización de la producción de proteínas in vitro. Nat. Comunitario. 11, 1872 (2020). Este estudio introdujo un enfoque de programación dinámica para determinar las ubicaciones y capacidades óptimas de las represas hidroeléctricas en la cuenca del Amazonas, equilibrando la producción de energía y el impacto ambiental.

Artículo ADS CAS PubMed PubMed Central Google Scholar

Flecker, AS y cols. Reducir los impactos adversos de la expansión hidroeléctrica del Amazonas. Science 375, 753–760 (2022). Este estudio introdujo un enfoque de programación dinámica para determinar las ubicaciones y capacidades óptimas de las represas hidroeléctricas en la cuenca del Amazonas, logrando un equilibrio entre los beneficios de la producción de energía y los posibles impactos ambientales.

Artículo ADS CAS PubMed Google Scholar

Pion-Tonachini, L. et al. Aprender de las máquinas de aprendizaje: una nueva generación de tecnología de inteligencia artificial para satisfacer las necesidades de la ciencia. Preimpresión en https://arxiv.org/abs/2111.13786 (2021).

Kusner, MJ, Paige, B. & Hernández-Lobato, JM Autocodificador variacional gramatical. En Conferencia internacional sobre aprendizaje automático 1945-1954 (2017). Este artículo describe un autocodificador variacional gramatical que genera nuevas leyes simbólicas y moléculas de fármacos.

Brunton, SL, Proctor, JL y Kutz, JN Descubrimiento de ecuaciones rectoras a partir de datos mediante una identificación escasa de sistemas dinámicos no lineales. Proc. Acad. Nacional. Ciencia. Estados Unidos 113, 3932–3937 (2016).

Artículo ADS MathSciNet CAS PubMed PubMed Central MATH Google Scholar

Liu, Z. y Tegmark, M. Simetrías ocultas del aprendizaje automático. Física. Rev. Lett. 128, 180201 (2022).

Artículo ADS MathSciNet CAS PubMed Google Scholar

Gabbard, H. y col. Estimación de parámetros bayesianos utilizando codificadores automáticos variacionales condicionales para astronomía de ondas gravitacionales. Nat. Física. 18, 112-117 (2022).

Artículo CAS Google Scholar

Chen, D. y col. Automatizar el mapeo de fases de la estructura cristalina combinando el aprendizaje profundo con el razonamiento de restricciones. Nat. Mach. Intel. 3, 812–822 (2021).

Artículo de Google Scholar

Gómez-Bombarelli, R. et al. Diseño químico automático utilizando una representación continua de moléculas basada en datos. Céntimo ACS. Ciencia. 4, 268–276 (2018).

Anishchenko, I. et al. Diseño de proteínas de novo mediante alucinación de red profunda. Naturaleza 600, 547–552 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Fu, T. y col. Árbol de andamiaje diferenciable para optimización molecular. En Conferencia Internacional sobre Representaciones del Aprendizaje (2021).

Sanchez-Lengeling, B. & Aspuru-Guzik, A. Diseño molecular inverso mediante aprendizaje automático: modelos generativos para ingeniería de la materia. Ciencia 361, 360–365 (2018).

Artículo ADS CAS PubMed Google Scholar

Huang, K. y col. Therapeutics Data Commons: conjuntos de datos de aprendizaje automático y tareas para el descubrimiento y desarrollo de fármacos. En Conjuntos de datos y puntos de referencia de NeurIPS (2021). Este estudio describe una iniciativa con modelos abiertos de IA, conjuntos de datos y programas educativos para facilitar los avances en la ciencia terapéutica en todas las etapas del descubrimiento y desarrollo de fármacos.

Danza, A. Peligro de laboratorio. Naturaleza 458, 664–665 (2009).

Artículo CAS PubMed Google Scholar

Segler, MHS, Preuss, M. & Waller, MP Planificación de síntesis químicas con redes neuronales profundas e IA simbólica. Naturaleza 555, 604–610 (2018). Este artículo describe un enfoque que combina redes neuronales profundas con la búsqueda de árboles de Monte Carlo para planificar la síntesis química.

Artículo ADS CAS PubMed Google Scholar

Gao, W., Raghavan, P. y Coley, CW Plataformas autónomas para síntesis orgánica basada en datos. Nat. Comunitario. 13, 1075 (2022).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Kusne, AG y cols. Descubrimiento de materiales sobre la marcha en circuito cerrado mediante aprendizaje activo bayesiano. Nat. Comunitario. 11, 5966 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Gormley, AJ y Webb, MA Aprendizaje automático en química combinatoria de polímeros. Nat. Rev. Mater. 6, 642–644 (2021).

Artículo ADS CAS PubMed Google Scholar

Ament, S. et al. Síntesis autónoma de materiales mediante aprendizaje activo jerárquico de diagramas de fases de desequilibrio. Ciencia. Adv. 7, eabg4930 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Degrave, J. y col. Control magnético de plasmas tokamak mediante aprendizaje por refuerzo profundo. Nature 602, 414–419 (2022). Este artículo describe un enfoque para controlar los plasmas de tokamak, utilizando un agente de aprendizaje por refuerzo para comandar y controlar bobinas y satisfacer restricciones físicas y operativas.

Artículo ADS CAS PubMed PubMed Central Google Scholar

Melnikov, AA y cols. La máquina de aprendizaje activo aprende a crear nuevos experimentos cuánticos. Proc. Acad. Nacional. Ciencia. Estados Unidos 115, 1221-1226 (2018).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Smith, JS, Isayev, O. & Roitberg, AE ANI-1: un potencial de red neuronal extensible con precisión DFT al costo computacional del campo de fuerza. Química. Ciencia. 8, 3192–3203 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Wang, D. y col. Muestreo eficiente de paisajes de energía libre de alta dimensión utilizando dinámica reforzada adaptativa. Nat. Computadora. Ciencia. 2, 20–29 (2022). Este artículo describe una red neuronal para estimaciones confiables de incertidumbre en dinámica molecular, lo que permite un muestreo eficiente de paisajes de energía libre de alta dimensión.

Artículo CAS Google Scholar

Wang, W. & Gómez-Bombarelli, R. Autocodificadores de grano grueso para dinámica molecular. npj Computación. Madre. 5, 125 (2019).

ADS del artículo Google Scholar

Hermann, J., Schätzle, Z. y Noé, F. Solución de red neuronal profunda de la ecuación electrónica de Schrödinger. Nat. Química. 12, 891–897 (2020). Este artículo describe un método para aprender la función de onda de sistemas cuánticos utilizando redes neuronales profundas junto con Monte Carlo cuántico variacional.

Artículo CAS PubMed Google Scholar

Carleo, G. & Troyer, M. Resolver el problema cuántico de muchos cuerpos con redes neuronales artificiales. Ciencia 355, 602–606 (2017).

Artículo ADS MathSciNet CAS PubMed MATH Google Scholar

En Karniadakis, G. et al. Aprendizaje automático basado en la física. Nat. Rev. Phys. 3, 422–440 (2021).

Artículo de Google Scholar

Li, Z. y col. Operador neuronal con conocimientos de física para aprender ecuaciones diferenciales parciales. Preimpresión en https://arxiv.org/abs/2111.03794 (2021).

Kochkov, D. y col. Aprendizaje automático: dinámica de fluidos computacional acelerada. Proc. Acad. Nacional. Ciencia. Estados Unidos 118, e2101784118 (2021). Este artículo describe un enfoque para acelerar la dinámica de fluidos computacional mediante el entrenamiento de una red neuronal para interpolar de cuadrículas gruesas a finas y generalizar a diferentes funciones de forzado y números de Reynolds.

Ji, W. y col. Stiff-PINN: red neuronal basada en la física para una cinética química rígida. J. Física. Química. A 125, 8098–8106 (2021).

Artículo CAS PubMed Google Scholar

Smith, JD, Azizzadenesheli, K. & Ross, ZE EikoNet: resolución de la ecuación de Eikonal con redes neuronales profundas. Traducción IEEE. Geociencias. Sensores remotos 59, 10685–10696 (2020).

ADS del artículo Google Scholar

Waheed, UB y cols. PINNeik: solución Eikonal que utiliza redes neuronales basadas en la física. Computadora. Geociencias. 155, 104833 (2021).

Artículo de Google Scholar

Chen, RTQ y cols. Ecuaciones diferenciales ordinarias neuronales. En Avances en sistemas de procesamiento de información neuronal 31, 6572–6583 (2018). Este artículo estableció una conexión entre las redes neuronales y las ecuaciones diferenciales mediante la introducción del método adjunto para aprender sistemas dinámicos de tiempo continuo a partir de datos, reemplazando la retropropagación.

Raissi, M., Perdikaris, P. y Karniadakis, GE Redes neuronales basadas en física: un marco de aprendizaje profundo para resolver problemas directos e inversos que involucran ecuaciones diferenciales parciales no lineales. J. Computación. Física. 378, 686–707 (2019). Este artículo describe un enfoque de aprendizaje profundo para resolver problemas directos e inversos en ecuaciones diferenciales parciales no lineales y puede encontrar soluciones a ecuaciones diferenciales a partir de datos.

Artículo ADS MathSciNet MATH Google Scholar

Lu, L. y col. Aprendizaje de operadores no lineales a través de DeepONet basado en el teorema de aproximación universal de operadores. Nat. Mach. Intel. 3, 218–229 (2021).

Artículo de Google Scholar

Brandstetter, J., Worrall, D. & Welling, M. Solucionadores de PDE neuronales de paso de mensajes. En Conferencia Internacional sobre Representaciones del Aprendizaje (2022).

Noé, F. et al. Generadores de Boltzmann: muestreo de estados de equilibrio de sistemas de muchos cuerpos con aprendizaje profundo. Ciencia 365, eaaw1147 (2019). Este artículo presenta un algoritmo de muestreo eficiente que utiliza flujos de normalización para simular estados de equilibrio en sistemas de muchos cuerpos.

Rezende, D. & Mohamed, S. Inferencia variacional con flujos normalizadores. En Conferencia internacional sobre aprendizaje automático 37, 1530-1538, (2015).

Dinh, L., Sohl-Dickstein, J. & Bengio, S. Estimación de densidad utilizando NVP real. En Conferencia Internacional sobre Representaciones del Aprendizaje (2017).

Nicoli, KA et al. Estimación de observables termodinámicos en teorías de campos reticulares con modelos generativos profundos. Física. Rev. Lett. 126, 032001 (2021).

Artículo ADS MathSciNet CAS PubMed Google Scholar

Kanwar, G. y col. Muestreo equivalente basado en flujo para la teoría del calibre de red. Física. Rev. Lett. 125, 121601 (2020).

Artículo ADS MathSciNet CAS PubMed Google Scholar

Gabrié, M., Rotskoff, GM y Vanden-Eijnden, E. Monte Carlo adaptativo aumentado con flujos normalizados. Proc. Acad. Nacional. Ciencia. EE.UU. 119, e2109420119 (2022).

Artículo MathSciNet PubMed PubMed Central Google Scholar

Jasra, A., Holmes, CC y Stephens, DA Métodos de Monte Carlo en cadena de Markov y el problema de cambio de etiquetas en el modelado de mezclas bayesianas. Estadística. Ciencia. 20, 50–67 (2005).

Bengio, Y. et al. Mejor mezcla a través de representaciones profundas. En Conferencia internacional sobre aprendizaje automático 552–560 (2013).

Pompe, E., Holmes, C. y Łatuszyński, K. Un marco para MCMC adaptativo dirigido a distribuciones multimodales. Ana. Estadística. 48, 2930–2952 (2020).

Artículo MathSciNet MATEMÁTICAS Google Scholar

Townshend, RJL y cols. ATOM3D: tareas sobre moléculas en tres dimensiones. En Conjuntos de datos y puntos de referencia de NeurIPS (2021).

Kearnes, SM et al. La base de datos de reacciones abierta. Mermelada. Química. Soc. 143, 18820–18826 (2021).

Artículo CAS PubMed Google Scholar

Chanussot, L. et al. Conjunto de datos de Open Catalyst 2020 (OC20) y desafíos comunitarios. ACS Catal. 11, 6059–6072 (2021).

Artículo CAS Google Scholar

Brown, N. y col. GuacaMol: modelos de evaluación comparativa para el diseño molecular de novo. J. química. inf. Modelo. 59, 1096-1108 (2019).

Artículo ADS CAS PubMed Google Scholar

Notin, P. y col. Trancepción: predicción de la aptitud de las proteínas con transformadores autorregresivos y recuperación del tiempo de inferencia. En Conferencia internacional sobre aprendizaje automático 16990–17017 (2022).

Mitchell, M. y col. Tarjetas modelo para informes modelo. En Conferencia sobre equidad, responsabilidad y transparencia 220–229 (2019).

Gebru, T. y col. Hojas de datos para conjuntos de datos. Comunitario. ACM 64, 86–92 (2021).

Artículo de Google Scholar

Bai, X. y col. Avanzando en el diagnóstico de COVID-19 con una colaboración en inteligencia artificial que preserve la privacidad. Nat. Mach. Intel. 3, 1081–1089 (2021).

Artículo de Google Scholar

Warnat-Herresthal, S. et al. Aprendizaje enjambre para el aprendizaje automático clínico descentralizado y confidencial. Naturaleza 594, 265–270 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Hie, B., Cho, H. & Berger, B. Realización de una colaboración farmacológica práctica y privada. Ciencia 362, 347–350 (2018).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Rohrbach, S. y col. Digitalización y validación de una base de datos de literatura de síntesis química en la ChemPU. Ciencia 377, 172–180 (2022).

Artículo ADS CAS PubMed Google Scholar

Gysi, DM y cols. Marco de medicina en red para identificar oportunidades de reutilización de medicamentos para COVID-19. Proc. Acad. Nacional. Ciencia. Estados Unidos 118, e2025581118 (2021).

Artículo CAS Google Scholar

King, RD y cols. La automatización de la ciencia. Ciencia 324, 85–89 (2009).

Artículo ADS CAS PubMed Google Scholar

Mirdita, M. et al. ColabFold: hacer que el plegamiento de proteínas sea accesible para todos. Nat. Métodos 19, 679–682 (2022).

Doerr, S. y col. TorchMD: un marco de aprendizaje profundo para simulaciones moleculares. J. química. Computación teórica. 17, 2355–2363 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Schoenholz, SS y Cubuk, ED JAX MD: un marco para la física diferenciable. En Avances en sistemas de procesamiento de información neuronal 33, 11428–11441 (2020).

Peters, J., Janzing, D. & Schölkopf, B. Elementos de inferencia causal: fundamentos y algoritmos de aprendizaje (MIT Press, 2017).

Bengio, Y. et al. Un objetivo de metatransferencia para aprender a desenredar los mecanismos causales. En Conferencia Internacional sobre Representaciones del Aprendizaje (2020).

Schölkopf, B. y col. Hacia el aprendizaje de la representación causal. Proc. IEEE 109, 612–634 (2021).

Artículo de Google Scholar

Goyal, A. & Bengio, Y. Sesgos inductivos para el aprendizaje profundo de la cognición de nivel superior. Proc. R. Soc. A 478, 20210068 (2022).

Deleu, T. et al. Aprendizaje de estructuras bayesianas con redes de flujo generativo. En Conferencia sobre la incertidumbre en la inteligencia artificial 518–528 (2022).

Geirhos, R. et al. Aprendizaje abreviado en redes neuronales profundas. Nat. Mach. Intel. 2, 665–673 (2020).

Artículo de Google Scholar

Koh, PW y cols. WILDS: un punto de referencia de los cambios de distribución en la naturaleza. En Conferencia internacional sobre aprendizaje automático 5637–5664 (2021).

Luo, Z. y col. Etiquete el aprendizaje eficiente de representaciones transferibles entre dominios y tareas. En Avances en sistemas de procesamiento de información neuronal 30, 165-177 (2017).

Mahmood, R. y col. ¿Cuántos datos más necesito? Estimar los requisitos para las tareas posteriores. En Conferencia IEEE sobre visión por computadora y reconocimiento de patrones 275–284 (2022).

Coley, CW, Eyke, NS y Jensen, KF Descubrimiento autónomo en las ciencias químicas parte II: perspectivas. Angélica. Química. En t. Ed. 59, 23414–23436 (2020).

Artículo CAS Google Scholar

Gao, W. & Coley, CW La sintetizabilidad de moléculas propuestas por modelos generativos. J. química. inf. Modelo. 60, 5714–5723 (2020).

Artículo CAS PubMed Google Scholar

Kogler, R. y col. Subestructura de chorro en el Gran Colisionador de Hadrones. Mod. Rev. Física. 91, 045003 (2019).

Artículo ADS CAS Google Scholar

Acosta, J. N. et al. Multimodal biomedical AI. Nat. Med. 28, 1773–1784 (2022).

Alayrac, J.-B. et al. Flamingo: un modelo de lenguaje visual para el aprendizaje en pocas tomas. En Avances en sistemas de procesamiento de información neuronal 35, 23716–23736 (2022).

Elmarakeby, HA y cols. Red neuronal profunda biológicamente informada para el descubrimiento del cáncer de próstata. Naturaleza 598, 348–352 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Qin, Y. et al. Un mapa de múltiples escalas de la estructura celular que fusiona imágenes e interacciones de proteínas. Naturaleza 600, 536–542 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Schaffer, LV & Ideker, T. Mapeo de la estructura multiescala de los sistemas biológicos. Sistemas celulares 12, 622–635 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Stiglic, G. et al. Interpretabilidad de modelos de predicción basados en aprendizaje automático en el sector sanitario. Wiley Interdisciplinario. Rev. Datos Min. Conocimiento. Descubrimiento. 10, e1379 (2020).

Artículo de Google Scholar

Erion, G. y col. Un marco económico para el desarrollo de modelos de IA para aplicaciones sanitarias. Nat. Biomédica. Ing. 6, 1384-1398 (2022).

Lundberg, SM et al. Predicciones explicables de aprendizaje automático para la prevención de la hipoxemia durante la cirugía. Nat. Biomédica. Ing. 2, 749–760 (2018).

Artículo PubMed PubMed Central Google Scholar

Sanders, LM y cols. Más allá de la órbita terrestre baja: investigación biológica, inteligencia artificial y laboratorios autónomos. Preimpresión en https://arxiv.org/abs/2112.12582 (2021).

Gagne, DJ II y col. Aprendizaje profundo interpretable para el análisis espacial de granizadas severas. Lun. Tiempo Rev. 147, 2827–2845 (2019).

ADS del artículo Google Scholar

Rudin, C. Deje de explicar modelos de aprendizaje automático de caja negra para decisiones de alto riesgo y utilice modelos interpretables en su lugar. Nat. Mach. Intel. 1, 206–215 (2019).

Artículo PubMed PubMed Central Google Scholar

Koh, PW y Liang, P. Comprensión de las predicciones de caja negra mediante funciones de influencia. En Conferencia internacional sobre aprendizaje automático 1885–1894 (2017).

Mirzasoleiman, B., Bilmes, J. & Leskovec, J. Coresets para el entrenamiento eficiente de datos de modelos de aprendizaje automático. En Conferencia internacional sobre aprendizaje automático 6950–6960 (2020).

Kim, B. y col. Interpretabilidad más allá de la atribución de características: pruebas cuantitativas con vectores de activación de conceptos (TCAV). En Conferencia internacional sobre aprendizaje automático 2668–2677 (2018).

Plata, D. et al. Dominar el juego del go sin conocimiento humano. Naturaleza 550, 354–359 (2017).

Artículo ADS CAS PubMed Google Scholar

Baum, ZJ y cols. Inteligencia artificial en química: tendencias actuales y direcciones futuras. J. química. inf. Modelo. 61, 3197–3212 (2021).

Artículo CAS PubMed Google Scholar

Finlayson, SG y cols. Ataques contradictorios al aprendizaje automático médico. Ciencia 363, 1287-1289 (2019).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Urbina, F. et al. Uso dual del descubrimiento de fármacos impulsado por inteligencia artificial. Nat. Mach. Intel. 4, 189-191 (2022).

Artículo PubMed PubMed Central Google Scholar

Norgeot, B. y col. Información mínima sobre el modelado clínico de inteligencia artificial: la lista de verificación MI-CLAIM. Nat. Medicina. 26, 1320-1324 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Descargar referencias

MZ agradece el apoyo de los Institutos Nacionales de Salud bajo R01HD108794, la Fuerza Aérea de EE. UU. bajo FA8702-15-D-0001, los premios de Harvard Data Science Initiative, Amazon Faculty Research, Google Research Scholar Program, Bayer Early Excellence in Science, AstraZeneca Research , Alianza de Roche con Científicos Distinguidos y el Instituto Kempner para el Estudio de la Inteligencia Natural y Artificial. CPG y YD reconocen el apoyo de la Oficina de Investigación Científica de la Fuerza Aérea de EE. UU. en el marco del Programa de Iniciativas de Investigación Universitaria Multidisciplinaria (MURI) FA9550-18-1-0136, el Programa de Instrumentación de Investigación de la Universidad de Defensa (DURIP) FA9550-21-1-0316 y los premios del Agente de Razonamiento Científico Autónomo (SARA) y la IA para Asistente de Descubrimiento (AIDA). Cualquier opinión, hallazgo, conclusión o recomendación expresada en este material pertenece a los autores y no refleja necesariamente los puntos de vista de los financiadores. Agradecemos a D. Hassabis, A. Davies, S. Mohamed, Z. Li, K. Ma, Z. Qiao, E. Weinstein, AV Weller, Y. Zhong y AM Brandt por las discusiones sobre el artículo.

Hanchen Wang

Dirección actual: Departamento de Investigación y Desarrollo Temprano, Genentech Inc, South San Francisco, CA, EE. UU.

Hanchen Wang

Dirección actual: Departamento de Ciencias de la Computación, Universidad de Stanford, Stanford, CA, EE. UU.

Estos autores contribuyeron igualmente: Hanchen Wang, Tianfan Fu, Yuanqi Du

Departamento de Ingeniería, Universidad de Cambridge, Cambridge, Reino Unido

Hanchen Wang y Joan Lasenby

Departamento de Computación y Ciencias Matemáticas, Instituto de Tecnología de California, Pasadena, CA, EE. UU.

Hanchen Wang y Anima Anandkumar

Departamento de Ingeniería y Ciencias Computacionales, Instituto de Tecnología de Georgia, Atlanta, GA, EE. UU.

Tian Fan Fu

Departamento de Ciencias de la Computación, Universidad de Cornell, Ithaca, Nueva York, EE. UU.

Yuanqi Du y Carla P. Gomes

Departamento de Ingeniería Química, Instituto de Tecnología de Massachusetts, Cambridge, MA, EE. UU.

Wenhao Gao y Connor W. Coley

Departamento de Ciencias de la Computación, Universidad de Stanford, Stanford, CA, EE. UU.

Kexin Huang y Jure Leskovec

Departamento de Física, Instituto Tecnológico de Massachusetts, Cambridge, MA, EE.UU.

Ziming Liu

Programa Harvard-MIT en Ciencias y Tecnología de la Salud, Cambridge, MA, EE. UU.

Payal Chandak

Mila – Instituto de IA de Quebec, Montreal, Quebec, Canadá

Shengchao Liu, Andreea Deac, Jian Tang y Yoshua Bengio

Universidad de Montreal, Montreal, Quebec, Canadá

Shengchao Liu, Andreea Deac y Yoshua Bengio

Departamento de Ciencias de la Tierra, Ambientales y Planetarias, Universidad de Brown, Providence, RI, EE. UU.

Peter Van Katwyk y Karianne Bergen

Instituto de Ciencia de Datos, Universidad de Brown, Providence, Rhode Island, EE. UU.

Peter Van Katwyk y Karianne Bergen

NVIDIA, Santa Clara, CA, USA

anima anandkumar

Centro de Astrofísica Computacional, Flatiron Institute, Nueva York, NY, EE. UU.

Shirley Ho

Departamento de Ciencias Astrofísicas, Universidad de Princeton, Princeton, Nueva Jersey, EE. UU.

Shirley Ho

Departamento de Física, Universidad Carnegie Mellon, Pittsburgh, PA, EE. UU.

Shirley Ho

Departamento de Física y Centro de Ciencia de Datos, Universidad de Nueva York, Nueva York, NY, EE. UU.

Shirley Ho y Petar Velickovic

Google DeepMind, Londres, Reino Unido

Pushmeet Kohli

Investigación de Microsoft, Beijing, China

Tie-Yan Liu

Departamento de Informática Biomédica, Facultad de Medicina de Harvard, Boston, MA, EE. UU.

Arjun Manrai y Marinka Zitnik

Departamento de Biología de Sistemas, Facultad de Medicina de Harvard, Boston, MA, EE. UU.

Débora Marcas

Broad Institute del MIT y Harvard, Cambridge, MA, EE. UU.

Debora Marks y Marinka Zitnik

Deep Forest Sciences, Palo Alto, California, EE. UU.

Bharat Ramsundar

BioMapa, Beijing, China

y cancion

Universidad de Inteligencia Artificial Mohamed bin Zayed, Abu Dhabi, Emiratos Árabes Unidos

y cancion

Universidad de Illinois en Urbana-Champaign, Champaign, IL, EE. UU.

Jimeng Sun

HEC Montreal, Montreal, Quebec, Canadá

Jian Tang

Presidente de CIFAR AI, Toronto, Ontario, Canadá

Jian Tang

Departamento de Ciencia y Tecnología de la Computación, Universidad de Cambridge, Cambridge, Reino Unido

Petar Velickovic

Universidad de Amsterdam, Amsterdam, Países Bajos

Max Welling

Microsoft Research Ámsterdam, Ámsterdam, Países Bajos

Max Welling

Tecnología DP, Beijing, China

Lin Feng Zhang

Instituto de IA para la Ciencia, Beijing, China

Lin Feng Zhang

Departamento de Ingeniería Eléctrica y Ciencias de la Computación, Instituto de Tecnología de Massachusetts, Cambridge, MA, EE. UU.

Connor W. Coley

Iniciativa de ciencia de datos de Harvard, Cambridge, MA, EE. UU.

Marinka Zitnik

Instituto Kempner para el Estudio de la Inteligencia Natural y Artificial, Universidad de Harvard, Cambridge, MA, EE. UU.

Marinka Zitnik

También puedes buscar este autor en PubMed Google Scholar.

Todos los autores contribuyeron al diseño y redacción del artículo, ayudaron a dar forma a la investigación, brindaron comentarios críticos y comentaron sobre el artículo y sus revisiones. HW, TF, YD y MZ concibieron el estudio y fueron responsables de la dirección y planificación generales. WG, KH y ZL contribuyeron igualmente a este trabajo (igual segunda autoría) y están enumerados en orden alfabético.

Correspondencia a Marinka Zitnik.

Los autores declaran no tener conflictos de intereses.

Nature agradece a Brian Gallagher y Benjamin Nachman por su contribución a la revisión por pares de este trabajo.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Springer Nature o su licenciante (por ejemplo, una sociedad u otro socio) posee los derechos exclusivos de este artículo en virtud de un acuerdo de publicación con los autores u otros titulares de derechos; El autoarchivo por parte del autor de la versión manuscrita aceptada de este artículo se rige únicamente por los términos de dicho acuerdo de publicación y la ley aplicable.

Reimpresiones y permisos

Wang, H., Fu, T., Du, Y. et al. Descubrimiento científico en la era de la inteligencia artificial. Naturaleza 620, 47–60 (2023). https://doi.org/10.1038/s41586-023-06221-2

Descargar cita

Recibido: 30 de marzo de 2022

Aceptado: 16 de mayo de 2023

Publicado: 02 de agosto de 2023

Fecha de emisión: 03 de agosto de 2023

DOI: https://doi.org/10.1038/s41586-023-06221-2

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.