El futuro de la inteligencia artificial
Geoffrey Hinto
Durante medio siglo, las
investigaciones sobre la inteligencia artificial (IA) se basaron en una extraña
analogía con la lógica. El razonamiento lógico consiste en utilizar reglas de
inferencia válidas para deducir conclusiones verdaderas a partir de premisas
ciertas. Tanto las premisas como las conclusiones son concatenaciones de
símbolos y las reglas de inferencia son meros mecanismos de manipulación de
estas concatenaciones. Los investigadores dieron por sentado que esta era la
manera en la que debía funcionar toda la inteligencia.
Desde los albores de la IA
existieron apóstatas que afirmaban que, en vez de imitar a la lógica, la IA
debía tratar de imitar las redes neuronales del cerebro. En estas redes, los
estímulos generan grandes patrones de actividad neuronal. Estos a su vez producen
otros grandes patrones de actividad neuronal que acaban originando respuestas
motoras. Todo el conocimiento del sistema reside en la manera en que un patrón
de actividad da lugar a otro, y este conocimiento se aprende a través de la
experiencia más que a través de los datos introducidos por un programador.
En los últimos años, ha quedado patente que conseguir que un ordenador simule ser una red neuronal es una forma muy eficaz de dotar a las máquinas de la clase de inteligencia que se necesita para tareas tales como el reconocimiento de voz, la interpretación de imágenes, la traducción automática y la práctica de juegos como el go, que requieren conocimientos intuitivos. Este planteamiento se denomina “aprendizaje profundo” (deep learning) porque utiliza redes neuronales profundas compuestas por muchas capas de neuronas. En lugar de tratar de poner por escrito todo lo que sabemos mediante expresiones simbólicas, permitimos que el ordenador aprenda todo lo que sabe a partir de ejemplos.
Si
deseamos traducir una frase del español al coreano, entrenamos a un ordenador
mediante la introducción de multitud de pares de frases en español con sus
traducciones en coreano hasta que asimile el concepto. El ordenador está
programado para comportarse como una red de neuronas cerebrales. Dicha red
aprende modificando la intensidad de las conexiones entre las células
cerebrales artificiales mediante un algoritmo de uso general bastante sencillo
denominado propagación hacia atrás o “retropropagación” (backpropagation).
Mediante este algoritmo de aprendizaje, la red neuronal artificial aprende a
convertir los símbolos introducidos correspondientes a las palabras en español
en patrones de actividad en miles de neuronas que captan los significados de
esas palabras. Por ejemplo, la palabra “miércoles” generará un patrón de
actividad determinado y la palabra “jueves” dará lugar a un patrón muy similar.
Los “vectores de palabras”
internos aportan la información para otro conjunto de neuronas que van
acumulando actividad con el transcurso del tiempo. Para cuando la red alcanza
el final de la frase española, estas otras neuronas poseen un patrón de
actividad llamado “vector de pensamiento” que representa el significado de la
frase en su totalidad. Posteriormente, este vector de pensamiento se puede
volver a convertir en símbolos del idioma que deseemos, siempre y cuando
dispongamos de datos para entrenar a la red neuronal que descodifica el vector de
pensamiento. A diferencia de la IA tradicional basada en la lógica, los
símbolos solo aparecen en los datos introducidos y en los resultados.
El aprendizaje profundo ya ha
revolucionado la capacidad que tienen los equipos informáticos para percibir el
mundo y está revolucionando su capacidad para moverse con agilidad y realizar
la manipulación de objetos con destreza. Está empezando a posibilitar que los
ordenadores comprendan el contenido de los documentos y mantengan
conversaciones racionales. Lograr que un ordenador realice una tarea específica
mediante su programación ha dejado de ser la única opción. A partir de ahora,
cuando una tarea sea tan compleja que no sepamos cómo programarla, podremos
indicar al ordenador que simule una red neuronal y entrenar a dicha red para
que realice la tarea con solo mostrarle multitud de ejemplos de la información
de entrada y de la respuesta deseada.
El
aprendizaje profundo tendrá un efecto revolucionario en la asistencia
sanitaria. Una red neuronal entrenada con 130.000 ejemplos ya es tan capaz como
un dermatólogo de decidir si una lesión cutánea es un cáncer y, de ser así, qué
tipo de cáncer es. Cuando haya sido entrenada con millones de ejemplos, será
mucho mejor que un dermatólogo. Cualquiera podrá obtener un diagnóstico
inmediato, fiable y sumamente barato con solo apuntar su teléfono móvil hacia
la mancha cutánea que le preocupa. Otra red neuronal puede examinar una imagen
de la retina de una persona diabética y determinar el estadio de retinopatía.
Esta práctica será muy valiosa para mejorar la eficacia de los tratamientos en
aquellos países que no puedan permitirse contar con un gran número de
oftalmólogos. Durante la próxima década, las redes neuronales aprenderán a
interpretar la mayoría de los tipos de imágenes médicas de manera mucho más
fiable, rápida y asequible que los facultativos. Las redes neuronales también
serán mejores que los médicos a la hora de predecir qué tratamientos serán
eficaces y de adaptarlos a las particularidades específicas de cada paciente,
incluyendo su perfil genético.
La idea tradicional de que la
esencia del pensamiento humano consiste en razonar de manera lógica mediante la
manipulación de expresiones en una especie de lenguaje simbólico interno está
sucumbiendo ante un punto de vista completamente diferente, según el cual un
pensamiento es simplemente un gran patrón de actividad neuronal. Podemos hacer
referencia a uno de estos patrones haciendo uso de la concatenación de palabras
que normalmente lo generaría o de la concatenación de palabras que produciría,
pero el pensamiento en sí mismo no tiene nada que ver con una concatenación de
palabras. Los pensamientos similares son patrones similares y tienen efectos
similares, de modo que el razonamiento por analogía sea la forma básica del
pensamiento humano en vez de una desviación ilógica de la racionalidad.
Muchos expertos en este campo
creen que los cerebros son tan solo máquinas extraordinariamente complicadas y
que, con el tiempo, el aprendizaje profundo podrá hacer lo mismo que puede
hacer el cerebro. Pero también creen que esto tardará mucho tiempo en ocurrir y
que requerirá muchos más avances técnicos en la tecnología del aprendizaje
profundo. En cualquier sistema político que esté dirigido por personas y para
personas, el aprendizaje profundo será una potente fuerza positiva para mejorar
la salud, eliminar los trabajos más arduos y liberar a la gente corriente para
que disfrute de la vida al máximo.
Geoffrey Hinton es
Catedrático de Ciencias de la Computación en la Universidad de Toronto y
Vicepresidente e Investigador en Ingeniería de Google.
No hay comentarios:
Publicar un comentario