Un androide del desierto describe las vastas oportunidades de la IA

0


Cuando Hongzhi Gao era joven, vivía con su familia en Gansu, una provincia ubicada en el centro norte de China en el desierto de Tengger. Pensando en su infancia, recuerda el viento constante y constante de la tierra fuera de su casa y que durante la mayoría de los meses del año no pasó más de un minuto después de salir antes de que la arena llenara cualquier espacio vacío y se metiera en sus bolsillos. , sus botas y su boca. La monotonía del desierto se quedó en su cabeza durante años, y en la universidad convirtió ese recuerdo en una idea para construir una máquina capaz de traer vida vegetal al paisaje desértico.

Los esfuerzos para detener la desertificación, el proceso por el cual la tierra fértil se convierte en desierto, se han centrado principalmente en soluciones manuales costosas. Hongzhi ha diseñado un robot con tecnología de aprendizaje profundo para automatizar el proceso de plantación de árboles, desde la identificación de lugares óptimos hasta la plantación de plántulas de árboles y el riego. A pesar de no tener experiencia con inteligencia artificial, como estudiante universitario, Hongzhi utilizó la plataforma de aprendizaje profundo PaddlePaddle de Baidu para combinar varios módulos para construir un robot con mejor capacidad de detección de objetos que máquinas similares ya disponibles en el mercado. A Hongzhi y sus amigos les llevó menos de un año construir el producto final y ponerlo en funcionamiento.

El Desert Robot de Hongzhi es un ejemplo revelador de la creciente accesibilidad de la inteligencia artificial.

En la actualidad, más de cuatro millones de desarrolladores están utilizando la tecnología de inteligencia artificial de código abierto de Baidu para crear soluciones que mejoran la vida de las personas en sus comunidades, y muchos de ellos tienen poca o ninguna experiencia técnica en el campo. “En la próxima década, la inteligencia artificial será la fuente de los cambios que tendrán lugar en todos los tejidos de nuestra sociedad, transformando la forma en que operan las industrias y las empresas. La tecnología ampliará la experiencia humana al llevarnos a una inmersión más profunda en el mundo digital ”, dijo el director ejecutivo de Baidu, Robin Li, a Baidu Create 2021, una conferencia para desarrolladores de inteligencia artificial.

Al entrar en un nuevo capítulo en la evolución de la inteligencia artificial, el director de tecnología de Baidu, Haifeng Wang, ha identificado dos tendencias clave que sustentan el viaje de la industria: la inteligencia artificial continuará madurando y aumentará su complejidad técnica. Y al mismo tiempo, el costo de implementación y la barrera de entrada disminuirán, beneficiando tanto a las empresas que construyen soluciones basadas en IA a gran escala como a los desarrolladores de software que exploran el mundo de la IA.

Combinando conocimiento y datos con el aprendizaje profundo

La integración de conocimientos y datos con el aprendizaje profundo ha mejorado enormemente la eficiencia y precisión de los modelos de inteligencia artificial. Desde 2011, la infraestructura de inteligencia artificial de Baidu ha adquirido e integrado nueva información en un gráfico de conocimiento a gran escala. Actualmente, esta tabla de conocimientos contiene más de 550 mil millones de datos, que cubren todos los aspectos de la vida diaria, así como temas específicos de la industria, incluidos la fabricación, los productos farmacéuticos, el derecho, los servicios financieros, la tecnología, los medios de comunicación y el entretenimiento.

Este gráfico de conocimiento y los enormes puntos de datos juntos forman los bloques de construcción del modelo de lenguaje Wenxin PCL-BAIDU previamente entrenado recién lanzado por Baidu (versión ERINIE 3.0 Titan). El modelo supera a otros modelos lingüísticos sin gráficos de conocimiento en 60 tareas de procesamiento del lenguaje natural (PNL), incluida la comprensión de lectura, la clasificación de textos y la similitud semántica.

Aprendiendo a través de las modalidades

El aprendizaje intermodal es una nueva área de investigación de la inteligencia artificial que busca mejorar la comprensión cognitiva de las máquinas e imitar mejor el comportamiento adaptativo de los humanos. Ejemplos de esfuerzos de investigación en esta área incluyen la síntesis automática de texto a imagen, en la que se entrena un modelo para generar imágenes a partir de descripciones de texto únicamente, así como algoritmos construidos para comprender el contenido visual y expresar esa comprensión en palabras. El desafío con estas actividades es que las máquinas creen conexiones semánticas entre diferentes tipos de conjuntos de datos (por ejemplo, imágenes, texto) y comprendan las interdependencias entre ellos.

El siguiente paso de la inteligencia artificial es la fusión de tecnologías de inteligencia artificial como la visión por computadora, el reconocimiento de voz y el procesamiento del lenguaje natural para crear un sistema multimodal.

En este frente, Baidu ha lanzado una variante de sus modelos de PNL que combina el lenguaje y la comprensión semántica visual. Ejemplos de aplicaciones del mundo real para este tipo de modelo incluyen avatares digitales capaces de percibir su entorno como seres humanos y gestionar el soporte al cliente para empresas y algoritmos capaces de «dibujar» obras de arte y componer poemas en base a su comprensión de las obras de arte generado.

Hay resultados potenciales aún más creativos e impactantes para esta tecnología. La plataforma PaddlePaddle puede crear conexiones semánticas entre la visión y el lenguaje, lo que llevó a un grupo de estudiantes de maestría en China a crear un diccionario para preservar los idiomas en peligro de extinción en regiones como Yunnan y Guangxi al traducirlos más fácilmente al chino simplificado.

Integración de inteligencia artificial entre software y hardware y en casos de uso específicos de la industria

A medida que los sistemas de inteligencia artificial se aplican para resolver problemas cada vez más complejos y específicos de la industria, se pone más énfasis en optimizar el software (marco de aprendizaje profundo) y el hardware (chip de inteligencia artificial) en su conjunto, en lugar de optimizarlos individualmente, teniendo en cuenta los factores. como la potencia de cálculo, el consumo de energía y la latencia.

Además, se está llevando a cabo una gran innovación a nivel de plataforma de la infraestructura de inteligencia artificial de Baidu, donde los desarrolladores externos utilizan capacidades de aprendizaje profundo para crear nuevas aplicaciones adaptadas a casos de uso específicos. La plataforma PaddlePaddle tiene una serie de API para admitir aplicaciones de inteligencia artificial en las últimas tecnologías, como computación cuántica, ciencias de la vida, mecánica de fluidos computacional y dinámica molecular.

La inteligencia artificial también tiene usos prácticos. Por ejemplo, en Shouguang, una pequeña ciudad de la provincia de Shandong, se utiliza inteligencia artificial para optimizar la industria de frutas y verduras. Solo se necesitan dos personas y una aplicación para administrar docenas de cobertizos de verduras.

Y esto es notable, dice Wang: «A pesar de la mayor complejidad de la tecnología de inteligencia artificial, la plataforma de aprendizaje profundo de código abierto reúne el procesador y las aplicaciones como un sistema operativo, lo que reduce las barreras de entrada para las empresas y las personas que desean incorporarse. negocio de uno «.

Barrera de entrada reducida para desarrolladores y usuarios finales

En el frente tecnológico, el entrenamiento previo de modelos grandes como PCL-BAIDU Wenxin (versión ERNIE 3.0 Titan) ha resuelto muchos cuellos de botella comunes encontrados por los modelos tradicionales. Por ejemplo, estos modelos genéricos ayudaron a sentar las bases para ejecutar diferentes tipos de actividades posteriores de PNL, como la clasificación de textos y las preguntas, en un lugar consolidado, mientras que en el pasado cada tipo de negocio tenía que resolverse mediante un modelo separado.

PaddlePaddle también tiene una serie de herramientas fáciles de desarrollar, como tecnologías de compresión de patrones para modificar patrones genéricos para adaptarse a casos de uso más específicos. La plataforma proporciona una biblioteca con soporte oficial de modelos de grado industrial con más de 400 modelos, de grandes a pequeños, que retienen solo una fracción del tamaño de los modelos genéricos pero pueden lograr un rendimiento comparable, reduciendo el desarrollo de modelos y los costos de implementación.

En la actualidad, la tecnología de aprendizaje profundo de código abierto de Baidu respalda a una comunidad de más de cuatro millones de desarrolladores de IA que han creado colectivamente 476.000 modelos, lo que contribuye a la transformación impulsada por la IA de 157.000 empresas e instituciones. Los ejemplos enumerados anteriormente son el resultado de innovaciones continuas en todos los niveles de la infraestructura de inteligencia artificial de Baidu, que integra tecnologías como reconocimiento de voz, visión artificial, AR / VR, gráficos de conocimiento y grandes modelos de pre-entrenamiento que están un paso más cerca de la percepción. el mundo como seres humanos.

En su estado actual, la IA ha alcanzado un nivel de madurez que le permite realizar tareas sorprendentes. Por ejemplo, el reciente lanzamiento de Metaverse XiRang no habría sido posible sin la plataforma PaddlePaddle para crear avatares digitales para que los participantes de todo el mundo se conecten desde sus dispositivos. Además, los descubrimientos futuros en áreas como la computación cuántica podrían mejorar significativamente el rendimiento de los metaversos. Esto muestra cómo las diferentes ofertas de Baidu están entrelazadas y son interdependientes.

En unos años, la IA estará en el centro de nuestra experiencia humana. Será para nuestra sociedad lo que el vapor, la electricidad e Internet fueron para las generaciones anteriores. A medida que la IA se vuelve más compleja, los desarrolladores como Hongzhi trabajarán más duro como artistas y diseñadores, dada la libertad creativa para explorar casos de uso que antes se consideraban solo teóricamente posibles. El cielo es el límite.

Este contenido fue producido por Baidu. No fue escrito por los editores de MIT Technology Review.

También podría gustarte
Deja una respuesta

Su dirección de correo electrónico no será publicada.

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept Read More