El actual escenario de evolución de una IA débil, centrada en tareas específicas y limitadas, a una IA fuerte, que busca igualar o superar la inteligencia del ser humano, está haciendo posible transformar el paradigma de funcionamiento de los sistemas de simulación tradicionales hacia sistemas avanzados.
No obstante, la construcción de sistemas o modelos avanzados requiere también de la mejora de sus procesos de aprendizaje y ajuste. Los aprendizajes por refuerzo (AR) atacan el problema de aprender a controlar agentes autónomos mediante interacciones por prueba y error con un ambiente dinámico desconocido que les provee señales de refuerzo por cada acción que realizan. Si los objetivos del agente están definidos por la señal de refuerzo inmediata, la tarea del agente se reduce a aprender una estrategia de control (o política) que permita maximizar la recompensa acumulada a lo largo del tiempo. La diferencia más importante de este tipo de aprendizajes respecto al Machine Learning habitual es que no existe la utilización o presentación de pares entrada/salida, sino que lo que se obtiene es una recompensa inmediata y el estado alcanzado tras la realización de una acción. Ante esta respuesta, no se le dice la acción que debería haber realizado, sino que se le permite ir recopilando experiencia útil, acciones, estados y formas de actuar.
El aprendizaje por refuerzo ha sido ya utilizado en los procesos productivos. Sin embargo, la mayoría de las experiencias se centran en la predicción, es decir, en identificar posibles situaciones o puntos de un espacio temporal futuro. Si bien se trata de un planteamiento correcto, un sistema de predicción no aporta soluciones a la problemática relacionada proveer soluciones o recomendaciones de acciones.
Independientemente de la tecnología o IA que utilice, los sistemas inteligentes deben complementarse con un sistema solucionador o «recomendador» de actividades. Un examen de los trabajos más recientes presentados en la conferencia ACM Recommender System muestra que se ha aplicado una amplia variedad de enfoques de investigación al problema de los sistemas de recomendación, desde métodos estadísticos hasta razonamiento ontológico, y se ha abordado una amplia variedad de problemas.
Sin duda, el aprendizaje profundo ha revolucionado las arquitecturas de recomendación y brinda más oportunidades para mejorar el rendimiento del recomendador. Unido a los conceptos de gestión de datos multimodales y su almacenamiento en bases de datos vectoriales para llevar a cabo un Retrieval-Augmented Generation (RAG), es posible trabajar en el almacenamiento de información, una representación vectorial del mismo y una búsqueda de similitud en objetivos esperados para, así, encontrar las recomendaciones más factibles.
El desarrollo de procesos de fabricación inteligentes solo será posible si seguimos investigando y avanzando en este apasionante campo.
¿Cómo podemos ayudarte?
Mantente informad@ de la actividad de AZTERLAN.
Mantente informad@ de la actividad de AZTERLAN.
Formamos equipos de trabajo en distintos ámbitos de la metalurgia y los procesos de transformación de metales.
Indícanos los datos de tu trabajo y nos pondremos en contacto contigo lo antes posible.
Comparte tu reto con nuestro equipo. Hablar no puede más que acercarnos un poco más a posibles soluciones.