Aprendizaje reforzado
Roberto Klatt
El robot de Google separa los residuos de oficina
)gozreH rednaxela – ebuTuo tohsneercSllümorüB tnnert retoboR elgooG(Foto: ©
- google tiene uno desarrollaron robots que separan los residuosque puede eliminar materiales reciclables y compost de los desechos de oficina
- El de eso Robots entrenados con aprendizaje por refuerzo (RL) casi siempre clasifica la basura correctamente
Google ha desarrollado robots de separación de basura que pueden eliminar materiales reciclables y compost de los desechos de oficina. Como resultado, los residuos residuales se redujeron significativamente.
Mountain View (Estados Unidos). Un equipo de Google ha estado trabajando en robots de clasificación de basura durante aproximadamente dos años, según el artículo de investigación Deep RL at Scale: Sorting Waste in Office Buildings with a Fleet of Mobile Manipulators (PDF). Los 23 robots fueron entrenados utilizando tecnología de aprendizaje por refuerzo (RL). Los científicos utilizaron datos reales y una simulación como datos de entrenamiento.
La tarea de los robots era patrullar dentro de un complejo de oficinas e inspeccionar las estaciones de separación de desechos, que contienen contenedores para materiales reciclables, compost y desechos residuales. Su objetivo era clasificar los objetos reciclables como latas y botellas de bebidas en la papelera de reciclaje, los residuos compostables en la papelera orgánica y el resto de materiales en la papelera residual.
Basura de diferentes objetos.
El principal problema fue entrenar a los robots para identificar una gran cantidad de objetos diferentes y clasificarlos adecuadamente en los contenedores de basura respectivos. Para lograr esto, los ingenieros de Google desarrollaron un sistema de cuatro fases para optimizar la capacidad del robot para clasificar correctamente los desechos. En la primera fase, se crearon directrices básicas para la separación de residuos con el fin de dotar a los robots de una gran experiencia inicial.
Sin embargo, esta base resultó insuficiente. Por lo tanto, en la segunda fase, el sistema fue entrenado mediante una simulación. En la tercera fase, los robots pasaron por un proceso de aprendizaje mediante el aprendizaje por refuerzo en una estación de basura con objetos de desecho representativos para aprender a clasificarlos correctamente. En la cuarta y última fase, los robots se utilizaron en estaciones de residuos reales para consolidar las habilidades de separación de residuos que habían adquirido.
Basura casi siempre clasificada correctamente
En el transcurso del proceso de formación, el sistema completó un total de 540.000 ensayos en las estaciones de residuos de formación y 32.500 ensayos en estaciones de residuos reales. El rendimiento general del sistema siguió mejorando a medida que aumentaba la cantidad de datos. Los ingenieros evaluaron el desempeño del sistema entrenado en una estación de basura bajo condiciones controladas, clasificando correctamente el 84 por ciento de los objetos.
Además, los ingenieros de Google recopilaron datos estadísticos de tres implementaciones de robots en el período de 2021 a 2022. El análisis de los resultados mostró que el peso de los desechos residuales podría reducirse entre un 40 y un 50 por ciento. Los experimentos llevados a cabo ilustraron que una estrategia de aprendizaje por refuerzo escalonado puede ser prometedora. Sin embargo, las posibilidades aquí aún no se han agotado por completo. En el futuro, a los ingenieros de Google les gustaría integrar otras fuentes de información, como aprender de videos de Internet, en el proceso de capacitación.
Comments