TUN-AI permite estimar la biomasa del atún con modelos de Machine Learning trabajados con datos de oceanografía y ecosonda FAD. En base a un estudio de Daniel Precioso, Manuel Navarro-García,, Kathryn Gavira-O’Neill, AlbertoTorres-Barránd David Gordo, Víctor Gallego y DavidGómez-Ullatea publicado en Sciencie se consigue
estimar la biomasa de atún bajo un dFAD con algoritmos ML a partir de más de 12.000 eventos de lance y despliegue.
–
El uso de información oceanográfica y características derivadas dependientes de la posición mejora la precisión de la predicción en todos los modelos.
El uso de dFADs por parte de las pesquerías de atún con cerco está muy extendido en los océanos, y las boyas de ecosonda fijadas a estos dFADs proporcionan a los pescadores estimaciones de la biomasa de atún agregada a ellos. Esta información tiene el potencial de conocer el comportamiento y la abundancia del atún, pero tradicionalmente ha sido difícil de procesar y utilizar.
El presente estudio combina los datos del cuaderno de bitácora de los DCP, los datos oceanográficos y los datos de la boya de la ecosonda para evaluar diferentes modelos de aprendizaje automático y establecer una línea de trabajo, denominada TUN-AI, para procesar los datos de la boya de la ecosonda y estimar la biomasa de atún (en toneladas métricas, t) en varios niveles de complejidad: clasificación binaria, clasificación ternaria y regresión.
Los modelos se entrenaron y probaron en más de 5.000 lances y más de 6.000 despliegues. De todos los modelos evaluados, el que mejor funciona utiliza una ventana de 3 días de datos de ecosonda, datos oceanográficos y características derivadas de la posición y el tiempo. Este modelo es capaz de estimar si la biomasa de atún era superior a 10 t o inferior a 10 t con una de 0,925.
Al estimar directamente la biomasa de atún, el mejor modelo (Gradient Boosting) tiene un error (MAE) de 21,6 t y un error relativo (SMAPE) del 29,5%, cuando se evalúa sobre lances. Todos los modelos probados mejoraron cuando se enriquecieron con características oceanográficas y derivadas de la posición, destacando la importancia de estas características cuando se utilizan datos de boyas de ecosonda. Se discuten las posibles aplicaciones de esta metodología y las futuras mejoras.
Los algoritmos de ML se entrenan con datos de ecosonda de los dFADs y datos del cuaderno de bitácora de los FADs de la flota española.
–
Nuestro mejor modelo tiene una puntuación F1 de 0,925 para la clasificación binaria y un error relativo (SMAPE) del 29,5%, cuando se evalúa sólo sobre eventos de lance.
–
Una ventana temporal más amplia mejora la precisión de la predicción, al menos hasta las 72 horas, ya que los patrones de los bancos de atún se observan en los datos de la ecosonda.