En base a la librería de imágenes de FlowCam y de microscopía óptica, el data scientist Martín Contreras creó un modelo de machine learning de redes neuronales artificiales profundas (deep learning) para la clasificación de células del fitoplancton del sur de Chile en el marco del Programa Oceanográfico para la Salmonicultura (POAS) y del Programa de Sanidad de Moluscos Bivalvos (PSMB).

Ello, con el objetivo de aportar conocimiento y reconocimiento automático de floraciones de algas nocivas (FAN, también conocidas como blooms o más coloquialmente como marea roja) y con énfasis en aquellas que generan problemas en el sur-austral del país.

“Este primer modelo logró un 90% de exactitud, no obstante, solo está entrenado en ciertas especies objetivo, de las cuales se posee imágenes en cantidad suficiente en el laboratorio de la empresa. Entonces, aumentar el dataset de clases de especies es parte de los objetivos futuros, para así lograr un modelo más robusto que pueda generalizar correctamente las diversas especies de fitoplancton”, puntualizó Plancton Andino SpA.

Diversos enfoques

Afrontar el desafío de clasificar imágenes de fitoplancton automáticamente no es una tarea sencilla. En este marco, surgen distintos desafíos, como trabajar con clases de fitoplancton con más imágenes que otras (class imbalances), para lo cual se deben optar por diversos enfoques, como la generación de imágenes sintéticas, submuestreo, penalización a las clases abundantes, entre otras técnicas.

“Este primer resultado es prometedor y nos acerca al objetivo de clasificar automáticamente el fitoplancton. Sin embargo, queda mucho por hacer y para aquello se necesita apoyo de nuestros clientes, Corfo (Corporación de Fomento de la Producción), entre otros”, precisó Plancton Andino.