Desarrollo de un sistema de análisis automático para la segmentación, clasificación y conteo de leucocitos en imágenes digitales de frotis de sangre periférica
Title: Desarrollo de un sistema de análisis automático para la segmentación, clasificación y conteo de leucocitos en imágenes digitales de frotis de sangre periférica
Author: Villegas Noguera, Ángel Luis
Abstract: La presente investigación tuvo como objetivo desarrollar un sistema capaz de identificar, clasificar y contar diferentes tipos de leucocitos en imágenes de frotis sanguíneo. El sistema se fundamenta en el uso de las redes neuronales convolucionales profundas (CNN) que representa uno de los paradigmas más influyentes en la visión por computador y reconocimiento de patrones de los últimos años. Para la segmentación y extracción de las células se utilizó una etapa de pre-procesamiento que incorpora el algoritmo lineal simple de agrupamiento iterativo (SLIC) como generador de superpixeles asociados a las regiones de la imagen. Luego, mediante una máquina de soporte vectorial (SVM) los superpixeles son clasificados como parte de núcleo, citoplasma, plasma u otros componentes, usando para ello los valores medios de intensidad en los espacios de color RGB, HSV y LAB. Posteriormente, se extrae la región que contiene al núcleo y citoplasma de las células y se utiliza una CNN para determinar el tipo de leucocito. Para el diseño de este clasificador se partió de 9 modelos públicos de redes convolucionales pre-entrenados con imágenes de la base de datos ImageNet. Estos se adaptaron a la tarea de clasificación de leucocitos mediante el concepto de transferencia de conocimiento evaluando las dos técnicas principales aplicables a las CNN: la extracción automática de rasgos y el ajuste fino de los pesos sinápticos. El sistema, implementado el ambiente de cómputo científico MATLAB, logró al clasificar en forma individual las seis bases de datos disponibles una exactitud promedio de 99.03%. Los resultados obtenidos evidencian la capacidad de las CNN de extraer representaciones adecuadas de los objetos presentes en las imágenes a partir de los datos sin procesar, al permitir hacer una clasificación similar o superior a otras técnicas que usan rasgos cuidadosamente seleccionados por personal especializado. La transferencia de aprendizaje mediante el ajuste fino en los pesos sinápticos demostró ser más efectiva, en términos de exactitud, para adaptar los modelos a nuevos problemas de clasificación. Esto es en parte atribuible estos no habían sido entrenados con imágenes de características similares a las empleadas en este proyecto. Usando una combinación principios, métodos y tecnologías existentes se desarrolló un sistema automático que exhibe una elevada capacidad para localizar y clasificar de forma robusta imágenes provenientes de diferentes bases de datos. Este sistema mostró buena capacidad de generalización al lograr extraer un 95.86% de las células presentes en un banco adicional de imágenes de validación y clasificarlas con un margen de error en torno al 3% respecto al criterio de un observador humano experto. Esto, junto a su capacidad realizar el conteo diferencial de leucocitos (100 células) en un tiempo medio aproximado de 1 minuto, le convierte en una alternativa competitiva frente a otras tecnologías del área.