Resumen:
El trabajo de tesis presenta un análisis de un problema de clasificación multiclase para
identificar colonias saludables, sin reina y de baja población, mediante el análisis de las señales
acústicas. Se estudiaron cinco colonias de abeja carniola en distintas condiciones biológicas.
Para grabar el sonido de las colonias de abejas se implementó un sistema de monitoreo basado
en una Raspberry Pi 2 y micrófonos omnidireccionales. La metodología de análisis está basada
en MFCC y un modelo de clasificación penalizado mediante Regresión Logística Lasso. Los
resultados demuestran que es posible identificar cada una de las condiciones bajo estudio con
una alta tasa de correcta clasificación. Sin embargo, la parte más interesante del estudio se
centra en el análisis de los conglomerados mediante gráficas de dispersión utilizando descomposición
en valores singulares. El análisis permitió observar que las muestras de colonias que
representan la misma condición se agrupan, además, las colonias pueden generar ligeras variaciones
en el patrón y puede estar relacionado con su estado de salud, volumen poblacional y
actividad de pecoreo. Finalmente, se calcularon los parámetros de monitoreo para determinar
la cantidad de muestras y la longitud que brinden un buen rendimiento y al mismo tiempo el
espacio de almacenamiento en memoria sea mínimo.
Descripción:
The thesis work presents an analysis of a multiclass classification problem through the
analysis of acoustic signals to identify healthy bee colonies, queenless colonies and colonies of
low population. Five colonies of Carniola honey bee were studied under diferent biological
conditions. A monitor system based on a Raspberry Pi 2 and omnidirectional microphones
was implemented to study the honey bee colonies. The analysis methodology is based on
MFCC's and a penalized Lasso logistic regression model. The results show that is possible
to identify every condition in the model with a high classification rate. However, the most
interesting results came from the cluster analysis of the data through scatters plots of singular
value decomposition. The results show that samples that represents the same condition tend
to group, also, the colonies can generate slightly diferent patterns and the data clusters of the
same condition tend to be close, the clusters can be afected by healthy conditions, weather,
number of bees and ecological factors. Finally, an analysis of the monitoring parameters to
determinate the data size and number of samples that ofter a good performance and with a
minimum memory space requirement was carried out.