Professional Documents
Culture Documents
2. RESUMEN
3.3. HIPOTESIS
La mastitis es una enfermedad multifactorial, ya que es el resultado de diversas
interacciones, epidemiolgicamente tenemos tres factores causantes: ubre del
animal, patgenos, medio ambiente.
4. MARCO TEORICO
4.1. CICLO DE LACTANCIA
Se entiende al ciclo de lactancia como la produccin de leche que se obtiene de
una vaca en el perodo de lactancia en un ao y est determinado por el intervalo
entre partos. (Castro Ramrez, 2002)
La figura 1 muestra el ciclo de lactancia, ste comienza con un parto de la vaca, la
cual durante los primeros cinco o seis das da leche con calostro, motivo por el cul
esta leche no es utilizada para la produccin lechera diaria; durante este perodo no
se le realiza control al animal (si es que coincide con la visita del inspector), siendo
el primer control el inmediato posterior. Luego de finalizado el calostro se le hacen
controles mensuales hasta su secado, luego de once meses de produccin
aproximadamente. Por "secado" se entiende cuando el personal del tambo
considera que ya no es conveniente ordear al animal, sea porque no est dando la
cantidad apreciable de leche o para prepararla para el nuevo parto. Los tiempos que
se presentan en el ciclo de lactancia graficado son los tiempos ptimos
determinados segn estudios de profesionales en la materia, los cuales tambin son
referencias y objetivos para la mejor productividad de las vacas, pero no implica que
en todos los casos stos se cumplan, ya que, por ejemplo, si una vaca al cabo de
los once meses de lactancia sigue produciendo una considerable cantidad de leche
puede ocurrir que se decida secarla un mes despus. La vaca es secada a los once
meses despus del parto, considerando que si todo se cumpli segn lo planeado
a los dos meses va a tener un nuevo parto y va a comenzar un nuevo ciclo de
lactancia, de esta manera tiene 60 das para descansar y recuperarse la ubre de la
lactancia anterior.
Luego del parto y antes de los 110 - 120 das se debe prear nuevamente al animal,
esto se debe hacer despus de los primeros 45 das del parto, en razn de esto
quedan 65 a 75 das en los cuales hay que prear a la vaca, la cual tiene celo cada
21 das, por lo tanto, hay tres oportunidades para hacerlo, pero para esto se debe
reconocer el celo en el animal, lo cual no siempre se cumple con xito.
El volumen de leche que da una vaca durante los meses de lactancia se grafica con
la curva de lactancia, la cual tpicamente es como se muestra en la fig. 2. (Cervantes,
2006)
5. MARCO METODOLOGICO
5.1. TIPO DE INVESTIGACION
Para la realizacin de este trabajo se utiliz un tipo de investigacin de campo ya
que se desarroll con nimos de interpretar y solucionar un problema en un
momento determinado. Los datos utilizados fueron proporcionados por la Estacin
Experimental Agropecuaria Rafaela del Instituto Nacional de Tecnologa
Agropecuaria. Dicho vnculo se estableci mediante el convenio que dicha
institucin y la Universidad Catlica de Santiago del Estero poseen, en pos de
fomentar los trabajos con caractersticas similares al presente. Por otra parte,
acorde a los objetivos intrnsecos o el nivel de conocimiento, la investigacin ha
iniciado como de tipo descriptiva. Esto se fundamenta en que la motivacin
primordial radic en describir algunas caractersticas fundamentales de conjuntos
homogneos de fenmenos. Asimismo, este tipo de investigaciones utilizan criterios
sistemticos que permiten poner de manifiesto la estructura o el comportamiento de
dichos fenmenos, como ejemplifican los modelos matemticos de curvas de
lactancia ya desarrollados, modelo de Wood por ejemplo. De acuerdo a los objetivos
extrnsecos o externos, se puede clasificar a la investigacin como aplicada, ya que
ha perseguido objetivos de aplicacin prctica en un futuro relativamente cercano.
A su vez, y como ltimo criterio de clasificacin para el tipo de investigacin, se
puede catalogar a la misma como cuantitativa (se utilizaron procedimientos y
tcnicas estadsticas al utilizar redes neuronales artificiales, ha sido orientada al
resultado y, bajo un conjunto de caractersticas, generalizable) y longitudinal (se
realiz un seguimiento de un determinado conjunto de variables de los mismos
animales a travs del tiempo).
6. RECOLECCION DE DATOS
Resulta pertinente aclarar que la tcnica de recoleccin de informacin fue la
utilizacin de datos secundarios. Dicha clasificacin se basa en que los datos han
sido previamente recogidos por otros investigadores y/o alumnos de nuestra
Universidad Nacional de Cajamarca en la Escuela Acadmico Profesional de
Medicina Veterinaria, los cuales son lo suficientemente vlidos, pertinentes y
confiables como para ser utilizados en este estudio, no siendo necesario de esta
forma repetir los procedimientos ya efectuados. A su vez, los datos
correspondientes a incidencias sanitarias fueron obtenidos desde los registros
existentes en el cuaderno de trabajo de los antes mencionados. Por ltimo, la
informacin meteorolgica fue proporcionada por el personal de la entidad, la cual
se dispone en almacenamientos internos de la misma. Al igual que los datos
sanitarios.
6.1. TRATAMIENTO DE DATOS
Luego de obtener la informacin se prosigui con el desarrollo de un modelo de
datos que permiti almacenarla seleccionando nicamente los datos de inters y
adicionando aquellos que admitan representar las variables elegidas. En relacin a
los datos que presentaban valores irrisorios o nulos, los mismos fueron filtrados a
modo de quitar el ruido que podran insertar en el anlisis.
6.2. SELECCIN DE CONJUNTOS DE APRENDIZAJE Y TEST
En lo que refiere al propio entrenamiento de la red, se dividi el cmulo de los datos
en conjuntos de estimacin, validacin y prueba. El primero de estos conjuntos fue
utilizado como entrenamiento, mientras que el segundo de ellos se estipul como
validacin cruzada de dicho entrenamiento. El set de datos remanente cumpli la
funcin de estimar el comportamiento de la red. Vale la pena aclarar que en todos
los casos los conjuntos estuvieron compuestos por la misma cantidad de casos
positivos que negativos. Los porcentajes de asignacin para cada uno de los
conjuntos nombrados iteraron entre diferentes valores, a fin de encontrar el mejor
rendimiento posible para la red.
7. ANALISIS DE DATOS
7.1. PREPROCESAMIENTO
En esta etapa el objetivo perseguido fue maximizar la eficiencia durante el
entrenamiento en relacin al conjunto de datos utilizado. Con respecto a esta ltima
actividad, el algoritmo seleccionado que se aplic fue Back-Propagation (BP),
siendo ste el algoritmo estndar a utilizar en redes neuronales del tipo MLP de
acuerdo a lo expresado por Haykin. Una vez seleccionado el modo de
entrenamiento a llevar a cabo resulta pertinente utilizar heursticas sugeridas por
dicho autor para mejorar el rendimiento del algoritmo, como por ejemplo, la
normalizacin de las entradas con el objetivo de que cada variable tenga una media
igual a 0 y una varianza igual a 1, o dicho de otro modo, que cada una de ellas tenga
la misma importancia (similar variabilidad y espectro de valores). Para llevar esto a
cabo las variables con valores discretos fueron binarizadas, mientras que las
restantes han sido normalizadas en base a la Ecuacin 1.
A su vez, el rango para estas ltimas variables se estipul entre los valores -1 y 1,
de acuerdo a la Ecuacin 2.
Por otro lado, la maximizacin del contenido que los datos ofrecen es esencial en el
desempeo de esta etapa. Para esto se especifican dos actividades fundamentales:
Utilizar un dato de ejemplo que arroje el mayor error posible de
entrenamiento.
Cada ejemplo utilizado debe ser radicalmente diferente a todos los
proporcionados anteriormente en ese conjunto.
Esto ha sido afrontado utilizando un algoritmo que seleccione de forma aleatoria los
valores de entrada para cada iteracin. A su vez, dado que la cantidad de registros
que indican la presencia de mastitis es significativamente menor a aquellos casos
en los que se trata de una vaca sana, se repiti la fase de entrenamiento la cantidad
de veces necesaria hasta que todos los datos sean contemplados por igual,
tomando en cada caso la misma cantidad de positivos y negativos.
7.2. ENTRENAMIENTO
La automatizacin de este proceso cont con las siguientes caractersticas:
Se utiliz MATLAB como entorno interactivo y lenguaje de alto nivel para la
construccin y ejecucin de un script que permita disear, entrenar y
visualizar distintos modelos de redes neuronales. Esta herramienta admite
de forma nativa trabajar con el reconocimiento de patrones, introduciendo
tcnicas como el aprendizaje por el gradiente del error, generacin de curvas
ROC y grficos de confusin, entre otras.
Debido a la dificultad de conocer de forma anticipada la cantidad de
neuronas en la capa oculta que maximiza los resultados obtenidos, fueron
contemplados distintos valores arbitrarios para este parmetro. El conjunto
de datos utilizado en base a esto es el siguiente:
NCP = {5; 8; 9; 10; 11; 12; 13; 14; 15; 20; 25; 40; 70; 100; 120}
La funcin de activacin en la capa oculta tenida en cuenta para este anlisis
fue la sigmoidea o logstica.
El algoritmo utilizado para esta etapa es presentado y explicado en la seccin
Apndice 2: Algoritmo de entrenamiento.
Por otra parte, ha existido un inters por identificar los rendimientos obtenidos al
aplicar distintas restricciones en el conjunto de datos inicial. Para esto, la etapa de
entrenamiento fue dividida en dos grandes partes: en una primera instancia se
trabaj con los registros de animales que se encontraban dentro de su primer tercio
de lactancia (menos de 65 das en lactacin, perodo en que la curva de produccin
presenta una pendiente ascendente y donde se presupona la identificacin de la
presencia del suceso sera factible de realizar ms fcilmente), para luego hacerlo
con el conjunto completo. A su vez, en relacin a la ventana de tiempo utilizada para
clasificar a los datos como positivos, en cada etapa se ha realizado una ejecucin
independiente del proceso por cada una de las alternativas presentadas a
continuacin:
Da en que se registr la presencia de mastitis clnica en el animal
Da en que se registr la presencia de mastitis clnica en el animal y da
previo
Da en que se registr la presencia de mastitis clnica en el animal y sus dos
das previos
Da previo al que se registr la presencia de mastitis clnica en el animal
Dos das previos al que se registr la presencia de mastitis clnica en el
animal
Da en que se registr la presencia de mastitis clnica en el animal, sus dos
das previos y sus dos das subsiguientes
Da anterior al da previo en que se registr la presencia de mastitis clnica
en el animal
Resulta pertinente aclarar que la ventana de tiempo ha sido ampliada en un mximo
de dos das previos desde el momento en el cul se efectu el diagnstico debido a
que ese perodo es el mnimo presentado para los distintos agentes desde que la
enfermedad es contrada hasta su manifestacin como mastitis clnica, fecha
indicada en los registros existentes como aparicin de la enfermedad. A su vez, el
concepto de ventana de tiempo utilizado puede ser comprendido como el perodo
de tiempo que fue analizado para clasificar los datos, teniendo como referencia el
momento en que la enfermedad ha sido detectada como mastitis clnica. Por otra
parte, fue expresado como parmetro de comparacin entre una y otra red el
coeficiente medio de confusin. Este valor se obtiene a partir de la Ecuacin 3,
donde ric se refiere al nmero de registros clasificados incorrectamente y rc al total
de registros clasificados.
Por ltimo, el tipo de entrenamiento utilizado fue de tipo batch, donde todos los
valores que componen el conjunto de entrada son pasados a la red antes de que se
produzca la actualizacin en los pesos sinpticos de la misma. El algoritmo de
entrenamiento aplicado es el Mtodo del Gradiente Conjugado [16]. Estas
caractersticas fueron seleccionadas debido a que presentan generalmente el mejor
rendimiento en los problemas de clasificacin de patrones, de acuerdo a lo
expresado por el fabricante de la herramienta utilizada. A su vez, el entrenamiento
tambin estuvo regido por el mtodo Early Stopping, el cul detiene este proceso
cuando el error de validacin aumenta en 6 iteraciones consecutivas.
8. RESULTADOS
8.1. Lgica Difusa
Nuestro grupo tuvo a bien elegir tres variables para el planteamiento del modelo de
lgica difusa, los cuales estn con mayores posibilidades de aparecer o de atacar
la enfermedad. Las variables utilizadas por nuestro grupo han sido: Da de lactancia,
cantidad de lluvia y riesgo de enfermedad.
Se puede decir que en el modelo planteado se muestra que en el sector bobino
lechero el riesgo de contraer mastitis se da con mayor porcentaje en el primer tercio
de haber empezado la lactancia de la vaca. Por lo cual los responsables de los
ejemplares deben tener el mayor cuidado durante dicha etapa para evitar posibles
consecuencias como se podra decir, prdida de leche.
8.2. Red Neuronal
De acuerdo a lo expresado anteriormente un total de 14 pruebas fueron realizadas
iterando los conjuntos de datos y la configuracin utilizada (cantidad de neuronas
en la capa oculta, ventana de tiempo, entre otras).
A partir de esto y a fin de obtener un porcentaje de clasificacin de vacas con
mastitis clnica con el menor error posible en el da en el que dicha patologa se hace
visible, resulta conveniente utilizar la red obtenida en la prueba nmero 1 (en caso
de utilizar datos de animales con menos de 65 das en lactacin) o nmero 8 (en
caso de utilizar la totalidad de los registros). En dichos ensayos los resultados de
las mismas ofrecen un coeficiente de confusin promedio (Coeficiente de
confusin.) igual a 0,0640 y 0,0687, respectivamente. En trminos de sensibilidad
(probabilidad de clasificar un evento de inters como mastitis clnica cuando
realmente lo es) y especificidad (probabilidad de que cuando el evento de inters no
ocurra se lo clasifique como normal o no infectada), los valores arrojados son 98,8%
y 88,4%, para la prueba nmero 1, mientras que para la prueba nmero 8 fueron
97,7% y 88,6%. Estas variables han sido obtenidas correspondientemente a partir
de las ecuaciones presentadas en los clculos de especificidad y sensibilidad.
9. CONCLUSIONES Y RECOMENDACIONES
9.1. CONCLUSIONES
Si bien esto no soluciona la problemtica actual, dado que el momento en el
que se realiza la deteccin de la enfermedad se mantendra constante, permite
contar con una herramienta de apoyo al personal de la Hacienda la Colpa de
modo que las pruebas diarias que se realizan en los animales para llevar a cabo
dicho diagnstico sea eliminado o reducido parcialmente a un conjunto de
animales ms acotado.
Sobre la aplicacin de redes neuronales artificiales en esta temtica observando
los resultados a los que se ha llegado, se puede concluir que son ampliamente
utilizables en el contexto trabajado. La implementacin de redes Perceptrn
Multicapa podra constituir una ayuda para monitorizar la presencia de mastitis
en los animales del establecimiento estudiado. Por otra parte, este estudio
constituye un aporte en la interseccin entre dos reas del conocimiento, la cual
no ha sido ampliamente abordada en la regin hasta el da de la fecha.
9.2. RECOMENDACIONES
Este Proyecto necesita una investigacin de campo y ya que esta se trata de un
proyecto universitario ser limitada a la informacin proporcionada por diferentes
fuentes de informacin, omitiendo la parte de observacin directa, etc.
Se recomienda disponer de un buen capital para su realizacin.
10. BIBLIOGRAFIA
for index3=1:3
clear net
2 % se obtienen datos negativos de forma aleatoria.
negativeData = datasample(negValues,length(posValues(:,1)));
allData = cat(2, negativeData',posValues');
allData = datasample(allData',length(posValues(:,1)) * 2)';
inputs = allData([1,2,3,4,5,6,7,8,9,10,11,12],:);
targets = allData(13,:);
net = patternnet(hiddenLayerSize);
net.layers{2}.transferFcn = 'tansig';
net.trainFcn = 'trainscg'; % Scaled conjugate gradient
for index5=1:5
%Re-entrenar la red y evaluar nuevamente
[net,tr] = train(net,inputs,targets);
%Evaluar la red
outputs = net(inputs);
errors = gsubtract(targets,outputs);
performance = perform(net,targets,outputs);
cNetSum = 0;
sensibility = 0;
specificity = 0;
%IterationsNumber depende de la relacin entre los valores positives y
negativos
iterationsNumber = round(length(negValues(:,1))/length(posValues(:,1)));
for indexIN=1:iterationsNumber
% Se obtienen datos negativos de forma aleatoria.
negativeData = datasample(negValues,length(posValues(:,1)));
inputs = allData([1,2,3,4,5,6,7,8,9,10,11,12],:);
targets = allData(13,:);
[c,cm,nd,per] = confusion(targets,netOutputs);
cNetSum = cNetSum + c;
sensibility = sensibility + (cm(2,2) / (cm(2,2) + cm(2,1)));
specificity = specificity + (cm(1,1) / (cm(1,1) + cm(1,2)));
end