Professional Documents
Culture Documents
INTRODUO GERAL
1
1. Introduo geral
2
Aplicaes analticas(13-14) do infravermelho prximo vem sendo
exploradas desde o incio da dcada de cinquenta mas, devido s dificuldades
instrumentais, a sua aplicao como tcnica quantitativa s teve incio trinta
anos mais tarde, com o desenvolvimento e uso generalizado de
microcomputadores. Graas ao interfaceamento entre equipamentos e
microcomputadores, tornou-se simples obter e armazenar grandes
quantidades de dados, de modo rpido e eficiente.
Uma vez superadas as dificuldades para a obteno dos espectros de
reflectncia difusa no infravermelho prximo, o passo seguinte foi obter
informaes quantitativas destes espectros. Nesta fase observou-se que
medidas de reflectncia difusa no infravermelho prximo podem ser
relacionadas concentrao de uma ou mais substncias presentes na
amostra, mas no de uma maneira direta, dificultando ou impossibilitando a
aplicao de procedimentos clssicos de calibrao univariada.
Atualmente, com o desenvovimento da quimiometria, o que se faz
medir a reflectncia em um grande nmero de comprimentos de onda, e
utilizar um mtodo de calibrao multivariada15 para estabelecer a relao
entre a reflectncia difusa e concentrao, ou outra propriedade de interesse.
Dentre tais mtodos destacam-se os no-lineares de calibrao
multivariada16 e mais recentemente as redes neurais17 e as redes neurais com
apodizao18.
3
CAPTULO 2
A ESPECTROSCOPIA DE REFLECTNCIA
DIFUSA NO INFRAVERMELHO
PRXIMO ( NIRR ).
A Reflectncia Difusa1, 25
7
Figura 2.1. Representao esquemtica da reflectncia difusa
8
A teoria fenomenolgica desenvolvida por Kubelka e Munk em 1931,
assume que a radiao que incide sobre uma superfcie rugosa ou particulada
(um p por exemplo), pode ser dividida em dois fluxos. Um fluxo I que
representa a radiao que penetra e absorvida pela amostra, na direo do
feixe incidente, e um fluxo J que retorna da amostra, devido reflectncia
difusa, conforme representado na Figura 2.2.
I0
x=0
dx
I J
x=d
Figura 2.2. Representao grfica dos fluxos envolvidos no modelo de Kubelka - Munk.
I0 a intensidade da radiao incidente, I a frao absorvida e J frao que sofreu
reflectncia difusa.
dI = K I dx eq.2.1
9
do feixe incidente devido reflectncia difusa pode ser descrita pela equao
2.2, como segue:
dI = S I dx eq.2.2
dI = K I dx S I dx eq.2.3
dI = ( K + S ) I dx + S J dx eq2.4
dJ = ( K + S ) J dx S I dx eq2.5
10
ordinrias. Obtida a soluo, basta aplicar as seguintes condies de
contorno:
quando: x=0 I = I0
I x =d 4
T= = eq2.6
I0 (1 + ) e (1 ) 2 e d
2 d
RD =
J x=d
=
(1 2 ) ( e d e d )
eq2.7
I0 (1 + 2 ) e d (1 ) 2 e d
em que:
11
= ( K( K + 2 S )) eq.2.8
=
K
eq.2.9
K + 2S
T = e K d eq.2.10
A semelhana da eq2.10 com a lei de Beer bvia, o que nos leva escrever:
K = C eq.2.11
Assim, K pode ser interpretado, princpio, como o produto C , da lei de
Beer. Entretanto, as coisas no so to simples assim, pois na lei de Beer as
absores ocorrem, exclusivamente, na mesma direo do feixe incidente e
na teoria de Kubelka-Munk, podem existir absores de feixes refletidos por
partculas vizinhas, aumentando o caminho ptico, conforme descrevemos
12
no incio deste tem. Tais fatos permitem absores em direes diferentes
quela do feixe incidente e portanto a analogia feita com lei de Beer, no
absolutamente vlida. Algumas correes podem ser feitas para incorporar
tal diferena. possvel demonstrar que se existe uma distribuio isotrpica
dos feixes incidentes, o caminho mdio percorrido pela luz ,
aproximadamente, duas vezes o caminho percorrido na direo do feixe
incidente e podemos escrever:
K =2 C eq2.12
A anlise do efeito do espalhamento de luz na transmitncia (eq2.6),
derivada na teoria de Kubelka e Munk, pode ser simplificada, se
observarmos a Figura 2.3.
14
Figura 2.4. Superfcie relativa ao comportamento da Reflectncia difusa (Rd) em funo
do espalhamento e da absoro, derivada da teoria de Kubelka e Munk.
1
R= eq.2.13
1+
f ( R) =
(1 R)
2
=
K
eq.2.14
2R S
K C
obtemos:
f ( R) = C eq.2.15
S
16
em que, a funo f ( R ) geralmente chamada de funo K-M.
Experimentalmente observado que o fator S dependente do
comprimento de onda mas, felizmente a dependncia observada muito
pequena ou praticamente nula para a maioria dos casos. Assim sendo, a
variao da reflectncia com o comprimento de onda deve possuir as mesmas
caractersticas de um espectro de transmitncia, dado que ambos so
relacionados por uma constante multiplicativa: o fator S. luz da discusso
anterior, podemos deduzir que, analogamente ao que ocorre com espectros
de absoro, a concentrao de espcies absorventes pode ser relacionada
funo K-M, como segue:
f ( R) C
17
secundrios, mais comuns, so: NaF, NaCl, MgSO4 , Li2CO3 , SiO2 , Al2O3
, BaSO4 e Teflon finamente particulado.
Conforme pudemos observar, a teoria de Kubelka e Munk um
excelente exerccio para compreenso dos fenmenos envolvidos em
medidas de reflectncia difusa e de fundamental importncia no projeto de
novos mtodos de anlises quantitativas fundamentados na espectroscopia
de reflectncia no infravermelho prximo. Entretanto, a aplicao prtica da
funo K-M limitada pela dificuldade de obteno de padres com 100%
de reflectncia, estveis no tempo.
R
A = Log10 eq.2.15
R0
18
Neste mtodo no h a necessidade de que o padro apresente 100%
de reflectncia difusa pois, todas as medidas so feitas em relao ao mesmo
padro e cada aplicao envolve o uso de uma equao nica, empiricamente
derivada. O procedimento para a construo de uma curva de calibrao
usando espectros de reflectncia exatamente igual ao utilizado para
espectros de transmitncia (ou absorbncia).
Naturalmente, a analogia utilizada para a obteno da equao 2.15
uma simplificao da situao fsica, pois associada reflectncia difusa
encontra-se, invariavelmente, a reflectncia especular. Uma consequencia
desta associao a perda da uniformidade do caminho ptico entre as
amostras. O caminho nestes casos passa a ser funo dos seguintes
parmetros: tamanho, forma, orientao das partculas, empacotamento das
partculas na amostra, distribuio de granulometria, etc.
Assim sendo, o caminho ptico torna-se uma varivel extra na
equao 2.15 e, portanto, mesmo nos casos em que s um componente da
amostra absorve radiao em um nico comprimento de onda, sero
necessrias medidas de absobncia em outros comprimentos de onda para
que se possa montar um sistema de equaes algbricas relacionando o
caminho ptico e concentrao, com a absorbncia. Este fato foi durante
alguns anos, um fator limitante ao uso da espectroscopia de reflectncia
difusa no infravermelho prximo em anlises quantitativas.
Atualmente, o que se faz medir a intensidade da reflectncia em um
grande nmero de comprimentos de onda (no espectro de reflectncia difusa
no infravermelho prximo) e utilizar um mtodo de calibrao multivariada
para estabelecer a relao entre reflectncia e concentrao.
Neste ponto encerramos a introduo sobre espectroscopia de
reflectncia difusa no infravermelho prximo. No houve a pretenso de
descrever todos os aspectos tericos mas somente o necessrio
19
compreenso de como esta tcnica foi aplicada, neste trabalho,
determinao de nitrognio em folhas de trigo, milho e algodo.
CAPTULO 3
TCNICAS DE PR-PROCESSAMENTO
DE SINAIS
20
3. Tcnicas de Pr-Processamento de Sinais
22
Na ltima classe (classe dos rudos de alta frequncia), encontramos o
tipo de rudo mais difcil de ser tratado: o rudo branco ou rudo gaussiano.
A caracterstica marcante deste tipo de rudo a inexistncia de uma
frequncia caracterstica, mas uma distribuio de frequncias caractersticas
aleatriamente espalhadas, sobre todas as frequncias que compem o sinal
analtico. Este tipo de rudo origina-se no movimento trmico ou movimento
Browniano dos eltrons em componentes de estado slido, presentes em
instrumentos eletrnicos. Este tipo de rudo torna-se particularmente crtico
em detectores de radiao eletromagntica, tanto que em alguns casos
resfria-se o detector, na tentativa de reduzir este tipo de rudo. Entretanto,
gerar frio , geralmente, algo caro ( proximadamente, cinco vezes mais
caro que gerar calor) e pouco prtico, especialmente para o caso de
detectores. Alm disso, como todos sabemos, impossvel atingir o zero
absoluto ( 0 K ) e, portanto, impossvel eliminar este tipo de rudo ou
mesmo, reduz-lo a nveis tolerveis, em boa parte das situaes prticas.
Entretanto, pode-se minimizar, em alguns casos, este tipo de rudo atravs
de softwares que apliquem filtros de transformada de Wavelet ou filtros de
transformada de Fourier, como descreveremos mais adiante, nesta tese.
24
Original, dez pontos, cinco pontos, trs pontos
x
i
i
Figura 3.1. Representao do efeito da largura do intervalo usado no filtro de mdia mvel
para a suavizao de rudo em um fiagrama.
26
Original, nove pontos, sete pontos, cinco pontos
xi
27
3.1.2 A remoo de rudo instrumental: O filtro de transformada de
Fourier e o filtro de transformada de Wavelet.
Eq. 3.1
Eq. 3.2
28
A sequncia de operaes utilizada no processo de remoo de rudo, atravs
da transformada de Fourier, podem ser facilmente entendidas se observarmos
a Figura 3.3.
Espectro de frequncias
Sinal Analtico do sinal analtico,
sem rudo Transformada de Fourier sem as frequncias
inversa do rudo
Sinal inicial
29
Figura 3.4. Sinal original, isto , sinal + rudo.
- 5 Hz
-10 Hz
30
Figura 3.5. Espectro de frequncias do sinal original.
31
Figura 3.6. Sinal livre do rudo.
F ( S ) = ( f ( ) h( )) Eq.3.3
32
Uma vez que a transformada de Fourier da convoluo de duas funes o
produto das transformadas, podemos escrever:
F ( S ) = ( f ( )) (h( )) Eq.3.4
F (S) = F( w ) H( w ) Eq.3.5
em que:
F( ) = 1 ( F(S )) Eq.3.6
34
Felizmente, a escolha da frequncia crtica geralmente uma tarefa
muito simples pois o rudo geralmente apresenta frequncia altas e o sinal
til, frequncias baixas. Na dvida, devemos efetuar o corte bem longe das
frequncia baixas. Neste caso, talvez no estejamos cortando todo o rudo,
mas certamente uma parcela ser eliminada e no corremos o risco de
distorcer o sinal.
O grande problema do filtro de transformada de Fourier certamente
no a escolha da frequncia crtica, mas a sua aplicao a sinais no
estacionrios, isto , sinais cujas frequncias caractersticas variam com
tempo (comprimento de onda para espectros, potencial para voltamogramas,
etc).
Imagine dois sinais completamente diferentes, mas que apresentem
espectros de frequncias idnticos. Por exemplo, um sinal pode ser composto
por duas frequncias combinadas durante todo o intervalo de tempo, um
segundo sinal pode possuir as mesmas duas frequncias entretanto, estas
podem aparecer, no sinal, em tempos diferentes. Os sinais seriam totalmente
diferentes mas seus espectros de frequncia, idnticos. Na Figura 3.8
podemos observar um sinal (sinal 1) com duas frequncias distribudas sobre
todo o sinal. Na Figura 3.9 representamos um segundo sinal (sinal 2)
formado pelas mesmas frequncias do sinal anterior mas divididas em dois
intervalos: no primeira metade do sinal temos somente a frequncia 10 Hz e
na segunda metade a frequncia 20 Hz.
35
Figura 3.8. Sinal com duas frequncias (10Hz e 20Hz), distribudas sobre todo intervalo
de tempo.
Figura 3.9. Neste sinal temos uma frequncia (10 Hz) na primeira metade do sinal e outra
frequncia (20 Hz) na segunda metade .
36
Nas Figuras 3.10 e 3.11, representamos os espectros de frequncia dos sinais
1 e 2, respectivamente. Observe que os espectros de frequncia dos dois
sinais apresentam, basicamente, as mesmas frequncias caractersticas. Este
fato nos levaria uma interpretao errada dos sinais pois seramos tentados
a pensar que os sinais so, no mnimo, muito parecidos. Entretanto, os sinais
so absolutamente diferentes.
O resultado prtico do fato descrito no pargrafo anterior que se
aplicarmos o filtro de transformada de Fourier a um sinal no estacionrio,
no momento em que aplicarmos a transformada inversa podemos recuperar
um sinal com caractersticas diferentes do sinal inicial.
37
Figura 3.11. Transformada de Fourier do sinal.
+ +
Eq. 3.7
38
A soluo para o problema da falta de suporte compacto das funes
seno e cosseno, aplicar a transformada de Fourier a segmentos do sinal e
no diretamente sobre o sinal todo, num procedimento conhecido como
transformada de Fourier de pequenos intervalos31 (STFT, short time Fourier
transform). Quando bem aplicada, a STFT fornece informaes exatas
sobre os tempos em que as frequncias ocorrem. Assim sendo, devemos
utilizar a STFT quando desejarmos aplicar o filtro de transformada de
Fourier a sinais no estacionrios. A nica desvantagem prtica deste
procedimento o aumento do tempo computacional. Matematicamente a
STFT pode ser escrita como segue:
( f ( ) l ( , )) e
1
STFT F ( w) = i w
d Eq.3.8
2
i f
(
Na equao 3.8, o termo l i , f ) representa a largura do intervalo utilizado
na STFT.
Quando aplicamos a STFT para sinais no estacionrios que mudam
suas frequncias em intervalos de tempo muito rpidos, a largura do intervalo
deve ser inversamente proporcional mudana de frequncias do sinal, isto
, quanto mais rapidamente o sinal muda de frequncia, menor deve ser a
largura do intervalo usado na STFT. Neste ponto, nos deparamos com um
problema terico muito interessante, qual seja: at quando possvel reduzir
a largura do intervalo utilizado na STFT, ou melhor, com que exatido, no
domnio do tempo, as frequncias podem ser determinadas em um sinal no
estacionrio ?
A resposta para questo anterior dada pelo princpio da incerteza de
Heisenberg41, 42. O princpio da incerteza de Heisenberg mostra que no
39
possvel conhecer exatamente e simultaneamente, tempo (t) e frequncia (w),
mas somente a seguinte relao entre estas grandezas:
1
w t
4
Este fato, nos leva ao seguinte problema de resoluo: quanto menor o
intervalo de tempo utilizado na STFT, pior a resoluo nas frequncias e
vice-versa.
Assim sendo, a transformada de Fourier nos fornece boa informao
sobre as frequncias de um sinal, mas no fornece informaes exatas sobre
o tempo em que estas frequncias ocorrem. J a STFT nos fornece boa
informao sobre o tempo em que as frequncias ocorrem mas no fornece
informaes exatas sobre as frequncias. As caractersticas dos dois tipos de
transformada de Fourier esto resumidas na Tabela 1.
40
Com o objetivo de superar os problemas de resoluo apresentados
pela transformada de Fourier e pela transformada de Fourier de pequenos
intervalos (STFT), foi desenvolvida no incio da dcada de setenta, por
Ingrid Daubechie53 no AT&T Bell Laboratrios, a transformada de Wavelet.
A transformada de Wavelet uma transformao linear que
analogamente transformada de Fourier, nos permite representar um sinal
no domnio das frequncias que o compem. No domnio das frequncias
tambm possvel cortar frequncias e atravs da transformada de Wavelet
inversa, recuperar o sinal livre de rudo.
A nica diferena entre as transformadas de Fourier e de Wavelet so
as funes de base utilizadas na decomposio do sinal. Nas transformadas
de Fourier as funes de base para a transformao de domnio so as
familiares funes seno e cosseno, as quais apresentam os problemas de falta
de suporte compacto, anteriormente mencionados. Para a transformada de
Wavelet, as funes de base so muito menos familiares e chamadas de
wavelets (ondinhas). Estas funes de base, as wavelets, apresentam como
principal caracterstica, suporte altamente compacto, isto , as wavelets no
se estendem de - at + no domnio do tempo, mas possuem um ponto de
incio e um ponto de trmino muito bem definidos.
Ao contrrio da transformada de Fourier, em que temos um nico tipo
de funes de base (senos e cossenos), na transformada de wavelet temos
vrios tipos diferentes de funes de base, isto , vrios tipos diferentes de
wavelets, divididas em famlias. As famlias de wavelets mais comums so
as seguintes: Daubechies, Morlets, Coiflets, Haar e as Symmlets. Um
exemplo clssico de funo de base utilizada em transformadas de Wavelet
a wavelet da famlia das Morlets, dada pela equao 3.9 e representada
na Figura 3.12.
41
g = ei w t e t
2
/2
Eq. 3.9
W ( ) =
x ( ) g ( ) d
Eq. 3.10
42
Uma vez que as wavelets utilizadas em filtros de rudo instrumental,
so compostas exclusivamente por frequncias baixas, isto , apresentam
frequncia crtica baixa, ao fazermos a convoluo da equao 3.10
automaticamente cortaremos frequncias altas, eliminando simultaneamente
o rudo instrumental.
Uma funo de base pode ser comprimida (por exemplo, perodo
reduzido a metade, frequncia crtica dobrada), no domnio tempo
(comprimento de onda para espectros, tempo para cromatogramas, diferena
de potencial para voltamogramas, etc.), de modo que podemos representar
um mesmo sinal em escalas cada vez menores, removendo rudo
sequencialmente em cada uma destas escalas. Alm disso a wavelet
transladada atravs do sinal, permitindo remover rudo de sinais
estacionrios ou no estacionrios. A transformada de Wavelet seria anloga
a uma STFT em que se pudesse reduzir indefinidamente a largura do intevalo
de anlise do sinal (janela), sem violar o princpio da incerteza de
Heisenberg. Entretanto, a relao entre a resoluo no domnio do tempo ou
das frequncias um jogo em que o Croupier o princpio da incerteza de
Heisenberg, que independentemente dos jogadores, isto , independente do
tipo de transformada utilizada, far valer suas regras. Assim sendo, se nas
transformadas de Wavelet, devido possibilidade de compresso das
wavelets, possvel obter alta resoluo no domnio do tempo, o princpio
da incerteza nos diz que algo deve ser perdido. De fato, medida que
comprimimos uma wavelet ganhamos resoluo no tempo, mas
simultaneamente, aumentamos sua frequncia de corte. Portanto, s
possvel cortar frequncias altas nos sinais em que estas frequncias, estejam
limitadas a pequenos intervalos de tempo. Resumindo, se uma wavelet for
comprimida, ganhamos resoluo no tempo, mas devido a alterao na
frequencia da wavelet, perdemos preciso na frequncia crtica de corte
43
utilizada no corte de frequncias altas. Portanto, o uso da transformada de
Wavelet apresentar melhores resultados quando o sinal em questo possuir
componentes de alta frequncia de curta durao e componentes de baixa
frequncia de longa durao. Felizmente, a maioria dos sinais encontrados
na prtica possuem as caractersticas anteriores.
As wavelets geradas por compresso e translao de uma wavelet
inicial (wavelet me), podem ento, ser escritas como52:
1 b
g a b ( ) = g Eq. 3.11
a a
Tempo
44
Naturalmente, a transformada de wavelet torna-se funo dos parmetros de
escala (a e b) e deve ser reescrita como segue:
W f (a, b) =
x ( ) g a b ( ) d Eq. 3.12
g1 b ( ) W1
g 2 b ( ) W2
f ( )
g 3 b ( ) W3
g 4 b ( ) W4
45
Frequncia esta que pode ser associada a alguma propriedade de interesse,
embutida no sinal e assim por diante.
O sinal inicial, livre de rudo, pode ser recuperado aplicando-se a
transformada de Wavelet inversa relativa wavelet mais comprimida, dada
pela equao 3.13.
da
x ( ) = W f (a, b) g a b ( ) db Eq. 3.13
a2
0
46
qumica analtica, os detalhes tericos no so necessrios e a introduo
anterior suficiente.
x i k = u k + v k xi eq.3.14
3- Correo final:
x ( corrigido )
=
( x(nao corrigido )
ik uk ) eq.3.15
ik
vk
48
O mtodo MSC, quando bem aplicado, capaz de reduzir
significativamente os efeitos relativos ao espalhamento de luz. Tipicamente,
obtm-se uma melhora expressiva na desempenho dos modelos contrudos
para a relao existente, entre a intensidade de reflectncia e a concentrao
das espcies absorventes.
49
Na compresso de dados pela tcnica da transformada de Fourier, a
idia bsica utilizar o espectro de frequncia ao invs do sinal analtico
propriamente dito. No espectro de frequncia possvel cortar frequncias
relativas ao rudo instrumental e frequncias relativas a informaes sem
importncia, reduzindo sua dimenso. O espectro de frequncia assim
tratado, pode ser armazenado ocupando menos espao. O sinal analtico pode
ser resgatado com grande facilidade, atravs da transformada de Fourier
inversa. O mtodo da transformada de Fourier encontra grande aplicao na
rea de compresso e tratamento de imagens. O famoso algoritmo JPEG
(Joint Photographics Experts Group), utilizado para compresso de imagens,
aplica o mtodo da transformada de Fourier ( em duas dimenses), em uma
de suas principais etapas. Com o algoritmo JPEG possvel alcanar taxas
de compresso da ordem de 45%, sem distoro significativa da imagem.
50
em que E uma matriz de erros, t i e p i so os escores e loadings,
respectivamente, da matriz das variveis independentes.
Esta a definio que se encontra em boa parte dos livros e artigos
sobre calibrao multivariada. A definio anterior est totalmente correta,
mas quase impossvel de entender, pelo menos para a grande maioria dos
mortais. Acompanhe o exemplo abaixo, e tudo se tornar claro (pelo menos
teoricamente!!! ).
Imagine que voc deseja determinar simultaneamente dois ons
metlicos, utilizando um complexante cromognico inespecfico, atravs de
espectroscopia de absoro, na regio do visvel (400 - 700 nm). Para tanto,
voc prepara diversas misturas, com diferentes propores dos ons
metlicos e adiciona o complexante cromognico inespecfico. Em seguida,
voc obtm para cada uma das misturas, o respectivo espectro na regio do
visvel. Executado o procedimento experimental anterior, voc poder
montar a seguinte matriz de dados:
Matriz X Matriz Y
10%a 90%b
40%a 60%b
60%a 40%b
90%a 10%b
350 650 nm
51
absorbncias lidas em diferentes comprimentos de onda. Na matriz Y, temos
as respectivas propores dos ons metlicos, presentes nas misturas.
No passo seguinte devemos centrar as colunas da matriz X na mdia
para obter X (basta subtrair de cada elemento da coluna, o valor mdio da
coluna toda) e calcular a covarincia de X , atravs da equao 3.17.
( )
Cov X =
X X
m 1
Eq.3.17
( )
Agora devemos obter a direo de maior variao da matriz Cov X . Isto
( )
Cov X pi = i pi Eq.3.18
52
de alta covarincia resolver a equao 3.18, obtendo seus autovalores e em
seguida seus autovetores
Tipicamente, a equao 3.18 apresenta como soluo uma srie de
autovalores, a partir dos quais obtm-se os respectivos autovetores. O
primeiro autovetor, correspondente ao maior autovalor, fornece a direo no
espao das variveis (colunas de X ) que descreve a maior porcentagem da
varincia das amostras. Nos casos em que toda a varincia do sistema no
puder ser descrita usando um nico autovetor, um segundo autovetor,
ortogonal ao primeiro, pode ser obtido e assim por diante at que toda a
varincia das amostras seja capturada. Nesta etapa possvel utilizar um
nmero de autovetores (ou autovalores) muito menor que o nmero de
colunas da matriz X ( nmero de comprimentos de onda) e ainda assim
capturar a maior parte da varina dos dados, resultando na compresso dos
dados.
Uma vez obtidas as direes de maior varincia das amostras, o
prximo passo projetar a matriz X nesta nova base, como segue:
X pi = t i Eq. 3.19
53
piT ( pi piT )
54
Resumindo, os escores so extremamente versteis e podem ser
usados, com vantagens, em substituio s absorbncias (ou outra varivel)
em qualquer procedimento de calibrao multivariada.
CAPTULO 4
TCNICAS QUIMIOMTRICAS DE
MODELAMENTO DE DADOS
55
4. Tcnicas quimiomtricas de modelamento de dados
56
Operacionalmente podemos considerar uma rede neural como uma
caixa de processamento que pode ser treinada para que, a partir de um
conjunto de dados de entrada (inputs), possa gerar uma ou mais sadas
(outputs), conforme representado na Figura 4.1.
Entradas
Processamento
Sadas
Por exemplo, pode-se treinar uma rede neural para que a partir do
espectro de RMN-H (input) de um composto orgnico ela apresente como
saida (output) a estrutura molecular do mesmo, ou ainda os inputs podem ser
dados clnicos de um paciente e os outputs o diagnstico e tipo de evoluo.
Enfim, as aplicaes so extremamente variadas e esto presentes em quase
todas as reas do conhecimento humano.
Neste ponto do texto, j temos uma viso geral sobre redes neurais e,
portanto, estamos aptos a aprofundar nossos conhecimentos sobre o assunto.
Como veremos, esta uma tarefa fcil visto que as redes neurais so
elaboradas a partir de cinco conceitos bsicos, extremamente simples. Estes
elementos so:
Neurnios artificiais
Sinapses e pesos
Funes de transferncia
dendritos
corpo celular
axnio
Entradas
Sada
58
Figura 4.2B. Neurnio artificial
E n tr a d a ( in p u t )
P o n d e r a o
s a d a ( o u tp u t)
59
O sinal total que entra no corpo de processamento de um neurnio
artificial costumeiramente chamado de Net, cujo valor calculado atravs
da simples multiplicao do sinal que chega ao neurnio pelo peso da sinapse
em questo.
x
x 1
2
x n
N et
sa d a
Figura 4.4 Representao generalizada da sinapse
Net = X W
i =1
i i eq.4.1
60
At o momento vimos como calcular o sinal que entra em um
neurnio, mas qual ser o sinal de sada de um neurnio?
1) No negativa
A funo de transferncia deve ser no negativa, pois ou o neurnio troca
sinal com outro neurnio ou no troca, no h como trocar sinal negativo.
2) Contnua
A funo de transferncia deve ser contnua, pois um neurnio no pode
trocar sinal com outro neurnio, indefinidamente.
Funo sigmoidal
-10 -5 0 5 10
1.0 1.0
Out=f(Net)
0.8 0.8
0.6 0.6
0.4 0.4
0.2 0.2
0.0 0.0
-10 -5 0 5 10
Net
62
Funo de Heaviside
-10 -5 0 5 10
1.0 1.0
0.8 0.8
Out=f(Net)
0.6 0.6
0.4 0.4
0.2 0.2
0.0 0.0
-10 -5 0 5 10
Net
3) Funo Linear
63
-Log(R/Ro)
0.38
0.36
0.34
0.32
0.30
0.28
0.26
0.24
1 2 3 4 ... 277
Sigmoidal
Linear
Teor de nitrognio
Figura 4.7. Representao de uma rede neural tpica, utilizada neste trabalho.
64
infravermelho prximo (NIRR) de folhas de trigo, milho ou algodo. A sada
(output) foi a concentrao de nitrognio nestas folhas.
Vale ressaltar que o nmero de camadas intermedirias e nmero de
neurnios nestas, um parmetro ajustvel conforme veremos adiante.
Camada de entrada:
65
w1,1 w1,2 w1,3 L w1,277
w2 ,1 w2 ,2 w2 ,3 L w2 ,277
1
W277 277 = w3,1 w3,2 w3,3 L w3,277
M M M M
w w277 ,2 w277 ,3 L w277 ,277
277 ,1
Camada intermediria:
Camada de sada:
xil = [ x1 x2 x3 x4 x5 L x277 ]
66
w1,1 w1,2 w1,3 L w1,277
x
w2 ,1 w2 ,2 w2 ,3 L w2 ,277 1
x2
Net = [ Net1 , Net 2 ,K Net 277 ] = w3,1 w3,2 w3,3 L w3,277
M
M M M M
w x277
277 ,1 w277 ,2 w277 ,3 L w277 ,277
Net lj =
W
i =1
l
ji xil eq.4.5
Uma vez que toda entrada de uma camada pode ser relacionada com a sada
da camada anterior, podemos reescrever a equao 4.5 como segue:
Net =
l
j
i =1
Wjli outil 1 eq.4.6
67
lidas em diferentes comprimentos de onda, para vrios espectros de
reflectncia difusa na regio do infravermelho prximo de folhas de trigo,
milho ou algodo. Uma vez propagados, podemos calcular a sada da rede
neural, isto , o valor previsto da concentrao de nitrognio nestas folhas,
conforme representamos na Figura 4.7.
Uma vez obtidos os valores previstos pela rede neural, podemos
calcular um erro de previso (E), o qual pode ser definido, em princpio,
como o somatrio do quadrado da diferena entre o valor previsto pela rede
(sada) e o valor real (target), como segue:
E=
k =1
( y k y$ k ) 2 eq.4.7
68
Entrada
W1 Corrigido
W1
W2 Corrigido
W2
W3 Corrigido
W3
Correo
Sada
Erro
Objetivo
Figura 4.8. Representao da retropropagao para uma rede com uma camada de
entrada(W1), uma intermediria(W2) e uma camada de sada(W3)
Primeiro termo:
lj out l 1
69
O fator de correo lj obtido utilizando-se o mtodo do gradiente
descendente, cuja essncia que o erro (E) deve apresentar um mnimo em
funo do parmetro que o causa, ou melhor, lj fornecer os pesos que
minimizam o erro (E). O parmetro chamado de velocidade de
treinamento introduzido para ponderar as correes, de modo a evitar
grandes correes principalmente no final do processo iterativo, quando boa
parte dos pesos j foi corrigido e uma correo muito acentuada pode
comprometer todas as correes efetuadas.
Segundo termo:
W jprevio
i
( )
1
W = J T J + I JT E eq.4.9
70
onde J a matriz jacobiana do erro para cada um dos pesos, um escalar
positivo, I a matriz identidade e E o vetor de erros dado pela equao 4.7.
Em ambos os casos, a etapa de treinamento se encerra quando o erro
atingir o critrio de convergncia previamente estabelecido. Neste ponto, a
rede est treinada e podemos utilizar um conjunto de espectros de NIRR,
diferente daquele utilizado no treinamento, para avaliar as propriedades de
generalizao da rede neural artificial, as quais so geralmente boas,
especialmente em situaes em que os dados apresentem no linearidades.
Entretanto, em alguns casos, as redes neurais artificiais, mesmo depois de
terem sido treinadas, apresentam baixos erros de calibrao e elevados erros
de previso, isto , sobreajuste (overfitting), devido ao nmero excessivo de
neurnios utilizados na camada intermediria. O nmero de neurnios na
camada intermediria atua de modo anlogo ao nmero de componentes
principais utilizado na regresso de componentes principais74-75 (PCR), ou
ordem do polinmio utilizado em regresso polinomial76, por exemplo.
Portanto, um procedimento fundamental para evitar-se sobreajuste
(overfitting), isto , pequenos erros de calibrao e elevados erros de
previso, a otimizao do nmero de neurnios da camada intermediria.
71
nc
1
( yi y$i )2
% SEC = i =1
100 eq. 4.10
cc nc k 1
np
1
( yi y$i )2
% SEP = i =1
100 eq.4.11
cp np
72
4.2 Redes Neurais com Apodizao77, 78
1
C(W ) = E (W ) + W T D W eq.4.12
2
73
O termo de regularizao simplesmente penaliza pesos com valores
elevados, sendo esta penalizao, ponderada pelo fator D. O fator de
regularizao auxilia no processo de pruning e assegura a estabilidade
numrica do mtodo. Em seguida, expande-se a funo custo em srie de
Taylor at termos de segunda ordem, em torno de um possvel mnimo W0 ,
como segue:
C(W ) = C(W0 ) + (
1 2
2
E + D) ( dW )
2
eq.4.13
em que dW = W W0 .
C(W ) = W eq.4.14
d W = H 1 eq.4.15
(
H = 2 E + D ) eq.4.16
74
Neste ponto pode-se voltar a equao 4.12, explicitar a funo E(W),
substituir o valor de dW e obter a seguinte equao para a salincia:
H ( E + D) H 1
1 2 1 2
dE (W ) = W0 D H 1 + eq.4.17
2
X = TP + E eq.4.18
Y = UQ + F eq.4.19
U =bT + eq.4.20
76
feita por um polinmio de grau varivel, o que nos permite modelar relaes
no lineares entre t e u, como segue:
t = a0 + a1 u + a2 u 2 + a3 u 3 + L + an u n eq.4.22
77
ui ti
CAPTULO 5
78
OBJETIVOS
5. OBJETIVOS
79
CAPTULO 6
PARTE EXPERIMENTAL
80
6. Parte Experimental
81
Na etapa anterior determinao de nitrognio pelo mtodo Kjeldahl,
as folhas foram lavadas com uma soluo de gua e detergente (1%) e
enxaguadas vrias vezes com gua destilada e uma vez com gua deionizada.
Em seguida, as folhas foram colocadas em sacos de papel (para
identificao), secas em estufa a 65C ( mnimo de 24 h), modas em um
moinho do tipo Wiley com abertura de 2 mm e peneiradas em peneira de 80
mesh. Esta etapa do procedimento experimental est representada na Figura
6.1.
Moagem
Determinao de
Peneirao
nitrognio - Kjeldahl
82
uma das amostras foi a mdia dos espectros das trs alquotas. Antes da
aquisio do espectro de cada alquota (e para todas amostras), obteve-se o
espectro do padro de reflectncia utilizado como referncia em clculos
posteriores (padro n 99 da empresa LabSphere, Inc.). Assim, foram
obtidos 6 espectros para cada amostra, resultando em um total de
aproximadamente, 500 espectros de reflectncia difusa no infravermelho
prximo.
Os espectros NIRR foram obtidos em um espectrofotmetro de
infravermelho prximo com monocromador baseado em filtro ptico
acstico sintonizvel90-93 (AOTF), desenvolvido e gentilmente cedido pelo
Prof. Dr. Clio Pasquini (IQ-UNICAMP) e pelo Sr. Renato Guchardi. Na
montagem utilizada para as medidas de reflectncia, adaptou-se ao
espectrofotmetro uma fibra ptica bifurcada (um feixe conduz a radiao
NIR at a amostra e o outro conduz a radiao NIR atenuada, devido s
absores, at o detector). Esta adaptao permitiu que as medidas de
reflectncia fossem feitas diretamente sobre as folhas modas (ou sobre o
padro de reflectncia, Teflon finamente particulado), como representado
nas Figuras 6.2.A, 6.2.B e 6.2.C.
83
Detector Radiao NIR
Ponta de prova
Porta amostra
Figura 6.2.B A. Nesta foto pode-se observar o porta amostra (carregado com folhas de
trigo modas) e a ponta de prova, da fibra ptica.
84
Figura 6.2.C. Nesta foto pode-se observar o padro de reflectncia e a ponta de prova da
fibra ptica.
Figura 6.3. Foto do porta amostra, padro de referncia e frascos com amostras de folhas
de trigo modas.
Lock in
Lmpada de tungstnio
Detector de PbS Ponta de Prova AOTF 100W , bulbo de quartzo
Porta Amostra
Gerador de
rdio frequncias
Piezoeltrico
Cristal
Radiao de
incudente TeO 2
86
Materiais piezoeltricos, quando submetidos diferenas de potencial
respondem expandindo-se ou contraindo-se; se a diferena de potencial
aplicada com uma determinada frequncia, o piezoeltrico executa um
movimento vibratrio. Uma vez que o material piezoeltrico est acoplado a
um cristal de TeO2, a vibrao mecnica se propagar atravs deste cristal.
Vibraes mecnicas (o som, por exemplo) quando se propagam em meios
materiais, como o cristal de TeO2, geram regies, internas ao cristal, de
compresso e rarefao, como representado na Figura 6.6.
Gerador de
rdio frequncias
Piezoeltrico
Radiao
incidente
88
Figura 6.7. Vista geral do espectrofotmetro utilizado para a obteno dos espectros de
reflectncia difusa no infravermelho prximo.
89
Escolhendo a arquitetura da rede neural .......
90
Selecionando a funo de transferncia para a camada intermediria........
91
CAPTULO 7
RESULTADOS E DISCUSSO
7 Resultados e Discusso
92
Os espectros foram traados lanando-se nas abscissas os
comprimentos de onda ( em nm) e nas ordenadas o logaritmo na base 10,
da razo entre a reflectncia da amostra (R) e a reflectncia do padro (R),
isto , utilizamos o mtodo emprico descrito no tem 2 desta tese. Na Figura
7.1 representamos trs espectros tpicos, um para cada tipo de amostra.
0.40 0.40
Trigo
0.38 0.38
Milho
0.36 Algodo 0.36
-Log(R/Ro)
0.34 0.34
0.32 0.32
0.30 0.30
0.28 0.28
0.26 0.26
0.24 0.24
93
7.1.1 Homogeneidade das amostras99
94
alquota1, alquota2, alquota3
0.32
0.30
0.28
-Log( R / R0 )
0.26
0.24
0.22
0.20
0.18
1400 1600 1800 2000 2200 2400
96
Figura 7.3. Efeito do filtro de transformada de fourier.
80
60
Frequncia
40
20
97
7.2.2 Filtro de transformada de Wavelet
98
Distribuio de resduos para o filtro de Wavelet
80
Frequncia 60
40
20
-0.0010 -0.0008 -0.0006 -0.0004 -0.0002 0.0000 0.0002 0.0004 0.0006 0.0008
Resduo
99
Figura 7.7. Espectros tratados com o filtro de Savitzky-Golay, sobrepostos aos no
tratados.
60
Frequncia
40
20
100
mais eficiente. Gaussianas fortemente centradas em torno do valor zero
(pequena largura), indicam que, possivelmente, pouco rudo foi removido.
Resumindo, os resduos devem apresentar distribuio gaussiana, centrada
em zero e quanto mais larga a gaussiana, melhor o filtro.
Os filtros de Fourier e Wavelets apresentaram desempenho
equivalente, visto que a rea da gaussiana relativa ao filtro de Fourier (rea=
0,025) foi, para todos efeitos prticos, igual rea da gaussiana relativa ao
filtro de Wavelet (rea = 0,023). Todavia, tanto o filtro de transformada de
Fourier quanto o de transformada de Wavelet foram significativamente
melhores que o filtro de Savitzky-Golay (rea = 0,01).
Alm do mtodo anterior avaliamos a desempenho dos filtros de pr-
processamento em funo dos resultados que produziram nos modelos
utilizados (PLS, PLS polinomial, PLS rede neural, redes neurais e redes
neurais com prunning), isto , avaliamos o filtro que permite construir
modelos de melhor qualidade, isto , menores erros. Discutiremos este fato
aps termos apresentado os resultados obtidos com os modelamentos.
101
Figura 7.10. Espectros de folhas de trigo, antes do MSC.
103
umidade (Figura 7.12), para a amostra com menor teor de umidade (Figura
7.13) e para uma amostra com teor de umidade intermedirio (Figura 7.14 ).
Figura 7.12. Curva representativa da variao da massa em funo da temperatura para a amostra
com maior teor de umidade (5,5 %).
Figura 7.13. Curva representativa da variao da massa em funo da temperatura para a amostra
com menor teor de umidade (4,65 %).
104
Figura 7.14. Curva representativa da variao da massa em funo da temperatura para a
amostra com teor de umidade intermedirio (5,09 %).
105
visualizar possveis agrupamentos (clusters) dos espectros, possibilitando
a seleo homognea das amostras usadas na calibrao, validao e
previso ( Figura 7.15 ).
7.6 Modelamentos
106
Desenvolvemos modelos de calibrao exclusivamente para as
amostras de folhas de trigo. As amostras de milho e algodo foram utilizadas
com outra finalidade que se tornar clara, mais adiante no texto.
Os modelos foram construdos combinando-se todas as tcnicas de
pr-processamento de sinais com todas as tcnicas de modelamento,
resultando em um total de oitenta modelos.
A construo dos modelos foi feita utilizando-se, no o espectro todo
( todas intensidades de reflectncia, lidas em todos os comprimentos de onda
) mas, os cinco primeiros componentes principais ( PCs ) deste espectros,
os quais capturavam aproximadamente, 95% da varincia dos dados. A
opo por cinco PCs deve-se ao fato de que se fosse utilizado um nmero
superior ou inferior a este, aumentvamos os erros de validao e previso
em todos os modelos. Entretanto, nos modelos em que empregamos a
derivada segunda dos espectros utilizamos vinte componentes principais
(PCs), visto que neste caso estes PCs forneceram modelos com menores
erros de calibrao, validao e previso.
107
nc
1
( y y$ )
i =1
i i
2
eq.7.1
% SEC = 100
cc nc k 1
np
1
( y y$ )
i =1
i i
2
eq.7.2
% SEP = 100
cp np
1) Desempenho individual
Modelos que apresentavam %SEP e/ou %SEV duas vezes maior que
o %SEC, foram foram imediatamente descartados, visto ser esta uma
108
indicao de sobreajuste (overfitting), isto , modelos com baixos erros de
calibrao e altos de previso e validao. Alm disso, tambm foram
descartados modelos com erros ( % SEC, % SEP ou % SEV) muito acima
do aceitvel (digamos 15 % de erro). Esta estratgia reduziu
consideravelmente o nmero de modelos a serem analisados, isto ,
comparados.
Assim sendo, a prxima tarefa comparar todos os modelos restantes
e escolher aqueles que apresentem melhor desempenho. Uma maneira de
estabelecer esta comparao construir uma tabela (Tabela 1) com os valores
de % SEC, % SEV, % SEP, coeficiente de correlao ( r2 ), coeficiente
angular e coeficiente linear, para cada um dos modelos e em seguida,
compar-los. Esta tarefa extremamente tediosa pois muitos modelos
apresentam bons valores de % SEP, % SEC e % SEP mas, valores runs para
os outros parmetros, dificultando a escolha dos melhores modelos.
Entretanto, existe um modo de facilitar as coisas, como veremos seguir.
109
10 FFT sim 3.94 5.00 11.3 0.99 0.99 0.97 0.99 1.00 1.00 0.04 0.05 0.03
POLIPLS
11 SG no 5.09 8.84 10.9 0.99 0.98 0.96 0.98 0.97 0.95 0.06 0.06 0.09
RN
12 SG no 6.43 6.55 8.65 0.98 0.99 0.97 0.98 0.96 0.97 0.04 0.06 0.04
RNP
13 SG no 6.59 8.30 9.40 0.99 0.98 0.98 0.98 0.92 0.97 0.11 0.20 0.09
PLSRN
14 SG no 5.91 6.20 8.00 0.99 0.99 0.98 0.98 0.95 0.96 0.06 0.2 0.1
PLS
15 SG no 5.42 7.83 11.1 0.99 0.98 0.97 0.95 0.92 0.96 0.15 0.26 0.01
POLIPLS
16 SG sim 4.98 16.5 16.4 0.99 0.95 0.93 0.99 1.08 1.03 0.01 0.34 0.27
RN
17 SG sim 6.43 6.55 8.61 0.99 0.99 0.98 0.98 0.96 0.97 0.05 0.13 0.13
RNP
18 SG sim 6.60 8.20 9.40 0.99 0.98 0.98 0.97 0.92 0.97 0.11 0.20 0.10
PLSRN
19 SG sim 4.90 15.7 11.5 0.99 0.93 0.96 0.99 1.19 1.04 0.02 0.71 0.01
PLS
20 no no 5.49 5.99 11.9 0.99 0.99 0.95 0.98 0.96 0.94 0.06 0.17 0.12
RN
21 no no 6.51 6.9 8.1 0.99 0.99 0.98 0.98 0.95 0.96 0.03 0.14 0.15
RNP
22 no no 4.60 6.85 9.42 0.99 0.98 0.98 0.99 0.95 0.97 0.03 0.15 0.10
PLS
23 no no 4.98 8.56 12.0 0.99 0.98 0.96 0.96 0.92 0.97 0.13 0.19 0.02
POLIPLS
* Na construo da Tabela 1 utizamos as seguintes abreviaes: Redes neurais com apodizao (RNP),
Redes neurais (RN), Mnimos Quadrados Parciais - redes neurais (NNPLS), Mnimos Quadrados Parciais
(PLS), Mnimos Quadrados Parciais-ajuste polinomial (POLIPLS), Filtro de transformada de Fourier
(FFT), Filtro de Savitzky-Golay (SG) e derivada (Der.). Os sub ndices c, v e p, indicam calibrao,
110
para os trs primeiros componentes principais ( um escore em cada
coordenada) os quais capturavam 99,5% da varina dos dados. O objetivo
deste procedimento absolutamente idntico ao utilizado para a seleo das
amostras ( tem 7.5 desta tese ), isto , observar possveis agrupamentos dos
resultados. O grfico obtido, est apresentado na Figura 7.16.
III
II
PC 3
4
I
IV
PC 2
PC 1
111
destes resultados no acrescentaria nada existncia ou no de possveis
agrupamentos entre os dados, mas prejudicaria muito a visualizao destes
agrupamentos, devido ao aumento de pontos no grfico da Figura 7.16.
2) Desempenho relativa102:
113
Selecionados os modelos que desejamos comparar ( modelos 1 at 5
da pgina anterior), centralizaremos toda a anlise subsequente sobre estes
modelos, para obtermos uma classificao dos mtodos de modelamento,
isto , na etapa anterior fizemos uma classificao grosseira, que ser
refinada nesta etapa.
Uma vez que os modelos selecionados anteriormente no apresentam
sobreajuste (overfitting), podemos fundir os conjuntos de validao e
previso em um nico conjunto, aqui chamado de conjunto de previso
combinado, e calcular para este conjunto o erro padro de previso
combinado (% SEPC). Lembre-se, o objetivo de separar o conjunto de
amostras de teste (previso + validao) em dois conjuntos de 12 amostras (
12 para validao e 12 para previso ), foi somente o de identificar modelos
com sobreajuste.
A seguir apresentaremos em detalhe a desempenho de cada um dos
cinco mtodos de modelamento selecionados.
PLS
% SEC % SEPC
6,75 8,91
114
PLS
6
4
NIRR-PLS, % N
2 Calibrao
Previso
1
0
0 1 2 3 4 5
KJELDAHL, % N
Figura 7.17. Valor previsto, para o teor de nitrognio, pelo modelo de calibrao NIRR-
PLS versus o valor obtido com o mtodo Kjeldahl.
% SEC % SEPC
6,42 9,65
115
PLS polinomial (POLIPLS)
5
NIRR-PLS-Polinomial, % N
2
Calibrao
Previso
1
0
0 1 2 3 4 5
KJELDAHL, % N
Figura 7.18. Valor previsto, para o teor de nitrognio, pelo modelo de calibrao NIRR-
POLIPLS versus o valor obtido com o mtodo Kjeldahl.
Redes Neurais(RN)
% SEC % SEPC
4,78 6,53
116
Redes Neurais
6
NIRR-REDES NEURAIS, % N 5
Calibrao
1 Previso
0
0 1 2 3 4 5
KJELDAHL, % N
Figura 7.19. Valor previsto, para o teor de nitrognio, pelo modelo de calibrao NIRR-
RN versus o valor obtido com o mtodo Kjeldahl.
117
PC1 PC2 PC3 PC4 PC5
sigmoidal
Linear
%N
Figura 7.20. Representao da rede neural utilizada no nodelamento. Esta rede possui
uma camada de entrada com cinco neurnios, uma camada intermediria com quatro
neurnios e uma camada de sada com um nico neurnio. A funo de transferncia
utilizada entre a camada intermediria e a camada de sada foi a funo sigmoidal. Na
camada de sada utilizou-se a funo linear.
% SEC % SEPC
6,10 7,64
118
PLS redes neurais ( NNPLS )
6
4
NIRR-NNPLS, % N
2
Calibrao
Previso
1
0
0 1 2 3 4 5
KJELDAHL, % N
Figura 7.21. Valor previsto, para o teor de nitrognio, pelo modelo de calibrao NIRR-
NNPLS versus o valor obtido com o mtodo Kjeldahl.
2
Calibrao
1
Previso
0
0 1 2 3 4 5
KJELDAHL, % N
Figura 7.22. Valor previsto, para o teor de nitrognio, pelo modelo de calibrao NIRR-
RNP versus o valor obtido com o mtodo Kjeldahl.
120
PC1 PC2 PC3 PC4 PC5
s L s L s L s L s L
121
PC1 PC2 PC3 PC4 PC5
s L s L s L s L s L
%N
Figura 7.24. Rede neural aps o corte dos neurnios desnecessrios, apenas dois
neurnios so suficientes para o modelamento.
122
RNP RN NNPLS PLS POLIPLS
10
6
Valor
% SEC % SEPC
Figura 7.25. Grfico de barras dos valores de % SEC e % SEP, para todos modelos
testados.
um dos modelos nos indica que a rede neural com apodizao (pruning) foi
redes neurais com pruning foi 5 % melhor que as redes neurais ordinrias,
123
de %SEPC, estatisticamente significativas, de modo a justificar a
classificao anterior ?
2
SEPi
F( p i , p j ) = eq.7.3
SEPj
Fcritical = 1,98
124
teste F, as redes neurais com pruning com o PLS Rede neural (F = 1.5) e
de confiana.
pruning (RNP), redes neurais (RN) e PLS rede neural (NNPLS). Na classe
125
RNP RN NNPLS PLS POLIPLS
2.4
2.2 FCritical = 1.98
2.0
1.8
Teste F 1.6
1.4
1.2
1.0
0.8
0.6
0.4
0.2
0.0
A B
Grupos
Figura 7.26. Grfico de barras dos valores de teste F, utilizados para a comparao da
desempenho dos modelos. (A) grupo de menores erros, (B) grupo de maiores erros.
trigo = [ 1 0 0 ]
milho = [0 1 0 ]
algodo = [ 0 0 1 ]
A rede neural utilizada para tal tarefa, foi treinada com o mtodo de
Marquardt-Levenberg e apresentava a arquitetura representada na Figura
7.27:
127
-Log(R/Ro)
0.38
0.36
0.34
0.32
0.30
0.28
0.26
0.24
1 2 3 4 ... 277
sigmoidal
sigmoidal
Trigo Milho Algodo
Figura 7.27. Representao da rede neural utilizada na classificao dos espectros. Esta
rede neural possui uma camada de entrada com 277 neurnios, uma camada intermediria
com oito neurnios e uma camada de sada com trs neurnios. A funo de transferncia
utilizada entre a camada de intermediria e a camada de sada foi a funo sigmoidal. Na
camada de sada, utilizou-se a funo sigmoidal.
128
7.8 Unindo classificao e modelamento
129
CAPTULO 8
CONCLUSES
8. Concluses
130
Neste trabalho podemos obter vrias concluses, umas ligadas s
tcnicas de pr-processamento e modelamento e outras ligadas aplicaes
prticas. Comeemos com aquelas ligadas s tcnicas de pr-processamento
e modelamento.
A partir dos resultados obtidos podemos concluir que se desejarmos
utilizar, com eficincia, a espectroscopia de reflectncia difusa no
infravermelho prximo (NIRR) para determinar nitrognio em folhas
devemos invariavelmente tratar o espectro obtido de modo a remover rudo
e espalhamento de luz; caso contrrio os erros de previso sero elevados.
Para remover o espalhamento de luz, devido s diferentes granulometrias das
amostras, devemos usar o mtodo MSC e, para remover o rudo, podemos
optar entre o filtro de Fourier e o filtro de Wavelets, visto que ambos
apresentaram desempenhos equivalentes.
A avaliao dos mtodos de modelamento fundamentada
simplesmente na comparao dos erros de previso, pode induzir a
concluses incorretas. Portanto, para avaliar o desempenho de mtodos de
modelamento, deve-se invariavelmente aplicar testes de significncia
estatstica, como por exemplo, o teste F.
Os mtodos de modelamento testados foram classificados em dois
grupos. Um grupo, com menores erros de previso, formado pelas redes
neurais com apodizao, redes neurais e PLS redes neurais e um segundo
grupo, com maiores erros de previso, formado pelo PLS e PLS polinomial.
Internamente a estes grupos no h diferenas significativas, no nvel de 95
% de confiana, entre os valores de % SEC e % SEPC.
Conforme descrevemos, os modelos baseados em redes neurais
apresentaram desempenhos significativamente superiores aos outros
mtodos de calibrao multivariada. Uma vez que, os trs mtodos baseados
em redes neurais no apresentaram diferenas significativas nos valores de
131
% SEPC, a opo por um deles deve ser feita considerando fatores como o
tempo computacional, a facilidade de implementao do mtodo, a
disponibilidade de softwares, etc. Entretanto podemos considerar que as
redes neurais com apodizao oferecem um maior potencial de aplicao em
calibrao multivariada que os demais mtodos, pois o seu uso no requer a
otimizao da arquitetura da rede neural e reduz significativamente a
possibilidade de overfitting. Alm disso, somente as redes neurais com
apodizao oferecem a possibilidade de diagnosticar e modelar dados,
independentemente das relaes de linearidade ou de no-linearidade entre
as variveis dependente e independentes.
Os bons resultados obtidos e a possibilidade de unificao entre
modelamento e classificao em um nico software tem incentivado a
substituio do tradicional mtodo Kjeldahl para anlise de nitrognio em
plantas pela metodologia desenvolvida neste trabalho, nos laboratrios de
rotina do INSTITUTO AGRNOMICO DE CAMPINAS (IAC).
132
CAPTULO 9
Referncias bibliogrficas
9. Bibliografia
1990.
133
[2] D. L. Wetzel, Anal. Chem. 55(12), 1165A (1983).
(1984).
3, 133 (1995).
(1995).
Chichester, 1989.
[22] A. L. Smith, Applied infrared Spectroscopy, John Wiley & Sons, New
York, 1979.
(1997).
135
[28] J. C. Miller e J. N. Miller, Statistics for Analytical Chemistry, Ellis
(1992).
[36] P. Bloomfield, Fourier Analysis of time series, John Wiley, New York,
1976.
Press, 1990.
Janeiro, 1982.
136
[40] G. B. Arfken e H. J. Weber, Mathematical Methods for Physicists,
[41] H. Eisberg e R. Resnick, Quantun Physics, John Wiley & Sons, New
York, 1986.
Philadelphia, 1993.
[45] B. Walczak, B. van der Bogaert e D. L. Massart, Anal. Chem. 68, 1742
(1996).
(1997).
1996.
137
[51] G. Strang, American Scientist, 82, 250 (1994).
(1985).
3973).
[63] B. Katz, Nerve Muscle e Synapse, MacGraw Hill, New York (1996).
(1990).
York, 1970.
em 1998.
neural network models, Proc. of the IEEE workshop on neural networks for
1997.
Campinas 1997.
[94] I. Kurtz, R. Dwelle e P. Katzka, Rev. Sci. Instrum., 58(11), 1996 (1987).
[97] Matlab, The Mathworks Inc., 24 primer Park Way, Natick, Mass., USA
(1995)
[98] H. Demuth e M. Beale, Neural Network Toolbox for use with Matlab,
141
[100] D. A. Skoog, F. J. Holler e T. A. Nieman,Principles of Instrumental
(1991).
142