You are on page 1of 5

XXIII Congresso Brasileiro em Engenharia Biomédica – XXIII CBEB

SEGMENTAÇÃO DOS MOVIMENTOS DA LARINGE COM APLICAÇÕES


EM SISTEMA BIOMECÂNICO

F. A. Zampirolli*, R. I. Cuzziol*, G. S. Marques* e L. R. Neves**

*Universidade Federal do ABC, Santo André, Brasil


**UNIFESP, São Paulo, Brasil

fzampirolli@ufabc.edu.br

Abstract: There are deficiencies in medical robotic som, e da pressão sub-glótica foram gravadas como
tools. For this reason, it is important to use tensão da prega vocal, largura glótica e a taxa de fluxo
monitoring and control systems of robots to de ar foram sistematicamente variados.
simulate the movements of the muscles of the Reznik [5], apresenta características anatômicas do
larynx. This work makes the segmentation of the trato respiratório superior de vários animais, incluindo o
movements of vocal folds of humans and pigs, do homem. Onde há um número grande de diferenças e
using a biomechanical system with LEGO NXT semelhanças macroscópico e microscópico entre as
kits. Calculus of measures to assist the study of the espécies.
behavior of the larynx are also presented. Este trabalho apresenta um procedimento para
utilização de algoritmos clássicos de processamento de
Palavras-chave: Segmentação de Imagens, Pregas imagens presentes nas bibliotecas do Matlab, para a
Vocais, Sistema Biomecânico, Robótica. análise dos movimentos da laringe, utilizando dados
concretos como área de abertura máxima e mínima,
Introdução momento de início da produção sonora e o tempo de
fechamento glótico de fonação. Com isso é possível
A avaliação e padronização do “ótimo” nas comparar os dados de uma laringe com um padrão.
análises pós-operatórias de laringes sempre foram
muito difíceis, pois a avaliação sonora pode se tornar Materiais e Método
subjetiva, a mensuração durante a fonação é complexa
e mesmo com uma sonorização correta os movimentos Utilizou-se o ambiente de programação Matlab [6]
musculares podem continuar errados causando rein- para o desenvolvimento do código para analisar os
cidência dos problemas [1]. Analisar os movimentos vídeos. Este ambiente possui versatilidade e grande
da laringe permite verificar distúrbios de vibração das capacidade de manipular imagens. Este trabalho de
pregas vocais e distúrbios da voz [2] e são importantes segmentação da laringe foi aplicado em três tipos de
temas apresentados na literatura. vídeos, como descritos a seguir.
Lohscheller, et al. [2], apresentam um procedi-
mento avaliado clinicamente para a reconstrução da I) vídeo da laringe humana – A partir de imagens
vibração das pregas vocais de endoscópicos digitais de laríngeas de paciente oriundo do Setor Interde-
alta velocidade de vídeos usando basicamente um partamental de laringologia e Voz da UNIFESP-EPM,
filtro de Threshold, porém com cálculos topológicos adquiridas por exame de laringoestroboscopia indireta
complexos para a reconstrução das pregas vocais. (Scott LC 960, Curitiba) convertidas para o formato AVI
Wurzbacher, et al. [3], apresentam um procedi- e aplicadas no modelo, segmentou-se as imagens
mento para a calibração de endoscópicos usando (frames ou quadros) do vídeo. Somente uma frequência
sequências de imagem em alta velocidade da laringe específica do “é” foi aplicada. As rotinas utilizadas do
por uma detecção automática de marcas usando Matlab para esta segmentação foram [7]: (1) níveis de
projeções paralelas de linhas de laser. Basicamente, cinza - após a captura de uma imagem do vídeo, usou-se
estes marcadores são obtidos a partir das reflexões do a rotina rgb2gray para converter a imagem RGB para
laser usando processamento de imagens. níveis de cinza do tipo byte (assumindo assim valores
Slavit e McCaffrey [4], apresentaram uma medida entre 0 e 255); (2) abertura morfológica - para suavizar
do padrão vibratória denominado Open Slope Quotient a imagem de um frame usando como função
(OSQ). O OSQ está relacionado com a velocidade de estruturante um quadrado 3x3; (3) Threshold - usou-se
abertura vocal e resistência da laringe e foi aplicada como limiar um valor próximo dos nível de cinza 40,
em uma laringe canina. OSQ também pode estar este valor foi obtido através de testes empíricos e deverá
relacionado à rigidez das pregas vocais. Este ser ajustado conforme a aquisição de outros vídeos; (4)
parâmetro é baseado na abertura máxima durante a criou-se um marcador central, considerando a laringe
abertura da glote. Utilizando um modelo de laringe localizada ao centro da imagem, e finalmente uma
excisada canina, as formas de onda, a intensidade do reconstrução a partir deste marcador para reconstruir a

1
XXIII Congresso Brasileiro em Engenharia Biomédica – XXIII CBEB

região das pregas vocais da laringe. Utilizando este Figura 3-(a) e 3-(c). Os gráficos das áreas versos os
procedimento simples e robusto, foi possível frames são apresentados na Figura 3-(b) e 3-(d),
segmentar os vídeos das laringesnda base de dados destacando estes frames correspondentes, em dois
apresentada neste trabalho. instantes (frames 129 e 154) antes da vibração das
Segundo Lohschellern et al. [2], especialistas clíni- cordas vocais.
cos formularam as especificações de sistema para a
análise de vídeos de alta velocidade de vibração das
pregas vocais: (1) segmentação glote robusto para
processar até mesmo filmes com qualidade baixa de
imagens; (2) identificações separadas das bordas
esquerda e direita da prega vocal, considerando a
orientação apresentada na Figura 1; (3) alta precisão
de detecção de bordas; (4) tempo de computação
reduzido; e (5) intervenção mínima do usuário.

II) vídeo da laringe humana de alta velocidade –


Assim, este trabalho apresenta também a segmentação Figura 1: a) Pregas vocais com a maior abertura; b)
das bordas da laringe humana usando um vídeo de alta Pregas vocais no início da produção sonora.
resolução, através de poucas rotinas da toolbox de
processamento de imagens do Matlab, descritas no
item I anterior.

III) vídeo da laringe do porco – Finalmente,


inspirado nas análises anteriores das laringes humanas,
este trabalho também faz a segmentação dos
movimentos de uma laringe do porco utilizando um
sistema biomecânico, descrito em [1], usando dois kits
LEGO NXT [8], veja Figuras 6 e 7. Neste sistema foi
analisado também o comportamento dos movimentos
de uma laringe canina. Esta pesquisa foi submetida ao
Comitê de Ética em Pesquisa da Universidade Federal
de São Paulo, sendo aprovada e recebendo o número Figura 2: Gráfico da área segmentada versos um frame
1647/09. Porém, neste artigo analisamos somente os do vídeo, apresentando os pontos de máximo e mínimo
vídeos obtidos pela laringoestroboscopia de pacientes da Figura 1.
humanos e os vídeos da laringe do porco.

Resultados

I) vídeo da laringe humana – Segmentando


somente a abertura das pregas vocais da laringe
determinou-se a abertura máxima e mínima, e com
isso, conseguiu-se calcular o “momentum” em que as
pregas vocais começam a produção sonora e a
velocidade de aproximação e vibração das mesmas.
Assim, com estas segmentações das imagens define-se (a) (b)
o momento de repouso (Figura 1a) havendo a
determinação do espaço glótico através da quantidade
de pixels na área segmentada de abertura.
Posteriormente define-se o instante em que não há
mais adução das pregas vocais e começa o movimento
de produção sonora laríngea (Figura 1b).
De posse desses dois parâmetros apresentados na
Figura 1, realizou-se o cálculo de velocidade de
fechamento glótico. A Figura 2 apresenta um gráfico (c) (d)
das áreas destas segmentações versos os frames do
vídeo. Figura 3: Segmentação de vídeo de alta resolução em
dois instantes diferentes: (a) imagem do frame 129 e (c)
II) vídeo da laringe humana de alta velocidade – 154. Os gráficos (b) e (d) apresentam as áreas versos os
Aplicando a mesma metodologia em um vídeo de alta frames.
velocidade, obtém-se as segmentações apresentadas na A Figura 4 apresenta o gráfico das áreas da

2
XXIII Congresso Brasileiro em Engenharia Biomédica – XXIII CBEB

abertura/fechamento da laringe versos o frame do


vídeo de alta resolução. Já a Figura 5 apresenta o
gráfico da velocidade de abertura/fechamento
correspondente.

Figura 4: Gráfico apresentando a área da


abertura/fechamento da laringe versos o frame do
vídeo de alta resolução.

Figura 6: Apresenta a estrutura para suportar os dois kits


LEGO NXT, com 6 servo motores, três em cada bloco
NXT. Veja um vídeo destes movimentos em [9].

Figura 5: Gráfico apresentando a velocidade da


abertura/fechamento da laringe.

Essas informações poderão ajudar o médico


otorrinolaringologista a realizar diagnóstico e indicar
um melhor tratamento ao paciente.
Figura 7. Laringe fixa em um sistema biomecânico, veja
III) vídeo da laringe do porco – Agora, em [1] foi um vídeo em [10].
construído um sistema biomecânico para simular os
movimentos de laringes. A Figura 6 apresenta a Realizando segmentações neste vídeo apresentado
estrutura para suportar os seis tipos de movimentos na Figura 7, foi possível calcular várias medidas da
dos músculos, um para cada motor do kit LEGO NXT. abertura/fechamento da laringe, conforme a tensão
Ao centro é fixado a laringe, como apresentado na aplicada em cada músculo. Alguns exemplos são
Figura 7. apresentados na Figura 8 e na Tabela 1.

3
XXIII Congresso Brasileiro em Engenharia Biomédica – XXIII CBEB

• Comprimento do maior eixo: o maior eixo da elipse


que pode ser desenhada dentro do segmento;
• Comprimento do menor eixo: o menor eixo da elipse
que pode ser desenhada dentro do segmento;
• Orientação: ângulo formado entre o menor e o maior
eixo da elipse;
• Área convexa: a menor área convexa que consegue
contornar o segmento;
• Excentricidade: razão entre a distância dos focos da
frame 1460 elipse com o maior eixo;
• Diâmetro equivalente: diâmetro da circunferência
com área igual ao do segmento;
Á
• Extend: ;

á
• Solidity: ;
á

Outras medidas encontradas em [12] foram usadas:


∗ ∗Á
frame 170 • FormFactor: ;
í
Á
• Roundness: 4 ∗ ;
∗ ²

• AspectRatio: ;

• Convexity: .
í

Tabela 1: Cálculo das medidas para três frames, da


Figura 8.

frame 960 Frame 170 960 1460


Centroid_x 404 341 265
Figura 8. Segmentação de três frames diferentes do
vídeo apresentado na Figura 7, destacando o contorno Centroid_y 262 233 240
das pregas vocais. Após esta segmentação são calculas AreaBox 58548 67580 3264
várias medidas, sendo destacados o retângulo externo Area 30496 38728 2126
e o centroide.
Perimeter 1090 1046 426
Com os segmentos binários das pregas vocais da MajorAxisLength 417 393 222
laringe do porco, obteve-se várias medidas
MinorAxisLength 99 133 13
morfológicas da abertura/fechamento. Foram
utilizados 16 tipos de medidas. Uma parte dos Orientation -3 -3 0
algoritmos de medidas é encontrada na biblioteca de ConvexArea 33002 40245 2356
processamento de imagem do Matlab, usando a função
Eccentricity 0.97148 0.94077 0.99821
regionprops, outras foram desenvolvidas. Segue lista
de medidas usadas e as descrições [11]: EquivDiameter 197 222 52
Extent 0.52636 0.57812 0.69819
• Centroid: centróide do segmento;
Solidity 0.92407 0.96231 0.90238
• AreaBox: área do retângulo externo do segmento, FormFactor 0.32255 0.44481 0.14722
calculada usando BoundingBox;
Roundness 0.2233 0.31926 0.05492
• Área: quantidade de pixels do segmento; AspectRation 4.2145 2.9507 16.7365
• Perímetro: comprimento de contorno do segmento; Convexity 0.89908 0.85851 0.97653

4
XXIII Congresso Brasileiro em Engenharia Biomédica – XXIII CBEB

Discussões [6] MATLAB technical documentation. Disponível em


http://www.mathworks.com. Acessado em 20 de maio de 2012.
[7] William K. Pratt – Digital Imagem Processing. New York, 1991.
Todas as 16 medidas apresentadas na seção
[8] LEGO MINDSTORMS NXT. Disponível em
anterior podem ser utilizadas para as classificações http://mindstorms.lego.com. Acessado em 6 de junho de 2012.
dos vários estados das pregas vocais, de vários tipos [9] Zampirolli, F. A., Neves, L. R., Marques, G. S. e Cuzziol, R. I.
de laringe, semelhante ao que foi realizado em [11], Vídeo ilustrando os motores para o movimento da laringe em
onde se classificou dois tipos de tecido humano. sistema biomecânico. Disponível em:
Desta forma, este trabalho contribui fornecendo http://youtu.be/RmFnYH_NmlI. Acessado em 12 de junho de
2012.
um arcabouço de medidas e um sistema para ser
[10] Neves, L. R., Zampirolli, F. A., Marques, G. S. e Cuzziol, R. I..
utilizado no auxílio em cirurgias, fornecendo um Vídeo ilustrando o movimento da laringe em sistema
padrão de comportamento para movimentos biomecânico. Disponível em: http://youtu.be/dCnInNXyrd8.
específicos dos músculos das laringes, afetando Acessado em 12 de junho de 2012.
diretamente as aberturas das pregas vocais, e [11] Zampirolli, F. A., Stransky,B., Lorena,A. C., Paulon, F. L. M.
consequentemente da fonação da laringe. Segmentation and classification of histological images -
application of graph analysis and machine learning methods –
Além disso, este trabalho contribui no estudo do SIBGRAPI, 2010.
comportamento dos músculos da laringe, fornecendo [12] Chang, R. F., Wu, W.J., Moon W. K. and Chen, D. R.Automatic
aos estudantes uma ferramenta didática e de baixo ultrasound segmentation and morphology based diagnosis of
curto. solid breast tumors, Breast Cancer Research and Treatment, vol.
89, pp. 179–18, 2005.
Como trabalhos futuros, é possível adaptar o
sistema de segmentação, fornecendo ao sistema
biomecânico da laringe um retorno em tempo real das
tensões aplicadas pelos motores dos kits LEGO NXT.
Além disso, é possível adaptar o software que
controla o sistema biomecânico para ser operado
remotamente pela internet. Desta forma pessoas de
qualquer parte poderiam ver a parte de segmentação e
manipular os motores do sistema biomecânico.

Conclusão

Foi apresentado neste artigo um procedimento para


utilização de algoritmos clássicos de processamento
de imagens presentes nas bibliotecas do Matlab, que
são usados para obter medidas que podem ser
utilizadas para o auxílio das cirurgias em laringes e em
exames de laringoestroboscopia em humanos. Além
disso, através deste procedimento é possível calcular
16 medidas distintas da segmentação das pregas focais.
Estas medidas foram calculadas usando um sistema
biomecânico da laringe do porco, permitindo a
obtenção de dados objetivos quanto às características
da movimentação das pregas vocais.

Referências
[1] Neves, L. R. Modelo biomecânico computadorizado aplicado
em laringes caninas. Tese de doutorado, Universidade Federal
de São Paulo, UNIFESP, 2010.
[2] Lohscheller, J, et al. Clinically evaluated procedure for the
reconstruction of vocal fold vibrations from endoscopic digital
high-speed videos. Medical Image Analysis, 11, 400–413,
2007.
[3] Wurzbacher, T., et al. Calibration of laryngeal endoscopic
high-speed image sequences by an automated detection of
parallel laser line projections, Medical Image Analysis, 12,
300–317, 2008.
[4] Slavit, D. H. e McCaffrey, T. V., Open Slope Quotient: A
New Glottographic Parameter, Journal of Voice, Vol. 9, No.1,
pág. 86-94, New York, Raven Press Ltd., 1995.
[5] Reznik,G. K., Comparative Anatomy, Physiology, and
Function of the Upper Respiratoy Tract, Environ Health Persp,
Vol. 85, pág. 171-176, 1990.

You might also like