You are on page 1of 2

Aprendizado Simblico de Mquina na Aquisio Automtica de Conhecimento em

Domnios Mdicos
Maria do Carmo Nicoletti 1; Flvia Oliveira Santos 1

1
Depto. de Computao - DC/UFSCar
Rodovia Washington Luiz, km 235 - 13565-905 - So Carlos (SP)

Resumo - Este artigo trata do uso de tcnicas simblicas indutivas de aprendizado automtico de mquina aplicadas a
domnios mdicos. Apresenta os paradigmas proposicional e relacional de aprendizado simblico indutivo e discute a
efetiva contribuio de tais mtodos no aprendizado de regras de diagnstico mdico.

Abstract - This paper describes the use of inductive symbolic techniques of automatic machine learning applied to
medical domains. It presents the propositional and relational paradigms of inductive symbolic learning and discusses the
effective contribution of these methods when learning medical diagnostic rules.

Introduo Para a representao dos exemplos do


conjunto de treinamento, os sistemas indutivos
Entre os vrios paradigmas existentes para proposicionais de aprendizado usam uma linguagem
aprendizado simblico tratado como uma rea de baseada em atributos. Um atributo uma possvel
pesquisa em Inteligncia Artificial, o chamado caracterstica relevante do conceito a ser aprendido;
aprendizado indutivo baseado em exemplos o que exemplos de treinamento so descritos como vetores de
tem sido mais largamente pesquisado e o que mais tem pares atributo-valor e de uma classe associada. Os
contribudo efetivamente para a implementao de conceitos induzidos so tipicamente expressos como
sistemas simblicos de aprendizado de mquina. A regras de produo ou rvores de deciso, que podem
partir de um conjunto de exemplos, chamado de ser tratadas como variaes de linguagens baseadas em
conjunto de treinamento, vrios tipos de conceitos, ou atributos.
regras de classificao, podem ser aprendidos como, Sistemas proposicionais, tais como o ID3,
por exemplo, diagnstico de doenas, previso de AQ, CN2 e derivados, tm sido utilizados com relativo
recorrncia de tumores, estimativa de sobrevida de sucesso nos mais variados domnios de conhecimento,
pacientes, previso meteorolgica, predio do mas principalmente no de diagnstico mdico. Um
comportamento de novos compostos qumicos, etc. A exemplo disso o nmero de arquivos de dados
aplicao mais bvia de aprendizado de mquina est mdicos para testes de novas verses, medidas e novos
na articulao de sistemas de aprendizado de mquina algoritmos de aprendizado de mquina disponveis
a mecanismos de aquisio de conhecimento, em junto ao UCI Repositrio de Dados1. Entretanto, a
sistemas baseados em conhecimento. Dependendo do limitao imposta pela linguagem proposicional e as
domnio e da disponibilidade de um conjunto de dificuldades na incorporao de qualquer
treinamento representativo, muitas vezes tcnicas de conhecimento do domnio no processo de induo do
aprendizado indutivo simblico podem ser usadas na conceito, pressionaram a pesquisa por formas mais
construo de bases de conhecimento de maneira mais poderosas de representao de conhecimento, dando
efetiva que as tradicionais tcnicas baseadas em origem rea de aprendizado simblico indutivo
entrevistas e/ou tcnicas semi-automticas para denominada de programao lgica indutiva (PLI). PLI
aquisio de conhecimento. uma rea relativamente recente e seus principais
resultados so a nvel terico. A adoo, por sistemas
Metodologia de PLI , de restries de lgica de primeira ordem para
a representao de exemplos e conceitos viabilizou a
De uma maneira geral um sistema que incorporao de teoria do domnio no processo
aprende a partir de exemplos recebe como dados indutivo de aprendizado, provocando, com isso, uma
informaes na forma de situaes especficas, cada expanso do universo de conceitos passveis de serem
uma delas devidamente classificada (geralmente por aprendidos, e.g, conceitos recursivos. Mesmo atravs
um especialista humano do domnio) e produz, como do uso restrito e controlado de expresses de lgica de
resultado, uma hiptese que generaliza aquelas primeira ordem, a tarefa de aprendizado pode se tornar
situaes inicialmente fornecidas. invivel, considerando as dimenses que o espao de
Sistemas simblicos de aprendizado de busca pode atingir. Pesquisas em PLI se concentram
mquina baseados em exemplos podem ser no controle do espao de busca, processo que pode
classificados com base na linguagem de representao parcialmente ser viabilizado atravs do controle da
de exemplos/conceitos utilizada, em sistemas linguagem utilizada2.
proposicionais e sistemas relacionais.

1
Resultados do conceito) deve ser cuidadosamente "pensado" e
preparado, de maneira que ele possa orientar o sistema
Os problemas tpicos do aprendizado precisamente na direo da expresso do conceito;
proposicional, alm daqueles inerentes prpria na dificuldade da definio pelo usurio, da teoria do
limitao da sua expressividade, so bem conhecidos e domnio, i.e., de um conjunto adequado de predicados
suas possveis solues, bem estudadas. Por exemplo, representativos, que sero utilizados como base para a
problemas relacionados a atributos multivalorados, a expresso daquele conceito. A esses problemas,
atributos com valores contnuos, com valores acrescente-se algumas limitaes na aplicao de
desconhecidos, com valores irrelevantes, memria sistemas de PLI, apontadas em Bratko5: falta de
disponvel versus nmero de exemplos, facilidade para o usurio controlar o processo indutivo
incrementabilidade, redundncia, dados com rudos, (e.g. poder especificar restries nos operadores de
etc. foram exaustivamente abordados e diversas refinamento); instabilidade dos resultados
solues poder ser encontradas na literatura. Entretanto (sensibilidade ao setup de parmetros e modos de
alguns domnios, particularmente domnios mdicos, operao).
caracterizam-se pela existncia de rudos inerentes que,
em alguns casos, dificilmente so eliminados, mesmo Discusso e Concluses
com uma cuidadosa preparao dos exemplos de
treinamento e utilizao de tcnicas disponveis para As tcnicas de aprendizado simblico
tratamento de rudos em sistemas proposicionais3. Em proposicional j esto consolidadas; o uso de sistemas
domnios mdicos, alguns dados so colecionados a que as implementam j fato. Apesar desse
partir da descrio da doena/sintoma feita s vezes de aprendizado ser limitado, sua contribuio e seus
memria pelo prprio paciente e interpretada por um limites so perfeitamente conhecidos. Entretanto,
mdico. Em muitos casos, tanto a descrio quanto a como visto, quando tais sistemas so utilizados na rea
interpretao so subjetivas e, conseqentemente, no mdica, alguns cuidados adicionais devem ser
confiveis. Esse poblema discutido em Lavrac et al 4, tomados. J sistemas de programao lgica indutiva,
onde descrito um experimento do aprendizado de em virtude de serem razoavelmente recentes, tm ainda
regras para diagnstico de doenas reumticas, em um longo caminho a percorrer, para se tornarem
estgio inicial. Nesse experimento, as efetivamente sistemas automticos de aquisio de
aproximadamente 200 doenas reumticas podiam ser conhecimento. Apesar de mais poderosos que os
agrupadas em 3, 6, 8 ou 12 classes de diagnstico. proposicionais, sua utilizao ainda exige um esforo
Oito classes foram escolhidas, por sugesto de um exagerado por parte do usurio, na preparao do
especialista. Notou-se, entretanto, que conjunto de exemplos e teoria de domnio apropriada.
aproximadamente 74% dos exemplos disponveis
pertenciam a duas dessas classes, restando s 6 outras Referncias
apenas 26%. Dos 462 registros de pacientes, apenas
16 pertenciam classe de doenas inflamatrias da 1
MURPHY, P.M.; AHA, D.W. UCI Repository of
espinha, por exemplo. Apesar dos problemas machine learning databases and domain theories,
associados confeco do conjunto de treinamento, o Irvine, University of California, Department of
aprendizado indutivo proposicional tem sido Information and Computer Science, 1994.
satisfatoriamente utilizado em domnios mdicos, 2
desde que considerados alguns pontos: o conjunto de NICOLETTI, M.C. Ampliando os limites do
treinamento deve ser representativo do domnio, tanto aprendizado indutivo de mquina atravs das
abordagens construtiva e relacional. Tese de
qualitativa quanto quantitativamente; tcnicas
Doutorado, IFSC/USP, 1994.
convencionais para tratamento de rudos devem
3
necessariamente ser aplicadas, caso contrrio, a GAMBERGER, D. Inductively learned rule for
tendncia a da gerao de um nmero grande de breast cancer domain with improved interobserver
regras, excessivamente especializadas e reproductibility. P. Barahona; M. Sefanelli; J. Wyatt
conseqentemente, com pouca utilidade; a aplicao (eds), Lecture Notes in AI 934, 1995, pp. 431-432.
de tcnicas de aprendizado de mquina a domnios 4
LAVRAC, N. et al. The utility of background
mdicos sofre um problema conhecido como problema
knowledge in learning medical diagnostic rules.
geogrfico, que geralmente impede a portabilidade de
Applied Artificial Intelligence 7, 1993, pp. 273-293.
conjuntos de regras entre regies/pases.
5
Por outro lado, pesquisas tm tentado BRATKO, I. Machine learning and qualitative
contornar as limitaes representacionais reasoning. Machine learning 14, 1994, pp. 305-312.
caractersticas do aprendizado proposicional, atravs
do uso de sistemas relacionais, tipicamente, os sistemas
Agradecimentos : FAPESP, pelo apoio financeiro.
de programao lgica indutiva. A difuso no uso de
tais sistemas tem esbarrado: na dificuldade de
definio e preparao do conjunto de exemplos pelo
usurio do sistema. O conjunto de exemplos (sempre
dividido em exemplos positivos e exemplos negativos

You might also like