Professional Documents
Culture Documents
So Paulo
2011
VALRIA FARINAZZO MARTINS
So Paulo
2011
VALRIA FARINAZZO MARTINS
So Paulo
2011
DEDICATRIA
Ao Prof. Dr. Lincoln de Assis Moura Jr. pelo grande apoio, incentivo, pacincia e
orientao em todo o desenvolvimento deste trabalho e pela contribuio para a minha
carreira acadmica e profissional. Sem ele, eu no teria chegado at aqui.
Ao Hospital Edmundo Vasconcelos, sobretudo ao Prof. Dr. Claudio Campi de Castro por
sempre ser to prestativo e apoiar a minha pesquisa, desde a fase de qualificao.
minha amiga Ana Grasielle Dionsio Corra que participou, efetivamente, como
especialista de usabilidade nas inspees e testes de usabilidade. Agradeo tambm
por todo o apoio e amizade em muitos momentos.
Ao prof. Pericles Prado Turnes Jr., pelo auxlio e crticas, sempre construtivas, na
anlise dos dados das avaliaes. E pelo apoio e amizade sempre presentes.
Ao Prof. Dr. Leandro Zerbinatti pelo material cedido para os testes de usabilidade.
A todas as pessoas que, de uma forma direta ou indireta, contriburam para que fosse
possvel que eu alcanasse este objetivo tanto no plano acadmico e profissional
quanto pessoal.
...Que ningum se engane,
s se consegue a simplicidade
atravs de muito trabalho.
Clarice Lispector
RESUMO
Este trabalho relaciona elementos das reas de Computao e Sade para comporem
a elaborao de uma metodologia para avaliao de usabilidade de sistemas de
transcrio automtica de laudos na rea de Radiologia. Inicialmente, apresentado
um estudo realizado sobre a rea de Interface do Usurio Baseada em Voz que
identifica requisitos para os sistemas que trabalham com comunicao mediada por voz
assim como as iniciativas no sentido de se criar uma metodologia para sua avaliao.
Em seguida realizado um estudo dos sistemas de transcrio automtica de laudos,
no qual os principais requisitos so caracterizados e classificados. Os dois estudos
acima citados foram integrados para a elaborao de uma metodologia para a avaliao
de Sistemas de Transcrio Automtica de Laudos em Radiologia. A metodologia foi,
ento, validada previamente atravs de inspees e testes de usabilidade realizados
fora do ambiente hospitalar, atravs do uso de um sistema de transcrio automtica de
laudos em Radiologia. Posteriormente, a metodologia foi tambm aplicada a um
hospital da cidade de So Paulo. Como resultado principal foi proposto um guia
bastante detalhado para se avaliar os Sistemas de Transcrio Automtica de Laudos
em Radiologia, cada vez mais presentes em hospitais e clnicas no pas, alm dos
relatos das experincias obtidas com a aplicao desta metodologia em um caso real.
This work combines knowledge from Computer Science and Health Science in order to
to propose an evaluation methodology for Automatic Transcription System of Radiology
Reports. At first a study regarding a Voice User Interface is presented, this interface
identifies the requirements for Spoken Language Dialogue Systems and it can also be
used as a tool for an evaluation methodology. Following, a study of automatic
transcription systems is presented; in this study the main requirements are listed and
classified. Both studies were integrated to allow a new methodology to evaluate an
Automatic Transcription System in Radiology. This methodology was previously
validated through some inspections and usability tests outside the hospital environment
and afterword the methodology was used in a hospital in So Paulo city. As a main
result it was proposed a very detailed guide for evaluating the Automatic Transcription
Systems Reports in Radiology, increasingly found in hospitals and clinics in this country,
apart from reports on experiences gained in applying this methodology in a real case.
TI Tecnologia da Informao
ABSTRACT ...................................................................................................................... 9
LISTA DE ILUSTRAES ............................................................................................. 10
LISTA DE TABELAS ...................................................................................................... 11
LISTA DE GRFICOS .................................................................................................... 12
LISTA DE QUADROS .................................................................................................... 13
LISTA DE ABREVIATURAS ........................................................................................... 16
SUMRIO....................................................................................................................... 17
1. INTRODUO .......................................................................................................... 20
1.1 Consideraes iniciais ......................................................................................... 20
1.2 Objetivos da Pesquisa ......................................................................................... 23
1.3 Motivaes e Justificativas .................................................................................. 25
1.4 Mtodos da Pesquisa .......................................................................................... 27
1.5 Organizao do Trabalho .................................................................................... 28
2. INTERFACE DO USURIO BASEADA EM VOZ ..................................................... 30
2.1 Interface Homem-Computador (IHC) ................................................................... 30
2.1.1 Requisitos de Interface ...................................................................................... 30
2.1.2 Tipos de Interfaces ............................................................................................ 32
2.1.3 Independncia de dilogo .................................................................................. 34
2.2 Definio.............................................................................................................. 35
2.3 Principais Diferenas entre Interfaces Grficas e interfaces do usurio baseadas
em voz ........................................................................................................................ 37
2.4 Arquitetura de um Sistema Baseado em Interface de Voz .................................. 39
2.4.1 Mdulo de Ponto de Finalizao ........................................................................ 41
2.4.2 Mdulo de Extrao de Caractersticas ............................................................. 42
2.4.3 Mdulo de Reconhecimento de Voz .................................................................. 42
2.4.4 Mdulo de Compreenso da Linguagem Natural .............................................. 44
2.4.5 Mdulo Gerenciador de Dilogo ........................................................................ 45
2.5 Sintetizao de Voz ............................................................................................. 45
2.6 Vantagens e Dificuldade no Uso de VUI.............................................................. 46
2.7 Questes Tcnicas .............................................................................................. 49
2.8 Consideraes Finais .......................................................................................... 50
3. AVALIAO DE USABILIDADE ............................................................................... 51
3.1 Definio.............................................................................................................. 51
3.2 Mtodos Tradicionais de Avaliao de Usabilidade de Interfaces ....................... 54
3.2.1 Mtodos de Inspeo de Usabilidade ................................................................ 54
3.2.2 Testes de Usabilidade ....................................................................................... 58
3.2.3 Comparao entre os Mtodos de Avaliao de Usabilidade ............................ 60
3.3 Consideraes Finais .......................................................................................... 60
4. USABILIDADE DE INTERFACES DO USURIO BASEADAS EM VOZ .................. 62
4.1 Contextualizao ................................................................................................. 62
4.2 Avaliao de VUI Ideia inicial ........................................................................... 63
4.3 Requisitos no funcionais para Interface do Usurio Baseada em Voz .............. 63
4.3.1 Requisitos no-funcionais relacionados representao da informao .......... 64
4.3.2 Requisitos no-funcionais relacionados entrada de dados ............................. 66
4.4 Caractersticas da Qualidade em Interface do Usurio Baseada em Voz ........... 69
4.5 Mtricas para a Avaliao de Usabilidade para Interface do Usurio Baseada em
Voz 73
4.6 Consideraes Finais .......................................................................................... 77
5. INTERFACE DO USURIO BASEADA EM VOZ PARA SISTEMAS DE
INFORMAO RADIOLGICA ..................................................................................... 78
5.1 Consideraes Iniciais ......................................................................................... 78
5.2 Sistemas de Transcrio Automtica de Laudos ................................................. 80
5.3 Funcionamento de um Sistema de Transcrio Automtica de Laudos .............. 83
5.4 Consideraes Financeiras ................................................................................. 85
5.5 Requisitos de um Sistema de Transcrio Automtica de Laudo ........................ 86
5.6 Consideraes Finais .......................................................................................... 89
6. METODOLOGIA DE AVALIAO DE INTERFACES DE VOZ PARA A REA DA
SADE SISTEMAS DE TRANSCRIO AUTOMTICA DE LAUDO ........................ 90
6.1 Introduo............................................................................................................ 90
6.2 Objetivos da Metodologia Utilizada ..................................................................... 91
6.3 Agrupamento dos Requisitos em Classes ........................................................... 91
6.4 Classificao dos Requisitos quanto Dificuldade de Avaliao ........................ 93
6.5 Requisitos Selecionados ..................................................................................... 94
6.6 Mtodo de Avaliao para cada Requisito Selecionado ...................................... 97
6.7 Consideraes Finais ........................................................................................ 107
7. APLICAO DA METODOLOGIA A SISTEMAS J IMPLANTADOS .................... 108
7.1 Descrio dos sistemas utilizados ..................................................................... 109
7.2 Planejamento da Inspeo do Sistema Stand-alone ......................................... 115
7.3 Planejamento das Observaes dos Usurios Finais em Ambiente de Produo
.159
7.4 Discusses sobre os resultados dos testes ....................................................... 168
8. CONCLUSES ....................................................................................................... 173
8.1 Aspectos Gerais do Trabalho ............................................................................ 173
8.2 Contribuies do Trabalho................................................................................. 176
8.3 Trabalhos Futuros ............................................................................................. 182
REFERNCIAS BIBLIOGRFICAS ............................................................................. 184
APNDICES E ANEXOS ............................................................................................. 194
APNDICE A - QUESTIONRIO DE SATISFAO DE USURIOS DE .................... 195
SISTEMAS DE TRANSCRIO DE LAUDOS EM RADIOLOGIA ............................... 195
APNDICE B - CARTA DE APRESENTAO PARA OS ........................................... 198
PARTICIPANTES DO TESTE ...................................................................................... 198
APNDICE C AUTORIZAO PARA O USO DE IMAGEM E SOM ........................ 200
APNDICE D PLANO DO OBSERVADOR ............................................................... 202
APNDICE E - RESULTADOS DA APLICAO DO QUESTIONRIO ...................... 205
APNDICE F - PLANO DE OBSERVAO PARA O USO DO SISTEMA DE
TRANSCRIO AUTOMTICA DE LAUDOS EM RADIOLOGIA................................ 208
ANEXO A - TABELA DE REFERNCIA DE INTERFERNCIA SONORA .................. 211
DESEJVEL PARA AMBIENTES ................................................................................ 211
ANEXO B - LAUDOS UTILIZADOS NOS TESTES E INSPEES ............................. 213
DE USABILIDADE ........................................................................................................ 213
20
1. INTRODUO
Este trabalho relaciona elementos das reas de Computao e Sade para comporem a
elaborao de uma metodologia para avaliao de usabilidade de sistemas de transcrio
automtica de laudos na rea de Radiologia.
Nos ltimos anos, a rea de IHC tem se desenvolvido e um grande esforo tem sido
empregado em relao a questes de projeto e avaliao de interfaces no convencionais,
tais como em Realidade Virtual, Realidade Aumentada, Interfaces por Gestos e Interface do
Usurio Baseada em Voz, do ingls Voice User Interface.
21
A origem das Interfaces do Usurio Baseadas em Voz se deu nos anos 50, quando
pesquisadores vislumbraram a voz como forma de comunicao entre o humano e a mquina.
Afinal, desde que a fala constitui a principal interface para a comunicao entre pessoas, era
de se esperar que essa forma natural de interao entre seres humanos fosse pensada como
interao entre homens e mquinas.
1
O termo domnios restritos est sendo empregado aqui como sub-reas do conhecimento, que trabalham com um conjunto
finito de palavras em seu vocabulrio. Como exemplo, a rea de Radiologia uma sub-rea da Sade, e os seus
especialistas trabalham com uma fatia bem menor de termos do que os 100 mil termos da rea Mdica e 60 milhes de
possibilidades de diagnsticos presentes no SNOMED (07/03/09).
22
Ainda vale destacar que poucos trabalhos tem se voltado para o estudo de metodologias de
avaliao para esta classe de aplicaes. O conhecimento atual sobre avaliao de Voice
User Interface (VUI) advm de pequenas contribuies de avaliaes que foram
desenvolvidas para projetos especficos, e que tentam generalizar e propor recomendaes
para tais classes de aplicaes, como PARADISE (WALKER et al, 1997), EAGLES (GIBBON;
MOORE; WINSKI, 1997) e DISC (DYBKJAER; BERNSEN, 2000).
Assim, a tecnologia de reconhecimento de voz tem sido usada para propsitos mais
especficos, tais como em sistemas de ditado como, por exemplo, sistemas de transcrio
automtica de laudos2; sistemas com unidades de resposta audvel baseados em voz (IVR);
sistemas para controlar equipamentos mdicos, e sistemas para interpretao de linguagem
(DURLING; LUMSDEN, 2008). Isto significa que o vocabulrio consideravelmente menor,
proporcionando uma preciso mais alta no reconhecimento dos termos especficos.
Porm, muito pouco tem sido explorado em questo da avaliao destes sistemas de voz
para uso em domnio restrito na rea da Sade. No h trabalhos suficientes na literatura que
estabeleam os requisitos especficos da rea que devem ser atendidos de forma a tornar o
uso de reconhecimento de voz efetivo e eficaz.
2
O termo laudo radiolgico ou laudo em Radiologia um documento, em que so mencionadas a tcnica utilizada e as
possveis intercorrncias durante o procedimento. A descrio dos achados deve ser redigida de forma sucinta e completa, e
quando o diagnstico seguro, terminar com uma impresso/concluso (FENELON, 2003). Exemplos de laudos podem ser
visualizados na Anexo B deste trabalho.
23
Os sistemas que utilizam reconhecimento de voz na rea da Sade, no so, na sua grande
maioria, analisados seguindo mtodos mais completos e complexos e bem-estabelecidos de
avaliao de usabilidade. Alm disto, algumas avaliaes de usabilidade para esta classe de
aplicaes so focadas apenas no desempenho do reconhecimento de voz num contexto
particular do ambiente, enquanto outras avaliaes se voltam para a usabilidade de um
sistema todo, em que o reconhecimento de voz apenas um dos aspectos (DURLING;
LUMSDEN, 2008).
A elaborao desta metodologia tem o intuito de poder ser utilizada como um guia para
hospitais e clnicas mdicas que desejem comprar sistemas de transcrio automtica de
laudos em Radiologia, o prprio desenvolvimento deste sistema ou customizaes e, que
estejam preocupados, tanto com a usabilidade quanto pela aceitabilidade destes sistemas por
seu corpo de mdicos radiologistas.
Tal plano deve incluir o estudo e o estabelecimento de mtricas de usabilidade a partir dos
atuais requisitos de interface - criados principalmente para atender s interfaces grficas (GUI)
-, de requisitos prprios para interfaces do usurio baseadas em voz e o estudo e a
metrificao de requisitos especficos, definidos e estudados, de sistemas de transcrio
automtica de laudos em radiologia. Assim, os objetivos especficos deste trabalho so:
7. Estabelecer outros requisitos para VUI em RIS que forem julgados pertinentes.
11. Escolher o mtodo de avaliao apropriado para cada requisito escolhido, levando em
considerao fatores como eficincia, tempo e custo.
17. Apresentar trabalhos futuros que possam ser desenvolvidos a partir desta pesquisa.
Um dos principais problemas apontados na literatura (WHITE, 2005; KANAL et al, 2001;
BHAN et al, 2008; HUNDT et al, 1999; DURLING; LUMSDEN, 2008; GOPAKUMAR et al,
2008; KIMBERLY, 2006) a demora da disponibilizao dos laudos de Radiologia devido ao
tempo gasto entre o envio de laudos gravados e seu retorno de forma textual para a avaliao
do radiologista (TAT Tournaround Time).
Os sistemas de transcrio automtica de laudos (que utilizam VUI) tm sido cogitados como
soluo para diminuir este tempo (TAT) e tambm como redutor dos custos globais dos
departamentos de Radiologia. Porm, para se verificar a eficcia de se utilizar sistemas de
transcrio automtica de laudos, preciso avaliar se os requisitos gerais de VUI e tambm
os requisitos especficos da rea esto sendo tratados de maneira correta nos produtos
disponveis no mercado.
Por outro lado, a maioria dos sistemas de VUI encontrados na literatura trata de sistemas de
consultas a determinadas informaes vindas de uma base de dados. So, assim, sistemas
relativamente simples de reservas de passagens areas, reserva de hotis, consulta de
horrios de vos, e similares. Desta maneira, possuem um vocabulrio pequeno, com uma
interao entre o usurio e a mquina bastante grande (dilogo). Muitos pesquisadores
(WALKER; PASSNNEAU; BOLAND, 2001; MLLER, 2002; MLLER 2005; LARSEN, 2003;
HARTIKAINEN; SALONEN; TURUNEN, 2004) tm proposto mtodos e metodologias para
avaliar a usabilidade destes sistemas mais simples. Porm, avaliar os sistemas de transcrio
automtica de laudos uma tarefa relativamente diferente, desde que:
O dilogo entre o usurio e o sistema bem menor, visto que o sistema deve apenas
transcrever (gerar um texto) a partir da fala do usurio, sem haver consultas a serem
realizadas e informadas ao usurio.
A qualidade das mensagens de sada e a adequao das frases de sada devem ser
substitudas pela preciso do texto.
1. Falhas no laudo causadas por erros no reconhecimento das palavras podem ser
desastrosas para os pacientes, pois podem significar um diagnstico equivocado.
27
2. Como criar uma metodologia que leve em considerao os principais requisitos para
este tipo de sistema.
b) Quais os requisitos especficos dos sistemas de laudo automtico que devem ser
considerados para esta avaliao;
e) Como avaliar estes sistemas de uma maneira vivel, com custos e tempos
aceitveis para a instituio da sade;
Sendo assim, h que se propor uma metodologia para avaliao destes sistemas que
considere estas questes particulares.
Ao final, foi realizada uma pesquisa de campo por corresponder coleta direta de informao
no ambiente em que a tcnica pode ser usada. Segundo Marconi e Lakatos (2007), pesquisa
de campo aquela que realizada fora do laboratrio, no prprio ambiente no qual as
ocorrncias so geradas.
Desta forma, a fim de se alcanar os objetivos gerais e especficos propostos neste trabalho,
as seguintes atividades foram realizadas:
Percebeu-se que um nome mais apropriado para esta tese poderia envolver o termo
metodologia, pois, na verdade, trata-se de uma metodologia proposta pela autora para
avaliar os sistemas de transcrio de laudos em Radiologia.
Segundo Myers (1995), a pesquisa em IHC estuda como as pessoas projetam, implementam
e usam sistemas computacionais interativos e como os computadores afetam o indivduo, as
organizaes e a sociedade. Isto abrange no s a facilidade de uso, mas tambm novas
tcnicas de interface para dar suporte s tarefas dos usurios, fornecendo um melhor acesso
informao e criando formas mais poderosas de comunicao. Ela envolve dispositivos de
entrada e sada (E/S) e tcnicas de interao que os usam; como a informao apresentada
e requisitada; como os processos computacionais so controlados e monitorados; todas as
formas de ajuda, documentao e treinamento; as ferramentas usadas para projetar, construir,
testar e avaliar as interfaces do usurio; e os processos que os desenvolvedores seguem para
criar interfaces.
Liang (1987), Fischer (1990) e Rocha e Baranauskas (2003), estabeleceram que para se obter
uma boa interface, necessrio que certos requisitos sejam atendidos:
Foley e Van Dan (1990) e Nielsen (1993) destacam as principais metas a serem atingidas, ao
se desenvolver uma dada IHC:
WYSIWYG (What you see is what you get): Neste tipo de interface, a representao
com que o usurio interage nas telas de interface basicamente a mesma que a
imagem final criada pela aplicao. A maioria das aplicaes interativas possui algum
componente nesta representao. Por exemplo, um editor de texto que imprime uma
letra em negrito tambm a mostra neste formato em vdeo.
33
Interface Grfica com o Usurio (GUI): Conforme Vavassori (1995), as formas de IHC
evoluram de comandos textuais para mecanismos de interao avanados, tais como
grficos e objetos tridimensionais, oferecendo suporte a uma ampla variedade de
caractersticas. Vrios benefcios foram trazidos com a interface grfica:
o Acesso Direto Um objeto grfico pode ser considerado como um objeto atmico
com facilidade de ser enfocado. Utilizando-se variaes de forma, cor e tamanho,
pode-se tornar fcil atrair o usurio para a rea de interesse.
Porm, h, atualmente, vrios outros tipos de interface que no se enquadram nestas quatro
categorias supracitadas, as chamadas interfaces no-convencionais, entre as quais possvel
citar as interfaces touch-screen e as interfaces do usurio baseadas em voz (que sero vistas
na prxima seo).
Dilogo Interno
Componente de Componente de
Usurio Dilogo Computao
(Interface) (Aplicao)
Sistema Interativo
Dilogo
Externo
Como se sabe, a interface responsvel pela comunicao com o usurio, o que chamado
de dilogo externo. J a aplicao responsvel pela execuo das tarefas requisitadas pelo
usurio atravs da interface. Entre a interface e a aplicao estabelecido o dilogo interno.
2.2 Definio
Interface do usurio baseada em voz, em ingls Voice User Interface (VUI) ou Speech User
Interface (SUI), consiste na interao de uma pessoa com um sistema atravs de voz,
utilizando uma aplicao de linguagem falada (SHNEIDERMAN, 2000).
Este tipo de interface inclui elementos tais como: prompts ou mensagens do sistema,
gramticas e lgica de dilogo ou fluxo de chamada (call flow). Os prompts so todas as
mensagens de voz pr-gravadas ou sintetizadas que devem ser executadas durante o dilogo
com o usurio. Gramticas definem todas as palavras, sentenas ou frases que podem ser
ditas pelo usurio em resposta a um prompt. A lgica de dilogo define todas as aes a
serem tomadas pelo sistema em determinado ponto da interao, tais como um acesso
base de dados (COHEN; GIANGOLA; BALOGH, 2004).
SISTEMA: [Nome da empresa] Bom dia. Com quem voc deseja falar?
USURIO: Eu gostaria de falar com Valria Farinazzo.
SISTEMA: Desculpe-me, voc gostaria de falar com Valria Farinazzo?
USURIO: Sim.
SISTEMA: Estamos transferindo sua chamada para Valria Farinazzo. Obrigado.
Neste exemplo, uma locutora gravou todas as possveis falas do sistema. Aps o prompt
Bom dia. Com quem voc gostaria de falar? o sistema ouve, usando uma gramtica que
ajusta entradas do usurio com o nome da pessoa da empresa; como o reconhecimento no
atingiu uma taxa considerada segura, o sistema pede a confirmao Desculpe-me, voc
gostaria de falar com seguido do nome da pessoa que possivelmente o sistema entendeu.
Dada a confirmao, o sistema reproduz a mensagem Estamos transferindo sua chamada
para.. acompanhado do nome da pessoa e conecta o udio das duas pessoas.
37
Interfaces audveis so as que interagem somente atravs do som tipicamente, uma entrada
falada (sonora) do usurio e uma sada falada (sonora) ou no-falada do sistema. As sadas
no-faladas (Nonverbal audio - NVA, em ingls) podem ser na forma de earcons (cones
audveis, ou sons projetados para comunicar um significado especfico por exemplo, o aviso
de que um amigo est online), msica de fundo ou ambiental (para criar uma sensao) ou
outros sons de fundo (CHAMBERLAIN et al, 2006; OLIVEIRA NETO; SALVADOR, 2007).
Uma das principais questes relacionadas voz para interfaces que ela mais transiente
do que esttica, ou seja, o usurio deve obter a informao no momento em que esta
informao fornecida - no h uma tela para visualizar a informao. No existe a
oportunidade de rever as sadas do sistema ao seu prprio ritmo. O ritmo totalmente
controlado pelo sistema. Se a interface no for muito evidente em todos os seus caminhos, o
usurio ter que aprender atravs de tentativa-e-erro, tornando o sistema insatisfatrio
(DYBKJAER; BERNSEN, 2001). Portanto, a natureza efmera das interfaces audveis exige
um esforo cognitivo significativo do usurio. O projetista desse tipo de interfaces deve seguir
diretrizes que diminuam a carga cognitiva do usurio e que proveja mecanismos para que o
ritmo da interao seja controlado por ele (OLIVEIRA NETO; SALVADOR, 2007).
Ao ser detectado que num projeto de Interface Grfica com o Usurio, h uma separao
clara da lgica da aplicao do modelo em que a aplicao mostrada, ou seja, uma
separao entre a parte funcional e a forma de apresentao desta, ento pode-se perceber
que plausvel estender a aplicao para trabalhar sobre uma interface de voz.
Porm, possvel perceber que a natureza dos projetos baseados em componentes para
aplicaes grficas e de voz podem ser bastante diferentes.
O Quadro 1 reflete esta diferena e o texto a seguir explica estas diferenas (HUNT; WALKER,
2000):
38
Visibilidade X
Transincia X
Assimetria de Banda-Larga X
Temporalidade X
Concorrncia X
Concorrncia: comunicao apenas por voz tende a ser serial e com canal nico. A
maioria das pessoas encontra dificuldade para ouvir e falar simultaneamente ou
ouvir mais de uma voz, de maneira eficiente, ao mesmo tempo. Por outro lado,
sadas visuais permitem concorrncia de mltiplos canais de dados que podem ser
processados juntos pelo usurio ou a ateno do usurio pode simplesmente mudar.
Alm disto, muitos aspectos de sada visual so projetados para responder em
tempo real s entradas do usurio (por exemplo, digitar uma letra e ela aparecer na
tela).
Um sistema com interface do usurio baseada em voz tpico composto por mdulos
conforme mostrado na Figura 3 (LAMEL; MINKER; PAROUBEK, 2000; LAI, 2000; SAN-
SEGUNDO et al, 2005, COHEN; GIANGOLA; BALOGH, 2004; MCTEAR, 2002).
41
Nas sub-sees a seguir, sero detalhados e explicados cada um dos mdulos que
compe a Figura 3 acima, de maneira mais detalhada.
As ondas so, ento, empacotadas e enviadas para o prximo mdulo, no qual ser realizada
a extrao de caractersticas (feature extraction).
42
Eu quero ir a So Paulo
Embora a tecnologia TTS ainda no reproduza com fidelidade a qualidade da voz humana
gravada - vale a pena destacar que, at o momento, os sintetizadores de voz no conseguem
representar entonao - ela tem melhorado muito nos ltimos anos. Tipicamente, o uso da voz
humana pr-gravada est atrelado aos prompts e ao envio de mensagens para os usurios.
No entanto, determinadas aplicaes, como leitores de e-mail e notcias, tem dados muito
dinmicos. Nesses casos, uma vez que os textos das mensagens no podem ser previstos,
pode-se usar a tecnologia TTS para criar os discursos de sada (COHEN; GIANGOLA;
BALOGH, 2004).
Atualmente, possvel usar sistemas que interagem atravs da fala em aplicaes que
permitem verificar informaes de vos, passagens e companhias areas, realizar consultas
em instituies financeiras (como bancos e cartes de crdito), alugar carros, verificar as
condies do trfego e de tempo, localizar endereos, acessar o horrio de trens e nibus,
encontrar os locais e horrios de sesses de cinemas, e fazer reservas em restaurantes. A
esta lista, em constante crescimento, podem ser adicionados muitos outros servios, como o
acesso secretria de voz do telefone celular (OLIVEIRA NETO; SALVADOR, 2007).
Ampliar uma marca: atravs da pronncia e tom de voz, vrias sensaes podem
ser passadas ao usurio, como polidez, firmeza e emoo. Isso pode ser usado a
favor da construo da imagem da empresa ou marca de um produto.
Para os usurios, existem vrias outras vantagens em se usar bons sistemas baseados em
voz sobre outras formas de interao (COHEN; GIANGOLA; BALOGH, 2004):
Intuio e eficincia: os sistemas de boa qualidade que interagem com voz utilizam
as habilidades natas dos usurios. As tarefas podem ser feitas de maneira mais
simples e mais eficiente do que, por exemplo, em aplicaes touchtone. Numa
aplicao bancria, por exemplo, o usurio pode falar algo como Eu quero meu
48
extrato bancrio dos ltimos 15 dias, que muito mais simples do que navegar
numa srie de menus.
Liberdade para as mos e olhos: algumas atividades, como dirigir, ocupam as mos
e os olhos do usurio. As aplicaes baseadas em comandos de voz se tornam
uma soluo ideal para esse tipo de situao, at mesmo porque a interface dos
telefones celulares ainda bastante pobre.
Segundo Deng e Huang (2004), para que os sistemas baseados em comandos de voz tenham
uma aceitabilidade macia pela sociedade, h alguns desafios a serem vencidos:
3
De acordo com Suhm, Myers e Waibel (2001), o termo multimodal deveria se referir ao uso de mais de uma modalidade,
indiferente da natureza das modalidades. Entretanto, muitos pesquisadores tm usado o termo multimodal referindo-se
especificamente s modalidades que so comumente utilizadas na comunicao entre pessoas, tais como fala, gestos e
escrita a mo.
49
Necessidade de se trabalhar com sistemas para linguagem natural, com estilo livre: at
o momento, quando usurios interagem com sistemas baseados em comandos de voz,
eles esto cientes de que seu partner uma mquina. Esta mquina falha no
reconhecimento de voz se o usurio tenta introduzir um estilo natural e casual na
conversao.
De acordo com Alapetite, Boje e Morten (2009), quando se desenvolve uma aplicao com
interface do usurio baseada em voz, h algumas questes que no devem ser esquecidas
ou menosprezadas para o sucesso da aplicao:
3. AVALIAO DE USABILIDADE
Este captulo apresenta uma reviso bibliogrfica dos principais mtodos de avaliao de
usabilidade, criados, principalmente, para interfaces grficas do usurio.
3.1 Definio
A avaliao de usabilidade consiste de uma das trs avaliaes possveis para um sistema.
possvel pensar em avaliar: i) tecnicamente os componentes do sistema; ii) a usabilidade do
sistema; e iii) o sistema e seus componentes sobre o ponto-de-vista dos clientes. Obviamente
estas trs formas no esto completamente desassociadas; por exemplo, um sistema com
uma boa integrao de componentes considerados excelentes pode ter uma usabilidade baixa,
assim como um cliente pode preferir um sistema com componentes no considerados to
eficientes por questes de custo e compatibilidade de plataformas (BERNSEN; DYBKJAER,
2001).
Vrias definies sobre usabilidade so propostas, na literatura, incluindo a dada pela ISO
(ISO 9241-11): usabilidade a capacidade que um sistema interativo oferece a seu usurio,
em um determinado contexto de operao, para a realizao de tarefas, de maneira eficaz
(que a preciso e a completude com que usurios conseguem atingir seus objetivos),
eficiente (que a relao entre a preciso e a inteireza com que usurios atingem certos
objetivos e os recursos gastos para atingi-los) e satisfatria (que o conforto e as atitudes
positivas dos usurios concernentes ao uso do sistema).
J para Lauesen (2005), Avouris (2001), Sommerville (2001) e Nielsen (1989; 1993), a
usabilidade consiste de fatores como:
Funcionalidade: o sistema pode dar suporte s tarefas que o usurio tem na vida
real.
Fcil aprendizado: quo fcil o aprendizado sobre o sistema para vrios grupos de
usurios.
Enquanto a ISO e outros autores (LAUESEN, 2005; AVOURIS, 2001; SOMMERVILLE, 2001;
NIELSEN, 1993) so conceitualmente claros, difcil usar estas definies na prtica. Quando
a avaliao realizada atravs de estudos empricos, os pesquisadores necessitam decidir
sobre indicadores (mtricas) para cada fator. Por exemplo, uma mtrica de memorizao
pode determinar que um operador que estivesse familiarizado com o trabalho deveria estar
habilitado a usar 80 por cento das funcionalidades do sistema depois de uma sesso de trs
horas de treinamento.
Porm, complexo decidir como estes fatores contribuiro para uma concluso sobre a
usabilidade de um sistema. Uma alternativa definir usabilidade de um sistema como a ausncia
de obstculos que impedem os usurios de completar suas tarefas. Com base nesta abordagem,
usabilidade pode ser medida em termos dos problemas de usabilidade que so identificados
quando os usurios esto usando um sistema em seu trabalho (SKOV; STAGE, 2005).
Os mtodos de avaliao sero aqui classificados em duas dimenses, de acordo com Rocha
e Baranauskas (2003):
A seguir, sero abordados dois dos mtodos de inspeo de usabilidade mais utilizados:
avaliao heurstica e percurso cognitivo.
a) Avaliao Heurstica
A maioria dos mtodos de inspeo tem um efeito significativo na interface final somente se
for usada durante o ciclo de vida do projeto, o que, efetivamente, no ocorre na maioria dos
casos, seja porque so caros, difceis ou demorados (ROCHA, BARANAUSKAS, 2003).
Pesquisando este problema, Nielsen (1993) prope o que ele chama de engenharia
econmica de usabilidade. A avaliao heurstica o principal mtodo desta proposta.
Ao final desta etapa inicial, as listas elaboradas pelos avaliadores so consolidadas em uma
nica lista. Tipicamente, uma sesso de avaliao dura cerca de 2 horas, mas, dependendo
do tamanho ou complexidade da interface, recomendvel dividi-la em vrias sesses
abordando cenrios especficos.
HEURSTICAS DE NIELSEN
Estas heursticas so bastante gerais, podendo ser adaptadas dependendo do tipo de sistema
que se venha a trabalhar. Por exemplo, Salvador, Oliveira Neto e Guimares (2009)
compuseram outras heursticas para avaliar interface do usurio baseadas em voz e Sutcliffe
e Gault (2004) propuseram outras heursticas para avaliar sistemas de Realidade Virtual.
b) Percurso Cognitivo
Percurso Cognitivo um mtodo de inspeo de usabilidade que tem como foco central a
avaliao do projeto quanto sua facilidade de aprendizagem, sobretudo por explorao
(ROCHA, BARANAUSKAS, 2003).
Fase preparatria: definio das tarefas, sequncias de aes para cada tarefa,
universo de usurios e da interface a ser analisada.
Preparao: nesta fase, busca-se garantir que tudo esteja pronto antes do usurio
chegar.
Vdeo Snapshots do uso tpico de sistema: o usurio tem suas aes gravadas em
vdeo estando ciente de que a gravao est acontecendo.
Cdigo de instrumentao para coleta estatstica permite que as interfaces sejam melhoradas
vrias vezes. As operaes mais comuns podem ser detectadas. A interface pode ser
reorganizada de tal forma que seja mais rpida, por exemplo, atravs do uso de menus do
tipo pop-up.
Nenhuma destas abordagens relativamente simples para avaliar a interface com o usurio
completamente segura e so, provavelmente, insuficientes para detectar todos os problemas
60
de interface do usurio. Entretanto, estas tcnicas podem ser usadas por um grupo de
voluntrios, antes do sistema ser liberado, sem um grande gasto de recursos. A maioria dos
grandes problemas de projeto de interface do usurio pode, ento, ser descoberta e corrigida.
O teste de usabilidade o mais eficaz para detectar erros, mas o mais caro. O
custo de um teste de usabilidade da ordem de 50 vezes o custo dos mtodos de
inspeo. Todos os problemas srios so encontrados, mas h perda de valor na
deteco de consistncias.
levadas em considerao pelos mtodos tradicionais de avaliao, visto que estes mtodos
foram criados, principalmente, para interfaces grficas do usurio.
62
Este captulo expe o escopo de usabilidade para interfaces do usurio baseadas em voz.
Sendo assim, define e prope requisitos gerais e especficos para esta classe de aplicaes.
Por fim, versa sobre aspectos de qualidade destes sistemas, alm de listar mtricas para este
fim.
4.1 Contextualizao
A usabilidade est se tornando uma questo cada vez mais importante no desenvolvimento e
na avaliao de sistemas de reconhecimento de voz. Muitas companhias comeam a gastar
um volume alto de recursos para conhecerem exatamente as caractersticas destes tipos de
sistemas que so atraentes aos usurios e, tambm, saberem como avaliar se seus sistemas
possuem estas caractersticas. Apesar destas importantes questes sobre usabilidade,
durante os ltimos anos, o que mais se tem pesquisado so os componentes deste tipo de
sistema, e no, sobretudo, os aspectos de usabilidade.
Alm disto, o conhecimento atual sobre avaliao de VUI advm de pequenas contribuies
em avaliaes que foram desenvolvidas para projetos especficos, e que tentam generalizar e
propor recomendaes para tais aplicaes, como o framework PARADISE (WALKER et al,
1997), o projeto EAGLES (Expert Advisory Group on Language Engineering Standards)
(GIBBON; MOORE; WINSKI, 1997) e EU DISC (DYBKJAER; BERNSEN, 2000).
63
Segundo Dybkjaer e Bernsen (2001), para fazer uma avaliao de um sistema com
reconhecimento de voz, torna-se necessrio o uso de templates que contenham as seguintes
questes:
Qual a parte do sistema que est sendo avaliado: por exemplo, o gerenciamento do
dilogo.
A ideia fornecer ferramental suficiente ao avaliador para que, seguindo este template, seja
possvel avaliar a interface do usurio baseada em voz de maneira eficaz e eficiente. H que
se apontar, sobretudo, que a importncia dos critrios para a avaliao de um VUI depende
da aplicao e de usurios ou grupo de usurios deste sistema.
de sequncia indica que uma unidade de linguagem de comando foi aceita (em
interface do usurio baseada em voz significa que o sistema entendeu a ao
solicitada pelo usurio); nvel funcional: indica que o sistema est trabalhando no
problema (mensagens como por favor, aguarde um momento) ditas ao usurio.
Frases de sada adequadas: o contedo das sadas do sistema deve ser correto,
relevante e suficientemente informativo, sem prover sobrecarga de informao ao
usurio. A forma de expresso do sistema deve ser clara e no-ambgua e a
linguagem deve fornecer uma terminologia apropriada e familiar ao usurio.
4
Barge-in conhecido como a interrupo no sistema de telefonia (sistemas automticos) causada por usurios
experientes que esto acostumados a navegar pelo sistema de maneira mais rpida para os prximos prompts
do sistema. uma caracterstica importante porque permite que usurios experientes consigam se mover
rapidamente atravs do sistema a fim de obter as informaes desejveis (COHEN; GIANGOLA; BALOGH,
2004).
66
Dybkjaer e Bersen (2001) e Salvador, Oliveira Neto e Kawamoto (2008) definiram um conjunto
de critrios de avaliao de usabilidade para sistemas de comandos de voz que esto
relacionados ao acesso do usurio ao sistema:
Preveno de erros: desejvel que uma boa interface seja capaz de prevenir
possveis erros realizados pelos usurios. O que pode ser feito, no caso de VUI,
tentar guiar o usurio a alcanar seus objetivos rapidamente, por exemplo,
passando o controle do dilogo para o sistema, se for percebido que o usurio tem
alguma dificuldade, ou fornecer sentenas adicionais ao final de cada dilogo
alertando o usurio para os prximos passos que ele pode tomar no sistema.
5
Turn-Taking um dos mecanismos bsicos para todos os tipos de dilogo e conversas envolvendo mais do que duas pessoas.
um mecanismo crucial na interao homem-computador permitindo que cada interlocutor tenha a sua vez de interagir
(BOSCH; OOSTDJIK; RUITER, 2004).
68
Tratamento de erros: uma boa interface deve ser capaz de fornecer correo das
entradas rapidamente, aumentando a produtividade de usurios e estimulando que
eles explorem o sistema. As VUIs podem atender a este requisito adotando dilogos
de iniciativa mista, tcnicas de confirmao de dilogo e, no caso de sistemas de
telefonia, transferindo a chamada para um atendente humano quando o usurio se
encontra em srias dificuldades. possvel dividir este tratamento de erros em
quatro modalidades.
Na figura supracitada, h vrios fatores que contribuem para a qualidade de VUI, entre eles
possvel destacar:
De acordo com a Figura 9, possvel discutir que a aceitabilidade de uma aplicao VUI est
ligada a trs pilares fundamentais: a usabilidade que leva satisfao do cliente, a
eficincia do servio e aos benefcios econmicos com a aquisio da aplicao. Obviamente,
a eficincia da tarefa, que leva eficincia do servio, requisito fundamental e est ligada
eficincia do servio.
Sendo assim, para que um sistema seja aceito, ele precisa atender a requisitos como preciso
do reconhecimento da voz, tempo de resposta adequado e minimizao da sobrecarga de
memria, mas tambm qualidade do sistema de udio e de entrada da voz e atender
condies mnimas estabelecidas de interferncia sonora do ambiente (vide Anexo A deste
trabalho); tambm primordial estudar as questes financeiras que podem inviabilizar a
implementao de tal sistema.
Com base nos estudos encontrados na literatura, foi possvel coletar as principais
caractersticas da qualidade para aplicaes VUI que constam da Quadro 3: e Quadro 4:.
Estas caractersticas referem-se ao dilogo estabelecido entre o sistema e o usurio e
tambm comunicao, tarefa e servio.
4.5 Mtricas para a Avaliao de Usabilidade para Interface do Usurio Baseada em Voz
Na literatura, foram encontrados vrios trabalhos que citam possveis mtricas e medidas para
avaliar a usabilidade de VUIs, agrupados entre avaliaes subjetivas e objetivas. Dentre os
vrios trabalhos sobre avaliao subjetiva para Interfaces do Usurio Baseadas em Voz esto
(WALKER; PASSONNEAU; BOLAND, 2001; MLLER, 2002; MLLER, 2005; LARSEN, 2003;
DYBKJAER; BERNSEN, 2001; HARTIKAINEN; SALONEN; TURUNEN, 2004). Alguns autores
citam a avaliao subjetiva como a mais importante, por colherem a opinio da satisfao do
usurio. Os trabalhos encontrados foram baseados na experincia adquirida pelos autores na
construo e avaliao de sistemas de reconhecimento de voz; outros na modificao de
mtodos utilizados em outras reas do conhecimento para medir qualidade, tal como o
trabalho de Hartikainen, Salonen e Turunen (2004) que consiste em fazer uma modificao no
mtodo SERVQUAL (PARASURAMAN; ZEITHAML; BERRY, 1988). Este mtodo produz uma
medida subjetiva entre a diferena entre expectativas e percepes dos usurios em cinco
dimenses de qualidade de servio para todos os servios. Outro trabalho encontrado
estabelece um mtodo para avaliar a qualidade dos servios de telefonia baseados em voz
atravs do mtodo utilizado para avaliar a qualidade dos servios de telefonia baseados no
atendimento humano (MLLER, 2002; 2005).
O prximo captulo abordar VUI para sistemas de informao radiolgica, sobretudo para
sistemas de transcrio automtica de laudos em radiologia.
78
Este captulo versa sobre o uso de VUI aplicado rea da Sade, principalmente no dia que
se refere ao seu uso em transcries de laudos em radiologia, tratando, inclusive sobre seus
requisitos.
Segundo Rodrigues (1996), um dos grandes desafios para a comunidade cientfica no campo
da informtica aplicada Sade a implementao de solues de grande impacto funcional,
aliadas a um baixo custo operacional, que possam contribuir para a melhoria da qualidade do
setor, facilitar o acesso e expedir servios oferecidos aos pacientes e prover dados
organizados rapidamente disponveis para os profissionais de sade, sejam eles mdicos,
pesquisadores, epidemiologistas, estatsticos, administradores etc.
Neste ponto, uma das tecnologias promissoras para aumentar a usabilidade desta classe de
sistemas o reconhecimento de voz. Esta tecnologia tem sido utilizada, na rea da Sade,
em aplicaes como (DURLING; LUMSDEN, 2008):
que ele pudesse reportar informaes tais como os nveis de dor e a sua
localizao. Para este sistema, a taxa de erro do reconhecedor foi de apenas 2%.
O tempo que os radiologistas levam para fazer seu trabalho maior porque eles
tem que ler e corrigir os laudos.
83
Outra soluo apontada por Ichikawa et al (2007), prope o uso de reconhecimento de voz
para a gerao de arquivos de texto, mas passando pela correo de erros de pessoas para
fazerem a transcrio (utilizando os arquivos de voz tambm gerados), ou seja, uma
abordagem mista entre as duas frentes defendidas pelos autores supracitados. Obviamente
esta soluo diminui o TAT, mas no torna o laudo disponvel em tempo real.
So elas:
A interface grfica relativa a estes sistemas de laudos pode ser vista a seguir, conforme a
Figura 12.
Infra-estrutura de rede: embora geralmente j exista na instituio, pode ter que ser
realizado uma atualizao.
7. Ajuda: caso o usurio tenha algum problema na execuo do sistema, preciso que
haja uma ajuda e que o sistema seja capaz de identificar quando o usurio est em
apuros. Tambm desejvel que o usurio possa acionar a ajuda, dizendo alguma
palavra especfica, tal como ajuda ou help.
9. Recuperao de erros: o usurio deve ser capaz de corrigir seu ditado a qualquer
momento.
10. Tempo de resposta do feedback: o tempo de resposta para o usurio no deve ser
alto deixando o usurio pensando que o sistema no o compreendeu ou que algo
errado foi realizado. Segundo Nielsen (1993), um dcimo de segundo (0,1s) o
limite para o usurio pensar que o sistema est reagindo instantaneamente, o que
significa que nenhum feedback especial necessrio; um segundo (1.0s) o limite
para que o fluxo de pensamento do usurio no seja interrompido, mesmo que o
usurio perceba uma certa demora; e dez segundos (10s) o limite para manter a
ateno do usurio focalizada no dilogo. s vezes, feedbacks especiais so
necessrios para contextualizar uma navegao mais demorada do usurio.
necessrio salientar que estas medidas foram realizadas para sistemas stand-alone
ou pginas WEB. Porm, para sistemas de reconhecimento de voz, este tempo no
foi encontrado na literatura, precisando ser tomado a partir de observao do
usurio no uso do sistema.
88
12. Uso da arquitetura Cliente-Servidor: para que os radiologistas estejam livres para se
moverem de uma estao a outra dentro do hospital ou clnica.
14. Qualidade das entradas de dados: o sistema deve possuir perifricos de entrada, tal
como microfones que no causem interferncias s entradas de voz.
16. Qualidade do sistema de udio: a voz gravada deve ser compreensvel e muito
semelhante voz original.
17. Tempo de retorno: tempo para o laudo ficar pronto que deve ser menor do que os
sistemas de transcrio humana.
20. Diversidade e Percepo Humana: o sistema deve permitir que usurio experientes
possam realizar suas tarefas de maneira mais eficiente que usurios iniciantes, seja
atravs de teclas de atalho ou uso de barge-in - por exemplo, sendo capaz de clicar
com o mouse e recuperar padres de laudos j disponibilizados.
21. Satisfao do Cliente: est ligada porcentagem de erros gerados pelo sistema e
facilidade de uso, assim como o entusiasmo do usurio para utilizar o sistema
novamente.
22. Naturalidade da fala do usurio: o usurio deve poder falar de maneira natural e
contnua, da mesma forma que faria se estivesse gravando o udio.
Neste captulo foi possvel verificar o uso de reconhecimento de voz para aplicaes efetivas
na rea da Sade, sobretudo em aplicaes de propsito especfico, tais como na radiologia.
Tambm, aqui, foram descritas as principais caractersticas e os requisitos para sistemas de
transcrio automtica de laudos em radiologia.
Uma metodologia ser proposta, utilizada para medir estes principais requisitos, aqui
estabelecidos. O prximo captulo tratar de abordar esta metodologia.
90
6.1 Introduo
Esta metodologia sugere que se utilizem os mtodos para avaliao da usabilidade baseados
em inspeo sempre que seja possvel avaliar a interface sem envolver os usurios finais, a
fim de diminuir os custos das sesses de testes de usabilidade. Devem-se utilizar testes de
usabilidade quando for verificado que a inspeo no seja suficiente.
Embora, na literatura apontada por Nielsen (1989, 1993) seja desejvel utilizar de trs a
quatro avaliadores para se compor a lista de inspeo de usabilidade, esta metodologia
utilizar dois avaliadores (a prpria autora e um especialista em VUI convidado). O motivo
para esta abordagem se deu porque as inspees utilizariam muito mais horas cerca de 10
vezes mais - do que Nielsen (1989, 1993) discute em seu trabalho em torno de 2 horas.
Tambm por esta razo, a 2 especialista no fez parte de todas as inspees.
a. dilogo e comunicao;
b. meta-comunicao;
d. tarefa, e
e. entrada de dados.
Porm, para o domnio estabelecido na rea da Sade, a partir dos requisitos e mtricas
listados no Captulo 4 e 5, para se avaliar sistemas de transcrio automtica de laudo, as
seguintes classes so, aqui, propostas:
O quadro a seguir mostra o agrupamento sugerido de acordo com a definio das classes:
CLASSE REQUISITO
Assim, foram classificados todos os requisitos listados no item 6.3 em trs graus, conforme
mostrado na Quadro 8:.
94
COMPLEXIDADE REQUISITOS
6. Ajuda: este requisito est ligado facilidade com que usurios, principalmente
iniciantes, tero para aprenderem e acessarem o sistema de ajuda para
conseguirem resolver seus problemas com o uso do sistema e conseguirem finalizar
seus objetivos (ditar um laudo de maneira eficiente).
10. Visibilidade do sistema: este requisito est relacionado maneira como o sistema
ter para mostrar ao usurio seu status atual. Por exemplo, se o sistema encontrar
algum erro de reconhecimento ou tiver algum problema no acesso ao dicionrio,
como ser realizada a visibilidade do sistema.
12. Qualidade das entradas de dados: este requisito est relacionado a bons
dispositivos de captao de voz (microfones) que no causem problemas de
interferncia sonora ou eltrica que promovam distores na fala.
14. Tempo para o laudo ficar pronto: o tempo para o laudo estar disponvel para
consulta atravs do uso de um sistema de transcrio automtica de laudo deve ser
menor do que atravs de outros mtodos: escrita mo, digitao pelo prprio
radiologista, uso do servio de transcrio humana.
17. Satisfao do Cliente: este requisito est ligado ao prazer de se utilizar o sistema de
transcrio automtica de voz. um requisito totalmente subjetivo que geralmente
medido atravs da aplicao de questionrios, tais como o apresentado no
Apndice A.
A fim de tentar diminuir os custos com os testes de usabilidade, ser utilizada a avaliao por
inspeo de usabilidade para as medidas objetivas baseada em heursticas. J para as
medidas subjetivas, sero utilizados e testes e questionrios.
Por outro lado, as heursticas utilizadas foram baseadas num adaptao de Nielsen (1993), no
estudo de requisitos no funcionais para VUI e nas boas prticas de desenvolvimento de VUI
apontados por (DYBKJAER; BERSEN, 2001), (SALVADOR et al., 2008) e (KOMATANI et al.,
2003), de acordo com as peculiaridades dos sistemas de transcrio automtica de laudos.
Utilizando os requisitos para sistemas de transcrio de laudos utilizando VUI selecionados na
sesso anterior, foram pesquisadas mtricas na literatura (seo 4.5) e, tambm, propostas,
pela autora, novas mtricas para sua avaliao de acordo com as peculiaridades dos
sistemas de transcrio automtica de laudos. Um template baseado em Dybkjaer e Bernsen
(2001) proposto para melhor organizar as avaliaes (Quadro 9:).
REQUISITO
Tipo de Avaliao
Mtodos de Avaliao
Importncia
Dificuldade de Avaliao
Sintomas a procurar/ Mtricas a utilizar
Quadro 9: Template utilizado para realizar a avaliao dos requisitos. (Fonte: autor)
SATISFAO DO CLIENTE
MODALIDADE APROPRIADA
ADEQUAO DO FEEDBACK
VISIBILIDADE DO SISTEMA
PRECISO
RECUPERAO DE ERROS
Quadro 21: Avaliao do Tempo para o Laudo ficar Pronto. (Fonte: autor)
TAMANHO DO VOCABULRIO
INTERFERNCIA SONORA
O prximo captulo tem como foco todo o plano de avaliao, em detalhes, realizados para
a validao da metodologia aqui proposta.
108
Sero abordadas, neste Captulo, todas as fases de preparao dos testes e de inspeo de
usabilidade de sistemas j implantados em hospitais, utilizando a metodologia detalhada no
Captulo 6.
Este Captulo tem por objetivo verificar quo bem funciona um sistema de transcrio de
laudos de radiologia, utilizando-se a metodologia proposta no Captulo 6, no qual foram
propostos os requisitos e as mtricas para esse tipo de sistema.
Sero utilizados aqui dois sistemas de transcrio automtica de laudos em radiologia, que
sero descritos a seguir. A fim de facilitar os testes, economizar tempo e custos, alm de
incomodar, o mnimo possvel, os mdicos radiologistas, optou-se por ser realizada a maioria
dos testes com usurios participantes interessados na rea tecnolgica. Outro ponto
importante para a reduo de tempo e de custos o uso de inspeo de usabilidade, por ser
realizado por especialistas em usabilidade, ao invs de usurios finais.
Vrias empresas, tais como Philips Healthcare (Philips, 2010) e Agfa (Agfa, 2010), que
vendem sistemas radiolgicos, incorporam o motor de reconhecimento de voz da Nuance em
suas solues. O que torna um sistema mais atrativo que outro so, ento, as facilidades
customizaes - que podem ser incorporadas programadas - ao sistema radiolgico.
A seguir sero descritos dois sistemas testados neste trabalho. O primeiro utiliza a mquina
de reconhecimento de voz da Nuance, sem facilidades programadas nos sistemas de
radiologia. O segundo sistema, tambm da empresa Philips (2010), na verso 2.1, pertence a
um hospital de So Paulo em que poucos usurios costumam utiliz-lo.
A fim de baratear os custos com os testes nos hospitais, diminuir o tempo de testes e tambm
o incmodo para o setor de TI dos hospitais que teriam que disponibilizar o ambiente de
testes do reconhecedor de voz, optou-se pela instalao do sistema Speech MagicTM verso
6.1 (2010) em uma mquina fora do ambiente hospitalar.
Embora hajam alguns inconvenientes no uso desta abordagem, tais como o sistema no estar
instalado como cliente-servidor e no tendo condies, por isso, de um aprendizado mais
eficaz da mquina de reconhecimento de voz e, ainda, no permitir a entrada de novas
palavras -, para vrios tipos de testes, esta abordagem j suficiente. Foi possvel testar
vrios requisitos do sistema, como o delay do sistema em resposta s entradas do usurio
requisito tempo de feedback, alm de ser possvel entender o funcionamento do sistema.
110
possvel, neste aplicativo, selecionar a linguagem a ser utilizada, o tipo de usurio, sendo
Flvia a nica voz feminina presente nas opes, o tipo de canal de entrada e tambm a
linguagem para as telas (GUI Languages). Porm, a interface de telas, apresenta as
linguagens misturadas entre verses em ingls, portugus e espanhol, gerando certo
desconforto cognitivo.
O segundo componente do sistema, chamado Neoc Interactive 6.1, a interface que permite
a gravao dos laudos e visualizao dos textos. uma interface bastante intuitiva, estando
no idioma espanhol. A tela inicial deste componente apresentada na Figura 15.
112
O sistema vai ignorar hesitaes e interjeies que o usurio tenha, quando est
pensando na prxima frase a dizer, assim como ignorar o som ambiente ou
seja, interferncias sonoras.
possvel utilizar o NEOC Interactive 6.1 sem ter realizado o treinamento inicial da voz do usurio,
porm, segundo a documentao, haver diferena de acertos no reconhecimento da voz.
O sistema Philips Speech Magic verso 2.1 o que est instalado no hospital foco do estudo.
Embora seja uma verso bastante antiga, visto que a ltima verso se encontra em 7.
Sua interface bastante parecida com a verso descrita no item anterior, como pode ser
visualizada na Figura 16.
O sistema no est interligado ao PACS ou RIS, o que contribui para o aumento do tempo
para o laudo ficar pronto.
O ambiente fsico pode ser visualizado na Figura 17. possvel perceber que o mdico
necessita visualizar trs telas ao mesmo tempo, e em uma delas, podem estar concentradas
quatro imagens do exame em questo.
Figura 17: Ambiente no qual so realizados os laudos dos exames de Ressonncia Magntica atravs do
sistema de transcrio automtica. . (Fonte: autor)
J para a segunda fase da avaliao, foi selecionado um usurio que utiliza o sistema com
mais frequncia.
Esta seo tem por objetivo propor as heursticas e mtricas para que os especialistas
verifiquem a conformidade do sistema com o que foi estabelecido. De todas as heursticas e
mtricas detalhadamente descritas no Captulo 6 deste trabalho, apenas as com metodologia
de avaliao por inspeo constaro desta parte da avaliao.
Nesta seo foi elaborado cada Caso de Teste, apoiado na Metodologia proposta no Captulo
6. Um caso de teste descrito na literatura de maneira bastante padronizada, tais como
abordado em (IEEE 829-2008; DELAMARO; MALDONADO; JINO, 2007; LEE, 2003). Porm,
para casos de teste de usabilidade no foi encontrado, na literatura, nenhum template. Assim,
a autora definiu um template que se adequasse a suas necessidades de padronizao dos
testes, conforme possvel verificar na Quadro 30.
116
Nome da Mtrica
Mtodo de Avaliao
Participantes
Material Necessrio
Roteiro
Resultados
Anlise
Quadro 30: Template para Casos de Testes. (Fonte: autor)
Resultados
Anlise
Quadro 36: Caso de Teste para Avaliar a Qualidade das Entradas de udio. (Fonte: autor)
Resultados
Anlise
Quadro 38: Caso de Teste para Avaliar a Visibilidade do Sistema por Inspeo. (Fonte: autor)
Embora Nielsen (1993) estabelea que uma inspeo deva ter entre 3 e 5 especialistas, foram
utilizadas duas especialistas em usabilidade para esta inspeo. As duas especialistas
encontram-se em fase de doutoramento na rea de Interfaces Homem-Computador, so do
sexo feminino, com experincia acadmica e em empresa, com mais de 30 anos de idade.
Segundo Nielsen (1993), uma inspeo de usabilidade dura cerca de 2 horas e deve
ser realizada individualmente. Porm, possvel perceber, atravs dos resultados dos testes,
na prxima seo, que estas inspees demoraram bastante tempo, cerca de 20 horas. Esta
foi uma das principais razes do no uso da 2 especialistas em todas as inspees e tambm
da no utilizao de mais de dois especialistas.
Laptop Philips: Processador Core 2 Duo, Memria RAM de 4GB, HD de 320 GB.
SpeechMike Pro TM
Philips: utilizado para as entradas de udio, tal como apresentado
na Figura 18.
Cronmetro: utilizado para medir o tempo dos testes e tempo de resposta do sistema.
6
Esta licena foi gentilmente cedida pela empresa MacSym Tecnologia Mdica (Macsym, 2010) por um prazo de 60 dias
123
Software Neoc Interactive 6.1: pode ser utilizado sem a execuo prvia do
SmInitialTraining, porm apresentar uma preciso menor.
Esta subseo tem por objetivo gerar os resultados de cada caso de teste determinado para
inspeo, assim como a anlise dos resultados.
Os textos tm uma mdia de 56.4 palavras por laudo, sendo que o menor laudo tem 52
palavras e o maior, 66.
Anlise a) A mdia de erro entre todos os 10 testes foi de 4.54%, com desvio
padro de 1.237%, o que indica que houve uma certa homogeneidade
nos dados, analisados a partir do Grfico 1 Porcentagem de Erro.
Anlise
a) possvel, atravs de comparao entre o Grfico 1 e o Grfico
5, verificar que houve uma piora significativa na porcentagem de
erros quando se utiliza um texto com palavras fora do vocabulrio
130
7. Ratificar e Retificar
8. Cerca de um laudo e Cerca de 1 metro
9. Ponto de referncia e baixo contraste .
10. Caracterstica afim e A fim de caracterizar.
Resultados Este teste demorou cerca de 5 minutos.
As respostas que o sistema deu s entradas mostradas acima
foram:
1. Acerca do paciente. e Cerca de 1 milho
2. o paciente apresenta arteriosclerose e A paciente apresenta a
aterosclerose
3. Cmara e Cmera
4. O comprimento de 1 m e o comprimento do exame
5. Emergir e Emergir
6. Acidente e Incidente
7. Ratificar e Retificar
8. Cerca de o laudo e Cerca de 1m
9. Ponto de referncia e baixo contraste .
10. Caracterstica afim e A fim de caracterizar.
Anlise O sistema foi capaz de distinguir entre os homnimos em 70% dos
casos estudados, falhando nos itens 4, 5 e 8.
Quadro 46: Resultados e Anlise do Caso de Teste para Avaliar a Resoluo de Ambiguidade para
Homnimos. (Fonte: autor)
Texto Transcrito:
tcnica exame realizado em equipamento de alta potencia com tcnica
de alta quilovolt imagem de fornece escala de contraste longa mais de
contraste laudo estruturas sseas e tecidos moles da parede torcica
sem alteraes no vascularizao pulmonar normal, de configurao e
topografia e dimenses normais e imagem cardaca aumentada. Aorta
alongada e do arco mdio normal do parnquima pulmonar de
transparncia normal
142
Anlise
a) As interjeies comumente usadas quando se est ditando
frases criadas naquele momento foram transformadas em palavras
sem sentido dentro do texto grifadas em negrito. Ao contrrio do
que est especificado no manual, as interjeies no so
ignoradas pelo sistema.
b) Atravs desta inspeo, foi observado que o sistema, ao
contrrio do que indica o manual de utilizao, no capaz, quase
nunca, de inserir pontuao adequada, seguindo as pausas que o
usurio faz no texto. Portanto, se o usurio no fizer a pontuao
explcita do texto quando dita, ter que faz-lo depois no prprio
texto transcrito. Ter que inserir pontuao explcita no ditado torna
a naturalidade da fala menor.
Alm disso, o sistema inseriu algumas palavras que servem como
conexes entre as frases, tais como no, e, do, destacados no
texto, em resultados.
Quadro 53: Resultados e Anlise do Caso de Teste para Avaliar a Naturalidade da Fala do Usurio por
Inspeo
Utilizando uma metodologia para a elaborao dos testes por Observao adaptada de Diah
et al (2010), Nielsen (1993) e de Mitchell (2007), este planejamento composto pelas
seguintes atividades executadas de maneira consecutiva:
criar as tarefas;
selecionar os participantes;
questionar o participante; e
Esta etapa tem por objetivo verificar quo bem funciona o sistema de transcrio automtica
de radiologia para um sistema stand-alone, desejando-se verificar o quanto o sistema est
adaptado s mtricas estabelecidas no Captulo 6 deste trabalho.
Esta subseo detalha a configurao dos equipamentos utilizados durante os testes com o
software SpeechMagic (2010), assim como os materiais necessrios:
Laptop Philips: Processador Core 2 Duo, Memria RAM de 4GB, HD de 320 GB.
Cmera Fotogrfica.
Cronmetro: utilizado para medir o tempo dos testes e tempo de resposta do sistema.
Software Neoc Interactive 6.1: pode ser utilizado sem a execuo prvia do
SmInitialTraining, porm apresentar uma preciso menor.
O template proposto pela autora no Quadro 30 foi utilizado para os testes de usabilidade que
esto detalhados nesta subseo.
A seguir sero destacados os casos de teste para testar a Naturalidade da Fala do Usurio,
Recuperao de Erros do Sistema, Carga Cognitiva e Adequao do Feedback do Sistema.
7
Esta licena foi gentilmente cedida pela empresa MacSym Tecnologia Mdica (Macsym, 2010) por um prazo de 60 dias
146
Resultados
Anlise
Quadro 55: Caso de Teste para Avaliar a Naturalidade da Fala do Usurio por Observao. (Fonte: autor)
Para cada participante, foi realizado um primeiro contato pessoal e, posteriormente, enviada
uma carta de apresentao especificando o intuito do teste, como seria realizada a seo e o
tempo necessrio. Esta carta, na ntegra, consta do Apndice B deste trabalho.
Embora Nielsen (2000b) descreva, em seu estudo, que um grupo com 5 participantes seja
suficiente para encontrar 80% das caractersticas desejveis de serem descobertas em um
sistema e que quanto mais usurios forem adicionados, menos informaes adicionais so
encontradas em oposio ao custo para se fazer os testes, foi verificada a necessidade de se
trabalhar com 8 participantes, pois se desejava verificar caractersticas especficas da voz de
homens e mulheres e tambm de pessoas com sotaque. Assim, o trabalho englobou um
grupo de 6 participantes, sendo 3 homens e 3 mulheres, e um grupo de 2 participantes, um de
cada sexo, com sotaques diferentes das pessoas nativas na cidade de So Paulo.
149
50% 50%
Experincia Sistema de Nunca Utilizei Funcionam regularmente
Transcrio Automtica
0.875 0.125
Sotaque Pronunciado Sim No
0.25 0.75
Nvel Escolaridade Graduao Mestrado Doutorado
0.125 0.625 0.25
Tambm participaram destes testes duas especialistas em usabilidade cuja funo foi a de
observarem os participantes em suas atividades, fazendo as coletas de dados necessrias:
preenchimento de formulrio e captao de imagens e sons.
A seguir so mostradas algumas fotos tiradas na fase de testes de usabilidade com alguns
voluntrios.
A interferncia sonora nestes testes de usabilidade foi medida, no incio de cada teste, e
consta da Tabela 2.
O tempo do teste total foi, em mdia, de 45 minutos. O tempo de cada teste consta da Tabela 3.
Em relao s questes ticas que devem ser tratadas num teste de usabilidade, foram
utilizadas aquelas indicadas por Pernice e Nielsen (2009) e Mitchell (2007), vindas do Human
Factors and Ergonomics Society Code of Ethics de 1993 (28/12/2010). Assim, foram
realizadas as seguintes aes:
Envio, por correio eletrnico, de uma Carta de Apresentao dos Testes de Usabilidade,
conforme apresentada no Apndice B, e marcao de um horrio para a realizao do
teste.
As sesses foram compostas por quatro partes, conforme descritas por Rubin e Chisnell
(2008) e tiveram durao mdia de 45 minutos:
Introduo sesso de testes: explica os motivos para a realizao dos testes e como
o usurio deve agir. Deve durar cerca de 5 minutos.
Tarefas: quais as tarefas que o usurio deve executar. Deve durar cerca de 30 minutos.
Os voluntrios fizeram um treinamento mnimo prvio necessrio de sua voz que de 8
frases, totalizando cerca de 2 minutos de treino, em mdia.
152
Nessa fase foi passado um questionrio de ps-teste para cada um dos participantes a fim de
verificar a satisfao de utilizao do sistema e tambm verificar parte de questes de
usabilidade.
Nessa subseo possvel visualizar, em detalhe, todos os casos de teste realizados atravs
de observao dos participantes, assim como seus resultados dos testes e anlise dos dados
coletados. Os quadros e tabelas so apresentados a seguir.
ou alto;
iii) Usurio l um laudo e usurio fala um laudo sem ler;
b) Atravs da leitura de laudos:
i) Verificar a diferena de preciso entre o usurio falar mais
pausadamente ou mais rapidamente;
ii) Verificar a diferena de preciso entre o usurio falar com tom
baixo ou alto;
Resultados
O laudo continha 54 palavras.
Os usurios 1, 3, 5 e 8 so mulheres.Os usurios 7 e 8 so, respectivamente,
um homem com sotaque e uma mulher com sotaque.
Os resultados podem ser visualizados no Grfico 10.
Anlise
a) Embora esteja na especificao do sistema, fornecido pelo fornecedor, que
o sistema faz a insero de pontos finais e vrgula, o sistema no foi capaz de
faz-lo, colocando conjunes tais como com, e, que, em muitas vezes
afetavam o sentido das frases.
154
d) O uso do sistema para uma fala natural do usurio sempre se mostra melhor
do que a insero dos dados atravs de um ditado mais pausado ou mais
rpido do que o habitual.
e) O uso do sistema para um tom de voz mais baixo ou mais alto tambm afeta
o reconhecimento, devendo o usurio sempre utilizar seu tom normal de voz.
Entre as mulheres, o uso de um tom mais baixo de voz impediu a entrada do
laudo, visto que o sistema foi incapaz de captar a entrada de udio.
Quadro 63: Caso de Teste da Avaliao da Carga Cognitiva do Sistema. (Fonte: autor)
Resultados
Tabela 7: Questo sobre a percepo do udio pelo prprio usurio
Experincia de uso do sistema
Concordo Concordo Indeciso Discordo Discordo
Fortemente Fortemen
Consigo entender perfeitamente o 6
som gravado do ditado que fiz.
Anlise Esta medida subjetiva foi altamente confirmada como verdadeira entre
todos os participantes do experimento, mostrando que o udio gravado
e usado para a transcrio altamente fiel, na percepo do usurio,
ao som original.
Quadro 65: Caso de Teste para Avaliar a Qualidade do Sistema de udio. (Fonte: autor)
Este teste de usabilidade ser executado apenas analisando o usurio final radiologista
em seu ambiente de trabalho. Assim, observador apenas anotar questes observveis nas
tarefas sendo executadas, no fazendo intervenes com o usurio.
Utilizando uma metodologia para a elaborao dos testes por Observao adaptada de Diah
et al (2010), Nielsen (1993) e de Mitchell (2007), este planejamento composto pelas
seguintes atividades executadas de maneira consecutiva:
criar as tarefas;
selecionar os participantes;
questionar o participante; e
Esta subseo detalha a configurao dos equipamentos utilizados durante os testes com o
software Speech Magic 2.1 (Philips, 2010), assim como os materiais necessrios:
PC Intel Core 2, CPU 6.300, 1.86 GHz, 1.97 GB de RAM, com Sistema Operacional XP
2002.
Cmera Fotogrfica.
Cronmetro: utilizado para medir o tempo dos testes e tempo de resposta do sistema.
NATURALIDADE DA FALA
O usurio fala de maneira natural, ou seja, nem muito pausado nem muito ( ) Sim ( ) No
rpido
Observaes:
Observaes:
Observaes:
Observaes:
Observaes:
Observaes:
Quadro 66: Formulrio de Observao da Naturaliza da Fala do Usurio
162
Tabela 10: Formulrio de Observao do Tempo para o Laudo ficar Pronto. (Fonte: autor)
TEMPO PARA O LAUDO FICAR PRONTO
Tempo de ditado:
Observaes:
Observaes:
Observaes:
Observaes:
Tempo Total
RECUPERAO DE ERROS
Observaes:
Observaes:
Observaes:
Observaes:
Quadro 67: Formulrio de Observao da Recuperao de Erros
163
SOBRECARGA COGNITIVA
Observaes:
O usurio fez hesitaes quando o texto apresentava delay para aparecer ( ) Sim ( ) No
na tela
Observaes:
Observaes:
Quadro 68: Formulrio de Observao da Sobrecarga Cognitiva do Usurio. (Fonte: autor)
Envio, por correio eletrnico, de uma Carta de Apresentao dos Testes de Usabilidade,
conforme apresentada no Apndice B, e marcao de um horrio para a realizao do
teste.
Nessa fase foi passado um questionrio de ps-teste para ao participantes fim de verificar a
satisfao de utilizao do sistema e tambm verificar parte de questes de usabilidade. Este
questionrio consta do Apndice A deste trabalho e o resultado apresentado a seguir.
NATURALIDADE DA FALA
O usurio fala de maneira natural, ou seja, nem muito pausado nem muito ( X ) Sim ( ) No
rpido
Observaes: Segundo o usurio, ele fala um pouco mais devagar que no sistema similar
utilizado em outro hospital
Observaes: Percebe-se que esta j uma prtica comum para os radiologistas que
utilizam o sistema de transcrio manual de laudos, ou seja, o uso de
digitadoras.
Observaes:
Observaes:
Observaes:
Quadro 70: Formulrio de Observao da Naturaliza da Fala do Usurio. (Fonte: autor)
RECUPERAO DE ERROS
Observaes: Nos trs laudos observados, as taxas de erro foram: 9%,14% e 18%. A taxa
menor entendida porque foram utilizadas macros e pouco foi a parte de
ditado propriamente dito.
Observaes: A amostra muito pequena para afirmar que no necessrio inserir palavras
novas no sistema, no seu uso dirio.
8
O termo macro utilizado aqui, se refere a textos pr-digitados que fazem parte, comumente, de um laudo. Podendo, assim,
serem inseridos no texto, economizando ditados.
168
SOBRECARGA COGNITIVA
Observaes: O mdico j orientado a no olhar a tela enquanto faz o laudo. Alm disso,
neste momento, o mdico j est olhando para duas outras telas, com quadro
imagens em uma delas.
O usurio fez hesitaes quando o texto apresentava delay para aparecer ( ) Sim ( X ) No
na tela
O usurio dita o laudo e j faz a formatao explcita (ditada) do laudo (X) Sim ( ) No
As discusses sobre os resultados dos testes de usabilidade aplicados neste trabalho foram
divididas em duas partes, conforme os sistemas utilizados: sistema stand-alone e o sistema
implantado no Hospital Edmundo Vasconcelos.
Atravs de todos os testes realizados, foi possvel concluir vrias questes sobre o sistema
utilizado em sua verso stand-alone, tanto referentes inspeo de usabilidade quanto aos
testes de usabilidade fora do ambiente hospitalar, que esto descritas a seguir.
A inspeo de usabilidade mostrou que a preciso da voz chegou a 95% de acerto, mesmo
com um treinamento da voz mnimo cerca de 2 minutos.
Isso prova que o sistema possui uma boa preciso do reconhecimento, podendo ainda ser
melhorado, se forem includas palavras novas ao vocabulrio inicial do sistema e tambm
havendo um treinamento mais aprofundado para os usurios, sobretudo aqueles com sotaque
pronunciado. Para se exemplificar o ganho que se teria, se a palavra quilovoltagem fosse
includa ao vocabulrio inicial do sistema, haveria uma diminuio do erro, em mdia, de
25.65%, pelos testes efetuados.
J os testes com um tom mais baixo que o habitual entre os usurios mostraram uma
caracterstica interessante: nenhuma das mulheres do grupo conseguiu inserir o laudo
utilizando um tom mais baixo da voz. J, entre os homens, todos conseguiram inserir o laudo,
tendo um no muito significativo decrscimo na taxa de reconhecimento da voz.
Provavelmente isso decorrente do timbre de voz mais grave.
O delay do sistema em apresentar o texto referente ao que estava sendo ditado, em tempo
real, foi bastante alto, chegando a quase 5 segundos, em alguns momentos. Segundo o
fornecedor do sistema, muitos especialistas sugerem que os mdicos radiologistas no olhem
para a tela enquanto esto ditando seu laudo, pois o delay interfere na cognio do usurio,
inserindo sobrecarga tarefa. Em testes com os voluntrios, havia um sentimento de que o
sistema no estava funcionando quando este delay era alto.
170
Os testes com interferncia sonora mostraram que este um requisito que influencia
fundamentalmente a preciso do reconhecimento de voz, devendo, o ambiente, se necessrio,
ser modificado para estar de acordo com as normas de rudo estabelecidas pela ABNT NBR
10152/1987 (2010).
Em relao ao requisito Dicionrio especfico para RIS, foi analisado que, segundo os testes
realizados neste trabalho, a massa de dados insuficiente para se afirmar que o dicionrio
inicialmente inserido no sistema de reconhecimento seja considerado aprovado ou reprovado.
Para que este requisito pudesse ser caracterizado de maneira apropriada, uma anlise de
todos os laudos gerados por todos os radiologistas durante certo intervalo de tempo
conseguiria medi-lo de maneira mais eficaz. Levando em considerao esta limitao, para os
testes realizados, apenas uma palavra no estava contemplada no dicionrio - quilovoltagem.
Esta palavra apareceu em todos os laudos examinados e representou, em mdia, 1.78% das
palavras presentes nos laudos.
O requisito Resoluo de Homnimos foi testado de maneira superficial, pois no foi levado
em considerao todas as palavras homnimas que poderiam aparecer no dicionrio do
sistema.
Houve dificuldade no uso de mtodos automticos de comparao das verses dos textos
original e gerada pelo ditado -, pois houve a necessidade de desconsiderar pontos tais como:
Diferenas de acentuao.
A incluso de uma ou mais palavras no texto eram tratadas apenas como 1 incluso.
171
Os dois equipamentos utilizados para a entrada dos laudos HeadSet Philips e SpeechMike
Philips se mostraram eficientes. Era esperada, segundo informao do fornecedor, uma
grande diferena de qualidade sonora, porm, pelos testes efetuados, a preciso no
reconhecimento se mostrou melhor com o HeadSet em condies de pouca interferncia
sonora. J com muita interferncia sonora, o SpeechMike foi melhor. A diferena expressiva
de custo e a ergonomia entre os dois equipamentos devem ser levadas em considerao na
aquisio de um ou outro equipamento.
O sistema de ajuda help foi considerado bastante superficial, entre os dois especialistas: o
help online no funcionou e no havia um sistema de buscas de palavras nem de contexto.
Os pontos considerados mais crticos, tanto entre os especialistas quanto entre os voluntrios
se referem aos requisitos de Falta de Visibilidade e Adequao do Feedback e
Recuperao de Erros.
Uma das razes apresentadas por um dos mdicos da equipe de Radiologistas do hospital
para o no uso da ferramenta refere-se ao fato dele digitar mais rapidamente do que o
sistema consegue transcrever. Este mdico tambm fala muito rapidamente, o que
ocasionaria uma queda de performance no sistema.
172
O tempo normal para que um laudo seja liberado no hospital de 3 dias, sendo comum que
atrasem at 5 dias.
Outro ponto importante mencionado pelo mdico que, quando o servio de digitao
utilizado, o mdico precisa reaver as imagens mdicas para confirmar o laudo; j no uso do
sistema de transcrio automtica, isso se torna desnecessrio devido ao imediatismo com
que o laudo fica pronto para uso.
Entre os pontos fracos na observao do uso deste sistema, percebeu-se que a taxa de
reconhecimento de voz foi bastante inferior ao apresentado pelo sistema stand-alone,
conforme foi apresentado no Quadro 71. Como este mdico utiliza o sistema de transcrio
automtica de radiologia de outro hospital, em verso mais atualizada, pode-se concluir que
esta verso instalada no Edmundo Vasconcelos capta mais as interferncias sonoras
externas do que as verses mais recentes conforme foi explicitamente dito pelo mdico.
Tambm foi percebido e confirmado pelo mdico que, nesta verso, o sistema possui grande
dificuldade em reconhecer epnimos, tal como T2 que reconhecido como tendes.
Segundo o mdico entrevistado e observado, que trabalha em outro hospital com o mesmo
sistema, em verso diferente, as principais melhorias no uso do sistema, em verso superior so:
8. CONCLUSES
Este trabalho apresentou uma reviso bastante extensa de temas relacionados pesquisa,
como Interface Homem-Computador, Interface do Usurio Baseada em Voz, Avaliao de
Interfaces, Requisitos de Usabilidade para VUI e Sistemas de Transcrio Automtica de
Laudos. De acordo com este amplo levantamento bibliogrfico, foi verificado que no h,
ainda, na literatura, trabalhos suficientes sobre como se avaliar, sob o ponto de vista da
usabilidade, tais aplicaes de maneira metodolgica.
Um estudo aprofundado sobre VUI foi realizado no Captulo 2, de onde surgiram vrios dos
artigos publicados (OLIVEIRA NETO; SALVADOR, 2007; SALVADOR; OLIVEIRA NETO;
KAWAMOTO, 2008; SALVADOR, OLIVEIRA NETO; GUIMARAES, 2009), alm de um
captulo de livro nacional (OLIVEIRA NETO; SALVADOR; KAWAMOTO; 2010) e dois
captulos de livros internacionais (SALVADOR; OLIVEIRA NETO; PAIVA, 2010; KAWAMOTO;
SALVADOR; OLIVEIRA NETO, 2010).
Houve uma preocupao de captar os requisitos especficos para aplicaes VUI, tratados no
item 4.3, assim como os requisitos estabelecidos para sistemas de transcrio automtica de
laudos no item 5.5, que deu origem aos requisitos estabelecidos na metodologia descrita no
Captulo 6 (SALVADOR; MOURA JR., 2010a; SALVADOR; MOURA JR., 2010b).
Esta metodologia consiste em se determinar como ser avaliado cada um dos requisitos
selecionados e classificados, segundo caractersticas como: tipo e mtodo de avaliao,
dificuldade e importncia da avaliao e mtricas que devem ser seguidas.
Com o intuito de validar a metodologia, foram realizadas as coletas dos dados das avaliaes
realizadas, junto a especialistas atravs do uso de avaliao por inspeo, sem interveno
do usurio. Tambm foram realizadas avaliaes junto a voluntrios no especialistas em
Radiologia, atravs de avaliao por testes de usabilidade. Outra avaliao por testes de
usabilidade se deu com um usurio final um mdico radiologista que trabalha em um
hospital-alvo da pesquisa que conta com o sistema j implantado.
Os dados foram, ento, analisados a fim de ser possvel estabelecer os pontos fortes e fracos
de tal metodologia e que melhorias pudessem ser apontadas. Esta fase de preparao para
os testes e anlise consta do Captulo 7 deste trabalho.
Entre os principais pontos fortes do sistema que foram percebidos e estudados possvel
destacar:
Por outro lado, foram considerados os seguintes pontos crticos dos sistemas avaliados:
O delay do sistema um fator crtico para o sistema, pois causa aumento da carga
cognitiva.
O trabalho visou a reduo de custos com testes de usabilidade, por ser conhecido na
literatura de IHC, que este um custo que pode ser impeditivo da avaliao de muitos
sistemas. Assim, procurou-se utilizar, ao mximo possvel, as tcnicas de inspeo que no
utilizam usurios finais e que diminuem significativamente o tempo e os custos das avaliaes.
177
O trabalho resultou num conjunto de trs componentes para avaliar sistemas de transcrio
automtica de laudos em Radiologia. Em cada um destes componentes, foi gerado um
guideline de como testar cada requisito.
Na parte que versa sobre a inspeo de usabilidade, foi criado um template que serve como
guia para cada requisito que deve ser testado. Este template contm: nome da mtrica,
mtodo de avaliao, participantes, material necessrio, roteiro, resultados e anlise.
Na parte que versa sobre os testes de usabilidade, foi levemente modificado o template
utilizado na fase anterior acrescido do item Orientaes aos Participantes. O conjunto destes
templates serve como guia para se testar a usabilidade junto a voluntrios.
J na terceira parte, que versa sobre testes de usabilidade por observao e questionrios
com usurios finais traz vrios formulrios que devem ser preenchidos pelo observador
quando fizer estes testes, trazendo um checklist do que observar.
Sendo assim, este trabalho serve de guia para a rea de TI de hospitais e clnicas
radiolgicas quando se deseja avaliar a compra de sistemas de transcrio automtica de
laudos, cada vez mais comuns no mercado interno. Tambm pode ser utilizado para se
verificar, quando se trabalhe com customizaes de tais sistemas, a usabilidade que se
deseja atingir e a que est atualmente vigente.
desejvel que a avaliao de usabilidade proposta atravs desta metodologia seja realizada,
ou comandada, por especialistas em usabilidade, pois necessria, mesmo para um
especialista, uma quantidade bastante grande de horas para, principalmente, a avaliao de
inspeo.
178
Outra medio de requisito que obteve uma resposta aqum do desejvel foi Dicionrio
especfico para RIS, pois a massa de dados utilizada para os testes insuficiente para se
afirmar que o dicionrio inicialmente inserido no sistema de reconhecimento de voz seja
considerado aprovado ou reprovado. Para que este requisito pudesse ser caracterizado de
maneira apropriada, uma anlise de todos os laudos gerados por todos os radiologistas
durante certo intervalo de tempo conseguiria medi-lo de maneira mais eficaz.
Tambm o requisito Resoluo de Homnimos foi testado, mas seria necessrio um teste
mais aprofundado: identificao, dentro do dicionrio do sistema, de todas as palavras
homnimas e ento testadas.
Embora Nielsen (1987) tenha abordado que a maioria das inspees de usabilidade dure em
torno de duas horas por participante, estas inspees demoraram bem mais de vinte horas
para serem efetivadas. Esta foi uma questo bastante decisiva na escolha de quando utilizar
somente um avaliador e quando utilizar dois.
Algumas limitaes nestas avaliaes - nas inspees de usabilidade e tambm nos testes de
usabilidade com voluntrios foram decorrentes do uso de um sistema stand-alone, pois:
Outro ponto a ser considerado, a quantidade de usurios voluntrios e finais utilizada nos
testes. Mesmo utilizando uma quantidade maior de usurios que Nielsen (1987) verse para os
testes de usabilidade, foi percebido que, para a avaliao de VUI, devem-se levar em
considerao muitas caractersticas intrnsecas da voz, tais como: sotaque, idade do usurio,
timbre, velocidade da voz, alm de caractersticas do prprio ambiente fsico - interferncia
sonora do ambiente e caractersticas das pessoas - resistncia ao uso destes sistemas e
expertise com o uso de computadores.
Um ponto bastante frustrante para a autora neste trabalho foi a dificuldade em conseguir
permisso nos hospitais para se fazer a pesquisa de campo. Mesmo utilizando uma
metodologia de avaliao que previa pouca interao com os mdicos radiologistas, muitas
barreiras foram criadas pelos hospitais e no puderam ser ultrapassadas. Um exemplo desta
barreira foi conseguir contatos na rea de TI nos hospitais de So Paulo que possuam o
sistema instalado. Mesmo depois de realizados os contatos, havia, em alguns hospitais, uma
barreira, s vezes intransponvel, para conseguir a continuidade do contato com pessoas de
TI e tambm observar os usurios finais utilizando o sistema.
O objetivo inicial deste trabalho era de que a metodologia pudesse ser aplicada a, pelo menos,
dois hospitais; porm teve que ser aplicada a apenas um hospital, por haver esta barreira
supracitada. Um amenizador para este problema foi que o mdico entrevistado no hospital
foco da pesquisa tambm trabalha no outro hospital que no foi possvel fazer a pesquisa de
180
campo; assim, este mdico pode dar uma contribuio significativa das diferenas entre os
dois sistemas, a partir do seu ponto-de-vista.
Embora tenham sido encontrados alguns pontos fracos supracitados nesta metodologia para
a avaliao de usabilidade de Sistemas de Transcrio Automtica de Laudos em Radiologia
e tambm as barreiras impeditivas para um melhor trabalho de campo, possvel dizer que
ela contribui significativamente para as necessidades de mercado na escolha de um sistema
mais amigvel ao usurio final, pois leva em considerao os requisitos gerais de VUI, mas
agora adaptados aos sistemas de ditado e tambm aspectos ligados a um sistema especfico
de Radiologia, focando sempre na satisfao do usurio final.
interessante lembrar que no existe, ainda, na literatura, uma metodologia similar que leve
em considerao requisitos gerais de VUI e de sistemas de ditado em Radiologia. Tambm
possvel destacar que esta metodologia no possui custos financeiros e nem de tempo
impeditivos, o que a torna factvel.
Vale ainda a pena ressaltar que, sendo a autora da rea de IHC, existe um desejo sempre
presente que os sistemas disponveis no mercado, tenham sempre atendidos critrios de
usabilidade focados no usurio final. desejo da comunidade de IHC que os sistemas
interativos se adaptem s necessidades do usurio e, no o contrrio, como possvel
observar em tantos sistemas presentes no cotidiano das pessoas. Sendo a voz uma das
formas mais naturais de comunicao entre pessoas, a possibilidade de ser, tambm, a voz,
uma forma mais natural de comunicao entre o homem e a mquina, necessrio que esta
forma de interao seja bastante intuitiva e amigvel aos usurios finais. Sendo assim, a
preocupao de se avaliar se os Sistemas de Transcrio Automtica de Laudos em
Radiologia vem de encontro a esta preocupao da comunidade de IHC.
181
182
A primeira contribuio como trabalho futuro sugerida para que se tenha mais
automatizao dos testes, tanto com especialistas em Usabilidade, quanto com usurios
voluntrios e finais, que no era o foco deste trabalho. O uso de agentes inteligentes que
possam captar os laudos, ditar os laudos atravs da sintetizao da voz e verificar os pontos
de no reconhecimento da voz permitiria que a base de testes fosse relativamente maior. Isso
diminuiria imensamente o tempo de avaliao por inspeo de software, considerada um dos
pontos problemticos para esta metodologia.
Alm disso, a aplicao desta metodologia a uma quantidade maior de hospitais e clinicas
radiolgicas que tenha o Sistema de Transcrio Automtica em Radiologia poderia dar uma
viso mais real de como estes sistemas esto atendendo, atualmente, a critrios ligados
usabilidade. Seria, ento, possvel propor melhorias ligadas Usabilidade e gerao de
polticas de incentivo ao uso destes sistemas nos hospitais.
Esta viso mais real do quadro nacional no uso destes sistemas poderia proporcionar uma
melhoria destes sistemas por parte do fabricante, entendendo melhor as necessidades dos
usurios finais.
VUI, tais como sistemas de consultas: sistemas de reservas de passagens areas, reserva de
hotis, consulta de horrios de vos e similares.
Pensando numa abordagem mais humana no uso de VUI para a rea de Radiologia, seria
desejvel verificar a existncia de - ou construir - um reconhecedor de voz brasileiro que
tenha um custo baixo ou inexistente para o seu uso. Assim, seria possvel construir um
Sistema de Transcrio Automtico de Laudos em Radiologia voltado a hospitais com poucos
recursos financeiros e que atendam comunidade de baixa renda. Isso desejvel a fim de
agilizar as consultas e os resultados dos exames de Radiologia, proporcionando um maior
bem-estar a estas pessoas.
O uso desta metodologia de avaliao, aqui utilizada para avaliar sistemas j disponveis no
mercado, poderia ser adaptada para ser incorporada ao processo de desenvolvimento do
software, a fim de melhorar os produtos que so vendidos no mercado, principalmente
atendendo os requisitos ligados satisfao do usurio. Isso seria possvel, inserindo os
usurios finais no processo de desenvolvimento do software. Este aspecto bastante
comentado pela comunidade de Engenharia de Software, porm, como de conhecimento da
rea, sempre so gastos recursos financeiros e de tempo insatisfatrios para melhorar os
aspectos ligados Usabilidade de sistemas.
184
REFERNCIAS BIBLIOGRFICAS
ALLEN, J., PERRAULT, C. Analysing intention in utterances. In: Artificial Intelligence 15, p.
143 - 178, 1980.
BHAN, S.N.; COBLENTZ, C.; NORMAN, G.R.; ALI, A.H. Effect of voice recognition on
radiologist reporting time. In: CARJ, v. 59, n. 4, October 2008.
CHAMBERLAIN, J. ELLIOTT, G., KLEHR, M., BAUDE, J. Speech user interface guide,
redpaper, s. l.: IBM, 2006.
COHEN, M. H., GIANGOLA, J. P., BALOGH, J. Voice User Interface Design, Boston: Addison
Wesley, ISBN 0-321-18576-5, 368 pginas, 2004.
CURTIS, B. How to choose good metaphors. In: IEEE Software, Austin, v. 11, n. 3, p. 86-88,
1994.
DENG, L., HUANG, X. 2004. Challenges in adopting speech recognition. In: Commun. ACM v.
47, n. 1, p. 69-75, 2004.
DIAH, N.M.; ISMAILl, M.; AHMAD, S.; DAHARI, M.K.M. Usability testing for educational
computer game using observation method. In: CAMP10 is the first international conference
on Information Retrieval and Knowledge Management. Shah Alam, Malaysia, 2010.
DYBKJAER, L.; BERNSEN, N.O. Usability issues in spoken language dialogue systems. In:
Natural Language Engineering, Special Issue on Best Practice in Spoken Language
Dialogue System Engineering, v. 6 Parts 3 & 4, p. 243-272, 2000.
DYBKJAER, L.; BERNSEN, N.O. Usability evaluation in spoken language dialogue systems.
In: Proceedings of the ACL 2001 Workshop on Evaluation Methodologies for Language and
Dialogue Systems, 2001.
DYBKJAER, L.; BERNSEN, N.O.; MINKER, W. Usability evaluation of multimodal and domain-
oriented spoken language. In: Proceedings of the Fourth International Conference on
Language Resources and Evaluation (LREC), v. 5, Lisbon, Portugal, p. 1695-1698, 2004b.
FENELON, S. Aspectos tico-legais em imaginologia. Radiol Bras v.36 n.1 So Paulo Jan,
Feb, 2003.
FOLEY, J. D., VAN DAN, A. Computer graphics: principle and practice. Reading: Addison
Wesley, 1990.
GIBBON, D., MOORE, R., WINSKI, R. (eds.): Handbook of standards and resources for
spoken language systems. Mouton de Gruyter, Berlin, New York, 1997.
GOLD, J. D., LEWIS, C. Designing for usability: key principles and what designers think. In:
Communications of the ACM, v.28, n. 3, p.300-311, 1985.
HUANG, X.; ACERO, A.; HON, H.W. Spoken language processing. New Jersey: Prentice Hall.
ISBN 0-13-022616-5, 2001.
HUNDT, W. et al. Speech processing in radiology. In: Eur Radiol n.9, p. 1451-1456, 1999.
HUNT, A., WALKER, W. A fine grained component architecture for speech application
development, Sun Microsystems, Inc., Technical Report: TR-2000-86, Mountain View, CA,
USA, 2000.
187
ISO 9241-11. Ergonomic requirements for office work with visual display terminals (VDTs) Part
11: Guidance on usability. ISO 1997.
KAMM, C., WALKER, M., RABINER, L. The role of speech processing in human computer
intelligent commu-nication. In: Speech Communication n.23, p. 263 - 278, 1997.
KANAL, K.M. et al Initial evaluation of a continuous speech recognition program for radiology.
In: Journal of Digital Imaging, v. 14, n. 1, p 30-37, 2001.
KAWAMOTO, A.L.; SALVADOR, V.F.M.; OLIVEIRA NETO, J.S. Requirements and guidelines
for the evaluation of voice user interfaces. In: Aleksandar Lazinica. (Org.). User Interfaces. :
InTechweb, 2010, v.1, p. 32-55.
KOMATANI, K.; UENO S.; KAWAHARA, T; OKUNO, H. G. Flexible guidance generation using
user model in spoken dialogue systems. In: Proceedings of the 4lst Annual Meeting of the
Association for Computational Linguistics, p. 256-263, July, 2003.
LAMEL, L.; MINKER, W.; PAROUBEK, P. Towards best practice in the development and
evaluation of speech recognition components of a spoken language dialog system. In:
Natural Language Engineering, v. 6, n. 3-4, United Kingdom Cambridge University Press,
p. 305 - 322, 2000.
188
LARSEN, L.B. Issues in the evaluation of spoken dialogue systems using objective and
subjective measures. In: Proceedings of IEEE Workshop on Automatic Speech Recognition
and Understanding (ASRU'03), St. Thomas, U.S. Virgin Islands, USA, p. 209-214, 2003.
LEVIN, E., LEVIN, A. Evaluation of spoken dialogue technology for real-time health data
collection. In: Journal of Medical Internet Research, v.8, n. 4, 2006.
LIANG, T. User interface design for decision support systems: a self-adaptive apporach. In:
Information & Management, New York, v. 12, n. 4, p. 181-193, April, 1987.
McGURK, S.; BRAUER, K.; MACFARLANE, T.V.; DUNCAN, K. A.: The effect of voice
recognition software on comparative error rates in radiology reports. In The British Journal
of Radiology, n. 81, p. 767770, 2008.
MCTEAR, M.F. Spoken dialogue technology: enabling the conversational user interface. In:
ACM Computing Surveys, v. 34, n. 1, p. 90169, March, 2002.
MITCHELL, P.P., A step-by-step guide to usability testing, Lincoln, NE: iUniverse , 2007.
MOHR, D.N. et al. Speech recognition as a transcription AID: A randomized comparison with
standard transcription. In: Journal of Medical Informatics, v. 10, n. 1, p. 85-93, 2003.
MLLER, S. A new taxonomy for the quality of telephone services based on spoken dialogue
systems. In: Proc. 3rd SIGdial Worksh. on Discourse and Dialogue, US-Philadelphia, p.
142-153, 2002.
189
MLLER, S. Quality of telephone-based spoken dialogue systems, New York, NY: Springer,
2005.
MYERS, B.A. User interface software tools. In: ACM Transactions on Computer-Human
Interaction, v. 2, n. 1, p. 64-103, March, 1995.
NIELSEN, J. Heuristic Evaluation. In: J. Nielsen (ed.) Usability Inspection Methods. John
Wiley, New York, 1994.
NIELSEN, J. (2000, March 19). Why You Only Need to Test with 5 Users. Disponvel em:
http://www.useit.com/alertbox/20000319.html. Acesso em 12/12/2010.
PARASURAMAN, A., ZEITHAML, V.A.; BERRY, L.L., SERVQUAL: A multiple-item scale for
measuring consumer perceptions of service quality. In: Journal of Retailing, v.64, n. 1,
1988.
PAULETT, J.M., LANGLOTZ, C.P. Improving language models for radiology speech
recognition. In: Journal of Biomedical Informatics, 42, p. 53-58, 2009.
190
PERNICE, K., NIELSEN, J. Eyetracking methodology: how to conduct and evaluate usability
studies using eyetracking, NIELSEN NORMAN GROUP, 2009. Disponvel em:
http://www.useit.com/eyetracking/methodology. Acesso em 20/12/2010.
PRESSMAN, R.S. Software Engineering. 7th ed., New York: Addison-Wesley, 2004.
PRICE, P. Evaluation of spoken language systems: the ATIS domain. In: Proceedings of the
Third DARPA Speech and Natural Language Workshop, Morgan Kaufmann, 1990.
ROBBINS, A.H. et al. Speech-controlled generation of radiology reports. In: Radiology n. 164,
p. 569-573, 1987.
RUBIN, J.; CHISNELL, D. Handbook of usability testing: how to plan, design and conduct
effective tests. 2nd ed., New York: John Wiley & Sons, 2008.
SALVADOR, V.F.M.; OLIVEIRA NETO, J.S.; PAIVA, M. G. Evaluating voice user interfaces in
ubiquitous applications. In: Milton Mendes; Pedro Fernandes. (org.). Designing Solutions-
Based Ubiquitous and Pervasive Computing: New Issues and Trends. Natal, RN: IGI
Global, 2010.
SALVADOR, V.F.M.; MOURA JR, L.A. Heuristic evaluation for automatic radiology reporting
transcription systems. In: 10th International Conference on Information Science, Signal
Processing and their applications - ISSPA 2010, Kuala Lumpur. Proceedings of 10th
191
SALVADOR, V.F.M.; MOURA JR, L.A. Evaluation methodology for automatic radiology
reporting transcription systems. In: 13th World Congress on Medical and Health Informatics
- MedInfo 2010, Cape Town. Proceedings of 13th World Congress on Medical and Health
Informatics - MedInfo 2010.
SALVADOR, V.F.M.; BRITTO, M.; MOURA JR, L.A.; ALMEIDA JR, J.R. Qualidade de dados
para gesto de conhecimento na rea de sade. In: XI Congresso Brasileiro de Informtica
em Sade, Florianpolis, 2006.
SALVADOR, V.F.M., ALMEIDA FILHO, F.G.V., A rea de Informtica em Sade sob aspectos
ticos. In: Revista Cadernos Centro Universitrio So Camilo, v. 12, n. 2, abril; junho
2006, ISSN 0104-5865.
SHNEIDERMAN, B. The limits of speech recognition. In: Communications of the ACM, v. 43,
n. 9, p. 24 27, September, 2000.
192
SONNENBERG FA, BECK JR. Markov models in medical decision making: a practical guide.
Med Decis Making, v. 13, n. 4, pp. 322-38, 1993.
SUHM, B., MYERS, B., WAIBEL, A. Multimodal error correction for speech user interfaces. In:
ACM Transactions on Computer-Human Interaction, v. 8, n. 1, p. 60-98, 2001.
SUTCLIFFE, A., GAULT, B. Heuristic evaluation of virtual reality applications. In: Interacting
with Computers 16, New York: Elsevier, 2004.
VAVASSORI, F.B., LOH, S. Mtodo heurstico para avaliao e projeto de interfaces homem-
software. Trabalho de Concluso, Pelotas: Universidade Catlica de Pelotas, 1995.
VOLL, K., ATKINS, S., FORSTER, B. Improving the utility of speech recognition through error
detection. In: Journal of Digital Imaging, v. 21, n 4, p. 371-377, 2008.
WALKER, M. PARADISE: A framework for evaluating spoken dialogue agents. In: Proc. of the
Association of Computational Linguistics (ACL), p. 271 - 280, 1997.
ZUKERMAN, I.; LITMAN, D. Natural language processing and user modeling: synergies and
limitations. In: User Modeling and User-Adapted Interaction n. 11, p.129-158, Khuwer
Academic Publishers, Netherlands, 2001.
194
APNDICES E ANEXOS
195
PARTICIPANTES DO TESTE
199
Prezado(a) Senhor(a),
Atenciosamente,
captadas em fotografia ou outros meios aptos reproduo, autorizando-a tambm a edit-las, alter-las ou
adapt-las, a seu exclusivo critrio, bem como, sincroniz-las com msicas ou outros sons. A pesquisadora
tambm autorizada a utilizar, reproduzir e exibir a imagem mencionadas, isoladamente ou em conjunto com
outras imagens, nos seguintes materiais: folhetos em geral (encartes) , anncios para revistas e jornais,
reportagens, filmes, cartazes, mdia eletrnica, programas televisivos, materiais didticos (para aulas,
palestras, conferncias, congressos etc.), e outros suportes materiais que podem ser reproduzidos por
terceiros, tais como, DVD, CD-Rom, DVD-Audio, CD etc., todos destinados divulgao das campanhas e das
atividades desenvolvidas pela pesquisadora bem como, dos servios por ela prestados, que poder ser feita
ao pblico em geral. A presente autorizao concedida por prazo indeterminado e a ttulo gratuito, definitivo,
irrevogvel e irretratvel, abrangendo o uso, a reproduo e exibio da imagem e da voz acima mencionadas
em todos os veculos de comunicao existentes, nada podendo ser reclamado a ttulo de pagamento ou de
indenizao, obrigando a todos por si e por seus herdeiros.
So Paulo, de de 2010 .
___________________________________________________
(Assinatura)
Testemunhas:
1- _________________________________ 2 - ______________________________
RG n RG n
202
PLANO DO OBSERVADOR
DELAY DO SISTEMA
Medio 1 Medio 2 Medio 3 Medio 4 Medio 5 Mdia
(Segundos)
NATURALIDADE DA FALA
O usurio fala de maneira natural, ou seja, nem muito pausado nem muito rpido ( ) Sim ( ) No
Observaes:
O usurio insere pontuao explicitamente ( ) Sim ( ) No
Observaes:
O sistema coloca pontuao automaticamente ( ) Sim ( ) No
Observaes:
O usurio fez interjeies durante a gravao do laudo ( ) Sim ( ) No
Observaes:
O sistema ignorou as interjeies do usurio ( ) Sim ( ) No
Observaes:
O usurio falou em tom normal ( ) Sim ( ) No
Observaes:
INTERFERNCIA SONORA
Medio 1 Medio 2 Medio 3 Medio 4 Medio 5 Mdia
(db)
RECUPERAO DE ERROS
O usurio refez parte do texto depois do ditado ( ) Sim ( ) No
Observaes:
Quantas palavras foram editadas
Observaes:
O usurio inseriu palavras novas no sistema ( ) Sim ( ) No
210
Observaes:
O usurio formatou o texto ( ) Sim ( ) No
Observaes:
SOBRECARGA COGNITIVA
O usurio olhou para a tela enquanto ditava o laudo ( ) Sim ( ) No
Observaes:
O usurio fez hesitaes quando o texto apresentava delay para aparecer na tela ( ) Sim ( ) No
Observaes:
O usurio dita o laudo e j faz a formatao explcita (ditada) do laudo ( ) Sim ( ) No
Observaes:
211
So seguidas as disposies da ABNT - NBR 10152 e as normas brasileiras correspondentes (ABNT - NBR
10152, 2010)..
DE USABILIDADE
214