You are on page 1of 18

Introduo ao MINITAB ca

Disc. Informtica Mdica, FMUSP a e 28 de julho de 2003


Resumo MINITAB o principal aplicativo que utilizaremos ao longo do curso e para manipulao de dados e clculos estat ca a sticos. Para este curso pressupe-se que o aluno tenha um dom o nio de uso de principais recursos de um computador com sistema operacional Windows e de navegao na ca Internet por meio de navegadores.

Sumrio a
1 Objetivos 2 Tarefas bsicas: Criao de diretrio a ca o 3 Por que MINITAB? 4 Manipulao de dados ca 4.1 Entrada de dados: abrindo planilha de dados . . . . . 4.2 Visualizando a planilha de dados . . . . . . . . . . . . 4.3 Entrada de dados: preenchimento manual da planilha 4.4 Salvando dados . . . . . . . . . . . . . . . . . . . . . . 4.5 Administrador de projeto em MINITAB . . . . . . . . 4.6 Copiando e colando dados . . . . . . . . . . . . . . . . 5 Manipulao da Planilha e Clculo ca a 5.1 Obtendo subconjunto da planilha . . . . . . . 5.2 Ordenando o banco de dados: comando Sort . 5.3 Gerando um padro seqencial simples . . . . a u 5.4 Gerando um padro seqencial aletrio . . . . a u o 5.5 Salvando o projeto . . . . . . . . . . . . . . . 3 3 4 5 6 7 9 11 12 13 14 14 15 18 18 19

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

1


Objetivos
Objetivos desta aula  Ao nal desta aula, o aluno dever ser capaz de: a Descrever e manipular com os conceitos de disco rigido, organizacao de disco r gido em diretrios, arquivo eletrnico, tipo de arquivo o o eletrnico em sistema Windows. o Criar, nomear, preencher e apagar estrutura de armazenamento em diretrios. o Utilizar navegador de Internet para acessar um site, ler e copiar seu conteudo de tela, copiar arquivos de dados para um diretrio eso pec co criado previamente. Inicializar os aplicativos MINITAB e Excel. Realizar as operaes bsicas no MINITAB com as opes de menu co a co File, Manip e Calc.

Tarefas bsicas: Criao de diretrio a ca o

Inicialmente vamos criar um diretrio na raiz do disco C: onde armazenaremos o todos os arquivos gerados nesta aula prtica. No Windows, as unidades de a armazenamento (discos r gidos, leitoras de CD, leitora de disquete e outras unidades remov veis) so identicadas por uma letra do alfabeto seguida de a dois pontos, por exemplo A:, c: e F:. No sistema Windows, para identicao ca de unidade de armazenamento, nomes de arquivos e diretrio pode se utilizar o caixa alta ou baixa. Assim indiferente no sistema Windows usar A: ou a: e para unidade de disquete e os nomes de arquivos dados.doc e Dados.doc. Nos sistemas operacionais MacOS e Linux, esses dois nomes representariam dois arquivos distintos. Portanto muito cuidado. H regras espec a cas para formao de nomes de arquivos e diretrios para cada um dos sistemas operacica o onais; no Windows para formao de nomes pode se utilizar letras minsculas ca u e maisculas), d u gitos, espao e praticamente todos os s c mbolos dispon veis no teclado, exceto alguns que tm funes espec e co cas, tais como : (utilizado na identicao de unidade de armazenamento), ?, *, /, <, , > e \. Quando se ca tenta utilizar um desses s mbolos proibidos, Windows acusa imediatamente com uma mensagem de erro. Trs recomendaes: e co a) no utilize acentuao para nomear arquivos, pois dependendo da cona ca gura ao espec c ca de um dado computador os nomes podem no ser reconhea cidos; 3

b) Se utilizar espaos em nomes de arquivo, inclua somente um em cada c posio; ca c) Windows permite utilizar at 32 caracteres para nomes de arquivo, pore tanto aproveite essa possibilidade para identicar os arquivos com nomes ou mnemnicos que faam sentido e sejam facilmente reconhecidos no futuro por o c voc e seus colegas sobre o que contm os arquivos. e e Nas unidades de armazenamento os arquivos de dados e de programas so a guardados em estrutura hieraquicamente organizada em diretrios e subdio retrios. o   Primeiras tarefas: Utilizando Windows Explorer ou outro mtodo que conhea, crie e c uma pasta (tambm conhecida como diretrio) denominada e o MPT164a partir da raiz do disco C:. Em seguida crie outra pasta com as iniciais de seu nome, por exemplo ABC, dentro da pasta MPT164. Muito bem, se realizou corretamente os dois passos anteriores, voc deve ter uma estrutura de diretrio e o com o endereo C:\MPT164\ABC. c Com o computador conectado ` Internet, poss baixararquivos a e vel de um site ou servidor por meio de um navegador, tais Explorer ou Navigator. Nessa aula prtica de introduo ao MINITAB, impora ca taremos e manipularemos um arquivo de dados em formato Excel (arquivo com extenso XLS). Para baixar o arquivo exames.xls ena tre no site http://www.usp.br/fm/dim/minitab/pratica/index.htm e siga as instrues. Ao ser indagado onde o arquivo ser armazenado, co a escolha o diretrio recm criado, C:\MPT164\ABC. o e   Utilizando o Window Explorer poss visualizar a estrutura de diretrios e vel o do disco r gido. Observe na gura abaixo o diretrio C:\MPT164\ABC: o

Por que MINITAB?

Optamos por MINITAB porque, alm de a USP disponibilizar uma licena inse c titucional a todos pesquisadores ou alunos da USP em suas atividades de ensino e pesquisa nos Campi da USP, ele: Apresenta organizao de menus semelhantes aos de aplicativos comuca mente utilizados, como processador de texto Word e planilha eletrnica o Excel, facilitando seu aprendizado; e Incorpora uma srie de recursos de manipulao de dados, de confeco e ca ca de grco e de rotinas de anlise estat a a stica mais importantes que iro a satisfazer a maioria das necessidades de estudantes e pesquisadores na a rea de biomdica. e

Manipulao de dados ca

Pretende-se introduzir o MINITAB, mostrando algumas rotinas de manipulao ca de arquivos que sero uteis para resoluo de problemas prticos de anlise de a ca a a dados em medicina. No poss a e vel esgotar todas as possibilidades e recursos oferecidos pelo MINITAB em poucas aulas, mas esperamos poder mostrar algumas novas perspectivas de uso prtico de um pacote estat a stico que tambm e tem os principais recursos de um programa de planilha eletrnica, semelhante ao o Excel, da Microsoft, ou OpenOce, este um programa livre. Para aqueles mais curiosos, sugere-se a leitura de manuais eletrnicos do MINITAB dispon o veis no site da MINITAB (www.minitab.com), que tambm est disponibilizado na e a DIM (www.usp.br/fm/dim/minitab/pratica/index.htm). Os testes estat sticos propriamente ditos sero introduzidos ao longo das aulas prticas subseqentes. a a u

4.1

Entrada de dados: abrindo planilha de dados

1) Inicie MINITAB e abra a planilha exames.xls, que voc acabou de transferir e do site, utilizando a opo File ca Open Worksheet..., entre no diretrio de o trabalho C:\MPT164\ABC ou outro que voc criou, e se o arquivo exames.xls e no aparecer na janela de seleo, no se desespere, selecione na janela Files a ca a of type a opo Excel (*.xls), que ele aparecer. Basta selecion-lo e clicar ca a a no boto Open. A funo de Files of type um ltro que permite visualizar a ca e tipos espec cos (no Windows a extenso, ou seja os trs caracteres nais depois a e do ponto, dene o tipo de arquivo) de arquivos em uma determinada pasta na janela de seleo. ca

Dica: Nas opes de menu, trs pontos (...) indicam que h janela adicional co e a para seleo de opes ou preenchimento de parmetros ou valores. Da mesma ca co a forma, o tringulo ( ), ` direita da opo de menu, indica que esse item expandea a ca se em outras opes. co

4.2

Visualizando a planilha de dados

Aps clicar no boto Open da janela Open Worksheet, voc deve estar obo a e servando a janela do MINITAB com o seguinte aspecto:

Antes de prosseguir, vamos identicar os elementos que compem a janela o de planilha MINITAB, mostrada na metade inferior da tela: Note que os dados de cada pacientes esto organizados em linhas, identia cadas na coluna ` esquerda enumeradas a partir de 1. a Observe que cada coluna, denominada varivel, tem uma pr-identicao, a e ca a letra Cseguida de um nmero seqncial, C1, C2, C3, etc. Essa identiu ue cao est mostrada na primeira linha da janela de planilha (Worksheet) ca a do MINITAB. Alm disso, na segunda linha observa-se outro identicae dor opcional que, neste caso, foi automaticamente importado da planilha Excel. Abrindo-se a planilha exames.xls no Excel nota-se que este identicador est localizado na primeira linha da planilha, que no Excel a e denominado cabealho. No processo de converso, o MINITAB reconhece c a automaticamente a presena dos cabealhos e converte-os para compor c c a segunda linha de identicadores da planilha MINITAB. Dica impora c mbolos especiais (com exceo de ca tante: No utilize espaos ou s h fen baixo) para compor nome de identicadores; recomendase inciar o nome com uma letra. Em uma operao que realizar no MINITAB e necessite selecionar uma ca ou mais variveis, pode se utilizar qualquer um dos dois identicadores a 7

dispon veis indiferentemente. Nesta planilha, os pares C1 e PACIENTE, C2 e DN, C3 e IDADE, C4 e SEXO, C5 e CLIN, etc, identicam as mesmas colunas de dados. Note tambm que o identicador C2 seguido pela letra D, separados e e por um h fen e C4, C5, C6 e C7 por T, enquanto os demais no vm a e acompanhados por nenhuma letra. Estas colunas sem letras so variveis a a do tipo numrico; observe que nestas colunas que os nmeros esto alie u a nhados direita. A letra T identica as variveis do tipo texto e seu a a alinhamento ` esquerda. Portanto, muita ateno: um conjunto de daea ca dos aparentemente numricos pode estar codicado em tipo texto e se e voc tentar realizar clculos numricos com essas colunas, MINITAB ir e a e a acusar erro ou voc observar um resultado bisarro. Dica: Por erro e a ou incompatibilidade de codicao entre os programas que geca rou os dados e MINITAB, pode ocorrer de dados originalmente numricos serem importados como dados textuais. Neste caso e no ser poss a a vel realizar operaes numricas com esta varivel. co e a Portanto esteja muito atento com este detalhe. Este problema pode ser consertado com o comando Manip Change Data Type Text to Numeric. a) Na primeira linha da planilha, observa-se a identicao padro das ca a colunas, ou variveis, do MINITAB, enumerada a partir da esquerda com a a letra Cseguida de um nmero inteiro, i.e., C1, C2, C3 e assim por u diante. Adicionalmente, na coluna da varivel data de nascimento, DN, a a identicao padro, C2, seguida h ca a e fen e D, de data. As colunas em que os dados so codicados por textos so complementadas por T, a a de texto. Observe que as colunas com valores numricos no tm esses e a e suxos. b) A segunda linha est reservada para inserir um nome de fantasia para a dar um mnemnico associado aos dados de cada coluna. Neste caso, as o identicaes de variveis foram importadas da planilha Excel, portanto co a no houve necessidade de seu preenchimento. Abra esse mesmo arquivo a com Excel para ver como esse banco de dados aparece na planilha Excel, em particular os nomes de variveis. Na planilha MINITAB, pode-se editar a o nome das variveis clicando duas vezes sobre a clula. Nas operaes, a e co clculos e manipulaes do MINITAB, voc poder utilizar a identicao a co e a ca de coluna numrica (C1,C2, ...) ou nome de variveis. Veremos isso mais e a adiante.

4.3

Entrada de dados: preenchimento manual da planilha

Vamos abrir uma nova planilha MINITAB usando o comando File New Minitab Worksheet. Como exerc cio, em que armazenaremos dados de nomes de seus colegas, idade e cidade de nascimento. Portanto ser uma planilha com trs variveis em que usaremos os identicdadores a e a NOME, IDADE e CIDADE NASC, por exemplo. Entrando com idencador de variveis. Usando o mouse, clique na a clula de identicao de C1, na segunda linha, e entre NOME. Faa o e ca c mesmo para as outras variveis. a

Vamos entrar com o seguinte pequeno conjunto de dados: 1 2 3 Nome Paulo Silva Marins Sanchez e Clvis Concravo o Idade 17 19 21 Cidade natal So Paulo a Bauru Votuporanga

Antes de fato iniciarmos a digitao, note que podemos entrar de uma vez ca com todos os dados de uma coluna ou de uma linha. Suponha que seja mais lgico/conveniente entrar com todos os dados de um linha, ou seja com todos o os dados de um sujeito. Para uma dada clula, em gera, nalizamos a entrada e pressionando a tecla <Enter> e seria conveniente que o cursos apontasse a prxima clula ` direita. No MINITAB podemos controlar isso selecionado o e a o sentido da seta localizada no canto superior esquerdo da janela de planilha. Nesse momento a seta deve estar voltada para baixo,, e a tecla <Enter> dever a mover o cursor para a prxima abaixo na mesma coluna. Para mudar a direo o ca clique uma vez sobre a seta e isso dever mudar o sentido da seta para direita, a . Agora entre com os trs dados na planilha. Terminado uma linha, voc e e dever posicionar o cursor na primeira casa da linha seguinte por meio do mouse a ou usando as teclas de movimento. Uma vez preenchido, a planilha deve estar com o seguinte aspecto:

Note que 1) a largura da coluna se ajusta automaticamente ao contedo das u clulas, 2) o tipo de varivel determinado pelo contedo daquela coluna, e 3) e a e u os contedos das variveis tipo texto cam alinhados ` esquerda e os do tipo u a a numrico ` direita. e a Dica: se o programa utilizado no foi desenvolvido tendo em considerao a ca as acentuaes da l co ngua portuguesa, no as utilize antes de testar o programa a de computador para dois aspectos: primeiro, apresentar consistncia na come parao textual de palavras, por exemplo se gal igual a gala e laco igual ca ae e lao; em segundo, se ordena consistentemente as palavras acentuadas e as que c usam ce-cedilhados. Um jeito seguro no usar acentos nem cedilhas. e a

10

4.4

Salvando dados

No MINITAB pode se salvar e recuperar trs tipos de arquivos: projeto, planie lha e grcos. O projeto em MINITAB uma maneira conveniente de organizar a e e armazenar todos os arquivos de dados, grcos e sesses de anlise sobre um a o a determinada tarefa. Primeiro vamos dar um nome ` planilha que acabamos de a criar e salv-la usando o comando File Save Current Worksheet, e na jaa nela Save in selecione o diretrio de trabalho atual, C:\MPT164\ABC, com o o nome colegas.mtw. A extenso MTW associada por conveno ao aquivo a e ca de planilha MINITAB. H, alm de MINITAB, os formatos Excel, Quatro Pro a e

e 1-2-3 de planilha, que podem ser usados para exportar dados para uso em outros programas de anlise. Aqui salvaremos os dados em formato MINITAB. a Nota: Embora a planilha no MINITAB tenha uma organizao matricial em coca lunas e linhas, ela tem uma diferena fundamental em relao `s planilhas do Exc ca a cel, Quattro Pro ou 1-2-3, as suas clulas comportam valores, mas no frmulas. e a o Devido a isso, no clculo realizado usando o comando Calc as operaes so a co a realizadas com os contedos de colunas e resultado armazenado em uma coluna u escolhida na operao. ca

11

4.5

Administrador de projeto em MINITAB

MINITAB permite organizar as anlises de dados ou tarefas em projetos. O a projeto permite juntar sob uma identicao, ou concretamente em um arquivo ca tipo projeto. O contedo do projeto pode ser visualizado abrindo-se a janela de u Administrador de Projeto. Abrindo Administrador de Projeto: Execute Windows Project Manager ou pressionado o atalho <Ctrl+I> para ver o contedo do projeto. u

Note que a este projeto esto associadas, por ora, duas planilhas, exames.xls a e colegas.MTW, sob a pasta Worksheets. Alm dessa pasta h quatro outras e a denominadas Session, History, Graphs, ReportPad e Related Documents. Por exemplo, a pasta Session contm todas as datas e horas em que o projeto foi e criado e aberto; History, as operaes realizadas com as planilhas; Graphs, a co relao de todos os grcos gerados, que por ora est vazia. ca a a A pasta Columns, dentro da colegas.MTW, contm informaes sobre cada e co coluna ou variveis, i.e. Name (Nome das variveis), Id (identicao padro), a a ca a Count (nmero de dados), Missing (nmero de dados ausentes), Type (tipo de u u dados) e Description (uma descrio sobre a varivel que pode ser introduzida ca a na janela Column Description clicando-se o boto direito do mouse sobre a a coluna de planilha desejada, ento selecionando Column Description). As a colunas com descri oes apresentam um pequeno tringulo vermelho no canto c a superior direito na casela com identicador da varivel. a Introduza uma pequena descrio nas variveis da planilha colegas.mtw. ca a

12

4.6

Copiando e colando dados

Uma maneira prtica de transferir dados entre diversos aplicativos copiando a e e colando contedos. u Antes, abra uma nova planilha por meio de File New Minitab Worksheet.

Em seguida, abra a planilha exames.xls com o aplicativo Excel. Marque os dados PACIENTE, DN, IDADE E SEXO dos dez primeiros pacientes da planilha exames.xls; copie o contedo com o comando Edit u e Copy ou simplesmente <Ctrl+C> Na planilha MINITAB, clique na primeira casela de dados do canto superior esquerdo e cole o contedo com o comando Edit u Paste Cells ou simplesmente <Ctrl+V>.

13

Manipulao da Planilha e Clculo ca a

A barra de menus do MINITAB apresenta 4 opes principais de nosso inteco resse Manip, Calc, Stat e Graph. A opo Manip de manipulao da planilha ca ca permite separar ou juntar planilhas segundo algum critrio de seleo. Copiar e ca contedo de uma ou mais colunas para outras colunas. Empilhar os contedos u u de duas ou mais colunas em uma coluna. Transpor a planilha, que muito util e se, por exemplo, os dados importadas estiverem organizadas em linhas e desejamos analis-los no MINITAB que requer que os dados estejam organizados em a colunas.

5.1

Obtendo subconjunto da planilha

Vamos trabalhar com a planilha exames.xls. Observe que h 705 casos ou sujeia tos neste banco de dados. Suponha que queiramos separar os casos de mulheres e criar uma nova planilha. Selecione a planilha exames.xls, usando, por exemplo, o comando Window exames.xls. Execute Manip Subset Worksheet...

Selecione Specify which rows to include e clique Rows that match Condition Com o cursor na janela Condition, selecione a varivel SEXO e coma plete a expresso, SEXO = F. Em computao este tipo expresso a ca a e denominado expresso lgica e o resultado pode ser falso ou verdadeiro, a o que, no caso do MINITAB, resulta em valor zero (para falso) ou um (verdadeiro). Observe que o identicador de varivel est entre apostrofes e a a a constante tipo texto, letra F, entre aspas. Aspas e apostrofes so denoa minados delimitadores. No se usa delimitadores para valores numricos. a e A planilha resultante deve ter 448 casos de mulheres neste banco de dados:

14

5.2

Ordenando o banco de dados: comando Sort

Na prtica, freqntemente necessitamos ordenar o conjunto de dados por algum a e critrio para realizarmos uma anlise dos dados. e a O comando Manip Sort realiza a ordenao na prpria planilha, sem criar ca o uma nova planilha. Assim, se quisermos preservar a planilha original devemos criar uma copia antes de prosseguir Crie uma cpia da planilha exames mulheres.mtw com o comando File o Save Worksheet As preenchendo o campo File name: com um novo nome exames mulheres idade. Vamos salv-lo no formato Minitab (exa tenso MTW), selecionando no campo Save as type. a

15

Como voc j deve estar desconando, vamos ordenar o banco de dados e a em ordem crescente de idade. Execute o comando Manip Sort...

Clicando inicialmente dentro da janela Sort Column(s), selecione todas as variveis na janela a direita e pressione Select; em seguida clique dena ` tro da janela Store sorted column(s) in e selecione novamente todas as variveis na janela ` esquerda. Finalmente clique uma vez no pria a meiro campo Sort by Column e selecione varivel IDADE no campo ` a a esquerda.

Com estas seleo, todos os dados vo ser classicados em ordem cresca a cente de IDADE das pacientes. Como todas as variveis foram selecionaa das tanto para ordenao como para campo destino, o resultado nal da ca operao ser armazenado nas mesmas colunas. ca a Pressionando OK, voc deve estar observando o seguinte resultado: e Cheque se a relao horizontal dos dados foi preservada, vendo, por exemca plo a PACIENTE 27 na planilha original exames.xls.

16

Questo da Lista de Exerc a cio

Qual a idade da septuagsima quinta (75a.) paciente desta lista ordenada? e e Responda esta questo no Sistema de Prova. Se voc realizou corretamente a e todos os procedimentos at aqui, esta paciente deve seguir a paciente 676 e  

17

5.3

Gerando um padro seq encial simples a u

Na prtica, costuma-se enumerar seqencialmente um conjunto de casu a u stica para facilitar a identicao dos dados ou ordenar aleatorialmente um grupo de ca pacientes para sortear dois ou mais tipos de tratamento em um teste cl nico. Enumerando os dados: Salve a planilha exames mulheres idade.mtw alterando o nome para exames mulheres enumeradas.mtw com o comando File Save Current Worksheet As... Observe que esta planilha tem 15 colunas. Criando uma coluna de enumerao. Execute Calc ca Data Simple Set of Numbers Make Patterned

Entre com os parmetros mostrados na gura. Com esses parmetros a a iremos gerar uma seqncia aritmtica simples, iniciando em 1 com passo ue e 1. O campo To last value: foi preenchido com 448 porque o nmero de e u pacientes do sexo feminino no nosso banco de dados. D uma conferida! e Pressione OK e veja a coluna C16.

5.4

Gerando um padro seq encial aletrio a u o

Utilizando a mesma planilha, exames mulheres enumeradas.mtw, vamos gerar uma seqncia de nmeros aletrios para depois reordenar o conjunto de dados ue u o baseado nos nmeros aletarrios recm gerados . u o e Pressione Calc Random Data e observe as opes de distribuies co co de probabilidade que voc dispe para gerar o seu nmero aletatrio. Para e o u o o nosso propsito, qualquer uma das alternativas seria boa, mas utilizareo mos a opo Uniform..., que gera um conjunto de nmero reais aleatrios ca u o entre 0 e 1, inclusives, com igual probabilidade de ocorrncia neste intere valo. Armazenaremos o resultado na coluna C17. Observe o resultado na planilha 18

Ordenando a planilha de dados em ordem decrescente do valor aleatrio o gerado na coluna C17. Execute Manip Sort..., selecione de as primeiras 17 colunas nos campos Sort Column(s): e Store sorted column(s) in:. Uma forma alternativa de se selecionar essas colunas cont guas usar a notao e ca da identicao padro: C1-C17. Selecione a C17 para o campo Sort by ca a Column e clique no Descending (em seqncia descendente). Vide gura. ue

5.5

Salvando o projeto

Salvando-se o projeto, armazena-se dentro de uma estrutura organizada todas as planilhas, sesses e grcos por ventura gerados. o a Salvando projeto: Execute File Save Project As e salve o projeto com o nome aula1 ou com suas iniciais.

19