You are on page 1of 17

Quarto Mdulo

Apostila
Em 1988 o governo americano lanou o primeiro banco de dados pblico contendo sequncias de DNA dos mais diversos organismos. Este repositrio de seqncias recebeu o nome de Centro Nacional para Informao em Biotecnologia (NCBI-National Center for Biotechnology Information). Hoje este centro tem vrias ramificaes no mundo inteiro e alm do banco de dados propriamente dito, o NCBI proporciona um grande nmero de ferramantas de informtica e recursos para auxiliar o cientista na pesquisa gentica. A utilizao cada vez maior da informtica no estudo da pesquisa bilogica e ainda mais especficamente no estudo dos genes deu origem disciplina conhecida como bioinformtica. A bioinformtica ainda considerada uma recente subdiviso da biotecnologia e representa o casamento da biotecnologia com a informtica. De modo simples, bioinformtica consiste no depsito e anlise de sequncias genticas em bancos de dados e consequente manipulao e anlise destas sequncias com a utilizao de software especficos. O estabelecimento de bancos de dados pblicos possibilita que os cientistas possam ter acesso informao proveniente de outros laboratrios e possam tambm trocar e compartilhar seqncias genticas. Todos os dias novas seqncias so depositadas no banco de dados pbicos do NCBI, o chamado GenBank. A bioinformtica tem revolucionado o desenvolvimento da pesquisa mdicobilogica e tem possibilitado que novas descobertas relevantes sejam realizadas quase todos os dias. Hoje a maioria dos bilogos envolvidos com a pesquisa gentica no esto restritos apenas ao trabalho de laboratrio devendo os mesmos dedicar grande parte do seu tempo bioinformtica.
2) 3) 4) 4)

da oficina prtica de Gentica, Genoma e Biotecnologia

www.odnavaiaescola.org
Mdulo Introduao Bioinformtica Contedo destec-DNA 1) Sntese de Gene-bank e banco de sequncias Pesquisa BLAST, Comparao de sequncias Mapa de restrio

Anotao de genomas Este texto foi escrito por Francisco Prosdocimi (transcrito com permisso do autor). Este artigo foi baseado, principalmente, no artigo da Revista Nature Reviews, volume 2, julho de 2001, pginas 493-505, Genome annotation: from sequence to biology, que foi escrito por Lincoln Stein. Por milhares de anos, rabinos tm trabalhado sobre os textos do Torah, tentando fazer com que esse livro sagrado, to difcil de ser entendido, seja traduzido num conjunto de regras e condutas mais claras, de forma a montar uma verso compreensvel desse texto, conhecida como Talmud. Com o passar do tempo, a grande quantidade de anotao contida no Talmud chegou a ultrapassar, de longe, o tamanho do texto original, o Torah. A mesma analogia pode ser feita para os genomas. A seqncia de DNA uma fonte rica de informaes sobre a biologia dos organismos, mas deve ser traduzida e anotada de forma correta para que possamos obter corretamente essas informaes. A anotao genmica consiste num processo de vrios passos, havendo, mais ou menos, trs

Todos os direitos reservados DNA Goes to School, Inc 2004

categorias bsicas: a anotao em nvel de nucleotdeos, anotao em nvel de protenas e anotao em nvel de processo. Na anotao em nvel de nucleotdeos procura-se encontrar a localizao fsica das seqncias de DNA e descobrir onde esto os genes, RNAs, elementos repetitivos, etc. Na anotao em nvel protico procura-se descobrir a provvel funo dos genes, identificando quais so aqueles que determinado organismo possui e quais ele no possui. J a anotao em nvel de processo procura identificar as vias e processos nos quais diferentes genes interagem, montando uma anotao funcional eficiente. Chico On Line. Prosdocimi, F. 2001-2.

Como as seqncias esto depositadas no GenBank?


Para que voc possa realizar as atividades interativas voc tem que entender como as seqncias de DNA e RNA esto depositadas no GenBank. As sequncias esto sempre depositadas em forma de fita nica, mesmo que seja um fragmento de DNA. Isso porque quando o DNA transcrito para a forma de RNA apenas uma das fitas transcrita, a que chamamos de fita senso. A outra fita complementar molcula de DNA, chamada de fita anti-senso no transcrita para a forma de RNA. Deste modo, apenas a fita senso de DNA depositada no banco de dados. claro que isso vlido para os casos onde o gene conhecido. Quando no se conhece o gene, qualquer uma das fitas pode ser a fita depositada. Mas no se preocupe porque s trabalharemos com genes conhecidos. Ento, o primeiro ponto que voc tem que ter em mente que a fita de DNA depositada a fita senso, que transcrita para a forma de RNA. O segundo ponto que voc deve saber que a molcula de RNA mensageiro, apesar de, na realidade, corresponder fita complementar do DNA , no est depositada no Genbank desta forma. Ao invs disso, o RNA mensageiro depositado no GenBank semelhante fita senso de DNA. Ento qual a diferena entre a fita senso de DNA e fita de RNA mensageiro depositadas no GenBank? A diferena est no fato de que o RNA mensageiro constitui apenas os exons da molcula de DNA pois os introns so removidos durante o processo de edio do RNA. Deste modo o RNA mensageiro sempre menor que a fita senso de DNA. Veja, o exemplo abaixo. As letras em maiscula correspondem aos exons de um determinado gene e as letras em minscula correspondem aos introns. Vamos supor que um fragmento de DNA de uma determinada fita senso seja da seguinte forma: ATGCGTTACCTTAGtcagtctcatcTCAGGTGTCatcttttcttaCTGATC

O RNA mensageiro correspondente esta fita senso estar depositado no GenBank da seguinte forma:
ATGCGTTACCTTAGTCAGGTGTCCTGATC

importante que voc faa as seguintes observaes: O RNA mensageiro constutui apenas os exons da fita original de DNA O RNA mensageiro NO est na forma de fita complementar O RNA mensageiro no est depositado com suas bases de uracil (que o que na realidade ocorre), mas sim com as bases de timina A explicao deste fato est na sntese de DNA complementar, ou cDNA. A maioria das seqncias de RNA que esto no GenBank foram obtidas atravs da sntese de DNA complementar. O cDNA uma molcula similar ao DNA porm esta sintetizada no laboratrio. A sntese de cDNA realizada com a transcriptase reversa, uma enzima de origem viral que tem a capacidade de produzir uma molcula de DNA dupla fita a partir da cpia de uma molcula de RNA. Ou seja, como o nome diz, a transcriptase reversa faz o caminho contrrio daquele percorrido pela RNA polimerase, que a partir de uma molcula dupla fita de DNA produz RNA. Veja a figura abaixo. A molcula de DNA produzida pela transcriptase reversa chamada de DNA complementar (ou cDNA) e formada pelos mesmos compostos encontrados na molcula de DNA (aucar desoxirribose, grupos fosfato, ponte de hifdrognio e as 4 bases nitrogenadas, adenina, timina, guanina e citosina). A descoberta desta enzima viral e de seu mecanismo de ao abriu um importante caminho na biologia molecular. A molcula de RNA extremamente instvel e dependendo do RNA em questo o nmero de cpias pode estar muito reduzido. Deste modo, a possibilidade em se trabalhar com molculas de cDNA ao invs de RNA tem facilitado muito o trabalho do cientista no laboratrio. O cDNA uma molcula estavl, de fcil manuseio e sua multiplicao bastante simples.

Atividade 1: Procurando um gene no GenBank- Seqncia de Imagens

Passo 1

Passo 2

Passo 3

Passo 4

Passo 5

Passo 6

Atividade: Cachorro, o melhor amigo do homem

Passo 1

Passo 2

Passo 3

Atividade: Em buusca da mutao da anemia falciforme

Passo 1

Passo 2

Passo 3

Mapas de Restrio
Veja abaixo os mapas de restrio que voc ir obter no exerccio Cortando com o Webcuter Exerccio 1: Polimorfismo do gene ALDR

Exerccio 2: Seqncia do gene VLCS (Very Long Chain Synthetase)

Aps realizar a atividade no computador, tente responder s seguintes perguntas: 1) O que bioinformtica? 2) Se o DNA uma fita dupla, por que as sequncias aqui apresentadas s tm uma fita? 3) A partir da realizao da atividade Cachorro, o melhor amigo do homem.., voc concluiria que o homem e os cachorros apresentam 91% de similaridade em seu DNA? 4) O que mapa de restrio e como o mesmo pode ser usado? 5) O que o GenBank?

Tabela de Aminocidos

Bioinformtica, a profisso do futuro Renato Sabbatini (disponvel em http://www.epub.org.br/correio/cp990430.htm) Nos ltimos anos, as sees de oferta de empregos na rea biomdica tm estado lotadas de anncios procura de um profissional ainda desconhecido da maioria das pessoas: o especialista em bioinformtica. Esta uma cincia novissima (existe h menos de 10 anos), que tem como objetivo desenvolver e aplicar tcnicas computacionais no estudo da gentica, da biologia molecular e da bioqumica. Entre outras coisas, ela essencial para a construo de bases de dados contendo informaes sobre os genes e protenas dos organismos vivos, para a descoberta de novos genes, e de novos medicamentos. Usando alta tecnologia, o bioinformata muito valorizado pela crescente demanda e pelo ainda pequeno nmero de pessoas capazes de preench-las. Os maiores empregadores so as universidades, empresas farmacuticas e de informtica, institutos de pesquisas privados e do governo. Os salrios iniciais so altos, e um especialista com muitos anos de experincia pode ganhar muito dinheiro, particularmente nos grandes laboratrios multinacionais. O verdadeiro oceano de dados que est sendo gerado por projetos como o Genoma Humano, e a expanso no setor de biotecnologia mdica, so os principais responsveis por esta exploso na demanda por bioinformatas. Existem hoje grandes repositrios de dados genticos e bioqumicos, como o GenBank (que contm todas as seqncias de DNA conhecidas at hoje e que ocupa o equivalente a mais de 100 CD-ROMs). O Projeto Genoma Humano, por exemplo, tem como objetivo descobrir o cdigo gentico dos cerca de 80.000 genes humanos e utilizar esse conhecimento para tratar doenas genticas. Onde encontrar um bioinformtico, ou como form-lo? uma tarefa ainda bastante difcil. Geralmente um bilogo ou mdico que tem grandes conhecimentos de informtica, gentica e bioqumica. Quase no existem cursos sobre esse tema, e a maioria dos profissionais da rea autodidata. Antes de tudo, preciso ter uma cabea interdisciplinar, ou seja, ter mltiplos talentos, tais como matemtica, estatstica, computao, instrumentao e bioengenharia, gentica, biologia, etc. O Brasil tambm se ressente da falta desses profissionais, embora j estejamos embarcados em projetos genmicos grandes e multi-institucionais, como o Genoma da Xylella fastidiosa (um microorganismo que ataca os laranjais, causando a doena chamada amarelinho, de grande importncia econmica para o estado de So Paulo) e o Projeto Genoma e Cncer, ambos da FAPESP (Fundao de Amparo Pesquisa do Estado de So Paulo), que montou uma organizao para o sequenciamento gentico (ONSA). A universidade precisa urgentemente se movimentar para formar esse profissional crucial para a medicina do prximo sculo! No exterior (como na Baylor University, no Texas), j existem at cursos em nvel de graduao sobre bioinformtica. E aqui? Tirando uns poucos centros, como o da UNICAMP (Grupo de Biologia Computacional do Instituto de Computao, Centro de Biologia Molecular e Engenharia Gentica, Ncleo de Informtica Biomdica), estamos ainda no comeo. Mas, sem dvida, a profisso do futuro.

Bioinformtica: manual de utilizao Joo Paulo Kitajima Experincia o nome que damos a nossos erros. Oscar Wilde A bioinformtica uma rea fascinante. Vejo nela a confluncia de meus vrios ideais de profisso: a multidisciplinaridade e o equilbrio entre teoria e prtica. O contato com bilogos, agrnomos, farmacuticos e qumicos me tem sido muito enriquecedor. Estudar a vida uma experincia nica e participar deste estudo me muito gratificante. Alm destas razes, pessoalmente, tornar-me bioinformata me possibilitou alinhar com a rea de trabalho de meu velho pai, agrnomo e microscopista de longa data. Ao me envolver com biologia molecular aplicada a plantas, consigo entend-lo melhor, como profissional e mesmo como pai. Tenho trabalhado como bioinformata desde 1999, quando deixei para trs uma carreira promissora como professor adjunto no Departamento de Cincias da Computao da Universidade Federal de Minas Gerais. Cansado de empregar o dinheiro pblico em projetos sem retorno mais imediato para a sociedade, decidi mudar para uma rea de trabalho mais aplicada. Cheguei mesmo a prestar vestibular para agronomia e economia, mas a necessidade de um salrio falou mais alto e consegui uma bolsa de psdoutorado da Fapesp no Laboratrio de Bioinformtica (LBI) do Instituto de Computao da Unicamp, ento coordenado por Joo Carlos Setubal e Joo Meidanis. No incio tudo era muito estranho, afinal de contas meu ltimo contato com DNA havia sido no segundo grau. Mal me lembrava do que era o dogma central da biologia molecular, protenas, enzimas e ribossomos. E, de repente, estava eu l, fazendo informtica para bilogos, envolto por uma atmosfera efervescente de desafio. Afinal de contas, a bioinformtica do primeiro projeto genoma do Brasil estava acontecendo ali, ao meu lado. E depois do genoma da Xylella fastidiosa, outros vieram. Em meados de 2001, o destino me chamava para novos desafios. Joo Meidanis j havia mudado de rumo ao partir, alguns meses antes, para a iniciativa privada na rea de software e servios de bioinformtica. Joo Setubal alava vos mais altos tambm, trabalhando e realizando contatos acadmicos no exterior. A ironia do destino me fez bater, em dezembro de 2001, nas portas da Votorantim Ventures (VV). Naquela mesma poca, a Votorantim havia decidido investir em empreendimentos de risco e, na rea de biotecnologia, as propostas de investimento estavam sendo analisadas por um grupo chefiado por Fernando Reinach, um dos big boss da cincia no pas. Na verdade, eu o havia procurado para me orientar sobre como submeter um projeto para a VV. Mas, nem tive tempo de expor os meus planos. Fernando j havia uma contraproposta: juntar-se, como scio e diretor, a um novo grande empreendimento que estava surgindo na rea de genmica aplicada a plantas - a Alellyx. Chamo isto tudo de ironia do destino porque, alguns meses antes desta proposta, ir para a iniciativa privada era para mim algo totalmente fora de cogitao. Eu sentia mesmo ojeriza a esta possibilidade. Mas eu estava vendo as pessoas a meu redor tomarem novos rumos e eu precisava encontrar o meu. Voltar para a universidade tambm estava fora de cogitao. O tringulo ensino-pesquisa-extenso era pesado demais para mim. Eu precisava de algo com mais foco. Confesso que o projeto Alellyx era tentador. Impus algumas condies e declarei minha completa inexeperincia em assuntos empresariais. Condies aceitas e inexeperincia tolerada, levamos, eu e mais 4 scios, 3 meses para finalizar o projeto. Comeamos a operar em maro de 2002. Durante aquele ano, compartilhei a coordenao da bioinformtica com Joo Setubal. Em 2003, com a volta de Setubal para a academia, assumi sozinho esta rea na empresa. Atualmente, conto com uma equipe de primeira linha, entre bioinformatas, analistas de sistemas e de suporte e me considero privilegiado em estar onde estou. Vivi, nestes ltimos 4 anos, ento, diferentes experincias na rea de bioinformtica, do aprendizado gerncia, do pblico para o privado. Apesar do pouco tempo, esta heterogeneidade de situaes me permitiu chegar a algumas concluses que podem servir de orientao para quem pretende trabalhar na rea. Assim, como outras reas emergentes de trabalho, a bioinformtica se enquadra em um contexto onde o problema no hardware, nem software, mas peopleware, como dizem por a. No considero

a bioinformtica a profisso do futuro, mas penso que ela exige profissionais do futuro. Um profissional de bioinformtica bem colocado precisa: -Ter um bom conhecimento em cincia da computao: isto significa basicamente possuir uma boa capacidade de abstrao algortmica (isto , saber traduzir a soluo de um problema em um conjunto de programas eficazes e eficientes). Familiaridade e gosto por computao so condies obrigatrias para o sucesso na rea; -Conhecer os prncipios da biologia molecular e as diferentes tcnicas de bancada nos diferentes domnios onde a bioinformtica se faz necessria (as micas principalmente: genoma, transcriptoma, proteoma e metaboloma). Gostar de biologia essencial. Parece bvio que um bioinformata qualificado precise preencher as duas condies acima. Mas existe uma condio adicional que, em vrias situaes, eu prezo muito mais do que a capacidade tcnica e que muitas vezes no vem explicitada nos currculos dos profissionais: a capacidade de compreender o que os usurios ou clientes necessitam para resolver os problemas. Esta condio vital para qualquer contexto de anlise de sistemas, mas, em bioinformtica, ela mais dramtica. Os bioinformatas atendem um pblico que est envolvido com um negcio bastante complexo: cincia. Bilogos so cientistas e muitas vezes a soluo bioinformtica que necessitam faz parte do processo da descoberta. Ou seja, nem mesmo os usurios sabem exatamente o que querem e onde querem chegar. O bom bioinformata deve estar ciente deste fato e sintonizado com o usurio. O bioinformata deve ser parte da definio da soluo, antes mesmo da implementao dela. Visto de outro ngulo, um bioinformata deve, antes de tudo, saber se relacionar com pessoas e saber se colocar no lugar dos cientistas. Em geral, profissionais de computao que trabalham em ambientes de P&D devem possuir esta caracterstica. Na formao da minha equipe na Alellyx, eu valorizo muito mais um profissional mediano entrosado e com foco do que um aluno nota 10 na faculdade, mas anti-social e disperso. Enfim, a bioinformtica uma rea de trabalho que exige um profissional multidisciplinar. Isto implica obrigatoriamente na facilidade em se relacionar com diferentes tipos de profissionais (aqui, informatas se relacionando com outros informatas e com bilogos). Alm do mais, deve possuir boa capacidade de abstrao pois os problemas no so claros e as solues menos ainda. Joo Paulo Kitajima diretor de Bioinformtica/Alellyx Applied Genomics. Texto tirado de

http://www.comciencia.br/reportagens/bioinformatica/12.htm

You might also like