Professional Documents
Culture Documents
em Wall Street ou no Vale do Silcio. Esse objetivo ser possibilitado substancialmente por um
conjunto crescente de ferramentas gratuitas, sejam elas utilizadas por tcnicos do governo
como
feito em Chicago
, tcnicos de sade ou programadores em redaes.
No NICAR 2012, voc podia ver literalmente o cdigo que sustenta o futuro do jornalismo sendo
escrito - ou, pelo menos, projetado - nas paredes.
"O nvel de energia era incrvel", disse David Herzog, professor associado de jornalismo impresso e
digital da Escola de Jornalismo do Missouri, em uma entrevista por email aps o NICAR. "Eu no vi
participantes com as mos suadas e preocupados com o futuro do jornalismo. Eles estavam muito
ocupados o construindo."
Assim como
softwares cvicos abertos fazem cada vez mais parte do governo,
softwares de cdigo
aberto
esto desempenhando um papel fundamental no novo jornalismo de dados
.
"Ferramentas gratuitas e de cdigo aberto dominaram a conversa", disse Herzog. " evidente a
partir dos painis e das aulas prticas que ferramentas de cdigo livre e aberto eliminaram a
barreira de entrada em termos de muitos custos de software."
Embora muitos programadores sejam agnsticos com relao a quais ferramentas eles usam para
realizar um trabalho, as pessoas que esto construindo e compartilhando ferramentas de jornalismo
de dados esto fazendo isso muitas vezes por meio de cdigos de fonte aberta. Como
Dan Sinker
,o
O
Projeto PANDA foi lanado oficialmente em verso
beta em St. Louis, com uma festa de
lanamento. Voc pode conferir o
PANDA no Github
.
O
Overview da organizao Associated Press tornar a procura atravs de documentos
mais fcil.
O
LA Times Datadesk compartilhou uma ferramenta,
Django Bakery
, para transformar
aplicativos Django em arquivos HTML.
Jonathan Soma
, com a ajuda de John Keefe da WNYC, desenvolveu
Tabletop.js como uma
maneira de usar uma planilha pblica do Google Spreadsheets como uma fonte de dados
para um aplicativo Web.
Tabletop est no Github tambm
.
Enquanto uma parte do desenvolvimento de cdigo aberto foi definitivamente impulsionada pelas
exigncias do Knight News Challenge, que financiou o PANDA e o projeto Overview, h tambm um
esprito de colaborao em evidncia em toda esta comunidade.
Este um grupo de pessoas altamente dedicadas "a mostrar o seu trabalho" - e, para os
programadores dentro de redaes, isso significa compartilhar seu cdigo. Para colocar de outra
forma,
programe, no diga
. Sesses sobre Python, Django, mapeamento, Google Refine e Google
Fusion estavam lotadas no NICAR 12.
"Eu acho que esta foi a melhor conferncia NICAR desde a primeira, em 1993", disse Herzog.
"Sempre foi difcil fazer escolhas a partir do cardpio de painis, demonstraes e aulas prticas em
conferncias NICAR. Mas eu achava que havia uma abundncia de sesses excelentes e muito
informativas desenvolvidas pelos prprios participantes. Alm disso, acho que o NICAR oferece uma
boa variedade de opes para iniciantes e especialistas. Por exemplo, os participantes podem
aprender a mapear usando tabelas do Google Fusion na parte para novatos, ou ainda usando
PostGIS e qGIS no nvel avanado. Coletar dados atravs da raspagem tornou-se um negcio cada
vez maior para os jornalistas de dados. Ao mesmo tempo, est ficando mais fcil para as pessoas
com pouca ou nenhuma formao em programao raspar usando ferramentas como planilhas,
Google Refine e ScraperWiki. "
de dados do jornal USA Today, em uma entrevista por e-mail. "Minha primeira foi em 1999, em
Boston. A conferncia um lugar onde jornalistas nerds podem se reunir e se lembrar de que no
esto sozinhos em seu amor por nmeros, anlise de dados, programao e pela busca de grandes
histrias ao se debruarem sobre colunas em uma planilha. Ela serve como um importante espao
de treinamento para jornalistas comeando a mexer com dados em redaes, e tem sempre mantido
jornalistas informados sobre os desenvolvimentos tecnolgicos que oferecem novas maneiras de
encontrar e contar histrias. Ao mesmo tempo, sua conexo com o IRE a mantm firmemente
enraizada nos melhores aspectos do jornalismo investigativo - desenterrando histrias que servem
ao bem pblico.
para a Web, o que acelerou a capacidade de coletar, analisar e apresentar dados. Os objetivos
bsicos permaneceram os mesmos. Vasculhar dados e dar sentido a eles, muitas vezes com mtodos
das cincias sociais. A prtica CAR tende a ser um termo "guarda-chuva" - um que inclui jornalismo
de preciso, jornalismo de dados e qualquer metodologia que d sentido a dados, tais como
visualizaes e apresentaes de dados eficazes".
De uma certa forma, o termo CAR ainda existe porque o mundo do jornalismo no cunhou uma
expresso melhor para usar em seu lugar.
"Reportagem assistida por computador" uma expresso antiquada, mas a maioria das pessoas que
a pratica reconhece isso h anos ", disse DeBarros. "Ela se mantm porque ningum ainda inventou
um substituto
matador
." Phil Meyer, o padrinho do movimento, escreveu um livro seminal chamado
Precision Journalism
, e essa expresso tima para descrever esse segmento de CAR que lida com
estatsticas e com o uso de mtodos de cincias sociais na busca por notcias. Como um termo
A mudana mais significativa na CAR pode muito bem ter ocorrido quando todos os computadores
que estavam sendo utilizados para reportagens foram conectados em rede (com a Internet) na
dcada de 1990.
"Pode parecer bvio, mas claro que a Internet mudou tudo, e por um tempo CAR foi esmagada
enquanto se tentava aprender a navegar na Internet por histrias, e a como fazer o download de
dados", disse Cohen. "Em seguida, houve uma fase em que todo mundo estava desenvolvendo
intranets para entregar registros pblicos dentro de redaes, para ajudar a encontrar pessoas no
prazo de entrega, etc. Por isso, na maior parte do tempo, a CAR estava focada em comunicao, no
na publicao ou apresentao. Agora o pessoal de jornalismo de dados surgiu com outra direo:
pessoas que esto usando dados obtidos por meio de APIs e que muitas vezes ignoram o lado de
reportagem e usam as mesmas tcnicas para entregar a informao no filtrada para os seus leitores
em um formato mais fcil do que o que o governo est nos dando. Mas eu acho que tudo est
comeando a se consolidar - os chamados jornalistas de dados esto cada vez mais interessados em
reportagens, e os reprteres que utilizam as prticas de reportagem assistida por computador de
forma mais tradicional esto interessados na obteno de suas histrias na web de maneiras mais
interessantes.
No importa o nome, os objetivos ainda so os mesmos.
"CAR sempre foi relacionada ao uso de dados para encontrar e contar histrias", disse DeBarros. "E
ainda . O que mudou nos ltimos anos a maior nfase dada a apresentaes on-line (mapas e
aplicativos interativos) e as habilidades de programao necessrias para produzi-las (JavaScript,
HTML / CSS, Django, Ruby on Rails). As conferncias NICAR anteriores giravam muito mais em torno
das melhores histrias do ano e de como usar tcnicas de dados para cobrir determinados tpicos.
Isso ainda existe. Mas, mais recentemente, a conferncia e a prtica cresceram para incluir mais
tpicos de programao e apresentao de dados. Isso reflete o estado da mdia - todas as redaes
esto fazendo hora extra para fazerem o seu contedo funcionar bem na web, no celular e com
aplicativos, e os jornalistas de dados tendem a ser vanguarda nesse sentido, de maneira que no
surpreendente que a conferncia se expanda para incluir esses temas."
"Os dados realmente so o fil mignon da conferncia, e uma verificao rpida da programao
mostra as toneladas de sesses realizadas sobre todos os tipos de tpicos de dados, desde o censo
populacional sade, do crime educao", disse DeBarros.
O que eu vi em toda parte no NICAR foi o interesse no apenas em dados, no entanto, mas em como
obt-los e utiliz-los, desde encontrar histrias e fontes que forneam evidncias empricas para
sustentar outras reportagens at contar histrias com mapas e visualizaes.
"Um dos temas principais foi a anlise de dados (usando planilhas, softwares de gerenciamento de
dados, GIS), que d mais credibilidade ao jornalismo ao identificar padres, tendncias e pontos fora
da curva", disse Houston. "Outros temas envolveram coleta e anlise de mdias sociais, visualizao
de dados, planejamento e organizao de histrias baseadas na anlise de dados, programao para
web scraping (coleta de dados na Web) e a combinao de vrios programas da Web."
"Coleta de dados atravs de raspagem web vem se tornando um negcio cada vez maior para os
jornalistas de dados", disse Herzog. "Ao mesmo tempo, est ficando mais fcil para as pessoas com
pouca ou nenhuma formao em programao raspar usando ferramentas como planilhas, Google
Refine e ScraperWiki. Dito isto, uma outra mensagem para mim foi como a programao tem se
tornado importante. No, nem todos os jornalistas ou at mesmo jornalistas de dados precisa
aprender programao. Mas como
Rich Gordon da Medill disse
, todos os jornalistas devem
compreender o que ela pode fazer. "
Cohen destacou os dados de forma similar, especificamente a sua forma. "O tema que eu vi este ano
foi um foco em dados no estruturados, em vez de estruturados", disse ela. "Durante muito tempo,
martelamos governos para nos darem 'dados' em colunas e linhas. Acho que estamos vendo cada
vez mais que as histrias vm da informao no estruturada na mesma intensidade (seno em
intensidade maior) em que vem de documentos, udio e vdeo, tweets e outras mdias sociais - a
partir de fontes governamentais e no-governamentais. O outro tema que h muito mais
colaborao, abertura e compartilhamento entre as empresas de notcias concorrentes. (Veja, por
exemplo, PANDA,
census.ire.org e a API do New York Times sobre financiamento de campanha
).
Mas isso tambm no vai to longe - voc no v a ProPublica compartilhando com outros os dados
mdicos de mais de 40 estados que Dan conseguiu atravs de raspagem (eu tenho que admitir, no
entanto, que eu no pedi a ele para compartilhar.) A IRE sempre foi relacionada a tcnicas e
ferramentas de compartilhamento - agora estamos realmente compartilhando fontes"
Embora os dados dominaram o NICAR 12, outras tendncias tambm eram importantes, como
ferramentas abertas de mapeamento s tendncias macroeconmicas na indstria de mdia.
"Diversas redaes esto sofrendo com a rpida mudana na tecnologia de mapeamento", disse
DeBarros. "Muitos de ns durante anos utilizaram bem o Flash, mas a falta de suporte para Flash no
iPad tem alimentado a explorao em mapas baseados em tecnologias de cdigo aberto que
trabalham em uma variedade de ambientes online. Muitas redaes esto sofrendo com isso, e o
nmero de sesses de mapeamento na conferncia refletiu isso."
H tambm um contexto significativo para o interesse no desenvolvimento de habilidades de
jornalismo de dados. Mais de 166 jornais dos EUA pararam de publicar edies impressas ou
fecharam completamente desde 2008, resultando
em mais de 35.000 postos de trabalho perdidos ou
em aquisies na indstria de jornal desde 2007.
"A crise econmica e a mudana fundamental no negcio de publicaes impressas significam que
os jornalistas esto mais conscientes sobre a parte comercial do que nunca", disse DeBarros, "e eu
acho que a conferncia refletiu isso mais do que no passado. Houve uma grande sesso sobre como
transformar um bom trabalho em dinheiro por Chase Davis e Matt Wynn, por exemplo. Eu estive em
um painel sobre as razes de negcio para lanar APIs. Existe um mal-estar geral que a maioria dos
jornalistas sente sabendo que a nossa indstria ainda enfrenta tempos econmicos difceis. Assistir
a uma nova gerao de jornalistas abraar a causa emocionante."
Um aspecto notvel dessa nova gerao de jornalistas de dados que ela no parece ou ecoa as
redaes do sculo 20.
"Esta foi a conferncia com maior diversidade de que eu posso me lembrar", disse Herzog. "Eu vi
mais mulheres e negros do que nunca. Tivemos jornalistas de dados de vrios pases: Coria, Reino
Unido, Srvia, Alemanha, Canad, Amrica Latina, Dinamarca, Sucia e mais. Alm disso, a
conferncia tambm muito mais diversificada em termos de habilidades e interesses profissionais.
Empresrios da Web 2.0, programadores, defensores de dados abertos, especialistas em visualizao
de dados, educadores e construtores de aplicativos misturados com jornalistas tradicionais de CAR.
Eu tambm vi um pblico mais jovem, uma nova gerao de jornalistas de dados que est
abraando a causa. Para muitos dos participantes, esta foi a sua primeira conferncia."
Para isso, preciso que jornalistas de dados e programadores cvicos usem as poderosas
ferramentas emergentes nas redaes para a exploso de informaes digitais de governos,
empresas e nossos concidados.
A necessidade de jornalismo de dados, no contexto de enormes quantidades de dados do governo
que esto sendo liberados, no poderia ser mais oportuna, sobretudo tendo em conta os problemas
de qualidade persistentes.
"Eu no consigo encontrar quaisquer desvantagens em se ter mais dados em vez de menos", disse
Cohen, "mas eu me preocupo com algumas coisas."
Em primeiro lugar, enfatizou Cohen, h a questo de saber se os dados so abertos desde o incio - e
as consequncias da 'higienizao' feita antes do lanamento. "A demanda por dados estruturados,
limpos com a finalidade de criar aplicativos, pode resultar em registros falsos em vez de registros
reais liberados.
USASpending.gov um bom exemplo de que - ns no temos acesso aos registros
reais de gastos, como faturas e ordens de compra usadas pelas agncias, ou aos sistemas que eles
realmente utilizam para fechar os negcios. Em vez disso, temos um sistema parcial cujo nico
objetivo ser pblico, por isso no tem alta prioridade dentro de agncias e no h nenhuma pista
de auditoria natural nele. Ele no usado para o registro do gasto pblico, por isso, os erros no so
suscetveis de serem descobertos. "
Para lidar com esse tipo de problema, Cohen recomenda obter mais fontes documentais, como um
historiador faria.
To address those two issues, Cohen recommends getting more source documents, as a historian
would. "Eu acho que o que podemos fazer pressionar ainda mais para obter registros reais, e no
se contentar com o que o governo quer nos dar", disse ela. "Ns tambm temos que melhorar no uso
de registros que no estejam em formatos agradveis e fceis de usar - eles no nasceram assim,
devemos aperfeioar a capacidade de usar os registros sob qualquer forma que eles existem.
Se o texto a prxima fronteira em jornalismo de dados, aproveitando o poder do big data, ser a
servio de contar histrias de forma mais eficaz. Jornalismo digital e cincias humanas digitais esto
se fundindo a servio de uma sociedade mais informada.