Professional Documents
Culture Documents
o
(
s
)
Msicas
Echoprint
Chromaprint
5. Resultados e anlises
Este o momento de avaliar cada etapa do projeto, desde os algoritmos de
reconhecimento at o sistema de segurana/login desenvolvido para liberar acesso ao
projeto via web. Foram realizados alguns testes a fim de avaliar a funcionalidade do sistema,
bem como a sua eficincia.
Comeando pelos algoritmos, claro que sempre o objetivo obter maior velocidade
de resposta com uma alta porcentagem de acerto, e aqui tambm no diferente, quanto
mais rpido e mais eficiente o algoritmo melhor, logo, foram feitos testes para analisar a
velocidade de processamento de cada algoritmo com diferentes msicas. A Tabela 2
representa o tempo que cada algoritmo levou para codificar a msica (teste feito via linha de
comando fora do web site).
Tabela 2: Tempo de resposta de cada algoritmo
Nome Execuo pelo Echoprint (s) Execuo pelo Chromaprint (s)
Feeling This 55 48
Times Like These 59 51
Feel So Close 62 52
Glad You Came 76 52
Angel 64 50
Tempo mdio 63,2 50,6
A Tabela 2 evidencia que o chromaprint apresenta uma ligeira vantagem em termos
de velocidade de processamento perante o echoprint. Essa diferena pode ser bem notada
no Grfico 1, onde perceptvel que em todas as msicas a curva do tempo de execuo do
echoprint fica sempre em cima da curva do chormaprint. A diferena esta em torno de 10
segundos.
Grfico 1: Tempo de execuo dos algoritmos x msicas
72
0
1
2
3
4
5
6
7
8
9
10
1 2 3 4 5
T
e
m
p
o
d
e
r
e
s
p
o
s
t
a
d
o
s
e
r
v
i
d
o
r
(
s
)
Msicas
Echoprint
Chromaprint
Porm, a gerao do cdigo apenas uma etapa do processo de reconhecimento de
udio, ainda resta a anlise da velocidade de acesso ao banco de dados e por ltimo, e o
mais importante o nvel de eficcia de cada sistema, ou seja, qual sua porcentagem de
acerto de nome das msicas.
Com as mesmas msicas testadas anteriormente fez-se o teste de acesso/resposta
do banco de dados: foram enviados seus cdigos e outras informaes necessrias para o
servidor e analisado o tempo que levou para se obter uma resposta. Os resultados obtidos
esto dispostos na Tabela 3.
Tabela 3: Tempo de resposta do servidor de cada algoritmo
Nome Resposta do servidor Echoprint (s) Resposta do servidor Chromaprint (s)
Feeling This 7 2
Times Like These 7 3
Feel So Close 7 3
Glad You Came 7 2
Angel 10 3
Tempo mdio 7,6 2,6
Mais uma vez o chromaprint teve certa vantagem, e apresentou um desempenho
melhor. A diferena entre os dois est em cerca de 5 segundos em mdia e para ver de uma
maneira mais intuitiva, o Grfico 2 apresenta duas curvas representando a resposta do
servidor do echoprint e do chromaprint.
Grfico 2: Tempo de resposta do servidor x msicas
73
No proveitoso ter um rpido processamento com um gil acesso ao banco de
dados e retornar uma resposta incorreta, por isso que a prxima anlise de extrema
importncia. Com estas mesmas msicas, que foram testadas, fez-se anlise da resposta
obtida.
Depois de realizadas as chamadas dos servidores, notou-se que os dois sistemas
falharam em uma msica (msicas diferentes), porm a falha no foi referente ao algoritmo
e sim devido a inexistncias destas msicas no banco de dados. neste ponto que surge
uma das funes do banco de dados no website do projeto, pois aumenta a probabilidade
de acerto com o aumento de msicas armazenadas.
Baseando-se nos resultados mostrados, evidente que o chromaprint leva vantagem
em termo de velocidade de processamento, apresenta respostas mais rpidas tanto na
codificao do udio como no acesso s informaes do banco de dados. J em termos de
respostas corretas ambos apresentaram o mesmo desempenho 75 %. claro que seria
necessrio fazer testes com muito mais msicas para poder ter uma porcentagem mais
precisa.
Um ponto positivo que falhas foram devidas ausncia de cdigo correspondente
no banco de dados e no por alguma equivalncia errnea.
Com toda esta anlise feita com os algoritmos, pode-se avaliar o efeito que o site
causa neste tempo de processamento e eficincia. O tempo de resposta certamente ser
acrescido, pois no procedimento de automatizar a busca foram introduzidos filtros e
manipulaes de arquivo de extenso .txt.
Os dados obtidos esto dispostos na Tabela 4. Estes valores representam o tempo
de execuo total, ou seja, tempo de resposta do algoritmo mais tempo de resposta do
servidor.
Tabela 4: Tempo de resposta do site
Nome Resposta do website Echoprint (s) Resposta do website Chromaprint (s)
Feeling This 66 58
Times Like These 65 58
Feel So Close 60 58
Glad You Came 62 66
Angel 78 66
Para poder observar melhor o efeito do site sobre o tempo de resposta, foram
elaborados os Grfico 3 e Grfico 4, fazendo um comparativo entre antes e depois de cada
algoritmo, echoprint e chromaprint respectivamente.
74
55
60
65
70
75
80
85
1 2 3 4 5
T
e
m
p
o
d
e
r
e
s
p
o
s
t
a
d
o
s
i
s
t
e
m
a
(
s
)
Msicas
Echoprint sem website
Echoprint com website
45
50
55
60
65
70
1 2 3 4 5
T
e
m
p
o
d
e
r
e
s
p
o
s
t
a
d
o
s
i
s
t
e
m
a
(
s
)
Msicas
Chromaprint sem website
Chromaprint com website
visvel no Grfico 4 que o website acrescentou alguns segundos no seu tempo de
resposta, porm agora o sistema todo automatizado e com uma interface, representada
pelo site. J no Grfico 3 notrio que em trs das cinco msicas testadas apresentaram
um tempo de resposta menor, e isso se deve ao fato de que estas trs msicas
apresentarem seus cdigos cadastrados no banco de dados do projeto.
O Grfico 3 comprova que um dos objetivos, pelo qual o banco de dados foi
desenvolvido, funciona como o esperado diminuindo o tempo de resposta e assim deixando
o sistema mais rpido que o normal, porm isto apenas vlido para o echoprint.
Grfico 3: Tempo de resposta do sistema x Msicas (echoprint)
Grfico 4: Tempo de resposta do sistema x Msicas (chromaprint)
75
No caso do chromaprint, o site acaba elevando seu tempo de resposta. Isto ocorre
pois seu tempo de busca no servidor era muito baixo, cerca de 2 segundo, e o sistema de
busca pelo banco de dados, realizado no website, leva alguns segundos a mais pois
necessrio realizar a conexo e depois a busca por toda sua extenso.
O sistema de segurana desenvolvido funciona de acordo com o esperado, onde
todo o fluxo de informao do site controlado pelo administrador, que pelo prprio sistema,
tem a ferramenta de excluso de membros e tambm excluso de informaes
inadequadas/errneas.
O procedimento de bloqueio de contedo para pessoas que no estejam logadas
est em pleno funcionamento, ou seja, se tentar acessar qualquer pgina no site sem estar
logado, o contedo no ser liberado e uma mensagem ir aparecer na tela, indicando
para o membro realizar o login ou se cadastrar no site, caso ainda no o tenha feito.
Por ltimo, uma anlise da submisso de msicas tambm plausvel, pois desta
maneira consegue-se retirar informaes que revelam o tempo que o sistema leva para
adicionar dados dentro do banco de dados.
Quando o usurio submete uma msica para armazenamento no banco de dados,
praticamente todas as rotinas do website so acionadas, pois necessrio receber o
arquivo de udio, analisar o banco de dados com o intuito de no enviar msicas repetidas,
acionar um dos softwares escolhido, realizar a codificao e por ltimo enviar as
informaes armazenadas para o banco de dados. Devido nmero elevado de operaes
sequenciais, sem dvida, esta pgina que levar mais tempo para dar alguma resposta.
Na Tabela 5 pode-se observar o tempo desta operao.
Tabela 5: Tempo de resposta da submisso de dados
Nome
Resposta da submisso Echoprint
(s)
Resposta da submisso Chromaprint
(s)
Teenage Dream 129 119
Thank You For Loving Me 123 100
I Started a Joke 84 75
Mundo Animal 89 84
Quebra Mar 75 75
Too Much 158 146
Como esperado, o tempo de espera elevado, mas condizente, pois se juntarmos
todos os tempos de execuo anteriores teremos um nmero aproximado mdia dos
valores da Tabela 5. Outro fato que pode ser notado que o fator que mais interfere na
diferena entre os valores mostrados na Tabela 5 o tamanho do arquivo, ou seja, quanto
maior o arquivo maior o tempo de seu envio e, consequentemente, maior o tempo de
76
resposta de submisso dos dados. A msica que levou maior tempo foi Too Much,
justamente a que possui maior espao de memria, 10,0 MB.
Na Figura 26, tem uma imagem do banco de dados depois da submisso destes
arquivos, comprovando que a comunicao website e banco de dados est ocorrendo sem
falhas. Note que devido ao tamanho as impresses digitais no so mostradas
completamente, mas basta expandir a coluna id para analis-las por completo.
Figura 26: Banco de dados como as msicas enviadas para teste
77
6. Consideraes Finais
Ao final do trabalho foi possvel concluir que o projeto funcionou conforme o
planejado, apresentando-se como uma ferramenta de reconhecimento de udio, que alm
de propiciar o aumento do nvel de acerto dos algoritmos em funo da disponibilidade de
um banco de dados local, o que aumenta o acervo de msicas para realizar a comparao,
em muitos casos tambm diminuiu seu tempo de busca. Alm destes benefcios, o sistema
est disponvel para qualquer usurio, bastando-se fazer o cadastro na pgina inicial do
projeto, pois se utiliza das vantagens da disponibilizao via Web.
Sobre a rea de sistemas embarcados, pode-se concluir que continua em
crescimento, mas ainda possvel constatar a ausncia de concentrao de assuntos
pertinentes e bem documentados, o que pode inicialmente dificultar o trabalho. Porm, como
existem inmeros desenvolvedores pelo mundo, existem tambm muitos fruns de
discusses, onde todos compartilham informaes importantes, e destes fruns que
muitas vezes vem as informaes que auxiliam na soluo dos problemas que se
apresentam no decorrer do desenvolvimento de projetos, como alguns aqui apresentados.
78
Referncias Bibliogrficas
FRUM brasileiro de usurios Linux. Disponvel em: <http://www.brlinux.net>.
Acesso em: 31 jul. 2012.
GUIA taglib. Disponvel em: <http://taglib.github.com/>. Acesso em: 13 set. 2012.
BASE DE DADOS do algortimo chromaprint usado no desenvolvimento do projeto.
Disponvel em: <http://www.acoustid.org/chromaprint>. Acesso em: 20 ago. 2012
BASE DE DADOS do algortimo echoprint usado no desenvolvimento do projeto.
Disponvel em: <http://www.echoprint.me>.Acesso em: 20 ago. 2012.
ELLIS, D.; WHITMAN, B.; PORTER, A. Echoprint an open music identification
service, ismir 2011. Disponvel em <http://www.echoprint.me>.Acesso em: 30 ago.
2012.
BELLO, J.; DAUDET, L.; ABDALLAH, S.; DUXBURY, C. A tutorial on Onset Detection
in Music Signals, IEEE Transactions on speech and audio processing, 2005.
Disponvel em <http://ieeexplore.ieee.org>. Acesso em: 05 set.2012.
MANUAL FriendlyArm Tiny6410. Disponvel em <http://friendlyarm.net>. Acesso em
20 ju. 2012.
LEITO, G. Separao de fontes de sinais de udio. 2009. Ps-Graduao em
Engenharia eltrica e computao PPGEE, Universidade Federal do Rio Grande do
Norte, Natal. 2009
GUIA audio fingerprint: MusicBrainz: The open music encyclopedia. Disponvel em:
<http://musicbrainz.org>. Acesso em 20 ago.2012
HAITSMA, J.; KALKER, T. A Highly Robust Audio Fingerprinting System Philips
Research, 2002.
CHENG Y., Music Database Retrieval Based on Spectral Similarity, International
Symposium on Music Information Retrieval (ISMIR) 2001, Bloomington, USA.
October 2001
GUIA ffmpeg. Disponvel em: < http://ffmpeg.org/>. Acesso em 13 set. 2012.
GUIA libboost. Disponvel em: <http://www.boost.org/>. Acesso em: 13 set. 2012
79
ELLIS, D.; WHITMAN, B.; JEHAN, T.; LAMERE, P. The Echo Nest musical fingerprint. In
Proceedings of the 2010 International Symposium on Music Information Retrieval, 2010.
BARTSCH, M.; WAKEFIELD,G.Audio Thumbnailing of Popular Music Using Chroma-Based
Representations, 2005. Disponvel em: <http://ieeexplore.ieee.org>. Acesso em: 05
set.2012.
GUIA zlib. Disponvel em: < http://www.zlib.net/>. Acesso em 13 set. 2012.
GUIA Chroma features, 2004. Disponvel em:
<http://abrosa.ee.columbia.edu/matlab/chroma-ansyn> . Acesso em 30 out.2012.
KE, Y.; HOIEM, D.; SUKTHANKAR, R. Computer Vision for Music Identification, 2005.
Disponvel em: <http://www.cs.cmu.edu/~yke/musicretrieval/>. Acesso em: 15 set.2012.
GUIA php. Disponivel em: <http://php.net/manual/pt_BR/index.php>. Acesso em: 10
jul.2012.
GUIA Linux. Disponvel em: <http:// www.vivaolinux.com.br>. Acesso em: 10 jul.2012.
MANUAL Audacity, the Free, Cross-Platform Sound Editor. Disponvel em
<http://oficinademultimedia.files.wordpress.com/2011/09/manual_audacity.pdf>. Acesso em
13 out. 2012
MANUAL olimex SAM9-L9260. Disponvel em :
<http://www.olimex.com/Products/ARM/Atmel/SAM9-L9260>. Acesso em 5 out.2012.
GUIA googletest. Disponvel em: <http://code.google.com/p/googletest/>. Acesso em 13
set. 2012
CUNHA, A.; O que so sistemas embarcados? 2008 Disponvel em:
<http://www.sabereletronica.com.br/secoes/leitura/274>. Acesso em: 07 out. 2012.
GOMES, P.; LEITE, T.; CAETANO, U. A Arquitetura ARM. Projeto de Sistemas
Computacionais, Universidade de Campinas, 2005.
MATTOSO, M. Introduo a Banco de dados, 2007. Disponvel em:
<http://www.cos.ufrj.br/~marta/BdRel.pdf> . Acesso em: 19 out. 2012.
80
CRESSONI, P. Short Time Fourier Transform na Anlise de Sinais Eletromiogrficos, 2011.
Relatrio Final de trabalho de iniciao cientfica Centro Universitrio Fundao Santo
Andr, Santo Andr, 2012.
.
81
APNDICE A Imagens do website
Pgina principal
Pgina para realizar login
82
Pgina para realizar cadastro
Pgina para submeter msicas
83
Pgina para realizar o reconhecimento do udio
Pgina para exibio do contedo do banco de dados