You are on page 1of 80

MARCIO JOS DA SILVA

Modelagem de um sistema para auralizao


musical utilizando Wave Field Synthesis

So Paulo
2014

Marcio Jos da Silva

Modelagem de um sistema para auralizao musical


utilizando Wave Field Synthesis

Dissertao apresentada Escola de Comunicaes e Artes da Universidade de So Paulo para


obteno do ttulo de Mestre em Msica.
rea de concentrao:
Processos de Criao Musical
Orientador:
Prof. Dr. Regis Rossi Alves Faria

Esta a verso corrigida desta dissertao. A verso original se encontra disponvel tanto na
Biblioteca da ECA/USP quanto na Biblioteca Digital de Teses e Dissertaes da USP (BDTD)

So Paulo
2014

Autorizo a reproduo e divulgao total ou parcial deste trabalho, por qualquer meio convencional ou
eletrnico, para fins de estudo e pesquisa, desde que citada a fonte.

Catalogao na Publicao
Servio de Biblioteca e Documentao
Escola de Comunicaes e Artes da Universidade de So Paulo
Dados fornecidos pelo(a) autor(a)

Silva, Marcio Jos da


Modelagem de um sistema para auralizao musical
utilizando Wave Field Synthesis / Marcio Jos da Silva. -So Paulo: M. J. Silva, 2014.
80 p.: il.
Dissertao (Mestrado) - Programa de Ps-Graduao em
Msica - Escola de Comunicaes e Artes / Universidade de
So Paulo.
Orientador: Regis Rossi Alves Faria
Bibliografia
1. Wave Field Synthesis 2. auralizao musical 3.
espacializao sonora 4. udio espacial 5. programao
dinmica I. Faria, Regis Rossi Alves II. Ttulo.
CDD 21.ed. - 780

Marcio Jos da Silva


Modelagem de um sistema para auralizao musical utilizando Wave Field
Synthesis

Dissertao apresentada Escola de Comunicaes e Artes da Universidade de So Paulo para


obteno do ttulo de Mestre em Msica.
rea de concentrao:
Processos de Criao Musical
Orientador:
Prof. Dr. Regis Rossi Alves Faria

Aprovao em: 31 de outubro de 2014.


Banca examinadora:

_________________________________________
Prof. Dr. Regis Rossi Alves Faria
Instituio: FFLCRP-USP

_________________________________________
Prof. Dr. Fernando Henrique de Oliveira Iazzetta
Instituio: ECA-USP

_________________________________________
Prof. Dr. Jos Augusto Mannis
Instituio: IA-UNICAMP

Agradecimentos

FAPESP por todo o apoio dado a esta pesquisa, atravs do processo 2012/17263-1
e pelo financiamento do desenvolvimento do array de alto-falantes e equipamentos utilizados,
atravs do processo FAPESP 2008/08632-8 (projeto temtico MOBILE - Processos Musicais
Interativos).
Aos pesquisadores Csar Daniel Salvador Castaeda, Thilo Koch, Flvio Luiz Schiavoni
e a todos aqueles que direta ou indiretamente colaboraram com esta pesquisa.

Resumo

SILVA, Marcio. J. Modelagem de um sistema para auralizao musical utilizando Wave


Field Synthesis. 2014. 80 f. Dissertao de mestrado - Escola de Comunicaes e Artes, Universidade de So Paulo, So Paulo, 2014.

Buscando-se a aplicao prtica da teoria de Wave Field Synthesis (WFS) na msica, foi feita uma
pesquisa visando modelagem de um sistema de sonorizao capaz de criar imagens sonoras
espaciais com a utilizao desta tcnica. Diferentemente da maioria das outras tcnicas de sonorizao, que trabalham com uma regio de escuta pequena e localizada, WFS permite projetar
os sons de cada fonte sonora - como instrumentos musicais e vozes - em diferentes pontos do
espao de audio, em uma regio de escuta que pode abranger quase toda a rea compreendida
por este espao, dependendo da quantidade de alto-falantes instalados. O desenvolvimento de
um cdigo de estrutura modular para WFS foi baseado na plataforma orientada a patches Pure
Data (Pd), e no sistema de auralizao AUDIENCE, desenvolvido na USP, sendo integrvel
como ferramenta para espacializao sonora interativa. A soluo emprega patches dinmicos e
uma arquitetura modular, permitindo flexibilidade e manutenabilidade do cdigo, com vantagens
frente a outros software existentes, particularmente na instalao, operao e para lidar com um
nmero elevado de fontes sonoras e alto-falantes. Para este sistema tambm foram desenvolvidos
alto-falantes especiais com caractersticas que facilitam seu uso em aplicaes musicais.

Palavras-chave: Wave Field Synthesis, auralizao musical, espacializao sonora, udio espacial, sntese de campo sonoro, programao dinmica.

Abstract

SILVA, Marcio. J. Modeling a system for musical auralization using Wave Field Synthesis.
2014. 80 f. Masters dissertation - Escola de Comunicaes e Artes, Universidade de So Paulo,
So Paulo, 2014.

Seeking the practical application of the theory of Wave Field Synthesis (WFS) in music, a
research aimed at modeling a sound system capable of creating spatial sound images with the
use of this technique was made. Unlike most other techniques for sound projection that work
with a small, localized listening area, WFS allows projecting the sounds of each sound source
- such as musical instruments and voices - at different points within the hearing space, in a
region that can cover almost the entire area comprised by this space, depending on the amount of
installed speakers. The development of a modular structured code for WFS was based on the
patch-oriented platform Pure Data (Pd), and on the AUDIENCE auralization system developed
at USP, and it is integrable as a tool for interactive sound spatialization. The solution employs
dynamic patches and a modular architecture, allowing code flexibility and maintainability, with
advantages compared to other existing software, particularly in the installation, operation and
to handle a large number of sound sources and speakers. For this system special speakers with
features that facilitate its use in musical applications were also developed.

Keywords: Wave Field Synthesis, music auralization, sound spatialization, spatial audio, sound
field synthesis, dynamic programming.

Sumrio

1 UM SISTEMA DE SONORIZAO BASEADO EM


DE ONDA . . . . . . . . . . . . . . . . . . . . . . . .
1.1 Objetivos da pesquisa . . . . . . . . . . . . . . . .
1.2 Motivaes . . . . . . . . . . . . . . . . . . . . .
1.3 Utilizao das tcnicas de espacializao . . . . . .
1.3.1 Sistemas de sonorizao espacial . . . . . .
1.3.2 Espacializao na msica . . . . . . . . . .
1.3.3 Instrumentao musical virtual espacial . .
1.4 A escolha das plataformas de desenvolvimento . . .

SNTESE DE FRENTE
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .

2 TEORIA BSICA SOBRE WAVE FIELD SYNTHESIS . . . . .


2.1 Fundamentos tericos . . . . . . . . . . . . . . . . . . . . . .
2.1.1 Aliasing espacial . . . . . . . . . . . . . . . . . . . .
2.2 O operador WFS . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.1 O operador WFS segundo Ranjan e Gan . . . . . . . .
2.2.2 O operador WFS segundo Wittek . . . . . . . . . . . .
2.2.3 O operador WFS segundo Spors, Rabenstein e Ahrens .
2.2.4 O operador WFS segundo Marije Baalman . . . . . . .
2.2.5 Entendendo melhor o operador WFS . . . . . . . . . .
2.2.5.1 Clculo das amplitudes . . . . . . . . . . . .
2.2.5.2 Clculo dos atrasos . . . . . . . . . . . . . .
2.3 Aplicaes de Wave Field Synthesis . . . . . . . . . . . . . .
2.4 Projetos e trabalhos de referncia . . . . . . . . . . . . . . . .
2.4.1 O projeto CARROUSO . . . . . . . . . . . . . . . . .
2.4.2 Casa del Suono . . . . . . . . . . . . . . . . . . . . .
2.4.3 WFS do IRCAM . . . . . . . . . . . . . . . . . . . .
2.4.4 WFS da Technical University - Berlin . . . . . . . . .
2.4.5 IOSONO . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

10
10
11
13
13
15
15
16

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

18
18
21
21
23
24
25
25
25
27
28
28
29
29
29
30
30
30

3 ESTUDOS INICIAIS PARA DESENVOLVIMENTO DE PROTTIPOS


3.1 Programas de referncia para WFS . . . . . . . . . . . . . . . . . . . .
3.1.1 sWONDER . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.2 WFSPlayer de Daniel Salvador . . . . . . . . . . . . . . . . . .
3.1.3 SoundScape Renderer (SSR) . . . . . . . . . . . . . . . . . . .
3.2 Diagramas de blocos dos programas de referncia . . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

31
31
32
33
35
36

4 IMPLEMENTAO E TESTES BSICOS . . . . . . . . . . . . . . . . .


4.1 Operador WFS para o projeto . . . . . . . . . . . . . . . . . . . . . . .
4.2 Montagem e infra-estrutura bsica . . . . . . . . . . . . . . . . . . . .
4.2.1 Projeto e fabricao de alto-falantes especiais . . . . . . . . . .
4.3 Prottipo inicial em Pure Data . . . . . . . . . . . . . . . . . . . . . .
4.4 Avaliao bsica do funcionamento do prottipo inicial . . . . . . . . .
4.5 Prottipo final . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5.1 Aspectos gerais do projeto . . . . . . . . . . . . . . . . . . . .
4.5.2 Implementao do processador WFS com programao dinmica
4.5.3 Integrao ao sistema AUDIENCE . . . . . . . . . . . . . . . .
4.5.4 Construo do prottipo final . . . . . . . . . . . . . . . . . . .
4.6 Testes de funcionamento realizados no prottipo final . . . . . . . . . .
4.6.1 Apresentao dos resultados do teste subjetivo . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

40
40
41
43
44
47
51
53
54
56
57
62
67

5 CONCLUSES . . . . . . . . . . . . . .
5.1 Discusso dos resultados . . . . . . .
5.2 Principais contribuies deste trabalho
5.3 Trabalhos futuros . . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

70
70
71
72

Referncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

75

APNDICE A Configuraes do SSR . . . . . . . . . . . . . . . . . . . . . . . . .

78

APNDICE B Mtodo para o clculo da posio da fonte sonora . . . . . . . . . .

79

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

10

1 UM SISTEMA DE SONORIZAO BASEADO EM SNTESE DE


FRENTE DE ONDA

Wave Field Synthesis - ou Sntese de Campo de Onda - representada pela sigla WFS,
uma tcnica de sonorizao que visa reproduzir os atributos fsicos de um campo sonoro no
espao de audio, como auditrios e cinemas, permitindo teoricamente perfeita localizao
da fonte virtual, numa grande rea de reproduo, ao contrrio das tcnicas convencionais que
permitem a criao de uma iluso acstica sobre uma rea de escuta muito pequena conhecida
como sweet spot (RANJAN; GAN, 2012).
Nesta pesquisa de mestrado modelou-se uma implementao computacional modular e
flexvel da tcnica de sonorizao de Wave Field Synthesis (WFS), projetada de modo a facilitar
sua integrao a um sistema de auralizao1 desenvolvido na Universidade de So Paulo, o
AUDIENCE2 .
O projeto do sistema de auralizao AUDIENCE (AUDio Immersion ExperieNce by
Computer Emulation) teve incio em 2003 no Laboratrio de Sistemas Integrveis da Escola
Politcnica da Universidade de So Paulo (LSI-EPUSP) visando pesquisar tecnologias para
imerso sonora, produo e reproduo de udio 2D/3D, com aplicaes em multimdia, realidade
virtual, home-theaters e sonorizao surround (FARIA et al., 2005; FARIA; ZUFFO, 2006;
THOMAZ et al., 2006; FARIA; ZUFFO; ZUFFO, 2005).
Em 2005 o sistema foi utilizado numa instalao multicanal cbica (8 alto-falantes)
para a Caverna Digital3 , gerando a primeira verso do software de auralizao AUDIENCE. Na
verso atual, o programa consiste numa biblioteca de objetos e abstraes para a plataforma
Pure Data que permite construir aplicaes genricas de udio espacial. Est disponvel em duas
verses - uma completa e restrita (AUDIENCE4Pd) e outra bsica e aberta, que pode ser baixada
da internet gratuitamente a partir do website do projeto4 , denominada OpenAUDIENCE (OA),
utilizada como arquitetura de sistema e plataforma de referncia de programao neste projeto.

1.1

Objetivos da pesquisa

Este projeto props a modelagem e prototipagem de um sistema de sonorizao espacial


como aplicao prtica da teoria de Wave Field Synthesis, caracterizado pela manipulao e
distribuio espacial de cenas sonoras virtuais, usando um mapeamento controlvel, de modo a
poder alterar a posio dos sons emitidos. Para controlar este sistema, deveria ser desenvolvido
1
2
3
4

Auralizao o processo que usa modelagem fsica ou matemtica para criar um campo sonoro.
AUDIENCE: Sistema e Software para Imerso Sonora e Auralizao. Acesso em: <http://www.lsi.usp.br/neac/
audience>
O site do projeto CAVERNA Digital pode ser acessado em <http://www.lsi.usp.br/~rv/p/cave_p.html>
OpenAUDIENCE. Acesso em <http://www.lsi.usp.br/neac/pt-br/openaudience>

Captulo 1. UM SISTEMA DE SONORIZAO BASEADO EM SNTESE DE FRENTE DE ONDA

11

um cdigo de programao de estrutura modular, segundo os requisitos da plataforma de


auralizao AUDIENCE, de maneira a ser integrado como ferramenta para espacializao
sonora interativa, particularmente til para aplicaes de espacializao musical.

1.2

Motivaes

At o sculo XX, a msica s pde ser apreciada no momento da sua execuo, com
cada ouvinte prximo aos seus executantes. Indo mais alm, para que as fontes sonoras5 possam
ser ouvidas, no basta a distncia ser curta se o ambiente no acusticamente favorvel. Se
houver centenas de pessoas prximas a um violo tocado numa rua ao ar livre, provavelmente,
para grande parte dos presentes, o instrumento no ser ouvido de forma satisfatria. Como
comentado por Thomaz (2007, p. 23): Por exemplo, em uma orquestra, a escolha da posio
dos instrumentos deve-se principalmente ao volume sonoro que cada instrumento produz, de
forma que todos possam ser ouvidos claramente.
Para apresentaes musicais so desenvolvidas salas com acstica apropriada, e at
ajustvel, como por exemplo a Sala So Paulo, sede da Orquestra Sinfnica do Estado de So
Paulo. Outra soluo comum a instalao de um sistema de reforo de udio (com microfones e
alto-falantes) que distribua o som no ambiente em questo, usado inclusive em salas de concerto,
para que o pblico, independentemente de sua distribuio no espao do evento, possa ouvir bem
o que est sendo executado.
antiga a preocupao e o interesse pelo desenvolvimento da msica por meio das
possibilidades trazidas pela tecnologia. Esta influncia pode ser ilustrada pela evoluo dos
instrumentos musicais, as cada vez mais modernas salas de concerto ou a construo de estdios
de gravao cada vez mais sofisticados, e a relao destes com os processos de execuo,
transmisso, conservao e a criao de novos sons. Nas ltimas dcadas surgiram novas
possibilidades tcnicas para o universo musical. Porm, tal evoluo, na maioria dos casos, no
direcionada aos ouvintes, o que implica uma ausncia de ferramentas para forjar e adequar o
espao de audio, j que a nfase est na criao e execuo musicais, vide as interfaces que
esto entre o sistema de autoria (instrumentos, computadores, etc.) e os msicos. As diversas
pesquisas relacionadas sonorizao mostram que tem havido um aumento do interesse na
experincia de audio e, mais especificamente no udio espacial. A evoluo das tcnicas
de espacializao de campo sonoro, como consequncia das novas tecnologias de udio e do
aumento do poder de processamento dos computadores, levou otimizao e expanso do uso
do espao auditivo, o que sugere explorar cada vez mais as possibilidades tcnicas disponveis.
A tecnologia no se resume exclusivamente eletrnica ou informtica, mas, a partir
do sculo XX e, mais especificamente, da segunda metade do sculo, tanto uma, quanto outra,
5

Instrumentos musicais, sejam eles acsticos ou eletrnicos (como os sintetizadores), so exemplos de fontes
sonoras.

Captulo 1. UM SISTEMA DE SONORIZAO BASEADO EM SNTESE DE FRENTE DE ONDA

12

passam a estar cada vez mais presentes no prprio processo criativo. Conforme constata Braun
(Baltimore, 2000):
A tecnologia foi sempre inseparvel do desenvolvimento da msica.
Mas, no sculo XX, uma rpida acelerao tomou lugar: uma nova
msica da mquina veio existncia, instrumentos musicais eletrnicos
foram desenvolvidos e compositores frequentemente transformaram-se
em pesquisadores sonoros.

A evoluo tecnolgica dos equipamentos de som foi, e continua sendo, incorporada


a shows musicais, auditrios, salas de cinema, jogos de computador e sonorizao de eventos
teatrais, entre outras aplicaes. Cada vez mais so assistidas gravaes de vdeos musicais e
concertos por meio das mdias como a televiso, aparelhos de DVD e internet. H uma evoluo
nas possibilidades de escuta musical, atravs: da evoluo das salas de concerto; da evoluo dos
instrumentos musicais (acsticos ou no); das novas estticas e de novos conceitos, como a da
msica eletroacstica; da possibilidade de tornar o mais realstico possvel a escuta das grandes
orquestras; do uso de microfones, amplificadores e caixas de som na msica ao vivo ou gravada,
ou at mesmo gerada atravs de circuitos eletrnicos e computadores. Tudo isso nos motiva a
buscar uma nova e aperfeioada forma de projeo e escuta dos sons, otimizando e expandindo o
uso do espao auditivo.
De acordo com Ranjan e Gan (2013, pg. 19) e Baalman (2007), WFS produz imagens
sonoras mais definidas e estveis e adequada para situaes de concertos, pois, diferentemente
das outras tcnicas, tem a capacidade de induzir a percepo de objetos sonoros localizados numa
grande rea de audio, podendo assim atender um maior nmero de ouvintes simultaneamente.
Ao contrrio de tcnicas como a de reproduo em dois canais, as posies das fontes virtuais
percebidas pelo ouvinte no mudam conforme este se desloca, mas sim como se realmente
estivessem numa dada posio no ambiente. Alm disso, permite outros tipos de movimento das
fontes sonoras, tais como movimentos que usam controle mais preciso sobre a localizao de
fontes de som e movimentao atravs do espao de audio, podendo haver uma fonte com
uma posio fixa ou uma fonte que se move quando o ouvinte atravessa a regio de audio.
Segundo Brandenburg, Brix e Sporer (2004), as salas de concerto com WFS podem se transformar
em espaos multifuncionais com adaptaes acsticas para cada tipo de msica e posicionar
os instrumentos musicais de uma orquestra com informao angular espacial e boa noo de
distncia das cenas acsticas no palco. O artigo de Faria (2011b), sugere uma proposta diferente
de escutar e perceber os sons, com a possibilidade dos sons serem decompostos em parciais
(harmnicos, por exemplo) que poderiam ser ouvidos separados em posies diferentes, numa
projeo em WFS.
interessante salientar que, no Brasil, at a presente data, ainda no encontramos estudos
voltados a desenvolvimentos com o uso de WFS. Este trabalho proporciona, em lngua portuguesa,
um arcabouo de referncia novo sobre este assunto, fazendo uma integrao com as reas de

Captulo 1. UM SISTEMA DE SONORIZAO BASEADO EM SNTESE DE FRENTE DE ONDA

13

msica, computao musical e engenharia de udio, para a aplicao de WFS, por exemplo
na auralizao musical, focalizando na construo de cenas sonoras musicais integrado ao
framework do sistema de auralizao AUDIENCE. A provvel utilizao de sistemas baseados
em WFS, com a perspectiva de que se possa gerar implementaes inditas no Brasil e se possa
avaliar equipamentos fabricados em outros pases que se utilizam desta tcnica, depender
de pessoal qualificado para extrair o mximo de recursos dos equipamentos usados para tal
finalidade, como programadores, tcnicos e engenheiros de som. Espera-se que esta pesquisa
sirva de base informativa inicial para que estes profissionais possam realizar treinamentos e
desenvolvimentos tcnicos no Brasil.

1.3

Utilizao das tcnicas de espacializao do campo sonoro

O desenvolvimento de novas tcnicas de sonorizao e execuo musical so importantes


para o desenvolvimento da msica e motivam a explorao de novos caminhos. Conforme observado por Schafer (2001), sons distantes no tempo e no espao, composies do passado e sons
de culturas estrangeiras foram incorporados paisagem sonora, graas s novas possibilidades
de captar e reproduzir os sons. Desta forma, os ouvintes passaram a experimentar a dissociao
entre a escuta e a fonte sonora, j que os sons passam a ser reproduzidos por alto-falantes.
Este projeto buscou a adequao do espao sonoro aos ouvintes, o que significa garantir
qualidade e integridade de audio das cenas sonoras e individualizar o espao de audio em
cada ponto do espao fsico. Entretanto, para pesquisas neste campo importante lembrar que,
segundo Faria (2005, p. 150):
(...) a simulao e reproduo realista de um campo sonoro (...) uma
meta somente alcanvel atravs de refinamentos e melhoramentos sucessivos, tanto nos modelos utilizados quanto nas tcnicas de implementao. Um resultado de alta qualidade alcanvel aps iterados ciclos
de implementaes, testes, e melhoramentos.

1.3.1

Sistemas de sonorizao espacial

Desde o seu aparecimento, as tcnicas de auralizao vm evoluindo e tendem a utilizar


um nmero cada vez maior de alto-falantes necessrios a implementaes mais sofisticadas.
Isto pode ser observado comparando-se, como feito por Faria (2005) e Thomaz (2007), alguns
sistemas de sonorizao, como, por exemplo, os sistemas monofnico, quadrifnico, surround
(5.1, 7.1, etc.) e Ambisonics.
A histria da reproduo de som espacial comeou originalmente com o aparecimento
da reproduo estereofnica. O efeito estreo, surgiu por volta de 1930, quando percebeu-se
que a gravao feita com dois microfones (um para cada canal de gravao) poderia gerar, com
os alto-falantes, uma reproduo com sugesto de espacializao sonora. A partir do estreo,
diversas tcnicas de gravao foram propostas. Como desvantagens, a reproduo em estreo

Captulo 1. UM SISTEMA DE SONORIZAO BASEADO EM SNTESE DE FRENTE DE ONDA

14

apresenta uma grande interferncia entre as ondas (cross-talk), alm de ser muito limitada quando
busca-se a localizao precisa de objetos sonoros no campo de audio. Tanto em estreo quanto
na maioria das tcnicas de auralizao, o ouvinte no pode se deslocar da rea de audio correta,
pois as fontes sonoras tendem a emergir das caixas, no mais das posies virtuais esperadas.
Faria (2005, pg. 30) e Thomaz (2007, pg. 48) explicam que o mtodo bi-aural, assim
como a reproduo estereofnica, utiliza um canal de udio para cada ouvido e usa tcnicas para
tentar reproduzir neles, via fones de ouvido, um som originalmente emitido por uma fonte sonora
qualquer. Conforme as posies de cada objeto em relao ao ouvinte variam, temos que o som
chega primeiro ao ouvido que estiver mais perto desta fonte emissora, que uma das causas
de um objeto no ter o mesmo som para ambos os ouvidos. Estas diferenas levaram ao estudo
das funes de transferncias, aplicadas ao processamento desta tcnica, chamadas de Head
Related Transfer Function (HRTF), sendo individualizadas para o ouvido direito e esquerdo.
Como desvantagem, para vrios usurios, a tcnica necessita que o sistema reprodutor se conecte
a vrios fones de ouvido, pois os fones no podem ser compartilhados.
De acordo com Faria (2005, pg. 19-20), os sistemas surround criam efeitos complexos
de envolvimento e uma melhor ideia sobre a posio e o movimento dos objetos sonoros numa
cena sonora do que as antigas tcnicas, baseadas na reproduo em dois canais. Estes sistemas
tm cada vez mais mltiplos canais independentes, se utilizando de tcnicas digitais para o
processamento de sinais.
O Sistema Vetorial de Panorama por Amplitude (SVPA), ou em ingls Vector Based
Amplitude Panning (VBAP), conforme descrito por (FARIA, 2005, pg. 31-32) e Thomaz (2007,
pg. 55-56) um mtodo que permite posicionar as fontes virtuais no espao que tem boa preciso.
O sistema formado por diferentes arranjos de alto-falantes no qual so reproduzidos sinais
sonoros com diferentes amplitudes. Esta tcnica de implementao fcil e barata e de baixo
custo computacional, mas no leva em conta parmetros psicoacsticos importantes, como a
relao entre frequncia e variao da amplitude.
Ambiophonics, de acordo com Faria (2005, pg. 41) e Thomaz (2007, pg. 57), uma
tcnica de gravao e reproduo de som multicanal que emprega princpios psicoacsticos para
tratar os sinais que iro aos alto-falantes, em funo do posicionamento destes e dos ouvintes,
podendo resultar num elevado nvel de realismo na reproduo de salas de concerto e excelente
posicionamento das fontes sonoras virtuais no ambiente de projeo. A tcnica consiste em
separar o som direto, reproduzido por pares de alto-falantes, da ambincia, reproduzida por
outro arranjo de alto-falantes. Como limitao, Ambiophonics comporta somente de um a dois
usurios.
De acordo com Thomaz (2007, pg. 61), Ambisonics um sistema capaz de gravar e
reproduzir campos sonoros, buscando reconstruir a onda sonora original, levando tambm em
considerao parmetros psicoacsticos. Segundo Ranjan e Gan (2013), assim como em Wave
Field Synthesis, Ambisonics se baseia na reproduo do campos de ondas acsticas, o que

Captulo 1. UM SISTEMA DE SONORIZAO BASEADO EM SNTESE DE FRENTE DE ONDA

15

permitiria tima localizao das fontes sonoras. Ambisonics tem como vantagem poder sintetizar
o campo de onda com qualquer nmero de alto-falantes arranjados em formatos arbitrrios.
Segundo Faria (2005), WFS traz como vantagem diminuir o nmero de pontos de
interferncia das ondas geradas, produzindo uma frente de onda mais prxima daquela que um
instrumento real produziria no espao de audio, atravs da sua projeo por um nmero bem
mais elevado de alto-falantes que os usados nos sistemas comuns de udio espacial. Alm disso,
WFS no apresenta as limitaes de hot spots de outras tcnicas e pode ser usada para produzir
imagens sonoras hologrficas na frente dos alto-falantes.
A evoluo das tcnicas de espacializao de campo sonoro levou otimizao e expanso do uso do espao auditivo. Isto tem melhorado com as novas tecnologias de udio e o
aumento do poder de processamento dos computadores.
1.3.2

Espacializao na msica

Thomaz (2007, pg. 23) aborda o uso e a importncia de espacializao na msica


descrevendo apresentaes musicais nas quais h uma distribuio dos instrumentos musicais
em vrias posies do ambiente de execuo. Nas palavras do prprio autor:
Ento, aplica-se o termo de msica espacializada para toda msica na
qual, por meio do posicionamento incomum das fontes, da movimentao
das fontes e do uso da ambientao, o compositor eleva a espacializao
das fontes sonoras a um mesmo patamar de importncia que os outros
elementos da msica como a harmonia, o ritmo e o timbre, entre outros.

No trabalho de Baalman (2007), so comentadas composies de Hans Tuschku, Christian Calon, Victor Lazzarini, Andr Bartetzki e Shintaro Imai nas quais foram utilizadas tcnicas
de espacializao durante as respectivas apresentaes ao vivo destas peas. Para estas e outras
obras que precisem de recursos para espacializar, localizar ou movimentar o som no espao
sonoro sejam executadas em territrio brasileiro, necessria a instalao de um sistema de
espacializao sonora, que o foco deste projeto.
1.3.3

Instrumentao musical virtual espacial

Nas diversas formas de comunicao, um indivduo tem um pensamento e quer transmitilo a outro. A execuo musical uma destas formas de comunicao, uma maneira pela qual os
compositores transmitem suas ideias a outras pessoas. Para a criao de msicas cada vez mais
elaboradas e complexas, foi necessrio o desenvolvimento, dentre outras coisas, da tcnica dos
executantes e de instrumentos musicais de construo cada vez mais complexa para aumentar a
qualidade e a gama de timbres disponveis para os arranjos ou orquestraes (SILVA; FARIA,
2013). Desta forma, nota-se que o estudo e o desenvolvimento tecnolgico foram importantes

Captulo 1. UM SISTEMA DE SONORIZAO BASEADO EM SNTESE DE FRENTE DE ONDA

16

para a evoluo da msica, notadamente em relao aos instrumentos musicais, o que vai ao
encontro do que afirma Iazzetta (1997):
(...) Instrumentos musicais podem ser vistos como extenses tecnolgicas de nossas habilidades de produzir sons. Porm, necessrio que se
desenvolvam tcnicas para manipulao desses aparatos tecnolgicos
para que se alcance os resultados desejados.

Segundo Chion (1994) e o seu mito da alta fidelidade, a gravao no se aproxima


da realidade do concerto, pois no seria possvel ouvir as caractersticas gerais da execuo de
uma obra, como a percepo espacial dos instrumentos. Porm, a aproximao com a realidade
do concerto tende a melhorar com a evoluo das tecnologias de udio espacial, podendo os
instrumentos musicais, fugir da lgica da acstica imposta pelo corpo fsico dos instrumentos
tradicionais.
A tcnica de WFS pode ser usada na pesquisa com instrumentao musical virtual
espacial. Como proposto por Faria (2011b), a modelagem do espao pode ser feita pensando-o
como a interface de um instrumento de execuo musical, ou como uma matriz mapeada de
escuta de domnio do ouvinte, em que possvel controlar o som e algumas de suas caractersticas.
Impresses causadas pela simulao acstica de salas e pela posio dos instrumentos musicais,
sob controle dos instrumentistas, ajudam a definir diferentes cenas sonoras virtuais propostas aos
ouvintes.
O artigo escrito por Valbom e Marcos (2005) apresenta um ambiente de udio virtual,
chamado WAVE, cuja implementao abrange um modelo de instrumento musical que utiliza
tcnicas de som tridimensionais de udio envolvente, combinada com a visualizao e tecnologias
de realidade virtual. Este ambiente-prottipo visava estender a ideia de um instrumento musical
em um novo sistema de udio, com a incorporao de conceitos musicais tradicionais, integrando
msica e som. A arquitetura do sistema foi baseada em hardware de baixo custo e software open
source profissional com preos acessveis e equipamento de udio para manter uma qualidade de
som adequado. Vrias aplicaes deste ambiente virtual so discutidas no artigo, incluindo a
forma de satisfazer ao mesmo tempo compositores, artistas, estudantes de msica e de udio ou
mesmo simples usurios ocasionais.

1.4

A escolha das plataformas de desenvolvimento

Neste trabalho utilizada a plataforma computacional Pure Data6 (PUCKETTE et al.,


1996) (Pd) e bibliotecas feitas para ela como o AUDIENCE. O Pd um sistema que funciona
como um ambiente grfico de programao musical. Pode ser simultaneamente programado e
operado em tempo-real, sendo amplamente utilizado por msicos, artistas e sound designers.
6

Pure DataPD Community Site. Acesso em <http://puredata.info/>

Captulo 1. UM SISTEMA DE SONORIZAO BASEADO EM SNTESE DE FRENTE DE ONDA

17

A programao em Pure Data bastante simples por utilizar o conceito de fluxos e


blocos, o que permite a utilizao de expresses matemticas que alterem um fluxo de udio.
Um programa de Pd chamado de patch. Outra vantagem deste ambiente a sua capacidade em
aceitar extenses, atravs da criao de novos objetos que podem ser feitos na forma de externals
em linguagem C ou na forma de abstractions quando feitos em patches, com outros objetos do
prprio ambiente.
Alm de preencher os requisitos necessrios implementao deste projeto, o Pure
Data ainda tem outras vantagens como ser uma ferramenta opensource, ser multiplataforma e
funcionar em vrios sistemas operacionais. Alm disto, a escolha deste ambiente simplifica a
integrao do mdulo de WFS ao sistema AUDIENCE/OpenAUDIENCE, tambm implementado
na mesma plataforma.

18

2 TEORIA BSICA SOBRE WAVE FIELD SYNTHESIS (SNTESE DE


CAMPO DE ONDA)

Segundo Vries (2009) e Melchior (2011, pg. 16-17), a tcnica de Wave Field Synthesis
foi introduzida em 1988 por A. J. Berkhout (Universidade TU Deft, Holanda). baseada na
teoria formulada, no final do sculo XVII, pelo fsico holands Christiaan Huygens (1629-1695),
tendo como princpio fundamental obter o modelamento fsico da propagao de frentes de
ondas sonoras atravs da propagao e superposio de vrias pequenas frentes de onda, o que
requer uma formulao computacionalmente elaborada. Em 1818, o princpio de Huygens foi
complementado por Fresnel, e passou a se chamar princpio de Huygens-Fresnel. A formulao
matemtica deste princpio foi dada por Kirchhoff em 1882, que props um teorema mais geral
mostrando que o princpio de Huygens-Fresnel pode ser considerado um caso especial deste
teorema. O teorema de Kirchhoff pode ser simplificado levando formulao dos teoremas de
Rayleigh, que formam a base para a teoria de WFS.

2.1

Fundamentos tericos

O objetivo principal em WFS emular a frente de onda que seria produzida por objetos
sonoros reais em um ambiente acstico especfico, atravs de matrizes de alto-falantes densamente distribudas na rea de audio. De acordo com Menzies (2013), a configurao mais
comum da matriz de alto-falantes fica disposta num plano horizontal em que estes direcionam os
sons para a rea de audio, custa de perda de resoluo espacial para posies cada vez mais
distantes deste plano.
Segundo Baalman (2008) e Ranjan e Gan (2013), cada alto-falante emite um sinal de
udio com atraso e atenuao controlados, correspondentes sua posio, para que a soma das
contribuies destes sinais possa sintetizar uma frente de onda, buscando manter as caractersticas
espaciais e temporais que seriam emitidas por uma fonte sonora real. Na parte esquerda da figura
1 mostrada uma fonte sonora real e a representao da emisso de suas ondas sonoras, enquanto
na parte direita tem-se uma fonte sonora correspondente projetada atrs da matriz de alto-falantes,
o que ilustra o princpio de emulao por WFS.
Em WFS, o controle da sensao de localizao e distribuio do som de cada fonte
sonora melhora com o aumento do nmero de alto-falantes disponveis instalados. Os objetos
sonoros podem ser projetados em frente ou atrs dos alto-falantes. Na figura 2, podem ser
observadas duas possibilidades de criao de imagens sonoras virtuais. Na primeira, tem-se a
sensao de que a fonte sonora encontra-se atrs dos alto-falantes, enquanto na segunda, direita,
temos a fonte sonora formada em frente aos alto-falantes, como numa projeo hologrfica.
Segundo Baalman (2008), em WFS, considerando que o ouvinte est em frente matriz

Captulo 2. TEORIA BSICA SOBRE WAVE FIELD SYNTHESIS

19

Figura 1 esquerda ondas sonoras reais e direita ondas sonoras correspondentes sintetizadas por
WFS. Figura extrada da pgina LIMSI - Augmented and Virtual Reality & udio Interfaces <http:
//www.limsi.fr/Scientifique/aa/thmsonesp/IRV_web>

Figura 2 Fontes sonoras produzidas por WFS, como numa projeo hologrfica. esquerda tem-se
a impresso que a fonte sonora encontra-se atrs dos alto-falantes, enquanto direita temos a fonte
sonora formada em frente aos alto-falantes. Figura extrada da pgina MEI - Meios Eletrnicos Interativos
<www.lsi.usp.br/interativos/neac/audience/ambiwave.html>

de alto-falantes e a observa, a fonte sonora deve ser renderizada atrs da matriz, sobre ela ou
entre ela e o ouvinte. A fonte sonora no deve ser renderizada atrs de nenhum ouvinte, que,
neste caso, ouviria o som dos alto-falantes partindo em direo fonte sonora, o que o contrrio
do que esperado. Por esta limitao, determinada, em funo das posies dos ouvintes, a
linha de referncia que serve para determinar at onde o sistema pode projetar o objeto sonoro,
que tambm o limite no qual o ouvinte deve se posicionar para que a WFS surta efeito. A figura
3 ilustra a linha de referncia num sistema de coordenadas cartesiano, indicada por yre f e, como
prev a teoria, posicionada em frente a uma matriz de alto-falantes.
Segundo Baalman (2008, pg. 23-24) e Hulsebos (2004, pg. 11-12), para que a onda
sintetizada por WFS tenha as propriedades fsicas de uma onda sonora real, a presso do ar

20

Captulo 2. TEORIA BSICA SOBRE WAVE FIELD SYNTHESIS

(x f , y f )

linha de referncia (yre f )

rea de audio

Figura 3 O posicionamento das caixas de som, num sistema de coordenadas cartesiano, formando uma
matriz linear para WFS. As coordenadas (x f , y f ) correspondem posio do objeto sonoro (fonte sonora).
A linha de referncia, indicada por yre f , obrigatoriamente projetada antes da rea de audio, ou seja,
antes da regio em que o ouvinte deve estar para ouvir as fontes sonoras sintetizadas por WFS.

em cada ponto em frente s caixas de som, representada pela funo p(~r,t), deve satisfazer a
equao 2.1 (equao de onda), onde o mdulo de~r representa a distncia entre a fonte sonora
virtual e a frente de onda que a sintetiza e t o instante de tempo em que a presso foi medida.

2 p(~r,t)

(2.1)

1 2
p(~r,t) = 0
c2 t 2
n

Nesta equao, o laplaciano 2 p(~r,t) =


i=1

2
p(~r,t)
ri 2

equivale soma das derivadas


2

parciais da funo p(~r,t) em relao s componentes do vetor~r = (r1 , r2 , ..., rn , ), t


r,t) a
2 p(~
derivada parcial da funo p(~r,t) em relao ao tempo e c representa a velocidade do som no ar
(343,4 m/s).

Baalman (2008) mostra como a presso pode ser representada no domnio da frequncia
, usando-se a equao 2.2, conhecida como Transformada de Fourier.

(2.2)
onde j =

P(~r, ) =

1 (nmero imaginrio).

p(~r,t)e jt dt,

Captulo 2. TEORIA BSICA SOBRE WAVE FIELD SYNTHESIS

21

Com a Transformada Inversa de Fourier (equao 2.3) obtm-se novamente a funo no


domnio do tempo.

p(~r,t) =

(2.3)

1
2

P(~r, )e jt dt

A funo de onda no domnio da frequncia deve satisfazer a equao 2.4.

2 P(~r, ) +

(2.4)
2.1.1

 2
c

P(~r, ) = 0

Aliasing espacial

Apesar da tcnica ser considerada por muitos autores a que mais permite aproximar a
criao de campos sonoros sintticos dos naturais, h limitaes reconhecidas que devem ser
observadas no projeto de sistemas para usos musicais, principalmente para que no se inviabilize
a gerao dos efeitos desejados. Uma das principais limitaes est no fenmeno de aliasing
espacial, uma vez que o campo sonoro mostrado em posies descritas no espao de audio.
A frequncia mxima para que se opere sem aliasing espacial determinada pela
diferena mxima de tempo entre a viagem do som de um alto-falante a um ouvinte e a viagem
do som de outro alto-falante ao mesmo ouvinte, incluindo os atrasos necessrios para que ocorra
a sntese WFS, sendo, portanto, a frequncia mxima de operao do sistema, acima da qual
artefatos e a disperso da imagem sonora tornam imprecisa a tcnica.
Segundo Berkhout, Vries e Vogel (1993), a frequncia mxima para que um sistema de
WFS opere sem aliasing espacial, fmax , dada pela equao 2.5.

fmax =

(2.5)

c
xmax

onde xmax a distncia mxima entre o centro de duas caixas de som consecutivas e c
a velocidade do som no ar.
Conforme pode ser percebido pela equao 2.5, distncias pequenas entre os cones dos
alto-falantes possibilitam trabalhar com fmax mais altas, o que importante para que os sons de
instrumentos de registros bem agudos possam ser ouvidos nas posies previstas pelo uso de
WFS. Assim, deve-se buscar o menor espaamento possvel entre os transdutores, para que se
possa minimizar esta limitao.

2.2

O operador WFS

Na literatura sobre WFS, encontram-se passagens tericas que mostram as expresses


para a funo fundamental em qualquer implementao desta tcnica. Esta funo determina o

22

Captulo 2. TEORIA BSICA SOBRE WAVE FIELD SYNTHESIS

fator para o ganho de amplitude sonora correspondente a cada alto-falante e chamada de operador WFS (do ingls operator), ou ainda, driving function ou driving signal. Alm dos trabalhos
destacados no transcorrer desta seo, um bom embasamento pode ser encontrado em Wittek
(2007), Montag (2011) e, principalmente Hulsebos (2004), que abordam o desenvolvimento
terico desde suas bases, passando por diversas equaes, chegando a aplicaes imediatas,
principalmente descries sobre sistemas de WFS para matrizes lineares de alto-falantes. J no
texto de Salvador (2010), encontra-se a teoria de forma bem resumida. A seguir, so examinados os principais operadores encontrados na literatura pesquisada, que serviram de base ao
desenvolvimento deste projeto.
Conforme comentado no incio do captulo 2, os teoremas de Rayleigh, formam a base da
teoria de WFS. Estes teoremas so solues da equao 2.2, abordada na seo 2.1. Adaptando
esta teoria para que sejam usadas com matrizes de alto-falantes, obtm-se funo da presso
no domnio da frequncia, P(~r, ). Estas solues so descritas por Salvador (2010) e Ranjan
e Gan (2012), que afirmam que o somatrio das contribuies das frentes de onda geradas em
cada alto-falante, representada por P(~r, ), obedece a equao 2.6.

(2.6)

1 N
e j c |rn rr |
P(~r, ) =
x
D(x
,
)
n

4 n=1
|rn rr |

onde xn a abscissa1 de cada caixa de som, |rn rr | a distncia entre a caixa de som
n e a posio do ouvinte, x a distncia entre o centro de duas caixas de som consecutivas e
k = c o nmero de onda. O operador WFS, representado na equao 2.6 como D(xn , ), a
funo usada para calcular a contribuio de presso gerada em cada caixa de som do sistema.
Esta mesma abordagem feita por Belloch et al. (2013). Ele ilustra um sistema bsico
de WFS com N caixas de som, atravs da figura 4, e prope a equao 2.7, onde r p a diferena
entre as posies da fonte sonora e da n-sima caixa de som e rdn a diferena entre as posies
da n-sima caixa de som e do ponto de coordenadas (x0 , y0 ) (posio do ouvinte).

(2.7)

e j c rdn
P(x0 ,y0 ) ( f ) = Qn ( f )
rdn
n=0
N1

Segundo Belloch et al. (2013), o operador WFS (representado por Qn ( f ), onde f neste
caso representa a frequncia do sinal de udio) da n-sima caixa de som dado pela equao 2.8,
onde n (r p ) e An (r p ) so os fatores de atraso e amplitude, respectivamente. Ambos dependem da
distncia r p , entre a posio da fonte sonora virtual (representada pelo piano) n-sima caixa

de som. O filtro H( f ) equivale expresso K j f , onde K uma constante que depende da


1

coordenada cartesiana

23

Captulo 2. TEORIA BSICA SOBRE WAVE FIELD SYNTHESIS

Figura 4 Um sistema de WFS com N alto-falantes, onde so destacadas as distncias r p , entre fonte
sonora e alto-falante n, e rdn entre alto-falante n e ouvinte (BELLOCH et al., 2013).

geometria da configurao. Este termo vem da integral de Rayleigh I. O som da fonte sonora
virtual representada por X( f ).

(2.8)

Qn ( f ) = X( f ).H( f ).e jn (r p ) .An (r p )

Como base para a verso de operador escrito neste projeto, foram estudadas as verses
apresentadas em Baalman (2008), Ranjan e Gan (2012), Spors, Rabenstein e Ahrens (2008) e
Wittek (2007, pg. 58).
2.2.1

O operador WFS segundo Ranjan e Gan

A figura 5 descreve a geometria do sistema para WFS proposto por Ranjan e Gan (2012).
O plano onde esto o objeto sonoro (fonte), as caixas de som e o ouvinte, indicados por S, n e R,
respectivamente, tem coordenadas definidas pelos eixos x e z.
A equao 2.9 mostra o operador WFS proposto por Ranjan e Gan (2012).

r
(2.9)

Dw f s (n, ) = S()

j
2

|ZR Zn |
e j c |rn rS |
cos(S,n ) p
|ZR ZS |
|rn rS |

Captulo 2. TEORIA BSICA SOBRE WAVE FIELD SYNTHESIS

24

Figura 5 Descrio geomtrica do sistema para WFS (RANJAN; GAN, 2012).

2.2.2

O operador WFS segundo Wittek


A figura 6 descreve a geometria do sistema para WFS proposto por Wittek (2007, pg. 58).

Figura 6 Fonte virtual reproduzida num plano horizontal por uma matriz linear WFS. Wittek em seu
trabalho faz referncia a esta figura que est na tese de doutorado de E. Verheijen (VERHEIJEN, 1998,
pg. 41).

25

Captulo 2. TEORIA BSICA SOBRE WAVE FIELD SYNTHESIS

Na figura 6, o plano onde esto o objeto sonoro (fonte), indicado por S, e o ouvinte,
indicado por R, tem coordenadas definidas pelos eixos x e z.
A equao 2.10 mostra o operador WFS proposto por Wittek (2007, pg. 58).

r
(2.10)
2.2.3

Qm (r, ) = S()

jk
2

e jkr
Z0
cos
Z0 + Z0
r

O operador WFS segundo Spors, Rabenstein e Ahrens

A equao 2.11 mostra o operador WFS proposto por Spors, Rabenstein e Ahrens (2008,
seo 4.4).

r
(2.11)

Dtrad (~x0 , ) = S()

j c
2

|~xre f ~x0 |
e j c |~xS ~x0 |
cos p
|~xS ~x0 | + |~xre f ~x0 |
|~xS ~x0 |

onde ~xS a posio do objeto sonoro ~x0 a posio do alto-falante, cos =


a posio da linha de referncia.
2.2.4

ys
|~xS ~x0 |

e ~xre f

O operador WFS segundo Marije Baalman

Segundo Baalman (2008), o operador expresso pela equao 2.12, seguindo os parmetros ilustrados na figura 7.

r
(2.12)

Q (x, y0 , ) = S()

jk
2

r0
e jkr0
cos(0 )
r0 + r0
r0

Onde x a abscissa da posio da caixa de som, k = c o nmero de onda, S() o


q q

r0
1
1
sinal de udio, rc0 o fator de atraso, 2
jk o
r0 +r0 cos(0 ) r0 o fator de amplitude e
fator de filtragem.
2.2.5

Entendendo melhor o operador WFS

Levando-se em considerao as informaes passadas pelas equaes 2.9, 2.10, 2.11 e


2.12, proposta uma verso para o operador WFS (equao 2.13) que tenta unificar e sintetizar o
que foi proposto por elas. Estes quatro operadores so praticamente idnticos, se diferenciando
basicamente pela escolha das variveis que representam cada grandeza que tem correspondncia
nestas quatro verses.
Para a verso de operador proposta, como referncia, que pode ser escolhida arbitrariamente, usado o sistema de coordenadas cartesianas ilustrado na figura 8. Nesta a figura,

26

Captulo 2. TEORIA BSICA SOBRE WAVE FIELD SYNTHESIS

Figura 7 Parmetros usados no clculo feito pelo operador WFS relacionados s posies do objeto
sonoro , caixas de som (y0 ) e linha de referncia.

o vetor ~r f ,n representa a diferena entre a posio da fonte sonora virtual (f, no confundir
com frequncia que representada aqui por ) e a posio da caixa de som (n), ento tem-se
~r f ,n = (x f xn , y f yn ). O vetor~r f ,re f a diferena entre a posio da fonte sonora virtual e a
posio de referncia para a escuta, que pode ser a linha de referncia ou posio de um ouvinte.
O vetor ~rn,re f a diferena entre a posio da caixa de som e a posio de referncia para a
escuta. Nestes casos, foi adotada a linha de referncia para que os clculos no privilegiem a
escuta em um ponto, levando em considerao toda a rea de audio.

r
(2.13)

DW FS = S f

j c
2

|~rn,re f |
e j c |~r f ,n |
cos p
|~r f ,re f |
|~r f ,n |

O operador DW FS usado para determinar como o sinal de udio S f deve ser processado
para que ocorra a WFS. construdo em funo das posies dos ouvintes e da posio de
sua correspondente cada caixa de som, ou seja, cada caixa de som tem seu prprio operador.
Alm disso, deveq
receber as informaes da posio das fontes sonoras em tempo real. Segundo
Baalman (2008), j c o fator de filtragem e, de acordo com Wittek (2007, pg. 59), corresponde
a um filtro de amplitude em funo da frequncia, com ganho de 3 dB por oitava.
Alm do fator de filtragem, tem-se no restante da equao do operador WFS os clculos

27

Captulo 2. TEORIA BSICA SOBRE WAVE FIELD SYNTHESIS

y
(x f , y f )
fonte sonora virtual

~r f ,n
(xn , yn )

~r f ,re f

~rn,re f

linha de referncia (yre f )


x
rea de audio

Figura 8 Sistema de coordenadas cartesianas e vetores usados no operador WFS.

de amplitude e atrasos do sinal de entrada. Desta forma, este operador pode ser expresso pela
equao 2.14, onde os ndices f e n se referem fonte sonora e n-sima caixa de som,
respectivamente.

r
(2.14)

Dw f s = S f

A f ,n e j c d f ,n
c

sendo A f ,n o fator de amplitude.


2.2.5.1

Clculo das amplitudes

A partir das equaes 2.13 e 2.14, conclui-se que o clculo do fator de amplitude para o
sinal de udio pode ser feito usando-se a equao 2.15.

r
(2.15)

A f ,n =

1
2

|~rn,re f |
1
cos p
|~r f ,re f |
|~r f ,n |

Conforme a discusso sobre o referencial ilustrado na figura 8, temos que cos =


ento o fator de amplitude pode ser calculado pela equao 2.16.

r
(2.16)

A f ,n =

1
2

|~rn,re f |
|~r f ,re f |

y f yn
|~r f ,n |

1
p
|~r f ,n |

y f yn
|~r f ,n | ,

Captulo 2. TEORIA BSICA SOBRE WAVE FIELD SYNTHESIS

2.2.5.2

28

Clculo dos atrasos

Segundo Baalman (2008), o clculo dos delays (atrasos), que cada caixa de som n deve

efetuar ao transmitir sua contribuio sonora no domnio da frequncia, dado por e j c |~r f ,n | .
Considerando o ndice f representando a fonte sonora e~r f ,n sendo a diferena vetorial entre as
posies da fonte sonora e da n-sima caixa de som e r f ,n seu valor escalar, para o domnio do
tempo, usada a equao 2.17.

(2.17)

2.3

t f ,n =

r f ,n
c

Aplicaes de Wave Field Synthesis

Nos sistemas mais usados nas residncias, como os home-theaters, para que se possa
obter o resultado de espacializao oferecido em cada um deles, necessrio que o ouvinte se
posicione num determinado ponto entre as caixas de som, normalmente ficando numa poltrona
fixa. A maioria das tcnicas de sonorizao tem uma regio de escuta muita pequena (hot spot),
pois a mudana da posio do ouvinte muda a percepo do ponto onde o som est localizado.
Se vrias pessoas, ao mesmo tempo, tentarem ouvir o som gerado por uma destas tcnicas,
no podero ficar nesta pequena rea e no ouviro o resultado da projeo do som de forma
satisfatria. Em aplicaes de WFS, cada ouvinte deve ter a mesma sensao de distribuio e
percepo das fontes sonoras no espao de audio. A tcnica WFS se diferencia por permitir a
localizao do objeto independentemente da posio do ouvinte, de forma semelhante ao que
ocorre com a projeo de imagens nos filmes em 3D.
Segundo Lopez et al. (2010), sistemas de videoconferncia tm como objetivo fornecer
uma maneira de realizar reunies, sem a necessidade de ter a presena fsica dos participantes.
No entanto, o senso de realismo alcanado por esses sistemas tradicionais geralmente longe do
esperado pelas pessoas envolvidas na comunicao. A introduo de WFS pode contribuir para o
aumento do realismo em sistemas 3D de videoconferncia.
A utilizao de WFS imediata em salas de cinema, nos jogos de computador e em
eventos teatrais. A espacializao sonora por WFS pode ser aplicada para aumentar as possibilidades musicais, podendo ser utilizada em conjunto com imagens ou objetos mveis. Msicos
e maestros teriam a opo de realizar ensaios em meio a orquestras virtuais, pois esta tcnica
facilita discriminar o som de cada instrumento, mesmo quando vrios deles so ouvidos simultaneamente. Produtores em estdio de gravao, compositores ou arranjadores poderiam pensar em
diferentes formas de arranjos ou orquestraes musicais, em funo da posio em que gostariam
que cada som fosse reproduzido.

Captulo 2. TEORIA BSICA SOBRE WAVE FIELD SYNTHESIS

2.4

29

Projetos e trabalhos de referncia

A leitura de vrios trabalhos ajudou a traar uma viso terica geral sobre WFS e suas
aplicaes prticas. A seguir so comentados projetos de referncia que faziam parte deste
levantamento.
2.4.1

O projeto CARROUSO

Segundo Baalman (2008) e Brandenburg, Brix e Sporer (2004), o CARROUSO (Creating,


Assessing and Rendering in Real Time Of high quality aUdioviSual envirOnments in MPEG-4
context) foi um projeto financiado pela Comunidade Europia e realizado de janeiro 2001 at
junho de 2003, objetivando o desenvolvimento de udio 3D, com a construo de um sistema
de WFS para a renderizao de cenas sonoras, bem como desenvolver tcnicas para grav-las.
Para sua realizao se juntaram, em colaborao, empresas privadas, institutos de pesquisa e
universidades, como Delft University, France Telecom R&D, IRCAM, e Fraunhofer Institute IIS
AEMT.
2.4.2

Casa del Suono

Figura 9 Lampadario Acustico. Fotos retiradas de http://www.casadelsuono.it/project/default.asp

Segundo Baalman (2008), na Casa del Suono2 em Parma na Itlia, foram instalados dois
sistemas baseados em WFS. O primeiro deles para equipar um auditrio e o segundo uma matriz
esfrica, montado como um lustre, conhecido como Lampadario Acustico (figura 9). Usado
para formar fontes sonoras pontuais bem focalizadas, o Lampadario consegue espacializ-las
com deslocamento em tempo real no espao sob a cpula, em todas as trs dimenses. Um
computador, que usa o sistema operacional Debian GNU/Linux, faz o processamento dos sons,
que sero reproduzidos pelos alto-falantes, oriundos da entrada da placa de som, ou de qualquer
tipo de software que usa o servidor de udio Jack Audio Connection Kit (JACK)3 , um programa
2
3

Acesso em: Casa del Suono - Comune di Parma <http://www.casadelsuono.it/project/default.asp>


Acesso ao site do projeto em <http://jackaudio.org/>

Captulo 2. TEORIA BSICA SOBRE WAVE FIELD SYNTHESIS

30

que, por meio de um servidor de udio, interliga os programas de udio e os conecta s entradas
e sadas de hardware disponveis. O controle da posio de cada fonte pode ser feito via Open
Sound Control ou MIDI.
Martino Traversa comps uma pea de nome NGC 353 para a inaugurao da Casa del
Suono. A execuo desta composio cria aos espectadores a sensao de que podem tocar os
sons que danam ao redor e acima da cabea de cada ouvinte (BAALMAN, 2008).
2.4.3

WFS do IRCAM

Segundo Baalman (2008), foi instalado no IRCAM4 em Paris (Frana), em 2008, um


sistema WFS equipado com 128 alto-falantes. Este sistema combinado com um outro sistema
para a captura de movimento com cmaras de infravermelhos. Este equipamento usado para
experimentar novos mtodos de espacializao para a criao musical e para os experimentos
cientficos com a realidade virtual e cognio espacial. O IRCAM colaborou com o projeto
CARROUSO e nos ltimos anos estabeleceu parceria com a empresa sua Sonic Emotion, para
desenvolver sistemas de espacializao baseados em WFS.
2.4.4

WFS da Technical University - Berlin

A Technical University de Berlim, Alemanha, entre 2006 e 2007 lanou um projeto para
equipar um de seus auditrios usando um sistema WFS, com um total de 840 canais de udio.
O sistema controlado pelo software de cdigo aberto sWONDER proposto por Baalman et
al. (TU Berlin, 2007). O programa controlado via Open Sound Control (OSC), possibilitando
a comunicao com outros sistemas, alm disso, permite ao usurio definir o movimento das
fontes sonoras.
2.4.5

IOSONO

A plataforma comercial IOSONO5 o resultado do emprego da tcnica de WFS para


a sonorizao espacial de amplos espaos, como cinemas e teatros. O sistema o resultado de
anos de pesquisa e desenvolvimento de diversas universidades europeias, e foi aperfeioado
pelo Instituto Fraunhofer, da Alemanha. Reporta-se desde 2003, h um cinema de 100 lugares
em Ilmenau (Alemanha) equipado com 198 alto-falantes. O sistema tem sido desenvolvido
para aplicaes domsticas, sendo comercializadas verses home-theater. Pode-se verificar a
aplicao feita em um sistema de sonorizao da IOSONO, usando-se tecnologia baseada em
WFS, numa verso adaptada da pera Neither6 , escrita por Morton Feldman and Samuel
Beckett.
4
5
6

Institut de Recherche et Coordination Acoustique/Musique. Acesso em: <http://www.ircam.fr>


IOSONO, the future of spatial audio. Acesso em: <http://www.iosono-sound.com/>
3D Audio Opera Goes International. Acesso em: <http://neitherphase7.wordpress.com/about-neither/
about-neither-by-sven-soren-beyer/>

31

3 ESTUDOS INICIAIS PARA DESENVOLVIMENTO DE PROTTIPOS

Como base para o desenvolvimento do programa proposto para este projeto foram levantadas informaes buscando-se entender o funcionamento dos programas de referncia, atravs
de testes operacionais e da documentao disponvel correspondente. A documentao de cada
programa serviu para compreender o funcionamento de seus respectivos mdulos de algoritmos
utilizados, para que pudessem ser determinados aspectos em comum das implementaes, resultando numa estratgia de implementao para os mdulos de programao desenvolvidos neste
trabalho que consistiu na elaborao de diagramas de funcionamento em bloco que ilustram e
ajudam a explicar o emprego da tcnica de WFS na estrutura de cada programa.

3.1

Programas de referncia para WFS

A seguir feita uma anlise dos programas de referncia pesquisados. As informaes


levantadas sobre estes programas foram fundamentais como referncia para a construo do
sistema de WFS proposto.
Foram realizados testes de instalao, configurao e uso de trs programas de referncia
(WFSPlayer de Daniel Salvador, SSR, sWONDER). Tambm buscou-se avaliar o potencial
de explorao da distribuio espacial de elementos sonoros em aplicaes e peas musicais
auralizadas com WFS e as condies de uso destes programas como framework para possveis
implementaes artsticas.
A instalao dos programas SSR e sWONDER exigiu um aprendizado considervel sobre
os sistemas operacionais baseados em Linux. Houve algumas experincias com as distribuies
Ubuntu, Debian, Fedora e Ubuntu Studio. A experincia com estas distribuies mostra que,
embora funcionais, tm-se ainda que usar tempo considervel para solucionar problemas de
configurao, principalmente com as interfaces de som multicanal, item obrigatrio em um
sistema que pode empregar dezenas (ou centenas) de canais. Alm de seguir o manual de
instalao com um nmero considervel de procedimentos via terminal de comando, deve-se
resolver a pendncia da falta de vrias bibliotecas exigidas pelos programas citados.
Dificuldades com mltiplas instalaes de sistemas operacionais e das placas de som, de
sistemas auxiliares (como o JACK) e com o setup de matrizes de alto-falantes tornaram a tarefa
de realizar os testes mais complexa do que o previsto inicialmente. As sees seguintes resumem
os levantamentos realizados sobre os softwares de referncia.

Captulo 3. ESTUDOS INICIAIS PARA DESENVOLVIMENTO DE PROTTIPOS

3.1.1

32

sWONDER

O projeto de pesquisa do sWONDER (Wave field synthesis Of New Dimensions of


Electronic music in Realtime) iniciou-se em 2003, na TU Berlin, com M. Baalman. Em 2007,
para poder ser instalado e usado com muitos canais num grande auditrio na TU Berlim,
Alemanha, foi reestruturado por uma equipe de desenvolvedores para se adaptar a grandes
instalaes ficando com uma estrutura distribuda (BAALMAN et al., TU Berlin, 2007). O
propsito do projeto servir de ferramenta para composio musical e apresentaes ao vivo.
O programa sWONDER1 construdo em C/C++, e tambm se utiliza de Qt2 para a
interface de usurio, patches para Pure Data e plugins VST, roda sob a plataforma Linux e
dividido em alguns programas que podem rodar em diferentes computadores e que podem se
comunicar em rede, atravs do protocolo OpenSoundControl (OSC).
Pode ser configurado para operar com matrizes de alto-falantes linear ou retangular,
mas no circular. necessrio modificar os arquivos de configurao para usar o sistema com
eficincia. possvel definir parmetros geomtricos da sala virtual que o sistema deve conceber,
para que o usurio possa mover fontes virtuais dentro da regio definida. Isto tambm permite
aos usurios simular as reflexes do som nas paredes da sala virtual.
O sWONDER opera em realtime e controlado via JACK. Para diversas funes, como
gravao e reproduo de udio em mltiplos canais, o manual do software sugere a utilizao
do programa Ardour3 , uma estao de trabalho de udio digital multicanal.
possvel escolher entre fontes virtuais pontuais ou fontes do tipo ondas planas com
direo definida. As imagens dos objetos sonoros podem se formar atrs, em frente ou sobre
a matriz de alto-falantes. O controle do movimento dos objetos sonoros feita via mouse
interagindo com a interface de usurio, com a vantagem de poder optar entre o modo fade out
na posio de origem e um fade in na posio de destino ou o modo que tenta movimentar
continuamente o objeto, simulando o efeito Doppler. Tanto as cenas sonoras estticas como as
que tm objetos mveis podem ser salvas.
Segundo Belloch et al. (2013), a mudana de posio usando a tcnica de crossfade
(fade-out e fade-in), que consiste em incrementar sinal sonoro numa posio e decrementar
noutra, usa mais do que o dobro da demanda computacional o que fica muito mais complicado
com vrios objetos sonoros.
A nica instalao do sWONDER bem sucedida foi feita num computador antigo do
NEAC (com processador Intel Pentium IV de 2.80 GHz e 1 GB de RAM). Depois da difcil
instalao das bibliotecas auxiliares para que o programa pudesse ser compilado, constatou-se
que o sistema operacional instalado nesta mquina, Debian 6.0 (32 bits), usa um compilador
1
2
3

Para baixar o sWONDER, deve-se acessar: <http://sourceforge.net/projects/swonder/>.


Qt. Acesso em: <http://qt.digia.com/>
Ardour - the digital audio workstation. Acesso em http://ardour.org/

Captulo 3. ESTUDOS INICIAIS PARA DESENVOLVIMENTO DE PROTTIPOS

33

Figura 10 GUI do sWONDER. Fonte: <http://retiary.org/idea/idea7/idea_7/marijeb/marije.htm>

C++ em verso anterior aos usados nas outras mquinas com outros sistemas operacionais de
64 bits, como por exemplo o Ubuntu 12.04 LTS. O som do sWONDER foi ouvido quando este
computador foi conectado em rede a um computador iMAC (com processador Intel Core 2
Duo de 2.4 GHz e 4 GB de RAM), onde estava instalada a interface Echo Audiofire 12 que
suporta 12 canais de udio, atravs de uma ponte de udio com a utilizao do servidor JACK.
Como a demonstrao e os testes com este programa dependiam desta configurao em rede, sua
anlise mais detalhada foi deixada para o futuro, j que a prioridade ficou com as instalaes que
utilizavam apenas um computador. A figura 10 mostra a interface grfica de usurio (GUI) do
programa, ilustrando o mdulo de composio da cena.
3.1.2

WFSPlayer de Daniel Salvador

O WFSPlayer uma aplicao construda no ambiente de programao Pure Data por


Csar Daniel Salvador Castaeda, ex-pesquisador da Universidad de San Martn de Porres
(USMP), Peru, que concedeu o cdigo-fonte do sistema de WFS para esta pesquisa. Trata-se de
um conjunto de patches (abstraes) desenvolvidos por ele no Pd, que so includos no patch
principal, onde se encontra a interface que pode ser controlada via mouse.
O programa no tem documentao formal nem site de distribuio. Tem um carter experimental, no tem manual de instrues e quase no existem comentrios em seu cdigo-fonte.
Foi projetado para um sistema com arranjo de 35 alto-falantes dispostos em uma matriz circular
horizontal de 1,5 m de raio. No difcil alterar seus parmetros, desde que a configurao seja

Captulo 3. ESTUDOS INICIAIS PARA DESENVOLVIMENTO DE PROTTIPOS

34

sempre circular, uma particular limitao (ou caracterstica) desta implementao. Para outro
tipo de configurao, como a linear, so necessrias modificaes em quase todo o cdigo e,
provavelmente, alguns acrscimos em sua estrutura, o que no foi realizado por estar alm do
escopo proposto nesta pesquisa.

Figura 11 Patch principal do WFSPlayer, mostrando seus diversos mdulos de configurao e uso
acessvel em subpatches.

Para a instalao inicial do programa, devem ser acrescentadas ao Pd as bibliotecas


iemgui e bsaylor, que no vm na pasta enviada pelo pesquisador. Deve ser instalada, como
uma nova biblioteca para a Pd, uma pasta chamada Wave_field_synthesis, pois nela esto os
mdulos de processamento. O ncleo a abstrao wfs_sta_sw_2.5D_driving.pd, onde fica a
funo operador WFS usada para gerar as ondas sonoras esfricas.
O programa dividido em alguns blocos, e seu patch principal,
wfs_horizontal.pd, pode ser visto na figura 11, onde est o programa propriamente dito, comea
com bangs para disparar os parmetros iniciais contidos no audio_init, onde esto os parmetros de udio para todo o processo. No geometry_init est a distribuio com as coordenadas de
cada um dos 35 alto-falantes. No virtual_sources esto os arquivos de audio a renderizar.
Na interface de controle, que que fica dentro do subpatch
pd set_the_controls_for_the_heart_of_the_sun, necessrio controlar o objeto room_sim_2d,
colocando o mouse sobre o crculo central (cursor) e moviment-lo, pressionando a tecla Shift.

Captulo 3. ESTUDOS INICIAIS PARA DESENVOLVIMENTO DE PROTTIPOS

35

Um tipo de configurao diferente da circular, como a linear, precisaria de modificaes


em quase todo o cdigo e, provavelmente, alguns acrscimos em sua estrutura, o que fortaleceu
a motivao inicial em construir um patch totalmente novo em Pd, aproveitando as dicas de
alguns objetos utilizados por Salvador.
Foram feitas algumas alteraes para que o programa funcionasse com 6 caixas de som
passivas, ligadas a um amplificador de 8 canais, suportadas em pedestais de 1,8 m de altura e
dispostas em uma circunferncia de raio 0,5 m.
Com o uso de arquivos de udio, disponibilizados juntos com cdigo-fonte, foram feitos
testes onde percebeu-se que havia um efeito de deslocamento em circulo das fontes, seguindo a
distribuio geomtrica das caixas. Sabendo-se das limitaes da tcnica empregada, este efeito
foi provavelmente consequncia do grande espaamento entre os alto-falantes.
3.1.3

SoundScape Renderer (SSR)

O SoundScape Renderer (SSR) um programa usado para reproduo de udio espacial


executado em GNU/Linux e Mac OS X. Foi desenvolvido por Jens Ahrens, Matthias Geier e
Sascha Spors, um grupo de pesquisa da Universidade Tcnica de Berlim, em colaborao com
Telekom Inovation Laboratories. O programa foi escrito em linguagem C++ e tambm utiliza
QT, Python e Puredata. A verso atual do projeto a 0.4.24 , lanada em 24 de julho de 2014. A
primeira foi publicada em maio de 2010.
O SSR tem como propsito ser um framework para possveis implementaes de estado
da arte com vrias tcnicas de reproduo de udio espacial para uso e pesquisa. Ele capaz
de processar cenas acsticas virtuais usando WFS, reproduo bi-aural Head Related Transfer
Functions (HRTF), Ambisonics e Vector Base Amplitude Panning (VBAP). Tambm pode ser
configurado para operar com array de alto-falantes linear, retangular ou circular.
Qualquer programa que envia dados de udio e qualquer entrada do hardware de udio
pode ser conectado ao SSR e pode servir como fonte de entrada, em tempo real. Seu manual
recomenda que as conexes de udio sejam feitas atravs do JACK. Desta forma, o SSR pode ser
interligado a programas como players e gravadores, ou a qualquer programa que obrigatoriamente
tenha suporte ao JACK (AHRENS; GEIER; SPORS, 2012).
Como o arquivo disponibilizado para a instalao do programa era pr-compilado para
o sistema operacional Mac OS X, sua instalao foi relativamente simples. Antes disso, houve
uma tentativa de instalao no computador mais moderno (Intel Core i7-2600), sob o sistema
operacional Ubuntu Studio 12.04 LTS (64 bits), que exigia compilar o programa e as bibliotecas
necessrias para seu funcionamento, o que tornou esta atividade relativamente complexa. Mesmo
depois deste procedimento, sua instalao no foi finalizada para este sistema operacional,
4

Os arquivos para a instalao, bem como o manual de instrues, encontram-se disponveis em <https://
bitbucket.org/spatialaudio/ssr/downloads>

Captulo 3. ESTUDOS INICIAIS PARA DESENVOLVIMENTO DE PROTTIPOS

36

apresentando mensagens de erro enquanto estava sendo compilado.


As imagens dos objetos sonoros no SSR podem se formar atrs, em frente ou sobre a
matriz de alto-falantes. Pode-se trabalhar com fontes virtuais do tipo pontuais ou com ondas
planas, o que leva a impresso que o objeto est bem distante (no infinito). possvel colocar os
objetos sonoros em movimento fazendo o controle atravs do mouse na interface de usurio. A
tcnica consiste em fazer um fade out na posio de origem e um fade in na posio de destino.
Cenas sonoras estticas podem ser salvas, porm o mesmo no ocorre com as cenas em que os
objetos sonoros se movem (AHRENS; GEIER; SPORS, 2012). O programa cria as imagens
sonoras que podem ser controladas via interface grfica de usurio (GUI), que ilustrada pela
figura 12.

Figura 12 GUI do SSR para controle das posies das imagens sonoras, com a utlizao da tcnica
bi-aural.

Foram feitas anotaes gerais da reproduo de WFS pelo programa SSR, como forma de
deixar o equipamento pronto para os testes seguintes. Deveria-se testar as impresses causadas
quando as fontes sonoras pontuais encontravam-se paradas atrs ou em frente aos alto falantes,
tentando, de forma subjetiva, classific-las em precisas ou dispersas, quanto sua focalizao.
As impresses iniciais foram satisfatrias, com fontes soaram bem localizadas para quaisquer
pontos, com focalizao precisa.

3.2

Diagramas de blocos dos programas de referncia

Analisando-se as informaes do artigo de Geier, Ahrens e Spors (2008) foi possvel


derivar um diagrama geral de funcionamento do SSR, conforme mostrado na figura 13. Dadas as

Captulo 3. ESTUDOS INICIAIS PARA DESENVOLVIMENTO DE PROTTIPOS

37

configuraes iniciais da cena (bloco direita) e feito o controle das informaes do usurio
via GUI.
GUI

Network
Interface

Cena

Controlador

Entrada

Interface de
redenderizao

WFS
Sada

Figura 13 Diagrama de blocos geral de funcionamento do SSR.

Figura 14 Fluxo de operaes por canal do mdulo WFS do SSR.

O mdulo WFS do SSR tem o funcionamento mostrado no diagrama da figura 14. O sinal
de udio passa por um filtro de frequncias e, com os dados originados na GUI e na descrio da

Captulo 3. ESTUDOS INICIAIS PARA DESENVOLVIMENTO DE PROTTIPOS

38

cena, adicionam atrasos e diferentes amplitudes do sinal de udio para cada caixa de som do
sistema.

Figura 15 Diagrama em blocos do sWONDER.

Para o sWONDER, o artigo Baalman et al. (TU Berlin, 2007) permitiu chegar ao
diagrama da figura 15, no qual pode-se perceber que cada um dos N canais tem sua unidade de
renderizao (Render unit), onde so feitos os clculos para que ocorra a WFS. O usurio deve
enviar os dados de localizao dos objetos sonoros para a Unidade de Controle via xWonder
(GUI), enquanto o udio enviado a partir do bloco Score Player.
Os mdulos de WFS (Render unit) do sWONDER tm o funcionamento mostrado no
diagrama da figura 16. Este diagrama mostra que so aplicados atrasos correspondentes a cada
canal de udio e que tambm simulado um efeito de reverberao. Entretanto, as informaes
coletadas no mostraram como ocorreria a execuo de clculos para o controle de amplitude
de cada sinal de udio. A regio destacada esquerda mostra N unidades de Render unit que
recebem informaes de rede em tempo real, enquanto a regio destacada direita no opera em
rede.
A anlise do patch em Pd do WFSPlayer de Daniel Salvador levou ao diagrama em
blocos da figura 17. Na primeira camada do programa feita a configurao dos parmetros
relativos ao udio e a distribuio das caixas de som. Na segunda camada feito o envio dos
sinais de udio para a terceira camada. Esta ltima recebe as informaes enviadas pelo usurio
interface de controle da cena e processa os clculos para a renderizao dos sinais de udio
para o mdulo de WFS, que depois so enviados sada de udio do sistema. A ausncia

Captulo 3. ESTUDOS INICIAIS PARA DESENVOLVIMENTO DE PROTTIPOS

39

Figura 16 Funcionamento do mdulo WFS do sWONDER.

Figura 17 Diagrama em blocos do WFSPlayer.

de documentao dificultou uma elaborao precisa de um diagrama mostrando claramente o


funcionamento do mdulo de WFS.
Em todos os diagramas, o mdulo WFS correspondente distribui o sinal de udio de cada
um dos canais de entrada a cada caixa, com seus respectivos atrasos, atenuaes e filtragens.

40

4 IMPLEMENTAO E TESTES BSICOS

Neste captulo so apresentados a formulao de um operador WFS, os prottipos


desenvolvidos, os testes realizados, as possibilidades de implementao e a soluo encontrada
para a sonorizao do sistema de espacializao com WFS, articulando-se progressivamente os
requisitos e os aspectos de projeto envolvidos.
Esta pesquisa foi realizada nas dependncias do Ncleo de Engenharia de udio e
Codificao Sonora (NEAC1 ), sediado na Universidade de So Paulo.
A metodologia de desenvolvimento para este trabalho incluiu primeiramente a realizao
de instalao dos softwares de referncia e testes preliminares. Parte da metodologia usada foi
baseada em ciclos de avaliao dos software de referncia, testes de funcionamento, avaliao
dos operadores WFS e diagrama de blocos de cada um para avaliar suas funes e operaes
principais. Depois vieram os projetos de uma implementao em Pd que atendesse aos requisitos
(arquitetura de referncia). As implementaes vieram em dois ciclos basicamente (prottipo
inicial e final), a cada ciclo comparou-se o funcionamento do prottipo com os software de
referncia.

4.1

Operador WFS para o projeto

Nesta seo apresentada a formulao de um operador WFS que combina as operaes


de ponderao e atrasos, de uma forma adequada para uma implementao modular bsica. Esta
verso, a usada no projeto, o resultado da adaptao e da aplicao da proposta terica de
operador WFS explicitada na seo 2.2.5.
A figura 3, da seo 2.1, mostra o sistema de coordenadas cartesianas adotado, onde
(x f , y f ) so as coordenadas da posio do objeto sonoro (fonte sonora) e a delimitao do espao
de escuta previsto, iniciando-se a partir da linha de referncia (yre f < 0). As caixas de som,
dispostas em uma matriz linear, esto sobre o eixo x, o que implica em yn = 0. Conforme
mostrado na equao 2.16, a amplitude do sinal de udio depende da definio da linha de
referncia, da posio de cada caixa de som e da posio de cada fonte sonora virtual.
Como yn > yre f e y f > yre f tem-se que |~rn,re f | = yre f e |~r f ,re f | = y f yre f . Para evitar
a diviso por 0 em 1 foi acrescentado um erro de 0, 001m, que praticamente desprezvel
|~r f ,n |

1
em relao as dimenses de |~r f ,n |, ento 1 '
.
|~r f ,n |
|~r f ,n |+0,001m


y f yn
Quando na expresso |~r | , y f = yn = 0, com exceo de caso em que x f = xn , no
f ,n
qual esta expresso deveria resultar em 1, tem-se 0 como resultado, implicando em fatores de
1

NEAC-LSI-EPUSP (Ncleo de Engenharia de udio e Codificao Sonora do Laboratrio de Sistemas Integrvies da EPUSP). Acesso ao site em: <www.lsi.usp.br/neac>

41

Captulo 4. IMPLEMENTAO E TESTES BSICOS

amplitude nulos para todas as caixas. Para que nas proximidades das coordenadas de projeo da
fonte sonora virtual, a amplitude
 dosinal de udio

nos alto-falantes no fosse nula foi proposta a
y f yn +1010 m
y f yn
seguinte aproximao: |~r | ' |~r |+1010 m .
f ,n

f ,n

A equao 4.1 determina qual deve ser o fator de amplitude no processamento de udio
em cada mdulo de WFS do sistema, para cada fonte sonora f e cada canal de sada n.

(4.1)

1
A f ,n =
2

yre f
y f yre f

y f + 1010
|~r f ,n | + 1010

1
p
|~r f ,n | + 0, 001

Onde xn a abscissa
q de cada caixa de som (a ordenada yn = 0), yre f a ordenada da linha
de referncia, |~r f ,n | = (x f xn )2 + y2f a distncia entre a posio da fonte virtual (objeto
sonoro) e da caixa de som n, yre f < 0 (conforme coordenadas mostradas na figura 3, da seo
2.1).
Conforme ilustrado na figura 2, que est na seo 2.1, os objetos sonoros podem ser
projetados em frente, sempre antes da linha de referncia, ou atrs dos alto-falantes, sendo
possveis duas possibilidades de criao de imagens sonoras virtuais. Para o operador WFS usado
y
neste projeto, acrescentado o fator |y f | que altera a curvatura de onda de acordo com as duas
f
possibilidades explicadas. Como este fator geraria valores de tempo negativo, o que significaria
adiantar (antecipar) a emisso da frente de onda em cada alto-falante, adicionado um atraso
|~r
|
de valor f ,n(max)
, onde~r f ,n(max) corresponde posio da caixa de som da matriz que est mais
c
afastada da projeo do objeto sonoro. Para o clculo dos delays (atrasos) correspondentes a
cada um dos N canais de udio usada a equao 4.2.

(4.2)

t f ,n =

|~r f ,n(max) | +

yf
|y f |

|~r f ,n |

O mdulo WFS, que processa o som de uma entrada de udio para apenas uma sada de
som, mostrado na figura 18. Esta abordagem permite mapear de forma direta o processo que
gera o som da n-sima caixa de som com o sinal da fonte sonora auralizada.

4.2

Montagem e infra-estrutura bsica


Para a implementao dos cdigos e testes do sistema WFS, foram usados:
um computador com a seguinte configurao: um processador Intel Core i7-2600, de 3.40
GHz, memria de 16 GB e um disco rgido de 1 TB. O sistema operacional instalado um
Linux, Ubuntu Studio 12.04 LTS (64 bits);
1 interface de som Echo AudioFire 12, com 12 canais;

42

Captulo 4. IMPLEMENTAO E TESTES BSICOS

Sf

Amplitude (A)

xn

(xf, yf )

Delay ( tn)

Cn

Figura 18 Mdulo bsico de WFS que processa o som de uma entrada para uma sada de udio. A
auralizao de uma cena com F objetos sonoros vai requerer F fluxos de processamento, um para cada
fonte sonora.

2 interfaces de som M-Audio Delta 1010, totalizando 16 canais de sada analgica (8


canais para cada interface);
16 alto-falantes (entre 18 disponveis) ativos full-range da marca Lando2 , especificados e
fabricados sob encomenda, adquiridos em abril de 2013, especialmente para pesquisa em
WFS (Ver item 4.2.1);
1 notebook MacBook Pro (13 polegadas, Meados de 2010), com sistema operacional Mac
OS X v10.6 (Snow Leopard), uma porta FireWire 800 (at 800 Mbps), processador Intel
Core 2 Duo de 2,4 GHz e 4GB (duas 2 GB SO-DIMMs) de memria DDR3 de 1066 MHz;
1 cabo firewire para conectar o MacBook Pro interface de som Echo AudioFire 12;
16 cabos de udio para a conexo das interfaces de udio (sadas analgicas P10) s caixas
de som (entradas RCA).
Este projeto foi todo desenvolvido com a verso 0.43.4 do Pd-extended.
2

Acesso ao site da empresa em <www.lando.ind.br>

Captulo 4. IMPLEMENTAO E TESTES BSICOS

43

A configurao para a sincronizao das duas interfaces de som M-Audio Delta 1010 no
foi uma tarefa trivial. Foi preciso ser configurado um arquivo chamado .asoundrc, que tem que
ser colocado na pasta de usurio (home), no Linux. Aps baixar este arquivo e seguir todas as
instrues de configurao e instalao encontradas no site do ALSA3 (Advanced Linux Sound
Architecture), foi feita a sincronizao das placas M-Audio via conexo word-clock, controlada
por um servidor de udio de baixa latncia, o software livre jackd (jackdmp verso 1.9.8), que
o servidor do Jack Audio Connection Kit (JACK). Desta forma, foi montada uma interface virtual
que soma todos os canais disponveis de ambas as interfaces fsicas. A latncia da interface de
som foi admitida como constante no referencial de tempo, j que se aplicava igualmente a todos
os alto-falantes, no interferindo diretamente sobre a tcnica de WFS.
O comando para acionamento e configurao do servidor jackd :
jackd -R -d alsa -C multi_capture -P multi_playback -r 44100
Para os testes, foi adotada a distncia mnima entre as caixas de som, equivalente
largura das mesmas (x = 0,091 m). A distncia mxima poder ser definida pelo usurio em
razo do sistema de alto-falantes que possui e principalmente considerando-se a limitao da
frequncia mxima (em Hertz) que os sons devem ter para evitar-se o aliasing espacial que
pode provocar a disperso (m formao) das imagens sonoras no espao daqueles sons com
frequncias acima do limite previsto. Com o uso da equao 2.5, determinou-se, em funo do
x escolhido, a frequncia mxima para que o sistema opere sem aliasing espacial em fmax =
3774 Hz.
4.2.1

Projeto e fabricao de alto-falantes especiais

Devido falta de alto-falantes com os requisitos tcnicos desejados no mercado, foi


realizada parceria com a empresa nacional Lando para a fabricao de prottipos especiais. Aps
receber as especificaes tcnicas, a empresa construiu as 18 caixas de som modulares que
seriam usadas neste projeto.
A figura 19 mostra 16 caixas formando uma matriz linear (bloco bsico de frente com
aproximadamente 1,456 m) instalada no laboratrio. Para reduzir os reflexos acsticos, painis
absorventes foram colocados atrs da linha de alto-falantes. A rea de audio de testes tambm
foi ladeada de painis absorventes para reduzir a interferncia da acstica local.
Estes alto-falantes foram desenvolvidos e comprados com recursos da FAPESP, atravs
do projeto temtico MOBILE4 (processo no. 08/08632-8). Os prottipos so caixas ativas, que
tem dimenses de altura igual a 25 cm, largura de 9,1 cm e profundidade de 13 cm, com 2
taps de amplificao selecionveis, utilizam drivers cnicos de 3 full-range, e conectividade
analgica RCA-P10 para interfaces digitais M-Audio 1010 e Echo AudioFire12. A montagem
3
4

AlsaProject. Acesso em: <www.alsa-project.org>


MOBILE: Processos Musicais Interativos. Acesso ao site em <http://www.eca.usp.br/mobile/portal/>

Captulo 4. IMPLEMENTAO E TESTES BSICOS

44

Figura 19 Caixas acsticas fabricadas pela Lando para o NEAC.

entre os cones (drivers) numa montagem linear de 0,091 m, o que teoricamente proporciona
uma frequncia mxima de trabalho ( fmax ) de aproximadamente 3774 Hz, conforme abordado
na seo 4.2.

4.3

Prottipo inicial em Pure Data

Foi desenvolvido e testado em Pure Data um patch com 12 canais para WFS, para
ser usado com a interface de som Echo AudioFire 12, dividido em uma implementao computacional modular e flexvel para que pudesse ser integrado ao AUDIENCE, como parte do
desenvolvimento do prottipo final.
A figura 20 mostra o diagrama geral em blocos, para a aplicao de WFS, que servir
para o desenvolvimento dos prottipos. O (patch) inicial tem estrutura dividida em trs mdulos
independentes: a interface de usurio, o mdulo de processamento de WFS e a sada de udio
multicanal. Este programa sintetiza a frente de onda atravs dos clculos da amplitude e do
atraso do sinal de udio que chega a cada uma das caixas de som. A seguir feita a descrio
das partes do primeiro prottipo relacionadas, bem como a operao de cada uma delas.
A interface grfica de usurio, ilustrada na figura 21, possui controles para: posiciona-

Captulo 4. IMPLEMENTAO E TESTES BSICOS

45

Figura 20 Diagrama geral em blocos para os prottipos desenvolvidos em Pure Data.

mento da fonte sonora, controle de foco5 , entrada de udio e o controle de volume geral do patch.
A posio de cada fonte, num mximo de 4, controlada pelo objeto grid (cada um dos quatro
retngulos grandes que esto na parte inferior da figura) que fornece as coordenadas x e y para
o mdulo de WFS. A entrada de udio envia o sinal que pode ser de um arquivo de udio do
computador, da entrada de som externa (via interface de som) ou um som sintetizado no prprio
patch. O painel no canto superior esquerdo serve para selecionar um arquivo de udio para
reproduo, possuindo quatro sliders de volumes dos canais de entrada. Para mudar a posio
dos objetos sonoros deve-se usar o objeto grid (um dos quatro retngulos maiores inferiores),
que determina a regio real onde se podem mover as fontes sonoras e est delimitada de -1 m a 1
m no eixo x e -1 m a 10 m no eixo vertical. Ao lado destes objetos grid esto os medidores de
volume dos canais de entrada.
Cada mdulo de WFS recebe o sinal de udio, as coordenadas x e y da posio de cada
objeto sonoro e posio de cada caixa de som para calcular e aplicar cada delay (atrasos) e
intensidade de som do sinal de udio para cada caixa de som da matriz. A figura 22 mostra os 12
mdulos WFS, um para cada canal, desenvolvidos no prottipo em Pure Data para um objeto
sonoro (uma entrada de udio).
A sada de udio multicanal recebe o udio dos doze canais e os envia sada de som
5

Esta ideia est em desenvolvimento e descrita na seo 5.3

Captulo 4. IMPLEMENTAO E TESTES BSICOS

46

Figura 21 GUI do prottipo inicial para WFS.

Figura 22 Mdulos para WFS. Parte do primeiro prottipo.

do computador. Na figura 23, como havia quatro objetos sonoros (quatro canais de entrada)
aparecem 12 combinaes de 4 sinais de udio que esto ligadas aos 12 canais de sada do

Captulo 4. IMPLEMENTAO E TESTES BSICOS

47

sistema (no retngulo onde est escrito dac~).

Figura 23 Sada de adio do primeiro prottipo do sistema de WFS.

Nesta montagem inicial foram usadas 12 caixas de som que esto representadas sobre o
eixo x (y=0). No encontro entre a sexta e stima caixas (exatamente no meio das 12 caixas), est
a coordenada (0, 0). A linha de referncia foi colocada a 1 metro da matriz de alto-falantes. Nos
testes iniciais obteve-se uma noo razovel de profundidade (movimentao na direo do eixo
y) enquanto a movimentao na direo do eixo x no foi satisfatria. Descobriu-se, durante o
desenvolvimento do prottipo, que a expresso para o operador WFS precisava das correes
que acabaram sendo propostas na seo 4.1.

4.4

Avaliao bsica do funcionamento do prottipo inicial

Os mdulos do prottipo inicial do sistema de WFS foram testados em laboratrio com


matriz de 12 alto-falantes para a avaliao bsica do seu funcionamento e comparados em
termos prticos ao SSR. Foi realizado um teste subjetivo com voluntrios, que identificaram
a localizao de fontes sonoras, conforme sua percepo auditiva. Os testes de avaliao do
sistema consistiram na correo da projeo sonora esperada para cenas sonoras simples, com
objetos sonoros prximos ou um pouco afastados, visando verificar o funcionamento prtico do
prottipo inicial de WFS que seria integrado ao sistema AUDIENCE e buscando aperfeioar as
estratgias que viriam a ser usadas nos testes finais. As medies foram simplificadas, tendo em
vista a falta de condies acsticas adequadas para testes mais rigorosos.
As instalao dos itens necessrios foi feita no computador MacBook Pro de 64 bits.
A resoluo de udio para todos os programas foi ajustada para 44100 Hz. As conexes entre
eles, usados no teste para a WFS, foram feitas pelo servidor de udio do JACK, que interliga os
programas usados para o uso de WFS e estes com as entradas e sadas do sistema. Trabalhou-se
com 12 canais de sada, ligadas a 12 caixas de som ativas Lando amplificadas (ver item 4.2.1).
Est configurao limitou o comprimento da matriz linear de alto-falantes em 1,092 m.

Captulo 4. IMPLEMENTAO E TESTES BSICOS

48

A verso instalada do programa SSR foi a 0.4.1. Como o arquivo disponibilizado era
pr-compilado para o sistema operacional Mac OS X, esta instalao foi relativamente simples.
Antes de rodar o SSR, sempre deve-se inicializar o servidor de udio do JACK. A escolha da
geometria final do sistema, com a definio do nmero e da posio dos alto-falantes e da
orientao do espao de audio foi feita alterando-se um arquivo de configurao, que est em
linguagem xml. Detalhes da configurao do SSR esto detalhados no apndice A.
Os testes objetivaram avaliar a percepo das fontes sonoras geradas em um espao de
audio6 , descrevendo como estes programas se comportariam como sistema de sonorizao
para aplicao prtica da teoria de Wave Field Synthesis (WFS). Os sujeitos participantes do teste
inicial tinham de 22 a 24 anos e profisso no relacionada a temtica da pesquisa. A escolha
de tais sujeitos foi feita de forma aleatria, atravs de um convite verbal, explicando qual a
finalidade e quais as etapas compunham o teste.

Figura 24 O programa Ardour para a reproduo dos arquivos de udio distribudos em canais que foram
controlados pelos sliders ilustrados esquerda. Suas conexes de udio so distribudas ao prottipo em
Pd e ao SSR via JACK.

A figura 24 mostra o programa Ardour, onde foram tocados os arquivos de udio, usados
pelo SSR e pelo prottipo desenvolvido em Pd, com os instrumentos organizados em pistas
(tracks) diferentes e tocados repetidamente durante os testes. O uso deste recurso til quando
quer-se ouvir uma fonte sonora por vez, ou selecionar algumas delas para audio, ou editar os
momentos de execuo em tempo real. Com a utilizao deste programa foram distribudos os
canais para a execuo das projees sonoras. No incio, os ouvintes foram expostos aos sons
para que pudessem descrever as impresses causadas de acordo com a denominao dada pelo
6

rea com aproximadamente 8 m2 , em sala simples, preparada com alguns painis de absorvio de cabine
audiomtrica para reduzir as reflexes das paredes.

49

Captulo 4. IMPLEMENTAO E TESTES BSICOS

pesquisador para facilitar a anlise, pois os sons poderiam no aparecer numa mesma ordem da
nomenclatura estabelecida. Depois, foi pedido para que, um de cada vez, ficassem sentados a
cerca de 1,20 m das caixas de som. Foram colocadas 3 amostras de udio (arquivos .wav) de
resoluo de udio de 44100 Hz. A seguir a descrio destes arquivos:

(a) Espectro de bass.wav.

(b) Espectro de campana.wav.

(c) Espectro de gota.wav.

Figura 25 Espectros de frequncia dos sons usados no teste.

bass.wav gravao, com durao de 3,9 segundos, de um contra-baixo eltrico tocando uma
frase musical numa regio grave, com maior intensidade sonora para frequncias inferiores
a 300 Hz, conforme mostra seu espectro de frequncias, correspondente soma de todos
os sons deste arquivo de udio, na figura 25a.
campana.wav gravao de um tom agudo de 2 segundos de uma campainha, com maior intensidade sonora para frequncias em torno de 1000 Hz (pico de intensidade), 2500 Hz e
5000 Hz (esta ltima acima da frequncia de aliasing), conforme mostra seu espectro de
frequncias na figura 25b.
gota.wav gravao, com durao de 0,05 segundo, de uma gota de gua tocando uma superfcie
de gua, com maior intensidade sonora para frequncias com valores entre 900 Hz e 1500
Hz, conforme mostra seu espectro de frequncias na figura 25c.
O Patchage7 uma interface grfica para realizar e visualizar as conexes feitas pelo
servidor jack. Na figura 26 podem ser vistas todas as conexes feitas pelos programas usados no
teste.
7

Acesso ao programa pela pgina <http://drobilla.net/software/patchage/>

Captulo 4. IMPLEMENTAO E TESTES BSICOS

50

Figura 26 Patchage: interface grfica para realizar e visualizar as conexes feitas pelo JACK. As quatro
sadas de udio do Ardour so conectadas paralelamente s entradas dos dois programas testados, que por
sua vez tem sadas de udio conectadas sada do sistema (interface de udio).

Durante o teste propriamente dito, os sons foram passados dois a dois e os participantes
deveriam localiz-los espacialmente na sala. Foram usadas fontes sonoras pontuais paradas atrs
ou em frente aos alto-falantes, projetadas nos quatro quadrantes do plano cartesiano adotado,
respeitando o limite de reproduo de 1,20 m imposto pela linha de referncia (conforme
explicado na seo 2.1), ou seja, fora do espao de audio dos ouvintes.
As coordenadas das posies das fontes sonoras projetadas na cena sonora foram determinadas em metros, com o auxlio de uma trena. Tal teste foi aplicado, como dito anteriormente,
comparando o prottipo inicial em Pd desenvolvido nesta pesquisa ao SSR. As projees selecionadas por ambos os programas, tinham as seguintes coordenadas cartesianas: posio 1:
(-0.55;1.13), posio 2: (-0.19;-0.88), posio 3: (0.25;3.30) e posio 4: (0.49;-0.37). A interface
grfica do SSR, com configurao para o uso de WFS e com as posies das fontes sonoras,
mostrada na figura 27.
Os casos avaliados foram os seguintes:
Caso 1: avaliao da posio 1 (com som do contra-baixo) 1 e da posio 4 (com som
de gota dgua).
Caso 2: avaliao da posio 2 (com som de gota dgua) e da posio 3 (com som de
campana).
Caso 3: avaliao da posio 1 (com som de campana) e da posio 3 (com som do
contra-baixo).
Caso 4: avaliao da posio 2 (gota dgua) e da posio 4 (com som do contra-baixo).

Captulo 4. IMPLEMENTAO E TESTES BSICOS

51

Figura 27 Interface grfica do SSR, configurada para WFS. A matriz de 12 alto-falantes representada
um pouco abaixo do centro da figura por 12 pequenos desenhos de alto-falantes alinhados na horizontal.
As posies informadas pelos objetos (tracks) correspondem s posies das fontes sonoras.

As medidas, bem como a distncia entre o ponto previsto e o ponto medido (erros
calculados), para cada uma delas encontram-se na tabela 1. Com estes dados, calculou-se o erro
mdio da diferena entre a posio projetada e a percepo desta projeo, para o SSR 1,14 m
e do prottipo em Pure Data 1,51 m. Nesta avaliao o programa SSR teve melhor resultado,
com 24,5% de rendimento superior aos acertos do prottipo inicial desenvolvido em Pure Data
para o sistema OpenAUDIENCE.

4.5

Prottipo final

A implementao do sistema de WFS, e seus respectivos testes iniciais, motivou a busca


por uma escolha ferramental que permitisse automatizar as configuraes do programa, uma vez
que a estrutura modular contando com um elevado nmero de canais implicava em um grande
nmero de conexes a serem feitas. Alm disso, um grande nmero de conexes a serem feitas
manualmente aumentava a chance de erros na programao de patches. Os requisitos para esta
escolha foram:

52

Captulo 4. IMPLEMENTAO E TESTES BSICOS

Tabela 1 Medidas das posies indicadas pelos ouvintes e, para cada uma delas, a distncia entre o ponto
previsto e o ponto medido (erros calculados) para a comparao entre os programas SSR e o primeiro
prottipo em Pure Data para o mdulo de WFS do sistema OpenAUDIENCE. Todas as medidas em
metros.

Caso 1
contra-baixo
gota dgua
Caso 2
gota dgua
campainha
Caso 3
campainha
contra-baixo
Caso 4
gota dgua
contra-baixo

Caso 1
contra-baixo
gota dgua
Caso 2
gota dgua
campainha
Caso 3
campainha
contra-baixo
Caso 4
gota dgua
contra-baixo

SSR
Voluntrio 1
x
y
Erro
-0,43 0,23 0,91
0,42 -0,27 0,12

Voluntrio 2
x
y
Erro
-0,42 -0,16 1,30
0,36 -0,28 0,16

(-0,19; -0,88)
(0,25; 0,3)

-0,05
0,23

-0,78
0,56

0,17
2,74

0,02
-0,2

-0,46
0,6

0,47
2,74

(-0,55; 1,13)
(0,25; 0,3)

-0,09
0,12

0,31
0,56

0,94
2,95

-0,26
0,43

-0,47
0,86

1,63
2,45

(-0,19; -0,88)
(0,49; -0,37)

-0,09
0,47

-0,55
0,36

0,34
0,73

-0,24
0,46

-0,51
-0,14

0,37
0,23

Pos. projetada (x,y)


(-0,55; 1,13)
(0,49; -0,37)

Pd
Voluntrio 1
x
y
Erro
0,22 0,36 1,09
-0,19 0,81 1,36

Voluntrio 2
x
y
Erro
-0,34 0,36 0,80
0,43 0,32 0,69

(-0,19; -0,88)
(0,25; 0,3)

0,06
0,13

-0,11
0,3

0,81
3,00

0,16
0,44

0,27
0,11

1,20
3,20

(-0,55; 1,13)
(0,25; 0,3)

-0,22
-0,16

-0,33
-0,07

1,61
3,05

-0,25
0,17

0,22
-0,26

0,96
3,56

(-0,19; -0,88)
(0,49; -0,37)

-0,14
0,14

-0,43
0,25

0,45
0,71

0,23
-0,08

-0,13
0,2

0,86
0,81

Pos. projetada (x,y)


(-0,55; 1,13)
(0,49; -0,37)

capacidade de configurar vrios canais de entrada e sada,


capacidade de alterar a posio de cada objeto durante a execuo do algoritmo,
Tais exigncias motivaram a busca de formas mais seguras e rpidas para se implementar
o sistema de patches, principalmente motivada pelas razes descritas a seguir.
A baixa flexibilidade da implementao inicial pode ser notada pela quantidade de
objetos e conexes necessrios implementao do sistema que inicialmente trabalha com
apenas um objeto sonoro. Seguir tal linha de implementao implicaria replicar todos os objetos
e conexes para tratar mais objetos sonoros. No caso mostrado, para cada novo canal de entrada
teria que ser feita uma nova cpia destes 12 mdulos e teriam que ser renomeados, de forma
manual, vrios objetos, a maioria deles no mostrados na figura 22. O mesmo ocorreria caso

53

Captulo 4. IMPLEMENTAO E TESTES BSICOS

fosse necessrio alterar algum ndice, nome ou equao. O mesmo raciocnio se aplica caso
houvesse alterao do nmero de canais de sada, pois uma mudana na posio ou quantidade
de caixas de som implicaria em uma refatorao completa da implementao.
4.5.1

Aspectos gerais do projeto

A figura 28 mostra um diagrama geral de entradas e sadas para o sistema de WFS, onde
F o nmero total de canais de entrada (igual ao nmero de objetos sonoros em cena) e N o
nmero total de canais de sada. S f e Cn representam, respectivamente, cada sinal de entrada de
udio e cada canal de sada de udio, xn corresponde posio de cada caixa de som e (x f , y f )
so as coordenadas do objeto sonoro, em relao ao sistema de coordenadas. O sistema possui
uma configurao relativamente complexa devido quantidade de informaes correspondentes
s suas entradas e sadas.
x C1

x C2

x C3

x C4

xN

xn

S1

C1

S2

C2

S3

C3

S4

C4

Wave Field Synthesis


Sf

Cn

SF

CN

(x1, y1 )

(x2, y 2 )

(x3, y3 ) (x4, y4 )

(xf , yf )

(x F , y F )

Figura 28 Diagrama geral de entradas e sadas de uma matriz processada de WFS. S f , Cn , xn e (x f , y f )


representam, respectivamente, cada sinal de entrada e sada de udio, a posio de cada caixa de som e as
coordenadas de cada objeto sonoro.

Durante o uso do sistema, as posies e a quantidade de caixas de som normalmente so


fixas. J o nmero de canais de entrada, usualmente, tanto pode ser fixo como pode ser alterado

Captulo 4. IMPLEMENTAO E TESTES BSICOS

54

se, por exemplo, forem usados arquivos de udio com nmero diferente de canais. Para uma
dada configurao necessrio que o programa permita o uso de um nmero varivel de canais
de entrada e sada do sistema.
Para cada sinal S f de entrada atribuda a posio (x f , y f ). Para cada canal de sada Cn
temos a configurao da posio da respectiva caixa acstica no eixo x. Vale notar que a posio
das caixas de som no eixo y fixa.
A figura 29 mostra o diagrama geral para o sistema de WFS com uma diviso em blocos,
aprofundando a viso mais geral mostrada na figura 28. Percebe-se que para cada canal de
udio (objeto sonoro) feito o processamento em N mdulos de WFS, para que o sinal deste
objeto sonoro seja distribudo nas N caixas de som correspondentes a cada um destes mdulos.
possvel verificar que a posio de um objeto sonoro ir alterar o sinal em todos os canais
de sada. Claramente nesta plataforma de programao orientada a patches, era necessria uma
soluo que empregasse mecanismos para automatizar a construo e conexo dos patches.
A implementao do primeiro prottipo em Pd, apresentada na figura 22, mostrou-se
eficaz para os objetivos do projeto, porm tal implementao com 12 mdulos WFS desenvolvidos
para um nico objeto sonoro (uma entrada de udio) demandou bastante tempo e se mostrou
pouco flexvel. Uma soluo para construir um grande nmero de conexes, de modo flexvel e
em tempo real, proposto na prxima seo.
4.5.2

Implementao do mdulo processador de WFS com programao dinmica no Pd

Analisando-se as possveis implementaes para processamento em tempo real no ambiente Pure Data, foi apresentada uma soluo para a gerao automtica de patches aplicados
sonorizao de um sistema de espacializao baseado em WFS. Esta soluo emprega patches
dinmicos e uma arquitetura modular, permitindo flexibilidade e manutenabilidade do cdigo,
com vantagens particularmente para lidar com um nmero elevado de fontes e alto-falantes.
A programao dinmica uma tcnica computacional na qual o programa pode alterar
seu prprio cdigo em tempo de execuo, permitindo assim que o mesmo se adeque dinamicamente a um problema especfico (RITSCH, 2006). Esta tcnica de programao bastante similar
tcnica computacional chamada reflexo (ZMLNIG, 2009), por tratar do conhecimento que o
cdigo possui sobre si mesmo. Com isto, a abstrao em si no traz apenas sua implementao,
porm recria o subpatch toda vez em que instanciado, baseando esta criao nos parmetros
informados. Em consequncia disto, o nmero de canais pode ser alterado de forma simples e
rpida. De acordo com Silva, Schiavoni e Faria (2014), usar programao dinmica para flexibilizar a configurao e aliviar a replicao de cdigo bastante atraente para o caso especfico de
WFS em que os sistemas podem chegar a centenas de alto-falantes.
Como a experimentao do prottipo do sistema seria feita a partir de diferentes configuraes com variaes de parmetros de entrada e sada, posio das fontes (ou objetos) sonoras

55

Captulo 4. IMPLEMENTAO E TESTES BSICOS

S1

WFS 1,1

C1

WFS f,1

C1

WFS 1,2

C2

WFS f,2

C2

WFS 1,3

C3

WFS f,3

C3

WFS f,n

Cn

(x 1 , y1 )

(xf, y f )
WFS 1,n

WFS 1,N

S2

Sf

Cn

CN

WFS 2,1

C1

WFS 2,2

C2

WFS 2,3

C3

(x 2 , y2 )
WFS 2,n

Cn

WFS f,N

SF

CN

WFS F,1

C1

WFS F,2

C2

WFS F,3

C3

WFS F,n

Cn

(xF , yF )

WFS 2,N

CN
WFS F,N

CN

Figura 29 Diagrama em blocos para o sistema de WFS. Para cada canal feito o processamento em N
mdulos de WFS e finalmente enviado para as N sadas de udio.

e das caixas, foram adotadas algumas possibilidades para automatizar as configuraes dos
patches.
O formato de arquivo do Pd bastante simples e padronizado e pode ser visto como um
arquivo de texto. A figura 30 mostra um trecho de cdigo que pode ser visto quando um arquivo
.pd aberto num editor de texto.
A primeira possibilidade de automatizao da configurao que gerava um arquivo .pd
foi desenvolvida em uma ferramenta na linguagem Java que, a partir dos parmetros iniciais,
gerava os patches j configurados. Esta soluo otimizou a criao do patch de WFS, porm
demandava a incorporao de uma ferramenta externa no processo de trabalho, o que nem sempre
desejvel.
Outra possibilidade de automatizao estudada foi criar em linguagem C um external
para o Pd que poderia receber parmetros em sua criao, como a quantidade de fontes sonoras

Captulo 4. IMPLEMENTAO E TESTES BSICOS

#N
#X
#X
#X
#X
#X
#X
#X
#X
#X
#X
#X

56

canvas 25 87 1270 684 10;


floatatom 640 58 5 0 0 0 - - -;
msg 541 52 0;
obj 409 317 +;
msg 406 459 \; pd-player\$1 vis 0;
obj 290 108 inlet;
obj 326 326 outlet;
obj 299 264 float;
text 340 233 reset;
connect 0 0 10 0;
connect 1 0 7 1;
connect 3 0 4 1;

Figura 30 Exemplo de arquivo do Pd. Mostrando um trecho de cdigo que pode ser visto quando um
arquivo .pd aberto num editor de texto.

e de canais, e se adequar dinamicamente a esta configurao de maneira transparente ao usurio.


Tal soluo, apesar de trazer benefcios como o processamento em C de algumas funcionalidades,
mostra-se pouco portvel, pois faria que tal external fosse compilado para cada sistema operacional onde o Pd fosse executado. Novamente, isto incluiria ao processo novas ferramentas, como o
compilador C, o que no desejvel. O prottipo inicial nos mostrou que os objetos necessrios
para a implementao j existiam e que construir um external no seria imprescindvel.
O patch principal utiliza abstraes do Pd para criar patches independentes do primeiro
ou subpatches dinamicamente a partir de argumentos. Tecnicamente, esta abstrao no possui
nada alm de uma estrutura para criar a si mesma quando instanciada. Isto quer dizer que,
internamente, a abstrao coleta o parmetro da instanciao informada pelo usurio do programa
e envia uma srie de mensagens ao prprio patch para que ele se auto-construa de acordo com
este parmetro.
Como o Pure Data permite sua extenso tambm por meio de abstraes, tal soluo foi
considerada mais adequada que as anteriores pelas seguintes razes:
no h necessidade de adicionar novas ferramentas ao processo de desenvolvimento;
o resultado obtido totalmente compatvel com o ambiente Pd e independente de onde ele
foi compilado;
a modificao da abstrao pode ser feita durante a sua execuo simplificando os experimentos e testes da ferramenta.
4.5.3

Integrao ao sistema AUDIENCE

Um dos requisitos para esta implementao foi torn-la compatvel s diretrizes da


arquitetura do sistema AUDIENCE (FARIA et al., 2005; FARIA, 2011a), que prev a modularizao funcional com operaes claramente atreladas a uma das quatro camadas funcionais

Captulo 4. IMPLEMENTAO E TESTES BSICOS

57

descritas nesta arquitetura. Desta forma, procurou-se projetar e agrupar as operaes em camadas
funcionais afins.
Cada uma das camadas da estrutura do sistema AUDIENCE explicada a seguir. A
aplicao dedicada de WFS com arquitetura modular desenvolvida neste projeto segue a lgica
estrutural apresentada.
Camada 1/ Descrio da cena sonora: nesta camada determina-se a composio da cena
acstica, com a descrio de como as fontes sonoras (instrumentos musicais) devero ser
posicionados no espao de audio. Primariamente parmetros do ambiente de escuta devem ser
considerados.
Camada 2/ Simulao acstica da cena: na segunda camada faz-se a simulao acstica
considerando-se o ambiente de escuta. Uma das ideias que este mdulo possa gerar metadados
que parametrizem a codificao de frentes de ondas no mdulo seguinte. As funes que so
implementadas nesta camada visam algum tipo de simulao acstica ou gerar parmetros para a
sntese de frente de onda (sinais de sada).
Camada 3/ Codificao do udio: a terceira camada responsvel pela codificao do
udio utilizando os metadados descritores da sntese da frente de onda. O mdulo dever converter
o sinal para algum formato WFS.
Camada 4/ Decodificao do udio e reproduo: a quarta camada determina qual configurao e disposio de caixas de som sero utilizados.
A construo de uma cena de udio virtual imersiva passa pela descrio da cena sonora,
pelo processamento de udio e, finalmente, pela sonorizao. Como o sistema possui uma diviso
clara de funcionalidades, poder ser modificado em partes, permitindo novas configuraes e
implementaes em cada mdulo.
4.5.4

Construo do prottipo final

A partir dos requisitos e especificaes do projeto, a soluo adotada para a construo


de um sistema de auralizao com WFS baseia-se num conjunto de abstraes dinamicamente
construdos no Pd. A implementao permitiu que o sistema fosse visualizado de maneira que
cada funcionalidade fosse implementada em blocos de funes interconectveis. A figura 31
mostra um diagrama de blocos proposto para o prottipo final.
O diagrama mostra os mdulos constituintes do prottipo final, articulando os conceitos
de programao dinmica e atendimento aos requisitos da arquitetura AUDIENCE de referncia.
Na interface principal o usurio determina os parmetros bsicos do sistema WFS (interface
controladora), como a disposio das fontes sonoras na cena (interface de cena) e o nmero de
alto-falantes no array. Nesta interface est o ncleo do mdulo WFS, dividido funcionalmente
em 3 tipos de subpatches:

58

Captulo 4. IMPLEMENTAO E TESTES BSICOS

Cria_blocos)

Interface)Principal)

Conecta_Blocos)
Interfaces)de)Controle)

Construtores)

Cria_Entradas_Saidas)
Cria_Matriz_Saida)(L4))

WFS1Ncleo)

Calculadores)

Executores)

Congura_Matriz)(L2))
Processador)(L3))
Processador)(L4))

Figura 31 Diagrama de blocos conceitual para o prottipo final, mostrando os tipos de patches projetados
e suas respectivas funes.

construtores (responsvel pela construo dinmica dos patches processadores, das conexes de entrada e sada, do patch das matrizes de alto-falantes, e das conexes entre os
blocos);
calculadores (responsvel pelos clculos dos atrasos e ponderaes de amplitude que sero
aplicadas a cada alto-falante do sistema);
executores (onde so construdos e conectados os patches processadores de udio).
A figura ainda mostra a que camada funcional do AUDIENCE esto associados cada
bloco.
Na presente verso, L1 se refere a um objeto pertencente camada funcional 1, conforme
a arquitetura AUDIENCE. L2, L3 e L4, igualmente, se referem s camadas 2, 3 e 4, respectivamente. So as seguinte abstraes (mdulos ou blocos funcionais) mais relevantes e suas
respectivas funes no fluxo de processos:
Mdulos de entradas (L1) e sadas (L4): recebem as informaes de posio dos objetos sonoros, seus respectivos sinais de udio e as posies das caixas de som usadas pelo
sistema.
Mdulos de clculo para WFS (L2): recebem as configuraes de entrada e calculam, conforme as equaes descritas nas incio do captulo 4.1, os fatores de amplitude (equao
4.1) e atrasos (equao 4.2) que sero aplicados aos sinais de udio.
Mdulos de processamento de udio (L3): aplicam, nos sinais de udio, os atrasos e as relaes de amplitude correspondentes tcnica de WFS.

Captulo 4. IMPLEMENTAO E TESTES BSICOS

59

Figura 32 Conexes em feitas no Pure Data com o uso de send e receive.

A diviso das funes do programa em mdulos se aproxima da proposta de arquitetura


sugerida pelo sistema AUDIENCE (FARIA, 2011a). Os mdulos descritos podem ser associados
s camadas especficas deste sistema. Uma vez feita a diviso de responsabilidades do sistema, o
prximo passo foi definir como seriam feitas as conexes entre os mdulos.
A soluo encontrada para permitir flexibilidade para as conexes de udio e de controle
foi constru-las utilizando os objetos bsicos do Pure Data, send e receive. Desta forma, foi
possvel que tais conexes funcionassem de maneira transparente para o usurio que, por sua
vez, no precisaria criar cada conexo individualmente.
Conforme ilustrado na figura 32, por meio de objetos send so feitas as conexes dos
sinais de udio, no exemplo [send audio1] (ou [s audio1]), e enviadas as coordenadas de uma
fonte sonora, no exemplo [send x1] (ou [s x1]) e [send y1] (ou [s y1]). Qualquer outro objeto
no patch que precisar receber tal informao pode acess-la por meio de um objeto receive,
por exemplo [receive audio1] (ou [r audio1]). Com esta soluo no h mais a necessidade
de conectar estes objetos explicitamente. Tal abordagem de implementao exigiu a definio
de nomes para envio e recebimento de mensagens e a formalizao na comunicao entre os
mdulos. Alm disso, isto permite que os mdulos sejam trocados e que exista mais de uma
implementao para cada um deles.

Captulo 4. IMPLEMENTAO E TESTES BSICOS

60

Figura 33 Exemplo de reflexo computacional. Quando foi criada a abstrao PosicaoCaixas recebeu os
parmetros 16, correspondente ao nmero de canais de sada, e 0.0912, correspondente distncia entre
as caixas de som.

A segunda parte da soluo est na criao destes mdulos como abstraes que utilizam
programao dinmica para a configurao do sistema. Atravs da passagem de parmetros
possvel informar a quantidade de canais de entrada e sada ou, tambm conforme ilustrado na
figura 33, a distncia entre as caixas de som em sua criao. A estrutura do prottipo final, isto ,
como os patches e subpatches foram construdos e concatenados, mostrada na figura 34.
A GUI do Patch principal desenvolvido em Pd para testes do sistema de WFS mostrada
na figura 35. Nela pode ser vista a sala virtual, onde a coordenada x pode variar de -1 m at
1 m e a coordenada y pode variar de -1.2 m (linha de referncia) at 4 m. Neste exemplo,
mostrada uma configurao para 5 fontes sonoras, que podem ter suas posies monitoradas
pelas caixas de nmero que esto no canto superior esquerdo. Dentro do subpatch pd WFS
esto as conexes de udio de entrada e sada e abstraes para o Pure Data, onde so informados
os dados de configurao (quantidade de entradas, quantidade de sadas, posio dos alto-falantes
e linha de referncia), feitos os clculos e realizado o processamento. A entrada de udio que
envia o sinal que pode ser de um arquivo de udio do computador, da entrada de som externa
(via placa de som) ou um som sintetizado no prprio patch. Opcionalmente pode ser utilizado o
player, que est no canto inferior esquerdo, para onde podem ser importados arquivos de udio e
suas sadas monitoradas pelos sliders e controles de volume que so mostrados direita.
A implementao do sistema na forma de abstraes e subpatches que utilizam programao dinmica para se instanciarem garante uma simplicidade grande de manuteno do sistema,
conforme mostra a figura 36. Tal soluo tambm se mostrou eficaz devido portabilidade e
facilidade de integrao com outros sistemas ou outros patches.
A posio de cada objeto sonoro poder ser informada por dispositivos externos (como

61

Captulo 4. IMPLEMENTAO E TESTES BSICOS

!
!
OA5WFS5prottipo!
!
!
!

SinaisEntrada!
VolumesEntrada!
Interface!de!Cena!(GUI)!
Player!
RecebeEnviaPosicaoObjetosSonoros!
PosObjetos!
VolumeGeral!
WFS!(config.!geral)!
CreateInOuts!
Wave5Field5Synthesis5AUDIENCE!!
ConfParametros!
DadosProg!
MakeConnections!
Construtores!
PosicaoCaixas!
Calc5WFS5MatrizLinear!
Focalizador!
WaveFieldSynthesis5Volume5geral!
Filtros53dB5por5Oitava!
L35Processing5WaveFieldSynthesis!

Figura 34 Organizao do patch do prottipo de WFS para o sistema OpenAUDIENCE e seus respectivos
subpatches. Os subpatches em cinza no foram utilizados no teste final.

62

Captulo 4. IMPLEMENTAO E TESTES BSICOS

r to_GUI pd colors pd confiGUI pd controlaPos

pd PosObjetos
0.61 x1

y1

1.2

-0.5 x2

-0.61 y2

0.56 x3

-0.21 y3

-0.6 x4

0.93 y4

0.591 x5

y5

3.1

WFSprototipo-v2.2

Para matriz linear de alto-falantes.

pd sinaisEntrada

Fonte_1
>+12

Fonte_2
>+12

Fonte_3
>+12

Fonte_4
>+12

Fonte_5
>+12

+6

+6

+6

+6

+6

+2

+2

+2

+2

+2

-0dB

-0dB

-0dB

-0dB

-0dB

-2

-2

-2

-2

-2

-6

-6

-6

-6

-6

-12

-12

-12

-12

-12

-20

-20

-20

-20

-20

-30

-30

-30

-30

-30

-50

-50

-50

-50

-50

<-99

<-99

<-99

<-99

<-99

pd volumesEntrada

Canal_1

Canal_2

Canal_3

Canal_4

Canal_5

1
4

y=0 ---------------------------------------------- posio dos alto-falantes

3
pd player
Player

Tocar-do-nicio Parar

Parado
-> yRef
room_sim_2d
s from_GUI

pp 0 rho_z

>+12
+6
+2
-0dB
-2
-6
-12
-20
-30
-50
<-99

pd RecebeEnviaPosicaoObjetosSonoros
CONFIGURAAO GERAL
pd WFS

Volume_geral
Volume geral via "wireless".

Figura 35 GUI do Patch principal desenvolvido em Pd para testes do sistema de WFS do OpenAUDIENCE.

sensores), por interfaces do AUDIENCE ou mesmo por outros programas, podendo substituir
ou trabalhar conjuntamente com a interface de controle j implementada para o prottipo
desenvolvido, conforme ilustrado na figura 37. Instrumentos eletrnicos, como os teclados
controladores e os mais modernos computadores, tambm podem controlar os sons no espao de
audio em tempo real ou de forma programada, permitindo que, como exemplo de aplicao,
sejam colocados sensores adaptados a instrumentos musicais que variam suas coordenadas
conforme mudam suas localizaes num dado referencial.

4.6

Testes de funcionamento realizados no prottipo final

O prottipo final do sistema de WFS para o sistema OpenAUDIENCE foi testado em


laboratrio com matriz de 16 alto-falantes. Foi realizado um teste subjetivo 10 voluntrios com
idades entre 20 e 60 anos e profisso no relacionada a temtica da pesquisa, que identificaram a
localizao de fontes sonoras, conforme sua percepo auditiva. A escolha de tais voluntrios foi

Captulo 4. IMPLEMENTAO E TESTES BSICOS

63

Figura 36 Exemplo de cdigo de abstrao funcional gerativa do sistema (criao dinmica de objetos
em patch).

feita de forma aleatria, atravs de um convite verbal, explicando qual a finalidade e quais as
etapas compunham o teste.
Foi construdo dinamicamente um patch com 16 canais de sada, sendo suas conexes
de udio de entrada e sada roteados via JACK. Da mesma forma que na seo 4.4, foi usado
o programa Ardour para distribuir os canais para a execuo dos arquivos de udio que so
enviados para o Pd, com os instrumentos organizados em pistas (tracks) diferentes e tocados
repetidamente durante os testes. As sadas de udio do Ardour foram conectadas s entradas

Captulo 4. IMPLEMENTAO E TESTES BSICOS

64

Figura 37 Qualquer dispositivo que envie as coordenadas x e y para as entradas da abstrao RecebeEnviaPOsicaoObjetosSonoros altera a posio da fonte sonora no Pd.

do programa para WFS, que por sua vez tem sadas de udio conectadas sada do sistema
(interface de udio), conforme pode ilustrado pela figura 38. Foram colocadas 4 amostras de
udio (arquivos .wav) com resoluo de 44100 Hz. A seguir a descrio destes arquivos:

Figura 38 Na interface grfica Patchage podem ser visualizadas as conexes feitas pelo JACK. As sadas
de udio do Ardour foram conectadas s entradas do programa para WFS do OpenAUDIENCE, que por
sua vez tem sadas de udio conectadas sada do sistema.

gota.wav gravao, com durao de 0,05 segundo, de uma gota de gua tocando uma superfcie
de gua, com maior intensidade sonora para frequncias com valores entre 900 Hz e
1500 Hz, conforme mostra seu espectro de frequncias na figura 25c.

65

Captulo 4. IMPLEMENTAO E TESTES BSICOS

(a) Espectro de Cl.wav.

(b) Espectro de Ob.wav.

Figura 39 Espectros de frequncias dos sons usados no teste.

campana.wav gravao de um tom agudo de 2 segundos de uma campainha percurtida, com


maior intensidade sonora para frequncias em torno de 1000 Hz (pico de intensidade),
2500 Hz e 5000 Hz (acima da frequncia de aliasing), conforme mostra seu espectro de
frequncias na figura 25b.
Cl.wav execuo de uma frase musical com 4 segundos de durao tocada por uma clarineta,
com maior intensidade sonora para frequncias nas faixas de 250 a 490 Hz (picos de
intensidade), 1000 a 1300 Hz e em torno de 1700 Hz, conforme mostra seu espectro de
frequncias, correspondente soma de todos os sons deste arquivo de udio, na figura 39a.
Ob.wav execuo de uma frase musical com 4 segundos de durao tocada por um obo,
com maior intensidade sonora para frequncias nas faixas de 530 a 650 Hz (picos de
intensidade), 1100 a 1300 Hz (com valor prximo ao da faixa anterior) e em torno de 3500
Hz, conforme mostra seu espectro de frequncias, correspondente soma de todos os sons
deste arquivo de udio, na figura 39b.
As frases musicais executadas pela clarineta e pelo obo fazem parte da pea The
Unanswered Question, composta em 1908 por Charles Ives, e a partitura deste trecho
mostrado
1
na figura 40.

B Clarinet

Oboe

44
44


mf

mf

Figura 40 Partitura do trecho da pea The Unanswered Question, composta por Charles Ives, executado
pela clarineta e pelo obo para o teste do prottipo final.

Inspirado na experincia descrita por Montag (2011, pg. 67-73), foi montado um setup
para os testes no qual uma cortina preta ortofnica que escondia os alto-falantes foi colocada a

66

Captulo 4. IMPLEMENTAO E TESTES BSICOS

0,18 m, a frente da matriz linear de alto-falantes, com uma rgua em sua base, sobre o mesmo
eixo (de ordenada y=-0,18 m). A linha de referncia foi fixada na posio y=-1,2 m, o limite para
as projees virtuais foi limitado a 4 m atrs da matriz de alto-falantes e foram deixados 2,3 m
depois da linha de referncia para o posicionamento dos ouvintes. A descrio deste ambiente
pode ser vista na figura 41.

fonte sonora virtual (x f , y f )


4m

caixas de som
cortina

D
1,2 m

linha de referncia (yre f )

2,3 m
B
A
4m
Figura 41 Configurao da sala para os testes com WFS. A cortina est a 0,18 m da matriz de alto-falantes.
Cada ouvinte fez duas audies: uma na posio representada pelo ponto A, que tem coordenadas x=0,725
m e y=-3,105 m, e outra audio na posio representada pelo ponto B, que tem coordenadas x=-1,13 m e
y=-2,505 m.

Os testes de avaliao do sistema consistiram no quanto os ouvintes poderiam indicar


a projeo sonora esperada para cenas sonoras simples. Os sons das 4 fontes sonoras testadas
foram calibrados em volume tentando-se ajustar percepo real da escuta destes tipos sonoros,
considerando-se as posies em que ficariam os ouvintes. No incio, os sons que seriam usados

Captulo 4. IMPLEMENTAO E TESTES BSICOS

67

no teste foram expostos aos ouvintes para que estes pudessem entender melhor as instrues
passadas pelo pesquisador. Foram usadas fontes sonoras pontuais paradas atrs e em frente aos
alto-falantes, projetadas nos quatro quadrantes do plano cartesiano. Para cada posio foram
realizadas 4 audies, totalizando 8 audies por ouvinte. As fontes sonoras objeto 1 (gota) e
objeto 2 (campana) foram escutadas separadamente; as fontes instrumentais objeto 3 (clarineta) e
objeto 4 (obo) foram escutadas simultaneamente. Os ouvintes deveriam ficar em duas posies
previamente definidas: o ponto A que tinha coordenadas (0,725; -3,105) e o ponto B com
coordenadas (-1,13; -2,505), no referencial adotado para a experincia.
Durante o teste, os participantes, um por vez, deveriam apontar um feixe de laser na
direo em que a fonte sonora era percebida, gerando um ponto iluminado na cortina do qual era
medida na rgua a coordenada x, o valor da coordenada y j era conhecido (y= -0,18 m). A partir
do teste feito com o ouvinte sobre o ponto A media-se o ponto D e partir do teste feito com o
ouvinte sobre o ponto B media-se o ponto C. A interseco das retas AD (que passa pelos pontos
A e D) e BC (que passa pelos pontos B e C) o ponto no qual o ouvinte percebeu o objeto. Uma
explicao detalhada sobre o mtodo para o clculo da posio da fonte sonora descrito no
apndice B que mostra como as medidas coletadas produziram as medidas estimadas de posio
de cada fonte sonora no espao de audio criado.
As projees selecionadas tinham as seguintes coordenadas cartesianas (em metros).
Estas posies correspondem s mostradas na figura 35 (a quinta fonte sonora no foi usada), a
interface grfica de usurio do Patch principal desenvolvido em Pd para o sistema de WFS do
OpenAUDIENCE. Os casos avaliados foram os seguintes:
Caso 1: avaliao da posio do objeto 1 (0,61; 1,20), som de choque de gota dgua
com gua.
Caso 2: avaliao da posio do objeto 2 (-0,50; -0,61), som de tom de campainha
(campana).
Caso 3: avaliao da posio do objeto 3 (0,56; -0,21) e posio do objeto 4 (-0,60; 0,93),
tocados simultaneamente, respectivamente o som de uma passagem tocada por uma clarineta e
um obo, cujas partes so mostradas na figura 40, de aproximadamente 4 segundos.
4.6.1

Apresentao dos resultados do teste subjetivo

A tabela 2 resume algumas estatsticas dos resultados obtidos no teste subjetivo onde
so mostrados as distncias (em metros, chamadas de erros) entre cada posio de fonte sonora
projetada pelo prottipo de WFS para o OpenAUDIENCE e a posio calculada baseada nas
estimativas dadas por cada ouvinte. O erro mdio obtido entre todos os ouvintes e para todas as
fontes sonoras foi 0,84 m, com um desvio padro de 0,21 m, portanto o erro poderia chegar a
1,05 m. A fonte sonora que apresentou menor erro mdio foi o objeto 3 (clarineta) de 0,42 m,
com um desvio padro de 0,25 m, e a que apresentou maior erro mdio foi o obo (objeto 4), de

Captulo 4. IMPLEMENTAO E TESTES BSICOS

68

1,32 m, com um desvio padro de 0,33 m. Considerando o quanto os valores mximos que cada
erro pode alcanar, teremos estimativa mxima de erro para o objeto 1 (gota) de 1,54 m, para o
objeto 2 (campana) de 0,94 m, para o objeto 3 (clarineta) de 0,67 m e para o objeto 4 (obo) de
1,65 m.
A figura 42 mostra os diagramas de disperso obtidos para cada uma das 4 fontes sonoras.
As posies das projees feitas pelo prottipo das fontes sonoras no espao de audio so
indicadas pelo crculo (um dos dois pontos maiores) e pelos pontos menores para formar os
diagramas de disperso das estimativas de posies levantadas no teste subjetivo. A mdia das
estimativas indicada com a marca quadrada e nela esto indicados seus respectivos desvios
padro, por meio das barras de incerteza. A escala est em metros. Conforme observado nesta
figura, apenas o valor esperado pelo objeto 3 (clarineta) est de acordo com o valor estimado pelo
experimento, pois se encontra dentro dos limites estabelecidos pelas barras de incerteza. O valor
estimado mais discrepante com relao ao valor esperado foi o do objeto 4 (obo), passando
0,86 m do limite estabelecido pela barra de incerteza relativa ao eixo y.
Tabela 2 Resultados do teste subjetivo para o prottipo final de WFS para o OpenAUDIENCE. As
medidas esto em metros e descrevem a diferena da posio (erros) entre o valor esperado e os valores
estimados pelos ouvintes.

69

Captulo 4. IMPLEMENTAO E TESTES BSICOS

0
2

(a) Resultados para o objeto 1 (gota).

(b) Resultados para o objeto 2 (campana).

0
2

0
0

(c) Resultados para o objeto 3 (clarineta).

(d) Resultados para o objeto 4 (obo).

Figura 42 Posies das projees das fontes sonoras no espao de audio (crculo maior) e pontos
menores para formar os diagramas de disperso das estimativas de posies levantadas no teste subjetivo
feitas pelo prottipo de WFS para o sistema OpenAUDIENCE. A mdia das estimativas indicada com a
marca quadrada e nela esto indicados seus respectivos desvios padro, por meio das barras de incerteza.
A escala est em metros.

70

5 CONCLUSES

Esta pesquisa abre um promissor campo de trabalho para a realizao prtica de aplicaes de WFS no universo musical e em reas como realidade virtual e realidade aumentada,
espacializao sonora, sonorizao de ambientes, museus e instalaes sonoras, cinema e auditrios. Desperta interesse a relativa facilidade do uso desta tcnica para a modelagem de
fontes sonoras instrumentais, a possibilidade de conectar o algoritmo de WFS a algoritmos de
simulao acstica, e a possibilidade de usufruir da estabilidade da imagem sonora produzida em
vrios pontos de escuta simultaneamente, diferentemente do que ocorre nos formatos limitados a
hot-spots, como Ambisonics.
Muitos problemas de configurao ocorreram, tomando muito tempo e mostrando quais
caminhos seriam proibitivos e quais seriam viveis para se implementar e testar os programas
para WFS com o hardware disponvel.
O patch desenvolvido para o sistema OpenAUDIENCE pode ser utilizado em aplicaes
de espacializao sonora com nmero de canais (alto falantes) e fontes sonoras variveis, podendo
acomodar matrizes de dezenas de alto-falantes em um sistema de interfaces multicanal, ficando
limitado disponibilidade de interfaces e poder de processamento do computador.
As avaliaes feitas nas dependncias do NEAC, em dois computadores com sistemas
operacionais diferentes (Mac Os X e Linux Ubuntu Studio), indicam que o programa desenvolvido para WFS pode ser utilizado por qualquer usurio que tiver um uma matriz linear de
alto-falantes e de mais fcil operao do que os outros programas testados.
A diviso do programa desenvolvido neste projeto em uma implementao computacional
modular como um patch do Pure Data, permite que o sinal enviado possa ser de um arquivo de
udio do computador, da entrada de som externa (via placa de som) ou um som sintetizado no
prprio patch.
A matriz bsica de 16 canais implementada tem uma frente de projeo de 1,456 m. As
caixas foram dispostas lado-a-lado com distncia entre drivers de aproximadamente 0,091 m.
Esta matriz mostrou-se vivel para escalamento do sistema para um nmero maior de alto-falantes
cobrindo uma rea de projeo de frente de onda maior.

5.1

Discusso dos resultados

Analisando-se os resultados apresentados na seo 4.6, buscou-se entender as razes


pelas quais a variao foi maior para o objeto 4 (obo). A divergncia maior apontada entre a
posio projetada do obo e as medidas coletadas no teste, levam a hiptese de que existe maior
dificuldade dos ouvintes em discernir dois instrumentos de sopro tocando simultaneamente.

Captulo 5. CONCLUSES

71

Desta forma, deve-se levar em considerao que os ouvintes provavelmente confundiram o som
do obo com o som da clarineta, em uma passagem relativamente mais longa de 4 segundos.
Com relao ao teste realizado com o som do objeto 1 (gota), foi calibrado em volume
- como os demais - para corresponder ao volume natural deste tipo de som escutado a certa
distncia do ouvinte, de forma que foi o som de menor volume entre todos. Provavelmente a
atenuao esperada no seu volume devido ao seu posicionamento mais distante no espao virtual
contribuiu para dificultar sua localizao.
O melhor sistema seria aquele em que as distncias entre a posio projetada (crculos
que marcam as fontes sonoras) e a posio mdia das medidas estimadas das posies das
fontes (quadrados) fosse mnima. Por essa mtrica observamos que o objeto 4 (obo) teve o pior
resultado (1,29 m) e o objeto 3 (clarineta) o melhor resultado (0,30 m).
Tambm observamos que a grande maioria das posies estimadas no teste subjetivo
(95%) caram dentro do raio de cobertura do array de alto-falantes, mesmo tendo sido posicionadas as fontes em locais limtrofes e desafiadores para o tamanho do array usado. Isto sugere que
com um nmero maior de alto-falantes os acertos de posio poderiam ser maiores.
Os resultados preliminares foram promissores, j que foi possvel aos ouvintes acertar o
quadrante da projeo do objeto, ressaltando-se que o ambiente de aplicao no estava completamente adaptado para tal atividade, sugerindo que condies acsticas devem ter influenciado
os resultados. Idealmente a salas para estes testes devem ser anecicas. Segundo Belloch et al.
(2013), um dos problemas prticos de WFS que sala de escuta introduz novos ecos que no
esto includos no sinal a ser reproduzido pela matriz de alto-falantes, alterando, assim, o campo
de som sintetizado e reduzindo o efeito espacial. Para testes futuros, condies acsticas adequadas sero importantes para testes mais rigorosos, pois no foi possvel estimar a influncia da
acstica local sobre os resultados obtidos. Alm disso, mesmo que esta influncia seja estimada,
o aprimoramento destes estudos deve levar em considerao toda a complexidade da escuta,
ou seja, os estudos psicoacsticos que tratam da percepo humana de localizao de sons no
espao.

5.2

Principais contribuies deste trabalho

Alm de apresentar algumas das formulaes mais relevantes propostas na literatura para
o operador WFS, podemos ainda citar como contribuies importantes deste trabalho:
a anlise de algumas implementaes da tcnica em programas de referncia disponveis, o
que propiciou um mapeamento das principais funes a serem implementadas e integradas
num sistema de auralizao por WFS;
a modelagem e construo de um prottipo em linguagem de patches numa implementao
aberta e compatvel com a arquitetura de auralizao modular AUDIENCE;

Captulo 5. CONCLUSES

72

a implementao automatizada dos patch e subpatches do prottipo, empregando-se uma


estratgia de programao dinmica de patches (construo dinmica e em tempo real dos
fluxos de processamento).
O mdulo de sonorizao desenvolvido para o sistema OpenAUDIENCE pode ser
utilizado na criao de cenas sonoras virtuais espaciais e modelar a sensao de localizao de
cada fonte sonora no espao de audio, podendo assim ser til em aplicaes de espacializao
sonora, como o desenvolvimento de instrumentos espaciais virtuais e modelagem fsica de
espaos de audio.
O patch de WFS para o sistema OpenAUDIENCE um prottipo extensvel. A simplicidade de seu uso, com mdulos independentes e reconfigurveis, possibilita conectar o algoritmo
de WFS a outros algoritmos de simulao acstica, podendo vir a se tornar uma alternativa aos
aplicativos que executam esta funo. O maior desafio na continuidade deste projeto conceber
uma forma de codificao que permita a escolha da geometria final do sistema de alto-falantes,
deixado para o futuro. De qualquer modo, na presente arquitetura, isto implicaria num novo
cdigo de clculo de parmetros na camada 2 (L2), no interferindo nos cdigos de outras
camadas.
O prottipo de WFS para o sistema OpenAUDIENCE reconfigurvel dinamicamente
e se mostrou bastante flexvel e verstil, permitindo a diminuio do esforo necessrio para a
configurao do sistema. Alm disso, trouxe facilidade de integrao com os diversos recursos
do Pd, principalmente com outros patches e entradas e sadas de programas no universo do
udio e da msica, facilitando o uso desta tcnica de sonorizao em trabalhos de composio,
gravaes, apresentaes, colaboraes musicais interativas e aplicaes que preconizem efeitos
de espacializao sonora, alargando as possibilidades de auralizao com instrumentaes
musicais. O uso do mdulo WFS no sistema AUDIENCE permite sua integrao, de modo
flexvel, a outras tcnicas de auralizao j nele implementadas e de forma extensiva a qualquer
programa implementado no Pd.
Neste trabalho foi desenvolvida uma matriz bsica com 16 canais, que poder servir de
base para implementaes futuras, podendo atingir, por exemplo, 64 alto-falantes que era a meta
prevista no escopo do projeto temtico MOBILE1 , um dos pontos de partida deste projeto. Desta
forma os resultados esperados deste projeto de mestrado sero matrizes perfeitamente utilizveis
num projeto de WFS maior.

5.3

Trabalhos futuros

Como desdobramentos a curto prazo, deseja-se realizar experimento no qual se utilize


objetos sonoros que apresentam propriedades espectrais semelhantes como, por exemplo, ins1

MOBILE: Processos Musicais Interativos. Acesso ao site em <http://www.eca.usp.br/mobile/portal/>

Captulo 5. CONCLUSES

73

trumentos de uma mesma famlia (como violinos e violas) para isolar as possveis variaes
induzveis na percepo espacial de objetos de diferentes assinaturas espectrais e, alm disso,
levar em considerao o padro de irradiao da fonte sonora na sua especificao, para testar
condies mais realistas de auralizao. Deve-se explorar as diferenas de sons com ataque bem
pronunciado, nos quais predominam seus transientes (como sons percussivos), sons quase sem
transientes (como violas e violinos) ou sons preponderantemente estacionrios e avaliar como
funciona o sistema com vozes humanas (fala e canto). Tambm considera-se fazer experimentaes com instrumental virtual espacial, explorando a capacidade do sistema em produzir iluses
hologrficas geradas pela criao e manipulao de fontes pontuais.
De acordo com Belloch et al. (2013), o princpio de Huygens pode ser usado para sintetizar as frentes de onda acsticas de uma forma arbitrria. Uma das ideias em vista, batizada como
controle de foco, citada inicialmente no item 4.3. Quando manipulados, sliders destinados a
esta funo enviam, de forma independente, a um bloco chamado de focalizador, o valor dos
fatores que sero aplicados aos clculos de atrasos nos sinal de udio e de intensidade sonora de
cada canal de udio, mudando a contribuio do som gerado por cada alto-falante na frente de
onda sintetizada. Em uma primeira implementao do recurso de foco espera-se avaliar, com a
alterao destes parmetros, como seriam as possveis deformaes da forma circular da frente
de onda gerada por WFS.
Como desdobramentos a mdio e longo prazo, espera-se construir uma matriz com maior
cobertura espacial, de 32, 64 e mais alto-falantes, e que sejam adaptveis a um sistema de suporte
e sustentao dos alto-falantes, que seja adaptvel a diferentes configuraes geomtricas e
alturas. Alm disso, sugere-se um estudo de simulao para visualizao das frentes de onda
geradas de forma a mapear as formas e evoluo. Do ponto de vista da percepo auditiva das
trajetrias de fontes em movimento, sugere-se um estudo para mapear a variao do perfil de
loudness (volume) ao longo do espao de escuta, principalmente para verificar-se variaes
indesejadas nas proximidades das caixas e ao atravessar do espao virtual ao real.
Neste trabalho foi dada uma nfase muito maior tarefa de modelagem e prototipagem
do mdulo de auralizao por WFS, concepo de uma estratgia de programao dinmica, e
sua sua integrao com a arquitetura de referncia de auralizao (AUDIENCE), sendo deixada
para trabalhos futuros a validao formal e operacional do sistema. Esta exigiria uma instalao
de hardware (computadores, interfaces e distribuio de udio) e configurao do software
operacional em um ambiente acusticamente tratado para a realizao de testes sistmicos,
objetivando validar a operao (funcionamento como esperado) do sistema como um todo.
Para um resultado menos suscetvel a interferncias com a acstica local, estes testes
deveriam ser realizados em um ambiente (sala) preferencialmente seca (baixo RT60). Alm
disto, para atestar a qualidade e preciso das imagens sonoras produzidas deveria ser usada uma
matriz de alto-falantes com dimenses da mesma ordem das dimenses fsicas da sala de audio,
exigindo-se, portanto, um nmero maior de alto-falantes, que no tnhamos disponvel para este

Captulo 5. CONCLUSES

74

projeto.
Espera-se explorar a tcnica de WFS, considerando suas limitaes, principalmente
aquelas relacionadas ao seu setup de sonorizao, como o aliasing espacial, buscando-se estender
os resultados prticos para as variaes das distncias entre as caixas de som, pesquisando-se as
alternativas tcnicas a estas limitaes.
Dentro das perspectivas modernas de comunicao e tecnologia, espera-se que haja
interatividade dos sons e imagens gerados para a criao de cenas virtuais com movimentos e
gestos humanos, sugerindo que a execuo, a escuta e a composio de novas peas musicais
podero lanar mo da utilizao de imagens sonoras mveis formadas no espao de audio,
abrindo perspectivas para a realidade musical aumentada, combinando instrumentos reais e
virtuais, isto , que possam ter a sua percepo virtualizada.
O mdulo de auralizao para WFS e seu respectivo cdigo sero disponibilizados
posteriormente junto distribuio da bilbioteca OpenAUDIENCE no site do NEAC em <www.
lsi.usp.br/audience>. Esta soluo aberta, permitindo que outros pesquisadores utilizem-na em
seus estudos.

75

Referncias

AHRENS, J.; GEIER, M.; SPORS, S. Introduction to the SoundScape Renderer (SSR). Quality
and Usability Lab Deutsche Telekom Laboratories Technische Universitt Berlin, 2012.
Disponvel em https://dev.qu.tu-berlin.de/projects/ssr/files.
BAALMAN, M. A. J. On wave field synthesis and the electro-acoustic music: State of the art
2007. In: Proceedings of the International Computer Music Conference 2007. [S.l.: s.n.], 2007.
BAALMAN, M. A. J. On Wave Field Synthesis and Electro-acoustic Music: With a Particular
Focus on the Reproduction of Arbitrarily Shaped Sound Sources. Tese (Doutorado)
Technischen Universitt Berlin, 2008.
BAALMAN, M. A. J. et al. Renewed architeture of the sWONDER software for wave field
synthesis on large scale systems. In: Linux Audio Conference 2007. [S.l.: s.n.], TU Berlin, 2007.
p. 7683.
BELLOCH, J. A. et al. Gpu-based wfs systems with mobile virtual sound sources and room
compensation. 52nd International AES Conference: Sound Field Control-Engineering and
Perception, 2013.
BERKHOUT, A. J.; VRIES, D. de; VOGEL, P. Acoustic control by wave field synthesis. The
Journal of the Acoustical Society of America, Acoustical Society of America, v. 93, n. 5, p.
27642778, 1993.
BRANDENBURG, K.; BRIX, S.; SPORER, T. Wave field synthesis: From research to
applications. In: Proceedings of the European Signal Processing Conference. Vienna, Austria.
[S.l.: s.n.], 2004.
BRAUN, H. J. Music and technology in the twentieth century. [S.l.]: The John Hopkins
University Press, Baltimore, 2000.
CHION, M. Msicas, media e tecnologias. Lisboa: Instituto Piaget, 1994.
FARIA, R.; ZUFFO, J. An auralization engine adapting a 3d image source acoustic model to an
ambisonics coder for immersive virtual reality. In: AUDIO ENGINEERING SOCIETY. 28th
International AES Conference: The Future of Audio TechnologySurround and Beyond. [S.l.],
2006.
FARIA, R. R. A. Auralizao em ambientes audiovisuais imersivos. Tese (Doutorado)
Universidade de So Paulo, 2005.
FARIA, R. R. A. Audience for pd, a scene-oriented library for spatial audio. Proceedings of
Pure Data Convention, Weimar - Berlin, Germany, 2011.
FARIA, R. R. A. The tempered space on the design of spatial musical instruments. Anais do
18th International Congress on Sound and Vibration, International Institute of Acoustics and
Vibration, Rio de Janeiro, 2011.
FARIA, R. R. A. et al. Audience-audio immersion experiences in the caverna digital. In:
Proceedings of the10th Brazilian Symposium on Computer Music, Belo Horizonte. [S.l.: s.n.],
2005. p. 106117.

Referncias

76

FARIA, R. R. A.; ZUFFO, M. K.; ZUFFO, J. A. Improving spatial perception through sound
field simulation in vr. In: IEEE. Virtual Environments, Human-Computer Interfaces and
Measurement Systems, 2005. VECIMS 2005. Proceedings of the 2005 IEEE International
Conference on. [S.l.], 2005. p. 6pp.
GEIER, M.; AHRENS, J.; SPORS, S. The soundscape renderer: A unified spatial audio
reproduction framework for arbitrary rendering methods. In: AUDIO ENGINEERING
SOCIETY. 124th AES Convention. [S.l.], 2008.
HULSEBOS, E. M. Auralization using Wave Field Synthesis. Tese (Doutorado) Delft
University of Technology. Delft, Holanda, 2004.
IAZZETTA, F. A msica, o corpo e as mquinas. Revista Opus, v. 4, n. 4, p. 2744, 1997.
LOPEZ, J. J. et al. Wave field synthesis for next generation videoconferencing. In:
Communications, Control and Signal Processing (ISCCSP), 2010 4th International Symposium
on. [S.l.: s.n.], 2010. p. 14.
MELCHIOR, F. Investigations on spatial sound design based on measured room impulse
responses. Tese (Doutorado) Tecnische Universiteit Delft, 2011.
MENZIES, D. Quasi wave field synthesis: Efficient driving functions for improved 2.5 d sound
field reproduction. In: AUDIO ENGINEERING SOCIETY. 52nd International AES Conference:
Sound Field Control-Engineering and Perception. [S.l.], 2013.
MONTAG, M. N. Wave Field Synthesis In Three Dimensions By Multiple Line Arrays.
Dissertao (Mestrado) University of Miami, Miami, 2011.
PUCKETTE, M. et al. Pure data: another integrated computer music environment. Proceedings
of the Second Intercollege Computer Music Concerts, Citeseer, p. 3741, 1996.
RANJAN, R.; GAN, W.-S. On the use of dynamically varied loudspeaker spacing in wave field
synthesis. In: AUDIO ENGINEERING SOCIETY. 133rd AES Convention. [S.l.], 2012.
RANJAN, R.; GAN, W.-S. Wave field synthesis: The future of spatial audio. Potentials, IEEE,
v. 32, n. 2, p. 1723, 2013. ISSN 0278-6648.
RITSCH, W. Does pure data dream of electric violins? In: Bang: Pure Data - Wolke Verlagsges.
Mbh, Graz, Austria, 2006.
SALVADOR, C. D. Discrete driving functions for horizontal reproduction using wave field
synthesis and higher order ambisonics. 129th AES Convention, 2010.
SCHAFER, R. M. A afinao do mundo. So Paulo: Fundao Editora da UNESP, 2001.
SILVA, M. J.; FARIA, R. R. A. Aplicao de Wave Field Synthesis para auralizao na msica.
In: AUDIO ENGINEERING SOCIETY. Anais do 11.o Congresso de Engenharia de udio.
[S.l.], 2013.
SILVA, M. J.; SCHIAVONI, F. L.; FARIA, R. R. A. Programao dinmica em Pure Data
aplicada Wave Field Synthesis. In: AUDIO ENGINEERING SOCIETY. Anais do 12.o
Congresso de Engenharia de udio. [S.l.], 2014.
SPORS, S.; RABENSTEIN, R.; AHRENS, J. The theory of wave field synthesis revisited. In:
124th AES Convention. [S.l.: s.n.], 2008. p. 1720.

Referncias

77

THOMAZ, L. F. Aplicao msica de um sistema de espacializao sonora baseado em


Ambisonics. Dissertao (Mestrado) Escola Politcnica da Universidade de So Paulo, 2007.
THOMAZ, L. F. et al. Orchestra spatialization using the audience engine. In: Proceedings of the
ICMC. [S.l.: s.n.], 2006.
VALBOM, L.; MARCOS, A. Wave: Sound and music in an immersive environment.
Computers & Graphics, v. 29, n. 6, p. 871 881, 2005. ISSN 0097-8493. Disponvel em:
<http://www.sciencedirect.com/science/article/pii/S0097849305001585>.
VERHEIJEN, E. N. G. Sound reproduction by wave field synthesis. Tese (Doutorado)
Technische Universiteit Delft, 1998.
VRIES, D. de. Wave Field Synthesis - AES Monograph. New York: Audio Engineering Society
Inc, 2009.
WITTEK, H. Perceptual differences between wavefield synthesis and stereophony. Tese
(Doutorado) University of Surrey, 2007.
ZMLNIG, I. Reflection in pure data. Proceedings of the Linux Audio Conference, Parma, Itlia,
2009. Disponvel em http://lac.linuxaudio.org/2009/cdm/Saturday/18_Zmoelnig/18.pdf.

78

APNDICE A Configuraes do SSR

Neste anexo mostrado o contedo do arquivo de configurao xml utilizado pelo


programa SoundScape Renderer (SSR) na seo 4.4, junto de algumas instrues para melhor
entendimento.
A posio do ouvinte a origem do sistema de coordenadas. A configurao da matriz linear com 12 alto-falantes. Como a distncia das caixas regular, basta informar as
coordenadas de duas das caixas de som da matriz (array) de reproduo. A primeira caixa tem
coordenadas x="1.25" e y="0.319" e a segunda x="1.25" e y="0.228". Assim, a distncia do ouvinte para a matriz de alto-falantes 1,25 m. E os centros dos alto-falantes de cada
caixa esto a 0,091 m de distncia entre si. Para que as caixas apaream na GUI, da esquerda
para a direita, na mesma ordem do que aparece na matriz de alto-falantes, deve ser colocado
<orientation azimuth="180"/>.
Na sequncia o contedo completo deste arquivo:
<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet type="text/xsl" href="asdf2html.xsl"?>
<asdf xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:noNamespaceSchemaLocation="asdf.xsd"
version="0.1">
<header>
<name>A linear array</name>
<description>
A distncia entre os alto falantes 0,091 m.
</description>
</header>
<reproduction_setup>
<linear_array number="12" name="linear segment front left">
<first>
<position x="1.25" y="0.319"/>
<orientation azimuth="180"/>
</first>
<second>
<position x="1.25" y="0.228"/>
</second>
</linear_array>
</reproduction_setup>
</asdf>

79

APNDICE B Mtodo para o clculo da posio da fonte sonora

No teste subjetivo final, a linha de alto-falantes foi escondida dos ouvintes por uma
cortina negra ortofnica, de modo que as posies das fontes sonoras foram estimadas por
meio de 2 indicaes da posio percebida do som indicadas sobre esta cortina usando-se um
apontador laser. O mtodo usado para o clculo da posio da fonte sonora mostrado a seguir.
Dadas as coordenadas das duas posies (pontos A e B) nas quais o ouvinte se encontrava e
dadas as duas coordenadas medidas pela apontamento da direo da fonte sonora pelo ouvinte
(pontos C e D) obtm-se a interseco de duas retas (reta AD e reta BC), ou seja, a posio da
fonte sonora (x f , y f ).
y
P = (x f , y f )
fonte sonora virtual

D
r1

x
r2

A
B

A = (xA , yA ) e B = (xB , yB ) so as duas posies em que o ouvinte escuta cada fonte


sonora e C = (xC , yC ) e D = (xD , yD ) so as medidas no anteparo usadas para determinar a
posio de P.
As equaes das retas r1 e r2 so y = a1 x + b1 e y = a2 x + b2 , respectivamente.
Para r1 tem-se o seguinte sistema de equaes:
(
yA = a1 xA + b1
yA yD
yD xA yA xD
a1 =
e b1 =
xA xD
xA xD
yD = a1 xD + b1
Para r2 :
(
yB = a2 xB + b2
yC = a2 xC + b2

a2 =

yB yC
yC xB yB xC
e b2 =
xB xC
xB xC

APNDICE B. Mtodo para o clculo da posio da fonte sonora

80

E finalmente o objetivo alcanado determinando-se as coordenadas x f e y f da fonte


sonora, que a posio do ponto P, em funo das duas posies de audio e das medidas em
um anteparo:
(
y f = a1 x f + b1

y f = a2 x f + b2

xf =

b2 b1
a1 a2

y f = a1 x f + b1

You might also like