Inovações em streaming e áudio imersivo transformam a experiência do rádio digital
Webinar da Ferncast destaca soluções para qualidade sonora, metadados e eficiência no fluxo de trabalho
23/04/2025
Em um webinar recente, a Ferncast GmbH explorou as tecnologias modernas de streaming para rádios, abordando formatos como IceCast, HLS e DASH. Especialistas da Ferncast discutiram protocolos essenciais, codificação de alta qualidade como xHE-AAC e Dolby Atmos, e casos de uso de grandes emissoras. Os impactos no workflow das emissoras também foram abordados, incluindo o processamento, o controle de loudness e a inserção de metadados.
Embora baseada na plataforma Aixtream da Ferncast, a discussão sobre o streaming das rádios pode ser generalizada para se entender os principais aspectos envolvidos neste processo: os protocolos e formatos de streaming, os codecs de áudio, o processamento de áudio, a inserção de metadados e a otimização da operação. Este é o propósito deste artigo, oferecer uma visão clara e concisa deste workflow como ponto de partida para análises mais profundas pelos profissionais do setor.
Protocolos e formatos de streaming: a base da distribuição
A forma como o áudio é entregue aos ouvintes evoluiu. Podemos distinguir entre formatos convencionais e formatos segmentados.
Formatos convencionais (Icecast/Shoutcast, RTMP): Estes são fluxos contínuos de áudio, replicados para os ouvintes através de redes de distribuição de conteúdo (CDNs). Embora simples e com alta compatibilidade com diversos dispositivos, a oferta de várias versões, com diferentes qualidades de áudio ou idiomas, exige que o ouvinte selecione um streaming de um endereço específico para cada caso. O protocolo Icecast/Shoutcast, baseado em HTTP, é um exemplo comum. Já o RTMP, embora mais utilizado em vídeo, ainda pode ser usado para enviar áudio para servidores que o convertem para outros formatos.
Formatos segmentados (HLS, DASH): Estes formatos dividem o áudio em pequenos segmentos que são baixados sequencialmente pelos dispositivos dos ouvintes, criando uma experiência de reprodução contínua. Um “manifesto” (ou playlist) organiza esses segmentos.
A segmentação possibilita funcionalidades importantes como o time-shifting (retroceder na transmissão) e o suporte a múltiplos idiomas.
O HLS (HTTP Live Streaming), especificado pela Apple, e o DASH (Dynamic Adaptive Streaming over HTTP), especificado pela MPEG, são os principais formatos segmentados. O HLS é particularmente comum em rádio devido ao seu bom manuseio de diferentes versões de áudio.
Uma vantagem crucial dos formatos segmentados é a taxa de bits adaptável. O player do ouvinte pode ajustar automaticamente a qualidade do áudio (trocando para segmentos com menor taxa de bits) em condições de baixa largura de banda, evitando interrupções.
O CMAF (Common Media File Format) é um esforço para padronizar o empacotamento de HLS e DASH, buscando maior compatibilidade entre dispositivos. Ele utiliza um formato de contêiner padronizado (MP4 fragmentado) e padroniza o comprimento dos segmentos, visando alcançar compatibilidade máxima com dispositivos finais.
Codecs de áudio: a qualidade sonora
A escolha do codec de áudio impacta diretamente a qualidade e a eficiência da transmissão.
Codecs comuns como AAC são amplamente utilizados em tecnologias modernas, enquanto o MP3 ainda é relevante para garantir compatibilidade com dispositivos mais antigos.
O xHE-AAC, desenvolvido pelo Fraunhofer, oferece uma qualidade de áudio notável mesmo em taxas de bits muito baixas (12 kbps a 320 kbps em estéreo). Ele também inclui mecanismos para garantir um volume e loudness consistentes para o ouvinte e permite a troca contínua de taxa de bits em resposta às condições da rede. O Airxtream suporta o empacotamento de xHE-AAC em HLS.
O Dolby Atmos expande as possibilidades para rádio ao vivo imersivo e podcasting imersivo, oferecendo experiências de áudio espacial. O Airxtream pode empacotar arquivos Dolby Atmos pré-codificados e realizar a codificação a partir de arquivos master, suportando diversos formatos espaciais.
Inserção de metadados: informação em tempo real
A inserção de metadados (como título da música, artista etc.) é fundamental para enriquecer a experiência do ouvinte. O Airxtream oferece uma abordagem flexível para gerenciar metadados.
Diversos métodos de ingestão são suportados, incluindo APIs para atualizações regulares (push), leitura de infraestruturas RDS existentes, busca de arquivos de texto (pull), extração de metadados de outras fontes (como Icecast, DAB, FM, DVB) e integração com softwares de programação (Music Master).
Na utilização dos metadados, o Airxtream permite configurar três camadas: base (informações estáticas), overlay (informações dinâmicas) e fallback (metadados de segurança em caso de falha na atualização).
O sistema também suporta a saída direta de metadados em diversos formatos (ID3 em MP4, capítulos), formatos específicos de protocolo (HLS com suporte a capítulos e futuro suporte a WebVTT para legendas) e formatos para CDNs específicos.
Neste contexto, os “capítulos” referem-se a uma forma de metadados que podem ser incluídos, por exemplo, nos arquivos de podcast (possivelmente no ID3 de formatos como o MP4). Esses capítulos permitem que os ouvintes naveguem facilmente para diferentes seções ou tópicos dentro do episódio do podcast, melhorando a experiência de escuta ao oferecer uma forma de acesso direto a partes específicas do conteúdo. O suporte a capítulos também existe em formatos específicos de protocolo como o HLS.
Otimização de workflow: a eficiência na operação
Diversas tecnologias são empregadas para otimizar o fluxo de trabalho na transmissão de rádio.
O HLS Catchup Mode resolve o problema de time-shifting limitado após a reinicialização de encoders redundantes, baixando os segmentos faltantes do CDN do servidor ativo.
O Smooth Delay permite ajustar o atraso na transmissão para sincronização de áudio e vídeo, com uma adaptação gradual para evitar distorções.
A redução do comprimento do segmento HLS (até 2 segundos ou menos no Airxtream) diminui a latência geral da transmissão.
Os Applets (pequenos programas embutidos no software principal) oferecem um sistema de automação “se isto então aquilo”, permitindo a criação de ações personalizadas com base em diversos gatilhos (data/hora, mudanças de pipe, eventos de log, botões de dashboard, alarmes).
Processamento e controle de loudness: a experiência sonora
Garantir uma qualidade de áudio consistente e otimizada é crucial. O
Stereo Tool da Thimeo foi integrado ao Airxtream, oferecendo processamento de áudio sofisticado e geração de MicroMP (uma forma reduzida ou otimizada de um codec, como o MP3, voltado para dispositivos embarcados, sistemas com pouca memória ou baixa capacidade de processamento), com uma interface web intuitiva.
O controle de loudness de próxima geração (NGLC) permite definir níveis de loudness e true peak alvo, com presets profissionais e ferramentas para criação de perfis personalizados. O sistema pode até mesmo alternar automaticamente entre diferentes conjuntos de parâmetros de processamento com base nas características do áudio de entrada, garantindo um loudness consistente em diferentes conteúdos.
Casos de uso: aplicações no mundo real
As tecnologias de streaming de rádio modernas oferecem um conjunto impressionante de ferramentas para emissoras de todos os portes. A flexibilidade, a escalabilidade, a qualidade de áudio aprimorada e as funcionalidades avançadas de gerenciamento e otimização abrem novos caminhos para alcançar e engajar audiências no ambiente digital.
Os casos de uso de grandes emissoras ilustram a versatilidade e o poder dessas tecnologias.
A WDR (Westdeutscher Rundfunk) utiliza o Airxtream para streaming HLS (AAC) e Icecast (MP3), além de multiplexação de MPTs (método de empacotamento e transporte de dados multimídia como imagens de capas de álbuns, slides de apresentação, EPGs etc.) compatíveis com DAB, tudo no mesmo sistema a partir de entradas de áudio digital AES67.
A Radio Nacional de España (RNE) demultiplexa 128 programas MPEG de entrada e os codifica em diversos formatos para distribuição via múltiplas plataformas de streaming, totalizando cerca de 700 saídas.
A Classic Audio, uma emissora comercial alemã, utiliza a API do Airxtream para automatizar a ingestão de programação via Music Master, processamento de áudio (incluindo NGLC) e gerenciamento de metadados para seus streamings lineares e seu programa sob demanda.