Legendagem Automática

Legendagem Automática. O Porquê.

O desenvolvimento das sociedades tem levado a uma consciencialização crescente das mesmas para a necessidade de garantir condições de igualdade no acesso à informação e conhecimento a todos os indivíduos. É neste contexto que as emissoras de televisão, bem como outros produtores de media, se deparam, cada vez mais, com requisitos legais que obrigam à disponibilização dos conteúdos recorrendo a métodos de comunicação alternativa, como por exemplo a linguagem gestual e a legendagem.
O facto de a legendagem se ter tornado útil para um conjunto mais alargado de utilizadores e situações – e.g. as legendas têm sido usadas por falantes não nativos de modo a compreenderem melhor os programas e a aprenderem a língua; a legendagem permite também seguir as emissões de TV em locais públicos, ou muito ruidosos (centros comerciais), ou onde é imperioso manter o silêncio (hospitais) –, fez despertar, nas emissoras de Televisão, um grau adicional de interesse por este mecanismo de descrição de conteúdos.
Com esta descrição alternativa de conteúdos permite-se, à emissão, chegar a um público mais amplo. Porém, a criação e utilização manual do closed caption é um processo caro, moroso e que envolve bastantes recursos, entre eles humanos. A criação e utilização de ferramentas automáticas que atacam este problema têm sido um dos nossos principais focos de investigação e desenvolvimento. O nosso objectivo é possibilitar a produção automática de legendas de alta qualidade e fidelidade, a um custo acessível e atrativo para as emissoras e produtoras de conteúdos.

 

Ao Vivo. Automático. Legislado. Acessível.

Geração de legendas automáticas para emissões de televisão ao vivo ou conteúdos web transmitidos em stream, sem a necessidade de intervenção humana. Cumpre todos os requisitos legais aos quais as emissoras têm de responder para transmitir e legendar os seus conteúdos, evitando os custos proibitivos de uma legendagem manual.

 Audimus.Media frame

 

Descrição Geral

O Audimus Media é um sistema de legendagem totalmente automático presente nas instalações do cliente. Este recebe os seus feeds de emissão, em directo, e produz legendas em tempo real. De fácil integração com o seu workflow actual, este sistema recebe qualquer fonte de aúdio ou vídeo, processa e envia as legendas geradas para qualquer encoder de teletexto ou de closed caption. Nas emissões web o processo é igualmente possível e semelhante. Para atingir máxima precisão existem diferentes tecnicas ou estratégias que se podem tomar, como por exemplo, adaptação a oradores mais frequentes ou atualização diária do contexto do vocabulário.
 
 

Principais Características

Este produto foi criado, primeiramente, para canais de televisão. É nosso objectivo fornecer um serviço que permita a legendagem automática das emissões em directo, onde todos os regulamentos de acessibilidade sejam cumpridos com qualidade e rapidez. Contudo, atualmente as necessidades de closed caption vão muito mais além das emissoras de televisão. A produção de conteúdos para a web tem vindo a registar um aumento que não pode ser ignorado, liderado pelas operadoras de OTT/IPTV e Internet video portals. Cada vez mais estas entidades necessitam de acompanhar os conteudos que transmitem com legendagem. O Audimus Media responde a esta necessidade com a possibilidade de receber qualquer conteudo web e fazer a sua legendagem em tempo real. Além deste ponto fulcral, permitimos, também, a adição de metadata aos conteúdos a transmitir. A indicação de quem é o orador, da língua utilizada e a sinalização de ocorrência de música no background são exemplos do enriquecimento que fazemos a uma normal transmissão.
Entidades institucionais e Plataformas de E-learning que façam transmissão de conteúdos, ou empresas que possuam uma televisão interna e necessitam de legendar os seus conteúdos podem utilizar o Audimus Media para o fazer.

 

Sumariamente, o Audimus Media permite:

 

  • Legendagem automática de emissões de televisão em directo
  • Legendagem automática em web streams em directo
  • Incorporação de metadata em contéudos a transmitir
  • Cumprir com todos os regulamentos de acessibilidade
O Audimus Media pode ser útil para uma ampla variedade de organizações e clientes. As utilizações mais relevantes estão presentes nas seguintes áreas de negócio:

 

  • Emissoras de televisão
  • OTT / IPTV
  • Internet Video Portals
  • Plataformas de E-learning
  • Televisão corporativa
  • Entidades Institucionais

Descrição Aprofundada

Sempre foi nosso propósito a criação de um sistema totalmente automático, onde a produção de legendas em tempo real com a menor latência e taxa de erro possíveis são os objectivos principais. Para tal desenhámos e desenvolvemos a arquitectura presente na imagem seguinte.
 
 
O Audimus Media captura um qualquer sinal de áudio ou vídeo em formato digital ou análogico e, através de reconhecimento de fala automático, produz as legendas optimizadas para diferentes tipos enconders com uma latência diminuta.
Neste processamento automático destacamos a identificação de todos os pivots presentes no áudio recebido, bem como, a detecção de alteração entre diferentes oradores. O texto de saída é normalizado, formatado e optimizado para um conjunto de encoders alvo que detêm grande parte do universo atual do mercado. Tudo isto é feito menos de 3-4 segundos palavra a palavra.
Sendo um sistema dependente da língua, são disponibilizados diferentes modelos para diferentes regiões. Estes são treinados com grandes quantidades de áudio e texto, onde o volume total do vocabulário ultrapassa as 100.000 palavras.
Os modelos de linguagem resultam da interpolação de vários submodelos associados a diferentes fontes, estando disponível um Serviço de Adaptação dos Modelos de Linguagem que permite a sua adaptação diária às diferentes temáticas novas. Este sistema trabalha em conjunto com um Módulo de Segmentação Acústica para uma separação das zonas acústicas relevantes para a legendagem.
Entre as línguas suportadas podemos enumerar: Português Europeu, Português Africano, Português do Brasil, Espanhol, Francês, Alemão, Italiano, Suíço, Basco, Inglês Americano e Inglês Britânico.
 

Administração do Sistema

Toda a administração do sistema é disponibilizada via interface web.

 

 

 

 

audimusServer4

 

 

Requisitos Computacionais

  • Intel i7 or Intel Xeon com, pelo menos, 4 cores (físicos) e CPU Freq >2.5GHz
  • 8GB of Ram (no mínimo)
  • 5GB of free disk space (no mínimo)
  • Placa de som for balanced audio (onboard ou uma SoundBlaster Audigy ou similar) or SDI Declink card (to use directly SDI)
  • Windows 7/8/10/WS2012
  • Acesso remoto por TeamViewer, Remote Desktop ou VPN

Demonstração

 

Casos de sucesso

O AUDIMUS.MEDIA encontra-se em funcionamento na RTP, operador público de televisão em Portugal, desde 2007. O sistema actualmente legenda vários programas na RTP nomeadamente os diversos programas de informação, num total de cerca de 10 horas diárias.
O AUDIMUS.MEDIA entrou em funcionamento na SIC, no segundo semestre de 2015. O sistema irá legendar os principais programas de informação dos vários canais SIC.
Actualmente o Audimus.Media encontra-se a funcionar no mercado brasileiro em cerca de 40 estações, espalhadas por todo o país. O sistema encontra-se a legendar em todas estas estações os respectivos programas de informação, desde a informação local à informação nacional.