Transcrição de Fala Automática

Automático. Integrável. Flexível.

O sistema AUDIMUS.SERVER da VoiceInteraction é a resposta às suas necessidades de transcrição de ficheiros de media. De uma forma automática, é agora possível transfomar os seus arquivos audio-visuais em documentos textuais. De integração simples e flexível com o seu fluxo de trabalho e estrutura atuais, alcance a execelência de uma transcrição optimizada à sua situação particular.

Descrição Geral

Suportado por um motor de reconhecimento de fala em constante evolução, o Audimus Server pode receber qualquer tipo de arquivo media, gerando metadata que descreve os conteúdos falados. É feita uma transcrição integral do discurso reconhecido, a qual é reforçada e melhorada com anotações semânticas e a identificação temporal das intervenções de todos os oradores. É possível exportar o resultado final num número extenso de formatos textuais, com o objectivo de optimizar para agilizar o fluxo de trabalho atual do cliente.

Principais Características

Com este produto proporcionamos aos nossos clientes um conjunto de novas oportunidades e de facilidades ao lidar com o problema da transcrição manual de arquivos media pré-gravados. Em termos de exportação, fornecemos uma grande variedade de outputs. Aqui irá encontrar o formato que necessita, o qual irá agilizar o workflow que já possui. Pode, por exemplo, utilizar os formatos que disponibilizamos para importar o resultado da transcrição para um editor NLE.
Em termos de integração de metadata é importante, também, realçar a ligação e cooperação com diferentes MAMs. O apriomorar da metadata aqui produzida é um dos factores de maior relevo do Audimus Server. O arquivamento dos resultados gerados para rápida consulta sempre foi um dos nossos objectivos com este programa. Assim, um grande arquivo de media fica totalmente indexado e com o seu conteúdos completamente pesquisável.
Por outro lado, a criação, em tempo inferior ao tempo de ficheiro, de uma transcrição completa diminuiu o esforço necessário para realizar a tradução de um qualquer conteúdo indicado. Se necessita deste tipo de serviço e não quer começar do zero, esta é a solução que procura.
 

Sumariamente, o Audimus Server permite:

  • Exportar a transcrição em múltiplos formatos
  • Enriquecimento de metadata de MAMs
  • Arquivação indexada em base de dados
  • Importação directa para editores textuais
  • Integração rápida e eficiente no fluxo de trabalho do cliente
  • Redução drástica do tempo de produção das transcrições
O Audimus Server pode ser útil para uma ampla variedade de organizações e clientes. As utilizações mais relevantes estão presentes nas seguintes áreas de negócio:

  • Emissoras de Televisão
  • Criadores de transcrições e legendas
  • Tradutores de transcrições e legendas
  • Produtores de conteúdos
  • Instituições públicas e privadas, Tribunais, Câmaras e Assembleias Municipais

Descrição Aprofundada

Não tendo que responder às restrições temporais de processamento que um modo online exige, o Audimus Server necessita de , contudo, conseguir responder a utilizações mais abrangentes. Saíndo no ambiente de broadcast news, existe uma compreensível perda de qualidade do resultado, visto a falar ser mais espontânea e menos preparada.
Para responder as estas necessidades, desenvolvemos uma solução que recebe qualquer tipo de ficheiro de media e, através de reconhecimento de fala automático, produz uma transcrição completa do conteúdo fornecido. Este resultado é aprimorado por uma completa descrição semântica do que foi reconhecido, além da indicação das zonas de fala e zonas de silêncio.
Nas zonas de fala é indicado o orador responsável pela secção analisada, informação à qual se adiciona a lingua falada pelo mesmo. O texto de saída é normalizado, formatado e pode ser optimizado para um largo conjunto de saídas disponibilizadas. Tudo isto é feito num tempo inferior à duração do ficheiro de entrada.
 

audimusServer 1

Sendo um sistema dependente da língua, são disponibilizados diferentes modelos para diferentes regiões. Estes são treinados com grandes quantidades de áudio e texto, onde o volume total do vocabulário ultrapassa as 100.000 palavras.
Os modelos de linguagem resultam da interpolação de vários submodelos associados a diferentes fontes, estando disponível um Serviço de Adaptação dos Modelos de Linguagem que permite a sua adaptação diária às diferentes temáticas novas. Este sistema trabalha em conjunto com um Módulo de Segmentação Acústica para uma separação das zonas acústicas relevantes para a legendagem. Entre as línguas suportadas podemos enumerar: Português Europeu, Português Africano, Português do Brasil, Espanhol, Francês, Alemão, Italiano, Suíço, Basco, Inglês Americano e Inglês Britânico.
 
O Audimus Server possui uma interface de administração e utilização, podendo ser facilmente integrado com aplicações através de interface Webservices (SOAP/WSDL). Este sistema recebe um ficheiro áudio/vídeo, coloca-o numa lista para processamento e notifica o utilizador após a sua conclusão, para que este possa consultar e utilizar o resultado do reconhecimento. Trabalha com vocabulários >100.000 palavras e modelos de linguagem treinados com textos de jornais. Nas zonas de fala, faz uma transcrição completa do que foi dito, com a indicação de níveis de confiança no reconhecimento.

audimusServer4

 

Casos de sucesso

O AUDIMUS.SERVER encontra-se em funcionamento desde o ultimo trimestre de 2015. O sistema actualmente está a ser usado na elaboração das atas da Câmara e das atas da Assembleia Municipal, permitindo disponibilizar assim todas as atas de forma mais rápida.
A LUSA é um dos bons exemplos de utilização deste sistema para a legendagem de vídeos para serem distribuídos para corporate TV. Os vídeos depois do ingest no sistema são submetidos ao AUDIMUS.SERVER. Depois de serem transcritos passam pela interface de edição disponibilizada pela VOICEINTERACTION que permite a correcção e ajuste das legendas e a integração dessas legendas directamente no vídeo ou num ficheiro .srt à parte. Esses vídeos são depois utilizados na área de serviço da LUSA.