Startup Palabra AI recebe US$ 8,4 milhões para acelerar tradução de voz em tempo real
A Palabra AI, jovem empresa voltada à tradução de voz por meio de inteligência artificial, assegurou um aporte pré-seed de US$ 8,4 milhões. A rodada foi liderada pela Seven Seven Six (776), gestora de venture capital do cofundador do Reddit, Alexis Ohanian, e contou com participação da Creator Ventures e de investidores anjo, entre eles Max Mullen (Instacart), Anne Lee Skates (ex-a16z), Mehdi Ghissassi (ex-DeepMind) e Namat Bahram.
Fundada em 2023 pelos engenheiros Artem Kukharenko e Alexander Kabakov, a companhia pretende eliminar barreiras linguísticas em conversas ao vivo. Segundo Ohanian, a combinação entre conhecimento técnico do time e execução de produto motivou o investimento. O executivo considera a tradução de fala um desafio diferente da conversão de texto, pois exige troca de idioma praticamente instantânea sem comprometer naturalidade da voz.
Redução de latência para 800 milissegundos
A principal proposta da Palabra é oferecer tradução simultânea com atraso inferior a um segundo. De acordo com Kukharenko, ex-engenheiro de aprendizado de máquina da Samsung, soluções atuais costumam acoplar módulos independentes de reconhecimento de fala, tradução de texto e síntese de voz, o que amplia a latência e prejudica a sensação de tempo real. A tecnologia desenvolvida internamente combina esses estágios em um único fluxo e atinge cerca de 800 ms de atraso, marca que, segundo o fundador, torna a experiência mais fluida.
Para ampliar o número de idiomas compatíveis, a startup criou um pipeline de dados personalizado capaz de incorporar novas línguas em poucas semanas. No final do processo, um intérprete humano valida a qualidade das saídas antes de disponibilizá-las ao público. A arquitetura também foi projetada para lidar com ruídos de fundo e interrupções comuns em chamadas de voz.
Aplicativo para usuários finais e APIs para empresas
A Palabra comercializa produtos para consumidores e organizações. Para o usuário final, há um aplicativo para desktops Mac e Windows que se integra a plataformas de videoconferência como Google Meet, Zoom, Discord, Slack e Microsoft Teams. O software já traduz mais de 30 idiomas, permitindo que participantes de nacionalidades distintas conversem cada um no próprio idioma.
No site oficial, a empresa informa que trabalha para estender o suporte a serviços de conteúdo, entre eles YouTube, Netflix, Twitch e Vimeo, oferecendo dublagem automática em tempo real. O modelo de negócio inclui um plano gratuito com 30 minutos mensais e assinaturas a partir de US$ 25, que liberam 60 minutos adicionais de tradução em todos os aplicativos compatíveis.
Para o mercado corporativo, a companhia disponibiliza APIs e SDKs que podem ser integrados a produtos de terceiros. Atualmente, a tecnologia abastece a plataforma de vídeo Agora em transmissões multilíngues ao vivo. Prestadoras de serviços linguísticos, como a GIS Group, recorrem ao sistema como complemento a intérpretes humanos, e diversos organizadores de eventos utilizam a solução para ampliar o alcance global de conferências.

Imagem: techcrunch.com
Cenário competitivo
O segmento de tradução de voz registra crescimento veloz e abriga concorrentes como a EzDubs, acelerada pela Y Combinator, que desenvolve aplicativos para conversas presenciais ou por chamadas, e a Camb.AI, sediada em Dubai, focada em transmissões de eventos esportivos e de entretenimento em múltiplos idiomas. Grandes empresas de tecnologia também avançam na área: no início do ano, o Google adicionou tradução simultânea a reuniões no Meet.
Diante desse cenário, a Palabra aposta em avanços técnicos para se diferenciar. A equipe de pesquisa trabalha em um modelo de previsão de fluxo que promete reduzir ainda mais a latência e em uma infraestrutura capaz de processar mais de 10 mil transmissões de áudio simultâneas.
Próximos passos
Com os recursos recebidos, a startup pretende ampliar o quadro de pesquisadores e engenheiros, expandir o suporte linguístico e acelerar acordos com plataformas de comunicação e streaming. O foco imediato é aprimorar a qualidade do áudio gerado, mantendo o sotaque natural do falante original e evitando cortes, meta considerada essencial para adoção em ambientes corporativos sensíveis a atrasos.
Ao endereçar as limitações atuais da tradução de fala, a Palabra AI se posiciona como candidata a fornecer infraestrutura para conferências internacionais, transmissões de eventos e criação de conteúdo globalizado, mercado cuja demanda acompanha a crescente interação entre públicos de diferentes idiomas.