A transformação da voz em um recurso acessível

A Microsoft democratiza o uso da voz, permitindo que essa tecnologia esteja ao alcance de todos, inclusive de áreas que não são técnicas. Entenda

Como seres humanos, estamos muito familiarizados com o uso de nossas vozes – nosso principal meio de comunicação. O tempo, porém, fez com que passássemos a usar também o texto: SMS, WhatsApp, Telegram, Skype… são muitos os recursos que nos permitem digitar e que, com o tempo, também passaram a permitir o envio de mensagens de voz e a compreender palavras ditadas pelo consumidor.

Chegamos, então, a um ponto em que o interlocutor já não é necessariamente um humano, mas um robô. Ele começa a entender a voz de um indivíduo, a conhecer expressões e até mesmo gírias, evoluindo a cada dia. Fernando Lemos, CTO da Microsoft, explica que houve etapas nessa evolução:

  • 2016 – Visão
  • 2017 – Reconhecimento de fala
  • 2018 – Leitura, tradução e síntese de discurso
  • 2019 – Compreensão de linguagem

 

Com isso, o chamado aprendizado de máquina (ou Machine Learning, em inglês), tornou-se uma realidade.

Qual foi o impacto desse processo na experiência do cliente?

Lemos responde a essa pergunta a partir de um exemplo: a transformações de texto em voz que, hoje, é feita a partir de sistemas neurais – ou seja, ela se torna muito mais natural e confiável. A partir disso, ele apresenta o que a Microsoft possui para trabalhar com sistemas de cognição e voz. “Dentro de uma das nossas nuvens, a Azure, temos uma gama enorme de serviços de IA”, diz.

1. Aplicativos de IA e agentes

“São dois grandes blocos: serviços cognitivos e comunicação por chatbots apoiados em sistemas cognitivos e IA”, diz. Em sistemas cognitivos, a empresa busca aplicar capacidade humana na tecnologia e, depois, tomadas de decisão via redes neurais. Como exemplo, ele cita sistemas de apoio à decisão, ou seja, personalização. No atendimento ao cliente, por exemplo, ele cita que é possível determinar as respostas a partir da compreensão do humor do cliente. “Em sistemas de linguagem, muitas vezes é difícil determinar se a conversa é com um robô ou com um agente”, diz.

Caso não seja possível manter o uso de uma nuvem pública, ele explica que os serviços de cognição podem ser aplicados no sistema interno da empresa.

2. Gestão do conhecimento

Na prática, esse serviço se aplica a qualquer tipo de informação – seja documento, seja imagem, ou até mesmo vídeos. Depois, esses dados são catalogados e transformados em outras interações. Portanto, é a transformação da informação em conhecimento em prol da experiência.

3. Machine Learning

No caso de máquinas de aprendizado, Lemos destaca que essa tecnologia passa a estar disponível também para pessoas que não são especialistas – cientistas de dados, por exemplo. “Estamos empoderando qualquer pessoas para que possam fazer sistemas cognitivos com máquinas de aprendizado”, diz.

Ele opera de duas formas: quem não é técnico, que atua na área de negócios, pode usar a alternativa automática, que já é pré-treinada e pode simplesmente ser abastecida com dados do negócio. De forma visual e gráfica, o uso é simples. Por outro lado, há o processo de operar voz, IA e nuvem – como um método de treinamento da Machine Learning.

O trabalho com voz

De acordo com Lemos, o trabalho principal com voz acontece em empresas de relacionamento com clientes, telecomunicações, mídia, hotéis, restaurantes e carros inteligentes. “Aplicamos as técnicas de voz para criar dados insights e um assistente digital”, diz. A ideia é que as empresas possam ter suas próprias assistentes virtuais de voz. “A Microsoft lançou recentemente um estúdio de voz em que cada um pode experimentar e criar a voz que vai falar com você”, afirma.

No Teams, ele conta que é possível ter uma tradução em tempo real da fala em outra língua. O Skype, por sua vez, foi o primeiro a ter tradução em tempo real. Ambas (e muitos outros recursos) usam a tecnologia da Microsoft.

Confira o vídeo completo:


+CVX

5 exemplos de como IA e os bots combatem a Covid-19
5 perguntas e respostas sobre bots e dados pessoais
Humana ou não, a voz é sempre uma alternativa no atendimento






ACESSE A EDIÇÃO DESTE MÊS:

ASSINE NOSSA NEWSLETTER

MAIS LIDAS

VEJA MAIS

ÚLTIMAS

VEJA MAIS

CM 256: Os vencedores do Prêmio Consumidor Moderno de Excelência em Serviços ao Cliente

CM 255: Tudo o que você precisa saber sobre o consumidor na pandemia

Você já conhece as Identidades do consumidor?

VEJA MAIS