Ângulo de Anderson
A Inteligência Artificial Pode Ajudá-lo a Alcançar uma Pessoa Real Mais Rápido

Pesquisas recentes mostram que configurações de IA de código aberto do tipo ChatGPT podem potencialmente encaminhar chamadores para a pessoa certa em um call center usando linguagem natural, sem seguir opções de menu irritantes que são diferentes a cada semana, aparentemente deliberadamente obstrutivas.
Tentar alcançar uma pessoa real em um call center pode ser uma experiência frustrante, devido à necessidade de navegar por opções de múltipla escolha a um ritmo lento – frequentemente sem certeza de qual das opções se adequa ao seu caso. Se nenhuma delas se adequar, usuários experientes tendem a adotar truques e soluções alternativas para ganhar acesso a um consultor humano de algum tipo, e para sair do ‘inferno das opções’. Muitos de nós reconheceremos isso como uma experiência mais ou menos ‘combativa’ e hostil ao usuário.
Não é surpreendente que os call centers estejam na linha de frente para aumento ou substituição por sistemas de IA; e, apesar de uma abordagem circunspecta ser urgida por alguns setores, a automação de call centers por IA permanece um alvo fácil para manchetes de tecnologia, e para a perspectiva de inovação baseada em IA que pode oferecer um retorno sobre o investimento excepcionalmente cedo.
Loja Fechada
Mas há algumas áreas onde os princípios de código aberto e dados livremente disponíveis raramente são aplicados ou disponíveis, e esta é uma delas. Isso faz sentido: qualquer empresa interessada em automatizar seus sistemas de resposta ao cliente terá um interesse limitado ou zero em compartilhar os dados que alimentam suas percepções duramente conquistadas, suas metodologias ou sua propriedade intelectual.
Por um lado, compartilhar esses recursos custaria uma vantagem competitiva; mais importante ainda, dado o quão propensos os sistemas de IA são a divulgar informações privilegiadas, é legalmente arriscado.
Isso levou a uma série de jogadores bem investidos a desenvolver sistemas de resposta de call center auxiliados por IA de forma independente uns dos outros (presumivelmente com algum esforço redundante inevitável); e a uma proliferação de startups e jogadores estabelecidos de B2B que buscam atender à demanda crescente por capacidades de resposta ao cliente impulsionadas por IA.

Um assistente de voz PolyAI abre uma chamada de serviço ao cliente para a empresa fictícia ‘Augusta Lawn Care’, utilizando grandes quantidades de conversas de treinamento para automatizar respostas por meio da infraestrutura de call center existente. Fonte
Além disso, a corrida para remover a frustração de navegar por um labirinto de call center provou ser um estímulo para esforços de pesquisa – embora a maioria dessas publicações tenda a ocorrer longe de Arxiv e outras redes de publicação de pesquisa aberta, de acordo com a natureza geralmente clandestina do desenvolvimento de IVR.
Em vez disso, pesquisa, dados e inteligência de negócios relacionados à automação de sistemas de resposta ao cliente por IA são todos guardados com ciúme, com muito poucas opções de código aberto disponíveis – mesmo que o uso de sistemas e dados de FOSS oferecesse uma opção legalmente sólida, o que é duvidoso.
Chamada Local
Com isso em mente, é refrescante ver um novo artigo da Colômbia tentando tirar o IVR de sua vault corporativa, pelo menos um pouco. O novo trabalho, uma entrada concisa intitulada Além dos Toques de IVR: Roteamento de Intenção do Cliente usando LLMs, vem de um pesquisador da Universidad Distrital Francisco José de Caldas em Bogotá, e afirma ser o primeiro projeto não fechado a usar Large Language Models (LLMs) para gerar um esquema de trabalho para um sistema de Roteamento de Intenção do Cliente (CIR).
Em vez de tentar obter acesso a dados de chamadas do mundo real ou árvores de menu proprietárias, o novo projeto gera todos os componentes do zero usando três modelos de IA: um para inventar um menu de call center realista; outro para simular centenas de reclamações de chamadores; e um terceiro para atuar como o chatbot, tentando encaminhar essas reclamações para o destino correto.
O resultado é um teste sintético, mas convincente, com uma empresa de telecomunicações fictícia, juntamente com 920 consultas de usuário distintas, permitindo que o experimento contorne os riscos legais enquanto investiga como bem a IA atual pode interpretar discurso vago e desordenado, e ainda conectar o chamador à pessoa certa.
Os testes indicam que o esquema do sistema pode corresponder a reclamações de chamadores em forma livre ao destino de call center correto com até 89,13% de precisão, especialmente quando dado ‘opções de menu achatadas’ em vez de descrições verbosas (mais sobre isso mais tarde).
O estudo também encontrou que, quando os chamadores usavam linguagem mais casual ou variada, a IA errava mais; mas que alguns desses erros ocorreram não porque a IA mal interpretou, mas porque o próprio menu de telefone era confuso.
![Exemplos de interações de cliente, compartilhados como parte do novo projeto. [Fonte] https://figshare.com/articles/dataset/Beyond_IVR_Touch-Tones_Customer_Intent_Routing_using_LLMs/30118690](https://www.unite.ai/wp-content/uploads/2025/10/figshare-examples-data.jpg)
Exemplos de interações de cliente, compartilhados como parte do novo projeto. Fonte
Os dados do projeto foram tornados publicamente disponíveis.
Método
O primeiro modelo na abordagem tripartite cria um menu de telefone detalhado para uma empresa de telecomunicações fictícia; o segundo gera mensagens de chamador únicas – algumas simples, outras reescritas ou tornadas mais casuais – para simular como as pessoas realmente falam quando ligam para pedir ajuda. Com relação a isso, 10 exemplos únicos foram feitos para cada ponto final do menu.
O terceiro modelo foi encarregado de conectar cada chamador ao departamento correto, com base apenas na mensagem e em uma versão do menu. Esse esquema permitiu que o experimento fosse totalmente repetível, enquanto contornava a necessidade de dados de chamadas reais ou expunha informações de cliente:
![Os três sistemas escolhidos para a abordagem tripartite. [Fonte] https://arxiv.org/pdf/2510.21715](https://www.unite.ai/wp-content/uploads/2025/10/table-1-5.jpg)
Os três sistemas escolhidos para a abordagem tripartite. Fonte
Os três modelos usados, respectivamente, foram gpt-3.5-turbo; gpt-4o-mini; e gpt-4.1-mini.
Para simular um ambiente de serviço ao cliente convincente, foi necessário sintetizar um menu de telefone complexo do zero. Devido à escassez de conjuntos de dados relevantes, o modelo gpt-3.5-turbo foi solicitado a gerar uma estrutura completa e multi-ramificada para um provedor de telecomunicações fictício.
Cada ramo foi configurado para representar áreas de serviço, como faturamento, suporte técnico gerenciamento de conta, e novos serviços, com opções realistas e sub-opções e profundidade variada ao longo da árvore. A partir desse menu artificial, duas versões foram criadas para testes posteriores: uma como uma hierarquia de texto simples, para imitar como um humano poderia ler o menu inteiro; e outra como uma lista de pontos finais, cada um com sua própria sequência de pressionamentos de botão.
Isso permitiu que o sistema fosse testado tanto em uma versão detalhada quanto em uma versão ‘reduzida’ do desafio de roteamento:

Duas versões do menu de telefone foram fornecidas à IA: uma hierarquia de texto detalhada e uma lista simplificada de opções de menu diretas, para comparar como cada formato apoiava o roteamento de chamadores para o local correto.
Para criar as mensagens de chamador necessárias para os testes, um segundo modelo de linguagem foi usado para produzir um conjunto de reclamações ou solicitações originais, com 10 exemplos únicos feitos para cada ponto final do menu.
Cada um desses foi então expandido em várias versões reescritas, para imitar a gama de maneiras pelas quais chamadores reais poderiam expressar seus problemas, e introduziu mudanças de comprimento, tom e até mesmo erros menores ou ‘palavras de preenchimento’.
As 920 mensagens de chamador geradas no início foram projetadas para testar a precisão do sistema e simular a imprevisibilidade do discurso do mundo real.
A terceira etapa testou quão precisamente o modelo final poderia mapear cada mensagem de chamador para o destino de menu correto, com base nas duas maneiras diferentes de apresentar o sistema IVR (veja imagem acima).
Na primeira versão, a IA foi dada uma descrição completa e descritiva da árvore de telefone, com cada ramo e sub-opção dispostos em forma de texto. Na segunda, ela viu apenas uma lista de destinos finais, cada um vinculado a uma sequência de botões.
O objetivo era ver se uma versão reduzida do menu tornaria mais fácil para o modelo decidir para onde cada chamada deveria ir. Em ambos os casos, o sistema recebeu uma mensagem de cada vez e foi solicitado a retornar apenas o caminho, sem palavras ou explicações adicionais, para facilitar a pontuação automática.
Isolamento
Para evitar contaminar os resultados dos testes, o experimento manteve cada modelo isolado dos outros: o menu de telefone foi elaborado pelo primeiro modelo, mas então finalizado manualmente, para que permanecesse desconhecido para os outros sistemas.
As mensagens de chamador foram então geradas separadamente por gpt-4o-mini, usando apenas os nomes dos pontos finais, e sem acesso à estrutura do menu. Finalmente, gpt-4.1-mini, que lidou com o roteamento, viu apenas o texto do menu e as mensagens de entrada, e não teve envolvimento na criação de nenhum.
Métricas
Para medir como bem o sistema de roteamento se saiu, duas métricas padrão foram usadas: precisão foi definida como o percentual de casos em que o modelo retornou o caminho exatamente correto (como 1‑2‑3). Para isolar a localização dos erros, matrizes de confusão também foram geradas*, mostrando quão frequentemente cada caminho foi confundido com outros. As avaliações foram executadas em Python usando as bibliotecas pandas e scikit-learn.
Resultados
Nos testes, a precisão do modelo dependeu fortemente de como o menu de telefone foi apresentado: quando dado a lista achatada de caminhos de menu, o sistema atingiu 89,13% de precisão no conjunto de dados mais simples, em comparação com 81,30% quando usando a versão descritiva completa do menu:

Precisão de roteamento para o terceiro modelo (LLM3), em diferentes formatos de prompt e tipos de conjunto de dados, indicando que caminhos de menu achatados consistentemente superaram descrições hierárquicas, e que a precisão declinou ligeiramente quando as entradas foram aumentadas com linguagem parafraseada ou informal.
Esse padrão se manteve para o conjunto de dados maior e mais variado linguisticamente, onde a versão achatada novamente se saiu melhor, marcando 86,52% contra 77,07% para o formato descritivo.
Esses resultados, observa o artigo, sugerem que prompts baseados em lista mais simples ajudaram o modelo a corresponder consultas de forma mais confiável do que descrições hierárquicas longas.
A precisão também caiu ligeiramente quando versões parafraseadas e informais de mensagens de chamador foram introduzidas, indicando que uma variedade maior melhorou a realidade, mas também tornou a classificação mais difícil.
O artigo conclui:
‘Nossos resultados mostram que LLMs roteiam intenções com mais precisão quando dadas caminhos IVR achatados (até 89,13) do que descrições de menu verbosas (tão baixas quanto 77,07%), sugerindo que prompts concisos e estruturados reduzem o ruído e se alinham melhor com a tarefa de roteamento.
‘Isso apoia o princípio de que clareza e concisão melhoram o desempenho de LLM em configurações de classificação.
‘Importante, transformar menus em caminhos achatados é um processo simples e automatizável para uso no mundo real.’
Conclusão
É refrescante ver pelo menos algum trabalho aberto ocorrendo em uma das vertentes de pesquisa mais fechadas e exclusivas da literatura. O que resta a ser visto é se ‘arquiteturas de enquadramento’ que contextualizam LLMs serão necessárias no futuro, ou se o modelo precisará apenas acessar inteligência de negócios (localmente disponível), obviando a necessidade de a empresa compartilhar dados com provedores terceirizados.
Em última análise, os princípios de design mais amplos em funcionamento aqui parecem prováveis de serem adotados naturalmente por futuros sistemas de IA, mesmo em domínios além do serviço ao cliente, sem exigir alinhamento deliberado com esse uso.
* Por favor, consulte o artigo de origem para esses.
Publicado pela primeira vez na quarta-feira, 29 de outubro de 2025










