Bloco 1 — Estratégia e Governança

01 — DIAGNÓSTICO

O problema não é falta de dados.
É falta de ação autônoma sobre eles.

A Quantum possui os dados — estoque, histórico, políticas. O que falta é a capacidade de agir sobre eles sem intervenção humana em cada passo. Essa é a real natureza do desafio.

O "muro da escalabilidade operacional" é o sintoma. A causa é estrutural: cada função opera em silo e o custo marginal de atendimento cresce de forma linear com o volume. Chatbots de FAQ e filtros de busca não quebram essa linearidade — apenas a adiam.

Estado atual

Arquitetura reativa

Sistemas que respondem quando perguntados. Informação fragmentada, interpretação inconsistente, zero execução autônoma.

Estado-alvo

Arquitetura agêntica

Sistemas que executam processos de ponta a ponta com autonomia supervisionada. O custo deixa de crescer com o volume.

↓ A TRANSFORMAÇÃO É ESSA TRANSIÇÃO ↓

"Transformar a plataforma em uma entidade agêntica, onde a IA não apenas responda, mas execute processos complexos de ponta a ponta." — desafio da diretoria

02 — MAPEAMENTO DE GARGALOS

Cinco gargalos, ranqueados por impacto × viabilidade

Os três primeiros concentram o investimento inicial. Toque em cada linha para ver o detalhe.

Suporte ao cliente fragmentado

toque para expandir

O estoque não "fala" com o suporte em tempo real e as políticas de devolução são interpretadas de forma inconsistente por humanos. É o gargalo com maior custo recorrente e maior dor de marca.

Prioridade alta

Abandono de carrinho sem contexto

toque para expandir

A recomendação não considera contexto emocional nem histórico profundo do cliente. Num catálogo de 5M de SKUs, o abandono raramente é só preço — é fricção cognitiva: o cliente não encontra, não confia, ou não recebe o empurrão certo.

Prioridade alta

Logística de última milha reativa

toque para expandir

A gestão logística não antecipa rupturas nem reroteia proativamente. Em 12 países, cada falha de previsão vira custo de SLA, reenvio e atrito — que contamina diretamente o suporte.

Prioridade alta

Personalização por RPA e scripts

toque para expandir

Campanhas baseadas em regras fixas não escalam para 12 mercados com nuances culturais. Alto custo de manutenção, baixo retorno incremental.

Prioridade média

Conhecimento operacional não-codificado

toque para expandir

Políticas, exceções e "jeitinhos" vivem na cabeça de pessoas. Sem isso estruturado, nenhum agente é confiável. É um gargalo habilitador — precisa ser endereçado em paralelo, não depois.

Habilitador

Cadeia causal O gargalo 3 alimenta o 1 — falha logística vira atrito de suporte. E o gargalo 5 bloqueia todos os demais. Isso não é só um ranking: é o que define o sequenciamento do roadmap. A fundação vem primeiro.

03 — AI STRATEGY CANVAS

Nove blocos, uma página, um norte

O quadro que sintetiza a estratégia e abre a conversa com a diretoria.

Visão / Norte

Tornar-se uma entidade agêntica de varejo — IA que executa processos ponta a ponta. Métrica-síntese: fricção zero.

Casos de uso prioritários

(1) Agente de suporte resolutivo · (2) Recomendação contextual · (3) Orquestração logística.

Dados

O ativo já existe. O gargalo está na unificação e governança, não na coleta. Necessário: camada semântica única.

Capacidades técnicas

RAG sobre base unificada, orquestração multi-agente, tool calling sobre sistemas legados, observabilidade.

Pessoas e talento

AI Engineers como arquitetos. Times de suporte e logística migram para supervisores de agentes.

Governança e risco

Guardrails por nível de impacto, human-in-the-loop nas ações de alto risco, trilha de auditoria completa.

Modelo operacional

De operador de tarefa para gestor de exceção. O humano sai do fluxo e entra no loop de supervisão.

Métricas de valor

Custo por atendimento, tempo de resolução, conversão pós-recomendação, autonomy rate.

Infraestrutura e parcerias

Modelos fundacionais, infraestrutura de orquestração, plataforma de observabilidade de LLM.

04 — FRAMEWORK DE ADOÇÃO

Quatro ondas. Cada uma conquista a próxima.

O princípio que sustenta o framework: autonomia se conquista com evidência, não se concede por decreto. Cada onda tem um gate de métrica que autoriza a seguinte.

ONDA 0

Fundação

Habilitador · roda em paralelo

Unificação da camada de conhecimento: políticas de devolução, regras de estoque e exceções operacionais codificadas e versionadas. Sem isso, nenhum agente é confiável.

Gate: base semântica única + governança de dados ativa

ONDA 1

Copiloto

Humano no fluxo

O agente de suporte sugere respostas ao atendente humano, consultando estoque e políticas em tempo real. O humano ainda decide. Objetivo: provar acurácia e ganhar confiança institucional.

Gate: acurácia da sugestão acima do limiar

ONDA 2

Agente supervisionado

Human-in-the-loop

O agente passa a executar resoluções de baixo risco sozinho e escala apenas exceções. Em paralelo entra a recomendação contextual. Ações de alto impacto ainda exigem aprovação humana.

Gate: confiança comprovada na Onda 1

ONDA 3

Orquestração agêntica

Autonomia ponta a ponta

Múltiplos agentes colaboram: o agente logístico detecta risco de ruptura, reroteia e notifica o agente de suporte, que comunica o cliente antes da reclamação. A Quantum vira, de fato, a entidade agêntica.

Gate: autonomy rate no alvo definido com a diretoria

Detalhamento · Onda 1

Copiloto — o plano de execução

A onda mais importante de acertar: é ela que constrói — ou destrói — a confiança institucional no resto do programa.

O que é e por que ela existe

A Onda 1 coloca um agente de IA ao lado do atendente humano, não no lugar dele. O agente lê o ticket, consulta estoque e políticas em tempo real, e sugere a resposta ou a ação. O humano revisa, ajusta se preciso, e envia. Toda decisão final continua sendo humana.

Parece pouco ambicioso — e é proposital. A Onda 1 não está resolvendo o problema de custo ainda; ela resolve um problema anterior e mais perigoso: a organização não confia na IA para agir sozinha, e com razão, porque ninguém ainda mediu se ela acerta. A Onda 1 é o experimento controlado que gera essa evidência — barata de errar, porque o humano filtra, e cada interação vira um dado sobre acurácia.

O problema específico que ela ataca

Direto no Gargalo 1: o estoque não fala com o suporte em tempo real e as políticas de devolução são interpretadas de forma inconsistente. Na Onda 1 o copiloto não conserta a fonte dos dados — ele faz a ponte. Ao abrir um ticket de devolução, o agente já traz status do pedido, política aplicável àquele SKU/país/data e uma resposta sugerida coerente. O atendente para de garimpar em cinco sistemas e passa a validar uma proposta.

Arquitetura mínima

Base de conhecimento (RAG)

As políticas unificadas da Onda 0, indexadas e recuperáveis. Sem isso, o copiloto alucina política — e alucinar política destrói confiança.

Conectores de leitura

Tool calling somente-leitura para pedido e estoque. O agente lê tudo e escreve nada — elimina a categoria de risco "ação errada".

Camada de sugestão

O agente compõe a resposta e a entrega dentro da ferramenta que o atendente já usa, sem trocar de tela.

Captura de feedback

Aceite, edição ou descarte de cada sugestão é registrado. Esse log é o produto mais valioso da onda.

A métrica-gate

A Onda 1 só autoriza a Onda 2 quando a acurácia da sugestão passa de um limiar definido com a diretoria. Três coisas a instrumentar:

Aceitação sem edição

De quantas sugestões o atendente envia como vieram. É o sinal mais forte de que o agente acertou sozinho.

Edição leve × descarte

Sugestão editada levemente ainda indica um agente útil; descartada indica que ele errou o alvo. A proporção mostra se está perto ou longe.

Acurácia em compliance

Separado e mais rígido. Política de devolução, reembolso e regras exigem acurácia quase absoluta — erro aqui vira risco jurídico em 12 jurisdições.

O princípio para a diretoria: o gate não é "a IA é boa o suficiente", é "a IA erra de forma rara e previsível o bastante para que, na Onda 2, a gente saiba exatamente quais casos ela pode assumir."

Quem faz o quê

AI Engineer

Arquiteta o RAG, os conectores e a camada de sugestão, e instrumenta a captura de feedback.

Time de suporte

Muda de papel já aqui: além de atender, está treinando e avaliando o agente a cada aceite ou descarte. Vale nomear isso — não é vigilância, é o mecanismo que torna o trabalho deles menos repetitivo nas próximas ondas.

Diretoria

Define o limiar do gate e o período de observação antes da decisão de avançar.

Riscos próprios da Onda 1

Excesso de confiança do atendente

Se o copiloto for bom, o atendente para de revisar e só clica "aceitar" — perde-se o filtro humano e contamina-se a métrica. Mitigação: amostragem de auditoria independente.

A Onda 0 não estava pronta

Base incompleta faz o copiloto sugerir com confiança coisas erradas. A Onda 1 só começa com uma fatia da base já confiável — comece pelos casos de devolução mais comuns, não pelo catálogo inteiro.

Medir vaidade em vez de verdade

Aceitação alta pode significar "agente ótimo" ou "atendente não está olhando". A auditoria independente é o que separa os dois.

A Onda 1 é a onda em que a IA não economiza dinheiro ainda — ela ganha o direito de economizar dinheiro depois.

05 — GOVERNANÇA

O que protege a transformação

Três pilares que precisam existir desde a Onda 0 — não depois.

◆

Guardrails e níveis de autonomia

Ações classificadas por impacto: informacional → transacional baixo → transacional alto → irreversível. Cada nível define quem aprova. A IA nunca decide sozinha algo irreversível.

⊕

Human-in-the-loop estruturado

Não é "humano revisa tudo" (não escala) nem "humano revisa nada" (não é seguro). É o humano revisando exceções e amostras, com o sistema aprendendo das correções.

▤

Observabilidade e auditoria

Toda decisão de agente precisa ser rastreável: o que consultou, o que decidiu, com que confiança. Requisito de compliance em 12 jurisdições e base para melhorar o sistema.

Síntese para a diretoria

A Quantum tem os dados e tem a urgência. O que falta é a camada de ação autônoma governada. O caminho não é um grande projeto de IA — é uma sequência de quatro ondas, onde cada uma entrega valor mensurável e conquista o direito de avançar. O papel do AI Engineer é ser o arquiteto dessa progressão.

O problema não é falta de dados.É falta de ação autônoma sobre eles.

Estado atual

Estado-alvo

Cinco gargalos, ranqueados por impacto × viabilidade

Nove blocos, uma página, um norte

Casos de uso prioritários

Dados

Capacidades técnicas

Pessoas e talento

Governança e risco

Modelo operacional

Métricas de valor

Infraestrutura e parcerias

Quatro ondas. Cada uma conquista a próxima.

Copiloto — o plano de execução

O que é e por que ela existe

O problema específico que ela ataca

Arquitetura mínima

A métrica-gate

Quem faz o quê

Riscos próprios da Onda 1

O que protege a transformação

Guardrails e níveis de autonomia

Human-in-the-loop estruturado

Observabilidade e auditoria

O problema não é falta de dados.
É falta de ação autônoma sobre eles.