Base de Conhecimento

A Base de Conhecimento permite que seu agente de IA responda com informações específicas do seu negócio — produtos, políticas, FAQs e mais. Usando a técnica de RAG (Retrieval-Augmented Generation), o agente busca automaticamente os trechos mais relevantes para cada pergunta.

Como funciona (RAG)

Quando um contato envia uma mensagem para o agente:

A pergunta é convertida em um vetor numérico (embedding)
O sistema busca os trechos mais similares na base de conhecimento
Os trechos relevantes (até 8) são injetados no prompt do agente
O modelo de IA gera a resposta com base nesses trechos + system prompt

Apenas trechos com similaridade acima de 70% são incluídos, garantindo respostas precisas e contextualizadas.

Tipos de fonte

🔗

URLs

Adicione URLs de páginas web, documentação ou blogs. O CloudWhats extrai automaticamente o texto da página, removendo menus, scripts e elementos visuais.

Suporta HTML, PDF e texto puro hospedados em URLs
Cache de 30 minutos durante processamento
Timeout de 10 segundos por página
Detecção de mudanças via hash de conteúdo

📄

Arquivos

Faça upload de documentos para alimentar a base de conhecimento.

PDF — documentos, manuais, catálogos
TXT — texto puro, FAQs
Markdown (.md) — documentação formatada
Tamanho máximo: 10 MB por arquivo

Processamento da base

Após adicionar uma fonte, o CloudWhats processa o conteúdo automaticamente:

Extração — o texto é extraído do arquivo ou URL
Chunking — o texto é dividido em trechos de ~1.000 tokens com sobreposição de ~200 tokens
Embedding — cada trecho é convertido em um vetor de 768 dimensões
Armazenamento — os vetores são salvos no banco via pgvector para busca eficiente

O processamento é feito em segundo plano e pode levar alguns segundos a minutos dependendo do tamanho do conteúdo. Acompanhe o status na aba de conhecimento do agente.

Status das fontes

Status	Descrição
Pendente	Fonte adicionada, aguardando processamento
Processando	Extração, chunking e embedding em andamento
Pronto	Disponível para busca RAG nas conversas
Erro	Falha no processamento (até 3 tentativas automáticas)
Desatualizado	Conteúdo da URL mudou — necessita reprocessamento

Boas práticas

Conteúdo estruturado — use cabeçalhos, listas e parágrafos bem definidos. Isso ajuda o chunking a criar trechos coerentes.
Informações atualizadas — mantenha as URLs e arquivos atualizados. Remova fontes obsoletas.
Evite redundância — não adicione o mesmo conteúdo em múltiplas fontes, pois os resultados de busca podem ficar duplicados.
Teste com perguntas reais — use o Preview do agente para verificar se o conhecimento está sendo encontrado corretamente.
Qualidade sobre quantidade — prefira menos fontes com conteúdo relevante a muitas fontes com informação genérica.

O agente só utiliza a base de conhecimento quando a pergunta do contato tem similaridade com os trechos armazenados. Informações muito genéricas podem não ser recuperadas. Seja específico no conteúdo.

Gerenciamento

Na tela de edição do agente, a aba de conhecimento permite:

Adicionar e remover URLs
Fazer upload e excluir arquivos
Acompanhar o status de cada fonte (pendente, processando, pronto, erro)
Ver a quantidade de chunks e tokens por fonte
Forçar reprocessamento de fontes desatualizadas