A Base de Conhecimento permite que seu agente de IA responda com informações específicas do seu negócio — produtos, políticas, FAQs e mais. Usando a técnica de RAG (Retrieval-Augmented Generation), o agente busca automaticamente os trechos mais relevantes para cada pergunta.
Como funciona (RAG)
Quando um contato envia uma mensagem para o agente:
- A pergunta é convertida em um vetor numérico (embedding)
- O sistema busca os trechos mais similares na base de conhecimento
- Os trechos relevantes (até 8) são injetados no prompt do agente
- O modelo de IA gera a resposta com base nesses trechos + system prompt
Apenas trechos com similaridade acima de 70% são incluídos, garantindo respostas precisas e contextualizadas.
Tipos de fonte
URLs
Adicione URLs de páginas web, documentação ou blogs. O CloudWhats extrai automaticamente o texto da página, removendo menus, scripts e elementos visuais.
- Suporta HTML, PDF e texto puro hospedados em URLs
- Cache de 30 minutos durante processamento
- Timeout de 10 segundos por página
- Detecção de mudanças via hash de conteúdo
Arquivos
Faça upload de documentos para alimentar a base de conhecimento.
- PDF — documentos, manuais, catálogos
- TXT — texto puro, FAQs
- Markdown (.md) — documentação formatada
- Tamanho máximo: 10 MB por arquivo
Processamento da base
Após adicionar uma fonte, o CloudWhats processa o conteúdo automaticamente:
- Extração — o texto é extraído do arquivo ou URL
- Chunking — o texto é dividido em trechos de ~1.000 tokens com sobreposição de ~200 tokens
- Embedding — cada trecho é convertido em um vetor de 768 dimensões
- Armazenamento — os vetores são salvos no banco via pgvector para busca eficiente
Status das fontes
| Status | Descrição |
|---|---|
| Pendente | Fonte adicionada, aguardando processamento |
| Processando | Extração, chunking e embedding em andamento |
| Pronto | Disponível para busca RAG nas conversas |
| Erro | Falha no processamento (até 3 tentativas automáticas) |
| Desatualizado | Conteúdo da URL mudou — necessita reprocessamento |
Boas práticas
- Conteúdo estruturado — use cabeçalhos, listas e parágrafos bem definidos. Isso ajuda o chunking a criar trechos coerentes.
- Informações atualizadas — mantenha as URLs e arquivos atualizados. Remova fontes obsoletas.
- Evite redundância — não adicione o mesmo conteúdo em múltiplas fontes, pois os resultados de busca podem ficar duplicados.
- Teste com perguntas reais — use o Preview do agente para verificar se o conhecimento está sendo encontrado corretamente.
- Qualidade sobre quantidade — prefira menos fontes com conteúdo relevante a muitas fontes com informação genérica.
Gerenciamento
Na tela de edição do agente, a aba de conhecimento permite:
- Adicionar e remover URLs
- Fazer upload e excluir arquivos
- Acompanhar o status de cada fonte (pendente, processando, pronto, erro)
- Ver a quantidade de chunks e tokens por fonte
- Forçar reprocessamento de fontes desatualizadas