Pular para o conteúdo principal

Integração por Sitemap

Com a funcionalidade de Sitemap do EvaGPT, você pode facilmente importar informações de um site para uma lista de conhecimento específica, fornecendo simplesmente a URL do site. Essa funcionalidade também resume automaticamente páginas longas usando IA, tornando mais fácil para você acessar as informações mais importantes do seu agente, caso estejam incorporadas no seu site, no Slack ou no Discord.

Guia passo a passo

Para integrar a funcionalidade de Sitemap do EvaGPT à sua lista de conhecimento, siga estes passos:

  1. No menu lateral esquerdo da EvaGPT, navegue até "Integrações" e clique em "Criar Integração" e em "Website".
  2. Digite um nome e uma descrição opcional para esta integração.
  3. Selecione a lista de conhecimento na qual deseja importar informações.
  4. Digite a URL do site.
  5. Salve a integração clicando no botão "Salvar".

Existem algumas opções extras que precisam ser consideradas. Você pode encontrá-las em "Configurações Avançadas".

Configurações Avançadas

Glob

A integração de sitemap utiliza um padrão Glob. Utilize um /* no caminho de URL desejado para extrair os conteúdos da página representada pela URL. Se utilizar um /**, a integração extrairá todos os arquivos existentes a partir do caminho especificado na URL.

Um "padrão glob" é uma maneira de procurar por coisas (geralmente arquivos) usando letras e símbolos especiais. Por exemplo:

  • foto* — encontra todos os arquivos que começam com "foto" e podem ter qualquer coisa depois, como foto1.jpg ou foto_verão.png.
  • foto? — encontra arquivos que têm "foto" no início seguido de apenas um caractere, como foto1.jpg ou fotoA.png.

Basicamente, é uma maneira de procurar informações usando partes desconhecidas de texto, útil quando você precisa verificar muitos arquivos com base em um padrão comum em seus nomes.

Seletores

Você pode limitar o importador a áreas específicas do seu site fornecendo uma lista de seletores CSS. Os principais seletores costumam ser article, main e body.

Javascript

Se você ativar essa funcionalidade, o importador usará um navegador completo para rastrear o conteúdo do seu site. Essa funcionalidade é particularmente útil para importar sites complexos com muito conteúdo dinâmico e scripts.

Agendar sincronização

Define com que frequência o sistema vai validar as URLs obtidas a partir da varredura feita no site informado.

Validade do conhecimento

Você pode usar essa configuração para expirar automaticamente registros antigos. Isso é útil no caso de você ter um site muito dinâmico com muitas mudanças. Usando essa funcionalidade, registros mais antigos serão removidos e substituídos por registros mais novos, garantindo melhor consistência de dados.

Depois que a integração do Sitemap for criada, a EvaGPT importará automaticamente as informações do site para a lista de conhecimento selecionada, processo que pode levar de 3 a 15 minutos, dependendo da complexidade do site e das opções selecionadas.

Como acessar as informações importadas

Para acessar as informações importadas do site, basta navegar até a lista de conhecimento selecionada no Passo 3. Todas as informações importadas estarão disponíveis lá, incluindo quaisquer páginas resumidas. Você pode então usar essas informações para treinar seu agente ou para qualquer outro propósito.

Cuidados

Limitações

Atualmente, um rastreamento é limitado a um máximo de 15 minutos e o número máximo de URLs que podem ser rastreadas é de 1.000. Se você precisar rastrear mais de 1.000 URLs ou precisar de um tempo de rastreamento mais longo, entre em contato com nossa equipe de suporte ao cliente para obter uma solução personalizada.