Integração por Sitemap
Last updated
Last updated
Com a funcionalidade de Sitemap do EvaGPT, você pode facilmente importar informações de um site para uma lista de conhecimento específica, fornecendo simplesmente a URL do site. Essa funcionalidade também resume automaticamente páginas longas usando IA, tornando mais fácil para você acessar as informações mais importantes do seu agente, caso estejam incorporadas no seu site, no Slack ou no Discord.
Para integrar a funcionalidade de Sitemap do EvaGPT à sua lista de conhecimento, siga estes simples passos:
1. Na barra lateral, navegue até "Criar Integração" no EvaGPT e clique em "Website".
2. Digite um nome e uma descrição opcional para esta integração.
3. Selecione a lista de conhecimento na qual deseja importar informações.
4. Digite a URL do site.
5. Salve a integração clicando no botão "Salvar".
Imagem 1: menu de criação da integração de sitemap
Existem algumas opções avançadas que precisam ser consideradas. Você pode encontrar essas informações em "Configurações Avançadas" (imagem 2).
Imagem 2: configurações avançadas na criação da integração de sitemap
Glob - a integração de sitemap utiliza um padrão Glob. Utilize um /* no caminho de url desejado para extrair os conteúdos da página representada pela url. Se utilizar um /**, a integração extrairá todos os arquivos existentes a partir do caminho especificado na url.
Seletores - você pode limitar o importador a áreas específicas do seu site fornecendo uma lista de seletores CSS. Os principais seletores costumam ser article
, main
e body
.
Javascript - se você ativar essa funcionalidade, o importador usará um navegador completo para rastrear o conteúdo do seu site. Essa funcionalidade é particularmente útil para importar sites complexos com muito conteúdo dinâmico e scripts.
Agendar sincronização - com que frequência o sistema vai validar as urls obtidas a partir da varredura feita no site informado.
Validade do conhecimento - você pode usar essa configuração para expirar automaticamente registros antigos. Isso é útil no caso de você ter um site muito dinâmico com muitas mudanças. Usando essa funcionalidade, registros mais antigos serão removidos e substituídos por registros mais novos, garantindo melhor consistência de dados.
Depois que a integração do Sitemap for criada, o EvaGPT importará automaticamente as informações do site para a lista de conhecimento selecionada, processo que pode levar de 3 a 15 minutos, dependendo da complexidade do site e opções selecionadas.
Para acessar as informações importadas do site, basta navegar até a lista de conhecimento selecionada no Passo 3. Todas as informações importadas estarão disponíveis lá, incluindo quaisquer páginas resumidas. Você pode então usar essas informações para treinar seu agente ou para qualquer outro propósito.
Observe que existem algumas limitações na funcionalidade de Sitemap. Atualmente, um rastreamento é limitado a um máximo de 15 minutos e o número máximo de URLs que podem ser rastreadas é de 1000. Se você precisar rastrear mais de 1000 URLs ou precisar de um tempo de rastreamento mais longo, entre em contato com nossa equipe de suporte ao cliente para obter conselhos sobre como criar uma solução personalizada.
Um "padrão glob" é uma maneira de procurar por coisas (geralmente arquivos) usando letras e símbolos especiais. Imagine que você está procurando arquivos em seu computador, e você quer encontrar todos os arquivos que têm a palavra "foto" em seus nomes.
Se você usar um asterisco (*) como um padrão glob, como "foto", ele vai encontrar todos os arquivos que começam com "foto" e podem ter qualquer coisa depois, como "foto1.jpg", "foto_verão.png" e assim por diante.
Se você usar um ponto de interrogação (?) como um padrão glob, como "foto?", ele vai encontrar arquivos que têm "foto" no início, mas depois tem apenas um caractere, como "foto1.jpg" ou "fotoA.png".
Basicamente, é uma maneira de procurar por coisas em um computador ou servidor usando pedaços de texto com algumas partes desconhecidas. Isso pode ser útil quando você precisa verificar muitos arquivos ou informações com base em um padrão comum em seus nomes, como arquivos de um site em um servidor, por exemplo.
Quer ver essa integração sendo posta em prática? .