Pular para o conteúdo principal

Modelos

A EvaGPT oferece suporte para que você utilize diferentes modelos de IA, dependendo de suas necessidades, para criar experiências envolventes através de agentes de IA conversacional. Isso inclui modelos da OpenAI, como GPT-4 e GPT-3, juntamente com modelos da Anthropic, Mistral, DeepSeek, Perplexity, Meta e Google.

Tabela de Modelos Disponíveis

Nome do modeloDescrição curtaProporção de tokensTamanho do contexto
gpt-5.2O GPT-5.2 é o membro rápido e leve da família 5.2, otimizado para conversas rápidas, enquanto mantém forte inteligência geral.0.7778400.000
gpt-5.1Oferece raciocínio mais forte, melhor adesão às instruções e um estilo conversacional mais natural.0.5556400.000
gpt-5GPT-5 é um modelo de linguagem de nova geração com recursos de raciocínio e desempenho aprimorado em todos os domínios.0.5556400.000
gpt-5-MiniVersão econômica do GPT-5, oferecendo excelente desempenho para a maioria das tarefas.0.1111400.000
gpt-5-NanoO modelo mais leve e rápido da família GPT-5, otimizado para tarefas simples.0.0222400.000
gpt-4.5Destaca-se em tarefas que se beneficiam do pensamento e da conversa criativos e abertos.8.3333128.000
gpt-4o-miniModelo mais eficiente em termos de custo da OpenAI. Contexto de 128K.0.033128.000
gpt-4oMais rápido e mais barato que o GPT-4 Turbo, com capacidades de visão robustas.0.5556128.000
gpt-4-turboModelo avançado em desempenho e precisão, com respostas mais rápidas.1.6667128.000
gpt-4Modelo de inteligência conversacional de última geração.3.33338.192
gpt-3.5-turboModelo rápido e econômico para tarefas mais simples.0.083316.384
gpt-4.1Modelo principal da OpenAI para tarefas complexas.0.44441.047.576
gpt-4.1-miniEquilíbrio entre inteligência, velocidade e custo.0.08891.047.576
gpt-4.1-nanoModelo gpt-4.1 mais rápido e econômico.0.02221.047.576
o3Modelo versátil e poderoso, destaque em matemática, ciência, programação e raciocínio visual.0.4444200.000
o4-miniOtimizado para raciocínio rápido e eficaz.0.2444200.000
o1Modelo de raciocínio com 128K tokens de contexto. Atenção: temperatura deve ser mantida em 1.3.3333128.000
o3-miniModelo de raciocínio econômico, otimizado para codificação, matemática e ciências.0.2444200.000
mistral-large-latestRaciocínio de alto nível para tarefas de alta complexidade.0.666732.000
mistral-small-latestRaciocínio econômico para cargas de trabalho de baixa latência.0.166732.000
claude-4.6-sonnetAlto desempenho em programação, agentes e automação de fluxos de trabalho.0.83331.000.000
Claude Opus 4.6Eficiente para programação e tarefas profissionais de longa duração.1.38891.000.000
Claude Opus 4.5Otimizado para engenharia de software complexa e fluxos de trabalho agentivos.1.3889200.000
Claude Sonnet 4.5Modelo avançado ajustado para agentes e programação de longa duração.0.83331.000.000
Claude 3.7 SonnetModelo com capacidades aprimoradas de raciocínio, programação e resolução de problemas.0.8333200.000
Claude Haiku 4.5Modelo rápido e eficiente da Anthropic.0.2778200.000
deepseek-r1-distill-llama-70bRaciocínio de alto nível com avanço significativo na velocidade de processamento.0.055128.000
deepseek-chat-v3-0324Modelo baseado em mixture-of-experts com excelente desempenho em diversas tarefas.0.0489164.000
llama-3.3-70b-versatileDesenvolvido pela Meta, otimizado para tarefas com grandes volumes de dados.0.0439128.000
sonarOpção leve com fundamentação por busca em tempo real na internet.0.0556128.000
sonar-proOpção premium com fundamentação por busca em tempo real na internet.0.8333128.000
sonar-deep-researchRealiza pesquisas em tempo real na internet de nível especializado.0.4444128.000
sonar-reasoningOpção premium com tecnologia DeepSeek R1 e Chain of Thought (CoT).0.2778128.000
sonar-reasoning-proModelo de primeira linha com fundamentação avançada por busca e DeepSeek R1.0.4444128.000
gemini-3.1-proRaciocínio multimodal de alta precisão em texto, imagem, vídeo, áudio e código.0.66671.048.576
gemini-3-flashModelo de raciocínio de alta velocidade para fluxos de trabalho agentivos.0.16671.048.576
gemini-2.5-flashModelo multimodal capaz e de baixo custo.0.19441.048.576
gemini-2.5-proModelo multimodal de alta capacidade construído para a era dos Agentes.0.83331.048.576
gemini-2.0-flashModelo multimodal com excelente desempenho e janela de contexto de 1 milhão de tokens.0.02221.048.576
gemini-1.5-flashModelo rápido com excelente desempenho para tarefas diversas e repetitivas.0.01671.048.576
gemini-1.5-proModelo de maior inteligência da série Gemini 1.5, com janela de contexto de 2 milhões de tokens.0.27782.097.152
gpt-image-1Modelo de geração de imagens multimodal.2.2222
gpt-image-1-miniVersão compacta do modelo de geração de imagens.0.4444
dalle3Modelo de alta qualidade para geração de imagens a partir de texto.1
dalle2Modelo baseado na arquitetura DALL-E 2.1
stablediffusionModelo baseado em Stable Diffusion para geração de imagens.1
personalizadoQuando se utiliza uma chave de API externa para qualquer modelo selecionado.0.0028

Escolha o modelo apropriado dependendo do seu caso de uso específico e desempenho desejado.

Personalização das Configurações do Modelo

Para personalizar as configurações de um modelo, dentro do ambiente de criar Agente ou editar Agente, clique em configurações avançadas, escolha o modelo e personalize suas propriedades.

Existem quatro propriedades principais que podem ser personalizadas:

Número Máximo de Tokens

Esta propriedade determina o número máximo de tokens que o modelo pode consumir ao gerar uma resposta. Por padrão, isso é definido como o tamanho máximo do contexto para o modelo, mas você pode reduzi-lo para limitar a quantidade de recursos usados pelo modelo.

Temperatura

Esta propriedade determina o nível de aleatoriedade ou criatividade nas respostas do modelo. Um valor de temperatura mais alto resultará em respostas mais diversas e criativas, enquanto um valor mais baixo resultará em respostas mais conservadoras e previsíveis.

Penalidade de Frequência

Esta propriedade determina o quanto o modelo aceita a repetição de certas palavras ou frases em suas respostas. Um valor de penalidade de frequência mais alto resultará em respostas mais variadas e menos repetitivas.

Penalidade de Presença

Esta propriedade determina o quanto o modelo aceita o uso de certas palavras ou frases em suas respostas. Um valor de penalidade de presença mais alto resultará em respostas menos propensas a conter palavras ou frases específicas.

:::tip Recomendação Ao personalizar essas propriedades, é recomendável experimentar e testar diferentes configurações para encontrar o melhor equilíbrio entre desempenho e criatividade. :::