Modelos
A EvaGPT oferece suporte para que você utilize diferentes modelos de IA, dependendo de suas necessidades, para criar experiências envolventes através de agentes de IA conversacional. Isso inclui modelos da OpenAI, como GPT-4 e GPT-3, juntamente com modelos da Anthropic, Mistral, DeepSeek, Perplexity, Meta e Google.
Tabela de Modelos Disponíveis
| Nome do modelo | Descrição curta | Proporção de tokens | Tamanho do contexto |
|---|---|---|---|
| gpt-5.2 | O GPT-5.2 é o membro rápido e leve da família 5.2, otimizado para conversas rápidas, enquanto mantém forte inteligência geral. | 0.7778 | 400.000 |
| gpt-5.1 | Oferece raciocínio mais forte, melhor adesão às instruções e um estilo conversacional mais natural. | 0.5556 | 400.000 |
| gpt-5 | GPT-5 é um modelo de linguagem de nova geração com recursos de raciocínio e desempenho aprimorado em todos os domínios. | 0.5556 | 400.000 |
| gpt-5-Mini | Versão econômica do GPT-5, oferecendo excelente desempenho para a maioria das tarefas. | 0.1111 | 400.000 |
| gpt-5-Nano | O modelo mais leve e rápido da família GPT-5, otimizado para tarefas simples. | 0.0222 | 400.000 |
| gpt-4.5 | Destaca-se em tarefas que se beneficiam do pensamento e da conversa criativos e abertos. | 8.3333 | 128.000 |
| gpt-4o-mini | Modelo mais eficiente em termos de custo da OpenAI. Contexto de 128K. | 0.033 | 128.000 |
| gpt-4o | Mais rápido e mais barato que o GPT-4 Turbo, com capacidades de visão robustas. | 0.5556 | 128.000 |
| gpt-4-turbo | Modelo avançado em desempenho e precisão, com respostas mais rápidas. | 1.6667 | 128.000 |
| gpt-4 | Modelo de inteligência conversacional de última geração. | 3.3333 | 8.192 |
| gpt-3.5-turbo | Modelo rápido e econômico para tarefas mais simples. | 0.0833 | 16.384 |
| gpt-4.1 | Modelo principal da OpenAI para tarefas complexas. | 0.4444 | 1.047.576 |
| gpt-4.1-mini | Equilíbrio entre inteligência, velocidade e custo. | 0.0889 | 1.047.576 |
| gpt-4.1-nano | Modelo gpt-4.1 mais rápido e econômico. | 0.0222 | 1.047.576 |
| o3 | Modelo versátil e poderoso, destaque em matemática, ciência, programação e raciocínio visual. | 0.4444 | 200.000 |
| o4-mini | Otimizado para raciocínio rápido e eficaz. | 0.2444 | 200.000 |
| o1 | Modelo de raciocínio com 128K tokens de contexto. Atenção: temperatura deve ser mantida em 1. | 3.3333 | 128.000 |
| o3-mini | Modelo de raciocínio econômico, otimizado para codificação, matemática e ciências. | 0.2444 | 200.000 |
| mistral-large-latest | Raciocínio de alto nível para tarefas de alta complexidade. | 0.6667 | 32.000 |
| mistral-small-latest | Raciocínio econômico para cargas de trabalho de baixa latência. | 0.1667 | 32.000 |
| claude-4.6-sonnet | Alto desempenho em programação, agentes e automação de fluxos de trabalho. | 0.8333 | 1.000.000 |
| Claude Opus 4.6 | Eficiente para programação e tarefas profissionais de longa duração. | 1.3889 | 1.000.000 |
| Claude Opus 4.5 | Otimizado para engenharia de software complexa e fluxos de trabalho agentivos. | 1.3889 | 200.000 |
| Claude Sonnet 4.5 | Modelo avançado ajustado para agentes e programação de longa duração. | 0.8333 | 1.000.000 |
| Claude 3.7 Sonnet | Modelo com capacidades aprimoradas de raciocínio, programação e resolução de problemas. | 0.8333 | 200.000 |
| Claude Haiku 4.5 | Modelo rápido e eficiente da Anthropic. | 0.2778 | 200.000 |
| deepseek-r1-distill-llama-70b | Raciocínio de alto nível com avanço significativo na velocidade de processamento. | 0.055 | 128.000 |
| deepseek-chat-v3-0324 | Modelo baseado em mixture-of-experts com excelente desempenho em diversas tarefas. | 0.0489 | 164.000 |
| llama-3.3-70b-versatile | Desenvolvido pela Meta, otimizado para tarefas com grandes volumes de dados. | 0.0439 | 128.000 |
| sonar | Opção leve com fundamentação por busca em tempo real na internet. | 0.0556 | 128.000 |
| sonar-pro | Opção premium com fundamentação por busca em tempo real na internet. | 0.8333 | 128.000 |
| sonar-deep-research | Realiza pesquisas em tempo real na internet de nível especializado. | 0.4444 | 128.000 |
| sonar-reasoning | Opção premium com tecnologia DeepSeek R1 e Chain of Thought (CoT). | 0.2778 | 128.000 |
| sonar-reasoning-pro | Modelo de primeira linha com fundamentação avançada por busca e DeepSeek R1. | 0.4444 | 128.000 |
| gemini-3.1-pro | Raciocínio multimodal de alta precisão em texto, imagem, vídeo, áudio e código. | 0.6667 | 1.048.576 |
| gemini-3-flash | Modelo de raciocínio de alta velocidade para fluxos de trabalho agentivos. | 0.1667 | 1.048.576 |
| gemini-2.5-flash | Modelo multimodal capaz e de baixo custo. | 0.1944 | 1.048.576 |
| gemini-2.5-pro | Modelo multimodal de alta capacidade construído para a era dos Agentes. | 0.8333 | 1.048.576 |
| gemini-2.0-flash | Modelo multimodal com excelente desempenho e janela de contexto de 1 milhão de tokens. | 0.0222 | 1.048.576 |
| gemini-1.5-flash | Modelo rápido com excelente desempenho para tarefas diversas e repetitivas. | 0.0167 | 1.048.576 |
| gemini-1.5-pro | Modelo de maior inteligência da série Gemini 1.5, com janela de contexto de 2 milhões de tokens. | 0.2778 | 2.097.152 |
| gpt-image-1 | Modelo de geração de imagens multimodal. | 2.2222 | — |
| gpt-image-1-mini | Versão compacta do modelo de geração de imagens. | 0.4444 | — |
| dalle3 | Modelo de alta qualidade para geração de imagens a partir de texto. | 1 | — |
| dalle2 | Modelo baseado na arquitetura DALL-E 2. | 1 | — |
| stablediffusion | Modelo baseado em Stable Diffusion para geração de imagens. | 1 | — |
| personalizado | Quando se utiliza uma chave de API externa para qualquer modelo selecionado. | 0.0028 | — |
Escolha o modelo apropriado dependendo do seu caso de uso específico e desempenho desejado.
Personalização das Configurações do Modelo
Para personalizar as configurações de um modelo, dentro do ambiente de criar Agente ou editar Agente, clique em configurações avançadas, escolha o modelo e personalize suas propriedades.
Existem quatro propriedades principais que podem ser personalizadas:
Número Máximo de Tokens
Esta propriedade determina o número máximo de tokens que o modelo pode consumir ao gerar uma resposta. Por padrão, isso é definido como o tamanho máximo do contexto para o modelo, mas você pode reduzi-lo para limitar a quantidade de recursos usados pelo modelo.
Temperatura
Esta propriedade determina o nível de aleatoriedade ou criatividade nas respostas do modelo. Um valor de temperatura mais alto resultará em respostas mais diversas e criativas, enquanto um valor mais baixo resultará em respostas mais conservadoras e previsíveis.
Penalidade de Frequência
Esta propriedade determina o quanto o modelo aceita a repetição de certas palavras ou frases em suas respostas. Um valor de penalidade de frequência mais alto resultará em respostas mais variadas e menos repetitivas.
Penalidade de Presença
Esta propriedade determina o quanto o modelo aceita o uso de certas palavras ou frases em suas respostas. Um valor de penalidade de presença mais alto resultará em respostas menos propensas a conter palavras ou frases específicas.
:::tip Recomendação Ao personalizar essas propriedades, é recomendável experimentar e testar diferentes configurações para encontrar o melhor equilíbrio entre desempenho e criatividade. :::