Tag: benchmarking-de-software

  • APIEval-20

    APIEval-20

    Descrição da ferramenta: APIEval-20 é uma plataforma de benchmark para agentes de teste de APIs, que avalia a detecção de bugs, cobertura e eficiência com base em testes automatizados usando esquemas JSON e cargas úteis.

    Atributos:

    🛠️ Automatização: Gera testes automatizados a partir de esquemas JSON e amostras fornecidas.
    🎯 Acuracidade: Avalia a capacidade do agente em detectar bugs de forma objetiva, sem ambiguidades.
    🔍 Cobertura: Mede a abrangência dos testes realizados nos diferentes aspectos da API.
    ⚙️ Versatilidade: Testa múltiplos cenários, incluindo autenticação, erros, paginação e fluxos multi-step.
    🌐 Acesso aberto: Disponível na plataforma Hugging Face para uso público e colaborativo.

    Exemplos de uso:

    📝 Criar suites de teste automáticas: Gerar conjuntos de testes para APIs com base em esquemas JSON e payloads exemplo.
    🔧 Detecção de bugs em endpoints: Avaliar se o agente consegue identificar falhas específicas em APIs ao executar os testes.
    📊 Avaliação de cobertura: Medir a abrangência dos testes gerados pelo agente sobre diferentes funcionalidades da API.
    ⏱️ Análise de eficiência: Comparar o desempenho dos agentes na execução e detecção durante os testes.
    🔐 Avaliação de fluxos multi-step: Testar a capacidade do agente em validar sequências complexas envolvendo múltiplas etapas.