O Detector de Plágio não é uma caixa negra. O seu motor de deteção foi inscrito no principal benchmark científico da área — a competição PAN — e avaliado por organizadores académicos independentes em nove avaliações internacionais. O historial completo encontra-se abaixo; cada resultado inclui uma ligação à sua fonte oficial.
| Ano | Competição | Local | Tarefa | Classificação | Pontuação | Fonte |
|---|---|---|---|---|---|---|
| 2009 | 1.ª Competição Internacional sobre Deteção de Plágio | PAN @ SEPLN · San Sebastián | Deteção externa | 4 / 10 | 0.3045 | visão geral |
| 2010 | 2.ª Competição Internacional sobre Deteção de Plágio | PAN @ CLEF · Padua | Deteção externa | 8 / 18 | 0.5093 | visão geral · artigo |
| 2011 | 3.ª Competição Internacional sobre Deteção de Plágio | PAN @ CLEF · Amsterdam | Externo (experiência com WordNet) | 7 / 9 | 0.19 | visão geral · artigo |
| 2011 | CL!TR — Cross-Language Indian Text Re-Use | PAN@FIRE · IIT Bombay, Mumbai | Reutilização hindi↔inglês | 4 (melhor execução) | F 0.603 | tabela de classificação · visão geral |
| 2012 | 4.ª Competição Internacional sobre Deteção de Plágio | PAN @ CLEF · Rome | Alinhamento de texto | 6 / 10 | 0.538 | visão geral · artigo |
| 2012 | CL!NSS — Cross-Language Indian News Story Search 1ST | PAN@FIRE · ISI Kolkata | Reutilização jornalística (en→hi) | 1 / 3 | NDCG@10 0.34 | visão geral · artigo |
| 2013 | 5.ª Competição Internacional sobre Deteção de Plágio | PAN @ CLEF · Valencia | Alinhamento de texto | 6 / 9 | 0.61523 | visão geral · artigo |
| 2014 | 6.ª Competição Internacional sobre Deteção de Plágio 1ST* | PAN @ CLEF · Sheffield | Alinhamento de texto | 1 std · 3/10 | 0.868 | visão geral · artigo |
| 2026 | Voight-Kampff Generative AI Detection TOP AUC | PAN @ CLEF · Jena | Texto humano vs. IA | 3 / 34 | ROC-AUC 0.996 | tabela de classificação |
plagdet = pontuação global de deteção de plágio do PAN (precisão, cobertura e granularidade combinadas). NDCG@10 = qualidade do ranking. ROC-AUC = qualidade de classificação independente de limiar. *2014: 1.º no corpus de teste padrão, 3.º de 10 no corpus de ranking oficial. 2026: 3.º de 34 equipas; ROC-AUC mais alto de qualquer equipa ou baseline.
Cada competição documentou uma técnica que fundamenta o motor em produção. A investigação e o software pertencem à mesma linhagem — não são afirmações de marketing, mas métodos publicados e revistos por pares.
Deteção rápida de candidatos em passagens reutilizadas (PAN 2010, 2014).
Correspondência precisa de passagens fonte ↔ suspeitas com elevada precisão (PAN 2012–2014).
Métodos de WordNet e TF-IDF / tradução para paráfrases e reutilização entre línguas (PAN 2011; FIRE 2011–2012).
Distinção entre autoria humana e de máquina — ROC-AUC mais alto no PAN 2026.