Перейти вгору
Наукові досягнення

Незалежно верифікований рекорд бенчмарку, 2009 – 2026

Детектор плагіату — не чорна скринька. Його рушій виявлення брав участь у головному науковому бенчмарку галузі — змаганні PAN — і оцінювався незалежними академічними організаторами в дев'яти міжнародних оцінюваннях. Повний рекорд наведено нижче; кожен результат посилається на офіційне джерело.

Коротко З 2009 по 2014 рік рушій брав участь у всіх шести щорічних міжнародних змаганнях PAN з виявлення плагіату та у двох міжмовних завданнях PAN@FIRE в Індії — перемігши у завданні англійська–гінді CL!NSS у 2012 році. У 2026 році та сама лінія взяла участь у завданні PAN Voight-Kampff Generative AI Detection і показала найвищий ROC-AUC (0.996) серед усіх систем в оцінюванні, посівши 3-тє місце серед 34 команд. Продукт безперервно постачається з 2007 року.
Повний рекорд змагань

Дев'ять оцінювань, кожен результат із джерелом

РікЗмаганняМайданчикЗавданняМісцеРезультатДжерело
20091-е Міжнародне змагання з виявлення плагіатуPAN @ SEPLN · San SebastiánЗовнішнє виявлення4 / 100.3045огляд
20102-е Міжнародне змагання з виявлення плагіатуPAN @ CLEF · PaduaЗовнішнє виявлення8 / 180.5093огляд · стаття
20113-є Міжнародне змагання з виявлення плагіатуPAN @ CLEF · AmsterdamЗовнішнє (експеримент з WordNet)7 / 90.19огляд · стаття
2011CL!TR — Cross-Language Indian Text Re-UsePAN@FIRE · IIT Bombay, MumbaiПовторне використання гінді↔англійська4 (найкращий запуск)F 0.603таблиця лідерів · огляд
20124-е Міжнародне змагання з виявлення плагіатуPAN @ CLEF · RomeВирівнювання тексту6 / 100.538огляд · стаття
2012CL!NSS — Cross-Language Indian News Story Search 1STPAN@FIRE · ISI KolkataЖурналістське повторне використання (en→hi)1 / 3NDCG@10 0.34огляд · стаття
20135-е Міжнародне змагання з виявлення плагіатуPAN @ CLEF · ValenciaВирівнювання тексту6 / 90.61523огляд · стаття
20146-е Міжнародне змагання з виявлення плагіату 1ST*PAN @ CLEF · SheffieldВирівнювання тексту1 std · 3/100.868огляд · стаття
2026Voight-Kampff Generative AI Detection TOP AUCPAN @ CLEF · JenaТекст людина проти ШІ3 / 34ROC-AUC 0.996таблиця лідерів

plagdet = загальний бал PAN з виявлення плагіату (точність, повнота та гранулярність разом). NDCG@10 = якість ранжування. ROC-AUC = якість класифікації незалежно від порогу. *2014: 1-ше місце на стандартному тестовому корпусі, 3-тє з 10 на офіційному корпусі ранжування. 2026: 3-тє з 34 команд; найвищий ROC-AUC серед будь-якої команди або базової лінії.

Від лабораторії до продукту

Методи, яким ви довіряєте

Кожне змагання задокументувало техніку, яка лежить в основі робочого рушія. Дослідження та програмне забезпечення — це одна лінія наступництва, а не маркетингові твердження, а опубліковані рецензовані методи.

N-gram фінгерпринтинг

Швидке виявлення кандидатів у повторно використаних уривках (PAN 2010, 2014).

Вирівнювання тексту

Точне зіставлення вихідних ↔ підозрілих уривків із високою точністю (PAN 2012–2014).

Семантична та міжмовна схожість

WordNet і TF-IDF / методи перекладу для парафразу та міжмовного повторного використання (PAN 2011; FIRE 2011–2012).

Виявлення тексту, згенерованого ШІ

Розрізнення авторства людини та машини — найвищий ROC-AUC на PAN 2026.

Рецензовані публікації

Бібліографія

  1. Developing a High-Resolution Universal Multi-Type N-Gram Plagiarism Detector. Palkovskii & Belov. PAN @ CLEF 2014 Working Notes. CEUR-WS Vol-1180 ↗
  2. Using Hybrid Similarity Methods for Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2013. CEUR-WS Vol-1179 ↗
  3. Applying Specific Clusterization & Fingerprint Density Distribution with a Genetic Algorithm. Palkovskii & Belov. PAN @ CLEF 2012. CEUR-WS Vol-1178 ↗
  4. Using a TF-IDF Weight Ranking Model in CL!NSS. Palkovskii & Belov. FIRE 2012, ISI Kolkata. FIRE working notes ↗
  5. Using WordNet-Based Semantic Similarity Measurement in External Plagiarism Detection. Palkovskii & Belov. PAN @ CLEF 2011. CEUR-WS Vol-1177 ↗
  6. Exploring Fingerprinting as an External Plagiarism Detection Method. Palkovskii & Belov. PAN @ CLEF 2010. CEUR-WS Vol-1176 ↗
  7. "Counter Plagiarism Detection Software" & "Counter-Counter Plagiarism Detection" Methods. Palkovskii. PAN'09. CEUR-WS Vol-502 ↗
Про автора
YP

Yurii Palkovskii

Дослідник і провідний розробник · Zhytomyr State University, Institute of Foreign Philology · SkyLine LLC

Автор семи рецензованих статей з виявлення плагіату та тексту, згенерованого ШІ, у матеріалах CLEF/CEUR-WS і FIRE, результати яких незалежно оцінювались організаційним комітетом PAN (Potthast, Stein, Rosso, Hagen та ін.).

Кожне місце та кожен результат на цій сторінці взяті з офіційного оглядового документа змагання або таблиці лідерів, посилання на яку наведено поруч — незалежно верифіковано без прив'язки до цього сайту. Продукт активно розробляється з 2007 року; поточна збірка #2965.