الكشف والتوليد محبوسان في سباق تطاردي. كل إصدار نموذج جديد يُضيّق الفجوة الإحصائية التي تعتمد عليها الكواشف — وكل تحسين في الكشف يُقابَل بأداة تأنيس جديدة. إليك ما يجري فعلًا تحت الغطاء.
كل كاشف لنصوص الذكاء الاصطناعي هو في نهاية المطاف مُميِّز إحصائي — ينظر إلى خصائص النص (احتمالات الرموز، والحيرة، والانفجارية، والانتظام النحوي) ويحاول إيجاد إشارات تُميّز المحتوى المُولَّد آليًا عن المحتوى المكتوب بشريًا. تستخدم طريقة Binoculars (ICML 2024) نسبة التقاطع في الحيرة بين نموذجين لغويين كإشارتها. يتعلم النهج الخاضع للإشراف ModernBERT الإشارة مباشرة من أمثلة مُوسومة.
يتشارك كلا النهجين ثغرة أساسية: الإشارات التي يعتمدان عليها هي آثار جانبية لطريقة توليد النماذج للنص، وليست خصائص أساسية للكتابة الآلية. مع تحسّن النماذج التوليدية، تتقلص تلك الآثار الجانبية. نموذج مُدرَّب للكتابة بأسلوب أشبه بالإنسان سيكون — بحكم التعريف — أصعب كشفًا.
هذه ليست إخفاقًا بحثيًا. إنها حقيقة هيكلية في طبيعة المشكلة. يعمل الكشف على هدف متحرك: كل إصدار رئيسي لـ LLM يُضيّق الفجوة، وكل أداة تأنيس تُدرَّب صراحةً ضد مخرجات الكاشف. السؤال ليس ‘هل يمكننا تحقيق 100% كشف للأبد’ — لا يمكن ذلك — بل ‘هل يمكننا البقاء متقدمين على الجيل الحالي لفترة كافية لأن نكون مفيدين عمليًا.’
ثلاثة اتجاهات في التوليد تُصعّب الكشف. الحجم: تُنتج النماذج الأكبر نصًا أكثر تنوعًا إحصائيًا لأنها تملك توزيعات داخلية أغنى. نموذج بـ70 مليار معامل له نطاق أوسع من المخرجات الشبيهة بالإنسان مقارنةً بنموذج بـ7 مليار معامل. الضبط بالتعليمات: تُعلّم RLHF والأساليب الدستورية النماذجَ تجنّب الأنماط المتكررة والمُتحفظة والمملة التي جعلت GPT-3 سهل الاكتشاف. درجة الحرارة والأخذ بالعينات: تحوّلت واجهات الدردشة نحو أخذ العينات النووية والعشوائية، مما يكسر بعض الأنماط منخفضة التباين التي استخدمتها الكواشف الكلاسيكية كمراسٍ.
GPT-5 وClaude 4.5 وGemini 2.5 أصعب بشكل ملحوظ في الكشف من أسلافها. يؤكد تحققنا الداخلي هذا: كل جيل من النماذج يُخفّض AUC لدينا على تلك العائلة بنسبة 5–10 نقاط مئوية مقارنةً بالجيل السابق. انظر معيار الدقة للحصول على أرقام كل نموذج.
أدوات التأنيس — Undetectable AI وStealthWriter وHumanbeing وقائمة متزايدة — هي الخصوم الصريحون. تأخذ مخرجات الذكاء الاصطناعي وتُعيد صياغتها أو تُعيد كتابتها أو تنقل أسلوبها تحديدًا لهزيمة الكواشف. تُدرَّب ضد الكواشف العامة (بما فيها كاشفنا، رغم أننا لا نشارك أوزان نموذجنا أبدًا) وتتحسن بشكل قابل للقياس مع كل تحديث.
تملك الكواشف ثلاث استجابات لسباق تسلح التوليد. التجميع: دمج إشارات كشف متعددة بحيث لا تكفي أي تكتيك تحايل منفرد. يستغل تجميعنا لـBinoculars الصفري مع ModernBERT الخاضع للإشراف هذا الأمر: أداة تأنيس تهزم مكوّنًا واحدًا غالبًا ما تفشل أمام الآخر، ويلتقط درجة التجميع كليهما.
إعادة التدريب المستمرة: نضيف عينات من كل إصدار نموذج رئيسي جديد في غضون 4 أسابيع من الإطلاق. إذا صدر GPT-6 غدًا، ستتضمنه مجموعة التدريب لدينا بحلول منتصف الشهر القادم. هذا مكلف — حوسبة وتوسيم وإعادة تحقق — لكنه الطريقة الوحيدة للحفاظ على تحديث الكشف. الكواشف التي تُعيد التدريب سنويًا أو أقل أصبحت في جوهرها قطعًا متحفية في غضون عام.
التدريب العدائي: ندرّب عمدًا على عينات ذكاء اصطناعي مُؤنسَنة ومخرجات مُعاد صياغتها، لنُعلّم النموذج رؤية ما وراء نقل الأسلوب السطحي. هذا يرفع الحد الأدنى لما يجب على أداة التأنيس فعله للتهرب منا، مما يُبطّئ سباق التسلح بدوره.
كيف تعمل أدوات التأنيس فعلًا؟ ثلاث فئات عريضة. إعادة الصياغة: إعادة كتابة النص كلمة بكلمة أو جملة بجملة باستخدام LLM ثانوي. فعّال ضد الكواشف السطحية التي تعتمد على تسلسلات الرموز الدقيقة؛ فعّال بشكل معتدل ضد الأساليب الإحصائية. نقل الأسلوب: تحويل النص لمحاكاة مؤلف أو سجل معين. أكثر فعالية — ينخفض AUC لكاشفنا بمقدار ~8 نقاط على نصوص الذكاء الاصطناعي المنقولة أسلوبيًا.
التحرير الهجين بين الإنسان والذكاء الاصطناعي: يكتب المؤلف مسودة، يمررها عبر LLM للتلميع، ثم يُحرّر النسخة الملمّعة يدويًا. هذه أصعب حالة — عمل تعاوني حقيقي يمزج إشارات الإنسان والآلة على مستوى الجملة. لا يستطيع أي كاشف، بما فيها كاشفنا، حل هذه الحالات بشكل موثوق بدون بيانات وصفية لتاريخ التحرير لا يستطيع الكاشف رؤيتها.
نموذج ذهني مفيد: أداة التأنيس ليست ناقضةً للكاشف، إنها مضاعف تكلفة على المتحايل. تستغرق وقتًا وأحيانًا مالًا، وتضيف دائمًا خطر إدخال أخطاء. معظم محاولات الغش الأكاديمي لا تستخدم أدوات التأنيس لأن الاحتكاك يفوق الفائدة. حيث تهيمن أدوات التأنيس هو زراعة المحتوى الاحترافية وسبام SEO المُولَّد بالذكاء الاصطناعي — حالات استخدام يهم فيها الإنتاجية وضبط الجودة ضعيف.
الصق أي مستند وشاهد حكم كل جملة في الوقت الفعلي. يعمل منطق التجميع الموصوف أعلاه على نصك في أقل من 30 ثانية.
الكاشف ذو الإشارة الواحدة له إخفاق واحد. إذا اعتمدت فقط على الحيرة، فإن المخرجات المُعاد صياغتها مع احتمالات رموز متغيرة تهزمك. إذا اعتمدت فقط على مصنّف خاضع للإشراف، فإن النص خارج التوزيع (عائلة نماذج جديدة، مجال كتابة جديد) يهزمك. يُحسّب التجميع متوسط نقاط الضعف: إعادة الصياغة التي تهزم الحيرة غالبًا ما تُوقع المقدمة الخاضعة للإشراف، والعكس صحيح.
كاشفنا في الإنتاج مُجمَّع صراحةً: 35% Binoculars (صفري، مستقل عن النموذج، قوي على النصوص خارج التوزيع) + 65% ModernBERT (خاضع للإشراف، خاص بالمجال، دقة عالية على النصوص داخل التوزيع). اختيرت الأوزان تجريبيًا — تمت زيادة AUC التجميعي عندما سيطر ModernBERT لكن احتفظ Binoculars بصلاحية النقض على الحالات الحدية.
النتيجة: يجب على أداة التأنيس الآن هزيمة معماريتَي كشف مختلفتين جوهريًا في آنٍ واحد للتهرب من حكمنا. تُدرَّب أدوات التأنيس العامة عادةً ضد كاشف هدف واحد، مما يعني أنها غالبًا تنجح ضد ذلك الكاشف المحدد لكنها تفشل أمام تجميع. هذه الميزة الهيكلية الأساسية للكشف في سباق التسلح الحالي.
ماذا ينبغي أن نتوقع خلال 2026–2027؟ GPT-6 وClaude 5 إصدارات محتملة في منتصف العام؛ كلاهما سيُضيّق الفجوة أكثر. ستستمر نماذج الأوزان المفتوحة — Llama 4 وQwen 4 — في جعل التوليد عالي الجودة سلعةً رخيصة وجعل أدوات التأنيس أرخص تشغيلًا على نطاق واسع. AUC الكشف على النماذج الرائدة سينخفض على الأرجح إلى نطاق 0.80–0.90 للسنة الأولى بعد الإصدار قبل أن تُعدّله إعادة التدريب.
على جانب الدفاع: الإشارات متعددة الوسائط (ديناميكيات الكتابة، تاريخ التحرير، التحقق من هوية المؤلف مقابل مجموعة كتابة معروفة) من المرجح أن تكون أكثر أهمية من الكشف المستند إلى النص البحت في غضون 24 شهرًا. سيبقى كاشفنا النصي الأول مرشحًا دفاعيًا لكنه سيكون بشكل متزايد عضوًا مصوتًا في مجموعة أدلة أكثر ثراءً.
الخلاصة الصادقة: لن يصل الكشف المستند إلى النص البحت أبدًا إلى 100%. سيستقر عند حدود 90–95% AUC على النصوص داخل التوزيع و75–85% على النماذج الرائدة. إذا كان سير عملك يتطلب يقينًا، فأنت تحتاج إلى أدلة تتجاوز الدرجة. إذا كان سير عملك يتطلب إشارة قوية لتحديد أولويات المراجعة البشرية، يظل الكشف النصي مفيدًا وأفضل قياسيًا من عدم فعل أي شيء.
تصف هذه المقالة الخصائص الهيكلية للكشف عن نصوص الذكاء الاصطناعي. الأرقام المحددة تشير إلى تحققنا الداخلي وقد لا تُعمَّم. نُحدّث هذه الصفحة كلما استدعى ذلك بحث جديد أو إصدارات نماذج جديدة.