أظهر تقرير جديد نشرته Copyleaks، وهو أخصائي في تحليل الذكاء الاصطناعي وسرقة الأدب، أن نموذجًا معروفًا للذكاء الاصطناعي في Deepseek-R1 قد يتعب من استخدام إخراج روبوتات OpenAI. تتطابق بصمة الأسلوب على أنماط OpenAIتصل إلى 74.2 ٪.
وفقًا لـ Copyleaks، أظهرت أبحاثها الحديثة أن Deepseek-R1 يعتمد بشكل كبير على أسلوب OpenAIفي اللغة، وهيكل اللغة، واختيار القاموس.
استندت هذه الدراسة إلى ثلاثة أعمال الذكاء الاصطناعي المتقدمة وتم تدريبها مع نصوص من أربعة نماذج رئيسية. وهذا هو، كلود، الجوزاء، لاما، أوبياي.
وتُعد مُصنّفات الذكاء الاصطناعي (AI Classifiers) نماذج أو خوارزميات تُستخدم لتصنيف البيانات وفقًا لأنماط معينة. ويمكن لهذه المُصنّفات تحليل النصوص أو الصور أو البيانات الأخرى، ثم تصنيفها بناءً على معايير محددة.
وأظهرت النتائج أن أسلوب كتابة DeepSeek-R1 يتطابق مع أسلوب OpenAI بنسبة بلغت 74.2%، مما يعزز احتمال اعتماده على مخرجات ChatGPT في تدريبه، خاصةً مع إعلان DeepSeek سابقًا أنها استخدمت أسلوب “التقطير” (Distillation) لخفض تكاليف التدريب، وهو نهج يعتمد على استخدام مخرجات نموذج ذكاء اصطناعي متقدم لتدريب نموذج آخر بدلًا من بدء التدريب من الصفر.
وتأتي هذه الاكتشافات بعد أن تسبب إطلاق نماذج DeepSeek باضطراب كبير في سوق الذكاء الاصطناعي، مما أدى إلى خسائر تقدر بتريليون دولار في سوق الأسهم الأمريكية، إذ راهن المستثمرون على أن تدريب نماذج الذكاء الاصطناعي لم يعد يتطلب مليارات الدولارات.
نتيجة لحملات شركات مثل الهند، والتي تعتمد على بيع المعدات المستخدمة لتطوير الذكاء الاصطناعي، تعاني الهند من أكبر خسائر لشركات التكنولوجيا.
تجدر الإشارة إلى أن الشركة الصينية Deepseek لم تقدم تفاصيل واضحة حول مصدر تدريب البيانات الذي يثير أسئلة حول صحة النموذج وموثوقية إجاباته. يعتقد الخبراء أن هذا يمكن أن يمنح الشركة ميزة غير عادلة في ضوء الافتقار إلى الوضوح في آليات تدريس النموذج مقارنة بمنافسيها.
اتهمت OpenAI سابقًا Deepseek باستخدام Output ChatGPT لتدريس النموذج، لكنها لم تقدم هذا الدليل الواضح. يأمل بعض الخبراء أن تواجه الشركة الصينية ديبسيك ونماذجها المتقدمة حظرًا مستقبليًا في الولايات المتحدة.


