وثائق جديدة تظهر هوس ميتا للتغلب على OpenAI

تزعم وثائق قضائية جديدة تم الكشف عنها في دعوى حقوق النشر الخاصة بشركة Kadrey-Meta أن المسؤولين التنفيذيين في الشركة كانوا مهووسين بالتغلب على نموذج GPT-4 الخاص بشركة OpenAI عند تطوير نموذج Llama 3 مفتوح المصدر.

في رسالة بريد إلكتروني داخلية من أكتوبر 2023، أخبر أحمد الدحل، نائب رئيس الذكاء الاصطناعي التوليدي في ميتا، الباحث هوغو توفيرون: “بصراحة، يجب أن يكون هدفنا هو GPT-4. وحدات معالجة الرسوميات بسعة 64K قادمة! نحتاج إلى تعلم كيفية بناء نماذج متطورة والفوز بهذا السباق.”

وفي حين أصدرت شركة Meta نماذج ذكاء اصطناعي مفتوحة المصدر، أشار البريد الإلكتروني إلى أن قادة الذكاء الاصطناعي في الشركة يركزون في المقام الأول على التغلب على المنافسين مثل OpenAI وAnthropic، الذين تتخلف نماذجهم في واجهات برمجة التطبيقات. كما هو موضح بوضوح.

وأظهرت الرسائل أن شركة Mistral الفرنسية، التي تُعد من كُبرى الشركات المنافسة لميتا في مجال النماذج المفتوحة، لم تكن تُعد تهديدًا حقيقيًا، إذ وصفها الدحل قائلًا: “إن Mistral لا تُقارن بنا. يجب أن نكون قادرين على تقديم ما هو أفضل”.

وفي إطار هذا السباق، أظهرت الوثائق أن قادة ميتا أبدوا استعدادًا لتجاوز الحدود الأخلاقية أحيانًا، إذ ناقش الدحل وتوفرون استخدام مجموعة بيانات من منصة LibGen، التي تحتوي على أعمال محمية بحقوق الطبع والنشر من دور نشر تعليمية كبرى.

ووفقًا للوثائق، فإن المناقشات داخل ميتا كانت تشير إلى أن الشركة كانت تبحث عن تحسين جودة بيانات التدريب بعد اعتراف باحثي الشركة بأن مزيج البيانات المُستخدم في تدريب Llama 2 “كان سيئًا”، على حد وصفهم.

وقال مارك زوكربيرج، الرئيس التنفيذي لشركة ميتا، في رسالة داخلية في يوليو 2024: “هذا العام، تتنافس نماذج Llama 3 مع النماذج الحديثة وتتفوق عليها في بعض المناطق”. “بدءًا من العام المقبل، نتوقع أن تكون نماذج Llama المستقبلية هي الأكثر تقدمًا في الصناعة.”

سيتم إطلاق نموذج Llama 3 في أبريل 2024 وسيتنافس مع النماذج المغلقة من OpenAI وGoogle وAnthropic، ويتفوق على نموذج Mistral المفتوح. ومع ذلك، فإن البيانات المستخدمة لتدريب هذه النماذج تخضع الآن لتدقيق قانوني مكثف.

وتُظهر الوثائق ضغوطًا شديدة داخل شركة Meta لتحقيق النجاح في سباق الذكاء الاصطناعي، لكنها تسلط الضوء أيضًا على المخاوف القانونية والأخلاقية. واتهمت الشركة باستخدام بيانات محمية بحقوق الطبع والنشر دون إذن، وهو ما قد يعرض النموذج المفتوح لمخاطر قانونية كبيرة.

قد يعجبك

أحدث الأخبار

وثائق جديدة تظهر هوس ميتا للتغلب على OpenAI

روابط ويب جو

مقالات مميزة

أحدث المقالات