تم تحديث هذه المقالة آخر مرة في أغسطس 15, 2024
Table of Contents
تأخذ شركة Stichting Brein كمية كبيرة من البيانات غير القانونية لتدريب الذكاء الاصطناعي دون الاتصال بالإنترنت
تأخذ شركة Stichting Brein كمية كبيرة من البيانات غير القانونية لتدريب الذكاء الاصطناعي دون الاتصال بالإنترنت
قامت منظمة حقوق الطبع والنشر Stichting Brein بسحب مجموعة بيانات هولندية، وهي مجموعة من البيانات، كانت مخصصة لتدريب الذكاء الاصطناعي (AI). وبحسب المنظمة، فهذه هي المرة الأولى التي يحدث فيها هذا في هولندا.
ويتحدث برين نفسه عن “مجموعة بيانات كبيرة” تتكون، وفقًا للمنظمة، من نسخ غير قانونية لعشرات الآلاف من الكتب، وملايين السطور من مقالات إخبارية من مواقع مثل Nu.nl، وترجمات لعدد لا يحصى من الأفلام والمسلسلات التلفزيونية من مصادر غير قانونية. مصادر. يقول المخرج باستيان فان رامشورست أيضًا إنه يعرف من هو المبدع، لكنه لا يستطيع تحديد ذلك لأسباب تتعلق بالخصوصية.
استخدام مجموعة البيانات
تهدف مجموعة البيانات إلى تدريب ما يسمى بنموذج اللغة، ويُطلق عليها في المصطلحات نماذج اللغة الكبيرة. لقد وعد منشئ مجموعة البيانات Brein كتابيًا بعدم استخدامها بعد الآن وقدم أيضًا معلومات حول من حصل عليها. تقوم المؤسسة الآن بالتحقق مما إذا كانت البيانات قد تم استخدامها بالفعل بواسطة نماذج الذكاء الاصطناعي. إذا كان الأمر كذلك، فسيتم محاسبة الأطراف.
تمثل المواد التي تنتهك حقوق الطبع والنشر مشكلة كبيرة عند تدريب الذكاء الاصطناعي. في الآونة الأخيرة، أظهرت الأبحاث بقوة أن أعمال صانعي الصور الهولنديين قد تم استخدامها دون إذنهم لتدريب مولدات صور الذكاء الاصطناعي المعروفة، بما في ذلك DALL-E وMidjourney.
في الولايات المتحدة، هناك حاليًا دعوى قضائية بين صحيفة نيويورك تايمز وOpenAI، الشركة المصنعة لـ ChatGPT. وتتهم الصحيفة الشركة باستخدام كميات هائلة من المقالات الصحفية لتدريب الذكاء الاصطناعي دون إذن. تعتقد OpenAI أن استخدام البيانات مسموح به.
ستيشتينج برين
قم بكتابة اول تعليق