تأخذ شركة Stichting Brein كمية كبيرة من البيانات غير القانونية لتدريب الذكاء الاصطناعي دون الاتصال بالإنترنت

تم تحديث هذه المقالة آخر مرة في أغسطس 15, 2024

Table of Contents

تأخذ شركة Stichting Brein كمية كبيرة من البيانات غير القانونية لتدريب الذكاء الاصطناعي دون الاتصال بالإنترنت

قامت منظمة حقوق الطبع والنشر Stichting Brein بسحب مجموعة بيانات هولندية، وهي مجموعة من البيانات، كانت مخصصة لتدريب الذكاء الاصطناعي (AI). وبحسب المنظمة، فهذه هي المرة الأولى التي يحدث فيها هذا في هولندا.

ويتحدث برين نفسه عن “مجموعة بيانات كبيرة” تتكون، وفقًا للمنظمة، من نسخ غير قانونية لعشرات الآلاف من الكتب، وملايين السطور من مقالات إخبارية من مواقع مثل Nu.nl، وترجمات لعدد لا يحصى من الأفلام والمسلسلات التلفزيونية من مصادر غير قانونية. مصادر. يقول المخرج باستيان فان رامشورست أيضًا إنه يعرف من هو المبدع، لكنه لا يستطيع تحديد ذلك لأسباب تتعلق بالخصوصية.

استخدام مجموعة البيانات

تهدف مجموعة البيانات إلى تدريب ما يسمى بنموذج اللغة، ويُطلق عليها في المصطلحات نماذج اللغة الكبيرة. لقد وعد منشئ مجموعة البيانات Brein كتابيًا بعدم استخدامها بعد الآن وقدم أيضًا معلومات حول من حصل عليها. تقوم المؤسسة الآن بالتحقق مما إذا كانت البيانات قد تم استخدامها بالفعل بواسطة نماذج الذكاء الاصطناعي. إذا كان الأمر كذلك، فسيتم محاسبة الأطراف.

تمثل المواد التي تنتهك حقوق الطبع والنشر مشكلة كبيرة عند تدريب الذكاء الاصطناعي. في الآونة الأخيرة، أظهرت الأبحاث بقوة أن أعمال صانعي الصور الهولنديين قد تم استخدامها دون إذنهم لتدريب مولدات صور الذكاء الاصطناعي المعروفة، بما في ذلك DALL-E وMidjourney.

في الولايات المتحدة، هناك حاليًا دعوى قضائية بين صحيفة نيويورك تايمز وOpenAI، الشركة المصنعة لـ ChatGPT. وتتهم الصحيفة الشركة باستخدام كميات هائلة من المقالات الصحفية لتدريب الذكاء الاصطناعي دون إذن. تعتقد OpenAI أن استخدام البيانات مسموح به.

ستيشتينج برين

شارك مع الاصدقاء

أوي العربية! مرات

الأخبار الموثوقة المصدر

تأخذ شركة Stichting Brein كمية كبيرة من البيانات غير القانونية لتدريب الذكاء الاصطناعي دون الاتصال بالإنترنت

تأخذ شركة Stichting Brein كمية كبيرة من البيانات غير القانونية لتدريب الذكاء الاصطناعي دون الاتصال بالإنترنت

تأخذ شركة Stichting Brein كمية كبيرة من البيانات غير القانونية لتدريب الذكاء الاصطناعي دون الاتصال بالإنترنت

استخدام مجموعة البيانات

قم بكتابة اول تعليق

Leave a Reply إلغاء الرد