سرقة بيانات سبوتيفاي.. ماذا نعرف عن "أعداء حقوق النشر"؟
قالت مجموعة تدعى
Anna’s Archive إنها قامت بجمع 86 مليون ملف موسيقي من منصة Spotify، بالإضافة إلى 256 مليون صف بيانات وصفية تشمل أسماء الفنانين والألبومات، في عملية اعتبرت الأكبر من نوعها حتى الآن.
وأكدت Spotify، التي تستضيف أكثر من 100 مليون مقطع موسيقي، أن هذا التسريب لا يمثل مجموعتها الكاملة، وقالت: "أدى التحقيق في الوصول غير المصرح به إلى تحديد أن طرفا ثالثا قام بجمع البيانات الوصفية العامة واستخدم أساليب غير مشروعة لتجاوز إدارة الحقوق الرقمية للوصول إلى بعض الملفات الصوتية على المنصة"، مشيرة إلى أنها "حددت وأوقفت الحسابات الخبيثة التي شاركت في عملية الجمع غير القانوني".
كما أوضحت الشركة أنها لا تعتقد أن الملفات الموسيقية التي أخذتها Anna’s Archive قد تم نشرها بعد.
في المقابل، قالت المجموعة في مدونتها إنها تهدف إلى إنشاء "أرشيف للحفاظ على الموسيقى"، مشيرة إلى أن الملفات الصوتية تمثل حوالي 99.6% من الموسيقى التي يستمع إليها مستخدمو "Spotify" وسيتم مشاركتها عبر "تورنت"، وهو وسيلة لمشاركة الملفات الرقمية الكبيرة عبر الإنترنت.
تعد Anna’s Archive جزءا من مجموعة أطلقت عليها منصة Spotify اسم "Anti-Copyright Extremists" وتعرف بمواقفها المتطرفة ضد حقوق النشر.
من هم "المتطرفون ضد حقوق النشر"؟
تشتهر "Anna’s Archive" بتوفير روابط للكتب المقرصنة، لكنها توسعت مؤخرا لتشمل الموسيقى، إذ أوضحت على موقعها: "قمنا بعمل نسخة احتياطية من Spotify. يتم توزيعها عبر تورنتات ضخمة، تصل سعتها إلى حوالي 300 تيرابايت".
وأضافت أن هذه النسخة "تتضمن أكبر قاعدة بيانات عامة للبيانات الوصفية للموسيقى تضم 256 مليون مسار و186 مليون رمز تسجيل قياسي دولي فريد"، موضحة أن هذا يعد "أول أرشيف للحفاظ على الموسيقى مفتوح بالكامل، مع 86 مليون ملف موسيقي يمثل حوالي 99.6% من الاستماع".
وأوضحت المجموعة أن تركيزها عادة ما يكون على النصوص مثل الكتب والأوراق العلمية، لكنها ترى أن مهمتها في "الحفاظ على معرفة وثقافة الإنسانية" لا تفرق بين أنواع الوسائط.
وأضافت: "في بعض الأحيان يظهر لنا فرصة خارج نطاق النصوص، وهذه هي الحالة الحالية"، موضحة أنهم اكتشفوا "طريقة لجمع بيانات Spotify على نطاق واسع" ورأوا دورهم في بناء أرشيف موسيقي يهدف أساسا إلى الحفظ.
وأشارت المجموعة إلى وجود "متطرفين ضد حقوق النشر، أحدهم يهدف إلى الربح بأي ثمن على حساب الموسيقيين، والآخر يهدف إلى جعل الموسيقى متاحة للجميع".
وأكدت المجموعة: "بالطبع لا تمتلك Spotify كل الموسيقى في العالم، لكنها بداية رائعة"، كما أضافت: "بمساعدتكم، سيظل التراث الموسيقي للإنسانية محميا إلى الأبد من الدمار بسبب الكوارث الطبيعية والحروب وقطع الميزانيات وغيرها من الكوارث".
استخدام الملفات في تدريب الذكاء الاصطناعي
قالت صحيفة
الغارديان إن التسريب قد يعزز شركات الذكاء الاصطناعي التي تبحث عن مواد لتطوير تقنياتها.
وأوضح إد نيوتن-ريكس، مؤلف وناشط لحماية حقوق الفنانين، أن الموسيقى المسروقة "من المحتمل أن تُستخدم في تطوير نماذج الذكاء الاصطناعي".
وأضاف: "التدريب على المواد المقرصنة شائع للأسف في صناعة الذكاء الاصطناعي، لذلك من شبه المؤكد أن تنتهي هذه الموسيقى المسروقة في تدريب النماذج"، مشيراً إلى ضرورة أن تصر الحكومات على كشف الشركات عن بيانات التدريب التي تستخدمها.
كما أشار موقع Anna’s Archive إلى LibGen، وهو أرشيف ضخم للكتب المقرصنة الذي استُخدم، وفقا لمحكمة أميركية، لتدريب نماذج الذكاء الاصطناعي لشركة Meta بقيادة مارك زوكربيرغ، رغم التحذيرات داخل الفريق التنفيذي للشركة بأن البيانات "معروفة بأنها مقرصنة".
أوضحت الغارديان أن حقوق النشر أصبحت ساحة صراع بين الفنانين والمؤلفين والمبدعين من جهة، وشركات الذكاء الاصطناعي من جهة أخرى، حيث تدرب أدوات الذكاء الاصطناعي مثل الدردشة التفاعلية ومولدات الموسيقى على كميات ضخمة من البيانات مأخوذة من الإنترنت، بما في ذلك أعمال محمية بحقوق نشر.
في المملكة المتحدة، احتج المحترفون الإبداعيون على اقتراح حكومي يسمح لشركات الذكاء الاصطناعي باستخدام الأعمال المحمية بحقوق نشر بدون إذن ما لم يبد صاحب الحق رغبة في منع استخدام بياناته، حيث أيد تقريبا كل المشاركين في استشارة حكومية مخاوف الفنانين.
وقالت ليز كيندال، وزيرة العلوم والابتكار والتكنولوجيا، للبرلمان هذا الشهر إنه "لا يوجد توافق واضح" بشأن الموضوع، مضيفة أن الوزراء سيأخذون الوقت اللازم لضمان وضع سياسة مناسبة، مع الالتزام بتقديم مقترحات حول الذكاء الاصطناعي وحقوق النشر بحلول 18 مارس العام المقبل.