Le procès accuse Apple d'avoir utilisé un ensemble de données composé de millions de vidéos YouTube pour former un modèle d'IA, comme indiqué dans une étude publiée à la fin de 2024. Voici les détails.

Amazon et OpenAI également accusés

Comme l'a remarqué MacRumors, une proposition de recours collectif déposée par Ted Entertainment, Matt Fisher et Golfholics allègue qu'Apple a contourné les protections anti-scraping de YouTube pour télécharger des millions de vidéos.

Selon le document, un groupe de chercheurs d'Apple a publié une étude intitulée STIV : Production Vidéo Conditionnelle à Grande Échelle de Texte et d'Image, dans laquelle ils déclarent avoir formé le modèle de production vidéo décrit dans l'article en utilisant un ensemble de données appelé Panda-70M.

Extrait du procès :

L'ensemble de données Panda 70M sert de carte ou de fichier d'index identifiant certaines vidéos et clips YouTube par URL, identifiant vidéo et horodatage. Une seule vidéo YouTube peut être divisée en plusieurs clips, chacun considéré comme un exemple d'entraînement distinct. Extraire un clip nécessite d'accéder indépendamment à la vidéo source sur YouTube et d'isoler le segment spécifié ; cela crée une action de transition excessive distincte pour chaque clip extrait.

Les plaignants affirment que leur contenu figure plus de 500 fois dans l'ensemble de données et souhaitent déposer un recours collectif au nom de « tous ceux dans une situation similaire ».

En substance, ils soutiennent que l'ensemble de données ne fournit que des liens vers les vidéos, mais qu'Apple a contourné les protections anti-scraping de YouTube pour télécharger le contenu principal et l'utiliser pour former des modèles d'IA.

Par conséquent, ils demandent un procès par jury pour toutes les réclamations et souhaitent :

  1. Que cette affaire soit approuvée en tant que recours collectif et que les avocats des défendeurs et des plaignants soient désignés pour représenter la classe ;
  2. Que le défendeur déclare avoir intentionnellement contourné les systèmes de protection des droits d'auteur de YouTube pour protéger le contenu audiovisuel des plaignants et des membres de la classe.
  3. Des dommages-intérêts (jusqu'au maximum légal autorisé par violation), une injonction et des frais d'avocat et de dépens conformément à 17 U.S.C. §1203 ;
  4. La fourniture d'équité nécessaire pour prévenir ou restreindre la violation du contenu protégé par des droits d'auteur des plaignants et des membres de la classe, conformément au Titre 17, Titre 28 et/ou à la compétence intrinsèque de la Cour, ainsi que des mesures provisoires et permanentes pour empêcher le défendeur et ses agents, employés, avocats, dirigeants, successeurs, acquéreurs, titulaires de licences et tous les autres qui collaborent activement avec eux de violer les droits fédéraux des plaignants ou des membres de la classe ;
  5. La demande d'intérêts avant et après sur toute récompense monétaire accordée au défendeur, dans toute la mesure permise ; et
  6. La présentation d'autres demandes que la Cour jugera juste et appropriée.

En plus d'Apple, les plaignants ont également proposé des recours collectifs contre Amazon et OpenAI, affirmant que les deux entreprises ont utilisé l'ensemble de données Panda-70M dans leurs propres processus de formation de modèles d'IA.

Produits à découvrir chez Amazon

  • David Pogue – 'Apple : Les 50 premières années'
  • MacBook Neo
  • Logitech MX Master 4
  • AirPods Pro 3
  • AirTag (2ème génération) – Pack de 4
  • Apple Watch Series 11
  • Adaptateur CarPlay sans fil