Intelligence artificielle : ce nouveau rapport vient bouleverser l'industrie du cinéma
En quelques années, l'intelligence artificielle est devenue incontournable. Cet outil a envahi notre quotidien, et provoque d'importants changements au sein de notre société. Bien qu'ils se soient mis en grève pendant plusieurs mois l'an dernier pour dénoncer (entre autres) le manque de régulation autour de l'IA, les scénaristes ne pourront pas l'empêcher de bouleverser l'industrie du cinéma. En effet, un nouveau rapport inquiétant concernant la création artistique et la propriété intellectuelle...
Ces films et ces séries servent à entraîner l'IA
De plus en plus de marques utilisent l'IA pour produire du contenu, comme Coca-Cola avec sa nouvelle pub de Noël. Ce ne sont toutefois pas les seuls à se servir de cet outil au lieu d'engager des artistes : des studios, comme Disney, ont même conçu des génériques (celui de Secret Invasion) ou des affiches (celle de Thunderbolts) à l'aide de l'intelligence artificielle. Un constat qui révolte autant les internautes, les spectateurs et les cinéphiles que les professionnels du métier, qui craignent de voir leur métier disparaître, remplacé par les machines... Que des réalisateurs chevronnés et des personnalités publiques se soient positionnés contre l'IA ne change rien à la propagation de cet outil. Un nouveau rapport partagé par nos confrères de The Atlantic indique que les entreprises nourrissent leurs programmes à l'aide de références sérielles et cinématographiques, sans en informer leurs auteurs.
Les scénaristes voient ainsi leur travail être utilisé pour ensuite leur en priver. Quant aux générateurs, ils sont capables de produire du contenu inspiré par les oeuvres avec lesquelles ils ont été formés, mais il est compliqué pour les artistes de prouver que c'est leurs créations qui en sont à l'origine. Le rapport affirme qu'en plus de Alf et du Parrain, "53 000 autres films et 85 000 autres épisodes télévisés" ont servi à former des systèmes d'intelligence artificielle :
Les dialogues de tous ces films sont inclus dans un ensemble de données d'entraînement à l'IA qui a été utilisé par Apple, Anthropic, Meta, Nvidia, Salesforce, Bloomberg et d'autres entreprises. J'ai récemment téléchargé cet ensemble de données, dont j'ai vu la référence dans des articles sur le développement de divers grands modèles de langage (ou LLM). Il comprend des dialogues tirés de tous les films nominés pour le prix du meilleur film entre 1950 et 2016, d'au moins 616 épisodes des Simpsons, de 170 épisodes de Seinfeld, de 45 épisodes de Twin Peaks et de tous les épisodes de The Wire, The Sopranos et Breaking Bad. Il comprend même des dialogues pré-écrits "en direct" des émissions des Golden Globes et des Oscars. Si un chatbot peut imiter un mafieux de série policière ou un extraterrestre de sitcom (ou, plus important encore, s'il peut créer des émissions entières qui nécessiteraient autrement une salle de scénaristes) des données comme celles-ci en sont en partie la raison.
Des artistes spoilés sans compensation monétaire
Plus exactement, précise l'article, ce sont les sous-titres des programmes qui sont utilisés par ces sociétés pour former les programmes d'intelligence artificielle (ceux du site OpenSubtitles.org). Une source qui peut sembler bizarre, mais s'explique par le fait que cet outil a du mal à "parler normalement", c'est-à-dire comme le font deux personnes lors d'une conversation lambda. Il n'en demeure pas moins que le travail des scénaristes est exploité sans la permission des auteurs, et sans leur accorder aucune compensation monétaire. Leurs oeuvres servent donc illégalement à nourrir des programmes qui les priveront, dans un avenir proche, de leur métier. Un pillage qui n'est pas encadré par la loi, malgré les différentes poursuites judiciaires engagées par les auteurs. Le créateur de Breaking Bad, Vince Gilligan, a écrit en 2023 au Bureau américain des droits d'auteur que l'IA générative équivaut à "une forme de plagiat extraordinairement complexe et gourmande en énergie".
Et vous, que pensez-vous de ce rapport ?