Vous avez lu que le petit renard Jolly Redd arrivait dans Animal Crossing : New Horizons avant même que Nintendo ne l’annonce officiellement ? C’est tout simplement parce que des petits malins ont su analyser les lignes de code comme les voyants lisent dans le marc de café. Ce phénomène communément appelé ''data mining'', littéralement “exploration de données”, ne perd pas en popularité. Il a ses stars suivies par des milliers de personnes sur les réseaux sociaux, ainsi que ses plateformes communautaires privilégiées où se propagent des informations normalement laissées à la discrétion des concepteurs. Le principe ? Ouvrir les fichiers d’une alpha, d’une démo ou encore d’une application à l’aide de différents programmes pour en afficher les contenus et en divulguer les secrets. C’est de cette façon que des titres comme Sea of Thieves, Genshin Impact ou encore Fortnite ont vu des éléments encore non-annoncés s’éventer sur Internet. Mais est-ce que n’importe quel individu peut s’improviser ''data miner'' sans risque ? En écho au jeu créé par Rare précédemment évoqué, peut-on affilier cette technique à de la piraterie allant à l’encontre des œuvres, et donc des équipes qui les créent ?
What do you data mine ?
Ils sont connus sous les pseudonymes de Ninji, Senescallo, That1MiningGuy, Antediluviana ou encore Im_a_Fucking_Cereal (sic). Leur activité ? Diffuser sur Twitter, Discord et Reddit leurs trouvailles, à savoir des éléments de jeux populaires qui n’ont pas encore été révélés. Cela va des personnages à venir de Genshin Impact aux prochaines activités dans Animal Crossing : New Horizons, en passant par les futures armes d’Apex Legends. Leur méthode ? L’exploration de données, ou data mining. Le data mining est un terme qui possède plusieurs significations. Dans le monde professionnel, il signifie que des techniques automatisées – telles que des algorithmes – sont exécutées afin de croiser différentes informations qui sont ensuite étudiées. Cela permet au Data Analyst d’afficher des tendances et de dégager des connaissances, une compétence très prisée à l’époque des réseaux sociaux et des jeux-service. Dans la sphère du jeu vidéo, le terme est communément utilisé pour désigner l’analyse d’informations trouvées dans le code d’un soft ou sur un client de test public par une tierce personne.
Les data miners utilisent de multiples outils pour dénicher dans un titre les listes qui contiennent les modèles, les sons ou encore le chapitrage, dans le but de détecter des renseignements qui n’ont pas encore été divulgués. Lorsqu’ils sont chanceux, ils n’ont pas besoin de creuser trop profondément. En 2014, le patch 5.4 de World of Warcraft annonçait l’extension Warlords of Draenor par l’intermédiaire d’un dossier ajouté au client intitulé Iron Horde. L’add-on Wrath of the Lich King avait également laissé sous-entendre sa venue – plus ou moins volontairement – de la même manière. Lorsque les données ne se trouvent pas dans les fichiers atteignables par voie classique, les fouineurs passent par d’autres chemins, plus scabreux. Il existe des logiciels qui permettent d’explorer le contenu d’une compilation .pak, donnant potentiellement accès à un grand nombre d’informations cachées dans de multiples fichiers.
La plupart du temps, les ressources sensibles sont cryptées pour des raisons évidentes de confidentialité. Interrogé chez ActuGaming, That1miningguy explique qu’il utilise DXZTPorter et VPK Extractor, lui donnant accès aux modèles ainsi qu’aux images d’Apex Legends. L’utilisateur qui a “data miné” la démo de Resident Evil VII pour en publier son contenu sur Reddit a expliqué que le .pak était protégé mais qu’il s'était servi du logiciel HxD pour ouvrir l'exécutable. Peu importe la méthode utilisée, le mystérieux enquêteur dévoile ses trouvailles acquises via la démo et évente divers secrets grâce aux fichiers dénichés. Il n’en fallait pas plus pour que d’autres membres proposent une liste de chapitres regroupant les événements du jeu en se basant sur les informations trouvées, le tout avec une grande précision. L’analyse du code de la démo a permis de deviner les armes, les ennemis, le scénario et même le contenu des futurs dlc. C’est ce qui est aussi arrivé avec la lecture du fichier .pak de Sea of Thieves, éventant ainsi l’arrivée de multiples éléments. Avec quelques notions de langage de programmation, les bons logiciels, et surtout beaucoup de patience, il devient possible d’interpréter les lignes de code afin d’en ressortir ce qui n’a pas encore été montré. Il faut reconnaître qu’en nommant une animation “kraken_ingestplayer”, il est plutôt aisé de déduire qu’un monstre marin est au programme, et que ce dernier aura la faculté d’avaler le joueur.
T’es pas qu’Apk !
Dans les faits, n’importe quel individu suffisamment motivé et possédant de bonnes bases en informatique peut tenter d’extraire des renseignements provenant d’un jeu (ou d'une démo, d'une mise à jour, d'un patch) afin d’en percer ses secrets. Il faut cependant garder à l’esprit que les données textuelles trouvées n’engagent que ceux qui croient en elles. Il est effectivement commun de détecter dans ces listes des traces de développements inachevés. Dans notre exemple de Resident Evil VII, nous retrouvons entre autres des bribes d’expériences multijoueur coupées du projet ainsi que le nom d’un personnage connu de la série finalement resté derrière le rideau. Même cas de figure pour Apex Legends avec l’affaire du Smart Pistol repéré dans le code, mais finalement jamais sorti de l’armurerie. Le data mining est donc loin d’être une science exacte. Et c’est tout à fait normal, puisqu’il n’est qu’une interprétation libre d’un langage informatique. Si certains data miners se qualifient eux-mêmes d’archéologues du code, réfutant tout rapprochement de leur pratique avec celle du hacking ou d’ingénierie inverse, les éditeurs ont tendance à les voir d’un œil suspicieux. Du côté du droit, il est commun de penser qu’il n’y aurait rien d’illégal au fait de chercher des informations dissimulées au sein d’un soft. Les utilisateurs qui publient le résultat de leurs recherches trouvent même un écho auprès des sites spécialisés qui s’interdisent pourtant de mettre en avant du hacking classique dans leurs rubriques. Ce serait donc aux développeurs de faire attention à la manière dont ils protègent leur code et nomment leurs fichiers ? “Le fait de révéler une information encore inconnue du public par la simple analyse de données librement accessibles n’est pas en soi illégal” nous explique Nicolas Bressand, avocat au Barreau de Lyon, expert en droit de l’immatériel, contacté le 12 mars 2021. Il continue : “dans le cas du data mining, le problème relève davantage de la manière dont les données ont été obtenues et/ou de la nature de ces données”.
En droit français, les programmes sont protégés par le droit d’auteur. Cela permet notamment aux titulaires des droits d’interdire la décompilation de leurs œuvres logicielles. Par conséquent, lorsque le data mining implique de procéder à une décompilation du logiciel, il devient une pratique illégale, la décompilation constituant un acte de contrefaçon. À cela s’ajoute que le data mining peut également impliquer de contourner d’éventuelles Mesures Techniques de Protection mises en place par l’éditeur pour verrouiller son jeu, ou encore de divulguer des œuvres dont la reproduction est illicite, comme les visuels du jeu ou encore les musiques. Nicolas Bressand, avocat au Barreau de Lyon, expert en droit de l’immatériel.
Certains éditeurs comme Activision Blizzard prévoient une interdiction contractuelle au data mining dans les paragraphes de leurs licences d’utilisation. “Dans ce cas, le data mining constitue également une violation de la licence d’utilisation, et donc une faute contractuelle” confirme Nicolas Bressand. “Il est donc possible de rattacher la pratique du data mining à une diversité de violations d’obligations légales et/ou contractuelles” ajoute-t-il. Par conséquent, cela signifie que la responsabilité des data miners peut, en théorie, être engagée. En pratique, les actions en justice sont rares. Il y a bien eu les pressions de Niantic envers Pokevision, site qui se servait des informations de Pokemon GO afin d’aider à localiser les petits monstres virtuels. Mais en règle générale, les géants se font discrets sur la question du data mining, ils n’ont d’ailleurs pas souhaité répondre à nos questions traitant du sujet. “Les éditeurs ont-ils intérêt à agir contre des data miners ? Je ne le crois pas” avertit Nicolas Bressand. “Dans la majorité des cas, le préjudice subi par l’éditeur paraît extrêmement limité. À titre d’exemple, lorsque le data mining de Red Dead Redemption II a révélé qu’une version PC était en développement, l’éditeur a probablement perdu l’effet d’annonce entourant cette sortie à venir, mais quel était son préjudice réel ?”
Si les éditeurs poursuivaient systématiquement en justice les data miners, leur préjudice d’image serait probablement bien supérieur, dans les communautés du jeu vidéo, aux préjudices résultant des leaks. Nicolas Bressand, avocat au Barreau de Lyon, expert en droit de l’immatériel.
Il faut aussi garder à l’esprit que les studios, ravis de bénéficier d’un peu de mise en avant gratuite, peuvent devenir des victimes consentantes de cette pratique. “Je pense que dans l’essentiel des cas, les éditeurs, bien que pouvant sans difficulté caractériser des atteintes à leurs droits, préfèreront probablement ne pas agir contre les data miners. Ce d’autant que la révélation d’informations encore secrètes a souvent pour effet de créer de l’émulation autour du jeu et de susciter l’intérêt des joueurs” reconnaît Nicolas Bressand. Il conclut : “Il en serait peut-être autrement si un data miner parvenait à divulguer une grande quantité d’informations capitales d’un seul coup”.
D’utilité publique ?
Certes, cette pêche aux informations tenue par des marins d’eau douce fait surtout parler d’elle lorsque ses représentants remontent à la surface quelques nouvelles importantes – encore tenues secrètes – sur les gros jeux du moment. Mais le data mining ne se résume pas qu’à cette envie de lever le voile sur du contenu à venir. Dans un jeu comme World of Warcraft, il donne accès à des informations extrêmement détaillées sur les éléments de l’univers tels que les zones de farming et les patterns des adversaires. Dans Minecraft, il révèle des petites histoires parfois amusantes, parfois étranges (voire déstabilisantes). En fait, le code d’un jeu fourmille de détails sur la manière dont il a été produit. Comme l’explique le data miner Ehm, “il est fascinant d'avoir un aperçu de ce qui aurait pu être inclus dans un jeu. À l'instar des reportages sur les coulisses d'un film, l'exploration des données d'un soft donne l’impression d’accéder aux coulisses. Les ressources inutilisées racontent souvent, d'une manière ou d'une autre, une histoire sur le développement du titre. Parfois, vous pouvez même trouver un message caché du développeur qui vous renseignera littéralement sur le développement du jeu”.
Tels des chasseurs d’or munis de tamis, les data miners passent le code de nos jeux au peigne fin avec l’excitation de dévoiler un contenu enfoui qui fera peut-être briller les yeux du public. Considérés comme des éléments indispensables par toute une communauté de joueurs, ces enquêteurs 2.0 creusent dans une zone grise globalement désertée par les autorités. De quoi les laisser éprouver le frisson de la piraterie au calme, sans qu’ils n’aient à s’adonner à des actes de hacking trop barbares. Sous le regard circonspect des éditeurs.