Archives pour la catégorie PokemonSaSProject

#PokémonSaS Project at the CSDH/SCHN 2020 Conference

I will be presenting the text mining project on the Pokémon Sword and Shield Twitter community that I previously introduced a few weeks ago at this year’s CSDH/SCHN conference on June 5th. Academic associations are facing the challenge of quickly adapting their summer conferences to a format suitable for online exchanges in the context of the ongoing epidemic. This involves, amongst other things, less time dedicated to formal presentations and more emphasis on questions, which is, in my opinion, the most beneficiary part of the whole process. I am looking forward to hearing about new developments in digital scholarship, and discussing future avenues for the analysis of our database.

Meanwhile, you can access the conference paper on Humanities Commons, and a visualization of our Twitter corpus on Tableau public.

La Twittosphère de Pokémon: Épée et Bouclier (1)

Un des objectifs de mon stage postdoctoral à l’UQAM est de développer une méthodologie de travail intégrant l’analyse de données textuelles massives à l’étude du jeu vidéo sous l’angle communicationnel. Afin d’arrimer ce projet aux orientations de recherche du groupe Homo Ludens, j’ai décidé de former un corpus de travail constitué de courtes publications produites par les utilisateurs de réseaux socionumériques autour d’un jeu précis afin d’évaluer s’il est possible de cerner une définition émergente des mécaniques de jeu. Ce corpus me permettra aussi de constituer une base de données par laquelle je pourrai tester plusieurs outils de fouille de texte. Ayant formulé ce plan au début de la session d’automne, j’ai  naturellement choisi de bâtir mon corpus autour des Tweets reliés au jeu Pokémon Épée et Bouclier qui allait être publié par Nintendo dans les semaines suivantes. J’estimais à l’époque que le succès commercial presque assuré du jeu allait me fournir beaucoup de matériel de recherche.

Je n’avais pas tort.

La première moitié du corpus est constituée d’environ 210,000 Tweets publiés avant la sortie du jeu le 15 novembre 2019. Je suis maintenant en mesure de partager certains résultats préliminaires qui mettent en évidence l’influence de Nintendo sur la production de contenu de la plateforme ainsi que l’importance d’une approche de recherche multilingue.

 

Prerelease total

Le graphique représentant le nombre total de Tweets publiés au cours de cette période permet de constater la lente, mais constante progression du nombre de publications ainsi que l’impact direct des stratégies de mise en marché de Nintendo. Par exemple, l’augmentation soudaine du nombre de Tweets le 4 octobre semble avoir un lien direct avec le mystérieux livestream diffusé pendant 24 heures sur YouTube. Il en va de même pour chaque période de haute production de tweets. En général, elles semblent provoquées par une annonce importante comme la diffusion d’un Nintendo Direct. L’émergence du mot-clic #Dexit aux environs du 9 novembre par lequel les fans ont ouvertement critiqué le contenu limité du jeu fait exception à cette observation. Je serai bientôt en mesure de préciser puis d’expliciter ces phénomènes dans la suite de ce processus de recherche.

Prerelease distribution

La question la plus souvent posée à propos de ce projet est la pertinence d’utiliser Twitter plutôt que Reddit ou Facebook comme corpus. Ce graphique illustre l’une de ces raisons : la forte présence de publications en japonais. Ce phénomène permet l’analyse comparative de Tweets écrits en trois langues différentes, tout en faisant ressortir leurs champs sémantiques distincts. Les divergences et similitudes observées feront l’objet d’études ultérieures.

Je prévois terminer la collecte de données à la fin janvier. Le corpus sera alors constitué de près de trois millions de Tweets publiés sur une période de cinq mois, donc divisibles en deux périodes comparables de deux mois et demi. Je serai en mesure d’aborder l’analyse de la seconde moitié du corpus dans un prochain billet.