STIC:STIC III (2018)/Physicalisation de statistiques au hockey sur glace

De EduTech Wiki
Aller à la navigation Aller à la recherche
Physicalisation de données
Module: STIC:STIC III (2018)/Projets
brouillon débutant
2019/09/02

Description du projet

Ce projet créé dans le cadre du cours STIC III a pour but de proposer des visualisations évocatrices des statistiques de hockey sur glace. Elle se reposera sur un parser XML écrit en php, qui produira une heatmap qui sera déclinée sur divers supports.

Ce projet est en construction est sera terminé d'ici fin août 2019.

Objectifs

La compréhension de données statistiques est une tâche difficile, surtout lorsqu'elles sont présentées dans un tableau (la situation actuelle). Il existe actuellement des représentations visuelles assez basiques qui consistent à indiquer l'emplacement d'une action de jeu à l'endroit où elle a eu lieu. Bien que ces représentations graphiques en deux dimensions possède une certaine affordance elles ont comme faiblesse de ne pas fournir d'indications quant à la concentration des actions qui peuvent se superposer. Ce problème s'amplifie lorsque le nombres d'actions augmente.

Projet 1 - Heatmap en 3D des tirs cadrés

Dans ce projet je vais imprimer en 3D une réplique de patinoire dont la topographie indiquera l'emplacement et la quantité de tirs cadrés.

Pour mener à bien ce projet il y a plusieurs défis à relever.

  • En premier lieu il faudra récupérer les données saisies sous un format utilisable par l'ordinateur (actuellement elles sont sous une forme visuelle).
  • Dans un deuxième temps il faudra développer un algorithme d'interprétation des données.
  • Ensuite il faudra développer un algorithme permettant de produire des objets tangibles à partir de ces données.

Les données statistiques sont exportées au format XML. Le fichier obtenu ressemble à ce qui suit.

<GAMEACTION>
			<TEAM>Flaming Eagles HC</TEAM>
			<TIME>3756</TIME>
			<TYPE>SHOT</TYPE>
			<DETAIL>SOG</DETAIL>
			<SS>5-5</SS>
			<SCORER>24</SCORER>
			<PLUS1>3</PLUS1>
			<PLUS2>11</PLUS2>
			<PLUS3>16</PLUS3>
			<PLUS4>25</PLUS4>
			<PLUS5>24</PLUS5>
			<PLUS6>14</PLUS6>
			<GK>14</GK>
			<GK_OPPONENT>149</GK_OPPONENT>
			<DATETIME>1541271623</DATETIME>
			<PERIOD>1</PERIOD>
			<POSITION_X>4.691489</POSITION_X>
			<POSITION_Y>20.90425</POSITION_Y>
			<POSITION>L-POINT</POSITION>
			<ZONE>OFFENSIVE</ZONE>
		</GAMEACTION>

Pour réaliser ma heatmap je vais avoir besoin des éléments suivants :

  • <DETAIL> pour identifier si il s'agi d'un tir cadré
  • <POSITION_X> et <POSITION_Y> pour pouvoir y situer sur la surface de jeu.

Il y a là un premier problème, je ne sais pas à quoi correspondent ces valeurs. Où se trouve le 0 ? Quel est le maximum ? Après avoir placé des données dans les coins de la patinoire j'ai pu déterminer que les positions vont de 0 à 30 sur l'axe des X (petit côté de la patinoire) et de 0 à 60 pour l'axe des Y (long côté). C'est assez logique puisque une patinoire européenne fait 30m*60m.

L'algorithme que je vais mettre en place devra donc extraire les positions X et Y de tous les tirs cadrés (SOG).

Démarche

La première étape est la collecte de données, ces données ayant déjà été collectées je peux passer à l'étape suivante qui consiste à extraire les données pertinentes. Pour ce faire je vais coder un algorithme utilisant XPath qui me permettra de cibler les GAMEACTION correspondant à un tir cadré, puis à en récupérer la position.

Description de l'algorithme d'analyse syntaxique (parsing)

  • Scanner le dossier dans lequel se trouve les fichiers XML, placer leurs noms dans un array et les passer au parser.
  • Repérer tous les tirs cadrés d'une équipe dans le XML avec XPath et les placer dans un array (ces paramètres seront des arguments, utile si on veut travailler sur d'autres équipes ou d'autres actions de jeu).
  • L'array créé par SimpleXML contient des objets, il faut donc récupérer les valeurs contenues dans les objets les arrondir et les push dans un autre array.
  • Ensuite on crée un tableau (multidimensional array) que l'on rempli de 0.
  • Pour remplir les case correspondantes à chaque tir on récupère chaque paire de coordonnées (un x et un y), et ensuite on incrémente la case du tableau correspondant.
  • On répète l'opération pour tous les fichiers présents dans le dossier.
  • On exporte le tableau dans le dossier de travail.

Le code s'exécute en ligne de commande mais on pourrait imaginer lui donner une interface utilisateur dans le navigateur. L'avantage de l'exécution en ligne de commande est de s'affranchir de la durée d'exécution maximale. On peut augmenter cette valeur en modifiant php.ini cependant cela ne devrait pas être nécessaire.

Afin de respecter les bonnes pratiques l'utilisateur n'appelle pas directement le parser mais un script unique qui s'occupe lui d'appeler les autres fonctions.

Code du parser

Le code est disponible sur GitHub (le lien va suivre).

Ressources