La linguistique surprenante des commentaires Facebook – Entités nommées et relations

Voici le second billet d’une série portant sur l’analyse du contenu textuel de commentaires Facebook en lien avec des articles de la presse écrite. Le premier billet peut être lu ici.

Introduction

Alors que le premier billet traitait des attributs linguistiques des commentaires, nous nous intéressons ici aux entités nommées, aux prises de parole et aux relations entre les commentaires.

Entités nommées

Lieu

Georgalou [6] décrit différentes approches pour identifier les marqueurs de localisation dans les commentaires sur Facebook. Tout d’abord, il y a l’usage de toponymes et d’anthroponymes (en particulier les gentilés). La localisation peut aussi être liée à un élément culturel (site touristique, régime alimentaire, évènement), à une personnification (nationalité, appartenance ou personnalités politiques) ou à une relativisation (par des adverbes ou adjectifs démonstratifs).

Observations: Il sera essentiel de pouvoir ramener ces différents marqueurs de localisation à une forme normalisée pour en faire l’analyse et la comparaison avec les entités présentes dans le texte de l’article en question. De plus, il sera nécessaire ici de pouvoir utiliser une notion de méronymie ou d’holonymie dans la représentation pour en établir la pertinence. Un index géographique composé de données sémantiques telles que la base de données GeoNames sera très utile pour cette tâche.

Temps

Toujours selon Georgalou [6], différents types de marqueurs temporels sont utilisés dans les commentaires. Ces marqueurs peuvent représenter des durées, des moments, des références à des évènements historiques ou culturels, mais souvent aussi une référence relative à l’âge (anniversaire, évènement, génération ou cohorte) ou à une expérience vécue par l’utilisateur.

Le temps peut aussi être mesuré avec un nombre d’évènements. Certaines formes de ponctuation ou d’interjections peuvent exagérer la portée d’un marqueur temporel. On pourrait aussi ajouter la présence d’émojis représentant des concepts temporels. Tout comme pour les lieux, on peut aussi retrouver des adverbes.

Observations: Pour utiliser ces entités mentionnées dans les commentaires dans la mesure de leur pertinence, il sera nécessaire de:

  • bien identifier les marqueurs de temps dans l’article;
  • extraire les dates des évènements cités;
  • mesurer les durées entre ces différents instants.

Prise de parole

Expertise

Georgalou démontre aussi l’usage des commentaires sur Facebook pour prétendre à une forme d’expertise, étaler sa culture et son éducation et aussi s’approprier la maîtrise d’un sujet. Le réseau social est utilisé pour projeter une image positive du niveau d’éducation par les utilisateurs.

Cette expertise est illustrée par:

  • le choix de vocabulaire spécifique au domaine professionnel ou éducatif;
  • l’usage de phrases impératives ou interrogatives;
  • le jugement parfois sarcastique du travail des autres;
  • l’ajout de références en lien avec le domaine d’expertise.

Observations: Pour mesurer la pertinence de cette expertise avec le contenu de l’article, il faudra identifier les principaux sujets de celui-ci. Puis, constater si au moins un d’entre eux correspond à l’expertise prétendue par l’utilisateur.

Position

La prise de position relie le commentaire aux réalités socioculturelles traitées dans l’article journalistique. Ces positions sont exprimées par des adjectifs et des adverbes évaluatifs, des verbes affectifs et cognitifs, des modalités, des pronoms génériques, de l’ironie, des questions rhétoriques, des citations ainsi que l’utilisation de mécanismes d’emphase. On notera aussi l’usage de nombreuses images, notamment les memes, quoique ce n’est pas le sujet de ce rapport.

Observations: On remarque ici que l’on devra utiliser des étiquettes plus détaillées que celles qu’on retrouve notamment dans Universal Dependancies [1] pour identifier les parties du discours impliquées dans la prise de position. Pour ce faire, il sera nécessaire d’utiliser conjointement les parties du discours et une base sémantique telle que WordNet pour augmenter le niveau de détail contenu dans les étiquettes.

Relations entre les commentaires

Halté [7] caractérise le clavardage par:

  • l’intermittence entre la discussion synchrone et asynchrone,
  • la forte présence d’indices contextuels,
  • les tours de parole segmentés,
  • les conversations entrelacées,
  • la présence ou l’absence de séparations syntaxiques et
  • la présence de mécanismes d’emphase.

Observations: Ces caractéristiques du clavardage sont à considérer dans l’étude de la pertinence des commentaires par rapport à un article. On ne retrouve pas seulement qu’une relation entre le commentaire et l’article, mais aussi un ensemble de relations entre les commentaires.

Les types de relations

Ces types de relations peuvent, en quelque sorte, constituer une mesure qui représente la variable réponse dans un modèle de classification

  • L’intertextualité se définit comme la relation du commentaire avec les commentaires précédents, ainsi qu’avec la publication originale. C’est le concept qui peut être représenté par une mesure de distance entre les commentaires, ainsi qu’entre un commentaire et la publication. Dans Facebook, les commentaires qui répondent à un autre commentaire sont organisés sous une structure parent-enfant.
  • L’interdiscursivité se définit comme l’entrecroisement de différents dialogues indépendants, dans un même fil de discussion.
  • Les commentaires peuvent ainsi parfois être associés à la mauvaise discussion et mener à des quiproquos ou à des interprétations humoristiques. C’est pourquoi sur Facebook, fort heureusement, plusieurs utilisateurs vont identifier l’interlocuteur précédent dans un commentaire à l’aide de son nom d’utilisateur.
  • Il sera important de pouvoir associer le commentaire au bon fil de discussion pour en mesurer la pertinence. Pour identifier cette propriété dans les commentaires, un classificateur pourra apposer une étiquette à un commentaire qui indique à quel dialogue il appartient.
  • La multimodalité se définit comme l’interchangeabilité des différents modes de communication au sein d’une même discussion. C’est l’aspect multimédia des discussions sur les réseaux sociaux, où le texte, les images et les vidéos se succèdent.
  • On pourrait ici mesurer le nombre de changements de modalité du discours dans une même discussion. Il faut noter cependant que cette fonctionnalité peut être désactivée par le propriétaire de la page.

Suite

La suite de ce projet dans les prochains billets !

Billet(s) précédent(s)

Billets suivants

Références

[1] 2019. Universal Dependencies 2.5. Consulté à l’adresse http://hdl.handle.net/11234/1-3105

[6] Mariza Georgalou. 2017. Discourse and identity on Facebook. Bloomsbury Academic, an imprint of Bloomsbury Publishing Plc, London. Consulté à l’adresse http://ariane.ulaval.ca/cgi-bin/recherche.cgi?qu=a2650955

[7] Pierre Halté. 2018. Les émoticônes et des interjections dans le tchat. Lambert-Lucas, Limoges. Consulté à l’adresse http://ariane.ulaval.ca/cgi-bin/recherche.cgi?qu=a2767912