De la pédagogie de l’objet à l’objet pédagogique : Google comme instrument didactique paramétrable au service des enseignants

Martin-Gomez Francisco,

Chevalier Aline

Université Toulouse 2 Jean Jaurès, France

 

 

1. Introduction

Face au flot d’informations absolument fantastique qui saturent chaque jour un peu plus nos perceptions et dont la « maîtrise » est apparue progressivement comme un enjeu scolaire majeur,  une  compétence nouvelle a progressivement été formalisée et introduite dans la formation obligatoire des élèves français : savoir rechercher de l’information (objectif de connaissances et de compétences pour la maîtrise du socle commun, domaine 2 : des méthodes et outils pour apprendre). S’il apparaît désormais évident qu’Internet, en tant que système d’information agrégeant plus de 91% des recherches d’information (Boubée et Tricot, 2011) domine sans partage les autres modes d’accès à l’information, il reste toutefois encore nécessaire de savoir y trouver et retrouver l’information adéquate pour pouvoir l’utiliser. Le web, tout à la fois outil et produit de la transition numérique de l’information, permet en cela deux modalités distinctes : naviguer ou utiliser un moteur de recherche.

 

L’usage des moteurs de recherche

Si ces deux options coexistent depuis les débuts, il est depuis plus de 10 ans établi que la préférence des utilisateurs se porte largement sur la seconde (Griffiths et Brophy, 2005), la navigation n’étant plus considérée comme une médiation (ou stratégie) efficace face au progrès d’usage (à défaut de les qualifier de technologiques) qu’ont connu les moteurs de recherche. Ainsi, en multipliant mécaniquement les espaces d’informations rencontrés et visités successivement, cette stratégie de navigation peut renchérir le coût cognitifs de la tâche (par exemple en rendant la discrimination des documents plus difficile) et entrer en conflit avec notre tendance à l’économie de moyens  ou « avarice cognitive » (Miura et al., 2006) ; pour finir par être rejetée. La navigation, enfin, génère des phénomènes de frustrations fortes, comme la désorientation, l’impression de tourner en rond (perte du but informationnel) ou l’impression de perte de temps, qui nuisent la résolution de la tâche de recherche (Boubée, 2008).

D’autres auteurs confirmeront par la suite cette préférence, en observant en outre que l’usage d’un moteur conditionne bien l’efficacité d’une recherche d’information sur internet : pour Pak et Price (2008), les comportements et performances observées  lors de l’utilisation d’un moteur de recherche détermine en grande partie la réussite ou l’échec de tout le processus de recherche d’information (RI) ; la navigation entre et dans les sites web est secondaire et conditionnées par l’usage des moteurs (Sharit et al., 2008).

 

Google comme porte d’entrée sur le web

Parmi ces outils, il en est un tout particulièrement qui se démarque par l’intensité de son utilisation : avec plus de 90% de requête adressées au niveau mondial et en France en 2016, Google est le champion fonctionnel du web. Ce dernier, sans concurrent sérieux, jalonne le web de ses indexations et ouvre un accès simplifié à des contenus sans cela éparpillés. Il co-construit se faisant certains comportements de recherche, en fournissant par exemple, sinon l’estampille de vérité suffisante pour faire de ses résultats des objets normés auto-suffisants, à tout le moins un « choix satisfaisant » dès les premières occurrences de la (première) page de résultats… depuis 10 ans (Jansen et Spink, 2006).

Malgré tout, il est évident que toute recherche ne peut être résolue, malgré l’utilisation de Google. Différentes raisons peuvent être avancées, mais les plus fréquemment évoquées tiennent dans la limite du savoir accessible via le moteur (phénomène qui semble devoir diminuer dans le temps, la base de données adossée au moteur Google augmentant régulièrement) et/ou la limite du questionnement que l’utilisateur adresse à ce dernier (représentation inadaptée des besoins, des buts). Ainsi, le manque d’informations, de connaissances vis-à-vis du sujet de recherche, ou de l’outil, peuvent gêner la résolution d’une recherche.

 

Expertise et complexité de la tâche : concevoir une formation documentaire

·          Résolution de problème et tâche complexe

La première option pédagogique a donc été de former les élèves à l’utilisation de moteurs, dans l’objectif d’en améliorer le rendement individuel (ciblage du sujet et formulation des requêtes, optimisation des mots-clés et de la recherche, sélection et validation des documents proposés). Mais alors, comment caractériser une situation de recherche d’information avec suffisamment de précision pour construire des apprentissages ?

Il est en premier lieu relativement partagé par les chercheurs qu’une situation de recherche d’information est une situation de résolution de problème (Marchionini, 1997 ; Rouet et Tricot, 1998 ; Hearst, 2009). Elle se caractérise en effet par l’absence de procédure de résolution immédiate (Toutain, 2011), un objectif cible à atteindre à partir d’une situation initiale (Newell et Simon, 1972) et différentes solutions et séquences d’actions pour accomplir la tâche (Hoc, 1972). Mais une situation de recherche d’information peut dans un second temps se construire comme une situation complexe. A la suite des critiques formulées par Vakkari (1999), de nombreux auteurs considèrent désormais la recherche d’information sur le web comme une tâche complexe, se caractérisant par plusieurs façons d’atteindre le résultat, plusieurs résultats possibles, une interdépendance conflictuelle entre les différents chemins menant à une bonne réponse, et une incertitude quant aux chemins pour y parvenir (Bell et Ruthven, 2004).

 

·          L’intérêt de analyse expert/novice

L’analyse duale en termes expert-novice couplée à la considération de la complexité et son impact sur la résolution de la tâche peut ici prendre ainsi tout son sens dans la construction des apprentissages documentaires : d’une part, l’observation des caractéristiques expertes définit un « pool » de compétences et savoir-faire à acquérir (les apprenants pouvant en général être considérés comme des novices), tout en déterminant un objectif-cible pédagogique ; d’autre part, cette approche fournit une grille de lecture didactique, permettant de construire une progression, cette dernière étant représentée par la différence entre les comportements initiaux et les comportements experts vers lesquels tendre ; enfin, considérer la complexité de la tâche permet d’appréhender les variation dans la difficulté de résolution et ainsi de planifier l’accès à l’autonomie des élèves (maîtrise des compétences).

 

·          L’effet de la complexité de la tâche

Par complexité, nous entendons ici la « fonction d’incertitude » qu’une situation peut générer, ou plus précisément,  la complexité est comprise ici comme le sentiment d’incertitude que peut provoquer une tâche, quant aux résultats et/ou aux moyens de les atteindre (Vakkari, 1999 ; Byström et Järvelin, 1995). Comme l’a théorisé Morin (1988), il y aura complexité lorsque nous rencontrons une « incompressibilité algorithmique », c’est-à-dire une irréductibilité et indéductibilité à l’avance d’une séquence d’évènements. De nombreuses études, comme celle de Jansen et Spink (2006) sur le comportement type d’un utilisateur de moteur de recherche, ou encore celle de Lorrigo et al. (2005) sur les comportements oculaires d’utilisateur de moteurs de recherche selon les caractéristiques de la tâche, ont montré que la complexité d’une tâche peut ainsi impacter le nombre de requêtes formulées, le nombre de mots-clés utilisés, leurs natures (issus de la question ou inférés), leur type (pertinents/non pertinents), le nombre de pages de résultats étudiées, le temps passé sur ces pages, le nombre de liens étudiés, le temps passé dessus, l’ordre dans lequel ces liens sont étudiés. A cela nous ajouterons les conclusions des études de Chevalier, Maury et Fouquereau (2014) et celle de Monchaux, Amadieux, Chevalier et Mariné (2015). Dans ces études, si les auteurs concluent également que la complexité de la tâche de RI influence le temps de recherche ou le temps passé à naviguer ainsi que la performance des participants, ils précisent toutefois que ce temps supplémentaire provient d’un nombre de relectures plus important des informations (signalant ici une perte de l’information en mémoire de travail ou encore des difficultés de compréhension).

Si l’impact de la complexité de la tâche est désormais reconnue sur les stratégies déployées pour les utilisateurs en situation de recherche d’information, Vakkari (1999), rejoignant ainsi Fox et Tversky (1995) ou Fox et Weber (2002), rappelle que la déterminabilité d’une tâche, c’est-à-dire l’incertitude qui lui est corrélée, varie en fonction des connaissances du sujet sur la tâche. Brewer (2003) précisera que la représentation mentale qu’un individu se fait d’une situation de recherche d’information permet à ce dernier de mieux planifier et comprendre les réactions de l’environnement. Ainsi, plus un individu comprend finement la tâche et plus il sera capable de mettre en œuvre les bonne procédures et stratégies amenant la résolution. C’est ici l’impact de l’expertise qui est soulevé.

Comme le rappellent Dinet, Chevalier et Tricot (2012), l’expertise est essentiellement étudiée sous deux angles distincts dans la recherche : l’expertise liée au domaine et l’expertise dans la recherche d’information. L’expertise liée au domaine peut se définir comme l’ensemble des connaissances directement impliquées dans le thème de la recherche d’information (également appelées connaissances antérieures), alors que l’expertise liée à la recherche d’information se réfère aux savoir-faire et compétences techniques liés à l’utilisation des supports et des outils de recherche tels que les navigateurs ou les moteurs de recherches. Ces deux expertises s’articulent et peuvent se compenser dans l’action : Fields et al. (2005), cités dans Dinet et al. (2012), testant les comportements de recherche de documentaliste-bibliothécaires versus des experts du domaine (médecine), montrent ainsi que les bibliothécaires compensent leur manque de connaissances du domaine par leurs qualités techniques dans l’usage de l’outil de recherche supérieures.

Et malgré les critiques épistémologiques de Boubée et Tricot (2011) sur les constructions expérimentales reposant sur la distinction expert/novice, notamment parce qu’il est difficile de pouvoir classer des élèves comme véritablement novices si on considère les effets métacognitifs et les phénomènes de transferts de compétences, les biais dans le recueils des données ou la définition des tâches, nous avons pour notre part fait le choix de construire cette étude sur les effets des connaissances antérieures (expertise domaine). En effet, pour Brand-Gruvel, Wopereis et Walvaren (2009), les compétences de base déterminantes dans une RI sont : capacité langagière (lecture-compréhension), capacités d’évaluation, et les capacités techniques de maîtrise des environnements numériques. Puisque nos participants ont tous reçu, en amont de l’expérimentation, une formation documentaire identique, incluant une formation[1] spécifique à la recherche d’information sur le moteur Google (dans le cadre de leur formation obligatoire en collège, sur une durée de plusieurs heures), le rôle des capacités langagières et d’évaluation s’en trouvent renforcer et devraient être déterminantes dans la réussite de ces tâches. Or, ce sont pour nous des compétences dont la maîtrise relève de l’expertise du domaine. Enfin, les tâches de RI ont été conçues en considération de l’écologie scolaire de ces élèves, c’est-à-dire inscrites dans un processus d’apprentissage disciplinaire (ici l’histoire), qui repose avant tout dans une tension entre une situation initiale de novice (petite base de connaissances) et une situation finale  de plus grande expertise (plus grande base de connaissances).

 

·          L’effet des connaissances antérieures sur le sujet

Lazonder, Biemans et Wopereis (2000), en basant leurs mesures de performances sur le temps, la réussite dans la tâche et l’efficacité, ont montré que les experts sont plus rapides et plus efficaces que les novices. Marchionini (1995),  Brand-Gruwel et al. (2005) ou encore Ford et al. (2005) cité par Dinet et al. (2012) ont également tiré des conclusions similaires dans leurs études respectives. Pour ces derniers, les experts planifient davantage et préparent leurs activités de recherche, ce qui expliquerait pour partie ces différences de performances et d’efficacité. Ce que Chevalier et Kicka (2006) ou encore Tabatai et Shore (2005) confirment de leurs côtés. Dans cette optique, Sternberg (1998) propose de qualifier les experts par l’ensemble de caractéristiques suivantes : moins de temps de recherche d’informations, une meilleure représentation du problème (à mettre en correspondance avec une plus grande planification), un temps de résolution plus court et une plus grande précision dans la construction de la résolution du problème. L’auteur parle de schémas « riches et bien organisés ». Cette expertise et ces schémas impactent de façon transversale la recherche d’information. En effet, la capacité à viser/juger de l’essentiel, cette reconnaissance de l’information importante, se manifeste des « deux côtés » de la recherche d’information, et notamment au niveau de l’évaluation des résultats, puisque ces derniers étudient les textes rencontrés en filtrant l’information pertinente ou évaluant les sites en s’appuyant sur leur base de connaissance, à partir de critères préétablis. Chevalier et Kicka (2006) ainsi que Tabatabai et Shore (2005) précisent en outre que les experts explorent moins de sites web, activent moins de liens, connaissent moins de réitération de requêtes.

Enfin, Karlsson et al. (2012), à la suite de Tabatabai et Luconi (1998), en étudiant plus précisément les manifestations langagières des experts, observent une sélection de mots-clés défaillantes et vide de sens (laissent de côtés des concepts essentiels) précisent ainsi qu’un utilisateur « expert du domaine » disposera d’un vocabulaire spécifique à la tâche beaucoup plus étendu, lui permettant de construire des requêtes plus sophistiquées (plus de mots-clés), précises ou variées qu’un novice.

 

Conceptualisation de l’activité de recherche

·          Les modèles de RI

Du point de vue de la psychologie cognitive et de l’ergonomie cognitive, en s’appuyant sur la conceptualisation du modèle de Sharit, Hernandez, Czaja et Pirolli (2008) et sur celle du modèle CoLIDeS (2000) de Kitajima, Blackmon et Polson, il est possible de construire une suite d’actions générique de la recherche d’information sur Internet via un moteur de recherche (ici Google) : générer des mots-clés pertinents pour les requêtes, évaluer la pertinence des résultats fournis par le moteur de recherche et sélectionner un ou plusieurs liens à activer (sites/pages web à visiter). Cette suite d’action, dans le prolongement des travaux sur le modèle CoLIDeS, s’articulent selon deux processus ascendant et descendant : d’une part l’usager se base sur les caractéristiques physiques et/ou de surface d’une page web (ascendant ou bottom-up), et d’autre part ce même usager utilise ses connaissances pour faire des choix et prendre des décisions (top-down).

Dans la logique de ces modèles, l’expertise et la complexité exercent ainsi une influence dans les comportements et stratégies des utilisateurs à chaque étape de la recherche, comme nous en avons détaillés les effets précédemment. Lorsque le moteur de recherche ne fournit pas de documents pertinents (ou reconnus/jugés comme tels), l’activité de recherche devient plus complexe et il devient nécessaire pour les utilisateurs de reformuler leurs requêtes, partiellement (en rajoutant, éliminant ou rajoutant des mots), ou totalement (en modifiant l’ensemble des mots-clés composant la requête initiale). Cette modification requiert que les individus modifient leur représentation du but et/ou leur stratégie pour l’atteindre, ce qui impactera en retour leur lecture des résultats fournit par le moteur et leur exploration. Cette modification repose sur la fluence verbale (stock lexico-sémantique et processus stratégique de récupération des mots en mémoire) de chaque individu, influencée par les connaissances antérieures sur le domaine.

 

·          Conception du processus informationnel

D’une manière générale, la conception du processus informationnel que nous utilisons dans cette étude est celle d’une série de choix basée sur des hypothèses élaborées à partir des expériences passées, inspirée en grande partie par les travaux pionniers de Kulthau (1991, 2004). Ces hypothèses ou anticipations peuvent varier entre les individus, ne serait-ce qu’en raison d’une polyreprésentation des objets informationnels (Ingwersen, 1996) : nous ne possédons en effet pas la même compréhension-représentation mentale d’une information identique. Mais à la différence de Kulthau, nous considérons les choix comme situés et relevant de l’écologie globale de la tâche de recherche d’information. Comme Hollnagel (1991), nous pensons que tenter d’analyser la cognition humaine dans une perspective de fiabilité des processus technologiquement intermédiés implique nécessairement que l’homme et la machine soient appréhendés dans leurs interactions. Il est incontournable d’intégrer le système technique comme une composante de l’activité de recherche humaine. Ainsi, Ingwersen (1992, 1996), dont les études furent reprises par Dinet (2014), propose un cadre méthodologique intéressant pour cette étude. Celui-ci consiste à construire l’analyse de la recherche d’information en considérant les interactions entre : l’espace cognitif de l’individu (représentation du besoin, des buts et sous-buts, compréhension consigne), l’espace technique lié au système de recherche d’information (avec ses logiques formelles sous-jacentes), les informations stockées en mémoire de l’individu (connaissances) et les informations contenues dans le système technique. L’état des trois entités se modifie mutuellement au cours de la recherche.

 

·          Hypothèses sur les processus cognitifs de l’usager

Les deux modèles qui ont servi à construire notre conceptualisation s’inscrivant dans la logique des travaux de Kintsch et Van Dijk (1978), prolongés par ceux de Kintsch (1998) et de son modèle de construction-compréhension (1988), nous précisons que le processus de compréhension des documents rencontrés par les apprenants est, dans la présente étude, considéré comme un processus de représentation mentale du contenu. Ce processus mobilise deux sources principales d’informations : l’information rencontrée et les connaissances du sujet. Cette élaboration particulière est ainsi un processus fortement incrémental relevant d’un traitement ascendant (bottom-up) dirigé par les données rencontrées et consistant à intégrer ces informations en cours de traitement à la représentation initialement construite (et donc aux connaissances stockées en MLT).

 

·          Hypothèses expérimentales et problématique

L’étude utilisée ici s’est fixée pour objectif de contribuer à la compréhension et aux développement des connaissances sur les comportements d’utilisateurs en situation de recherche d’informations sur le web avec un moteur de recherche, tout en se proposant de fournir un appui théorique supplémentaire au développement de séances pédagogiques reposant sur l’utilisation spécifique de Google, adaptés aux besoins de formation et aux caractéristiques des utilisateurs de collège. Nous nous sommes plus particulièrement interrogés sur les effets des connaissances antérieures sur le domaine d’étude et de la complexité de la tâche sur la recherche d’information, en discutant d’une possible refonte des contenus de formation documentaire des élèves. Sur un plan théorique, les connaissances des comportements d’utilisateurs adultes en situation de recherche d’informations sur internet via un moteur de recherche sont déjà relativement développées, mais les études sur une population juvénile restent moins fréquentes. En outre, nous avons particulièrement orientée cette étude sur l’aspect le plus délicat pour des élèves du secondaire (collège), la fluence verbale, avec des analyses nombreuses liés aux mots-clés. Enfin, les dernières évolutions techniques des algorithmes qui sous-tendent Google semblent questionner la pratique enseignante et l’utilité des formations à la maîtrise de l’information, pour ne pas en précipiter l’obsolescence. Comme le souligne Boubée et Tricot (2011), ce qui manque actuellement le plus en ce qui concerne la formation des élèves et des enseignants, c’est de réintégrer la situation d’apprentissage en tant que telle, de comprendre comment accompagner l’activité en train de se dérouler. Pour cela, il est utile de prendre appui sur ce que font réellement les élèves « en cours d’action », de considérer ce qui, dans « l’écologie de la tâche », est utilisé par les jeunes comme stratégie d’allègement ou ce qui aide et rend possible l’accomplissement du processus de RI. Identifier les composantes cognitives des nouvelles stratégies déployées par les élèves pourrait en miroir permettre de compléter le cadre théorique de la RI. Ainsi outillé, il deviendrait finalement possible de repenser tout ou partie de la formation documentaire en considérant l’expertise réelle des élèves, et de (re)définir de nouvelles compétences au regard de l’évolution de leur environnement informationnel. ; se demander comment utiliser Google pour façonner  des séquences pédagogiques, et passer ainsi de la pédagogie de l’objet (apprendre à utiliser Google), à l’objet pédagogique (Google comme support d’apprentissage et outil didactique disciplinaire). La littérature sur le sujet (recherche d’information juvénile, usage d’un moteur de recherche spécifique, tâche écologique) permet en effet peu de conclusions formatives.

 

A cette fin, nous avons proposé à deux groupes d’élèves de fin de collège, (4ème et 3ème) relevant chacun de connaissances antérieures différentes sur le sujet (un groupe d’expert, un groupe de novice), de répondre à des séries de questions de recherche (tâches de RI) allant de simple à plus complexes. Utiliser une stratégie analytique sur le web (moteur de recherche), implique, comme nous l’avons évoqué, une étape initiale de planification dont la requête est le produit fonctionnel. C’est l’élément nécessaire pour initier le cours d’actions qui conduira à résoudre le problème de la tâche de recherche. Dans cette étape de planification, l’utilisateur définit son besoin et construit un but opérationnel. Plus ses connaissances sur le sujet sont étendues, plus ce dernier sera précis. Dans le cadre d’une recherche d’information sur moteur de recherche, nous nous attendons donc à ce que les novices manifestent de plus grandes difficultés langagières que les experts, se traduisant par des requêtes plus courte (moins de mots, la longueur d’une requête pouvant se voir comme un indicateur de la précision de la définition du besoin), moins précises (plus de mots-clés vides et moins de mots-clés pleins) et moins sophistiquées (peu de mots dérivés/inférés, mots utilisés essentiellement issus de la question, grande présence de langage naturel) puisqu’il est relativement admis que l’expertise référentielle influence la production de termes spécifiques (Dinet, 2014). Le manque de vocabulaire spécifique lié l’absence de familiarité, la faiblesse de la « base de connaissances », la pauvreté du modèle mental, qui se traduit dans la formulation de requête, se manifeste ensuite lors des étapes suivantes. Cette mauvaise qualité de requête génère ainsi un bruit documentaire (trop de documents par manque de précision de la requête, et/ou des documents de mauvaise qualité) qui doit gêner la reconstruction dynamique du but en cours de recherche, en pénalisant la sélection dans les résultats et dans l’information disponible. Nous nous attendons donc à ce que les novices formulent plus de requêtes et relisent davantage la consigne. Nous nous attendons également à ce qu’ils explorent plus de document (nombre de documents visités plus importants, profondeur plus importante) que les experts. Avec un taux d’exploration des résultats (efficience exploratoire : nombre de liens cliqués / nombre de requêtes) plus faibles. En lien avec ces différentes hypothèses, nous nous attendions enfin à ce que les experts aient de meilleures performances en termes de résultats (scores plus élevés) et de temps (durée plus courtes). Nous supposions également un effet lié de la complexité de la tâche

 



[1] Cette méthodologie de mise à niveau avant une expérimentation a déjà été utilisée par Dommes, Chevalier et Lia (2011) pour lisser les différences entre jeunes et âgés, et nous pensons également qu’un tel apprentissage neutralise les effets des différences individuelles initiales dans l’expertise technique liés à l’outil et aux procédures de RI, en positionnant nos deux groupes dans un niveau de maîtrise similaire.