Le dessous des textes : l'analyse de textes assistée par ordinateur

Tropes : un outil d'analyse sémantique


  Utilisation du logiciel : objectifs, méthodologie, applications
  Un exemple d'application : l'étude comparée de deux textes
      (classe de terminale)
  La recherche de textes d'intérêt historique, numérisés, accessibles en ligne
   Analyses sémantiques et lexicales : autres ressources
   Informations pratiques et ressources en ligne sur le logiciel Tropes

Des mots-clefs : Sémantique historique - Syntaxe historique - Discours et communication politique - Recherche d'information - Recherche documentaire - Gestion des connaissances - Indexation intelligente - Linguistique - Analyse sémantique. Corpus textuels - Statistique lexicale - Traitements automatiques - Analyse syntaxique automatique.

Retour - Haut de page - contacts   

CarreBleu.JPG (661 octets) Utilisation du logiciel : objectifs, méthodologie, applications

>> Objectifs pédagogiques :

- étude comparée de textes (historiques principalement) à travers leur analyse sémantique et lexicométrique,
- découvertes des outils informatisés d’analyse de textes (ATO),
- analyse sémantique très rapide et visuelle,
- réflexion autour de notions et mots-clefs, pouvant constituer une préparation intéressante aux méthodes de recherche dans l'univers numérique (en ligne ou hors ligne),
- propice à des travaux interdisciplinaires (avec les enseignants de français tout particulièrement)


>> Méthodologie, mise en oeuvre, organisation

Précautions et conseils méthodologiques :

- Convertir les fichiers textes à traiter en .txt
- Si l’on veut faire un travail comparatif, il est souhaitable de le faire sur des textes de longueur (nombre de caractères) comparables : un comptage par les fonctions "statistiques" du logiciel de traitement de textes le permet sans difficulté.
- Mais veiller également (cf. ci-dessous) à ce que ces textes soient de nature comparable pour éviter des biais méthodologiques. A moins que ce ne soit ce que l'on recherche : comparaison des discours tenus face à des récepteurs différents sur des événements identiques, modifications des registres de langue. L'utilisation de textes traduits peut entraîner des biais : à tester.

Organisation

- En salle informatique : en binômes d’élèves chacun d’entre eux travaillant sur un texte dans la perspective d’une mise en commun comparée ; ou de manière individuelle, indépendante, chaque élève ayant l’ensemble de la comparaison à traiter ou une seule partie en vue d’une mise en commun ultérieure en classe.
- Avec une classe entière ou une partie de classe, possibilité de travailler de manière collective si l’on dispose d’un vidéo projecteur de qualité suffisante.
- Enfin, en l’absence de moyens informatiques suffisants, on peut envisager un travail sur support papier des documents imprimés.

Mise en oeuvre

- Mise à disposition d’un court « mode d’emploi » pour l’élève, sous une forme papier souhaitable, voire nécessaire : principales fonctionnalités du logiciel, définitions.
- Niveau de guidage de l’activité, de la recherche des élèves :
dans la perspective d'un travail actif et direct des élèves avec ce type de logiciel, il est souhaitable de baliser précisément le parcours, préciser les attentes et les fonctionnalités du logiciel à utiliser. Il faudra donc prévoir une fiche pour guider et encadrer le travail des élèves.
- Elle peut comporter des questions sur : l’étude des formes de l’énonciation, du style ; l’identification des principaux corpus de références lexicales mobilisés ; la sélection de graphes de relations pertinents pour l’étude comparative ; la recherche des réponses et propositions aberrantes (les erreurs inévitables du logiciel peuvent être l'occasion d'une réflexion sur le langage).


Retour - Haut de page - contacts      


>> Propositions d'applications

Textes de même nature, dans un même contexte. Par exemple :
- Les grands classiques du programme de terminale : "appels" de juin 40 (cf. l'application décrite dans ces pages) ; "rapport" Jdanov et "doctrine" Truman, etc..
- Programmes de candidats aux mêmes élections.
- Propos du même énonciateur sur une même situation mais pour des récepteurs (publics) différents : modifications, adaptations de registres de langues (par exemple, sur un même thème, discours d'un chef de gouvernement face à ses homologues étrangers ou en tournée en province)
- Les éditoriaux de journaux d'opinion différentes sur les mêmes événements : on peut s'inspirer par exemple de cette étude proposée sur le site du CNDP sur les procès de Moscou : www.cndp.fr/tice/teledoc/dossiers/dossier_abattez.htm
- Jugements, appréciations comparés de témoins ou acteurs différents sur des événements identiques (mémoires, récits de voyages, par exemple).
- etc.
- Voir aussi l'exemple présenté dans Le Café Pédagogique :
l'utilisation des compte- rendus analytiques des séances publiques de l'Assemblée Nationale. P
www.cafepedagogique.net/pedago/pratiques/archives/2001/index_5_01.php3#tropes

Étudier une évolution et établir des comparaisons dans le temps :
- L'évolution des "discours" (de même nature : allocutions radiodiffusées, conférences de presse, notices documentaires, par ex.) sur une situation donnée : questions coloniales (Indochine, Algérie, autres), questions européennes, par exemple.
Voir, par exemple, sur ce site, les notices qui accompagnaient des projections de vues à fins éducatives sur l'Algérie de la fin du XIXe siècle et des années 30 (nouvelle fenêtre).
- Lieux et paysages : voir les récits de voyages, les journaux ; le voyage en URSS (Gide, par exemple) ou en Afrique (Leiris, Simenon, Gide, etc.)
- Les déclarations des droits de l'homme ou préambules constitutionnels
- Les discours d'investiture, discours inauguraux ; les voeux des Présidents de la République ; etc.. Discours programmes d'hommes politiques à l'occasion de rendez-vous électoraux espacés dans le temps.
- Évolutions des valeurs, évolutions idéologiques de tout parti, mouvement, syndicat à partir de leurs chartes, rapports introductifs ou actes de Congrès, etc..
- Voir aussi l'exemple présenté dans Le Café Pédagogique : quatre textes parlementaires contemporains de la guerre d'Algérie ont pu être retenus et analysés.
www.cafepedagogique.net/pedago/pratiques/archives/2001/index_5_01.php3#tropes

Autres applications :
- L'analyse peut être réalisée sur un seul document, sans intention comparative.
- On peut aussi, bien entendu, imaginer d'autres types d'applications : en géographie, en ECJS (études des discours de personnalités politiques par exemple, voir l'exemple proposé sur le site de l'éditeur)
- Comparer des travaux d'élèves, tout particulièrement les synthèses des études de documents.


>> Limites, problèmes, difficultés


- Le thesaurus implicite, les unités lexicales retenues, les rapprochements sémantiques proposés (sémantique lexicale), partie immergée du logiciel, ne conviennent pas toujours aux analyses demandées dans nos disciplines, induisant certains biais, voire certaines incohérences. Par exemple : métropole (coloniale) pris au sens de ville. Ce qui est assez rassurant : le regard et le jugement humains, en l’occurrence ceux des élèves et des enseignants, sont encore nécessaires !

- La comparaison des textes ne peut être faite simultanément (on ne peut traiter et ouvrir qu'un seul fichier à la fois). Ce qui suppose de prendre des notes au fur et à mesure de l’investigation, texte par texte. Ou de remplir un fichier traitement de texte sous forme d’un tableau en deux colonnes.

- La version « édition spéciale » proposée par l'éditeur (cf. ci-dessous) comporte certaines limites : elle ne permet pas de faire de copie de texte ou de graphe autrement que par copie, capture d’écran ; les textes traités sont limités à 32.000 caractères (ce qui est cependant largement suffisant pour la plupart de nos besoins)

- Prise en main du logiciel : elle est très simple pour les manipulations elles-mêmes. Plus complexe pour ce qui est de la réflexion sur les informations obtenues.
En cela, il parait difficile d'en envisager l'utilisation au collège ... ou alors avec un partenariat étroit avec les collègues de lettres et un parcours, des objectifs très balisés.

Retour - Haut de page - contacts      

 

CarreBleu.JPG (661 octets)  Un exemple d'application : l'étude comparée de deux textes classiques ("patrimoniaux") en classe de terminale

- Le texte radiophonique du Général de Gaulle - Appel du 18 juin - Cité dans Berstein et Milza, "Histoire Terminale", éditions Hatier, 1998, p. 27

- Pétain annonce aux Français les conditions de l'armistice (25 juin 1940). Philippe Pétain, "Appel du 25 juin 1940" , cité in P.Pétain, "Discours aux Français", édition établie par J.-C. Barbas, Paris, Albin Michel, 1989, pp.63-66.

Les textes exploités ci-dessus peuvent être obtenus, en ligne, à partir du site Cliotexte, entretenu par Patrice Delpin, sur HYPO (serveur WEB de l'enseignement secondaire postobligatoire du Département de l'Instruction Publique à Genève - http://hypo.ge-dip.etat-ge.ch/) :
http://hypo.ge-dip.etat-ge.ch/www/cliotexte/index.html



 
Description de la démarche et principaux résultats (nouvelle fenêtre)

(l'ensemble de la page et de ses images représente environ 150  Ko)



 Quelques éléments d'aide à l'utilisation du logiciel (nouvelle fenêtre)

Sur le site en ligne de l'éditeur du logiciel (Acetic), la présentation :
- du fonctionnement du moteur d'analyse : www.acetic.fr/fonction.htm
- d'un exemple d'analyse de discours : celui prononcé par L. Jospin en date du 23 avril 1995 lors du premier tour des élections présidentielles : www.acetic.fr/fr/guide/tropes/v50/tropes.htm

CarreBleu.JPG (661 octets)   La recherche de textes d'intérêt historique, numérisés, accessibles en ligne :

- Toujours sur Hypo, Athena aiguille sur diverses ressources de textes, en français, en ligne :   http://hypo.ge-dip.etat-ge.ch/www/athena/html/francaut.html
- Daniel Letouzey propose également des textes historiques : http://dletouzey.free.fr/ - www.multimania.com/letouzey/textes/textes.htm
- Sur le site de l'ABU (la Bibliothèque Universelle du CNAM) - http://abu.cnam.fr/index.html - catalogues de textes en ligne, qui propose des recherches d'occurrences sur les textes (en développement : les fréquences) utile pour faire une sélection d'extraits à étudier : http://abu.cnam.fr/BIB/index.html Certains de ces textes d'auteurs (actuellement 282 textes, 99 auteurs) peuvent être intéressants pour l'étude de tel ou tel thème en d'intérêt disciplinaire, ou à travers des projets croisés avec les collègues de lettres. On y trouvera par exemple le "J'accuse" mais aussi Germinal, les journaux de L. Bloy, J. Renard, des récits de voyage (A. Young, Stendhal, etc.) et bien d'autres textes de références.
- Sur le site Gallica, de la BNF -  http://gallica.bnf.fr/  Dernièrement, un corpus de textes consacrés au récit de voyage en France (en développement)
- Le CETE (Centre d'Edition de Textes Electroniques) de l'Université de Nantes : http://palissy.humana.univ-nantes.fr/CETE/CETE.html où l'on peut trouver des textes anciens numérisés. Voir tout particulièrement le Code noir dans ses versions comparées de 1685 et 1724 : http://palissy.humana.univ-nantes.fr/CETE/ANX/XIX/cadre.html
- La digithèque de matériaux juridiques et politiques (constitutions, traités, lois ou arrêts, déclarations officielles, discours, résultats électoraux, etc.), une intéressante banque de données http://mjp.univ-perp.fr
- Pour les textes d'histoire de la pensée économique, penser au fonds P. Taieb présentés par le Centre d'Histoire de la Pensée Économique (CHPE)
http://panoramix.univ-paris1.fr/CHPE/bvtai.html

- Des textes de la Révolution rassemblés par Philippe Royet :
http://membres.tripod.fr/Philippe_Royet/nea_fr/lance.htm
- Penser aussi aux sources textuelles en ligne proposées sur les différents sites gouvernementaux (Assemblée nationale, sénat, Elysée) ou des institutions européennes. Par exemple,
on peut envisager d'utiliser les débats du Sénat ou ceux du Parlement européen. Ces derniers sont accessibles en ligne à partir de : www.europarl.eu.int/home/default_fr.htm
Voir l'application proposée dans le dossier du Café Pédagogique :
www.cafepedagogique.net/pedago/pratiques/archives/2001/index_5_01.php3#tropes
Des textes en ligne sont également disponibles sur les serveurs anglo-saxons :
- Clicnet, répertoire d'écrits politiques en ligne :
www.swarthmore.edu/Humanities/clicnet/litterature/sujets/ecrits.politiques.html
- Les pages de Paul Halsall (Internet History Sourcebooks Project) : www.fordham.edu/halsall/
ou www.fordham.edu/halsall/mod/modsbook.html (histoire moderne)
www.fordham.edu/halsall/mod/modsbook21.html (XIXe)
- A partir du Tennessee Tech History Web Site, accès à d'importantes ressources en ligne en tout lieu, tout temps, toutes langues : www2.tntech.edu/history/edocs.html

Retour - Haut de page - contacts      

 

CarreBleu.JPG (661 octets)  Analyses sémantiques et lexicales : autres ressources

>> Généralités

De nombreux lieux de recherche, publics ou privés s'intéressent à ce type de démarches et d'outils. En effet, les enjeux en sont facilement identifiables : la traduction automatique en ligne, les besoins de l'indexation automatisée (recherche d'information et recherche documentaire, gestion des connaissances, veille et intelligence économique, etc...)

Il s'agit en règle générale de ressources assez spécialisées et souvent très "techniques", mais qui paraissent utiles à ceux qui voudraient approfondir ces démarches, ces outils, éventuellement dans le cadre de partenariats avec des collègues enseignants les lettres, les langues. Plus particulièrement pour des démarches comparatives, il y a là un champ d'investigation à ne pas négliger.

>> Autres présentations pédagogiques

- Le CNDP a assuré la diffusion, dans le cadre d'une collection "Micro-savoirs - Logitexte", d'applications pédagogiques réalisées avec le logiciel Pistes en version ms-dos. Par exemple : l'"analyse d'un journal de guerre 14-18, les études comparées des déclarations des droits de l'homme.
Voir, par exemple : www.fdlm.org/doss/goarant.html
- Des collègues de lettres en évoquent l'exploitation et proposent des études comparatives, par exemple sur le site académique de Rouen :
www.ac-rouen.fr/pedagogie/equipes/lettres/xcd_fran/cdfra.html
www.ac-rouen.fr/pedagogie/equipes/lettres/fiche2/fich_40.htm

- Exemple : un travail de recherche hypertextuelle dans la Comédie humaine :
http://134.59.31.1/~brunet/BALZAC/index.html

>> Informations en ligne sur les questions d'analyse sémantique et lexicale de textes

Les présentations d'outils logiciels en ligne sont intéressantes par elles-mêmes, quel que soit par ailleurs l'intérêt du logiciel (certains sont certainement datés dans leur conception et fonctionnement). Elles permettent de se faire une idée des problèmes rencontrés, des résultats obtenus, d'une méthode à une autre et de se familiariser avec certaines notions.

- Sur le site de l'Institut de linguistique française (ILF - laboratoire du CNRS) - http://ancilla.unice.fr/default.html - la présentation d'Hyperbase avec l'exemple de l'analyse comparée des manifestes des Congrès du PCF (du VIIe au XXIVe) :
http://ancilla.unice.fr/~brunet/pub/hyperbase.html

- Sur le site de « recherche en didactique et acquisition du français en langue maternelle » (DAF) - http://206.167.111.20/daf/ - on aura un cadre conceptuel, un thésaurus. Notons aussi ce lexique des mots-clés très complet sur la didactique de l'enseignement de la langue mais d'intérêt polyvalent : http://206.167.111.20/daf/Lexique.html

- Autres sites de référence sur la recherche en linguistique, l'INALF (Institut National de la Langue Française, du CNRS) - www.inalf.cnrs.fr/ - qui conduit en fait à l'ATILF Analyses et Traitements Informatisés du Lexique Français, une UMR (Unité Mixte de Recherche) regroupant la composante nancéienne de l'INaLF et le laboratoire LANDISCO de l'Université de Nancy 2, www.inalf.cnrs.fr/cgi-bin/atilf.exe .

- Le site ATO (ATO - Analyse de textes par ordinateur) est un centre d'expertise et de consultation en analyse de textes par ordinateur rattaché à la Faculté des Sciences humaines de l'Université du Québec à Montréal) - www.ling.uqam.ca/ato/. Il présente le projet "visibilité" - www.ling.uqam.ca/sato/index.html dont voici les intentions : "Le projet VISIBILITÉ entend tirer profit des immenses possibilités du réseau Internet pour la diffusion d'information aux fins de rendre accessibles, pour une clientèle élargie, un ensemble de ressources en matière d'analyse de textes par ordinateur (ATO).(...) secteur qui, depuis ses origines, rassemble les points de vue de plusieurs disciplines autour de l'«objet textuel ».
La section "outils et méthodes" est intéressante : www.ling.uqam.ca/sato/outils/index.html

- L'ENS St Cloud s'intéresse aussi à ces questions :  www.ens-fcl.fr/recherch/corpus.htm

- Ainsi que la MSH : www.msh-paris.fr/texto à partir duquel on peut accéder aux pages Texto

- Voir aussi le site RIFAL (Réseau international francophone d'aménagement linguistique) de la DGLF (Délégation générale à la langue française) http://mistral.culture.fr/culture/dglf/rifal/garde.htm qui donne accès à diverses ressources sur l'ingéniérie linguistique

- Un autre guide des sites et outils sur l'ingéniérie linguistique : http://linguistinformatique.free.fr/

Retour - Haut de page - contacts      

CarreBleu.JPG (661 octets)  Informations pratiques et ressources en ligne sur le logiciel Tropes


Le logiciel Tropes distribué avec l’acquisition du numéro d’avril 2001 de la revue Pc Expert est une version limitée "édition spéciale". Voir le site Internet www.acetic.fr et la présentation du logiciel :
www.acetic.fr/prsentat.htm et www.acetic.fr/analyse.htm

A partir du mois de mai, cette version pourra être demandée directement à l'éditeur : www.acetic.fr/demo.htm

Des présentations (plutôt techniques) sur des sites en ligne :
- Un test sur ZD Net - PcExpert : www.zdnet.fr/prod/cgi-bin/affiche.pl?ID=5260
- Un test de 01Net : www.01net.com/rdn?oid=127204


Retour - Haut de page - contacts      

 

Pages entretenues par S. Tabarly (cf. contacts)

Dernière mise à jour :
30-06-2001