Editor

JLLT edited by Thomas Tinnefeld
Journal of Linguistics and Language Teaching
Volume 8 (2017) Issue 2 (PDF)
pp. 233-249


Analyse du traitement interactif d’unités de
constructions préformées en contexte conversationnel –
Méthode outillée ou approche « manuelle » ?

Günter Schmale (Lyon, France)

Abstract (Français)
Suite à une présentation de phénomènes interactifs spécifiques relatifs à l’emploi d’expressions préformées dans des conversations allemandes, l’article tente de répondre à la question de savoir si les nouvelles méthodes d’analyses automatisées de grands corpus, produisant des résultats quantitatifs, peuvent faciliter ou même faire avancer l’étude de la préformation langagière dans une perspective interactionniste. A partir d’une longue séquence d’une conversation téléphonique française, l’article compare la forme transcrite avec la version océrisée afin d’examiner si la méthode outillée est à même d’élucider des phénomènes interactifs afférents au traitement conversationnel d’expressions préformées. Il s’avère qu’une approche automatisée fondée sur des corpus océrisés se limite pour des raisons techniques au seul niveau segmental, devant faire abstraction notamment de la séquentialité de l’interaction verbale.
Mots-clé: Expressions préformées, corpus, conversation, interaction, analyse automatisée, séquentialité de l’interaction verbale

Abstract (English)
Following the presentation of specific interactive phenomena appertaining to the use of formulaic expressions in German conversations from a conversation analytic perspective, the author discusses the question of whether recent quantitative methods of automatic corpus analysis are able to facilitate or even foster the study of formulaic language in large conversational corpora. Based on the comparison of an ocerized transcription sequence of a French telephone conversation and the original transcription, the article examines whether automatic corpus analysis allows to elucidate interactional phenomena of formulaic language use. It emerges that automatic methods are limited to the analysis of purely segmental factors; interactive - especially sequential - elements cannot be accounted for.
Keywords: Formulaic expressions, corpus, conversation, interaction, automatic corpus analysis, segmental factors, sequential elements

Abstract (Deutsch)
Im Anschluss an eine Darstellung spezifischer interaktiver Phänomene bei der Verwendung vorgeformter Ausdrücke in deutschen Gesprächen aus konversationsanalytischer Perspektive wird die Frage diskutiert, ob neuere quantitative Methoden der automatischen Korpusauswertung die Analyse großer konversationeller Korpora bei der Untersuchung vorgeformter Sprache vereinfachen bzw. sogar entscheidend voranbringen können. Auf der Grundlage einer längeren OCRisierten Sequenz eines französischen Telefongesprächs, die mit der Transkription verglichen wird, untersucht der Artikel, ob relevante interaktive Phänomene der konversationellen Behandlung vorgeformter Ausdrücke mit Programmen automatisierter Korpusanalyse erhoben werden können. Dabei stellt sich heraus, dass maschinelle Verfahren sich ausschließlich auf segmentale Phänomene beschränken; eine Berücksichtigung insbesondere der Sequentialität verbaler Interaktion wird nicht geleistet.
Stichwörter: Vorgeformte Sprache, Korpus, automatische Korpusauswertung, Gespräch, Interaktion, Sequentialität verbaler Interaktion



1 Introduction
La réflexion relative au phénomène du 'figement' langagier est très ancienne : Bréal évoque dès 1872 les 'groupes articulés', Bally (1909) les 'groupements usuels', Saussure (1916) les 'locutions toutes faites'.1 Plus récemment, la recherche portant sur la 'préformation langagière', pour utiliser un terme plus moderne et plus approprié pour couvrir le champ concerné, est marquée par trois tendances majeures : un élargissement du domaine d’investigation, un renoncement au critère de 'figement' au sens strict et une orientation vers les corpus.2
La recherche actuelle sur la préformation langagière au sens large ne se contente plus de l’analyse de proverbes, lieux communs, dictons et autres expressions idiomatiques fortement imagées, mais étend le champ d’investigation aux collocations, aux formules de routine,3 et – depuis l’article fondateur de Fillmore, Kay & O’Connor (1988) – aux 'constructions'.4 En même temps, à l’exception de certains courants au sein de la recherche francophone (p. ex. Lamiroy et al. 2010), on a très largement abandonné l’idée du figement, fortement relativisée pour n’exclure a priori aucune modification d’une 'unité de construction préformée' (désormais abrégée UCP). Cette prise de conscience de la variabilité fondamentale de toute expression préfabriquée est en grande partie imputable à une orientation de la recherche vers les corpus qui révèle que les formes de base inventoriées dans les lemmes des dictionnaires (spécialisés) ne sont le plus souvent pas celles effectivement employées par les utilisateurs de la langue en question.5
Toutefois, force est de constater que la plupart de ces études sont fondées sur des corpus de productions écrites dont la représentation des UCP se limite au seul niveau segmental. Si, très rarement, les analyses en question font appel à des corpus oraux, ces derniers sont le plus souvent de nature monologique, rendant impossible la prise en compte d’aspects interactifs. De plus, en règle générale, on fait abstraction de la multimodalité de la production orale de segments, négligeant ainsi aussi bien la prosodie et la communication non verbale que les facteurs co- et contextuels. Il s’ensuit que nous ne disposons à ce jour de trop peu de connais­sances relatives au caractère multimodal ainsi qu’à l’utilisation des unités préfabriquées en contexte dialogal, et conséquemment, de renseignements relatifs aux fonctions conversation­nelles des expressions idiomatiques.6
Pour essayer de combler cette lacune dans la recherche sur la préformation langagière, nos recherches s’orientent vers une étude du traitement interactif des UCP en contexte conver­sationnel. Au regard des tendances de la recherche actuelle, ayant recours majoritairement à des approches outillées visant l’obtention de résultats statistiquement signifiants, nous devons nous interroger quant à la nature de l’approche de l’étude des UCP employées en contexte conversationnel authentique. L’objectif du présent article est d’en décider : une méthode outillée, faisant appel à des concordanciers ou autres logiciels permet­tant une analyse automatisée de corpus textuels, est-elle appropriée à une analyse de ce qui est propre à l’utilisation multimodale en contexte conversationnel, ou faut-il procéder de manière manuelle, non automatisée, en parcourant « manuellement » les transcriptions dans leur intégralité ?
Afin de fournir une réponse circonstanciée à ces interrogations, nous allons dans un premier temps circonscrire notre acception de la notion d’'unitié de construction préformée' (section 2) et esquisser les principes d’une analyse conversationnelle de ces unités (section 3). En section 4 seront présentés les échantillons d’une analyse 'manuelle' d’extraits conversationnels correspondant à ces principes. La section 5 enfin essaiera de déterminer si une analyse 'outillée' est en mesure de produire les mêmes résultats qu’une analyse manuelle.

2 Eléments de définition de l’unité de construction préformée
Habituellement les UCP sont définies à travers trois traits distinctifs fondamentaux : au sens large, par leur polylexicalité, leur stabilité ou, plus rarement, leur figement, et au sens étroit, par leur idiomaticité ou non compositionnalité sémantique. Notre position, esquissée succinctement ci-après, varie de cette acception dominante de l’expression phraséologique.7
Dans un souci d’intégrer également les 'formules de routine' monolexicales (bonjour ! merci ! félicitations !) dans le champ des UCP, où elles ont naturellement leur place à part entière,8 nous proposons de remplacer le critère de 'polylexicalité' par celui de 'polyfactorialité'. Ce dernier terme serait alors son hyperonyme qui regrouperait aussi d’autres hyponymes participant à la description sémantique et pragmatique d’une UCP. Pour les phrasèmes communicatifs évoqués, les facteurs ‘acte de parole’ (salutation, remerciement, compliment), ‘situation’, ‘séquentialité’, ‘intonation’, ‘activité non verbale’, etc. constitueraient ainsi un ensemble factoriel qui justifie l’intégration de ces monolexèmes dans la catégorie des UCP. Qui plus est, la polyfactorialité ne se limite aucunement aux seules 'pragmatèmes' ; maintes expressions polylexicales sont également frappées par ce que Feilke (1998) dénomme 'empreinte pragmatique', i.e. de facteurs d’utilisation spécifiques, étroitement rattachés à l’UCP, qui peuvent se situer à tous les niveaux. Aussi même un proverbe du type Tel père, tel fils ne peut s’employer pour n’importe quelle comparaison, mais uniquement pour père et fils9 ; par ailleurs, la comparaison, utilisée normalement suite à un comportement typique du fils, concerne le plus souvent des traits de caractère négatifs communs au père et au fils. Il faut en outre tenir compte des phénomènes prosodiques (ton ironique) ou non verbaux (sourire moqueur). Le critère de 'polyfactorialité' est de ce fait le mieux à même d’intégrer, d’une part toutes les expressions monolexicales de nature polyfactorielle dans la classe des UCP, et de décrire d’autre part, tous les facteurs nécessaires à une utilisation adéquate des phrasèmes, qu’ils soient mono- ou polylexicaux.
Comme évoqué, le figement, la stabilité est tout au plus très relative, aucune modification n’étant a priori exclue.10 La présence d’un 'dénominateur phraséologique minimal' (DPM) est nécessaire afin qu’un interlocuteur puisse reconnaitre une UCP. Le cas idéal d’un tel DPM est le lexème archaïque qui n’a survécu qu’à l’intérieur d’une expression préformée, p. ex. avoir la berlue, battre la chamade, chercher noise. Ou encore une structure typique du type ‘x c’est x’, p. ex. la retraite c’est la retraite.11 Il va de soi que les facteurs co- et contextuels jouent un rôle déterminant dans l’actualisation d’un phrasème – tout comme la compétence phraséologique de l’interlocuteur.
L’idiomaticité, définissant les expressions phraséologiques au sens restreint à travers leur non compositionnalité sémantique, est une qualité graduelle des UCP, l’idiomaticité pouvant être entière, p. ex. à fleuret moucheté, ou partielle, p. ex. fort comme un Turc. D’après Burger (2010), le sens des collocations (prendre rendez-vous) est compositionnel. Il faudrait cependant restreindre ce qualificatif à ‘compositionnel au niveau du décodage’, où l’interprétation est aisée, non pas pour ce qui est de l’encodage, du fait que les collocations sont également frappées d’idiomaticité – une comparaison entre différentes langues en témoigne : se laver / brosser les dents, brush one’s teeth, sich die Zähne putzen. Il faut en effet connaître ces expressions pour pouvoir les (re)produire de manière adéquate. Feilke (1998) va jusqu’à constater qu’une grande majorité des productions langagières est frappée par une empreinte idiomatique (« idiomatische Prägung »), du fait de l’absence d’une totale compositionnalité sémantique. Pour Hausmann (1997)12, le spécialiste des collocations de l’allemand, tout est idiomatique au niveau de l’encodage. Pour un locuteur non-natif allemand du français, les bases verbales de collocations telles que passer une annonce, lancer un appel, faire ses bagages ne coulent en effet pas de source (sémantique), l’allemand utilisant respectivement les verbes aufgeben (Anzeige), starten (Aufruf) et packen (Koffer).13 Ces choix sont donc fondés sur des conventions arbitraires. Ainsi, les UCP ne sont non seulement soumises à une empreinte idiomatique, mais en même temps à une empreinte pragmatique. Les idiotismes imagés sont en effet le plus souvent liés à des conditions d’utili­sation spécifiques dépendant du statut social de l’utilisateur, de la situation, de la relation sociale entre interlocuteurs, du niveau stylistique, sans oublier la prise en compte de facteurs séquentiels, pour un emploi adéquat.
A partir de ces critères, Schmale (2013a) définit l’UCP de la manière suivante :
Est considérée comme préformée une unité de construction verbale et/ou non verbale, obligatoirement caractérisée par son caractère polyfactoriel et un certain degré de stabilité qui permet à un membre de la communauté langagière concernée de la reconnaître et de la réutiliser, sachant qu'elle est plus ou moins variable pour ce qui est de sa taille, sa stabilité, sa composi­tionnalité sémantique, sa dissémination et sa durabilité, sa saturation lexicale, son imbrication dans une situation de communication spécifique, la présence d'activités non verbales. (Schmale 2013a : 41)
Sans exclure que toutes les expressions préformées, englobées par cette définition, notamment les collocations, plutôt dotées d’un statut de lexème,14 nos recherches se sont concentrées jusqu’à présent sur les UCP idiomatiques qui ont fait l’objet de très nombreux travaux, mais sans que l’on se soit véritablement intéressé à leur utilisation et leurs fonctions.

3 Principes d’une analyse conversationnelle des unités de construction préformées
L’étude de la polyfactorialité et de l’empreinte idiomatique et en particulier pragmatique, mais aussi du repérage des UCP effectivement utilisées par les participants en contexte conversationnel, ainsi que le traitement interactif de ces unités de construction nécessitent inéluctablement un recours à des corpus de conversations en contexte naturel, i.e. non sollicitées pour les besoins de l’analyse (cf. Schmale 2015b). Ces enregistrements sont ensuite à transcrire selon un système spécifique15, tenant compte du plus grand nombre d’éléments segmentaux, supraseg­mentaux, non verbaux et contextuels ; cette restriction « du plus grand nombre » s’impose par le fait que l’enregistrement reste, pour l’analyste de conversations, la véritable base de son analyse. La transcription n’est au fond qu’un outil d’analyse, pourtant indispensable, mais en aucun cas la donnée originelle du fait qu’une transcription puisse difficilement, notamment lorsqu’elle intègre prosodie et communication non verbale, représenter absolument tous les phénomènes pertinents à la négociation conversationnelle.
C’est à l’aide de ces transcriptions et, en cas de besoin, d’enregistrements que l’analyste de conversation reconstitue la structure de l’interaction établie à travers les activités récipro­ques des participants. Dans la quête de cette reconstitution, l’analyste fonde systématiquement toutes ses conclusions sur les activités des interactants dans leur déroulement séquentiel, s’interdisant par conséquent toutes interprétations fondées sur ses propres convictions ou préférences. Toutefois, il peut naturellement faire appel à des résultats de recherches existants, à condition de les vérifier au sein des corpus étudiés et à condition que les recherches en question aient tenu compte de la multimodalité du phénomène étudié.
Mise à part une analyse fine des activités langagières aux niveaux segmental et suprasegmental et, le cas échéant, non verbal, l’analyse porte une attention toute particulière à l’environnement séquentiel du tour de parole qui accueille l’UCP en question. Cela implique que l’on examine la totalité de l’interaction conversationnelle qui comprend l’UCP, et en particulier les activités suivantes qui pourraient témoigner de la compréhension (ou de son absence), de l’interprétation de l’interlocuteur, de son traitement en général (Schmale 2013b pour des analyses de ce type).
La section suivante présentera, à titre d’exemples, plusieurs analyses d’extraits selon les modalités esquissées ci-devant.

4 Spécimens d’analyse conversationnelle « manuelle » d’expressions idiomatiques
Les extraits tirés de nos analyses conversationnelles et issus de différents corpus présenteront les diverses facettes relatives à la multimodalité et à l’interactivité des UCP, plus précisément les expressions idiomatiques (= EI) privées de compositionnalité sémantique sur lesquelles nous nous sommes pour l’instant concentrées.16 Dans ce qui suit, nous allons présenter quatre aspects :
  • le traitement interactif d’EI (4.1) ;
  • les activités non verbales con­comitantes comme cas spécifique du traitement interactif (4.2) ;
  • la métaphore « potentielle » ainsi que
  • l’expressivité comme fonction de la négociation conversationnelle (4.3).
Les exemples sont tirés de notre corpus de talk-shows de la télévision allemande (cf. Schmale 2013b), traduite pour les lecteurs français par nos soins, d’une part, ainsi que de nos corpus de conversations téléphoniques françaises (Schmale 2007a et b), d’autre part.

4.1 Le traitement interactif des expressions idiomatiques
L’analyse de corpus de dialogues en contexte naturel révèle que les expressions idioma­tiques imagées sont très fréquemment « traitées » soit par le producteur de l’EI lui-même, soit par son interlocuteur. « Traitées » cela signifie qu’elles sont rephrasées littéralement (Schmale 2001b, 2012), paraphrasées ou paraphrasantes (Schmale 2007a, 2012), accom­pagnées de commentaires métadiscursifs (Schmale 2009, 2012) ou d’activités non verbales (Schmale 2005, 2012). Ci-après seront analysés trois extraits de nos corpus illustrant l’analyse des trois cas de figure de l’EI-paraphrasée et de l’EI-paraphrase en contexte conversationnel.

4.1.1 Paraphrase d’une expression non phraséologique par une expression idiomatique : Enon phr > EI17
Pour diverses raisons, un locuteur peut paraphraser un énoncé ou une partie dont il a été destinataire par une expression idiomatique:
(1) L’animatrice (A) pose une question à une invitée « sataniste » (S). (IC/3-6-4)18
      01  A   können sie eigentlich das wort gott sagen ohne dass es ihnen weh tut,
                 ('pouvez-vous prononcer le mot dieu sans que cela vous fasse mal)'
      02  S  ich würds nich in den mund nehmen;
                ('je ne le prononcerais pas'; *"je ne le prendrais pas dans la bouche")
      03  A  und rückwärts auch nich,
                ('même pas à l’envers')
      04  S  in KEInem fall;
                ('en AUcun cas')
      05  A  das würd ich ihnen auch verbieten;
                ('je vous l’interdirais de toute façon')
L’interlocuteur sataniste paraphrase, dans ce cas, le verbe simple sagen ('dire', 'prononcer') de l’animatrice par l’EI métaphorique in den Mund nehmen. Le rôle de la paraphrase idiomatique réside vraisemblablement dans un renforcement de son refus d’employer le mot Dieu.19

4.1.2 Hétéro-paraphrase d’une expression idiomatique par une autre expression phraséologique, idiomatique ou non : EI1 > EI2 ou Ephr
Le récipiendaire d’une expression idiomatique peut paraphraser cette dernière à travers une autre expression phraséologique qui peut même être idiomatique:
(2) L’animateur (A) pose une question à un invité (I) au sujet de la relation avec ses co-détenus. (Bio/30-6/2)
     01  A  man is man is in der hierarchie der gefangenen ganz unten;
               ('on est tout en bas dans la hiérarchie des détenus')
     02  I   ja auf gut deutsch man- man is der letzte dreck;
               ('pour être franc on est on est moins que rien; *"la dernière des saletés")20
     03  A  ja;
           ('oui')
Une EI imagée – man is ganz unten (on est tout en bas) – est ici hétéro-paraphrasée par une autre EI, plus forte, man is der letzte dreck. A travers la paraphrase de l’EI de A, I accepte l’affirmation prononcée par A, tout en renforçant celle-ci.

4.1.3 Paraphrases d’une expression idiomatique par une expression non phraséologique : EI > Enon phr
Plus fréquemment, une EI est paraphrasée par une expression non phraséologique, d’une part du fait qu’une EI2 sémantiquement plus ou moins équivalente n’est pas disponible, d’autre part pour des raisons explicatives (cf. Infra):
(3) L’invité Horst fait appel à des prostituées ; un homme du public présent sur le plateau TV (P) le commente. (BS/19-3/3)
     01  A  (s’adressant à un homme du public du studio)
     02  A   behauptest du einige frauen machen ihren job äh schlecht,
                ('est-ce que tu prétends que certaines femmes font mal leur boulot')
     03  P  das kann ich nich beurteilen; ich sag nur jedem tierchen sein plaisirchen;
                ('je suis incapable d’en juger je dis seulement à chacun sa façon')
     04  P  jeder soll so leben wie er es für richtig hält;
               ('tout un chacun doit vivre comme bon lui semble')
L’auto-paraphrase non idiomatique jeder soll so leben wie er es für richtig hält (l. 04) permet à P de clarifier le sens de son EI de la ligne 03 (jedem tierchen sein plaisirchen), et d’appuyer par là même son message ; P souhaite probablement aussi allonger son énoncé afin de rester plus longtemps à l’antenne.

4.2 Activités non verbales concomitantes à la production d’une expression idiomatique
Le recours à un corpus d’enregistrements de talk-shows prenant en compte les activités non verbales des participants, a permis de démontrer que les EI sont parfois accompagnées de gestes illustrateurs (Schmale 2005).
(4) L’invitée R a rencontré son père biologique géorgien très tard dans sa vie. (Bio/2-2/5)
      01  R  also ich sag ihnen ehrlich-
                 ('bon ben je vais vous dire très franchement')
      02  R  mir i::s- (faisant un mouvement circulaire avec les deux mains)
      03  R  SO ein stein + von meinem herzen gefallen;
                 ('j’ai ressenti un tel soulagement'; *'une grosse pierre est tombée de mon cœur')
      04  R  weil ähm ich mich immer ein bisschen anders gefühlt habe;
                 ('parce que je me suis toujours sentie un peu différente')
Même si l’EI allemande métaphorique mir ist ein Stein vom Herzen gefallen signifie ‘être soulagée’, c’est par le biais du geste illustrateur pictographique (l. 02) que R indique l’importance de ce soulagement.21

4.3 Métaphore et expressivité potentielles comme fonctions de la négociation conversationnelle
Régulièrement, on attribue un caractère métaphorique ou des traits innés d’expressivité à toute expression idiomatique imagée. Il s’avère toutefois que la 'métaphoricité', déterminée par les sémanticiens à partir de l’existence de traits sémantiques partagés, un tertium comparationis sémantique entre domaine source et domaine cible d’une expression imagée, n’est que rarement apparente en surface de la conversation. Le plus souvent, l’analyste ne dispose d’aucune trace langagière de l’interprétation effective (ou de son absence) d’une relation métaphorique, p. ex. par le biais d’une activité metadiscursive ou d’un problème d’intercompréhension. Seule une analyse fine de l’environnement séquentiel peut permettre de conclure à l’interprétation d’une relation entre domaine source et domaine cible:
(5) Une infirmière explique l’objectif des entretiens à une patiente. (Walther 2005 : 376)
      01  I  alle menschen sind verschieden; ne,
               ('les êtres humains sont tous différents non')
      02  P  ja;
                ('oui')
      03  I  kann man nich alle äh äh so nehmen wie- (4.0)
               ('on ne peut pas tous les prendre comme-')
      04  I  über einen kamm scheren;
               ('les mettre tous dans le même sac'; *tous les coiffer avec le même peigne)
      05  P nee im gegenteil; (2.0) ich [sage immer man müsste‘]
               ('non au contraire je [dit toujours qu’il faudrait]')
      06  I  [man müsste alles indivi]duell-
               ['il faudrait individuellement']
      07  P  richtich;
                ('absolument')
     08  I  man muss eigentlich auch jeden individuell beTREUn;
               ('il faudrait soigner chaque patient individuellement')
L’EI (nich) alle über einen kamm scheren (l. 04) ne possède a priori pas de base sémantique car le lien entre domaine source (coiffer qn à l’aide d’une peigne) et cible (ne pas traiter tous de la même manière) n’est pas transparent. Cependant, le cotexte comprend plusieurs activités qui témoignent de la compréhension aussi bien de la locutrice-productrice que de son interlocutrice : l’indication de l’infirmière que tous les êtres sont différents (l. 01), précédant la production de l’EI, et surtout la paraphrase indiquant que tous ont besoin de soins individualisés (cf. l. 06/08).22
L’expressivité, à l’instar de la métaphoricité, n’est pas une qualité innée des expressions idiomatiques, il s’agit plus exactement d’un potentiel qui relève des activités et des interpréta­tions des participants.23 Selon Gréciano (1983), la paraphrase idiomatique de l’extrait suivant serait ainsi revêtue d’un degré d’expressivité plus fort que l’énoncé non phraséologique paraphrasé:
(6) L’animateur a posé une question à une invitée concernant son surpoids. (JP/3-2/3)
      01  I  aber auch n großer grund is eigentlich, dass ich sehr gerne esse-
               ('mais l‘une des raisons principales est au fond que j’aime manger')
      02  I  auch essen zubereite- gäste einlade- (.) und kein kostverächter bin also:-
               ('je prépare à manger invite des gens aime bien la bonne chère enfin')
Toutefois, aucun élément segmental, suprasegmental ou non verbal24 ne converge vers une plus grande expressivité de l’EI par rapport à l’expression verbale sehr gerne essen. L’EI résume tout simplement ce qu’I vient d’énoncer auparavant, le renforce probablement au moyen de la simple répétition du contenu, en aucun cas en raison d’une expressivité innée de l’EI.
Le même constat s’impose pour l’extrait (7) suvant:
(7) L’animatrice déclare au sujet d’un mari infidèle. (BS/3-6/2)
     01  A  so einen würd=ich doch LAUfen lassen; […]
           ('mais un type pareil je le laisserais partir')
     02  A  aber dann würd ich so einen doch in=nen WIND schiessen und laufen lassen;
           ('mais un type comme ça je l’enverrais balader ou promener')
Mis à part le fait que l’image in den wind schießen pourrait revêtir un caractère plus fort que laufen lassen,25 il convient de souligner que deux lexèmes voire les parties de lexèmes sont fortement accentués, et en particulier que cette EI est accompagnée d’un geste de la main gauche de A, une sorte de « bras d’honneur ». C’est sur la base de ces éléments que l’on peut conclure à une expressivité conversationnelle du tour de parole qui comprend l’EI in den wind schießen. L’EI développe donc ici son potentiel expressif et doit, pour le faire, être accom­pagnée d’autres phénomènes, ici : suprasegmentaux et non verbaux.

5 Analyse « outillée » d’extraits conversationnels ?
Examinons à présent la question de savoir si une méthode outillée visant à l’obtention de données à valeur statistique fondée sur une analyse automatisée s’avère être plus apte à éluci­der ce qui est propre au traitement interactif des UCP qu’une approche manuelle. En se fon­dant sur la recherche de n-grams, pratiquée par Siepmann & Bürgel (2015, à par. a et b), il s’agit de décider si cette méthode procure effectivement davantage de facilité et offre une plus validité que l’approche manuelle présentée précédem­ment.
Ces auteurs étudient en effet à l’aide du logiciel Sketch Engine les données du corpus du français écrit et parlé, le Corpus de Référence du Français Contemporain (CRFC). Le CRFC intègre également nos corpus de conversations téléphoniques (Schmale 2007b et 2007c). Voici à des fins illustratives un extrait de l’une des conversations téléphoniques, transcrite selon GAT (8), suivi d’exactement la même séquence en version CRFC (9):
(8) B, résidant à Mayence en Allemagne, appelle son amie F, qui lui avait promis de visiter ensemble le musée Gutenberg (Schmale 2007b : 20720-8 : l. 025-043):
025 B non que: de’ t=es pas venue à mayence alors;
026 F < si j=suis venue à mayence,
027 F mais tu verrais dans les conditions,
028 F on y est restés peut-être une heure en tout et pour tout,
029 F on a eu à peine le temps
030 F de visiter le musée gütemberg,>
031 B < (ah ben c’est-)>
032 B ben j=t=avais dit que je venais euh-
033 F ça (a été) sur les chapeaux de roues,
034 B & < j=t=avais dit que j=venais le visiter avec toi: voyons;>
035 F < non;
036 F oui- oui- oui bernard;>
037 F je m’en souviens très bien de c=que tu m’avais dit,
038 F mais je m’en souviens très bien < aussi
039 F comment ça s’est passé pour moi;> oh ben si tu veux
040 B a::h la la:-
041 F je te raconterai dans les détails,
042 B oui, ben-
043 F mais c’était vraiment la course; hein>

(9) 025  B  non que: de' t=es pas venue à mayence alors;26
     026  F «rit p> si j=suis venue à mayence,
     027  F  mais tu verrais dans les conditions,
     028  F  on y est restés peut-être une heure en tout et pour tout,
     029  F  on a eu à peine le temps
     030  F  de visiter le musée gütemberg,>
     031  B  «p> (ah ben c'est-)>
     032  B  ben j=t=avais dit que je venais euh-
     033  F  ça (a été) sur les chapeaux de roues,
     034  B  & «all> j=t=avais dit que j=venais le visiter avec toi: voyons;>
     035  F  «all> non;
     036  F  oui- oui- oui bernard;>
     037  F  je m'en souviens très bien de c=que tu m'avais dit,
     208      209
     038  F  mais je m'en souviens très bien «rit> aussi
     039  F  comment ça s'est passé pour moi;> oh ben si tu veux
     040  B  a::h la la:-
     041  F  je te raconterai dans les détails,
     042  B  oui, ben-
     043  F  mais c'était vraiment la course; hein>
     [Représentation de la séquence (8) au format CRFC.]
Tout en relativisant les observations qui vont suivre étant donné que Dirk Siepmann,27 éditeur principal du CRFC, nous a indiqué que la forme du corpus n’était pas définitive, un nettoyage allant intervenir ultérieurement, il faut constater ceci :
  • les phases d’énonciation simultanées disparaissent (cf. les lignes 030-031, 032-033, 034-035, 039-040, 042-043), rendant la lisibilité de certaines parties quasi impossible ;
  • certains signes spéciaux sont remplacés par des signes ayant une autre signification, p. ex. ‘ << ’ indiquant le début d’un commentaire du transcripteur par des guillemets (‘ «  ‘) ;
  • le scan automatique du corpus, pour l’extrait présenté relativement fidèle, même s’il intègre les numéros de pages du corpus (cf. 208 209 entre les lignes 037 et 038) produit parfois des séquences entières totalement illisibles, mélangeant la numérotation des énoncés de deux pages différentes.
Ces imprécisions dans la présentation du corpus font qu’une analyse séquentielle, au cœur de l’approche conversationnelle, devient impossible, ce qui n’est guère surprenant puisque les objectifs des auteurs du CRFC sont exclusivement lexicologiques et / ou lexicographiques, visant à la découverte de constructions à différents niveaux à partir du bi-gram. Ce que nous souhaitons démontrer à travers nos observations est qu’une analyse outillée de phénomènes interactifs n’est pas possible à moins que l’on investisse un travail considérable dans la présentation et dans l’indexation, nécessitant une analyse préalable, des séquences.28 Une approche « manuelle » serait de ce fait en fin de compte plus économique et efficace.
En outre, une étude automatisée de n-grams rencontre deux difficultés majeures pour ce qui est de l’analyse des UCP : primo, dus aux problèmes de numérisation évoqués, l’indica­tion de lignes et / ou le sigle locuteur sont traités comme unités n, en conséquence c’est (395 occurrences), j’ai (90) ou ah (26) sont considérés comme bi-grams par une recherche automatique via Sketch Engine. Secundo, celle-ci ne retient très majoritairement que les combinaisons de deux termes29 – p. ex. parce que (94), sais pas (68), il est (48) – qui n’appartiennent pas à la classe des UCP comme définies, seules certaines formules de routine – ça va (86), ben oui (61), bon ben (45), tu sais (41), au revoir (37) – sont relevées.
En revanche, ni expressions idiomatiques ni collocations ne sont retenues, faute de fréquences suffisantes. Aussi bien les EI se faire arrêter (par le médecin), être sur les chapeaux de roues (8), faire du porte à porte, en dire de toutes les couleurs à quelqu’un, être mauvaise langue, etc. que les collocations (ou idiomes partiels) ne pas être la faute de quelqu’un, tenir compagnie, faire la surprise à qn, avoir l’air de, être à moitié qc, se fatiguer à faire qc, ne pas être question de, etc. du corpus de conversations téléphoniques privées (Schmale 2007b) font de ce fait partie de la « Word List » des n-grams automatiquement constituée. L’utilité d’une analyse automatisée semble par conséquent résider avant tout dans le repérage de n-grams qu’il faut ensuite évaluer « manuellement » sur la base de critères spécifiques selon leur appartenance à la classe des unités de construction préformées – comme le font du reste Siepmann & Bürgel dans leurs travaux. On pourrait aussi envisager une indexation préalable de séquences qui permettrait ensuite une recherche automatique. Toute­fois, une telle indexation serait extrêmement chronophage, qui plus est, elle impliquerait en amont de toute analyse approfondie une interpretation obligatoirement préconçue selon les intérêts de recherches des données, contraire à la mentalité analytique esquissée auparavant.
Les analyses « outillées » à l’aide de concordanciers tels AntConc ou SketchEngine se font de surcroît exclusivement au niveau segmental des unitiés lexicales linéarisées, excluant par là même les phénomènes de la multimodalité, de l’interactivité et de la séquentialité qui se trouvent au cœur de nos intérêts de recherche.
Le recours à un traitement automatique aurait-elle permis de repérer l’utilisation, de surcroît erronée, de l’UCP induire en erreur ?30
      (10) [INTRODUIT EN ERREUR]
     277  E  c’est pas l’allocation compensatrice
     278      qui intervient à ce moment-là;
     279  D  [alors là, on (m’a introduit) en erreur là;]
     280  E  [l’allo(cosa)tion compensatrice, (.) c’est’]
     281      c’est pour aider les gens à s’habiller, à manger,
     282      quand ils peuvent pas couper leur viande,
     [Schmale 2007c : (46), p. 190.]
En raison de la fréquence plus que réduite de l’EI induire / *introduire en errreur, AntConc ne l’aurait pas repérée, aurait en plus négligé que sa production (l. 279) est chevauchée par le tour de parole de son interlocutrice E (l. 280), fait qui pourrait avoir une incidence sur la négociation conversationnelle.
Par conséquent, indépendamment du fait qu’une analyse outillée ne permet pas d’élucider les EI d’un point de vue quantitatif du fait de leur rareté, l’étude quantitative à l’aide de logiciels spécialisés (SketchEngine ou AntConc) fait abstraction de tous les phénomènes propres à l’organisation conversationnelle d’une interaction verbale. Se limitant à une analyse au seul niveau segmental, elle n’est de ce fait pas à même de capter le véritable caractère du traitement interactif des expressions idiomatiques en contexte conversationnel.

Références
Bally, Christian (1909). Traité de stylistique française. Paris: Klincksieck.
Bréal, Michel (1872). Quelques mots sur l’instruction publique en France. Paris: Hachette.
Burger, Harald (42010, 1998). Phraseologie. Eine Einführung am Beispiel des Deutschen. Berlin: Erich Schmidt.
Coulmas, Florian (1981). Conversational Routines: Exploration in Standardized Communication Situations and Prepatterned Speech. New York: Mouton Publishers.
CRFC – Corpus de Référence du Français Contemporain. (https://zenodo.org/record/ 2353#.Vm2x kr_F-pA; 12.12.2015).
Dudenredaktion (Hrsg.) (42013). Duden Band 11: Redewendungen. Wörterbuch der deutschen Idiomatik. Berlin: Dudenverlag.
Feilke, Hartmut (1998). Idiomatische Prägung. In: Barz, Irmhild & Günther Öhlschläger (Hrsg.). Zwischen Grammatik und Lexikon. Tübingen: Niemeyer, 69-80.
Fillmore, Charles J., Paul Kay & Mary C. O’Connor (1988). Regularity and Idiomaticity in Grammatical Constructions: The Case of Let Alone. In: Language 64 (1988) 3, 501-538.
Gréciano, Gertrud (1983). Signification et dénotation en allemand. La sémantique des expressions idiomatiques. Paris/Metz: Klinksieck.
Gülich, Elisabeth (1988/1997). Routineformeln und Formulierungsroutinen. Ein Beitrag zur Beschreibung formelhafter Texte. In: Wimmer, Rainer & Franz-Josef Berens (Hrsg.). Wortbildung und Phraseologie. Tübingen: Narr (= Studium zur deutschen Sprache 9), 131-175.
Günthner, Susanne (2006). Von Konstruktionen zu kommunikativen Gattungen: Die Relevanz sedimentierter Muster für die Ausführung kommunikativer Aufgaben. In: Deutsche Sprache 34 (2006), 173-190.
Hausmann, Franz Josef (1997). Tout est idiomatique dans les langues. In: Martins-Baltar, Michel (éd.). La locution entre langue et usages. Paris: ENS, 277-290.
Hausmann, Franz Josef & Peter Blumenthal (2006). Présentation: Collocations, Corpus, Dictionnaires. In: Langue française 150 (2006) 2, 3-13.
Lamiroy, Béatrice (coord.) et al. (2010). Les expressions verbales de la francophonie. Paris: Ophrys.
Mel’čuk, Igor A. (2011). Phrasèmes dans le dictionnaire. In: Anscombre, Jean-Claude & Salah Mejri (éds.). Le figement linguistiques: la parole entravée. Paris: Honoré Champion, 41-61.
Saussure, Ferdinand de (1916). Cours de linguistique générale. Paris: Payot.
Schemann, Hans (1993). Pons Deutsche Idiomatik. Die deutschen Redewendungen im Kontext. Stuttgart/Dresden: Klett.
Schmale, Günter (2001a). Le traitement conversationnel de phrasèmes dans les talk-shows de la télévision allemande. Nantes: Manuscrit non publié, 253p.
Schmale, Günter (2001b). Rephrasages comme traitement conversationnel de phrasèmes dans les talk-shows de la télévision allemande. In: Beiträge zur Fremdsprachenvermittlung 39 (2001), 47-71.
Schmale, Günter (2005). Nonverbale Aktivitäten bei der Äußerung von Phraselogismen. In: Studia Germanica Universitatis Vesprimiensis 9 (2005) 2, 159-173.
Schmale, Günter (2007a). Paraphrases phraséologiques dans la conversation. In: Kara, Mohammed (éd.) (2007). Usages et analyses de la reformulation. Recherches Linguistiques 29, 163-175.
Schmale, Günter (Hrsg.) (2007b). Communications téléphoniques I: Conversations privées – Un corpus de transcriptions. Sonderheft 12 der Beiträge zur Fremdsprachenvermittlung. Landau: VEP.
Schmale, Günter (Hrsg.) (2007c). Communications téléphoniques II: Conversations en contexte professionnel et institutionnel – Un corpus de transcriptions. Sonderheft 13 der Beiträge zur Fremdsprachenvermittlung. Landau: VEP.
Schmale, Günter (2009). Metalinguistic Comments and Evaluations of Phraseological Expres­sions in German Talk Shows. In: Textes & Contextes 4 (2009). (https://halshs.archives-ouvertes.fr/ halshs-00446159/document; 15.08.2016).
Schmale, Günter (2010). Ist ein idiomatischer Ausdruck immer expressiv? Korpusbasierte und fragebogengestützte Beobachtungen zu einer verbreiteten Prämisse. In: Yearbook of Phraseology I. Berlin/New York: de Gruyter Mouton, 97-124.
Schmale, Günter (2012). The Conversational Treatment of Idiomatic Expressions in German Talk Shows – A corpus-based study. In: Pamies, Antonio et al. (eds.) (2012). Phraseology and Dis­course: Cross-Linguistic Corpus-based Approaches. Baltmannsweiler: Schneider Hohengehren, 181-192.
Schmale, Günter (2013a). Qu’est-ce qui est préfabriqué dans la langue ? – Réflexions au sujet d’une définition élargie de la préformation langagière. In: Legallois, D. & A. Tutin (eds.). Vers une extension du domaine de la phraséologie. Langages 189 (2013), 27-45.
Schmale, Günter (2013b). Forms and Functions of Idiomatic Expressions in Conversational Interaction. In: id. (ed.): Formen und Funktionen vorgeformter Konstruktionseinheiten in authentischen Konversationen / Forms and Functions of Formulaic Construction Units in Conversation. Linguistik online 62 (2013), 67-96. (http://www.linguistik-online.de/62_13/sch male.pdf; 08.11.2015).
Schmale, Günter (2014). Mögliche Metaphern in der Konversation. In: Lefèvre, Michel (ed.). Linguistische Aspekte des Vergleichs, der Metapher und der Metonymie (= Eurogermanistik 33). Tübingen: Stauffenburg, 85-102.
Schmale, Günter (2015a). Le rôle de l’image matérielle dans l’actualisation du sens métaphorique des expressions idiomatiques. In: Bricco, Elisa et al. (dir.): Les avatars de la méta­phore. Publif@rum 23 (2015), 18pp. (http://www.publifarum.farum.it/ezine_articles.php?publifarum =6c6500903d681ee­c992d8efdda23551f&art_id=321; 16.08.2016).
Schmale, Günter (2015b). Korpusbasierung, Multimodalität, Interaktivität, Konstruktions-orientierung – Prinzipien einer zeitgemäßen linguistischen Pragmatik und Fremdspra­chendidaktik. In: Olszewska, Danuta et al. (Hrsg.). Studia Germanica Gedanensia 33 (2015), 84-108.
Selting, Margret et al. (1998). Gesprächsanalytisches Transkriptionssystem (GAT). In: Linguistische Berichte 173 (1998), 91-122.
Siepmann, Dirk & Christoph Bürgel (2015). L’élaboration d’une grammaire pédagogique à partir de corpus : l’exemple du subjonctif. In: Tinnefeld, Thomas (Hrsg.). Grammatikographie und didaktische Grammatik – gestern, heute; morgen. Gedenkschrift für Hartmut Kleineidam anlässlich seines 75. Geburtstages (= Saarbrücker Schriften zu Linguistik und Fremdsprachendidaktik (SSLF), A: Sammelbände, Bd. 3). Saarbrücken: htw saar, 159-185.
Siepmann, Dirk, Christoph Bürgel & Sascha Diwersy (2016). Le Corpus de référence du français contemporain (CRFC), un corpus massif du français largement diversifié par genres. In: Congrès Mondial de Linguistique Française 2016. ( http://www.linguistiquefrancaise.org/arti cles/shsconf/pdf/2016/05/shsconf_cmlf2016_11002.pdf; 24.09.2017).
Siepmann, Dirk & Christoph Bürgel (à par.). Les unités phraséologiques fondamentales du français contemporain. A par. In: Kauffer, Maurice & Yvon Keromnes (éds.). Approches théoriques et empiriques en phraséologie. Stauffenburg: Tübingen.
Walther, Sabine (2005). Erstgespräche zwischen Pflegepersonal und Patienten im Krankenhaus-Alltag. Radolfzell: Verlag für Gesprächsforschung.

Auteur:
Günter Schmale
Professeur de linguistique allemande
Université Jean Moulin Lyon 3
Faculté des Langues
Manufacture des Tabacs
Université Jean Moulin Lyon 3
1C avenue des Frères Lumière
CS 78242
F – 69372  L Y O N 
Cd 08, Centre d’Etudes Linguistiques (EA 1663)
E-Mail : gunter.schmale@univ-lyon3.fr

1 Cf. Schmale (2013a : 27-28) pour un aperçu de différentes perceptions du « figement » dans l’histoire de la linguistique.
2 Nous nous concentrons sur les tendances récentes pertinentes pour le développement proposé.
3 Les pragmatèmes de Mel’čuk (2011), les phrasèmes communicatifs de Burger (1998) ou les idiomes pragmatiques de Burger (1973).
4 Sans même parler des « textes préformés » (Gülich 1988 / 1997), p. ex. les faire part, ou encore des « genres communicatifs » (les « kommunikative Gattungen » de Günthner 2006) du type « cérémonie de mariage » ou « procès en justice ».
5 Constat qui se vérifie dans notre étude de 32 heures de talk-shows de la télévision allemande (Schmale 2001a) où seulement une minorité des expressions idiomatiques relevées revêtent la forme indiquée par les dictionnaires spécialisés Duden 11 (2013) ou Schemann (1993).
6 Cette même observation ne s’applique bien entendu pas aux formules de routine, dont les nombreuses fonctions ont été étudiées (p. ex. Coulmas 1981), ou aux collocations dont l’utilisation est « inévitable » et qui, à l’instar de lexèmes simples, ne possèdent pas de connotations spécifiques, p. ex. se laver les dents, prendre rendez-vous.
7 Cf. Schmale (2013a) pour une présentation plus développée.
8 Nombreux sont les travaux qui incluent les pragmatèmes ou formules de routine dans le domaine de la phraséologie tout en définissant le phrasème à travers le critère de la polylexicalité (cf. p ex. Coulmas 1981 ou Mel’čuk 2011).
9 Même si on voit de plus en plus souvent telle mère, telle fille ; une recherche Google rend 716 000 résultats.
10 Il suffit de regarder les unes du Canard Enchaîné ou les très nombreuses publicités faisant appel à des jeux de mots.
11 Entendu à la télévision lors d’une grève des routiers.
12 Cf. également Hausmann & Blumenthal (2006).
13 Il s’agit de traductions des collocations françaises précédentes.
14 Mais il va de soi que, pour le conversationnaliste, le véritable critère reste le traitement conversationnel, i. e. si une collocation fait l’objet d’une activité suivante s’y rapportant, elle sera naturellement étudiée.
15 Nous utilisons le Basistranskript augmenté de quelques éléments du Feintranskript du GAT de Selting et al. (1998).
16 Du fait qu’elles ont été au centre des recherches en phraséologie qui font toutefois, l’impasse sur l’analyse d’aspects de l’oralité.
17 Notre traduction française n’est pas forcément en mesure de reproduire le même phénomène qu’en allemand. Nous essayons de le rendre dans la mesure du possible via une traduction littérale entre parenthèses.
18 Les extraits (1) à (4) sont tirés de notre corpus de talk-shows (Schmale 2001).
19 Cf. Schmale (2013b) pour une analyse détaillée des fonctions de l’utilisation d’EI en contexte conversationnel.
20 LEO propose « comme une merde ».
21 Il existe en allemand en effet les lexèmes Steinbruch (carrière), Felsbrocken (roché), Riesenstein (grosse pierre) qui permettraient de renforcer lexicalement l’expression de l’intensité du soulagement.
22 Que P voulait probablement fournir en ligne 05. – Cf. Schmale (2014) pour d’autres extraits de ce type et Schmale (2015a) sur le rôle de l’image matérielle dans l’actualisation du sens métaphorique.
23 Cf. Schmale (2010) pour une discussion plus développée de cette problématique et une discussion d’autres extraits.
24 Nous avons bien entendu re-visionné l’extrait de talk-show. Il n’y a pas non plus de réaction venant de l’animateur ou du public, friands de tous jeux de mots.
25 En raison du verbe schießen (tirer), acte a priori plus violent que ‘laisser partir’.
26 Nous précisons qu’il s’agit d’un copier-coller de la séquence du corpus océrisé présente au sein du CRFC.
27 A qui nous sommes du reste redevable pour avoir mis à notre disposition la version CRFC de notre corpus de communications téléphoniques privées (Schmale 2007b).
28 Du reste, une indexation selon quels critères ?
29 Quelques rares quadri-grams, p. ex. au mois de novembre (9), ah ben c’est bien (8) ou vacances de la toussaint (5), mais aucun quinta- ou sexta-gram.
30 Les énoncés des lignes 279 et 280