Analyse
du traitement interactif d’unités de
constructions
préformées en contexte conversationnel –
Méthode
outillée ou approche « manuelle » ?
Günter Schmale (Lyon, France)
Abstract (Français)
Suite à une présentation de phénomènes interactifs spécifiques relatifs à l’emploi d’expressions préformées dans des conversations allemandes, l’article tente de répondre à la question de savoir si les nouvelles méthodes d’analyses automatisées de grands corpus, produisant des résultats quantitatifs, peuvent faciliter ou même faire avancer l’étude de la préformation langagière dans une perspective interactionniste. A partir d’une longue séquence d’une conversation téléphonique française, l’article compare la forme transcrite avec la version océrisée afin d’examiner si la méthode outillée est à même d’élucider des phénomènes interactifs afférents au traitement conversationnel d’expressions préformées. Il s’avère qu’une approche automatisée fondée sur des corpus océrisés se limite pour des raisons techniques au seul niveau segmental, devant faire abstraction notamment de la séquentialité de l’interaction verbale.
Mots-clé: Expressions préformées, corpus, conversation, interaction, analyse automatisée, séquentialité de l’interaction verbale
Abstract (English)
Following the presentation of specific interactive phenomena appertaining to the use of formulaic expressions in German conversations from a conversation analytic perspective, the author discusses the question of whether recent quantitative methods of automatic corpus analysis are able to facilitate or even foster the study of formulaic language in large conversational corpora. Based on the comparison of an ocerized transcription sequence of a French telephone conversation and the original transcription, the article examines whether automatic corpus analysis allows to elucidate interactional phenomena of formulaic language use. It emerges that automatic methods are limited to the analysis of purely segmental factors; interactive - especially sequential - elements cannot be accounted for.
Keywords: Formulaic expressions, corpus, conversation, interaction, automatic corpus analysis, segmental factors, sequential elements
Abstract (Deutsch)
Im Anschluss an eine Darstellung spezifischer interaktiver Phänomene bei der Verwendung vorgeformter Ausdrücke in deutschen Gesprächen aus konversationsanalytischer Perspektive wird die Frage diskutiert, ob neuere quantitative Methoden der automatischen Korpusauswertung die Analyse großer konversationeller Korpora bei der Untersuchung vorgeformter Sprache vereinfachen bzw. sogar entscheidend voranbringen können. Auf der Grundlage einer längeren OCRisierten Sequenz eines französischen Telefongesprächs, die mit der Transkription verglichen wird, untersucht der Artikel, ob relevante interaktive Phänomene der konversationellen Behandlung vorgeformter Ausdrücke mit Programmen automatisierter Korpusanalyse erhoben werden können. Dabei stellt sich heraus, dass maschinelle Verfahren sich ausschließlich auf segmentale Phänomene beschränken; eine Berücksichtigung insbesondere der Sequentialität verbaler Interaktion wird nicht geleistet.
Stichwörter: Vorgeformte Sprache, Korpus, automatische Korpusauswertung, Gespräch, Interaktion, Sequentialität verbaler Interaktion
1 Introduction
La
réflexion relative au phénomène du 'figement'
langagier est très ancienne : Bréal évoque dès 1872 les
'groupes
articulés',
Bally (1909) les 'groupements
usuels',
Saussure (1916) les 'locutions
toutes faites'.1
Plus récemment, la recherche portant sur la 'préformation
langagière',
pour utiliser un terme plus moderne et plus approprié pour couvrir
le champ concerné, est marquée par trois tendances majeures :
un élargissement du domaine d’investigation, un renoncement au
critère de 'figement'
au sens strict et une orientation vers les corpus.2
La
recherche actuelle sur la préformation langagière au sens large ne
se contente plus de l’analyse de proverbes, lieux communs, dictons
et autres expressions idiomatiques fortement imagées, mais étend le
champ d’investigation aux collocations, aux formules de routine,3
et – depuis l’article fondateur de Fillmore, Kay & O’Connor
(1988) – aux 'constructions'.4
En même temps, à l’exception de certains courants au sein de la
recherche francophone (p. ex. Lamiroy et al. 2010), on a très
largement abandonné l’idée du figement, fortement relativisée
pour n’exclure a
priori
aucune modification d’une 'unité
de construction préformée'
(désormais abrégée UCP). Cette prise de conscience de la
variabilité fondamentale de toute expression préfabriquée est en
grande partie imputable à une orientation de la recherche vers les
corpus qui révèle que les formes de base inventoriées dans les
lemmes des dictionnaires (spécialisés) ne sont le plus souvent pas
celles effectivement employées par les utilisateurs de la langue en
question.5
Toutefois,
force est de constater que la plupart de ces études sont fondées
sur des corpus de productions écrites dont la représentation des
UCP
se limite au seul niveau segmental. Si, très rarement, les analyses
en question font appel à des corpus oraux, ces derniers sont le plus
souvent de nature monologique, rendant impossible la prise en compte
d’aspects interactifs. De plus, en règle générale, on fait
abstraction de la multimodalité de la production orale de segments,
négligeant ainsi aussi bien la prosodie et la communication non
verbale que les facteurs co- et contextuels. Il s’ensuit que nous
ne disposons à ce jour de trop peu de connaissances relatives
au caractère multimodal ainsi qu’à l’utilisation des unités
préfabriquées en contexte dialogal, et conséquemment, de
renseignements relatifs aux fonctions conversationnelles des
expressions idiomatiques.6
Pour
essayer de combler cette lacune dans la recherche sur la préformation
langagière, nos recherches s’orientent vers une étude du
traitement interactif des UCP
en contexte conversationnel. Au regard des tendances de la
recherche actuelle, ayant recours majoritairement à des approches
outillées visant l’obtention de résultats statistiquement
signifiants, nous devons nous interroger quant à la nature de
l’approche de l’étude des UCP
employées
en contexte conversationnel authentique.
L’objectif du présent article est d’en décider : une
méthode outillée, faisant appel à des concordanciers ou autres
logiciels permettant une analyse automatisée de corpus
textuels, est-elle appropriée à une analyse de ce qui est propre à
l’utilisation multimodale en contexte conversationnel, ou faut-il
procéder de manière manuelle, non automatisée, en parcourant
« manuellement » les transcriptions dans leur
intégralité ?
Afin
de fournir une réponse circonstanciée à ces interrogations, nous
allons dans un premier temps circonscrire notre acception de la
notion d’'unitié
de construction préformée'
(section
2) et esquisser les principes d’une analyse conversationnelle de
ces unités (section 3). En section 4 seront présentés les
échantillons d’une analyse 'manuelle'
d’extraits conversationnels correspondant à ces principes. La
section 5 enfin essaiera de déterminer si une analyse 'outillée'
est en mesure de produire les mêmes résultats qu’une analyse
manuelle.
2 Eléments
de définition de l’unité de construction préformée
Habituellement
les UCP sont définies à travers trois traits distinctifs
fondamentaux : au sens large, par leur polylexicalité,
leur stabilité
ou, plus rarement, leur figement,
et au sens étroit, par leur idiomaticité
ou non
compositionnalité sémantique.
Notre position, esquissée succinctement ci-après, varie de cette
acception dominante de l’expression phraséologique.7
Dans
un souci d’intégrer également les 'formules
de routine' monolexicales
(bonjour !
merci ! félicitations !)
dans le champ des UCP, où elles ont naturellement leur place à part
entière,8
nous proposons de remplacer le critère de 'polylexicalité'
par celui de 'polyfactorialité'.
Ce dernier terme serait alors son hyperonyme qui regrouperait aussi
d’autres hyponymes participant à la description sémantique et
pragmatique d’une UCP. Pour les phrasèmes communicatifs évoqués,
les facteurs ‘acte de parole’ (salutation, remerciement,
compliment), ‘situation’, ‘séquentialité’, ‘intonation’,
‘activité non verbale’, etc. constitueraient ainsi un ensemble
factoriel qui justifie l’intégration de ces monolexèmes dans la
catégorie des UCP. Qui plus est, la polyfactorialité ne se limite
aucunement aux seules 'pragmatèmes' ; maintes expressions
polylexicales sont également frappées par ce que Feilke (1998)
dénomme 'empreinte
pragmatique',
i.e. de facteurs d’utilisation spécifiques, étroitement rattachés
à l’UCP, qui peuvent se situer à tous les niveaux. Aussi même un
proverbe du type Tel
père, tel fils
ne peut s’employer pour n’importe quelle comparaison, mais
uniquement pour père et fils9 ;
par ailleurs, la comparaison, utilisée normalement suite à un
comportement typique du fils, concerne le plus souvent des traits de
caractère négatifs communs au père et au fils. Il faut en outre
tenir compte des phénomènes prosodiques (ton ironique) ou non
verbaux (sourire moqueur). Le critère de 'polyfactorialité'
est de ce fait le mieux à même d’intégrer, d’une part toutes
les expressions monolexicales de nature polyfactorielle dans la
classe des UCP, et de décrire d’autre part, tous les facteurs
nécessaires à une utilisation adéquate des phrasèmes, qu’ils
soient mono- ou polylexicaux.
Comme
évoqué, le figement,
la stabilité
est
tout au plus très relative, aucune modification n’étant a
priori
exclue.10
La présence d’un 'dénominateur
phraséologique minimal'
(DPM) est nécessaire afin qu’un interlocuteur puisse reconnaitre
une UCP. Le cas idéal d’un tel DPM est le lexème archaïque qui
n’a survécu qu’à l’intérieur d’une expression préformée,
p. ex. avoir
la berlue,
battre la chamade,
chercher noise.
Ou encore une structure typique du type ‘x c’est x’, p. ex. la
retraite c’est la retraite.11
Il va de soi que les facteurs co- et contextuels jouent un rôle
déterminant dans l’actualisation d’un phrasème – tout comme
la compétence phraséologique de l’interlocuteur.
L’idiomaticité,
définissant les expressions phraséologiques au sens restreint à
travers leur non compositionnalité sémantique, est une qualité
graduelle des UCP, l’idiomaticité pouvant être entière, p. ex. à
fleuret moucheté,
ou partielle, p. ex. fort
comme un Turc.
D’après Burger (2010), le sens des collocations (prendre
rendez-vous)
est compositionnel. Il faudrait cependant restreindre ce qualificatif
à ‘compositionnel au niveau du décodage’,
où l’interprétation est aisée, non pas pour ce qui est de
l’encodage, du fait que les collocations sont également frappées
d’idiomaticité – une comparaison entre différentes langues en
témoigne : se
laver / brosser les dents, brush one’s teeth, sich die Zähne
putzen.
Il faut en effet connaître ces expressions pour pouvoir les
(re)produire de manière adéquate. Feilke (1998) va jusqu’à
constater qu’une grande majorité des productions langagières est
frappée par une empreinte
idiomatique
(« idiomatische Prägung »),
du fait de l’absence d’une totale compositionnalité sémantique.
Pour Hausmann (1997)12,
le spécialiste des collocations de l’allemand, tout est
idiomatique au niveau de l’encodage. Pour un locuteur non-natif
allemand du français, les bases verbales de collocations telles que
passer
une annonce, lancer un appel, faire ses bagages ne
coulent en effet pas de source (sémantique), l’allemand utilisant
respectivement les verbes aufgeben
(Anzeige), starten (Aufruf) et packen (Koffer).13
Ces choix sont donc fondés sur des conventions arbitraires. Ainsi,
les UCP ne sont non seulement soumises à une empreinte idiomatique,
mais en même temps à une empreinte
pragmatique.
Les idiotismes imagés sont en effet le plus souvent liés à des
conditions d’utilisation spécifiques dépendant du statut
social de l’utilisateur, de la situation, de la relation sociale
entre interlocuteurs, du niveau stylistique, sans oublier la prise en
compte de facteurs séquentiels, pour un emploi adéquat.
A
partir de ces critères, Schmale (2013a) définit l’UCP de la
manière suivante :
Est
considérée comme préformée une unité de construction verbale
et/ou non verbale, obligatoirement caractérisée par son caractère
polyfactoriel et un certain degré de stabilité qui permet à un
membre de la communauté langagière concernée de la reconnaître et
de la réutiliser, sachant qu'elle est plus ou moins variable pour ce
qui est de sa taille, sa stabilité, sa compositionnalité
sémantique, sa dissémination et sa durabilité, sa saturation
lexicale, son imbrication dans une situation de communication
spécifique, la présence d'activités non verbales. (Schmale 2013a :
41)
Sans
exclure que toutes les expressions préformées, englobées par cette
définition, notamment les collocations, plutôt dotées d’un
statut de lexème,14
nos recherches se sont concentrées jusqu’à présent sur les UCP
idiomatiques qui ont fait l’objet de très nombreux travaux, mais
sans que l’on se soit véritablement intéressé à leur
utilisation et leurs fonctions.
3 Principes
d’une analyse conversationnelle des unités de construction
préformées
L’étude
de la polyfactorialité et de l’empreinte idiomatique et en
particulier pragmatique, mais aussi du repérage des UCP
effectivement utilisées par les participants en contexte
conversationnel, ainsi que le traitement interactif de ces unités de
construction nécessitent inéluctablement un recours à des corpus
de conversations en contexte naturel, i.e. non sollicitées pour les
besoins de l’analyse (cf. Schmale 2015b). Ces enregistrements sont
ensuite à transcrire selon un système spécifique15,
tenant compte du plus grand nombre d’éléments segmentaux,
suprasegmentaux, non verbaux et contextuels ; cette
restriction « du plus grand nombre » s’impose par le
fait que l’enregistrement reste, pour l’analyste de
conversations, la véritable base de son analyse. La transcription
n’est au fond qu’un outil d’analyse, pourtant indispensable,
mais en aucun cas la donnée originelle du fait qu’une
transcription puisse difficilement, notamment lorsqu’elle intègre
prosodie et communication non verbale, représenter absolument tous
les phénomènes pertinents à la négociation conversationnelle.
C’est
à l’aide de ces transcriptions et, en cas de besoin,
d’enregistrements que l’analyste de conversation reconstitue la
structure de l’interaction établie à travers les activités
réciproques des participants. Dans la quête de cette
reconstitution, l’analyste fonde systématiquement toutes ses
conclusions sur les activités des interactants dans leur déroulement
séquentiel, s’interdisant par conséquent toutes interprétations
fondées sur ses propres convictions ou préférences. Toutefois, il
peut naturellement faire appel à des résultats de recherches
existants, à condition de les vérifier au sein des corpus étudiés
et à condition que les recherches en question aient tenu compte de
la multimodalité du
phénomène étudié.
Mise
à part une analyse fine des activités langagières aux niveaux
segmental et suprasegmental et, le cas échéant, non verbal,
l’analyse porte une attention toute particulière à
l’environnement séquentiel du tour de parole qui accueille l’UCP
en question.
Cela implique que l’on examine la totalité de l’interaction
conversationnelle qui comprend l’UCP, et en particulier les
activités suivantes qui pourraient témoigner de la compréhension
(ou de son absence), de l’interprétation de l’interlocuteur, de
son traitement en général (Schmale 2013b pour des analyses de ce
type).
La
section suivante présentera,
à titre d’exemples, plusieurs
analyses d’extraits selon les modalités esquissées
ci-devant.
4 Spécimens
d’analyse conversationnelle « manuelle » d’expressions
idiomatiques
Les
extraits tirés de nos analyses conversationnelles et issus de
différents corpus présenteront les diverses facettes relatives à
la multimodalité et à l’interactivité des UCP, plus précisément
les expressions idiomatiques (= EI) privées de
compositionnalité sémantique sur lesquelles nous nous sommes pour
l’instant concentrées.16
Dans ce qui suit, nous allons présenter quatre aspects :
- le traitement interactif d’EI (4.1) ;
- les activités non verbales concomitantes comme cas spécifique du traitement interactif (4.2) ;
- la métaphore « potentielle » ainsi que
- l’expressivité comme fonction de la négociation conversationnelle (4.3).
Les
exemples sont tirés de notre corpus de talk-shows de la télévision
allemande (cf. Schmale 2013b), traduite pour les lecteurs français
par nos soins, d’une part, ainsi que de nos corpus de conversations
téléphoniques françaises (Schmale 2007a et b), d’autre part.
4.1
Le traitement interactif des expressions idiomatiques
L’analyse
de corpus de dialogues en contexte naturel révèle que les
expressions idiomatiques imagées sont très fréquemment
« traitées » soit par le producteur de l’EI lui-même,
soit par son interlocuteur. « Traitées » cela signifie
qu’elles sont rephrasées littéralement (Schmale 2001b, 2012),
paraphrasées ou paraphrasantes (Schmale 2007a, 2012), accompagnées
de commentaires métadiscursifs (Schmale 2009, 2012) ou d’activités
non verbales (Schmale 2005, 2012).
Ci-après seront
analysés
trois extraits de nos corpus illustrant l’analyse des trois cas
de figure de l’EI-paraphrasée et de l’EI-paraphrase en contexte
conversationnel.
4.1.1 Paraphrase
d’une expression non phraséologique par une expression
idiomatique : Enon
phr
> EI17
Pour
diverses raisons, un locuteur peut paraphraser un énoncé ou une
partie dont il a été destinataire par une expression idiomatique:
(1) L’animatrice (A) pose une question à une invitée « sataniste » (S). (IC/3-6-4)18
01 A können sie eigentlich das wort gott sagen ohne dass es ihnen weh tut,
('pouvez-vous prononcer le mot dieu sans que cela vous fasse mal)'
02 S ich würds nich in den mund nehmen;
('je ne le prononcerais pas'; *"je ne le prendrais pas dans la bouche")
03 A und rückwärts auch nich,
('même pas à l’envers')
04 S in KEInem fall;
('en AUcun cas')
05 A das würd ich ihnen auch verbieten;
('je vous l’interdirais de toute façon')
L’interlocuteur
sataniste paraphrase, dans ce cas, le verbe simple sagen
('dire', 'prononcer') de l’animatrice par l’EI métaphorique in
den Mund nehmen.
Le
rôle de la paraphrase idiomatique réside vraisemblablement
dans un renforcement de son refus d’employer le mot Dieu.19
4.1.2
Hétéro-paraphrase
d’une expression idiomatique par une autre expression
phraséologique, idiomatique ou non : EI1
> EI2
ou Ephr
Le
récipiendaire d’une expression idiomatique peut paraphraser cette
dernière à travers une autre expression phraséologique qui peut
même être idiomatique:
(2) L’animateur (A) pose une question à un invité (I) au sujet de la relation avec ses co-détenus. (Bio/30-6/2)
01 A man is man is in der hierarchie der gefangenen ganz unten;
('on est tout en bas dans la hiérarchie des détenus')
02 I ja auf gut deutsch man- man is der letzte dreck;
('pour être franc on est on est moins que rien; *"la dernière des saletés")20
03 A ja;
('oui')
Une EI imagée –
man
is ganz unten
(on est tout en bas) – est ici hétéro-paraphrasée par une autre
EI, plus forte, man
is der letzte dreck.
A travers la paraphrase de l’EI de A, I accepte l’affirmation
prononcée par A, tout en renforçant celle-ci.
4.1.3
Paraphrases
d’une expression idiomatique par une expression non
phraséologique :
EI
> Enon
phr
Plus
fréquemment, une EI est paraphrasée par une expression non
phraséologique, d’une part du fait qu’une EI2
sémantiquement plus ou moins équivalente n’est pas disponible,
d’autre part pour des raisons explicatives (cf. Infra):
(3) L’invité Horst fait appel à des prostituées ; un homme du public présent sur le plateau TV (P) le commente. (BS/19-3/3)
01 A (s’adressant à un homme du public du studio)
02 A behauptest du einige frauen machen ihren job äh schlecht,
('est-ce que tu prétends que certaines femmes font mal leur boulot')
03 P das kann ich nich beurteilen; ich sag nur jedem tierchen sein plaisirchen;
('je suis incapable d’en juger je dis seulement à chacun sa façon')
04 P jeder soll so leben wie er es für richtig hält;
('tout un chacun doit vivre comme bon lui semble')
L’auto-paraphrase
non idiomatique jeder
soll
so
leben wie er es für richtig hält
(l. 04) permet à P de clarifier le sens de son EI de la ligne 03
(jedem
tierchen sein plaisirchen),
et d’appuyer par là même son message ; P
souhaite probablement aussi allonger son énoncé afin de rester plus
longtemps à l’antenne.
4.2
Activités non verbales concomitantes à la production d’une
expression idiomatique
Le
recours à un corpus d’enregistrements de talk-shows prenant en
compte les activités non verbales des participants, a permis de
démontrer que les EI sont parfois accompagnées de gestes
illustrateurs (Schmale 2005).
(4) L’invitée R a rencontré son père biologique géorgien très tard dans sa vie. (Bio/2-2/5)
01 R also ich sag ihnen ehrlich-
('bon ben je vais vous dire très franchement')
02 R mir i::s- (faisant un mouvement circulaire avec les deux mains)
03 R SO ein stein + von meinem herzen gefallen;
('j’ai ressenti un tel soulagement'; *'une grosse pierre est tombée de mon cœur')
04 R weil ähm ich mich immer ein bisschen anders gefühlt habe;
('parce que je me suis toujours sentie un peu différente')
Même
si l’EI allemande métaphorique mir
ist ein Stein vom Herzen gefallen
signifie ‘être soulagée’, c’est par le biais du geste
illustrateur pictographique (l. 02) que R indique l’importance de
ce soulagement.21
4.3 Métaphore
et expressivité potentielles comme fonctions de la négociation
conversationnelle
Régulièrement,
on attribue un caractère métaphorique
ou des traits innés d’expressivité
à toute expression idiomatique imagée. Il s’avère toutefois que
la 'métaphoricité',
déterminée par les sémanticiens à partir de l’existence de
traits sémantiques partagés, un tertium
comparationis
sémantique entre domaine source
et domaine cible
d’une expression imagée, n’est que rarement apparente en surface
de la conversation. Le plus souvent, l’analyste ne dispose d’aucune
trace langagière de l’interprétation effective (ou de son
absence) d’une relation métaphorique, p. ex. par le biais d’une
activité metadiscursive ou d’un problème d’intercompréhension.
Seule une analyse fine de l’environnement séquentiel peut
permettre de conclure à l’interprétation d’une relation entre
domaine source et domaine cible:
(5) Une infirmière explique l’objectif des entretiens à une patiente. (Walther 2005 : 376)
01 I alle menschen sind verschieden; ne,
('les êtres humains sont tous différents non')
02 P ja;
('oui')
03 I kann man nich alle äh äh so nehmen wie- (4.0)
('on ne peut pas tous les prendre comme-')
04 I über einen kamm scheren;
('les mettre tous dans le même sac'; *tous les coiffer avec le même peigne)
05 P nee im gegenteil; (2.0) ich [sage immer man müsste‘]
('non au contraire je [dit toujours qu’il faudrait]')
06 I [man müsste alles indivi]duell-
['il faudrait individuellement']
07 P richtich;
('absolument')
08 I man muss eigentlich auch jeden individuell beTREUn;
('il faudrait soigner chaque patient individuellement')
L’EI
(nich)
alle über einen kamm scheren
(l. 04) ne possède a
priori
pas de base sémantique car le lien entre domaine source (coiffer
qn à l’aide d’une peigne)
et cible (ne
pas traiter tous de la même manière)
n’est pas transparent. Cependant, le cotexte comprend plusieurs
activités qui témoignent de la compréhension aussi bien de la
locutrice-productrice que de son interlocutrice : l’indication
de l’infirmière que tous les êtres sont différents (l. 01),
précédant la production de l’EI, et surtout la paraphrase
indiquant que tous ont besoin de soins individualisés (cf. l.
06/08).22
L’expressivité,
à l’instar de la métaphoricité,
n’est pas une qualité innée des expressions idiomatiques, il
s’agit plus exactement d’un potentiel qui relève des activités
et des interprétations des participants.23
Selon Gréciano (1983), la paraphrase idiomatique de l’extrait
suivant serait ainsi revêtue d’un degré d’expressivité plus
fort que l’énoncé non phraséologique paraphrasé:
(6) L’animateur a posé une question à une invitée concernant son surpoids. (JP/3-2/3)
01 I aber auch n großer grund is eigentlich, dass ich sehr gerne esse-
('mais l‘une des raisons principales est au fond que j’aime manger')
02 I auch essen zubereite- gäste einlade- (.) und kein kostverächter bin also:-
('je prépare à manger invite des gens aime bien la bonne chère enfin')
Toutefois,
aucun élément segmental, suprasegmental ou non verbal24
ne converge vers une plus grande expressivité de l’EI par rapport
à l’expression verbale sehr
gerne essen.
L’EI résume tout simplement ce qu’I vient d’énoncer
auparavant, le renforce probablement au moyen de la simple répétition
du contenu, en aucun cas en raison d’une expressivité innée de
l’EI.
Le
même constat s’impose pour l’extrait (7) suvant:
(7) L’animatrice déclare au sujet d’un mari infidèle. (BS/3-6/2)
01 A so einen würd=ich doch LAUfen lassen; […]
('mais un type pareil je le laisserais partir')
02 A aber dann würd ich so einen doch in=nen WIND schiessen und laufen lassen;
('mais un type comme ça je l’enverrais balader ou promener')
Mis
à part le fait que l’image in
den wind schießen
pourrait revêtir un caractère plus fort que laufen
lassen,25
il convient de souligner que deux lexèmes voire les parties de
lexèmes sont fortement accentués, et en particulier que cette EI
est accompagnée d’un geste de la main gauche de A, une sorte de
« bras d’honneur ». C’est sur la base de ces éléments
que l’on peut conclure à une expressivité conversationnelle du
tour de parole qui comprend l’EI in
den wind schießen.
L’EI développe donc ici son potentiel expressif et doit, pour le
faire, être accompagnée d’autres phénomènes, ici :
suprasegmentaux et non verbaux.
5 Analyse
« outillée » d’extraits conversationnels ?
Examinons
à présent la question de savoir si une méthode outillée visant à
l’obtention de données à valeur statistique fondée sur une
analyse automatisée s’avère être plus apte à élucider ce
qui est propre au traitement interactif des UCP qu’une approche
manuelle. En se fondant sur la recherche de n-grams,
pratiquée par Siepmann & Bürgel (2015, à par. a et b), il
s’agit de décider si cette méthode procure effectivement
davantage de facilité et offre une plus validité que l’approche
manuelle présentée précédemment.
Ces
auteurs étudient en effet à l’aide du logiciel Sketch
Engine
les données du corpus du français écrit et parlé, le Corpus
de Référence du Français Contemporain
(CRFC). Le CRFC intègre également nos corpus de conversations
téléphoniques (Schmale 2007b et 2007c). Voici à des fins
illustratives un extrait de l’une des conversations téléphoniques,
transcrite selon GAT (8), suivi d’exactement la même séquence en
version CRFC (9):
(8) B, résidant à Mayence en Allemagne, appelle son amie F, qui lui avait promis de visiter ensemble le musée Gutenberg (Schmale 2007b : 20720-8 : l. 025-043):
025 B non que: de’ t=es pas venue à mayence alors;
026 F < si j=suis venue à mayence,
027 F mais tu verrais dans les conditions,
028 F on y est restés peut-être une heure en tout et pour tout,
029 F on a eu à peine le temps
030 F de visiter le musée gütemberg,>
031 B < (ah ben c’est-)>
032 B ben j=t=avais dit que je venais euh-
033 F ça (a été) sur les chapeaux de roues,
034 B & < j=t=avais dit que j=venais le visiter avec toi: voyons;>
035 F < non;
036 F oui- oui- oui bernard;>
037 F je m’en souviens très bien de c=que tu m’avais dit,
038 F mais je m’en souviens très bien < aussi
039 F comment ça s’est passé pour moi;> oh ben si tu veux
040 B a::h la la:-
041 F je te raconterai dans les détails,
042 B oui, ben-
043 F mais c’était vraiment la course; hein>
(9) 025 B non que: de' t=es pas venue à mayence alors;26
026 F «rit p> si j=suis venue à mayence,
027 F mais tu verrais dans les conditions,
028 F on y est restés peut-être une heure en tout et pour tout,
029 F on a eu à peine le temps
030 F de visiter le musée gütemberg,>
031 B «p> (ah ben c'est-)>
032 B ben j=t=avais dit que je venais euh-
033 F ça (a été) sur les chapeaux de roues,
034 B & «all> j=t=avais dit que j=venais le visiter avec toi: voyons;>
035 F «all> non;
036 F oui- oui- oui bernard;>
037 F je m'en souviens très bien de c=que tu m'avais dit,
208 209
038 F mais je m'en souviens très bien «rit> aussi
039 F comment ça s'est passé pour moi;> oh ben si tu veux
040 B a::h la la:-
041 F je te raconterai dans les détails,
042 B oui, ben-
043 F mais c'était vraiment la course; hein>
[Représentation de la séquence (8) au format CRFC.]
Tout
en relativisant les observations qui vont suivre étant donné que
Dirk Siepmann,27
éditeur principal du CRFC, nous a indiqué que la forme du corpus
n’était pas définitive, un nettoyage allant intervenir
ultérieurement, il faut constater ceci :
- les phases d’énonciation simultanées disparaissent (cf. les lignes 030-031, 032-033, 034-035, 039-040, 042-043), rendant la lisibilité de certaines parties quasi impossible ;
- certains signes spéciaux sont remplacés par des signes ayant une autre signification, p. ex. ‘ << ’ indiquant le début d’un commentaire du transcripteur par des guillemets (‘ « ‘) ;
- le scan automatique du corpus, pour l’extrait présenté relativement fidèle, même s’il intègre les numéros de pages du corpus (cf. 208 209 entre les lignes 037 et 038) produit parfois des séquences entières totalement illisibles, mélangeant la numérotation des énoncés de deux pages différentes.
Ces
imprécisions dans la présentation du corpus font qu’une analyse
séquentielle, au cœur de l’approche conversationnelle, devient
impossible, ce qui n’est guère surprenant puisque les objectifs
des auteurs du CRFC sont exclusivement lexicologiques et / ou
lexicographiques, visant à la découverte de constructions à
différents niveaux à partir du bi-gram.
Ce que nous souhaitons démontrer à travers nos observations est
qu’une analyse outillée de phénomènes interactifs n’est pas
possible à moins que l’on investisse un travail considérable dans
la présentation et dans l’indexation, nécessitant une analyse
préalable, des séquences.28
Une approche « manuelle » serait de
ce fait
en fin de compte plus économique et efficace.
En
outre, une étude automatisée de n-grams
rencontre deux difficultés majeures pour ce qui est de l’analyse
des UCP : primo,
dus aux problèmes de numérisation évoqués, l’indication de
lignes et / ou le sigle locuteur sont traités comme unités n,
en conséquence c’est
(395 occurrences), j’ai
(90) ou ah
(26) sont considérés comme bi-grams
par une recherche automatique via Sketch
Engine.
Secundo,
celle-ci ne retient très majoritairement que les combinaisons de
deux termes29
– p. ex. parce
que
(94), sais
pas
(68), il
est
(48) – qui n’appartiennent pas à la classe des UCP comme
définies, seules certaines formules de routine – ça
va
(86), ben
oui
(61), bon
ben
(45), tu
sais
(41), au
revoir
(37) – sont relevées.
En
revanche, ni expressions idiomatiques ni collocations ne sont
retenues, faute de fréquences suffisantes. Aussi bien les EI se
faire arrêter (par le médecin), être sur les chapeaux de roues
(8),
faire du porte à porte, en dire de toutes les couleurs à quelqu’un,
être mauvaise langue,
etc. que les collocations (ou idiomes partiels) ne
pas être la faute de quelqu’un, tenir compagnie, faire la surprise
à qn, avoir l’air de, être à moitié qc, se fatiguer à faire
qc, ne pas être question de,
etc. du corpus de conversations
téléphoniques privées (Schmale 2007b) font de ce fait partie de la
« Word
List » des n-grams
automatiquement
constituée. L’utilité d’une analyse automatisée semble par
conséquent résider avant tout dans le repérage de n-grams
qu’il faut ensuite évaluer « manuellement » sur la
base de critères spécifiques selon leur appartenance à la classe
des unités de construction préformées – comme le font du reste
Siepmann & Bürgel dans leurs travaux. On pourrait aussi
envisager une indexation préalable de séquences qui permettrait
ensuite une recherche automatique. Toutefois, une telle
indexation serait extrêmement chronophage, qui plus est, elle
impliquerait en amont de toute analyse approfondie une interpretation
obligatoirement préconçue selon les intérêts de recherches des
données, contraire à la mentalité analytique esquissée
auparavant.
Les
analyses « outillées » à l’aide de concordanciers
tels AntConc
ou
SketchEngine
se font de surcroît exclusivement au niveau segmental des unitiés
lexicales linéarisées, excluant par là même les phénomènes de
la multimodalité, de l’interactivité et de la séquentialité qui
se trouvent au cœur de nos intérêts de recherche.
Le
recours à un traitement automatique
aurait-elle permis de repérer l’utilisation, de surcroît erronée,
de l’UCP induire
en erreur ?30
(10) [INTRODUIT EN ERREUR]
277 E c’est pas l’allocation compensatrice
279 D [alors là, on (m’a introduit) en erreur là;]
280 E [l’allo(cosa)tion compensatrice, (.) c’est’]
281 c’est pour aider les gens à s’habiller, à manger,
282 quand ils peuvent pas couper leur viande,
[Schmale 2007c : (46), p. 190.]
En
raison de la fréquence plus que réduite de l’EI induire / *introduire
en errreur,
AntConc
ne l’aurait pas repérée, aurait en plus négligé que sa
production (l. 279) est chevauchée par le tour de parole de son
interlocutrice E (l. 280),
fait qui pourrait avoir une incidence sur la négociation
conversationnelle.
Par
conséquent, indépendamment du fait qu’une analyse outillée ne
permet pas d’élucider les EI d’un point de vue quantitatif du
fait de leur rareté, l’étude quantitative à l’aide de
logiciels spécialisés (SketchEngine
ou AntConc)
fait abstraction de tous les phénomènes propres à l’organisation
conversationnelle d’une interaction verbale. Se limitant à une
analyse au seul niveau segmental, elle n’est de ce fait pas à même
de capter le véritable caractère du traitement interactif des
expressions idiomatiques en contexte conversationnel.
Références
Bally,
Christian (1909). Traité
de stylistique française.
Paris: Klincksieck.
Bréal,
Michel (1872). Quelques
mots sur l’instruction publique en France.
Paris: Hachette.
Burger,
Harald (42010,
1998). Phraseologie.
Eine
Einführung am Beispiel des Deutschen.
Berlin:
Erich Schmidt.
Coulmas,
Florian (1981). Conversational
Routines: Exploration in Standardized Communication Situations and
Prepatterned Speech.
New
York: Mouton Publishers.
CRFC
– Corpus de Référence du Français Contemporain.
(https://zenodo.org/record/
2353#.Vm2x kr_F-pA; 12.12.2015).
Dudenredaktion
(Hrsg.) (42013).
Duden
Band 11: Redewendungen. Wörterbuch der deutschen Idiomatik.
Berlin: Dudenverlag.
Feilke,
Hartmut (1998). Idiomatische Prägung. In: Barz, Irmhild &
Günther Öhlschläger (Hrsg.). Zwischen
Grammatik und Lexikon.
Tübingen:
Niemeyer, 69-80.
Fillmore,
Charles J., Paul Kay & Mary C. O’Connor (1988). Regularity and
Idiomaticity in Grammatical Constructions: The Case of Let
Alone.
In: Language
64 (1988) 3, 501-538.
Gréciano,
Gertrud (1983). Signification
et dénotation en allemand. La sémantique des expressions
idiomatiques.
Paris/Metz: Klinksieck.
Gülich,
Elisabeth (1988/1997). Routineformeln und Formulierungsroutinen. Ein
Beitrag zur Beschreibung formelhafter Texte. In: Wimmer, Rainer &
Franz-Josef Berens (Hrsg.). Wortbildung
und Phraseologie.
Tübingen: Narr (= Studium zur deutschen Sprache 9), 131-175.
Günthner,
Susanne (2006). Von Konstruktionen zu kommunikativen Gattungen: Die
Relevanz sedimentierter Muster für die Ausführung kommunikativer
Aufgaben. In: Deutsche
Sprache
34 (2006), 173-190.
Hausmann,
Franz Josef (1997). Tout est idiomatique dans les langues. In:
Martins-Baltar, Michel (éd.). La
locution entre langue et usages.
Paris: ENS, 277-290.
Hausmann,
Franz Josef & Peter Blumenthal (2006). Présentation:
Collocations, Corpus, Dictionnaires. In: Langue
française
150 (2006) 2, 3-13.
Lamiroy,
Béatrice (coord.) et al. (2010). Les
expressions verbales de la francophonie.
Paris: Ophrys.
Mel’čuk,
Igor A. (2011). Phrasèmes dans le dictionnaire. In: Anscombre,
Jean-Claude & Salah Mejri (éds.). Le
figement linguistiques: la parole entravée.
Paris:
Honoré Champion, 41-61.
Saussure,
Ferdinand de (1916). Cours
de linguistique générale.
Paris: Payot.
Schemann,
Hans (1993). Pons
Deutsche Idiomatik. Die deutschen Redewendungen im Kontext.
Stuttgart/Dresden: Klett.
Schmale,
Günter (2001a). Le
traitement conversationnel de phrasèmes dans les talk-shows de la
télévision allemande.
Nantes: Manuscrit non publié, 253p.
Schmale,
Günter (2001b). Rephrasages comme traitement conversationnel de
phrasèmes dans les talk-shows de la télévision allemande. In:
Beiträge
zur Fremdsprachenvermittlung 39
(2001), 47-71.
Schmale,
Günter (2005). Nonverbale Aktivitäten bei der Äußerung von
Phraselogismen. In: Studia
Germanica Universitatis Vesprimiensis
9 (2005) 2, 159-173.
Schmale,
Günter (2007a). Paraphrases phraséologiques dans la conversation.
In: Kara, Mohammed (éd.) (2007). Usages
et analyses de la reformulation. Recherches
Linguistiques 29,
163-175.
Schmale,
Günter (Hrsg.) (2007b). Communications
téléphoniques I: Conversations privées – Un corpus de
transcriptions. Sonderheft
12 der Beiträge zur Fremdsprachenvermittlung. Landau:
VEP.
Schmale,
Günter (Hrsg.) (2007c).
Communications
téléphoniques II: Conversations en contexte professionnel et
institutionnel – Un corpus de transcriptions. Sonderheft 13 der
Beiträge zur Fremdsprachenvermittlung.
Landau: VEP.
Schmale,
Günter (2009). Metalinguistic Comments and Evaluations of
Phraseological Expressions in German Talk Shows. In: Textes
& Contextes 4
(2009). (https://halshs.archives-ouvertes.fr/
halshs-00446159/document; 15.08.2016).
Schmale,
Günter (2010). Ist ein idiomatischer Ausdruck immer expressiv?
Korpusbasierte und fragebogengestützte Beobachtungen zu einer
verbreiteten Prämisse. In:
Yearbook of Phraseology I.
Berlin/New York: de Gruyter Mouton, 97-124.
Schmale,
Günter (2012). The Conversational Treatment of Idiomatic Expressions
in German Talk Shows – A corpus-based study. In: Pamies, Antonio et
al. (eds.) (2012). Phraseology
and Discourse: Cross-Linguistic Corpus-based Approaches.
Baltmannsweiler: Schneider Hohengehren, 181-192.
Schmale,
Günter (2013a). Qu’est-ce qui est préfabriqué dans la langue ? –
Réflexions au sujet d’une définition élargie de la préformation
langagière. In:
Legallois, D. & A. Tutin (eds.). Vers
une extension du domaine de la phraséologie. Langages 189
(2013), 27-45.
Schmale,
Günter (2013b). Forms
and Functions of Idiomatic Expressions in Conversational Interaction.
In: id. (ed.): Formen
und Funktionen vorgeformter Konstruktionseinheiten in authentischen
Konversationen
/ Forms and Functions of Formulaic Construction Units in
Conversation.
Linguistik
online
62 (2013), 67-96. (http://www.linguistik-online.de/62_13/sch
male.pdf; 08.11.2015).
Schmale,
Günter (2014). Mögliche Metaphern in der Konversation. In: Lefèvre,
Michel (ed.).
Linguistische Aspekte des Vergleichs, der Metapher und der Metonymie
(= Eurogermanistik 33). Tübingen: Stauffenburg, 85-102.
Schmale,
Günter (2015a). Le rôle de l’image matérielle dans
l’actualisation du sens métaphorique des expressions idiomatiques.
In:
Bricco, Elisa et al. (dir.): Les
avatars de la métaphore. Publif@rum
23 (2015), 18pp.
(http://www.publifarum.farum.it/ezine_articles.php?publifarum
=6c6500903d681eec992d8efdda23551f&art_id=321; 16.08.2016).
Schmale,
Günter (2015b). Korpusbasierung, Multimodalität, Interaktivität,
Konstruktions-orientierung – Prinzipien einer zeitgemäßen
linguistischen Pragmatik und Fremdsprachendidaktik. In:
Olszewska, Danuta et al. (Hrsg.). Studia
Germanica Gedanensia 33
(2015), 84-108.
Selting,
Margret et al. (1998). Gesprächsanalytisches
Transkriptionssystem (GAT). In: Linguistische
Berichte
173 (1998), 91-122.
Siepmann, Dirk & Christoph Bürgel (2015). L’élaboration d’une grammaire pédagogique à partir de corpus : l’exemple du subjonctif. In: Tinnefeld, Thomas (Hrsg.). Grammatikographie und didaktische Grammatik – gestern, heute; morgen. Gedenkschrift für Hartmut Kleineidam anlässlich seines 75. Geburtstages (= Saarbrücker Schriften zu Linguistik und Fremdsprachendidaktik (SSLF), A: Sammelbände, Bd. 3). Saarbrücken: htw saar, 159-185.
Siepmann,
Dirk, Christoph Bürgel & Sascha Diwersy (2016). Le Corpus de
référence du français contemporain (CRFC), un corpus massif du
français largement diversifié par genres. In: Congrès
Mondial de Linguistique Française 2016.
(
http://www.linguistiquefrancaise.org/arti
cles/shsconf/pdf/2016/05/shsconf_cmlf2016_11002.pdf; 24.09.2017).
Siepmann,
Dirk & Christoph Bürgel (à par.). Les
unités phraséologiques fondamentales du français contemporain. A
par. In: Kauffer, Maurice & Yvon Keromnes (éds.). Approches
théoriques et empiriques en phraséologie.
Stauffenburg: Tübingen.
Walther,
Sabine (2005). Erstgespräche
zwischen Pflegepersonal und Patienten im Krankenhaus-Alltag.
Radolfzell: Verlag für Gesprächsforschung.
Auteur:
Günter Schmale
Professeur de linguistique allemande
Université Jean Moulin Lyon 3
Faculté des Langues
Manufacture des Tabacs
Université Jean Moulin Lyon 3
1C avenue des Frères Lumière
CS 78242
F – 69372 L Y O N
Cd 08, Centre d’Etudes Linguistiques
(EA 1663)
E-Mail :
gunter.schmale@univ-lyon3.fr
1
Cf.
Schmale (2013a : 27-28) pour un aperçu de différentes
perceptions du « figement » dans l’histoire de la
linguistique.
2
Nous nous concentrons sur les tendances récentes pertinentes pour
le développement proposé.
3
Les pragmatèmes de Mel’čuk (2011), les phrasèmes communicatifs
de Burger (1998) ou les idiomes pragmatiques de Burger (1973).
4
Sans même parler des « textes préformés » (Gülich
1988 / 1997), p. ex. les faire
part,
ou encore des « genres communicatifs » (les
« kommunikative Gattungen » de Günthner 2006) du type
« cérémonie de mariage » ou « procès en
justice ».
5
Constat qui se vérifie dans notre étude de 32 heures de talk-shows
de la télévision allemande (Schmale 2001a) où seulement une
minorité des expressions idiomatiques relevées revêtent la forme
indiquée par les dictionnaires spécialisés Duden 11 (2013) ou
Schemann (1993).
6
Cette
même observation ne s’applique bien entendu pas aux formules de
routine, dont les nombreuses fonctions ont été étudiées (p. ex.
Coulmas 1981), ou aux collocations dont l’utilisation est
« inévitable » et qui, à l’instar de lexèmes
simples, ne possèdent pas de connotations spécifiques, p. ex. se
laver les dents, prendre rendez-vous.
7
Cf. Schmale (2013a) pour une présentation plus développée.
8
Nombreux
sont les travaux qui incluent les pragmatèmes ou formules de
routine dans le domaine de la phraséologie tout en définissant le
phrasème à travers le critère de la polylexicalité (cf. p ex.
Coulmas 1981 ou Mel’čuk 2011).
9
Même si on voit de plus en plus souvent telle
mère, telle fille ;
une recherche Google
rend 716 000 résultats.
10
Il
suffit de regarder les unes du Canard
Enchaîné
ou les très nombreuses publicités faisant appel à des jeux
de mots.
11
Entendu à la télévision lors d’une grève des routiers.
12
Cf.
également Hausmann & Blumenthal (2006).
13
Il s’agit de traductions des collocations françaises précédentes.
14
Mais
il va de soi que, pour le conversationnaliste, le véritable critère
reste le traitement conversationnel, i. e. si une collocation fait
l’objet d’une activité suivante s’y rapportant, elle sera
naturellement étudiée.
15
Nous utilisons le Basistranskript
augmenté de quelques éléments du Feintranskript
du GAT
de Selting et al. (1998).
16
Du
fait qu’elles ont été au centre des recherches en phraséologie
qui font toutefois, l’impasse sur l’analyse d’aspects de
l’oralité.
17
Notre
traduction française n’est pas forcément en mesure de reproduire
le même phénomène qu’en allemand. Nous essayons de le rendre
dans la mesure du possible via une traduction littérale entre
parenthèses.
18
Les
extraits (1) à (4) sont tirés de notre corpus de talk-shows
(Schmale 2001).
19
Cf. Schmale (2013b) pour une analyse détaillée des fonctions de
l’utilisation d’EI en contexte conversationnel.
20
LEO propose « comme une merde ».
21
Il
existe en allemand en effet les lexèmes Steinbruch
(carrière), Felsbrocken
(roché), Riesenstein
(grosse pierre) qui permettraient de renforcer lexicalement
l’expression de l’intensité du soulagement.
22
Que P voulait probablement fournir en ligne 05. – Cf. Schmale
(2014) pour d’autres extraits de ce type et Schmale (2015a) sur le
rôle de l’image matérielle dans l’actualisation du sens
métaphorique.
23
Cf.
Schmale (2010) pour une discussion plus développée de cette
problématique et une discussion d’autres extraits.
24
Nous
avons bien entendu re-visionné l’extrait de
talk-show. Il n’y a pas non plus de réaction venant de
l’animateur ou du public, friands de tous jeux de mots.
25
En raison du verbe schießen
(tirer), acte a
priori
plus violent que ‘laisser partir’.
26
Nous
précisons qu’il s’agit d’un copier-coller de la séquence du
corpus océrisé présente au sein du CRFC.
27
A qui nous sommes du reste redevable pour avoir mis à notre
disposition la version CRFC de notre corpus de communications
téléphoniques privées (Schmale 2007b).
28
Du
reste, une indexation selon quels critères ?
29
Quelques
rares quadri-grams, p. ex. au
mois de novembre
(9), ah
ben c’est bien
(8) ou
vacances de la toussaint
(5), mais aucun quinta- ou sexta-gram.
30
Les énoncés des lignes 279 et 280