- Paraît chaque dimanche à 8 heures tapantes, méridien de Paris -

Éléments de linguistique

Table des matières

  • Linguistique comparée et historique, proto-indo-européen
  • Morphologie indo-européenne
    • voyelles-pivots et théorie des laryngales
    • racines, suffixes, thèmes, désinences et mots
    • infixe nasal
    • dérivation et voyelle thématique alternante
  • Lois de mutation phonétique
    • Loi de Grimm
    • Loi de Verner
    • Loi de Holtzammn
  • Groupes linguistiques indo-européens
    • Chronologie
    • tokharien
    • langues italiques
    • langues celtiques
    • langues indo-iraniennes
  • vocabulaire linguistique
    • cognat
    • épenthèse
    • métathèse
    • réfection
    • s-mobile
    • substrat
    • verbe résultatif
(en construction !)

Linguistique comparée et historique, proto-indo-européen

Le proto-indo-européen est cette langue hypothétique qui serait la langue-mère à l'origine de toutes les langues indo-européennes, langues que l'on répartit généralement en 8 grands groupes, auxquels on ajoute deux langues sans regroupement, l'albanais et l'arménien :
  • l'albanais,
  • l'arménien,
  • les langues balto-slaves,
  • les langues celtiques,
  • les langues germaniques,
  • les langues helléniques,
  • les langues indo-iraniennes,
  • les langues italiques,
  • les langues anatoliennes,
  • les langues tokhariennes.

La dérivation d'un mot de l'indo-européen dans des langues indo-européennes se fait globalement de la même façon, par ce que j'appelle percolation lente : par évolution progressive du mot original.

Le résultat de ce long processus ?

Des cognats,
du latin cognatus, “parent par les liens du sang,
des mots cousins, qui partagent un ancêtre commun.

Ne confondons donc pas ce lent processus avec le mécanisme des emprunts lexicaux.

À côté des dérivés par filiation directe, parfois fruits d'une évolution qui a pris des millénaires, l'emprunt est un mot qu'une langue va rapidement incorporer, parfois même tel quel
on parlera alors de calque -,
dans son lexique, à partir d'une langue étrangère, sans qu'il y ait nécessairement filiation entre ces langues. 

Pour résumer, des cognats sont apparentés les uns aux autres car ils ont évolué à partir d'un ancêtre commun,
ce que l'on appelle un étymon,
un mot à l'origine d'autres mots, ou si préférez, un mot vers lequel convergent, par leur étymologie, d'autres mots plus récents.

Quelques exemples repris d'articles précédents :

Le latin liber est issu (issu = dérivé par percolation lente) de la racine indo-européenne *lubʰ-.

Mais ce même latin a été vulgairement emprunté en français pour donner livre, ou en breton, pour donner levr. C'est ce qui peut d'ailleurs expliquer la forme de ces deux mots, toujours proche de l'étymon latin original liber, car ayant peu évolué.
racine indo-européenne *lubʰ-, peler (écorcer)” suffixée en -*ro-

*lubʰ-ro-“feuille, écorce 

radical proto-italique *lufro-
latin liber, “écorce, livre”

emprunt
français livre (fin XIème)

(De très nombreux mots français sont issus (percolés) du latin, mais certains, comme livre, ne sont que des emprunts.)

Vous retrouverez notre français café en anglais : emprunt. 
Comme vous trouverez l'anglais parking en français : emprunt.

Notre bazar nous vient du perse bāzār, marché” : emprunt.

Mais le féroïen fergja, “presser, pousser, comprimer...”, et le français arche sont des cognats, car dérivent tous deux (sont issus) d'une lointaine forme commune, l'adorable indo-européenne *ark-. 
Relisez donc Les Féroé ? Le tombeau des baleines...

la création simplifiée de cognats dans une langue L1 et une langue L2, 
chacune d'un groupe linguistique différent ?
(“percolation naturelle”)
langues reconstruites - langues attestées

racine indo-européenne
⇓                 ⇓
proto-langue P1  proto-langue P2
⇓                           ⇓
ancienne langue L1    ancienne langue L2
⇓                                    ⇓
moyenne langue L1          moyenne langue L2
⇓                                          ⇓
cognat dans la langue L1                   cognat dans la langue L2



un exemple de mécanisme de création d'emprunts ?

racine indo-européenne
proto-langue P1
⇓ 
ancienne langue L1
moyenne langue L1
                                                  langue L1 ⇒ emprunt ⇒ langue L2


Encore une chose : une proto-langue, dite aussi langue commune, est systématiquement une langue reconstruite par la linguistique comparée et historique, qui permet de présenter un état de langue à une époque déterminée.
C'est toujours à partir de mots attestés (retrouvés dans des écrits) que l'on peut recréer l'étymon duquel ils sont issus dans leur proto-langue.

À l'origine des langues germaniques, le proto-germanique. À l'origine du latin, ou de l'osque ou du sabin, le proto-italique, et ainsi de suite.

En d'autres termes, une proto-langue
(proto-slave, proto-balte, proto-germanique, proto-celtique, voire carrément - soyons fou -  proto-indo-européen...),
est toujours reconstruite ; il s'agit du résultat d'un exercice complexe de linguistique comparative et historique où l'on part de mots plus récents, auxquels on essaye de retrouver un ancêtre communun étymon, qui permettrait de les expliquer.

L'existence de ces proto-langues, fruit d'un pur exercice intellectuel, théorique par définition, est forcément difficile à prouver. Mais parfois, la chance sourit aux audacieux linguistes historiques, et des éléments factuels viennent attester le bien-fondé de ce processus (lisez donc Un Anglais roulant en Jeep Wrangler (et non en Land-Rover) ? Wrong. Simplement wrong., et voyez ce que raconte David W. Anthony à ce propos).

Morphologie indo-européenne

voyelles-pivots et théorie des laryngales

La voyelle de base, la voyelle-pivot d’une racine indo-européenne est théoriquement un *e-.

Selon la théorie des laryngales, les voyelles *o- et *a-, que l’on retrouve parfois dans les racines indo-européennes, ne seraient que le résultat de la combinaison, de la mise en contact de ce *e- original avec une consonne ... laryngale

On dénombre TROIS laryngales qui auraient été présentes en proto-indo-européen.
On les écrit sous la forme *h-, mais avec un suffixe: 1, 2, 3.
  • *h₁- désigne un h sourd (articulé sans vibration des cordes vocales) et non aspiré,
  • *h2- désigne un "h" voisé cette fois, mais toujours non aspiré,
  • *h3- sera elle, de même, voisée et non aspirée.
(on cite encore parfois *h4-, semblable dans ses évolutions à *h2-, mais voisé ET aspiré)

Très schématiquement:
  • un *e- court proviendrait d’une forme plus ancienne *h₁e-
  • un *a- court proviendrait de *h₂e-, et
  • un *o- court proviendrait de *h₃e-
Quant à un *ē- (*e long), il proviendrait de *eh₁-
  • un *ā- proviendrait de *eh₂- et
  • un - proviendrait de *eh₃-
Si, au détour d'un manuel de linguistique ou d'un dictionnaire, vous tombez sur une laryngale notée *H- ou *hx-, il s'agit d'un joker: on ne connaît pas précisément la laryngale originale. Entendez ce *H- ou *hx- comme "une laryngale quelconque".

Notez enfin que la théorie des laryngales est remise en question par les travaux très récents de l'Université de Helsinki, dont les résultats sont visibles sur pielexicon.hum.helsinki.fi.

racines, suffixes, thèmes, désinences et mots


L’indo-européen tel qu’on le reconstruit est une langue flexionnelle : pour y établir des relations grammaticales entre les mots, on modifie ces mots.

En l’occurrence, par des terminaisons spécifiques : des désinences, qui permettront des flexions : des déclinaisons de substantifs ou de verbes.

Les racines proto-indo-européennes, sur lesquelles se créeront des mots, sont des unités lexicales (des morphèmes).

En proto-indo-européen, pour faire un mot, il fallait une racine suivie d’un… suffixe.

Cet ensemble racine + suffixe, c’est le thème.

Stem en anglais.
Et un thème plus une terminaison (une désinence) forment un mot.


racine + suffixe = thème

thème + terminaison (désinence) = mot

Infixe nasal

Un infixe nasal est une consonne (ou éventuellement une syllabe) nasale reconstruite, insérée (infixée) dans la racine ou le thème d'un mot.

dérivation et voyelle thématique alternante

Une voyelle thématique s'intercale entre le thème et la désinence.

Si la voyelle de base, la voyelle-pivot d’une racine indo-européenne est en théorie un *e-, elle peut très souvent alterner avec un*o-

C'est une survivance de cette alternance vocalique que l'on retrouve, par exemple, dans les conjugaisons du grec ancien,
avec -ο- à la 1ère personne du singulier et aux 1ère et 3ème du pluriel (toujours -ο- devant et -ν), et avec -ε- aux 2ème et 3ème personnes du singulier et à la 2ème du pluriel (toujours -ε- devant et -τ).
Une terminaison en e/o indique simplement la présence d'une voyelle thématique (qui donc s'intercale entre le thème et la désinence) alternante : qui peut être soit un e, soit un o.


Lois de mutation phonétique

Loi de Grimm

Les consonnes occlusives sourdes de l'indo-européen (*p, *t, *k) deviennent en proto-germanique des fricatives sourdes, respectivement , , *x.

Loi de Verner

Celle loi complète la loi de Grimm, et précise que les fricatives germaniques se voisent sauf à l'initiale et sauf si la syllabe précédente était tonique en indo-européen.

Loi de Holtzammn

Elle s'applique spécifiquement au proto-germanique

Notamment, selon cette loi assez complexe, dite de durcissement (Verschärfung), les semi-voyelles de l'indo-européen *-y- et *-w- se doubleront, seront géminées (on parle de gémination) en proto-germanique dans certaines positions, pour aboutir, respectivement, à des *-jj- et *-ww-.

Groupes linguistiques indo-européens

Chronologie
Proto-indo-européen
scission en groupes de langues
chaque groupe développe sa proto-langue (proto-celtique, proto-germanique...), reconstruite théoriquement
les langues historiques émanent de leur proto-langue théorique



tokharien

Le tokharien, qui se parlait dans le bassin du Tarim - l'actuelle région autonome chinoise du Xinjiang -, a disparu il y a environ un millénaire.



Il constitue, dans ses deux variantes A et B, la langue la plus orientale des langues indo-européennes.

Ce nom, finalement, ne correspond probablement pas au véritable nom de ces tribus qui occupaient le bassin du Tarim, ni à celui de leurs langues ; c'est le philologue et orientaliste allemand Friedrich W. K. Müller (1863  – 1930) qui les baptisa ainsi.


Friedrich W. K. Müller

Plutôt que de parler de langues tokhariennes A et B, il conviendrait plutôt de mentionner les langues Arśi et Kuči, ou encore l'agnéen (tokharien A) et le koutchéen (tokharien B).

Tokharien A - Arśi - agnéen 
Tokharien B - Kuči - koutchéen

langues italiques

les langues sabelliques ou osco-ombriennes 

  • l'èque,
  • l'osque,
  • l'ombrien,
  • le samnite,
  • le marse,
  • le marrucin,
  • le sabin,
  • le volsque,
  • le lucanien,
  • le pélignien...

 les langues latino-falisques

  • le falisque, parlé au nord de Rome,
  • le latin, à l'origine parlé dans une petite zone toute mimi du centre-ouest de ce que nous appelons maintenant l'Italie, avant de s'étendre à tout l'Empire romain…

le vénète

le sicule

(source)

langues celtiques

continentales 

  • gaulois, celtibère, lépontique, galate… 

insulaires 

  • gaéliques : irlandais, manxois, écossais
  • brittoniques : breton, cambrien, cornique, gallois


langues indo-iraniennes

Langues indo-iraniennes
langues indiennes
langues iraniennes
langues iraniennes occidentales
langues iraniennes du Sud-Ouest
langues iraniennes du Nord-Ouest 
langues iraniennes orientales 

Langues indiennes

Le sanskrit (संस्कृतम्, saṃskṛtam, parachevé”) s'est parlé, et écrit, autrefois dans le sous-continent indien. On retrouve des traces écrites du sanskrit védique (le sanskrit archaïque employé pour composer les quatre Védas, que l'on fait remonter à une période s'étalant de -1700 à -1200.

Rig-Véda, Yajur-Véda, Sama-Véda et Atharva-Véda.
Véda pouvant être traduit par connaissance, nous avons, respectivement, la Connaissance des Versets, la Connaissance du Sacrifice Rituel, la Connaissance des Mélodies et des Chants, et la Connaissance d'Atharvan, du nom d'un groupe de Rishis, que l'on peut qualifier de sages.)

De nos jours, même s'il compte toujours parmi les 22 langues officielles de l'Inde, il n'est plus pratiqué que par quelques érudits, mais continue à être la langue sacrée des textes de l'hindouisme et du bouddhisme.

Il est toujours aussi la langue des ouvrages littéraires et scientifiques, un peu à la manière du latin chez nous naguère (rappelons-nous qu'en 1687, c'est encore en latin que Newton publiera ses Philosophiae Naturalis Principia Mathematica), mais malgré tout cela, il n'est plus parlé que par un petit pourcent de la population indienne, même si, lors d'un recensement récent, 14000 personnes l'ont présenté comme leur langue principale (à ne pas confondre avec langue maternelle).

Langues iraniennes occidentales

Dans les langues du Sud-Ouest, nous trouvons notamment...
  • le vieux-perse,
dont sera issu le moyen-perse (ou pehlevi),
 
dont sera à son tour issu le persan, dans ses diverses déclinaisons : farsi, dari, tadjik, judéo-persan et hazara,

ou encore...
  • l'achomi, langue toujours parlée dans le sud de l'Iran.


Pour ce qui est des langues du Nord-Ouest, citons...

  • le mède, langue jadis parlée par les Mèdes, ancien peuple qui vivait originellement dans une région du nord-ouest de l'Iran,
  • le kurde (le kurmandji et le sorani),
  • le gurani, dialecte kurde,
et enfin
  • le gilaki et le mazandarani, langues caspiennes.


Passons à présent aux langues iraniennes orientales.

Dans ce vaste groupe de langues, nous trouverons notamment...
  • le scythe (ou plutôt les langues scythes), de l'époque de l'iranien moyen, qui se parlait jadis en Scythie, le territoire occupé par les Scythes (ça a du sens), du VIIIème siècle avant Jésus-Christ jusqu'au IIème siècle de notre ère.

Le scythe, dont sera notamment issu...
    • l'ossète, parlé par les Ossètes, en Ossétie, au nord du Caucase, ainsi qu'en Géorgie.

Nous avions également...
  • le sogdien, langue moyenne iranienne qui se parlait dans la somptueuse (et mystérieuse, nanana) Sogdiane, celle de Samarcande et Boukhara, et dont l'alphabet ne fut déchiffré qu'au tout début du XXème,
  • le bactrien, très proche du sogdien, également repris dans le moyen iranien, mais parlé, lui, en Bactriane, au sud de la Sogdiane, et qui a disparu quelque part entre le IIème et le IIIème siècle après Jésus-Christ,
et...
  • le chorasmien, toujours langue moyenne iranienne, qui s'est parlé jusqu'au XIVème dans l'ancienne Chorasmie, au sud de ce qui fut naguère la mer d'Aral.

Nous y trouvons encore...
  • les langues du Pamir, toujours parlées, tout à l'est, notamment dans le nord-est de l'Afghanistan et dans l'est du Tadjikistan, parmi lesquelles citons - soyons fous - le roshani, le shughni et le yazgoulami. L'une de ces langues du Pamir, le sariqoli, se parle même à la frontière entre l'Afghanistan et la Chine, ce qui en fait la langue iranienne la plus orientale de toutes,


  • le pachto, l'une des deux langues officielles de l'Afghanistan, avec le dari, variété du persan, et qui se parle également au Pakistan,

et enfin, la plus célèbre de ces langues,
  • l'avestique, la langue iranienne orientale la plus anciennement attestée, celle utilisée dans l'Avesta, le livre sacré des Zoroastriens.
Pour rappel, l'avestique apparaît sous deux variétés :

  • le vieil avestique, la langue archaïque des gāthās (chants), que l'on peut faire remonter au IIème millénaire avant J.-C. (millénaire, hein, pas siècle, comprenons-nous bien),
et

  • l'avestique récent, qui remonte à peine au VIIIème siècle avant J.-C.

Vocabulaire linguistique

cognat

Mot d’une langue ayant la même origine qu’un autre mot appartenant à une autre langue. Les cognats sont donc des mots de langues différentes apparentés entre eux, car remontant directement à un même étymon dans leur langue d'origine commune (l'indo-européen, l'italique, le germanique...).

épenthèse

L'épenthèse consiste à insérer dans la parole un son supplémentaire pour clarifier, faciliter, ou rendre plus naturelle l'élocution.

métathèse

La métathèse, en linguistique, est une permutation par laquelle les lettres d’un mot s'inversent. En français, nous connaissons l’aréoport et son contraire l’aréopage.

réfection

La réfection consiste à reformer un mot à partir d’un modèle préexistant. Il y a réfection quand on modifie la forme populaire d’un mot, celle due à son évolution on ne peut plus normale, en la transformant pour la rapprocher de sa forme d’origine, de son étymon.

s-mobile

Phénomène bien connu en linguistique indo-européenne, qui fait qu'un *s- initial présent dans la racine indo-européenne, quand suivi d'une consonne, n'est pas repris systématiquement dans l'ensemble des dérivés de la racine.

Pensons au latin tonāre, “tonnerre”, dérivé de la racine indo-européenne *(s)ten-.

substrat

Le substrat représente en quelque sorte les reliquats, les vestiges d'une langue autochtone anciennement parlée sur un territoire donné, désormais disparue, et qui a peu ou prou influencé celle qui l'a un jour supplantée après l'invasion, la conquête dudit territoire par des locuteurs allochtones..

Par métonymie, on parle aussi de substrat pour désigner non plus l'influence d'une langue disparue sur une autre, mais bien cette langue disparue elle-même

verbe résultatif

Qui implique un état présent résultant d'une action passée. Les verbes résultatifs ont souvent le même sens que les accomplis (passé composé) d'autres verbes : “je sais” implique “j'ai appris”.

Aucun commentaire: