La philosophie de A à Z

La sémantique est l’étude théorique ou descriptive du sens ou de la signification linguistique. On la contraste traditionnellement avec la syntaxe, qui s’intéresse à la grammaire des langues autrement dit aux règles de construction des phrases, et à la pragmatique, qui étudie la langue et la parole en action et en contexte. Initiée en linguistique à la fin du 19e siècle, la sémantique a été étendue des langues naturelles aux langages formels par les philosophes et logiciens de la première moitié du 20e siècle. L’étude de la signification s’est alors trouvée intimement liée aux notions de vérité et de conséquence logique. Les approches logico-formelles sont en retour venues alimenter la théorisation sémantique en linguistique à partir des années 1960, jusqu’aux applications récentes et actuelles en traitement automatique des langues. Mobilisée pour la résolution de problèmes classiques tels que ceux de l’identité ou des objets inexistants, la sémantique présente un intérêt majeur pour la philosophie depuis le « tournant linguistique » qui a inauguré la philosophie analytique au 20e siècle.


1. Analyses philosophiques de la signification

On trouve chez Frege et Russell les analyses qui ont posé les principaux jalons des conceptions contemporaines de la signification en philosophie du langage. Tandis que l’approche linguistique de Saussure envisage la langue comme un système de signes et les signifiés (la signification des signes) comme des concepts, eux-mêmes vus comme des entités mentales, Frege défend une conception antipsychologiste selon laquelle la signification peut et doit être appréhendée de manière non mentaliste. La signification est ainsi selon lui d’emblée conçue comme liée à la [[référence]], c’est-à-dire à la relation langage-monde, sans pour autant s’y réduire.

On peut distinguer deux grandes familles de théories philosophiques de la signification selon qu’elles envisagent une structuration à un ou deux niveaux. Les théories monistes, développées dans la lignée des conceptions du nom propre de Mill et de Russell, envisagent que la signification d’une expression est constituée par ce qu’elle désigne : la signification d’un nom propre est simplement sa référence (son porteur), celle d’une phrase est une proposition, c’est-à-dire un ensemble structuré composé des significations de ses constituants. Ainsi, suivant l’approche russellienne, la phrase « Trump est vulgaire » aura pour signification une proposition structurée composée de Donald Trump (l’individu réel) et de l’[[universel]] désigné par « vulgaire » (l’universel pouvant être, selon les approches, la classe de tous les individus vulgaires, la propriété ou le concept de vulgarité, etc.). Cette conception de la référence directe des noms propres et des expressions linguistiques en général occupe une position dominante en philosophie du langage depuis qu’elle a été reprise et développée par Kripke et Putnam dans les années 1970.

Les conceptions monistes ne sont cependant pas celles qui dominent le champ de la sémantique formelle. À la suite de Frege, les théories dualistes ajoutent au niveau référentiel ou dénotationnel (Bedeutung) le niveau du sens (Sinn), une strate intermédiaire entre langage et monde. La motivation chez Frege en est de pouvoir distinguer la valeur cognitive de deux énoncés d’identité (a = a) et (a = b), où a et b sont remplacés par des noms propres désignant le même individu : si on se contente du niveau dénotationnel, les deux phrases ont strictement le même contenu. Le sens d’une expression est le mode de donation de sa dénotation (appellation que l’on préfère à celle de « référence » pour Frege), autrement dit ce qui doit être saisi par un sujet pour connaître sa dénotation. La phrase « Trump est vulgaire » ne désigne donc plus une proposition, comme chez Russell, mais une valeur de vérité (le Vrai ou le Faux), tandis que le sens offre un mode d’accès à cette valeur. Modifiés à la suite de Carnap et rebaptisés respectivement extension et intension, les deux niveaux frégéens sont repris et présents dans la plupart des théories sémantiques formelles contemporaines.

Comment caractériser le sens d’une phrase ? Ce mode de donation de la valeur de vérité, c’est ce que l’on appelle les conditions de vérité de la phrase : ce qui doit être le cas pour que la phrase soit vraie. Pour « Trump est vulgaire », le sens est donc (le fait) que Trump soit vulgaire : c’est à la condition que Trump soit effectivement vulgaire que la phrase sera vraie. L’exemple perd son apparence triviale si on remplace la phrase par sa traduction anglaise, « Trump is vulgar », qui possède les mêmes conditions de vérité.

Autre idée frégéenne promise à une grande postérité, le principe de compositionnalité. Ce principe énonce que la valeur d’une expression complexe est fonction des valeurs de ses constituants et de leur agencement syntaxique. Il vaut des sens comme des dénotations. Ainsi la valeur de vérité de « Trump est vulgaire » est fonction de la dénotation de « Trump » (l’individu Donald Trump) et de celle du prédicat « est vulgaire ». L’idée de Frege est qu’un prédicat comme « x est vulgaire » dénote une fonction (Vulgaire(x)), qui prend pour argument la dénotation du sujet qu’il prédique (ici Donald Trump) et qui produit une valeur de vérité (le Vrai si le prédicat s’applique au sujet, le Faux sinon).


2. Sémantique des langages formels

Les philosophes originairement intéressés par la signification linguistique sont les principaux contributeurs à la formalisation de la logique au tournant du 20e siècle. Les notions de syntaxe et de sémantique ont une caractérisation précise en logique contemporaine notamment du fait du caractère symbolique des langages considérés. Ces langages étant artificiellement construits, ils le sont en tant que langages-objets à l’aide d’un métalangage – suivant une distinction due à Tarski qui permet d’échapper à divers [[paradoxes]] comme le Menteur : une phrase ne peut pas dire d’elle-même qu’elle est vraie ou fausse, mais on peut dans le métalangage énoncer «  est vraie » au sujet d’une phrase du langage-objet.

La syntaxe délimite le langage, c’est-à-dire l’ensemble de ses formules (suites finies admissibles de symboles), à l’aide de règles de formation et d’un ensemble de symboles de base (le vocabulaire). La syntaxe d’un langage logique du premier ordre permet ainsi de déterminer que V(b), E(y, a) ou x R(x, b)  V(a) sont des formules (pourvu que V, E, R, a et b appartiennent au vocabulaire), tandis que VE(a)) ou x R( n’en sont pas. On trouve d’autres langages formels en mathématiques, par exemple en arithmétique, avec la même idée de correction syntaxique : 2 + 3 = 4 est une formule (quoique fausse), tandis que ((2 +( est mal formée.

La sémantique intervient ensuite en offrant une interprétation du langage qui permet d’introduire les notions de satisfiabilité, de vérité et de validité, et finalement de déterminer une théorie logique au sein du langage. On doit à Tarski d’avoir formulé dans les années 1930 la théorie des modèles, qui constitue une forme aboutie et standard de la sémantique pour les langages formels basée sur la théorie des ensembles.

Une structure de Tarski pour un langage du premier ordre L est un couple M = D, I formé d’un domaine non vide d’objets individuels D et d’une fonction d’interprétation I. La fonction I projette le vocabulaire sur le domaine : les constantes individuelles (comme a ou b, qui font office de noms propres) ont pour valeur des objets du domaine ; les prédicats unaires (comme V(x) pour « x est vulgaire »), leurs extensions, i.e. les classes d’objets du domaine auxquels ils s’appliquent ; les prédicats binaires (comme R(xy) pour « x est plus riche que y »), leurs extensions, i.e. les classes des paires ordonnées d’objets du domaine auxquelles ils s’appliquent, etc. Le domaine D est donc un ensemble structuré par les classes que sont les extensions des prédicats. À la structure vient s’ajouter l’assignation : une fonction g qui envoie les variables individuelles (x, y…) sur les objets du domaine, mimant pour les variables le rôle joué par la fonction I pour les constantes individuelles.

On peut dès lors définir les notions sémantiques évoquées plus haut. Conformément au principe de compositionnalité, la valeur sémantique d’une expression E relativement à M et g, notée ||E||M, g, est fonction des valeurs des constituants de E et de leur agencement syntaxique. Pour prendre un exemple et sans entrer dans le détail de la définition, on dit que la formule V(b) est satisfaite par g dans M, ||V(b)||M, g = 1 (la valeur sémantique de V(b) relativement à M et g est identique à 1) si et seulement si ||b||M, g ||V||M, g, autrement dit si et seulement si la valeur de b (I(b) : l’objet dénoté par b) est dans l’extension de V ; et ||V(b)||M, g = 0 sinon.

Une formule est vraie dans la structure M, ||||M = 1, si et seulement si elle est satisfaite par toutes les assignations dans la structure ; une formule est valide si et seulement si elle est vraie dans toutes les structures, autrement dit pour toutes les interprétations de son vocabulaire. Des formules comme (x = x) (« x est identique à x ») ou V(b)  x V(x) (« si V s’applique à b, alors il existe au moins un objet x tel que V s’applique à x ») sont ainsi des formules valides en logique du premier ordre. On appelle théorie logique (ou logique) le sous-ensemble du langage composé des formules valides.

Une autre notion au cœur de la sémantique des langages formel est la notion de conséquence logique. Si et ’ sont deux formules, |= ’ («  implique logiquement ’ », ou « ’ est conséquence logique de  ») si et seulement si ’ est vraie dans toutes les structures où est vraie. Autrement dit, la relation tient si et seulement s’il n’y a pas de structure qui rendrait vraie sans que ’ soit vraie. En logique du premier ordre on a par exemple : V(b) |= x V(x) (« V s’applique à b implique logiquement qu’il existe au moins un objet x tel que V s’applique à x »).

Les exemples présentés ici relèvent de la logique du premier ordre qui est paradigmatique de la logique dite extensionnelle, qui manipule les extensions des expressions. Les valeurs sémantiques données par l’interprétation d’un langage du premier ordre dans une structure de Tarski correspondent catégorie par catégorie aux extensions des théories néofrégéennes de la signification : des objets individuels pour les noms propres, des classes pour les prédicats unaires, des valeurs de vérité pour les phrases. La sémantique tarskienne ouvre cependant la voie à une analyse des intensions. Si les conditions de vérité de sont comprises comme ce qui doit être le cas pour que soit vraie, on les modélisera ici comme l’ensemble des structures M où est vraie : |||| = {M | ||||M = 1}.

La variabilité des structures d’interprétation est traitée par la sémantique de la logique modale. Suite aux travaux de Carnap, Kanger, Hintikka et Kripke, la sémantique des mondes possibles s’est imposée comme cadre général d’analyse des modalités aléthiques (le possible et le nécessaire) mais aussi d’autres modalités (l’obligation et la permission, le savoir, les croyances…). Pour les langages de logique modale du premier ordre, la sémantique en question assimile les structures de Tarski à des mondes possibles liés par une relation d’accessibilité. Cette sémantique intensionnelle offre des ressources importantes pour l’analyse de la signification linguistique.


3. Sémantique formelle pour les langues naturelles

L’étude des langages formels fournit l’analyse de différents phénomènes qui intéressent les langues naturelles : la quantification (« Tous les hommes… », « Un homme… »), la notion de portée (« chaque homme aime sa mère » est interprété différemment selon que le pronom « sa » est ou non dans la portée, donc dépend, du quantificateur initial « chaque »), les modalités, pour en citer quelques-uns. Elle offre surtout un cadre théorique mathématisé qui sera repris, après Montague et Lewis, par la sémantique linguistique. Le geste n’est toutefois pas anodin : les concepts formels ont-ils un sens pour les langues naturelles ?

Pour les conceptions dites « universalistes », selon lesquelles le langage constitue un medium universel, nous ne pouvons pas nous extraire du langage et observer en surplomb sa relation au monde. La sémantique, et notamment la vérité, seraient ineffables (Hintikka 1994). La distinction opérée par Tarski pour les langues formelles, entre langage-objet et métalangage, ne saurait ainsi être transposée aux langues naturelles.

Mais la tradition modèle-théorétique venue de la logique s’oppose de facto à la vision universaliste. À défaut de s’extraire du langage, on peut le formaliser (au moins un fragment) et modéliser le monde – ses objets, leurs propriétés et relations – par des structures ensemblistes (cf. schéma). La théorie des modèles peut alors venir en appui d’une sémantique pour les langues naturelles.

Langage Formalisation Langage formel
I
Monde Modélisation Domaine D

(avec ses classes)

La double contrainte universaliste de l’unicité du langage et de celle du monde est levée dans le modèle : la théorie n’impose pas de restriction sur le langage et elle nous invite à faire varier les structures d’interprétation qui modélisent le monde. La notion de conséquence logique, dont la définition s’appuie sur la variabilité des structures, permet de rendre compte non seulement de relations purement logiques, comme entre « Trump est un président vulgaire » et « Trump est vulgaire », mais aussi de relations de signification comme entre « Inès est ophtalmologiste » et « Inès est médecin ».

Montague (1974) a développé une sémantique formelle pour les langues naturelles, basée sur la théorie des modèles pour la logique modale, c’est-à-dire sur la sémantique des mondes possibles. Sa théorie propose une analyse fonctionnelle des intensions : l’intension ||E|| d’une expression E est une fonction qui associe à chaque monde possible l’extension de E dans ce monde. Cela vaut des prédicats : « ophtalmologiste » et « oculiste » ont la même intension puisque leur extension coïncide dans tous les mondes possibles – il est impossible d’avoir un individu qui serait ophtalmologiste sans être oculiste ou l’inverse. Cela vaut également des phrases : l’intension |||| d’une phrase est une fonction qui, à chaque monde possible, fournit la valeur de vérité de dans ce monde. L’intension de « Trump est président » est ainsi la fonction qui attribue le vrai au monde actuel comme aux autres mondes possibles où Trump a gagné les élections, et le faux à tous les autres. Cette fonction n’est autre que la fonction indicatrice de l’ensemble des mondes possibles où la phrase est vraie, les deux caractérisations de l’intension, en termes de fonction ou en termes d’ensemble de mondes possibles, étant ainsi équivalentes.

Le contenu sémantique des langues naturelles est donc formellement modélisable en termes de mondes possibles. Deux expressions sont synonymes si et seulement si elles partagent la même intension, c’est-à-dire si elles partagent la même extension dans tous les mondes possibles. Deux phrases sont synonymes si et seulement si elles partagent la même valeur de vérité dans tous les mondes possibles, autrement dit, si et seulement si elles sont logiquement équivalentes (chacune est conséquence logique de l’autre).

La sémantique montagovienne a toutefois rencontré des limites, qui ont conduit à de nouveaux développements depuis le début années 1980. Une première limitation provient du manque d’expressivité des quantificateurs logiques habituels, qui empêche de formaliser des expressions comme « beaucoup d’enfants » ou « la plupart des champignons ». Les linguistes ont introduits les quantificateurs généralisés qui visent à formaliser ce type d’expressions (Barwise & Cooper 1981).

Une autre limitation est liée à la dynamique du discours. La sémantique est construite depuis Frege au niveau de la phrase à l’aide du principe de compositionnalité. Mais certains phénomènes apparaissent à un niveau plus large, quand on envisage les successions de phrases. Ainsi les deux discours suivants :

(1) Paul a trois billes. Une est hors du sac. Elle est sous la table.

(2) Paul a trois billes. Deux sont dans le sac. *Elle est sous la table.

Il apparaît nettement que dans le second discours, le pronom (dit anaphorique) « elle » ne fonctionne pas alors qu’il a une dénotation parfaitement claire dans le premier. La situation ne diffère pas ici au niveau du sens : à la suite des deux premières phrases de (1) comme de (2), on obtient exactement la même intension, à savoir l’ensemble des mondes possibles où il y a trois billes, deux dans un sac, une hors de ce sac. Ce qui différencie les deux discours va donc au-delà de la granularité des intensions et relève du flux informationnel : dans le premier discours, la bille hors du sac a été rendue contextuellement saillante et devient dès lors disponible pour une dénotation ultérieure par un pronom, tandis que dans le second, ce sont les deux billes dans le sac qui sont rendues saillantes.

Ces aspects, qui rapprochent la sémantique de la pragmatique par la prise en compte du contexte, ont conduit à l’émergence de sémantiques dites dynamiques, sémantique des fichiers par Irene Heim (1983), théorie des représentations de discours par Hans Kamp (1981), logique des prédicats dynamique par Jeroen Groenendijk & Martin Stokhof (1991).


Bibliographie

Barwise, Jon & Robin Cooper, Generalized quantifiers and natural language, Linguistics and Philosophy 4 (2), 159-219, 1981.
Cet article inaugure la théorie des quantificateurs généralisés en sémantique des langues naturelles

Corblin, Francis, Cours de sémantique. Introduction, Paris, Armand Colin, 2013.
Il s’agit d’une introduction aux différents aspects de la sémantique formelle pour les langues naturelles.

Frege, Gottlob, Uber Sinn und Bedeutung, Zeitschrift fur Philosophie und philosophische Kritik, 100, 1892, 25-50. Trad. fr. Cl. Imbert, Sens et dénotation, in Ecrits logiques et philosophiques, Paris, Seuil, 1971, pp. 102-126.
Article où Frege présente la distinction fondamentale à l’origine des théories dualistes de la signification.

Galmiche, Michel, Sémantique linguistique et logique. Un exemple : la théorie de R. Montague, Paris, PUF, Coll. Linguistique nouvelle, 1991.
Une présentation pédagogique de la sémantique de Montague.

Gochet, Paul & Pascal Gribomont, Logique. Vol.1. Méthodes pour l’informatique fondamentale, Paris, Hermès, 1998.
Ouvrage présentant de façon assez détaillée les bases de la logique extensionnelle.

Groenendijk, Jeroen & Martin Stokhof, Dynamic Predicate Logic, Linguistics and Philosophy 14, 39-100, 1991.
Article fondateur de la logique dynamique des prédicats.

Hintikka, Jaakko, 1985, Is Truth Ineffable ?, in [Coll.] 1989 : Les Formes actuelles du vrai (Entretiens de Palerme 1985), Palerme, Enchiidion : 89-120. Trad.fr. F.Schmitz : La Vérité est-elle ineffable ?, in J. Hintikka, La Vérité est-elle ineffable ? Et autres essais, Combas, L’Eclat, 1994, pp. 9-47.
Article qui présente la distinction entre approches universaliste et modèle-théorétique de la logique et du langage.

Heim, Irene, File change semantics and the familiarity theory of definiteness, in R. Bauerle et al. (ed.) Meaning, Use and Interpretation of Language, Berlin, Walter de Gruyter, 1983. Article fondateur de la sémantique des fichiers, un exemple de sémantique dynamique.

Kamp, Hans, A theory of truth and semantic representation, in J.A.G. Groenendijk, T.M.V. Janssen & M.B.J. Stokhof (eds), Formal methods in the Study of Language, Mathematical Centre Tracts 135, Amsterdam, Mathematisch Centrum, pp. 277–322, 1981.
Article fondateur de la théorie des représentations de discours.

Kripke, Saül, Semantical considerations on modal logic, Acta Philosophica Fennica 16: 83-94, 1963.
Article qui a fixé la sémantique des mondes possibles.

Marconi, Diego, La philosophie du langage au XXème siècle, COmbas, L’Eclat, 1997. URL : http://www.lyber-eclat.net/lyber/marconi/langage.html
Livre introductif à la philosophie du langage, avec un aperçu utile sur la sémantique.

Montague, Richard, 1974, Formal Philosophy. Selected Papers of Richard Montague. New Haven/London: Yale University Press. Edited and with an introduction by Richmond H. Thomason.
Recueil posthume des travaux de Montague qui ont impulsé la sémantique formelle des langues naturelles.

Russell, B. (1905). “On Denoting”. Mind 14, pp. 479-493.
Article de référence de Russell apportant notamment l’analyse standard des descriptions définies.

Saussure, Ferdinand (de), Cours de linguistique générale, Paris, Payot, Coll. Petite bibliothèque Payot, 2016 [1916].
Ouvrage historique majeur de la sémantique linguistique du 20e siècle.

Tamba, Irène, La sémantique. Paris, PUF, 2005 (1e ed. 1988).
Introduction historique à la sémantique linguistique.

Tarski, Alfred, Der Wahrheitsbegriff in den formalisierten Sprachen, Studia Philosophica 1: 261–405, 1935. Trad. fr. G. Kalinowski, Le concept de vérité dans les langages formalisés, in Tarski, A., Logique, sémantique, métamathématique, t.1, Paris, Armand Colin, 1972, pp.157-269.
Article de référence de Tarski comportant sa définition de la vérité en logique.

Manuel Rebuschi
manuel.rebuschi@univ-lorraine.fr
Université de Lorraine