Les algorithmes de recommandation

On 25.04.2012, in Dossiers, by Mathieu
VN:F [1.9.17_1161]
Rating: 5.0/5 (2 votes cast)

Il existe des centaines d’algorithmes qui ont été utilisés pour l’implémentation de systèmes de recommandation. La plupart relève de concepts mathématiques avancés. Dans ce dossier, on va tenter d’analyser différentes approches et stratégies utilisées lors de la mise en place d’un système de recommandation.

Wikipedia définit un système de recommandation comme une forme spécifique de filtrage de l’information visant à présenter les éléments d’information (films, musique, livres, news, images, pages Web, etc) qui sont susceptibles d’intéresser l’utilisateur.

Dit autrement, un système de recommandation cherche à prédire la valorisation ou préférence qu’un utilisateur attribuerait à un objet (livre, musique, film…) ou à un élément social (personne, groupe, communauté) qu’il n’avait pas encore considéré.

Un système de recommandation requiert généralement 3 étapes:

  1. La première consiste à recueillir de l’information sur l’utilisateur.
  2. La deuxième consiste à bâtir une matrice ou un modèle utilisateur contenant l’information recueillie.
  3. La troisième consiste à extraire à partir de cette matrice une liste de recommandations.

Collecte d’Information

Pour être pertinent, un système de recommandation doit pouvoir faire des prédictions sur les intérêts des utilisateurs. Il faut donc pouvoir collecter un certain nombre de données sur ceux-ci afin d’être capable de construire un profil pour chaque utilisateur.

Une distinction peut être faite entre 2 formes de collecte de données:

  • Collecte de données explicite – Filtrage actif: repose sur le fait que l’utilisateur indique explicitement au système ses intérêts.
    • Exemple: demander à un utilisateur de commenter, taguer/étiqueter, noter, liker ou encore ajouter comme favoris des contenus (objets, articles…) qui l’intéressent. On utilise souvent une échelle de ratings allant de 1 étoile (je n’aime pas du tout) à 5 étoiles (j’aime beaucoup) qui sont ensuite transformées en valeurs numériques afin de pouvoir être utilisées par les algorithmes de recommandation.
    • Avantage: capacité à reconstruire l’historique d’un individu et capacité à éviter d’agréger une information qui ne correspond pas à cet unique utilisateur (plusieurs personnes sur un même poste).
    • Inconvénient: les informations recueillies peuvent contenir un biais dit de déclaration.
  • Collecte de données implicite – Filtrage passif: repose sur une observation et une analyse des comportements de l’utilisateur effectuées de façon implicite dans l’application qui embarque le système de recommandation, le tout se fait en “arrière-plan” (en gros sans rien demander à l’utilisateur).
    • Exemples:
      • Obtenir la liste des éléments que l’utilisateur a écoutés, regardés ou achetés en ligne.
      • Analyser la fréquence de consultation d’un contenu par un utilisateur, le temps passé sur une page.
      • Monitorer le comportement en ligne de l’utilisateur.
      • Analyser son réseau social.
    • Avantage: Aucune information n’est demandée aux utilisateurs, toutes les informations sont collectées automatiquement. Les données récupérées sont a priori justes et ne contiennent pas de biais de déclaration.
    • Inconvénient: Les données récupérées sont plus difficilement attribuables à un utilisateur et peuvent donc contenir des biais d’attribution (utilisation commune d’un même compte par plusieurs utilisateurs). Un utilisateur peut ne pas aimer certains livres qu’il a acheté, ou il peut l’avoir acheté pour quelqu’un d’autre.

Modèle Utilisateur

Le modèle utilisateur se présente généralement sous forme de matrice. On peut se le représenter comme un tableau qui contient des données recueillies sur l’utilisateur associées aux produits disponibles sur le site web.

Un autre point important est comment le temps influence le profil de l’utilisateur. Les intérêts des utilisateurs, généralement, évoluent au cours du temps. Les données du modèle utilisateurs devraient donc constamment être réajustées pour rester conformes aux nouveaux centre d’intérêts de l’utilisateur.

Liste de recommandations

Pour extraire une liste de suggestions à partir d’un modèle utilisateur, les algorithmes utilisent la notion de mesure de similarité entre objets ou personnes décrits par le modèle utilisateur. La similarité a pour but de donner une valeur ou un nombre (au sens mathématique du terme) à la ressemblance entre 2 choses. Plus la ressemblance est forte, plus la valeur de la similarité sera grande. A l’inverse, plus  la ressemblance est faible, et plus la valeur de la similarité sera petite. On verra plus tard dans le dossier quelques exemples.

Types de système de recommandation

On a l’habitude de présenter 4 approches possibles pour un système de recommandation:

  • Recommandation Personnalisée
  • Recommandation Objet (Content-Based filtering CB)
  • Recommandation Sociale (Collaborative Filtering CF – Context Aware)
  • Recommandation Hybride

Recommandation Personnalisée

Il s’agit de recommander des objets sur la base du comportement passé de l’utilisateur.

Exemples:

  • Des produits achetés ou sélectionnés sur un site de e-commerce, ainsi qu’un certain nombre d’actions ou décisions effectuées par l’utilisateur qui permettent de prédire de nouveaux produits susceptibles de l’intéresser.
  • Les annonces publicitaires (par ex. Adsense de Google) sont considérées comme des systèmes de recommandation personnalisée qui se basent sur le comportement passé de l’utilisateur (navigation, clics, historique de recherche…)

Recommandation Objet

Il s’agit de recommander des objets (ou contenus) en se basant sur les qualités et propriétés intrinsèques de l’objet lui-même et en les corrélant avec les préférences et intérêts de l’utilisateur. Ce type de système va donc extraire un certain nombre de caractéristiques et attributs propres à un contenu, afin de pouvoir recommander à l’utilisateur des contenus additionnels possédant des propriétés similaires. Cette méthode crée un profil pour chaque objet ou contenu, c’est-à-dire un ensemble d’attributs/propriétés qui caractérisent l’objet.

Exemples:

  • La décision de sélection et recommandation ou non d’un document à un utilisateur peut se baser sur le contenu (les mots présents) dans celui-ci, c’est-à-dire sur une comparaison des thèmes abordés dans le document par rapport aux thèmes qui intéressent l’utilisateur.
  • Pour décider la suggestion d’un article (news) ou non, un système de recommandation peut se baser sur les mot-clés principaux de l’article et les comparer avec les mot-clés apparaissant dans d’autres articles que l’utilisateur a évalués positivement dans le passé.
  • Dans le cas d’un site de vente de livre en ligne, on va se baser sur les caractéristiques du livre pour effectuer des recommandations, comme par exemple le sujet que traite l’ouvrage, son genre, son auteur, l’éditeur, etc. On pourrait ainsi recommander le livre Harry Potter à un utilisateur, si on sait d’une part que ce livre est un roman fantastique et d’autre part que l’utilisateur aime les romans fantastiques. Un système de recommandation pourra donc accomplir cette tâche seulement s’il a à disposition 2 types d’information:  1) la description des caractéristiques du livre et 2) un profil utilisateur qui décrit les intérêts (passés) de celui-ci en termes de préférence de type de livre. La tâche de recommandation consiste donc à déterminer les livres qui correspondent le mieux aux préférences de l’utilisateur.
Profil des livres
Profil/Préférences Utilisateur

Les algorithmes de recommandation objet permettent de développer des modèles afin de trouver des patterns ou motifs semblables entre différentes données. Ils évaluent à quel point un contenu pas encore vu par l’utilisateur est similaire aux contenus que celui-ci a évalués positivement dans le passé. Pour ce faire, on utilise la notion de similarité qui peut être mesurée de plusieurs manières:

  • Le système peut tout simplement vérifier si le livre se trouve dans la liste des genres préférés de l’utilisateur. Dans ce cas la similarité sera de 0 ou 1 (binaire/boolean).
  • Une autre façon serait de ne pas se baser sur le genre du livre, mais sur les mot-clés qui caractérisent l’ouvrage, et calculer la similarité de chevauchement entre les mots-clés du livre qui va éventuellement être suggéré avec les mots-clés préférés de l’utilisateur. Un des indicateurs de mesure de similarité qu’on utilise dans le cas d’un objet avec des propriétés multi-valeurs (cas des mot-clés) est le coefficient de Dice. Si chaque livre est décrit par un ensemble de mot-clés, le coefficient de Dice permet de mesurer le degré de similarité entre 2 livres à partir de leurs mot-clés.

 

Chevauchement des mots-clé

Dans le cas de documents de texte, on peut également imaginer que le contenu de chaque document soit décrit à partir d’une liste de tous les mots apparaissant dans le document, et décrire chaque document par un vecteur de valeurs binaires/booléennes, où un 1 indiquerait que le mot apparaît dans le document et un 0 indiquerait que le mot n’apparaît pas dans le document. Si le profil utilisateur est décrit par une liste similaire (un 1 indique un intérêt pour un mot-clé), on peut facilement associer et proposer des documents en mesurant le chevauchement entre les mot-clés qui intéressent l’utilisateur et les mots contenus dans le document. Le problème qui surgit avec une telle approche est qu’on assume que chaque mot a la même importance au sein d’un document. Or un mot qui apparaît très souvent ne caractérise pas forcément mieux un document. En plus, un plus large chevauchement entre les préférences de l’utilisateur et un document apparaîtera naturellement plus le document est long. En conséquence, le système de recommandation tendera à proposer des longs documents. Pour résoudre ces problèmes, on applique des techniques qui permettent de réduire le poids des mots qui apparaissent très souvent et d’augmenter le poids de ceux qui apparaissent plus rarement. Pour rendre encore plus compacte la liste des mots présents dans un document, on peut aussi quitter un certain nombre de mots qui sont sans intérêt, comme les prépositions, les articles… En normalisant aussi différentes variantes d’un même mot, par exemple les verbes conjugués sont remplacés par leur infinitif (volait par voler). On peut aussi décider de limiter la liste aux n mots les plus pertinents apparaissant dans les documents. Différents travaux ont montrés que le nombre optimum de mots à prendre en compte se trouve aux alentours de 100. Si trop peu de mots sont sélectionnées (moins de 50), on voit que d’importantes caractéristiques d’un document ne sont pas couvertes. Et si trop de mots sont inclus, certains ont peu d’importance et apportent plus de bruit qu’autre chose, ce qui réduit la qualité de la recommandation. On utilise aussi des base de connaissances lexicales externes pour éliminer des mots non pertinents.

De façon générale, les algorithmes de recommandation objet assignent un poids plus ou moins élevé aux attributs d’un contenu selon l’importance de ceux-ci. Le poids exprime donc l’importance de chaque attribut pour un utilisateur.

Un autre algorithme de recommandation objet couramment utilisé est la méthode de retour de pertinence de Rocchio (Rocchio’s relevance feedback) ou  classification de Rocchio. L’idée de cette méthode est de prendre en compte le point de vue des utilisateurs sur les recommandations proposées. Le principe, simple, repose sur le fait que l’utilisateur est le seul à savoir exactement ce qu’il recherche et apprécie, il est donc le plus à même de juger de la pertinence des suggestions retournées par un système de recommandation. Partant de cette idée, les systèmes exploitant le retour de pertinence permettent de récupérer ces « jugements » utilisateurs et les exploitent pour améliorer et affiner les recommandations. Techniquement, l’idée est dans un premier temps de décomposer les contenus évalués par l’utilisateur en 2 groupes (vecteurs, clusters) D+ (contenus évalués positivement et pertinents) et D- (contenus évalués négativement et non pertinents). Par un procédé mathématique on calcule une moyenne (prototype) qui permet de déterminer le centre (centroid) de chacun des 2 groupes (vecteurs) D+ et D-. Lorsqu’un nouvelle requête est effectuée par l’utilisateur, les résultats à recommander sont pondérés en fonction des 2 groupes D+ et D-. C’est-à-dire, on ajoute au résutats de la requête la liste D+ et on soustrait (retire) la liste D-, le tout de façon pondérée. L’effet obtenu est que les résultats retournés se rapprochent à chaque itération un peu plus du centre (centroid) de la liste D+ des contenus évalués positivement par l’utilisateur. Avec cette technique, on voit qu’il est possible d’affiner la requête initiale des utilisateurs au fur et à mesure que ceux-ci fournissent des jugements de pertinence sur des documents consultés. Le système de recommandation est donc doté d’une boucle de retour qui permet au même système de reformuler des recommandations plus pertinente en favorisant ou écartant certains contenus.

Avantages et inconvénients

Avantage: ce type de recommandation objet n’a pas besoin d’une large communauté d’utilisateurs pour pouvoir effectuer des recommandations. Une liste de recommandations peut être générée même s’il n’y a qu’un seul utilisateur.

Inconvénients: certains attributs peuvent être extraits automatiquement d’un contenu, comme par exemple pour un document de texte, on peut relativement facilement déduire certaines propriétés sémantiques automatiquement. On voit aussi qu’en pratique, des caractéristiques et propriétés comme le genre d’un livre ou la liste des acteurs dans un film, sont généralement fournis pas les créateurs du livre ou du film et sont généralement offerts sous forme électronique. Ce qui reste plus problématique, c’est l’acquisition de caractéristiques subjectives et qualitatives… Des propriétés, comme par exemple le style, le design… peuvent difficilement être acquises automatiquement, et devront plutôt être introduites manuellement avec tout ce que ça implique, comme le coût, les éventuelles erreurs…

Recommandation Sociale

Recommander des choses sur la base du comportement passé des utilisateurs similaires, en effectuant une corrélation entre des utilisateurs ayant des préférences et intérêts similaires. On utilise des méthodes qui collectent et analysent des données sur le comportement, les activités, les préférences des utilisateurs et des algorithmes tentent de prédire ce que l’utilisateur aimera en cherchant des utilisateurs qui ont les mêmes comportements que l’utilisateur à qui l’on souhaite faire des recommandations. L’idée sous-jacente est de dire que si un personne A a la même opinion (ou les même goûts) qu’une personne B sur un objet x, alors la personne A a plus de chance d’avoir la même opinion que B sur un autre objet y, plutôt que d’avoir la même opinion que quelqu’un choisi au hasard pour l’objet y. L’idée de base est donc de dire que si des utilisateurs ont partagés des mêmes intérêts dans le passé, il y a de fortes chances qu’ils partagent aussi les mêmes goûts dans le futur.

Les techniques de recommandation sociale (filtrage collaboratif) sont classées en 2 sous-types:

  • memory-based
  • model-based

User-based nearest neighbor (user-centric / memory-based)

Les algorithmes de recommandation sociale utilisent généralement différentes variantes d’un mécanisme basé sur le voisinage proche (user-based nearest neighborhood approach). Dans cette approche, un nombre d’utilisateurs (peer users / nearest neighbors / plus proches voisins) est identifié et sélectionné sur la base de la similarité de leurs intérêts et préférences avec l’utilisateur actif. On utilise alors principalement les ratings (par ex: films) de ces utilisateurs “voisins” pour calculer des similarités avec l’utilisateur actif. Pour chaque produit p que l’utilisateur n’a pas encore vu, une prédicition est faite en se basant sur les ratings de p assignés par le panel d’utilisateurs voisins. Cette méthode suppose 2 conditions initiales (inconvénients):

  1. On assume que si des utilisateurs ont eu des goûts similaires dans le passé, ils auront aussi des goûts similaires dans le futur.
  2. Les préférences des utilisateurs restent stables et cohérentes dans le temps.

Pour bien comprendre, on peut imaginer un tableau ou matrice de ratings de films, avec sur un axe les utilisateurs et sur un autre les films. Chaque cellule de la matrice contient le rating donné par un utilisateur pour un film. Un signe “+” indique que l’utilisateur a aimé le film, un signe “-” qu’il ne l’a pas aimé, pas de signe signifie qu’il n’a pas d’avis particulier sur ce film. Pour pouvoir prédire si Ken apprécierait le film “Fargo” et éventuellement lui recommander ce film, on compare les ratings de Ken à ceux des autres utilisateurs sélectionnés. On peut alors voir que Ken et Mike ont des ratings identiques, et que Mike a aimé le film Fargo, on pourrait alors prédire que Ken aimera aussi ce film et lui faire cette suggestion (user-centric).

Au lieu de se baser uniquement sur l’utilisateur le plus semblable, la prédiction est normalement calculée à partir de la moyenne pondérée des ratings de plusieurs utilisateurs. Le poids donné au rating de chaque utilisateur est déterminé par le degré de corrélation entre cet utilisateur et l’utlisateur pour qui on désire faire la recommandation. Pour mesurer le degré de corrélation entre 2 utilisateurs, on fait appel généralement au coefficient de corrélation de Pearson r. D’autres indicateurs de mesure de la similarité ou proximité entre utilisateurs sont aussi utilisés comme la corrélation de Ringo, ou le coefficient de corrélation de Spearman. Le coefficient de corrélation de Pearson se calcule à partir des valeurs présentes dans la matrice et peut prendre une valeur allant de +1 (forte corrélation positive) à -1 (forte corrélation négative). Par exemple, un coefficient de corrélation 0.70 entre 2 utilisateurs indiquerait une bonne similarité de leurs intérêts. On introduit aussi souvent dans le calcul de la mesure de Pearson un facteur de pondération afin de prendre en compte et pondérer le fait que certains utilisateurs ont toujours tendance à donner seulement de bons ratings, ou que d’autres ne vont jamais donné le rating maximum à un produit.

Les systèmes de recommandation doivent généralement aussi gérer un grand nombre d’utilisateurs. Faire des recommandations à partir des ratings de millions d’utilisateurs peut avoir de sérieuses implications en termes de performance. Ainsi, quand le nombre d’utilisateurs atteint un certain seuil, une sélection des “meilleurs” voisins doit être faite. Pour déterminer quels sont les voisins les plus pertinents à sélectionner, on utilise généralement l’algorithme du k-nearest neighbor (k-NN) qui permet de sélectionner seulement les k meilleurs voisins ayant la plus haute valeur de corrélation. Une autre approche (correlation-thresholding) serait de sélectionner seulement les voisins possédant une corrélation plus grande qu’un certain seuil. Le problème dans ces deux approches réside dans le fait de sélectionner le bon nombre k d’utilisateurs voisins à prendre en compte ou de déterminer la bonne valeur du seuil de corrélation. Si le nombre k est trop petit ou si le seuil de similarité est trop élevé, le nombre d’utilisateurs voisins pris en compte sera trop réduit pour effectuer une bonne prédiction (problème du reduced coverage/couverture réduite). Dans le cas contraire, lorsque que k est trop élevé ou que le seuil est trop faible, l’ensemble du panel de voisins est trop large (trop d’utilisateurs avec un degré de similarité limité), ce qui amène du bruit additionnel dans les prédictions. Plusieurs travaux et situations réelles ont montré qu’un panel composé de 20 à 50 voisins donne de bons résultats.

On n’est pas non plus limités aux ratings ou like/dislike, on peut aussi se baser sur des données plus implicites en observant le comportement de l’utilisateur sur le site, par opposition à la récolte de données explicite comme l’est le rating. On peut observer par exemple quelle musique il a écouté, quel article il a lu, et on croise ses infos avec celles du reste des utilisateurs afin de lui proposer de nouvelles suggestions.

La recommandation sociale user-centric a cependant ses limites. Lorsqu’il s’agit d’un gros site qui gère des millions d’utilisateurs et un catalogue de milliers de produits, il faut scanner un grand nombre de voisins potentiels, ce qui rend impossible la recommandation en temps réel. Pour palier ce problème, les gros sites implémentent souvent une technique différente plus apte au traitement préalable des données hors-ligne (offline preprocessing), la recommandation sociale item-centric (à ne pas confondre avec la recommandation objet).

Item-based nearest neighbor (item-centric / model-based)

Cette autre approche, appelée aussi item-to-item, propose une inversion de l’approche user-based nearest neighbor. Au lieu de mesurer la corrélation entre des utilisateurs, les ratings sont utilisés pour mesurer la corrélation entre les contenus (films), en s’aidant toujours du coefficient de corrélation de Pearson, mais cette fois-ci appliqué au contenu. Si par exemple les ratings des deux films “Fargo” et “Pulp Fiction” ont une parfaite corrélation, c’est-à-dire qu’ils ont reçu les mêmes ratings (positif, négatif ou nul) de la part des utilisateurs, on peut ainsi prédire que Ken aimera le film “Fargo” car il a aimé “Pulp Fiction” (les ratings des utilisateurs sur ces deux films sont parfaitement corrélés).

Pour le dire autrement, l’approche item-centric propose de rechercher en premier lieu des contenus similaires et ensuite de faire une recommandation à l’utilisateur. Cette approche permet de faire un traitement préalable sur la matrice pour déterminer les contenus similaires et ainsi pouvoir effectuer des prédictions en temps réel, contrairement à l’approche user-centric très gourmande en mémoire.

Autant le coefficient de corrélation de Pearson est très utilisé pour déterminer des utilisateurs similaires (cas de la recommandation sociale user-centric), dans l’approche item-centric, on utilise plutôt comme indicateur de mesure de similarité entre items un autre indicateur qu’on appelle de similarité cosinus ajustée. Les valeurs possibles pour cet indicateur vont comme dans le cas de mesure de Pearson de +1 (forte similarité positive) à -1 (forte similarité négative). Une fois que la similarité entre les items a été établie à l’aide de la similarité cosinus ajustée, on peut alors prédire un rating pour un item grâce aux ratings effectués par l’utilisateur sur les items similaires.

Dans l’approche item-centric, l’idée est donc de construire à l’avance la matrice de similarité entre items. Et en temps réel, on peut facilement ensuite déduire la prédiction de recommandation (le rating) d’un produit pour un utilisateur actif en déterminant depuis la matrice déjà construite quels sont les produits les plus similaires, et en calculant la valeur moyenne de ratings sur ces produits effectués par les utilisateurs voisins.

Avantages et inconvénients

Avantage:  L’approche purement de recommandation sociale n’exploite pas ou ne demande aucune connaissance sur les contenus eux-même. Par exemple, dans le cas d’un magasin de vente de livres en ligne, le système de recommandation collaboratif n’a pas besoin de savoir le type de contenu du livre, son genre, qui en est l’auteur, etc… Pas besoin de se baser sur l’analyse des propriétés intrinsèques d’un livre ou d’un contenu, la recommandation sociale est capable de recommander des contenus sans avoir besoin de comprendre le sens ou la sémantique du contenu lui-même. Les informations propres au livre n’ont pas besoin d’être introduite dans le système.

Inconvénients:

  • Scalability: souvent, les plate-formes sur lesquelles sont utilisés les filtres collaboratifs ont des millions d’utilisateurs, de produits et contenus. Ça demande donc beaucoup de puissance de calcul pour pouvoir proposer des suggestions aux utilisateurs. La recommandation sociale de type user-centric est aussi appelée memory-based, car la base de données des ratings est maintenue en permanence en mémoire dans le serveur et utilisée directement pour générer des recommandations à l’utilisateur actif. Bien que cette approche memory-based soit théoriquement plus précise, car elle a disposition en permanence et en temps réel toutes les données pour générer les recommandations, elle souffre de problèmes de scalability pour des bases de données de millions d’utilisateurs et de millions de contenus. Dans une approche item-centric ou model-based, les données sont préalablement traitées hors-ligne. Ensuite lors de l’exécution de l’application ou service web, le modèle “appris” ou pré-traité sera utilisé pour effectuer les prédictions. L’approche model-based permet d’éviter le problème de scalability.
  • Cold Start: les systèmes de recommandation sociale ont besoin de beaucoup de données et beaucoup d’utilisateurs pour être performants. Le lancement d’un service de recommandation peut souffrir au début du manque d’utilisateurs et d’informations sur ceux-ci.
  • Sparsity (Rareté): le nombre de produits ou contenus est énorme sur certaines plates-formes, et même les utilisateurs les plus actifs auront noté ou valorisé qu’un tout petit sous-ensembe de toute la base de données. Donc, même l’article le plus populaire n’aura que très peu de bonnes notes. Dans une telle situation, deux utilisateurs auront peu d’articles valorisés en commun, ce qui rend plus difficile la tâche de corrélation. C’est une situation qu’on retrouve lorsque le système dispose d’un ratio élevé de contenu par rapport aux utilisateurs, et qu’on retrouve aussi souvent au stade initial du lancement du service de recommandation, ce qui nous ramène au problème de cold start (qui peut être vu comme un cas spécial du problème de rareté).

Recommandation Hybride

Une combinaison des trois approches ci-dessus. Les méthodes hybrides sont de plus en plus utilisées, car elle permettent de résoudre des problèmes comme le cold start et la sparsity (rareté) qu’on retrouve dans une approche de recommandation uniquement sociale. D’autre part, si par exemple on considère 2 utilisateurs avec les mêmes goûts mais qui n’ont pas évalué ou “raté” des objets en commun, un filtrage collaboratif pur ne les considérera pas comme similaires ou voisins. Rappelons que la mesure de similarité standard ne prend en compte que les éléments pour lesquels l’utilisateur actif et l’utilisateur à comparer ont effectué un rating. L’idée est alors de pouvoir assigner une valeur par défaut aux éléments qui ont été “ratés” seulement par un des deux utilisateurs, afin d’améliorer la qualité de prédiction en cas de rareté (sparsity). En appliquant préalablement un algorithme de recommandation objet sur les contenus pour en exploiter leurs descriptions et caractéristiques, accompagné ensuite d’un algorithme de recommandation sociale pour effectuer les recommandations peut aider à résoudre ces limitations. Autrement dit, pour les cas de rareté (sparsity), lorsque peu d’items ont été évalués par les utilisateurs et qu’un filtrage collaboratif n’est pas possible, ce qu’on fait, c’est qu’on assigne en premier lieu un pseudo-rating ou vote artificiel par défaut à l’utilisateur sur les contenus disponibles en utilisant préalablement un algorithme objet, puis on applique ensuite sur la matrice (contenant peu de vrais rating et beaucoup de pseudo-ratings) un filtrage collaboratif.

Exemples:

Amazon utilise les 3 approches (personnalisée, sociale et objet). Amazon possède un système très sophistiqué, les recommandations sont d’une part personnalisées en se basant sur le comportement individuel passé de l’utilisateur (historique de navigation et historique d’achat), et d’autre part Amazon utilise aussi les caractéristiques de l’article lui-même (recommandation objet) et les comportements d’autres personnes (recommandation sociale). Tous ceux qui ont déjà fait un achat sur Amazon ont probablement dû lire le message de la part d’Amazon qui nous dit “les gens qui ont acheté x ont aussi acheté y“.  Cette approche est tout simplement l’approche item-based nearest neighbor (item-centric ou item-based collaborative filtering) qu’on a décrit auparavant. Il semblerait que le système de recommandation d’Amazon représente plus du 30% du CA global de la société (en 2009)!

Recommandation Amazon

Amazon Recommendation System

Netflix est aussi un bon exemple de système hybride. Il propose des recommandations en comparant les habitudes de visionnage des films d’utilisateurs similaires (recommandation sociale) et suggère aussi des films qui partagent des caractéristiques avec des films que l’utilisateur a noté positivement (recommandation objet).

Google, lui se focalise aussi sur une combinaison de 3 approches pour améliorer son produit phare qui est son moteur de recherche:
  • Recommandation Personalisée:
    • Google customise nos résultats de recherche, quand cela est possible, en se basant sur notre localisation et/ou nos dernières recherches.
    • Lorsqu’on est connecté à notre compte Google, il propose un contenu encore plus pertinent en fonction de notre historique de recherche.
  • Recommandation Sociale:
    • L’algorithme du PageRank est de manière intrinsèque un outil basé sur de la recommandation sociale dans la mesure ou il utilise les liens entre les pages web.
    • L’utilisation de contenus provenant de nos cercles de Google+ est aussi une forme de recommandation sociale.
  • Recommandation Objet
    • Google utilise aussi une approche sémantique pour sa fonction « Did you mean » de son moteur de recherche.

Pandora vs Last.fm

La différence entre les approches de recommandation objet et de recommandation sociale (collaborative) peut être illustrée en comparant deux services de radio en ligne que sont Pandora (seulement disponible aux USA) et Last.fm.

Pandora utilise principalement une approche de recommandation objet. Le système se base sur les propriétés de la chanson et/ou de l’artiste, c’est à dire il décompose dans un premier temps les morceaux de musique afin de mettre en évidence ses propriétés intrinsèques. Chaque morceau de musique disposerait de plus de 400 attributs, permettant de déterminer une sorte de code génétique de la chanson (Music Genome Project). En comparant les propriétés similaires entre différents morceaux, le système arrive alors à nous proposer de nouvelles chansons à écouter, c’est-à-dire une sorte de station radio qui diffuse de la musique avec des propriétés susceptibles de correspondre à nos goûts. L’utilisateur peut ensuite indiquer s’il aime ou pas le morceau en écoute, et permet ainsi à Pandora d’affiner son filtre de recommandation en privilégiant (ou pas) certains attributs selon l’information venue en retour de l’utilisateur.

Recommandation Pandora

Last.fm lui utilise un filtre de recommandation sociale (collaborative). Le service crée une station de radio personnalisée en observant quels sont les groupes, artistes et chansons que l’utilisateur a écouté régulièrement et les compare avec les comportements d’écoute d’autre utilisateurs. Last.fm va alors proposer des morceaux fréquemment écoutés par des utilisateurs ayant des goûts similaires.

 Last.fm
Chaque type d’approche a ses avantages et inconvénients. En l’occurrence Last.fm requiert beaucoup d’information sur les habitudes d’écoute des utilisateurs afin de produire un système de recommandation efficace (problème du cold start). Pandora lui au contraire a besoin de très peu d’information sur l’utilisateur pour démarrer une radio personnalisée, mais doit disposer d’une base de données gigantesque sur le “génome” de chaque chanson.

Netflix Prize

De 2006 à 2009, Netflix a parrainé un concours, le Netflix prize, offrant un prix de $1’000’000 à celui qui à partir d’un set de données de plus de 100 millions de ratings de films pourrait offrir des recommandations 10% plus précises que celles générées par le système original de la compagnie Netflix. Le 21 septembre 2009, le prix a été attribué à une équipe appelée  BellKor’s Pragmatic Chaos. Les gagnants avaient misé sur un mélange de centaines d’approches algorithmiques et méthodes prédictives qui réunies ensemble permettent d’être plus performant dans la prédiction. La solution la plus performante semble donc bien s’appuyer sur un ensemble de méthodes algorithmiques plutôt que sur le raffinement et l’optimisation d’une seule technique spécifique.

Pour l’anecdote, le Netflix prize n’a pas été renouvelé en 2010, car malgré le fait que le set de million de données fournies aux participants du concours aient été rendues anonymes pour préserver l’identité des clients, deux chercheurs de l’Université du Texas ont été capables d’identifier des utilsateurs présents dans le set de données utilisé lors du concours en associant et croisant ces données avec des ratings de films soumis sur l’Internet Movie Database (IMDb). Il s’en est suivi qu’en décembre 2009, un des utilisateurs anonymes du set de données a poursuivi Netflix pour violation de la législation américaine en terme de confidentialité.

Efficacité d’un algorithme de recommandation

On a vu que la recommandation sociale (filtrage collaboratif) a l’avantage contrairement à la recommandation objet de permettre d’effectuer des prédicitions même lorsqu’il y a peu de information associée au contenu à recommander ou lorsque que le contenu est difficile d’analyser automatiquement (idées, opinions…) Mais la recommandation sociale souffre aussi d’inconvénients comme le cold start et le problème de rareté (sparsity).

Evaluer l’efficacité des algorithmes de recommandation est loin d’être trivial. En premier lieu, parce que différents algorithmes peuvent être meilleurs ou moins bons en fonction du set de données sélectionné et sur lequel ils sont appliqués. D’autre part, les objectifs fixés par un système de recommandation peuvent être divers et variés. Un système de recommandation peut être mis en place pour estimer avec exactitude la note que donnerait un utilisateur à un élément, alors que d’autres auront comme objectif principal de ne pas proposer des recommandations erronées.

On peut donc légitimement se demander jusqu’à quel point ces différentes méthodes de recommandation sont réellement efficaces. Pour déterminer l’efficacité d’un système, des indicateurs comme la précision et le recall sont utilisés.

La précision est un indicateur qui représente la qualité de la recommandation, c’est-à-dire à quel point les suggestions proposées sont conformes aux intérêts de l’utilisateur:

précision = nbre de suggestions pertinentes / nbre de suggestions

Le recall indique combien de suggestions pertinentes ont été recommandées à l’utilisateur par rapport au nombre total de suggestions pertinentes disponibles dans le système.

recall = nbre de suggestions pertinentes proposées à l’utilisateur / nbre de suggestions pertinentes totale

L’indicateur de précision permet de déterminer la probabilité qu’un élément recommandé soit pertinent.

L’indicateur de recall permet de déterminer la probabilité qu’un élément pertinent soit recommandé.

On utilise aussi des techniques statistiques pour mesurer l’efficacité d’un algorithme de recommandation. L’idée c’est d’évaluer la précision de la prédiction effectuée par le système en comparant les prédicitions avec les choix qu’aurait fourni l’utilisateur dans un cas réel. On utilise par exemple lErreur Moyenne Absolue (MAE) qui mesure la déviation des recommandation prédites avec les choix réels effectués par les utilisateurs. Plus l’erreur moyenne absolue est faible, meilleure est la prédicition.

Pour conclure, la meilleure mesure de l’efficacité d’un algorithme de recommandation et de la pertinence des suggestions c’est finalement la satisfaction de l’utilisateur, qui n’est pas toujours facile à bien identifier.

Sources:

http://www.readwriteweb.com/archives/recommendation_engines.php

http://fr.wikipedia.org/wiki/Syst%C3%A8me_de_recommandation

http://en.wikipedia.org/wiki/Recommender_system

http://en.wikipedia.org/wiki/Collaborative_filtering

http://recommender-systems.org/

http://www.it.uc3m.es/jvillena/irc/descarga.htm?url=practicas/06-07/31.pdf

http://www.docstoc.com/docs/35703482/Top-N-Recommendation-Algorithm-B

http://www.cs.utexas.edu/users/ml/papers/cbcf-aaai-02.pdf

http://www.amazon.es/Recommender-Systems-Introduction-Dietmar-Jannach/dp/0521493366

 

» Voir l’illustration de Nico

 

VN:F [1.9.17_1161]
Rating: 5.0/5 (2 votes cast)
Tagged with:  
VN:F [1.9.17_1161]
Rating: 5.0/5 (3 votes cast)

L’expérience du chat de Schrödinger fut imaginée en 1935 par le physicien Erwin Schrödinger, afin de mettre en évidence des supposées lacunes dans l’interprétation de la physique quantique appliquée aux objets quotidiens faite par l’Ecole de Copenhague. L’Ecole Copenhague est un courant de pensée en physique qui a pris place au XXème siècle et qui présente la mécanique quantique comme un simple instrument de prédiction. De nombreux grands physiciens se sont inscrit dans ce courant comme Niels BohrWerner HeisenbergMax Born…Mais, Schrödinger, avec son expérience du chat, a voulu illustrer le problème qu’on appelle problème de la mesure, un problème qui trouve sa source dans l’interprétation purement prédicitive de la physique quantique telle que la décrit l’Ecole de Copenhague.

La physique quantique ou mécanique quantique est l’appellation générale d’un ensemble de théories physiques nées au XXème siècle qui décrivent le comportement des atomes et des particules. La mécanique quantique a donc pour but de décrire le monde microscopique et de l’infiniment petit. Cependant sa description du monde heurte le sens commun à plusieurs égards. Par exemple une propriété bizzare de la mécanique quantique est la dualité onde-particule, je vous renvoie à l’expérience des fentes de Young dont j’avais parlé dans mon dossier sur la lumière. Le problème de la mesure décrit par Schrödinger est en soi aussi une des nombreuses interprétations étranges que l’on peut faire de la mécanique quantique et il illustre bien les difficultés de corrélation entre les postulats fondamentaux de la mécanique quantique et le monde macroscopique tel qu’il nous apparaît et tel qu’il peut être mesuré.

Chat de Schrödinger

Superposition quantique

Un état quantique peut être vu comme un ensemble de propriétés qui permettent de décrire complètement un objet physique, comme par exemple une particule de matière. Par exemple, dans le cas d’un électron en mouvement, son état quantique est décrit par 4 propriétés ou nombres quantiques:

  • Nombre quantique 1: son énergie.
  • Nombre quantique 2: son spin
  • Nombre quantique 3: son moment angulaire
  • Nombre quantique 4: son moment magnétique.

En physique classique:

  • l’état d’un système physique détermine de manière absolue les résultats de mesure des grandeurs physiques.
  • les différents états d’un système physique classique sont mutuellement exlusifs (un système est très énergétique ou ne l’est pas)

En physique quantique:

  • la connaissance de l’état d’un système permet seulement de prévoir les probabilités respectives des différents résultats possibles lors d’une mesure. L’état quantique ne peut pas être assimilé à un ensemble de propriétés physiques qui évoluent au cours du temps. En mécanique quantique, l’état et les grandeurs physiques sont deux concepts séparés et sont représentés par deux objets mathématiques différents.
  • dans un système quantique les états mutuellement exclusifs existent aussi, on les appelle les états quantiques orthogonaux. Ce sont en quelques sortes les états de base d’un système quantique comparables à ceux de la physique classique. Mais la nouveauté en mécanique quantique, c’est que en plus de ces états orthogonaux mutuellement exclusifs, il en existe beaucoup d’autre, une infinité. Ils s’obtiennent en mélangeant les états quantiques de base. La mécanique quantique expose tous les états possibles du système, les états de base et aussi tous ceux qui peuvent s’obtenir en mélangeant, superposant, les états de base.

En mécanique quantique, le principe de superposition stipule que les propriétés qui caractérisent un état quantique d’une particule peuvent posséder plusieurs valeurs (position, spin, quantité de mouvement, etc…). Un système quantique se trouve dans un état superposé tant qu’il n’est pas observé ou mesuré. Cependant, la mécanique quantique stipule que le résultat d’une mesure d’un système donne toujours un des états de base mutuellement exclusifs, il n’est pas possible d’obtenir un état superposé lors d’une mesure. L’état superposé existe uniquement en absence d’observation. Pour expliquer ce phénomène, il faut faire appel à une nouvelle notion, la fonction d’onde.

La description du monde par la mécanique quantique repose sur une fonction d’onde (un courbe de forme ondulatoire) qui donne les probabilités de trouver une particule ou un objet quantique dans un état ou un autre. Pour cette raison, on a coutume de dire qu’un système quantique peut être dans plusieurs états à la fois, ou dans un état superposé. Il faut en réalité comprendre que le système est dans un état quantique unique, mais que les mesures peuvent donner plusieurs résultats différents, chaque résultat étant associé à sa probabilité d’apparaître lors de la mesure. Lors d’une opération dite de mesure, l’objet quantique sera trouvé dans un état de base déterminé. Il se produit ce que l’on appelle une réduction ou effondrement de la fonction d’onde: la particule ou l’objet quantique se matérialise dans un état donné, selon la probabilité indiquée par sa fonction d’onde. C’est comme si tout acte d’observation sélectionne instantanément un et un seul état parmi l’ensemble des états superposés possibles.

C’est la mesure qui perturbe le système quantique et le fait bifurquer d’un état quantique superposé vers un des états de base qui est mesuré. C’est un état qui ne préexiste pas avant la mesure, et qui à une probabilité d’advenir décrite par la fonction d’onde de la particule et c’est la mesure qui semble le faire advenir. En mécanique quantique, il n’est pas possible de connaître l’état d’un système avant son observation, tout simplement parce que cette information n’existe pas dans l’Univers. C’est comme si avant la mesure l’Univers n’aurait pas encore décidé quel en serait le résultat.

L’expérience du chat de Schrödinger

L’expérience consiste à enfermer un chat dans une boîte fermée avec un dispositif qui tue l’animal dès que le dispositif détecte la désintégration d’un atome d’un corps radioactif. On peut imaginer un détecteur de radioactivité comme un compteur Geiger, relié à un interrupteur qui peut provoquer la chute d’un marteau cassant une fiole de poison et libérant un gaz mortel pour le chat. L’interrupteur est activé et le chat empoisoné si l’atome radioactif se désintègre, au contraire l’interrupteur n’est pas activé et le chat reste vivant si l’atome ne se désintègre pas. Si les probabilités de la fonction d’onde de la particule radioactive indiquent qu’une désintégration a une chance sur deux d’avoir eu lieu au bout d’une minute, la mécanique quantique indique que, tant que l’observation n’est pas faite, l’atome est en superposition et simultanément dans deux états (intact et désintégré). Or le mécanisme de l’expérience imaginée par Erwin Schrödinger lie l’état du chat à l’état des particules radioactives (intact et désintégré), de sorte que le chat serait simultanément dans deux états (mort et vivant), jusqu’à ce que l’ouverture de la boîte (l’observation) déclenche le choix entre les deux états. Du coup, tant que l’on n’a pas ouvert la boîte, on ne peut absolument pas dire si le chat est mort ou non au bout d’une minute. En suivant scrupuleusement les règles quantiques, l’état superposé d’une particule (désintégrée/non désintégrée) devrait se propager à l’état du chat qui devrait également être dans un état superposé mort-vivant. Or, un tel état n’est et ne peux jamais être observé, d’où paradoxe et problème.

Chat de Schrödinger

La difficulté principale dans notre conceptualisation de cette expérience tient dans le fait que si l’on est généralement prêt à accepter ce genre de situation pour une particule quantique, l’esprit refuse d’accepter facilement une situation qui semble aussi peu naturelle quand il s’agit d’un sujet plus familier, macroscopique, à notre échelle comme un chat. En fait, le passage à l’échelle macroscopique que représente le chat par rapport aux particules radioactives est le principal intérêt de l’expérience. Il ne s’agit pas d’une question sur le vivant (vie/mort), car le rôle du chat peut être parfaitement remplacé et réalisé par le propre interrupteur (lui aussi un objet macroscopique) qui se trouverait dans deux états simultanés éteint et enclenché à la fois .

Cette expérience est plus une expérience de pensée qu’une expérience réalisable au sens physique du terme. On ne pourra en effet jamais mettre en évidence directement, ou mesurer, que le chat est à la fois mort et vivant car le fait d’essayer de connaître son état provoquera nécessairement l’effondrement de la fonction d’onde menant inéluctabalement à l’un des deux état mort ou vivant. D’ailleurs les expériences effectuées par les scientifiques sur la préservation de la superposition des états quantique peuvent s’appliquer à quelques particules ou molécules, mais les conditions techniques pour préserver l’état superposé du chat sont tout à fait irréalisables pour plus de quelques molécules.

C’est pour faire apparaître le caractère paradoxal de la multiplicité des états possibles avant la mesure et de la matérialisation vers un état mesuré et observé après la mesure que Erwin Schrödinger a imaginé cette expérience du chat. Il voulait réfuter l’interprétation de Copenhague de la mécanique quantique, qui conduisait à un chat à la fois mort et vivant, en soutenant l’idée que si l’on parvient à provoquer une dépendance ou un couplage direct entre l’état d’une particule et la vie d’un chat, on devrait pouvoir mettre le chat dans un état superposé, mort et vivant, jusqu’à l’observation, qui le réduira à un seul état. Shrödinger pensait que la possibilité du chat mort-vivant démontrait que l’interprétation de la fonction d’onde par l’Ecole de Copenhague et décrite orginellement par Max Born était incomplète. Comment concevoir que le chat n’ait pas d’état défini tant qu’on n’opère pas d’observation. Selon lui, le chat ne peut pas être mort et vivant à la fois !

L’interprétation orthodoxe de la physique quantique qui mène à un chat à la fois mort et vivant montre bien que la mécanique quantique semble obéir à des lois souvent contraires à notre intuition. On se rend compte alors que la question n’est plus tant de savoir « comment la superposition des états est-elle possible dans le monde quantique ? » mais plutôt « comment est-ce impossible dans le monde réel que l’on observe à notre échelle ? ».

Solutions du paradoxe

Pour en découdre avec ce paradoxe sur l’état mort-vivant simultané du chat, différentes pistes théoriques ont été mises en avant pour tenter d’apporter quelques éléments de réponse.

Chat de Schrödinger

Théorie de la décohérence

La théorie de la décohérence propose que l’état de superposition ne peut être maintenu qu’en l’absence d’interactions avec l’environnement qui déclenche le choix entre les deux états (mort ou vivant). La décohérence n’est pas provoquée par une action « consciente » de l’obervateur, qu’on interprète comme une « mesure », mais plutôt par des interactions physiques avec l’environnement, de sorte que la décohérence a lieu d’autant plus vite qu’il y a plus d’interactions. Chaque éventualité d’un état superposé interagit avec son environnement, mais la complexité des interactions est telle que les différentes possibilités deviennent rapidement incohérentes (d’où le nom de la théorie de la décohérence).

La théorie de la décohérence réconcilie d’une part le postulat de la réduction de la fonction d’onde avec d’autre part l’équation de Schrödinger qui autorise les superpositions d’états. L’équation de Schrödinger est une équation qui régit les états possibles d’une particule, c’est une équation linéaire, ce qui entraîne que pour deux états possibles d’une particule, la combinaison de ces deux états est également un état possible. L’état mort-vivant du chat doit être possible selon l’équation de Schrödinger, une réalité qui lui semblait à Schrödinger et qui nous semble difficilement acceptable. Comment donc les superpositions quantiques peuvent-elles disparaître à l’état macroscopique, alors que la linéarité de l’équation de Schrödinger mène naturellement à une préservation des états superposés aussi à l’échelle macroscopique? Alors heureusement la théorie de la décohérence peut démontrer mathématiquement que chaque interaction avec l’environnement déphase les fonctions d’onde des états les unes par rapport aux autres de telle manière que la probabilité d’observer un état superposé (mort-vivant) tend rapidement vers zéro. Seuls restent observables les états correspondant aux états observables macroscopiquement, l’état mort ou bien vivant du chat. Il n’y a alors pas de paradoxe : le chat se situe dans un état déterminé bien avant que la boîte ne soit ouverte et l’équation de Schrödinger est réconciliée avec la réduction de la fonction d’onde.

Les interactions et l’environnement dont il est question dans cette théorie ont des origines très diverses. Typiquement, le simple fait d’éclairer un système quantique suffit à provoquer une décohérence. Même en l’absence de tout éclairage, il restera toujours au minimum les quelques photons du fond diffus cosmologique qui provoquent également une décohérence, bien que bien plus lente. Et bien naturellement, le fait de mesurer volontairement un système quantique provoque des interactions nombreuses et complexes avec un environnement constitué par l’appareil de mesure. Dans ce cas, la décohérence est pratiquement instantanée et inévitable.

À l’échelle macroscopique, où on trouve des milliards de milliards de particules en intéraction avec l’environnement, la rupture de la cohérence (états superposés) se produit donc pratiquement instantanément. Autrement dit, l’état de superposition ne peut être maintenu que pour des objets de très petite taille constitués de quelques particules. Donc, pour la théorie de la décohérence, l’effondrement de la fonction d’onde n’est pas spécifiquement provoquée par un acte de mesure, mais peut avoir lieu spontanément, même en l’absence d’observation et d’observateurs. Ceci est une différence essentielle avec le postulat initial de réduction du paquet d’onde qui ne spécifie pas comment, pourquoi ou à quel moment a lieu la réduction, ce qui a ouvert la porte à des interprétations mettant en jeu la conscience et la présence d’un observateur conscient. La théorie de la décohérence prend le contre-pied de l’interprétation de Copenhague qui elle introduit l’observateur et la mesure intervenant au niveau le plus fondamental en physique.

Théorie de la décohérence avec paramètres cachés

La théorie de la décohérence avec paramètres cachés est une variante de la théorie de la décohérence classique. Comme pour la théorie classique, la décohérence se produit toujours indépendamment de la présence d’un observateur, ou d’une mesure, mais la théorie de la décohérence avec paramètres cachés stipule aussi que les lois quantiques ne seraient pas capables à elles seules d’expliquer la décohérence. Elle introduit des paramètres physiques supplémentaires dans les lois quantiques (par exemple: action de la gravitation) pour expliquer la décohérence.
L’inconvénient est que ces paramètres supplémentaires, bien que compatibles avec les expériences connues, ne correspondent à aucune théorie complète et bien établie à ce jour.

Approche relationnelle

L’interprétation relationnelle ne fait aucune distinction fondamentale entre l’expérimentateur humain, le chat, l’appareil de mesure, objets animés conscients ou inanimés. Tous sont des systèmes quantiques gouvernés par les mêmes lois de l’évolution de la fonction d’onde, et tous peuvent être considérés comme des “observateurs”. L’interprétation relationnelle autorise que différents observateurs peuvent avoir différents points de vue d’une même série d’événements, selon l’information dont ils disposent sur le système.

Par exemple, le chat peut être considéré comme un observateur de l’appareil de mesure, alors que l’expérimentateur lui peut être considéré comme un autre observateur du système se trouvant dans la boîte (chat + appareil de mesure). Avant que la boîte soit ouverte, le chat, selon qu’il soit vivant ou mort, dispose de l’information sur l’état de l’appareil (l’atome s’est désintégré ou non). Mais l’expérimentateur lui ne dispose pas encore de l’information sur l’état du contenu de la boîte (chat + appareil). Ainsi les deux observateurs ont simultanément deux points de vue différents sur la situation:

  • Pour le chat, la fonction d’onde de l’appareil apparaît comme réduite.
  • Pour l’expérimentateur, le contenu (chat + appareil de mesure) semble toujours être en superposition.

C’est seulement quand la boîte est ouverte que les deux observateurs (chat et expérimentateur) ont la même information sur ce qui s’est passé, c’est seulement à ce moment que pour les deux observateurs le système s’est réduit à un état défini (le chat est soit vivant ou soit mort).

En conséquence, l’approche relationnelle de la mécanique quantique argumente que la notion d’”état” ne décrit pas le système observé en lui-même, mais plutôt la relation, ou corrélation, que le système entretien avec l’observateur. Cette approche ne se centre donc pas sur les objets eux-même, mais plutôt sur les relations qu’il y a entre eux.

Approche positiviste

L’approche positiviste pense que la fonction d’onde ne décrit pas la réalité en elle-même, mais uniquement ce que nous connaissons de celle-ci. Autrement dit, les lois quantiques ne sont utiles que pour calculer et prédire le résultat d’une expérience, mais pas pour décrire la réalité. Les problèmes ou paradoxes qui peuvent potentiellement émerger deviennent dépourvus de sens, car ces problèmes ne concernent alors plus la réalité en elle-même, qui est finalement « telle qu’elle est » et qui n’aurait pas à justifier de ses incohérences tant qu’elle donne des résultats qui sont, à toutes fins utiles ou corrects. Dans cette hypothèse, l’état superposé mort-vivant du chat n’est pas un état « réel » et il n’y a pas lieu de philosopher à son sujet. De même, la décohérence ou l’effondrement de la fonction d’onde n’a aucune réalité en elle-même, et elle décrit simplement le changement de connaissance que nous avons du système. Le paradoxe, dans cette approche, est donc évacué. Cette approche positiviste repose sur la conviction que la mécanique quantique n’est qu’une description de tout ce que nous pouvons connaître de la réalité, mais ne décrit pas la réalité en elle-même.

Approche réaliste et théorie des univers parallèles

L’apporche réaliste prend le contre-pied de l’approche positiviste et stipule que la fonction d’onde décrit la réalité, et toute la réalité. L’approche réaliste pense que les postulats de la mécanique quantique nous disent quelque chose à propos de la réalité physique et recherchent donc la cohérence et leur adéquation avec la réalité elle-même.

Par exemple la théorie des univers parallèles (ou multivers), initiée par Hugh Everett en 1957, s’inscrit dans ce courant de pensée réaliste. La théorie des univers parallèles permet de décrire séparément les deux états simultanés mort-vivant du chat et leur donne une double réalité, c’est-à-dire deux réalités dans deux univers parallèles.  Cela signifie que, quand une mesure quantique peut donner plusieurs résultats différents, l’ensemble des superpositions de toutes les valeurs possibles de la mesure coexistent dans un multivers, mais nous n’aurions conscience que d’une seule éventualité car notre conscience (qui est par hypothèse, dans cette théorie, un phénomène purement physique) se retrouve quantiquement intriquée avec un et un seul résultat de la mesure. Il est donc impossible, pour un état de conscience donné, de percevoir l’ensemble des états superposés, pourtant réels d’après cette théorie. A chaque observation la réalité se scinderait en autant d’univers que d’observations physiquement possibles. Selon cette théorie, le chat serait à la fois mort et vivant de façon totalement indépendante à l’ouverture ou non de la boîte, les états mort et vivant subsisteraient après l’ouverture de la boîte. Les états “mort” et “vivant” seraient deux états réels qui ne peuvent pas intéragir l’un avec l’autre et dont leur histoire se déroule dans différentes branches indépendantes de l’univers.

Chat de Schrödinger

Conclusion

Où mettre la limite entre objets “classiques” (chat, appareils de mesure) et “quantiques”? Comment passe-t-on de et (états superposés) à ou?

Pour conclure, on voit que le paradoxe du chat prend sa source dans la formulation même des lois quantiques. Si une théorie alternative, formulée différemment, peut être établie, alors le paradoxe disparaîtrait de lui-même. Dans une telle nouvelle théorie, s’il n’existe ni superposition des particules ni décohérence, alors le prétendu paradoxe du Chat de Schrödinger se réduit à un simple artefact d’une théorie orginellement mal formulée. D’ailleurs la mécanique quantique se fonde sur 6 postulats fondamentaux qui sont considérés comme exacts. Certains considèrent que de véritables solutions au problème de la mesure ne peuvent être apportées qu’en remettant plus ou moins fondamentalement en cause ces postulats.

Encore quelques petites vidéos qui expliquent bien l’expérience et le paradoxe qui en découle:

-

Sources:

http://fr.wikipedia.org/wiki/Chat_de_Schr%C3%B6dinger

http://en.wikipedia.org/wiki/Schr%C3%B6dinger’s_cat

http://www.xatakaciencia.com/fisica/el-gato-de-schrodinger

http://www.xatakaciencia.com/fisica/el-gato-de-schodinger-i

VN:F [1.9.17_1161]
Rating: 5.0/5 (3 votes cast)
VN:F [1.9.17_1161]
Rating: 4.0/5 (1 vote cast)

Introduction

Avant de pouvoir déterminer les conditions nécessaires à la vie, il faut pouvoir définir ce qu’est la vie. Et définir ce qu’est la vie n’est pas une tâche facile. Pierre Kerner dans son dossier sur l’arbre du vivant nous a dit qu’il fallait considérer la vie non comme une substance aux propriétés éternelles, mais plutôt comme le résultat d’un processus issu de sélection naturelle. Et les caractéristiques du processus du vivant peuvent être décrites par la capacité de celui-ci à:

  • croître
  • se nourrir
  • se reproduire
  • évoluer
Pour tenter de compléter la défintion de Pierre, on pourrait aussi ajouter un élément important qui est celui de la capacité symbiotique du vivant.

La symbiose

La symbiose entre deux organismes vivants est la capacité de ceux-ci à collaborer et à s’entre-aider mutuellement pour survivre. On trouve de nombreux exemples de symbiose dans le règne animal et végétal. Un exemple tout simple est celui des bactéries qui se trouvent dans notre flore intestinale indispensables à notre survie. Les lichens sont aussi un bon exemple de symbiose, ils sont généralement constitués de l’association symbiotique entre un champignon et une algue.

lichen

Mais on peut aussi descendre d’une échelle et parler de symbiose moléculaire. En effet, les molécules dans nos cellules forment et s’assemblent dans un système complexe de type symbiotique. On voit que certaines molécules existent par ce que d’autres sont aussi présentes, les unes ne pourraient pas être présentes sans les autres. C’est cette symbiose moléculaire qui contribue à la survie de l’ensemble du système moléculaire et donc de nos cellules. Par exemple les molécules d’ADN peut exister uniquement parce qu’il y a les protéines, qui sont d’autres types de molécules, qui peuvent l’aider dans sa reproduction. Et vice-versa, les molécules de protéines peuvent exister car l’ADN est capable de son côté via l’ARN messager à se traduire en protéines. On voit bien qu’on se trouve dans une sorte de circuit fermé dans lequel certaines molécules ne pourraient pas survivre et exister sans l’aide d’autres molécules.

Une molécule en soi est inerte, mais au sein d’un système moléculaire plus complexe, celui-ci peut devenir dynamique.

La chimie du vivant

Essentiellement les éléments chimiques constitutifs des molécules de base nécessaires au développement de la vie sont les éléments chimiques constitutifs de l’ADN et des acides aminés:

  • Carbone
  • Oxygène
  • Azote
  • Hydrogène
  • Soufre
  • Phosphore

Ces différents éléments sont très abondants et disponibles dans le milieu interstellaire. D’ailleurs on pense que ce serait un astéroide (embryon de planète) qui aurait apporté sur Terre ces éléments sous forme de molécules.

Le Carbone est l’élément le plus important de tous pour l’apparition de la vie. C’est lui qui lui donne en quelques sortes le squelette chimique principal du vivant. L’atome de Carbone a la propriété de pouvoir s’unir à 4 autres éléments chimiques  (principalement Carbone, Oxygène, Azote et Hydrogéne) pour former des molécules organiques. L’atome de Carbone possède 4 liaisons chimiques possibles, c’est-à-dire il a en quelques sortes 4 bras avec lesquels il peut en faire beaucoup de choses. Il peut grâce à ses 4 bras (à ces 4 possibilités de liaison chimique) créer des chaînes moléculaires en s’associant à d’autres atomes de Carbone ou à de l’Oxygène, Azote, Hydrogène… Mais une autre particularité intéressante du Carbone est que l’énergie mise en jeu dans la liasion qui l’unit à un atome voisin n’est pas contraignante. Les énergies de liaison et de rupture sont similaires entre le Carbone et les éléments chimiques avec lesquels il peut se combiner pour que la vie apparaisse. Par exemple, l’énergie mise en jeu dans une liaison Carbone-Oxygène est similaire à celle mise en jeu dans une liaison Carbone-Carbone ou Carbone-Azote. L’atome de Carbone n’a donc pas de préférence de liaison avec un élément qui aurait une liaison plus forte et plus difficile à rompre. L’atome de Carbone traite les éléments avec lesquels il s’unit de façon equitable, c’est un atome démocratique. Ces différentes propriétés lui confère donc une grande capacité de diversité de combinaisons moléculaires. Sans diversité moléculaire, un système complexe avec métabolisme et symbiose moléculaire ne pourrait tout simplement pas exister.

molecule carbone

L’eau liquide est aussi un élément indispensable, car elle va jouer le rôle de solvant pour faciliter les réactions chimiques à partir de ces éléments chimique de base. L’eau permet aussi de transporter les molécules de ces éléments pour qu’elles se rencontrent. (L’organisation et l’agencement des molécules organiques se fait au détriment de celui des molécules d’eau qui acquièrent plus de désordre. Cette échange de procédé entre molécules organiques et l’eau a tendance à augmenter l‘entropie du système, c’est le fameux deuxième principe de la thermodynamique). L’eau des océans terrestres aurait en partie comme origine la glace présente sur des comètes qui auraient impactées la Terre à plusieurs reprises quelques millions d’années seulement après la création de notre planète (il y 4,55 millards d’années).

Pour former des longues molécules, c’est-à-dire des chaînes d’acides aminés, on a besoin de former des liaison peptidiques entre les molécules organiques primordiales à base de Carbone. Une protéine est constituée de plusieurs acides aminées mis bout à bout grâce à ces liaisons peptidiques. Pour effectuer ce processus de liaison entre acides aminés, il faut éliminer une molécule d’eau. Si tout se passe dans l’eau, c’est pas efficace, car l’eau est partout et aura tendance à empêcher la création de ces liaisons peptidiques. On a donc besoin de période d’alternance entre une certaine humidité et de la sécheresse. L’orgine de la vie aurait donc plutôt eu lieu dans des flaques d’eau ou dans des zones de marée. Par exemple une flaque d’eau peut s’évaporer permettant la concentration et la création des ces liaisons peptidiques, puis la pluie permet de recommencer le cycle d’alternance eau-sécheresse.

Acide aminé

L’expérience de Miller

(Alan)

Montre en mains, je vais tenter de présenter l’expérience de Miller en moins de 5 minutes. Un grand merci à David du blog Science Etonnante pour son récent billet sur l’expérience de Miller, dont je me suis très largement inspiré. On en fait tous l’expérience à chaque instant: nous avons besoin d’oxygène pour vivre. Or l’oxygène est un oxydant extrêmement puissant qui abime les molécules du vivant comme les protéines et l’ADN. Impossible d’imaginer que la vie ait pu démarrer dans une atmosphère riche en oxygène comme celle de la Terre d’aujourd’hui.

L’hypothèse d’Alexander Oparin

C’est pour cela qu’aux XIXe et début du XXe siècle, la théorie la plus en vogue était celle de la panspermie (qui postule que la vie sur Terre serait d’origine extra-terrestre). Mais en 1920, le biochimiste  Alexander Oparin émet une hypothèse folle: et s’il n’y avait pas toujours eu de l’oxygène dans l’atmosphère terrestre? Et si cela avait permis à la vie de démarrer par une succession de simples réactions chimiques? La Terre a 4.5 milliards d’années. Les traces de vie les plus anciennes remontent à 3.5 milliards d’année. L’atmosphère a eu le temps de changer. Pour l’oxygène, on sait maintenant qu’Oparin avait raison. C’est la vie, et notamment la photosynthèse qui produit les quantités astronomiques d’oxygène qu’on trouve dans l’atmosphère terrestre.

L’expérience de Miller

Un peu plus de 30 ans plus tard, un jeune doctorant de l’Université de ChicagoStanley Miller réalise, en 1953, une expérience qui lui permet de publier sa thèse, de valider l’hypothèse d’Oparin et de se rendre célèbre: il re-crée en éprouvette les conditions de la soupe originelle, soit 3 ingrédients:
  • un mélange de gaz proche de ce qu’on pensait être l’atmosphère primitive  (hydrogène, méthane et ammoniac);
  • de l’eau;
  • des étincelles (décharges électriques représentant les éclairs).
Les premières réactions sont visibles dès les premiers éclairs: l’atmosphère devient rose. Au bout d’une semaine, Stanley Miller analyse le contenu de cette soupe: tadaaa! Il y trouve  11 acides aminés, ces briques élémentaires du vivant, sans magie, juste en partant de quelques composants chimiques non-organiques naturellement présents.
Depuis, on a refait son expérience. Avec des mesures plus précises, on a trouvé jusqu’à 25 acides aminés (le vivant n’en utilise que 20). En changeant un peu la composition de la soupe primordiale (en y ajoutant par exemple du sulfure d’hydrogène ou du dioxide de soufre, qui auraient pu être fournis grâce aux volcans), on obtient encore plus d’acides aminés
L’expérience n’a pas permis de démontrer la production spontanée de molécules plus complexes comme des protéines par exemple. Mais bon, en laboratoire, on n’a pu simuler que ce qui se passe en quelques jours, quelques semaines voire quelques années. Pour rappel, dans la nature, il s’est écoulé près d’un milliard d’années, soit mille millions d’années, soit mille milliers de milliers d’années – ce qui est complètement inaccessible à notre entendement – pour combiner et recombiner ces briques élémentaires jusqu’aux premières traces de cyano-bactéries observées. L’évolution explique le reste. Il est bien sûr à ce stade impossible de prouver que c’est bien comme cela que la vie a démarré, mais l’hypothèse d’Oparin reste tout à fait pertinente et vraisemblable.

La vie basée sur le Silicium

On a vue que l’atome de Carbone a la possibilité de fomer 4 liaisons chimiques. Le Silicium qui se trouve juste au-dessous du Carbone dans le tableau périodique a lui aussi 4 possibilités de liaisons. Pourquoi ne pourrait-il pas s’unir à d’autres éléments et former 4 chaines de liaison comme le fait le Carbone et donner naissance à une vie basée sur le Silicium?

Le Silicum a quelques inconvénients par rapport au Carbone. Il s’unit à l’Oxygène avec beaucoup plus de force qu’avec les autres éléments. Il a en quelques sortes une préférence pour l’Oxygène. D’ailleurs tout le Silicium qu’on trouve sur Terre est saturé par l’oxygène et se trouve sous forme de silicates (SiO2). On peut alors argumenter qu’il pourrait exister quelque part dans l’Univers une planète contenant du Silicium, mais pas d’Oxygène. Sur une telle planète la formation de silicates serait impossible, et ça pourrait alors donner naissance à des molécules à base de Silicium possédant des liaisons énergétiques similaires avec d’autres éléments, comme le fait le Carbone. Néanmoins on sait que les éléments chimiques comme le Silicium et l’Oxygène se forme à l’intérieur des étoiles suite à des fusions nucléaires. L’explosion d’une étoile en supernova libère ces éléments dans l’espace. Hors l’Oxygène se forme de façon beaucoup plus abondante que le Silicium, dans l’Univers il existerait 9 fois plus d’atome d’oxygène que de Silicium. L’Hydrogène est l’élément chimique le plus abondant dans l’Univers, ensuite l’Hélium, puis l’Oxygène et en 4ème position vient le Carbone, lui aussi bien plus abondant que le Silicium. (L’Hydrogène est très abondant dans l’Univers mais il est aussi très léger, la Terre n’a pas la force de gravitation suffisante pour le maintenir à l’état gazeux, il se trouve principalement attrapé dans des molécules d’eau – H20).

Supposons tout de même que le Silicium se trouve dans un environnement qui lui permette de former des molécules possédant d’autres chaines chimiques que celles qu’on pourrait créer avec l’Oxygène qui serait absent de cet environnement. On sait que l’eau liquide est un milieu indispensable pour favoriser la rencontre, l’organisation et le métabolisme de ces molécules. Hors dans le cas du Silicium, l’eau décomposerait très rapidement les chaînes moléculaires du Silicium, au lieu de les organiser comme elle le fait avec celles de Carbone. Le Silicium s’unirait alors rapidemment à l’Oxygène de l’eau pour former à nouveau des silicates. Il faudrait pouvoir imaginer un liquide nouveau qui serait capable de favoriser l’organisation des molécules de Silicium au lieu de les décomposer. A ce jour, on ne connaît aucun liquide susceptible d’avoir ces propriétés vis-à-vis du Silicium. Il semble donc très peu probable que la vie spontanée puisse apparaître ou avoir apparu à partir du Silicium.

Sources:

http://cienciaes.com/entrevistas/2011/02/08/vida-basada-en-el-silicio-laborda/

VN:F [1.9.17_1161]
Rating: 4.0/5 (1 vote cast)
Tagged with:  

Les planètes habitables

On 02.11.2011, in Dossiers, by Mathieu
VN:F [1.9.17_1161]
Rating: 3.5/5 (4 votes cast)

Qu’est-ce qu’une planète habitable et quelles sont les conditions qui doivent être réunies pour que la vie puisse y apparaître?

Zone habitable

  • En astronomie, on définit la zone habitable comme une région de l’espace où les conditions sont favorables à l’apparition de la vie.
  • Il ne s’agit pas d’une zone où l’on peut habiter, mais plutôt d’une zone propice à la vie.
  • Pour espérer trouver de la vie ailleurs que sur Terre, il faut qu’on ait de l’eau liquide et de la matière organique. La vie peut difficilement s’imaginer sans carbone, et généralement en solution dans l’eau liquide.
  • Pour les physicens, la question ne se pose donc pas en où peut-on trouver la vie, mais plutôt où peut-on trouver de l’eau liquide.
  • Dans le système solaire on trouve de l’eau (H20) un peu partout (sur Mars, sur des satellites de planètes géantes…). La molécule d’eau H2O est très abondante dans l’Univers, mais généralement sous forme de glace ou de vapeur d’eau, très rarement à l’état liquide.
  • Le problème n’est donc pas de détrminer où il y a de l’eau, mais où se trouvent les conditions nécessaires de température et de pression pour avoir de l’eau liquide à la surface d’une planète avec une atmosphère.
Zone habitable du système solaire

 

Distance par rapport à l’étoile

Pour avoir de l’eau liquide à la surface d’une planète, il faut prendre en considération la distance de la planète à son étoile (soleil):

  • Si la planète est trop proche de son étoile ou du Soleil, il va faire trop chaud, la température sera trop élevée, au-delà du point d’ébullition de l’eau (100°C  à la pression sur Terre). L’eau ne se présentera pas sous forme liquide, mais sous forme gazeuse, sous forme de vapeur d’eau.
    • Si on rapproche seulement de 5% la Terre du Soleil, les simulations informatiques montrent que l’augmentation du rayonnement solaire engendrerait une instabilité du climat.
    • Les océans vont chauffer, donc plus de vapeur d’eau va s’évaporer, et la vapeur d’eau est un gaz à effet de serre, qui aura pour conséquence de réchauffer à son tour la surface de la planète, engendrant ainsi un emballement amenant à la mise en ébullition des océans.
    • Un autre effet additionnel a aussi lieu. Des molécules d’eau évaporées vont aussi monter jusqu’à la très haute atomsphère, actuellement très sèche et quasi sans vapeur d’eau. Les molécules de vapeur d’eau présentes dans la haute atmosphère vont alors en quelques sortes être attaquées par le rayonnement utlra-violet qui va casser (photodissocier) les molécules d’eau, et des atomes d’hydrogène vont se libérer. L’hydrogène est un gaz extrêmement léger (1 proton-1 électron), il va donc pouvoir être éjecter dans l’espace et s’échapper de la planète Terre. L’effet climatique de condensation (pluie) après l’évaporation n’a donc plus lieu pour ces molécules dont l’hydrogène est expulsé. La conséquence de ce phénomène serait la disparition des océans en seulement quelques millions d’années (ce qui est très faible à l’échelle de l’âge de la Terre de 4,6 milliards d’années).
  • Inversement, si la planète est trop éloignée de son étoile ou du Soleil, il va faire trop froid et l’eau sera présente sous forme de glace.
    • Si on éloigne la Terre du Soleil de seulement 10%, on se rend compte que le climat devient aussi instable.
    • En effet, s’il fait plus froid, il y aura alors plus de neige et de glace. Hors la neige et la glace réfléchissent le rayonnement solaire beaucoup mieux que le sol nu. La chaleur réfléchie n’est alors plus absorbée par le sol et se perd. Et plus il fait froid, plus il va y avoir de la neige et moins la chaleur du rayonnement solaire sera retenue, ce qui engendre un emballement amenant au gel des océans.
  • Cependant s’il fait trop froid sur Terre et que tout est gelé, il n’en reste pas moins présentes une activité volcanique qui crache du gaz carbonique et la tectonique des plaques est aussi toujours active. Le gaz carbonique ne va plus pouvoir être recyclé par les océans (pour former des carbonates) qui sont gelés et il va alors s’accumuler dans l’atmosphère et créer un effet de serre qui va compenser le refroidissement du à l’éloigement du Soleil. L’effet de serre va réchauffer la planète, et l’eau liquide pourrait alors réapparaître, qui va à son tour pouvoir reconsommer le gaz carbonique, et engendrer une nouvelle stabilisation du climat. Ce phénomène s’appelle le paradoxe du Soleil faible (Il y a plusieurs milliards d’années, le Soleil brillait plus faiblement et pourtant la Terre n’était pas couverte de glace mais d’eau liquide).

Les exoplanètes

Les exoplanètes sont des planètes extrasolaires orbitant autour d’une étoile autre que le Soleil.

  • La tout première exoplanète a été découverte en 1995, et actuellement on en aurait détectées près de 700, et on en découvre une centaine par an ces dernières années.
  • Certaines peuvent être observées depuis des instruments au sol, comme des téléscopes au sol. Cependant l’atmosphère terrestre joue le rôle de filtre à radiation, et nous empêche de lire dans certaines longeurs d’onde. Pour déterminer la constitution de l’exoplanète, on les observe plutôt depuis des téléscopes spatiaux mis en satellite, comme celui de la mission Kepler. Ces observations depuis l’espace permettent d’analyser toutes les radiations lumineuses émises par l’exoplanète et nous informe sur sa nature et sa composition.
  • On distingue généralement 2 grandes familles de planètes:
    • planètes telluriques
      • constituées de roche et métal.
      • densité élevée.
      • petite dimension.
    • planètes gazeuses
      • consituées principalement d’hydrogène et d’hélium.
      • faible densité.
      • grande dimension.
  • Dans le cas de grosses étoiles, la distance de l’exoplanète à son étoile devra être évidemment plus grande pour retrouver une zone habitable. Cependant la zone habitable doit aussi durer dans le temps (la Terre s’est formé il y a 4,5 milliards d’années, on pense que la vie est apparue il y a 3,5 milliards d’années, les organismes multicellulaires eux sont apparu il y a 1,4 milliards d’années, et les premiers animaux il y a 500-600 millions d’années ). Il faut donc du temps pour que la vie apparaisse dans une zone habitable. Hors les grosses étoiles plus massives que le Soleil évoluent plus vite et ont par conséquent une durée de vie plus courte (elle consomment beaucoup de combustibe – hydrogène, hélium – pour finalement exploser et se transformer en supernova). La courte durée de vie des étoiles massives n’est donc pas propice à une zone habitable durable.
  • 80% des étoiles au voisinage de notre galaxie sont des petites étoiles, plus petites que le Soleil. Elles ont les avantages de peu évoluer et d’avoir une durée de vie très longue, ça peut être de l’ordre de la durée de vie de l’Univers. Autour des petites étoiles, la zone habitable doit être plus proche de celles-ci, ce qui pose quelques problèmes. Ces petites étoiles sont stables à long terme (consomment peu d’hydrogène et n’explosent pas en supernova), mais pas à court terme (des éruptions solaires ont fréquemment lieu, des crachats de rayonnement ultraviolet). On voit qu’une trop grande proximité de la planète à son étoile peut aussi amener une instabilité peu propice à une zone habitable durable. Si ces éruptions solaires et rayonnements terminent au fond des océans, c’est pas grave car la sensibilité au rayonnement est moindre, mais sur les continents ça peut être problématique pour l’apparition de la vie.
  • Un autre problème est lié au fait qu’il y a de fortes chances que l’exoplanète ne montre qu’une face à son étoile (un peu comme la lune), les océans pourraient alors s’accumuler côté nuit (face cachée) et former une grande calotte glacière et que le côté jour (face visible) soit totalement aride, ce qui n’est non plus pas propice à un climat stable. Le gaz carbonique de l’atmosphère pourrait ainsi geler et se transformer en glace carbonique qui pourrait entraîner l’effondrement de l’atmosphère.
distribution-decouverte-exoplanete

 

L’exoplanète Gliese 581 c

On parle beaucoup de l’exoplanète Gliese 581 c, une planète semblable à la Terre et sois-disant habitable.

  • Il s’agit de l’une de six exoplanètes détectées en orbite autour de l’étoile Gliese 581.
  • Cette exoplanète est une sorte de super-Terre, d’environ 5 fois la masse terrestre (ça pourrait correspondre à une planète 1,5 fois plus grosse que la Terre), assez proche de son étoile.
  • On évalué la température à la surface de Gliese 581 de l’ordre de 40°C, ce qui pourrait laisser la place à la présence d’eau liquide et d’océans.
  • Mais l’océan à 40°C est chaud et s’évapore beaucoup plus, donc plus de vapeur d’eau dans l’atmosphère génère un effet de serre accru.
Comparaison Gliese581c - Terre

Le système stellaire

Notre Système solaire s’est formé il y a 4,6 milliards d’années d’un nuage de gaz et de poussières ayant subi l’onde de choc de l’explosion d’une supernovae proche. Cette onde de choc provoqua l‘agglomération de particules de poussières du nuage en des grains solides, qui à leur tour s’assemblèrent en des agrégats de plus en plus gros, engendrant au final les objets du Système solaire comme les planètes, comètes, astéroïdes et lunes. Mais on sait que notre Système solaire est aussi atypique:

  • Il existerait beaucoup plus de systèmes stellaire basé sur des étoiles naines, bien plus petites que le Soleil. Il est aussi très difficile de détecter des exoplanètes jumelles à la Terre possédant une étoile similaire à notre Soleil, par contre il est beaucoup plus facile de détecter des exoplanètes cousines tournant autour d’une étoile naine.
  • On voit très souvent dans ces systèmes stellaires que des planètes géantes, qui se sont formées relativent loin de leur étoile, ont pu migrer et s’approcher de leur soleil. Ce phénomène de migration peut amener la planète hors de la zone habitable. Cependant, lorsqu’une planète géante migre, elle laisse dans son sillage des traces. Elle peut alors provoquer l’apparition d’autres petites planètes, dont certaines pourraient être plus aptes à l’habitabilité.
  • On a aussi découvert que des planètes géantes (boules de gaz) se trouvent dans la zone habitable. Et autour de ces planètes géantes, il y a des satellites qui pourraient aussi être candidats pour héberger des océans.

La vie sur Mars

Dans le cadre de la mission Rover lancée en 2003, deux robots autonomes (Spirit et Opportunity) ont été envoyés sur Mars, afin d‘explorer la géologie de la planète. Ces robots avaient pour objectifs d’analyser les sols afin de détecter des roches sédimentaires (comme des argiles) qui témoigneraient de la présence d’eau.

Dans les conditions régnant actuellement sur Mars la présence d’eau liquide à la surface de la planète est impossible en raison de la faible température (en moyenne de -50 °C contre +14 °C sur Terre) et de la pression atmosphérique (6 hPa contre 1 013 hPa sur Terre). L’eau est présente uniquement sous forme de glace (dans le sous-sol, près des pôles) et aussi un tout petit peu sous forme gazeuse de vapeur d’eau (très faiblement présente dans l’atmosphère martienne, 0,03 % pour 95,3 % de CO2, et des traces d’azote et d’argon). Plusieurs indices semblent montrer que l’eau a occupé dans le passé de manière permanente le sol martien, des formes géologiques datant de 3,8 milliards d’années en témoignent. Cependant il n’y a pas de consensus sur quelle quantité d’eau était présente à la surface et durant combien de temps.

En avril 2009, le rover Spirit s’est immobilisé définitivement, ses roues se sont enfoncées dans une petite dune de sable et le rover n’est pas parvenu à se dégager. Après des tentatives infructueuses de la NASA pour le dégager de la dune, début 2010 on a renoncé définitevement à libérer Spirit. Le rover qui a parcouru depuis son atterrissage 7 730,5 mètres agit désormais en tant que station de mesure fixe.

L’équipement scientifique du rover Opportunity lui a dépassé de 6 ans la durée de fonctionnement pour laquelle il avait été construit. Il est aujourd’hui en partie hors service. Le spectromètre infrarouge qui l’équipait ne fonctionne plus depuis la tempête qui l’a frappé en 2007 et la capacité de détection de l’autre spectromètre Mössbauer est devenue très faible et le rend inutilisable.

Suite à cette première exploration géologique de la planète Mars, la prochaine étape sera de lancer une exploration chimique qui aura pour objectif de prélever des échantillons du sol martien et d’en séparer la composante minérale des molécules organiques. Un analyse des molécules organiques nous donnera probablement des informations sur la possibilité des synthétisation naturelle de ces molécules sur Mars et la possibilité d’engendrer de la vie.

Rover - Mars

La vie sur Europe, Titan et Encelade

Sur le satellite/lune Europe de Jupiter, il y a de l’eau sous forme de glace et dessous cette glace probablement un océan d’eau liquide avec des éventuelles réactions de synthèses chimiques très intéressantes. Il faudrait donc pouvoir y envoyer une mission qui aurait pour objectif premier de perforer les 10 km de glace et atteindre l’eau liquide et pouvoir ainsi y effectuer des analyses.

Satellite Europe

Le satellite/lune Titan de Saturne possède une atmosphère (méthane, azote) qui est une vraie usine à réaction chimique prébiotique qui potentiellement permetterait de former les composants chimiques indispensables à la vie (comme des sucres, des acides aminés, des bases azotées…). Cependant Titan ne possèderait pas d’eau liquide, il y fait beaucoup trop froid, par contre il possède un lac et des rivières de méthane liquide. Néanmoins malgré l’absence d’eau liquide (en tout cas en surface), Titan reste un bon laboratoire pour analyser l’évolution chimique naturelle sans eau liquide.

Sur Encelade, un autre satellite/lune de Saturne, on a découvert récemment qu’il neige. Un geyser, situé sur son pôle Sud, y éjecte beaucoup d’eau, et une partie de cette eau retombe à la surface sous forme de neige.

Détection et caractérisation des exoplanètes

Actuellement, les chercheurs auraient détecté plus de 700 exoplanètes. Cependant la détection ne suffit pas, il faut aller plus loin et aussi pouvoir caractériser et identifier les propriétés de ces exoplanètes:

  • son orbite, son cycle et la distance à son étoile.
  • son transit, son éclipse ou ombre de passage périodique devant/derrière son étoile. On peut le mesurer en détectant des baisses de luminosité dans la courbe de lumière de l’étoile dû au passage de la planète.
  • son diamètre, sa masse et sa densité (exoplanète tellurique ou gazeuse).
  • sa consitution (roche, glace ou océan).
  • la composition de son atmosphère (oxygène, ozone, méthane…).

Le méthane présent dans l’atmosphère d’une planète peut être un bon indicateur ou signature de la présence de vie, car les bactéries émettent du méthane, sur Terre les ruminants aussi, l’activité volcanique émet aussi du méthane.

Conclusion

Pour clore le dossier, on peut avoir deux approches à la possibilité de vie extraterrestre:

  • L’approche optimiste: on pense que dans l’Univers il y a mille millards d’étoiles. Si une étoile sur deux a des planètes, ça nous amène à une nombre invraisemblable de planètes. Par conséquent, très nombreuses sont celles qui peuvent potentiellement se situer dans la zone habitable. Et tout indique aussi qu’il peut exister beaucoup d’exoplanètes telluriques de type et taille de la Terre, et à bonne distance de leur étoile.
  • L’approche pessimiste: la Terre s’est crée grâce à des circonstances extrêmement favorables. D’ailleurs quand on regarde toutes les conditions qui ont dû être réunies pour voir apparaître de l’eau su la Terre, on voit qu’on a eu pas mal de chance.
    • La terre a une taille suffisante pour pouvoir retenir son atmosphère qui peut ainsi exercer un pression à sa surface nécessaire à la présence d’eau liquide
    • Recyclage de l’atmosphère par la tectonique des plaques qui maintient l’effet de serre au bon niveau.
    • Protection de l’atmosphère par le champs magnétique terrestre qui joue le rôle de bouclier contre des rayons cosmiques mortels pour la vie.
    • L’obliquité de la planète a aussi un rôle important à jouer pour l’habitabilité. La Terre (comme Mars) est inclinée sur un axe d’environ 20° qui est stable et constant grâce à la présence de la masse de la Lune (alors que celle de Mars varie de façon cahotique). Cette obliquité constante de la Terre permet de stabiliser le climat et l’alternance des saisons. Beaucoup d’exoplanètes ont une obliquité nulle, elles n’ont alors plus de saison et des pôles extrêment froids, qui peut amener la perte de l’atmosphère et de l’eau à ses pôles.
    • Cycle jour-nuit de 24 heures relativement court qui permet de ne pas trop réchauffer la surface de la Terre. Il faut savoir que la Lune a des journées et nuits de 2 semaines (14 jours), la température de plus de 100°C à la mi-journée (7 jours) y est alors bien plus élevée que celle de la Terre.

Sources:

http://www.cieletespaceradio.fr/qu_est_ce_qu_une_planete_habitable__.311.UNIV_001 http://www.cieletespaceradio.fr/la_vie_a_t_elle_pu_apparaitre_ailleurs_que_sur_terre__.661.SYST_001 http://www.cieletespaceradio.fr/planetes_habitables__la_nouvelle_donne.758.ESPA_001 http://www.cieletespaceradio.fr/exoplanetes__le_bon_grain_et_l_ivraie.746.ESPA_001 http://media.radiofrance-podcast.net/podcast09/10212-10.10.2011-ITEMA_20314103-0.mp3

VN:F [1.9.17_1161]
Rating: 3.5/5 (4 votes cast)
Tagged with:  

Dossier – Le langage chez l’humain

On 05.10.2011, in Dossiers, by Mathieu
VN:F [1.9.17_1161]
Rating: 3.0/5 (2 votes cast)

Traiter du langage chez l’humain est un vaste chantier, car on se trouve au carrefour de plusieurs disciplines, sciences sociales, biologie, neurosciences, anthropologie, communication, culture…nous allons dans ce dossier tenter d’aborder sous différents angles plusieurs aspects du langage chez l’humain.

langage

Histoire des langues

C’est l’Homo habilis, il y a plus de deux millions d’années, qui pourrait être le plus ancien préhumain à avoir employé un langage articuléOn suppose aussi la préexistence d’une proto-langue chantée chez l’homme de Néandertal, qui, au niveau de connaissance actuelle, ne possédait pas de syntaxe. L’apparition il y a 200 000 ans de l’Homo sapiens a été accompagné de la conjonction de nombreux facteurs pour expliquer l’apparition du langage chez l’homme:

  • la maitrise du feu (environ 500 000 ans avant notre ère) qui a permis d’alimenter un cerveau de taille croissante;
  • l’augmentation de la masse de l’encéphale;
  • le redressement du pharynx qui a permis la vocalisation plus poussée de la parole.
  • la mutation d’un gène dit de la parole.
Les recherches récentes en paléo-linguistique ont identifié un fond de 27 mots communs à la racine de toutes les langues terrestres écrites au début du XXIème siècle, ce qui renforce le scénario « Out of Africa » (monogenèse), selon lequel l’ancêtre de nos langues serait sorti d’Afrique. En effet, si des sources et des orgines distinctes avaient donné naissance à nos différentes langues actuelles, elles n’auraient pas eu de raison d’adopter toutes par hasard la même proto-langue de départ basé sur ces 27 mots.

 

Evolution de l'homme

 

 

Evolution de l'homme

 

Le langage a pris depuis environ 7 000 ans une forme écrite dans un certain nombre de langues qui se sont alors imposées comme les langues dominantes.

Une étude comparée des langues nous enseigne par exemple que bien que d’apparence très proches (par l’écriture et le lexique), deux langues comme l’arabe et le persan n’ont aucun lien de parenté. D’ailleurs le persan appartient à la même grande famille que le français ou encore, plus lointainement, l’islandais. Parmi les principales familles de langues, on peut citer les langues indo-européennesafro-asiatiquessino-tibétainesnigéro-congolaises ou encore austronésiennes.

La diversité linguistique

Un article sur le blog Science étonnante (un blog que je recommande à tous nos poditeurs qui propose d’excellents articles de vulgarisation scientifique sur des thèmes aussi originaux et que surprenants) nous en apprend un peu plus sur le processus qui a engendré la diversité linguistique. On sait que l’Homo Sapiens a émigré d’Afrique il y a environ 60’000 ans. Parmi les nombreux éléments à l’appui de cette thèse, il y a le fait que la diversité génétique des populations décroît à mesure que l’on s’éloigne d’Afrique, c’est ce qu’on appelle l’effet fondateur en série. On a montré aussi qu’il en va de même pour la diversité des langues parlées dans le monde. Les langues africaines sont ainsi phonétiquement bien plus riches que les langues européennes.

L’effet fondateur est un phénomène qui explique pourquoi les migrations géographiques s’accompagnent d’une perte de diversité génétique. Quand une migration se produit à partir d’une population, elle est souvent le fait d’un petit nombre de pionniers, qui emportent avec eux seulement une faible fraction de la diversité génétique de leur population d’origine. Une fois établis, ils se reproduisent entre eux, et la nouvelle population qu’ils vont ainsi engendrer sera moins variée génétiquement que celle de départ. Et lorsque des migrations ont lieu les unes à la suite des autres, on parle d‘effet fondateur en série. Dans ce cas, la diversité génétique des populations décroît au fur et à mesure des migrations successives. Ce scénario amène donc une perte de diversité génétique des populations actuelles à mesure que l’on s’éloigne de l’Afrique. Cette décroissance de la diversité expliquerait aussi l’incompatibilité du scénario qui autoriserait l’apparition d’homo sapiens à un autre endroit que l’Afrique.

Effet fondateur en serie

Une analyse similaire à celle portée sur la diversité génétique s’est intéressée à la diversité phonémique des langages, en utilisant le World Atlas of Language Structure. Le nombre de phonèmes différents est un indicateur de la diversité du langage. En analysant 504 langages du WALS, on a pu montrer que la diversité phonémique des langages décroît quand on s’éloigne d’Afrique. La corrélation avec la diversité du génôme est bien là, mais moins évidente aussi car d’autres facteurs sont aussi responsable de la diversité phonémique d’un langage, comme la taille de la population qui le pratique.

Une manière intéressante de visualiser cet effet, c’est de regarder ces types de phonèmes qu’on appelle les tons. Dans certaines langues, dites langues à tons, la hauteur (au sens musical « aigu/grave ») d’un son peut influer sur le sens qu’on donne au mot. C’est difficile à imaginer pour nous-autres francophones, puisque le français n’est pas une langue à tons, mais beaucoup de langues extra-européennes sont tonales. Dans la carte ci-dessous, on constate qu’une plus grande diversité des langues tonales se trouve en Afrique, ce qui renforce le scénario que l’ancêtre de nos langues est sorti d’Afrique.

Diversité de ton

Le langage comme technologie sociale

Dans une conférence TED, le biologiste Mark Pagel propose une théorie pour expliquer comment est apparu le langage chez les hommes et comment il a évolué et s’est complexifié au fil du temps. Il suggère que le langage est une pièce de technologie sociale qui a permis aux premiers hommes vivant en tribu d’accéder un nouvel outil très puissant: la cooperation.

Il y a 200’000 ans avant notre ère, vivait le Néandertal qui était un artisan de la pierre. L’homme de Néanderthal travaillait et utilisait la pierre pour toute sorte de fonctions (casser, râcler, tailler, couper…). Les hommes de cette époque apprenaient à fabriquer toute sorte d’outils à base de pierre simplement en observant et reproduisant les techniques appliquées par leurs congénères et leurs pairs. Un apprentissage réciproque s’est mis en place. Cette époque marque le début de l’apprentissage basé sur des relations sociales de partage et coopération (social learning).

Pierre Néanderthal

Au fil du temps, les populations se sont adaptées cultuellement à cette forme d’apprentissage social basée sur l’imitation et la copie, et le problème du vol visuel (visual theft) s’est posé:

  • En regardant comment travaillent les autres on peut voler leurs idées!
  • Le social learning a induit en quelque sorte le vol visuel.
Pour résoudre ce dilemme entre le progrès qu’apporte le social learning et le risque que suppose le vol visuel, deux options se sont posées:
  • Option 1: Revenir à de petits groupes familiaux, petites tribus ou communautés dans lesquelles on va préserver une pratique sans la divulguer à l’extérieur afin d’en faire bénéficier ceux du groupe. Mais se replier sur sois-même pour éviter le vol visuel et revivre comme nos ancètres ne nous aurait pas permis d’évoluer tel qu’on l’a fait, on serait toujours en train de vivre comme les Néanderthals. Dans les petits groupes, il y a moins d’idées, moins d’innovation…les petits groupes sont aussi plus sensibles aux accidents avec le risque qu’une pratique puisse disparaître.
  • Option 2: Développer un système de communication afin de pouvoir mieux partager nos idées et ainsi mieux coopérer. Un système de communication qui permetterait que cette énorme ferme de connaissance accumulée depuis la nuit des temps devienne accessible à tous. C’est cette option que l’humanité a choisie et qui a donné naissance au langage.

Le langage est une pièce de la technologie sociale qui améliore les possibilités de coopération et qui permet de prévenir le vol visuel:

  • Le langage permet d’établir un accord ou une négociation afin de protégéer les intérêts de l’un ou de l’autre.
  • Le langage permet de mieux coordoner les activités.

Le langage a amené un explosion de créativité et prospérité. L’apprentissage social accompagné du langage nous a permis de transformer l’environnement pour qu’il satisfasse à nos besoins. Cependant on constate qu’il existe tout de même entre 7000-8000 langues sur la terre. On pourrait penser que c’est naturel que la diversité des langages correspond à la divergence des populations sur terre. Mais la plus grande diversité de langage sur terre provient de populations très concentrées. Par exemple, rien que la Papouasie-Nouvelle Guinée possède près de mille langues différentes. Mark Pagel, le biologiste qui soutient cette théorie du langage comme pièce de technologie sociale nous avertit que, selon lui, plusieurs langues sont une barrière à l’échange d’idées, de coopération…Pour conserver la prospérité du monde moderne, il faut se poser la question radicale de la standarisation linguistique, l’idée qui dirait que notre destinée est celle d’un seul monde avec une seule langue!!

Je ne sais pas si Mark Pagel est favorable à ce que tout le monde parle l’esperanto, mais à mon avis la diversité et le métissage au sens général et linguistique engendrent évidemment plus de prospérité et de richesse que l’uniformisation…j’en profite pour rappeler la quote de Walter Lippmann que j’avais évoquée dans l’épisode 21 de podcastscience: ”Quand tous les hommes pensent pareil, plus personne ne pense beaucoup” – “When all men think alike, no one thinks very much”.

Cerveau et langage

Dans une des émissions Sur les épaules de Darwin, Jean-Claude Ameisen nous donne quelques pistes sur la relation entre la structure du cerveau et le langage. On y apprend qu’en 1861, Paul Broca identifia une aire cérébrale dans l’hémisphère gauche du cerveau indispensable au langage parlé. Une lésion dans cette aire, appelée aire de Broca, fait perdre la capacité de parler. Puis quelques années plus tard, Carl Wernicke identifie dans le même hémisphère gauche une autre aire indispensable elle à la compréhension du langage oral, c’est l’aire de Wernicke. Une lésion dans cette aire de Wernicke fait perdre la capacité de comprendre le langage parlé. En 1887, le neurologue français Jules Dejerine identifie toujours dans le même hémisphère gauche une aire indispensable à la lecture des lettres et des mots. Un lésion de cette aire fait perdre la capacité de lire, une personne ayant cette lésion peut continuer de parler, de comprendre le langage oral, peut même continuer à être capable d’écrire correctement, mais ne peut plus lire, y compris ce qu’elle écrit elle-même. Un siècle après les découvertes de Broca, Wernicke et Dejerine, l’imagerie fonctionnelle cérébrale qui permet l’étude en temps réelle des activités du cerveau confirmera l’activation de ces différents régions de l’hémisphère gauche induite par la prononciation d’un mot, l’écoute d’un mot ou la lecture d’un mot. Néanmoins dés 1869, quelques années après la découvert de Broca, il y a eu des débats concernant l’interprétation du rôle précis de ces aires. Le neurologue anglais John Jackson dira à Broca que localiser une lésion qui détruit la parole n’est pas la même chose que localiser la parole dans le cerveau, et 20 ans plus tard Freud souligera aussi que ces aires sont l’un des éléments indispensables à un vaste réseau cérébral impliqué dans la parole et la lecture.

Aire de Broca

Il semblerait aussi qu’une mutation génétique de plusieurs gènes dominants dont le gène FOXP2 aient joué un rôle dans le développement de la capacité cognitive liée à la parole. Ce gène FOXP2 prend des formes variables selon les espèces, et dans la forme humaine, il aurait donné la capacité pour l’homme de passer des mots à la syntaxe. On sait que la substitution d’un seul des 715 acides aminés du gène FOXP2 entraîne de sérieuses pathologies affectant la phonation et, plus généralement, la forme du larynx. La mutation de ce gène FOXP2 intervenue chez l’Homo sapiens il y a cent à deux cent mille ans a donc certainement dû être déterminante dans l’apparition de la parole chez l’homme.

Ces gènes seraient aussi à l’origine de la maturation de l’aire de Broca et de l’aire de Wernicke dans le cerveau.

L’aphasie

L’aphasie, parfois appelée mutisme, est la perte de la capacité de parler. On parle d’aphasie quand un individu a perdu totalement ou partiellement la capacité de communiquer par le langage, c’est-à-dire de parler et/ou de comprendre ce qu’on lui dit.

Aphasie

La plupart des personnes aphasiques n’ont pas perdu complètement l’usage de la parole. L’aphasie est, plus précisément, un trouble du langage qui peut présenter des différences considérables : certains patients ne montrent que des incertitudes légères, pour trouver leurs mots par exemple, alors que d’autres ont presque totalement perdu la faculté de s’exprimer par le langage, de comprendre ce qu’on leur dit, de lire et/ou d’écrire, alors que d’autres facultés, comme la mémoire ou l’orientation, sont préservées. Il existe plusieurs sortes d’aphasie dans lesquelles ces diverses facultés peuvent être différemment diminuées. Les orthophonistes (spécialistes du langage) font une différence entre l’articulation, la parole et le langage: si un individu éprouve des difficultés pour prononcer des sons (quelle que soit leur place dans le mot) on dira qu’il a un trouble de l’articulation ; s’il éprouve des difficultés à combiner les sons pour faire des mots (ajouts, substitutions, altérations, omissions de sons en fonction de leur place dans le mot), il s’agira d’un trouble de la parole; s’il éprouve des difficultés à choisir ses mots, à les combiner pour faire des phrases ou même à comprendre leur sens, on dira plutôt qu’il a un problème de langage. L’aphasie est un trouble du langage acquis, c’est-à-dire qu’elle survient chez un individu qui avait auparavant un langage normal et se distingue donc des problèmes pouvant apparaître lors du développement du langage chez l’enfant (par exemple, une dyslexie développementale ou un bégaiement).

On a vu que l’hémisphère gauche pour les droitiers est responsable du langage (expression, compréhension, lecture et écriture), sauf pour certaines langues orientales, qui ont un autre mode de fonctionnement (chinois, japonais), et ceci étant dû au système de représentation graphique de la langue qui s’appuie plus sur une idée (idéogramme) que sur un fonctionnement du type un signe égale un phonéme. Plus spécifiquement, dans environ 90 à 95 % des cas de troubles du langage post-lésionnels (aphasies), le dommage est localisé dans l’hémisphère cérébral gauche. Les atteintes de l’hémisphère droit sont responsables des 5 à 10 % restants des cas d’aphasie.

Ceux qui utilisent le langage gestuel peuvent aussi présenter une aphasie à la suite d’une atteinte cérébrale: il existe le cas d’un jeune homme qui avait été élevé par des parents sourds-muets, et qui était devenu aphasique à la suite d’un accident. Avant l’accident, il communiquait aussi bien par langage par signes que par le langage parlé. Après l’accident, il éprouvait des troubles tout aussi graves dans son langage parlé que dans son langage gestuel.

Les individus aphasiques bilingues ou polyglottes présentent généralement des atteintes dans toutes les langues qu’ils parlent: On peut se poser la question si des lésions cérébrales produisent-elles des dommages similaires dans toutes les langues? Des langues très différentes utilisent-elles les mêmes systèmes neuronaux? Dans la forme la plus courante d’aphasie, présentée par presque la moitié des cas de sujets bilingues, les deux langues sont affectées de façon analogue, et la récupération est la même dans les deux cas.

L’influence du langage sur la perception des couleurs

Un documentaire de la BBC nous explique comment la perception des couleurs est influencée par le langage utilisé pour définir les couleurs. On y apprend que des chercheurs ont comparé notre vocabulaire habituel utilisé pour catégoriser les couleurs (rouge, bleu, vert, jaune, etc…) avec celui employé par la tribu africaine Himba vivant au nord de la Namibie. Les Himbas classent les couleurs d’une autre façon que nous: ils utilisent le mot “zoozu” pour les couleurs foncées correspondant au rouge, vert, bleu et pourpre, le mot “vapa” pour le blanc et certains types de jaune, le mot “borou” pour certaines teintes de vert et de bleu, ou encore le mot “dumbu” pour des teintes de vert, rouge et brun…On voit que linguistiquement, ils réunissent sous un même mot des couleurs pour lesquelles on a des mots différents, et ils différencient verbalement en plusieurs couleurs, une couleur qui pour nous est unique.

Les Himbas décrivent les couleurs différemment, mais les percoivent-ils de la même manière que nous? On a réalisé une expérience dans laquelle on présente à un sujet de la tribu Himba plusieurs carrés colorés, tous sont de la même couleur sauf un, et on demande au sujet de déterminer quel est celui de couleur différente. Si on présente 12 carrés colorés en vert, dont un seul d’entre eux est un vert teinté un peu différents des 11 autres, pour le sujet Himba c’est très facile de déterminer lequel est différent des autres car ils utilisent des mots différents pour ces deux variantes de vert, alors que pour nous c’est plus difficile, car la différence de teinte dans le vert est très légère. Si par contre on présente une série de carrés colorés en vert dont seulement l’un d’entre eux est bleu, de telle façon que le vert et le bleu utilisés soient définis par le même mot dans la langue des Himbas, c’est très difficile pour les Himbas de détecter lequel des carrés est bleu parmi les verts, alors que pour nous qui utilisons des mots différents pour le vert et le bleu c’est très facile de trouver l’intru.

On peut conclure suite à cette expérience que la perception des couleurs dans notre cerveau peut être modulée par notre langage et que les Himbas perçoivent donc le monde d’une manière bien différente de la nôtre.

La linguistique et psycholinguistique

Wikipedia nous dit que la linguistique désigne l’étude du langage humain. La linguistique théorique est souvent divisée en domaines séparés et plus ou moins indépendants:

  • phonétique : étude des différents sons produits par l’appareil phonatoire humain ;
  • phonologie : étude des éléments d’articulation de deuxième niveau, ou phonèmes, d’une langue donnée ;
    • Les phonèmes sont en gros les sons élémentaires associés à une langue, ceux que l’on représente à l’aide de l’alphabet phonétique (voyelles + consonnes + combinaisons). Il y a en général plus de phonèmes que de lettres, puisque certaines lettres peuvent se prononcer de plusieurs manières différentes, et que certaines combinaisons de lettres peuvent donner des phonèmes nouveaux (par exemple « ch »). On en compte plus ou moins 36 en français, mais beaucoup plus dans certaines langues.
  • morphologie : étude de la structure interne des mots ;
  • syntaxe : étude des rapports entre unités lexicales dont la combinaison forme des phrases ;
  • sémantique : étude du sens des mots et des énoncés ;
    • Dans les hiéroglyphes, les pictogrammes, les idéogrammes, l’image du mot donne son sens, mais rien dans le mot n’indique comment il se prononce. Si on a appris le code visuel du mot, on peut comprendre une même écriture quelque soit sa langue orale. En Chine les 50’000 idéogrammes distincts, 4000-5000 en usage courant, se lisent et se comprennent dans toutes les provinces dont les langues orales sont différentes et incompréhensibles à ceux qui ne les ont pas apprises.
  • stylistique : étude du style d’un énoncé littéraire ;
  • pragmatique : étude de l’utilisation (littérale, figurée ou autre) des énoncés. Elle s’intéresse aux éléments du langage dont la signification ne peut être comprise qu’en connaissant le contexte de leur emploi;

La psycholinguistique est l’étude des processus cognitifs mis en œuvre dans le traitement et la production du langage. Fondée dans les années 1950, la psycholinguistique fait appel à de nombreuses disciplines, telles la linguistique, la neurologie, la neurobiologie, la psychologie et les sciences cognitives. La psycholinguistique est donc interdisciplinaire par nature.

Les méthodes de recherche dans cette discipline se basent principalement sur des expériences comportementales ou de neuroimagerie:

  • Au moyen d’électrodes placées sur un sujet, on peut ainsi déduire que l’activité cérébrale sémantique chez un sujet sain précède l’activité syntaxique
  • Chez les patients ayant une aphasie, leur accès à l’information sémantique serait plus lent.

Faculté innée ou acquise?

Un des psycholinguistes les plus connus est Noam Chomsky. Chomsky pense que les humains ont une grammaire universelle innée:
  • Cette grammaire universelle contiendrait les règles grammaticales permettant de parler toutes les langues, c’est-à-dire des structures communes à toutes les langues, inhérentes à l’esprit humain et à l’apprentissage du langage chez l’enfant.
  • Les structures linguistiques seraient d’ores et déjà codées dans le cerveau. Les différentes “langues” parlées sur la planète ne seraient que des adaptations somme toute cosmétiques de ce langage cérébral fondamental.
  • Les enfants sont donc supposés avoir une connaissance innée de la grammaire élémentaire commune à tous les langages humains.
  • Les principes grammaticaux sous-tendant les langages sont donc innés et fixés.
  • D’ailleurs pour expliquer le fait que les enfants sont capables d’apprendre une langue qui a une grammaire complexe en un laps de temps relativement court, tout se passe comme si nous étions prédisposés à apprendre une grammaire qui comporte ce genre de règles
  • Cette grammaire formelle qu’il propose expliquerait aussi la productivité de la langue: avec un jeu réduit de règles de grammaire et un ensemble fini de termes, les humains peuvent produire un nombre infini de phrases. Il existe et il existera donc toujours des phrases qui n’ont jamais été dites.
  • Chomsky stipule donc que cette connaissance d’une grammaire universelle est déjà inscrite dans la structure de la faculté du langage.
Chomsky a fondé la linguistique générative:
  • Observation: On a constaté que les enfants commettent des erreurs caractéristiques quand ils apprennent leur première langue, tandis que d’autres types d’erreur apparemment logiques ne se produisent jamais. Ces erreurs d’apprentissage faites par un grand pourcentage d’enfants tendent à démontrer qu’il existe un processus de généralisation des règles inhérent à l’apprentissage (exemple : ils sontaient au lieu de ils étaient).
  • Interprétation: l’enfant n’apprend pas par mimétisme puisque l’erreur n’a pas été copiée d’un “professeur” mais produite par l’enfant lui-même.
  • Observation: la progression dans l’apprentissage semble être temporellement ordonnée. Les enfants commencent par analyser la structure prosodique (accents, intonations) vers 3 mois, puis la structure segmentale, suivie de la structure syllabique, le lexique et enfin, la syntaxe.
  • Interprétation: la faculté d’apprentissage du langage est structurée et dépend donc d’un système cognitif. De plus, le fait que cet ordre ne varie guère en fonction des enfants semble indiquer que ce système soit universel, c’est-à-dire que le mécanisme d’apprentissage n’est en général pas spécifique à une langue.

Selon la théorie générative de Chomsky, la faculté de langage est un processus cognitif. La faculté de langage est une capacité innée spécialisée de l’espèce humaine, qui permet l’acquisition du langage. Même si aucun enfant ne naît avec la capacité de parler directement, tous naissent avec la capacité d’acquisition du langage qui leur permet d’apprendre le langage rapidement dans leurs premières années. Il existerait par conséquent un module cognitif humain universel qui sert de base à la faculté de langage et pouvant expliquer la rapide acquisition de la langue maternelle, et ce, peu importe la langue.

A la théorie générative, développée par Chomsky, s’opposent d’autres théories sur l’apprentissage comme le béhaviorisme (comportementalisme).

  • Les béhavioristes (comportementalistes) donnent une part plus importante à la non-spécialisation des structures d’apprentissage et au rôle des stimuli externes, des imitations (cas des “enfants sauvages”).
  • Pour les béhavioristes, le langage est un ensemble d’habitudes conditionnées par le phénomène stimulus-réponse, permettant la mémorisation. Il en découle que toute action de la parole est soit un acte de répétition, soit une analogie.
  • Ils réfutent l’existence d’un dispositif d’acquisition innée du langage, stipulé par Chomsky.
Le point de vue de la grammaire universelle et la théorie générative postulée par Chomsky est aussi récusée notamment par le courant du connexionnisme:
  • Le connexionnisme ramène la langue à un cas particulier des processus généraux du cerveau.
  • Les connexionnistes modélisent les phénomènes mentaux ou comportementaux comme des processus émergents de réseaux d’unités simples interconnectées.
  • La forme des connexions et des unités peut varier selon les modèles.
    • Par exemple, les unités d’un réseau peuvent représenter des neurones et les connexions peuvent représenter des synapses.
    • Un autre type de modèle pourrait faire que chaque unité du réseau soit un mot et que chaque connexion soit un indicateur de la similarité sémantique.
  • Le plus souvent les connexionnistes modélisent ces phénomènes à l’aide de réseaux neuronaux.

Cependant comme on l’a vu, le gène FOXP2 et l’imagerie cérébrale (aire de Wernicke et aire de Broca) ont tout de même permis de mettre en avant, en tout cas en partie, la caractéristique innée du langage chez l’homme.

Acquisition du langage

bébé

L’acquisition du langage est une étape importante du développement de l’enfant qui se déroule généralement entre les âges de un et trois ans. Au cours du développement humain, le langage est précédé par des modes de communication non-verbaux (jeux d’imitations réciproques entre la mère et le bébé par exemple). Dès la naissance (déjà quelques minutes après la naissance) le bébé détecte si les personnes qui l’entourent sont en train d’interagir avec lui ou non. Si c’est le cas, le bébé répond et est stimulé par cette interaction : il s’agit alors de communication préverbale. Par la suite, cette communication non-verbale reste présente lors de la communication verbale : par exemple on discute en se comprenant d’autant mieux qu’on se regarde l’un l’autre. Les crises du nouveau-né ne sont pas encore du langage, il ne s’agit que d’expressions de malaise ou de souffrance sans intention de signification ou de communication. Mais s’ils n’ont pas de sens pour le bébé, son entourage va leur en donner un. Le bébé va alors pouvoir établir un lien dans son cerveau entre ses cris et la vue des adultes, il va les utiliser comme des signaux adressés à son entourage pour qu’il agisse sur lui. Progressivement, l’enfant va reconnaître les personnes et établir un lien entre les paroles qu’elles prononcent et certains objets qu’elles désignent. Vers trois mois l’enfant comprend des mots simples comme “papa”. Il est important de signaler ici que l’un des facteurs fondamentaux permettant le développement de la communication linguistique est la communication non-verbale (imitation, communication affective). Pour que l’enfant parle il faut qu’il le désire, il faut qu’il soit stimulé. Vers le quatrième mois on peut entendre les premiers gazouillis, le bébé produit d’abord des sons de façon accidentelle, c’est en général un fort stimulant pour les adultes en train d’interagir avec le bébé, qui commentent les sons, les répètent, y réagissent. C’est donc l’interaction adulte-bébé elle-même qui est stimulée et donc le bébé est fortement incité à persévérer. Le bébé reproduira alors certains sons de façon constante et répétée. Vers la fin de la première année, le babillage est plus clair et on constate la répétition intentionnelle de certaines sonorités, l’enfant a alors la possibilité de prononcer les premiers mots.

On peut donc considérer qu’il y a deux moments principaux dans l’acquisition du langage:

  • Dans un premier temps, la capacité d’articuler certains phonèmes indépendamment de leur signification.
  • Dans un deuxième temps, la capacité de leur donner un sens relativement à la langue parlée par l’entourage.

On a aussi montré que chaque nouveau né a la capacité d’apprendre n’importe quelle langue, mais cette capacité ne peut se manifester que s’il est engagé dans un dialogue actif. Il apprendera alors sa langue et aura tendance à perdre la capacité à distinguer la richesse et la subtilité des autres langues. A 6 mois, dit Stanislas Dehaene, l’espace des voyelles se rétrécit à la langue maternelle, puis à l’âge d’un an celui des consonnes. C’est à cet âge, par exemple, qu’un enfant japonais apprenant sa langue perd sa capacité à distinguer le R du L. Tous se passe comme si l’acquisition d’une langue n’était possible qu’au prix d’un oubli. Mais cette appropriation de la richesse et de la singularité de sa langue maternelle a tendance, si on n’apprend pas d’autres langues, à rendre indistinctes ces autres langues qui deviennent comme du bruit imcompréhensible. D’où l’expression des Grecs de l’Antiquité pour désigner les étrangers, les barbares, parce qu’ils leur semblaient qu’ils ne savaient pas parler, n’avaient pas de langage, mais seulement la capacité d’articuler des sons sans signification: “Bar”, “Bar”, “Bar”…une sorte de prosopagnosie appliquée aux langues.

J’avais annoncé il y quelques épisodes mon intention de rédiger un dossier sur le langage chez l’humain et Thierry Raeber, un des nos poditeurs, en a profité pour nous envoyer un message pour partager avec nous quelques recherches plus approfondies sur ce thème de l’apprentissage du langage chez le bébé.

Alors déjà, le fait que les bébés sont initialement capable d’apprendre n’importe quelle langue, mais qu’ils se spécifient est tout à fait exact ! Ça se joue en fait principalement sur le fait que contrairement aux adultes, ils sont à la base capable de maîtriser tous les sons de toutes les langues. C’est la raison pour laquelle on les appelles les “phonéticiens universels”. Or ce dont on s’est rendu compte, c’est que dès l’age de 10 mois (oui oui, même pas un an), ils commencent à perdre cette capacité à tout reconnaître. Ils se spécifient. Autrement dit, ils commencent à perdre la capacité de discriminer tous les sons, en se concentrant exclusivement sur les sons de la langue de leur environnement. Ils le font entre autre à l’aide de ce qu’on appelle le babillage (ces sons un peu chaotiques propres aux bébés :-) ). Ce processus s’appelle l’”apprentissage par l’oubli” ou l’élagage linguistique. Petit à petit, ils deviennent de plus en plus performants à distinguer les sons de leur langue maternelle, mais ne parviennent plus à faire la différences entre des phonèmes qui ne sont pas différenciés  (comme la différence entre R et L que les chinois ne comprennent pas).

Voilà en gros quelques compléments qui pourraient vous intéresser pour votre prochaine émission. Je joins tout de même quelques références à mes propos, parce qu’il ne faut pas me croire sur parole :D

La première est une très intéressante vidéo sur le sujet : http://www.ted.com/talks/lang/eng/patricia_kuhl_the_linguistic_genius_of_babies.html

Ca résume assez bien l’idée avec encore d’autres infos intéressantes.

- Discriminer les langues
Les méthodes expérimentales bien inventives ont permis de montrer que les bébés savent bien distinguer deux langues différentes, et qu’ils préfèrent choisir la langue qui correspond à leur environnement pratiquemment dès leur naissance !

Jacques MEHLER[1] a montré grâce à la technique de la succion non nutritive, que les nourrissons français, dès 4 jours, distinguent le russe du français, et préfèrent entendre du français  (Mehler et al., 1988). Les bébés “avaient à comparer” des passages lus par une bilingue franco-russe en indiquant leurs préférences via une tétine non nutritive.

[1] « Naitre humain » (Mehler et Dupoux, 1990) : En gros mehler semble être un innéiste très nativiste (pas maturationniste). Si on ne peut pas apprendre, on peut désapprendre : le bon exemple est la segmentation des syllabes dans toutes les langues possibles, une compétences  que les bébés perdent ensuite pour ne reconnaître que leurs propres syllabes de leur propre langue et de ce fait, ils se mettent à babiller et à apprendre leur propre langue. On peut certes apprendre à écrire, à faire des maths etc. mais cet apprentissage repose sur des mécanismes universels qui sont définis par le bagage génétique de l’espèce.

Là encore, les performances des bébés reposaient sur les indices prosodiques ( la partie de la grammaire qui traite de la quantité syllabique et de l’accent.) présents dans les passages en russe et en français. Ce résultat est robuste et à été retrouvé dans d’autres études : les bébés distinguent entre leur langue maternelle et une autre langue (Barick & Pickens, 1988), et les bébés préfèrent leur langue maternelle (voir Dehaene-Lambertz &Houston, 1998, pour une procédure testant directement la préférence).

Dispositif expérimental :

1) Succion non nutritive = une technique d’habituation et réaction à la nouveauté
- Une tétine reliée à un ordinateur qui va enregistrer à chaque fois que le bébé tète sa tétine plus rapidement.
- Cette technique s’appuie sur un principe simple et universel : le désintérêt progressif que nous manifestons pour une scène familière ET le regain d’attention que nous avons pour une scène nouvelle. En d’autres termes, plus on connaît un stimulus, moins on le regarde. Au contraire, plus un stimulus est nouveau, plus on le regarde. Avec la succion, plus un bébé est interessé plus il tète, plus il se désinteresse moins il tète. En d’autres termes l’habituation s’installe.
- On passe au bébé les différentes langues et on regarde au travers du rythme de succion si  (1) il perçoit des différences (2) sur quelle langue il s’arrête le plus, laquelle est la plus intéressante pour lui.

Alors qu’un jeune enfant peut apprendre une ou plusieurs langues avec facilité, l’acquisition d’une langue tardive à l’âge adulte est particulièrement difficile. Pourquoi ? Parce que pour apprendre parfaitement une langue, on élague les autres. On devient spécialistes pour reconnaître notre langue et pour la parler, mais on devient tellement spécialiste qu’on est plus capables de discriminer les subtilités d’une langue étrangère.

DUPOUX travaille sur cette question. Pour lui, cette difficulté est due, au moins en partie, à une spécialisation des processus perceptifs au contact avec la ou les langues maternelles. Cette spécialisation deviendrait permanente après un certain âge critique.

= à la naissance, nous sommes des phonéticiens universels… à 10 mois, nous ne sommes plus « citoyens du monde » (Kuhl et al., 1992 ; Kuhl, 1998).
(12-18 mois: production d’un babillement typique de notre langue d’immersion)
= surdité phonologique des adultes (exemple des difficultés des japonais à différencier les /r/ et les /l/ (Goto, 1971; Miyawaki et al., 1975)
= et donc difficulté à apprendre parfaitement une autre langue.

 - Discriminer les syllabes
Tout a commencé avec les études de Peter EIMAS (1934-2005) un psycholinguiste qui a participé à fonder le courant des compétences précoces a montré en 1971, avec une expérience qui a lancé un véritable pavé dans la mare, que le bébé était capable à 1MOIS seulement, de discriminer les différentes syllabes prononcées.

EIMAS > publié dans le Science.

Avec cette technique, Eimas montre que le nourrisson sait faire la différence entre les syllabes (pa et ba par exemple) mais aussi toutes les unités phonétiques de TOUTES les langues !

Le nouveau-né est bien un phonéticien universel. Dès la naissance, tous les bébés de tous les pays du monde peuvent distinguer les son R et L.

Pourtant, après quelques mois, par exemple l’enfant japonais aura oublié cette distinction, qui sera élaguée car elle n’est pas pertinente dans l’environnement langagier japonais ! En effet il est assez connu qu’il est difficile pour les japonais d’apprendre l’anglais car ils ne font pas la distinction entre les sons R et L, cela n’existe juste pas dans leur langue. (Goto, 1971, Stranhe et Dittmann, 1984 ; Logan, Lively et Pisoni, 1991).

Comment on explique ce phénomène d’élagage?

En fait ce sont les cerveaux qui diffèrent. L’immersion dans une certaine langue modifie le cerveau. En d’autres termes, les bébés entament processus d’élagage pour mieux se focaliser sur la langue maternelle, qui devient très vite évidemment la plus pertinente à reconnaître.
Ils se mettent à trier les sons pour devenir attentifs à la langue maternelle. En nous écoutant parler, les bébés classent activement les sons dans les bonnes catégories, celles propres à la langue de leur environnement.

Les tout jeunes bébés font donc la différence entre les sons quelque soit a personne qui parle (Kuhl, 1985) mais attention plus les adultes, ni même les enfants à partir de 10 mois !

Du coup, entre 12 et 18 mois, les bébés de cultures différentes commencent à produire des sons en lien avec les caractéristiques de leur communauté. Les bébés chinois babillent d’une manière qui sonne chinoise, les suédois d’une manière suédoise…

Comment fait-on pour discriminer les différentes langues et apprendre celle qui est la plus pertinente ?

L’explication des sciences cognitive est multifactorielle : 3 facteurs principaux.

Attention, on ne retrouve pas ces trois facteurs seulement pour l’apprentissage du langage, mais dans toutes sortes d’apprentissage (comment on apprends sur les choses, comment on apprend sur autrui..)

- (1) Des compétences innées
Les êtres humains sont équipés dès la naissance de mécanismes spécialisés qui nous présent pour nous aider à comprendre le langage, bien avant évidemment de savoir parler. Ils naissent avec des programmes puissants déjà installés et prêts à fonctionner. Pour Pinker par exemple, qui reprend certaines idées de Chomsky[1], tous les nouveaux nés viennent au monde avec des compétences linguistiques, comme le montre l’expérience célèbre de EIMAS qui a montré que les nouveaux nés bien avant de savoir parler savent discriminer les syllabes.

Pinker est un évolutionniste et donc pense que le langage a un caractère évolutif.

ça veut dire que cette compétence a été sélectionnée par l’évolution pour nous permettre de répondre à des problèmes particuliers, sociaux ou écologiques, ceci pour nous permettre de survivre dans notre environnment. En d’autres termes, si le langage et la communication ne nous avaient pas apporté de bénéfices, la communication  aurait tout simplement disparu !

Quels sont les avantages du langage ?

- Le premier avantage du langage est de nous permettre de communiquer et de coordonner nos actions avec celles des autres membres de notre groupe.
- Le fait que nous parlions des langues différentes permets de nous différencier des autres, c’est un moyen comme un autre de savoir qui partage son groupe et qui est étranger (empêcher ses ennemis d’obtenir une certaine information peut être aussi crucial que partager une information avec ses alliés). Remettre cette remarque au moment ou cette compétence de nous différencier était pertinente permet de mieux comprendre. Nos ancêtres devaient reconnaître impérativement leurs ennemis pour des question de survie, on a hérité de cette compétence qui ne veut pas dire qu’elle est aujourd’hui pertinente.
- Le développement du langage est certainement lié au développement de notre capacité à apprendre sur les gens et sur les choses. Le langage nous permet de profiter de tout ce que les autres personnes ont fait avant nous.

Donc il y a bien sûr une base innée, des modules qui sont là « tout prêts », mais ceci est compatible avec d’autres types de mécanismes qui viennent s’ajouter, notamment d’apprentissage culturel.

- (2) Une capacité à apprendre considérable
Notre cerveau est une machine à apprendre. Nous sommes « programmés » pour apprendre tout au long de notre vie. Les enfants ne fonctionnent pas avec un programme unique, mais avec une succession de programmes de plus en plus puissants et spécialisés. Apprendre en quelque sorte, c’est s’auto-reprogrammer en fait !

Dans point de vue évolutionniste, on peut se dire la soif de savoir et l’appétit d’explications a plus de poids,  que les dangers de l’exploration par soi même. Le langage nous permet de profiter de tout ce que les autres personnes ont fait avant nous.

- (3) Rôle de l’entourage: Des leçons implicites données par les gens qui les entourent.
Les adultes sont programmés pour aider les enfants à apprendre. Ils agissent spontanément d’une façon qui encourage les apprentissages, la plupart du temps de manière totalement inconsciente.

Un des bons exemples c’est le parler maternant ou « MOTHERESE »:

Terme anglo-saxon utilisé pour désigner le langage modulé de la mère envers son enfant quand il est en période d’acuisition langagière.

Cependant, on a pas besoin d’être la mère d’un enfant pour commencer à parler le motherese.

Exemple du motherese : prenez des notes puis groupe.

http://www.youtube.com/watch?v=FR3y4TNGIjo

Quelles sont les modifications que vous remarquez ?

Il y a plusieurs modifications quand on parle le motherese :
- La prosodie : elle est plus accentuée, plus chantante afin de faire ressortir le discours et de capter l’attention de l’enfant,
- Le lexique : il est aussi adapté à celui de l’enfant,
- Les phrases : elles sont plus courtes et bien formulées (Ferguson, 1964 ; Snow, 1977 ; Snow et Ferguson, 1977), ce qui est probablement une aide à intégrer les mots et à assimiler la grammaire de la langue.
- L’articulation : elle a un débit plus ralenti et plus de pauses. Les parents parlent bien plus distinctement quand ils utilisent le motherese (Kuhl et al., 1997).
- Le discours est en général plus redondant : par exemple on va expliquer et montrer du doigt en même temps.. dans le but de se faire comprendre.

Les bébés préfèrent entendre des voix de parler « bébé ». C’est en quelque sorte un langage universel, intuitif. C’est un processus naturel et inconscient, souvent on ne rend pas compte qu’on commence à parler de cette manière !

———————–

[1]Presque toutes les phrases que nous entendons sont inédites, et pourtant nous les comprenons toutes.  Pour Chomsky, connaitre une langue implique de connaître des règles, mais qui ne ressemblent en rien à celles de la grammaire traditionnelle : ce sont des règles naturelles, que nous appliquons inconsciemment. Nous serions programmés pour absorber des suites de sons et les traduire en représentations sensées, de la même manière que nous sommes programmés pour absorber des informations sensorielles et les traduire en représentations d’objets, et pour absorber des représentations faciales et les traduire en représentations de sentiments.

Conclusion

Des questions restent cependant encore ouvertes ou ne sont qu’en partie résolues:

  • La capacité à utiliser le langage est-elle apparue brusquement (position défendue par Noam Chomsky) ou grâce à la sélection naturelle (position défendue par Steven Pinker) ?
  • Quelles facultés nécessaires au langage sont modulaires ?
  • Y a-t-il une période critique pour apprendre à parler (voir la question des enfants sauvages)?
  • Notre langue influence-t-elle notre façon de penser (voir Hypothèse Sapir-Whorf) ?
    • décrit le rôle du langage dans la pensée.
    • la façon dont on perçoit le monde dépenderait du langage, autrement dit que les représentations mentales dépendent des catégories linguistiques (l’influence du langage sur la perception des couleurs chez la tribu Himba).
    • Le mot Américain peut prendre un sens différent selon la langue.
      • En français, un Américain sera presque toujours compris comme « un habitant des États-Unis d’Amérique ».
      • En espagnol, un Americano signifiera toujours « un habitant de l’ensemble du continent américain », dû au lien culturel entre l’Espagne et les pays hispanophones du continent latino-américain.
      • Le terme Américain courant en français se traduira en espagnol par estadounidense (de Estados Unidos), traduisible en «Étasunien».
    • la “réalité” serait, dans une grande mesure, inconsciemment construite à partir des habitudes linguistiques du groupe. Deux langues ne sont jamais suffisamment semblables pour être considérées comme représentant la même réalité sociale. Les mondes où vivent des sociétés différentes sont des mondes distincts, pas simplement le même monde avec d’autres étiquettes.
    • cette thèse de Sapir-Whorf qui dit que notre langue influence notre façon de penser est au coeur d’une controverse:
      • Au début des années 1960, les psychologues Roger Brown et Eric Lenneberg ont entrepris de véritablement tester l’hypothèse Sapir-Whorf à partir d’observations expérimentales et montrèrent que le lexique des couleurs semblait avoir une influence réelle sur la perception et la mémoire de celles-ci par des locuteurs parlant des langues différentes.
      • Par contre une étude à large échelle comparant les termes de couleurs dans plusieurs dizaines de langues menée par les anthropologues Brent Berlin et Paul Kay a montré que l’organisation hiérarchique du lexique des couleurs est quasi universelle. Ils conclurent donc à l’inverse de la thèse de Sapir-Whorf que c’était l’organisation des catégories mentales qui déterminait les catégories linguistiques.
    • Dans tous les cas, la pensée d’un individu est, au moins en partie, dépendante des langues qu’il connaît, et en particulier de leur précision. Ce que l’on appelle « apprendre une langue », c’est la création d’une série de liens entre signifiants (mots) et signifiés (concepts). Si un signifiant est absent (si nous ne connaissons pas l’existence d’un mot), alors le signifié (le concept exprimé par ce mot) pourra parfois être également absent. Mais à l’inverse, il est aussi possible de ne pas trouver un mot correspondant à un concept que l’on a en tête.
  • Quels sont les processus cognitifs associés à l’apprentissage et acquisition d’une seconde langue ?
    • On voit que les enfants apprenant une deuxième langue sont plus aptes à la parler couramment que les adultes.
    • En général, c’est très rare qu’une personne parlant une deuxième langue soit complètement bilingue et passe pour un autochtone.
  • Les animaux ont-ils des facultés langagières ?Chimpanzé langage
    • On a pu montrer dès les années 1970 que les vervets (singes verts), alors qu’ils étaient captifs dans une réserve du Kenya, étaient capables de moduler leur cri d’alerte afin d’induire des stratégies défensives appropriées: s’enfoncer dans la végétation à l’approche d’un aigle, au contraire grimper le plus haut possible à l’approche d’un léopard, ou encore scruter le sol avec attention pour choisir le bon arbre à l’approche d’un python ; on notera que la sémantique de ces cris n’est pas innée mais est enseignée aux jeunes singes par leurs parents.
    • C’est ce type de communication, qui devait sans doute exister chez les Australopithèques et même leurs prédécesseurs, qui a dû se développer sensiblement chez l’homo habilis pour lui permettre d’organiser ses activités collectives.
    • La danse des abeilles est utilisée pour communiquer la distance de la source de nourriture.
    • Le chant des oiseaux qui est articulé.
    • Le chant des baleines qui fait réagir d’autres poissons. On a constaté que lorsqu’on fait écouter artificiellement un cri de baleine à un groupe de poissons, celui-ci répondera au son en s’éloigant de la source, même si aucune baleine n’est présente.
    • Communication animale ou langage? Ou se situe la frontière entre le langage et d’autres formes de communication?
    • Un certain nombre de propriétés du langage humain ont été mis en avant pour le séparer de la communication animale comme par exemple:
      • Transmission culturelle: le langage est passé de l’un à l’autre consciemment ou inconsciemment.
      • Elément discrets: le langage est composé d’unités discrètes qui sont utilisées en combinaison pour créer du sens.
      • Déplacement: le langage peut être utilisé pour communiquer sur des choses qui sont ou qui ne sont pas dans notre voisinage spatial et temporel immédiat.
      • Métalinguistique: la capacité de discuter du propre langage.
      • Productivité: un nombre fini d’unités peuvent être utilisées pour créer un nombre infini d’occurences.
      • Capacité à l’alternance: c’est ce qui permet un aller-retour entre les interlocuteurs dans une véritable communication à double sens. La différence avec le langage animal dont les signaux émis unilatéralement déclenchent une réaction plutôt que d’entrer en relation sur le mode du langage.
      • Capacité à exprimer le possible et non seulement le réel présent: c’est la condition sine qua non de la capacité d’abstraction.
      • Capacité à exprimer des liens logiques: elle permet que naisse l’argumentation.
      • Capacité à exprimer la mémoire du passé: l’aboutissement le plus achevé de cette capacité est l’écriture, mais la transmission orale existait antérieurement, usant de cette même capacité.
    • Des recherches sur les singes suggèrent qu’ils sont capables d’utiliser le langage de manière à satisfaire certains des critères cités auparavant, comme la transmission culturelle, un langage construit d’unités discrètes, un langage productif…cependant aucune expérience n’a montré qu’ils étaient capables de couvrir tous ces critères en même temps. Par exemple le chimpanzé peut “parler” à ses congénères afin d’aviser de l’approche d’un danger, mais dans ce cas il s’agit uniquement d’un langage lié à un événement observable, ce qui montre un manque de faculté langagière de déplacement de la part de celui-ci.
Pour conclure et pour ceux qui veulent aller encore plus loin sur cette thématique, je vous invite en premier lieu à écouter une émission de la Tête au Carré sur la voix (la voix qui nous relie à notre identité, et qui serait une faculté propre à la condition humaine), et je vous renvoie aussi à un article publié sur Internet Actu qui traite des recherches effectuées actuellement sur l’évolution du langage chez les robots.

Notre poditeur Thierry Raeber revient également en renfort pour approfondir les travaux effectués sur la relation entre le langage et la percéption du monde:

Si vous permettez toutefois que je joue mon linguiste de service :-) , je me permets de revenir sur cette histoire de découpage des couleurs dans le langage. Pour ce faire, commençons par rappeler que comme vous l’avez dit, c’est sujet à discussion. Plus précisément, deux grandes visions s’affrontent ici. Il y a d’un coté le courant que l’on appelle le “relativisme linguistique”, digne descendant du structuralisme saussurien, et de l’autre côté ce que nous pourrions appeler l’universalisme, ou le nativisme, ou l’innéisme, à choix ;-) . Le premier courant considère que le langage est notre grille de lecture du monde, que ce découpage est totalement arbitraire, et que par conséquent nous percevons différemment le réel en fonction de notre langue maternelle. C’est ce qu’on appelle l’hypothèse Sappir-Whorf, du nom des instigateurs de ce courant. Le second considère que notre système perceptif et conceptuel répond à des contraintes cognitives, qui sont donc universelles, et que malgré les différents “découpages”, nous voyons tous les choses globalement de la même manière (l’un des premiers acteurs de ce courant étant Noam Chomsky).

Il faut également savoir que le relativisme fait de moins en moins d’adeptes à l’heure actuelle. La raison en est qu’un grand nombre de mythes sur lesquelles ce courant se basait ont été falsifié par de récentes recherches en sciences cognitives. Je pense notamment au mythe très connu et souvent cité des 32/46/80/400 (à choix selon les travaux) mots pour dire “blanc” en Inuit, idem pour décrire la neige. Ces expériences menées dans les débuts de la recherche ethnographique ont été refaites avec des outils méthodologiques plus solides, et ces conclusions se sont avérées erronées. Il existe en réalité deux mots pour dire “blanc” (ce qui est déjà le double du français, ce n’est pas rien :-) ), et qu’un seul terme pour dire “neige”, sachant que tous les autres termes sont des sous-classes (tout comme le français à le terme de base “neige”, et un tas de sous-termes comme “poudreuse, petche, poudre, carton, grésil, etc.). Le second mythe à l’appui de la thèse relativiste est la langue des Hopi, une tribu d’Amazonie. Selon certaines études, cette tribu n’aurait pas de conception du temps car leur langue n’a pas de temps verbaux. Cela part déjà d’un postulat selon lequel ce qui n’est pas dans la langue n’est pas conceptualisé, ce qui est très discutable. De plus, d’autres études, réalisées cette fois par des linguistes et non des ethnologues, ont montré que s’ils n’ont effectivement pas de temps verbaux, il ont en revanche tout un système d’adverbes de temps qui leur permettent malgré tout de décrire la dimension temporelle. Sans oublier que le Chinois présente la meme particularité de n’avoir que des adverbes pour décrire le temps, et personne n’oserait soutenir qu’ils n’ont pas de notion du temps…

Venons-en maintenant aux couleurs. Pour cette question également, un très grand nombre d’études ont été réalisées un peu partout pour montrer que le découpage particulier du spectre influençait notre perception. Or, s’il est tout a fait vrai que toutes les langues ne découpent pas de la meme manière le spectre lumineux, une colossale étude intitulée ” Basic color terms” menée par deux linguistes et ethnologues, Brent Berlin et Paul Kay, et publiée de mémoire en 1969 (en plein relativisme!) a montré qu’il existe une régularité tout a fait frappante dans l’apparition des couleurs dans la langue. Je m’explique. La plupart des langues occidentales ont 11 termes dits “primaires”, “basiques” ou “focaux” (je sais, ça fait beaucoup de choix :-) ). La liste étant (de mémoire toujours) la suivante : noire, blanc, rouge,jaune, vert, bleu, orange, rose, brun, gris, violet. On entend par “couleur basique” une couleur qui n’est pas une sous-catégorie d’une autre au niveau conceptuel, pas d’un point de vue physique. Le brun n’est pas un type précis de bleu, l’orange n’est pas un type particulier de rouge, contrairement au carmin, au pourpre, au beige, etc. Or, la première observation est qu’aucune langue ne dispose de davantage de couleurs basiques. 11 est, pour l’instant du moins, il faut rester prudent, le maximum observé. Cependant, un grand nombre de langues en ont moins que 11. Certaines n’en ont que 2 ! Mais les recherches de Berlin et Kay ont montré que l’apparition de ces couleurs se fait toujours dans le meme ordre. Imaginez une culture dont la langue ne contient que 2 termes pour différencier les couleurs. Alors ce sera toujours un distinction du type blanc/noir, ou disons plutôt clair/foncé, voire couleurs chaudes/couleurs froides. Prenez maintenant les cultures disposant de 3 termes de couleur. Elles auront toutes le rouge comme couleur supplémentaire, les deux premières restant un regroupement plus ou moins précis des couleurs mentionnées clair/foncé. La quatrième couleur est toujours le jaune. A partir de la cinquième, ça se corse, on voit apparaitre la couleur “blert”, qui regroupe le bleu et le vert en une seule couleur. Ce n’est que lorsque la 6ème couleur apparait que l’on fait la différence entre le bleu et le vert (mais cette sixième vient toujours faire la séparation entre bleu et vert, jamais autre chose). A partir de là, les couleurs restantes apparaissent de manière moins régulière. Parfois le gris apparaît avant le brun, parfois c’est l’inverse. Cette étude a été dans sa version d’origine menée sur plus de 160 langues, mais les travaux se sont depuis poursuivis et jusqu’à ce jour, aucune exception n’a été trouvée. Aucune langue n’a de mot pour dire “jaune” sans en avoir un pour dire “rouge”, ni de mot pour dire “brun” sans en avoir un pour dire “bleu”. Pour le dire en termes plus mathématiques, la couleur de rang n n’apparait que si il existe déjà un terme pour décrire toutes les couleurs de rang n-1, n-2, etc.

Qu’est ce que tout ceci veut dire? Simplement que malgré les thèses relativistes qui défendent une vision du monde basée sur le découpage totalement arbitraire de la langue, il semble que notre vision du monde soit très fortement contrainte par notre structure cérébrale qui répertorie les couleurs basiques toujours de la meme manière. Alors bien entendu, cela n’empêche pas que certaines adaptations dues à la langue maternelle s’opèrent, comme cela semble être le cas de la tribu des Himba. Il faut toutefois savoir que le cas des Himba est également très connu, et que de nombreuses recherches sont menées pour comprendre ce cas. Or un grand nombre d’entre elles (Regier et Kay notamment) apportent d’autres explications aux phénomènes observés. A noter également que cette langue ne failli pas à la règle d’apparition des couleurs !

Je dois toutefois apporter quelques corrections à ce que j’ai dit. J’ai écrit ça hier soir un peu en vitesse, et après vérification de quelques points dont je n’était pas certain, je vois que j’ai fait quelques imprécisions :
L’ordre des couleurs est un chouïa différent : on a donc dans l’ordre :1.  Clair/foncé
2.  Rouge
3.  Jaune ou “blert” (“blert” = bleu-vert)
4.  Jaune et “blert”
5.  Séparation de “blert” en bleu/vert.
6.  Brun
7.  Violet ou rose ou orange
8.  Violet ou rose ou orange, selon ce qui est déjà apparu en 7.
9.  Idem selon ce qui a été choisi  en 7 et 8
10. Gris.Ce qui fait donc bien 11 couleurs, comptant que la première ligne en compte 2…De plus, j’ai surestimé le nombre de langues sur lesquels ces observations ont été faites dans la version d’origine. Je crois que ce n’est qu’une vingtaine de langues. Il reste toutefois vrai qu’à l’heure actuelle cette observation s’est vérifiée sur toutes les langues observées, celles-ci étant considérablement plus nombreuses.Et finalement, il faut bien comprendre que le relativisme linguistique affirme que c’est la culture qui influe sur notre perception du monde. Or cette thèse a été assez massivement falsifiée, ne serait-ce parce que l’idée de “culture” est trop floue. Ce n’est pas une force magique qui flotte dans l’air et qui vient nous transformer de l’intérieur. Si un paramètre peut modifier notre perception, il doit être clairement identifiable, pour des raisons de plausabilité et de falsifiabilité. Le lexique est un bon exemple. Il peut grandement varier selon les langues, et il entraine effectivement, dans une certaine mesure, une modification de notre perception. Mais cela n’a rien de culturel. Ca reste un phénomène mental en ceci qu’il est raisonnable de penser que selon le découpage opéré par les mots de notre langue, les connexions neuronales sollicitées par notre appareil conceptuel s’en trouvent modifiées, et par conséquent notre perception également. C’est un phénomène absolument fascinant, qui s’observe dans d’autres cas que les couleurs (par exemple la représentation temporelle). Mais d’une part, les différences ne sont pas aussi grandes que certains veulent bien le croire. Si les Himbas ont plus de peine à différencier certaines couleurs appartenant à la même catégorie lexicale dans leur langue, ils perçoivent globalement les couleurs de la même façon que n’importe quel être humain. De plus,  soutenir que c’est notre culture qui modifie notre perception n’a en fait pas vraiment de sens, car ça n’explique en rien comment cette modification se produit. C’est en cela que réside la grande fracture entre relativisme et naturalisme.
Premièrement, tu parlais du langage animal et de la distinction avec le langage humain. Tout d’abord, parmi les spécificités que tu cites, on peut rajouter une capacité propre à l’être humain qui, si elle n’est pas directement propre au langage, est indispensable pour que celui-ci soit opérationnel tel qu’il l’est pour l’homme : il s’agit des méta-representations, et plus particulièrement des attributions d’intention. En effet, un singe est capable un comprendre un message de danger, tel que “attention, un danger arrive depuis le sol”. Il peut ainsi se réfugier dans un arbre. Mais ce qu’il n’est vraisemblablement pas capable de faire, c’est de se dire “mon congénère pense qu’un danger vient du sol”, ou meme “mon congénère souhaite me communiquer qu’un danger vient du sol”. Alors la question se pose : l’humain fait-il ça dans la conversation quotidienne ? La première réponse est “on s’en fiche, il peut le faire, c’est tout ce qui compte…”. Un peu frustrant quand même, non ? Une réponse plus constructive est de dire que oui, mais pas toujours de manière consciente. Toutefois cette capacité à attribuer à l’autre des croyances, des intentions et des états mentaux est indispensable ! Pour illustrer mon propos, considérons un fait de langue bien connu : l’ironie. Imaginez que je suis un conducteur connu pour etre très prudent. Je roule calment en voiture avec un ami à mon bord. J’arrive au croisement d’une route parfaitement droite et dégagée, avec seulement une voiture qui est encore très loin du croisement. Je m’apprête à m’engager lorsque mon ami me dit “attention, il y a une voiture qui arrive !”. Pour comprendre l’ironie de mon ami, et donc son intention communicative, je suis obligé de faire des hypothèses sur ses propres croyances et pensées. Je dois postuler qu’il ne prend pas véritablement au sérieux le risque que représente cette voiture au loin. Je postule également qu’il me sait être très prudent. Je postule qu’il postule que je suis capable de lui attribuer les bonnes intentions. Etc. Ceci n’étant qu’une partie des informations que je dois lui imputer pour arriver au final à comprendre la critique cachée qui est que je suis excessivement prudent et que ça l’agace.
Le cas de l’ironie est particulier, mais il montre bien en quoi il est nécessaire, pour parvenir à obtenir le sens que voulait communiquer mon ami, de faire des suppositions sur les pensées qui l’animent lorsqu’il communique. Et ce processus n’est pas une exception propre à l’ironie, mais est le cas général de notre conversation quotidienne. Nous devons en permanence faire des hypothèses sur les états mentaux de nos interlocuteurs pour parvenir à refaire le chemin entre ce qui est verbalisé (les mots qui sortent de la bouche) et la véritable intention communicative (qui est dans la quasi totalité des cas bien plus riche que le contenu verbalisé). Et l’étude de ces processus où l’on “rajoute” l’informations non verbalisée s’appelle la pragmatique, dont vous avez parlé, et qui échappe totalement aux animaux, même aux grands singes.
Maintenant s’il est intéressant de se demander ce que l’homme peut faire avec le langage, que l’animal de peut pas faire, il est également intéressant de se demander si le langage humain, indépendamment de ses différentes fonctions, diffère par sa nature de celui de de l’animal. Et la réponse est oui! C’est d’ailleurs l’argument le plus fort. Le langage humain de distingue du langage animal en ceci qu’il dispose d’une syntaxe. Évidemment, il faut s’entendre sur ce qu’est une syntaxe. La syntaxe, comme vous l’avez très bien dit, est l’ensemble des règles qui régissent la bonne construction des phrases. Mais il ne faut pas croire que dès qu’on se met à aligner des unités de sens (pour l’homme, des mots), on a une syntaxe. L’animal dispose d’un ensemble, parfois assez vaste, de signes ( qui est comme vous l’avez dit la réunion d’un signifiant, le mot ou le son correspondant, et d’un signifié, qui est le concept) qui permet de décrire différentes choses. Par exemple, “attention danger sol”. La réunion de ces trois signes forme une informtion unifiée qui est interprétable. Mais on n’a pas encore de syntaxe. La syntaxe, telle qu’on la trouve par exemple dans le langage humain, mais également dans les langages informatiques, a comme propriété de pouvoir générer, sur la base d’un nombre limité de règles, des phrases infinies. C’est l’homme qui a vu l’homme qui a vu l’homme qui a vu l’homme qui … La limite des phrases n’est pas liée par la syntaxe, mais simplement par notre capacité de mémorisation. Au bout d’un moment, on “perd le fil”. Mais ce n’est pas dû à une limite de notre système langagier. Cette syntaxe permet également de générer un nombre virtuellement infini de phrases différentes, mais qui restent tout à fait compréhensibles dès la première écoute. Cette syntaxe, qui n’est pas une fonction, mais une propriété du langage humain, est totalement absente de tout langage animal.Cette (longue) précision étant faite, je reviens sur une question d’Alan qui demandait ce que c’était que cette grammaire générative. Je pense que ça mérite précision car à premier abord, c’est totalement contre intuitif de se dire qu’on a une grammaire encodé dans notre cerveau dès la naissance. Mais là encore, il faut se demander ce que l’on entend par grammaire. Il n’est pas question de dire que l’accord du participe passé, la formation des verbes irréguliers, ou la construction “aller chez le coiffeur” plutôt que “aller au coiffeur” est inscrit dans notre code génétique. L’idée est simplement que contrairement aux apparences, il existent entre toutes les langues du monde davantages de similitudes que de différences, et que certaines de ces similitudes sont universelles, et donc vraisemblablement imposées par notre système cognitif et conceptuel. Commençons par des choses simples : toutes les langues ont des verbes, des noms, des adjectifs, des prépositions, des adverbes. Est-ce un hasard ? Pourquoi, avec tout le brassage linguistique, ne trouve-t-on aucune langue qui dispose de catégories grammaticales différentes ? Si l’on regarde maintenant de plus près, On trouve le même genre de faits étonnants dans la syntaxe. Prenons l’exemple de la coréférence des pronoms : si je dis ” Pierre dit qu’il est heureux”, le pronom “il” peut reprendre “Pierre”. Mais si je dis “il dit que Pierre est heureux”, “il” ne peut plus reprendre Pierre. Jusque là, rien de bien sorcier, on a envie de dire “ben ouais, et alors ?”. Ici, le linguiste répondra “et alors pourquoi ??”. La première observation est de dire que cette coréférence ne se fait pas n’importe comment. Il y a, apparemment, des règles, et on veut savoir lesquelles !! Première hypothèse : un pronom ne peut pas reprendre ce qui vient après dans la phrase. Dans le second cas, Pierre est post-posé, la reprise est donc impossible. Ouais, sauf que dans “lorsqu’il joue avec ses enfants, Pierre est heureux”, la coréférence est tout à fait possible… Bon, il faut trouver autre chose. On creuse, on creuse, et on finit par se rendre contre que la règle est assez compliquée. Contentons-nous ici de dire qu’un pronom ne peut jamais reprendre un élément qui est contenu dans le syntagme c-commandé par le pronom. Pas la peine de comprendre ce que cela veut dire, il suffit de noter deux choses très importantes. La première est que cette règle complexe, dont il est quasi impossible d’être conscient sans s’y attarder longuement, est présente dans toutes les langues du monde. Aucune langue ne viole cette règle de coréférence. D’ailleurs, lorsqu’on apprend une langue étrangère, on ne fait jamais ce genre d’erreur. On en fait plein, mais pas ça… L’existence de cette règle universelle, parmi beaucoup d’autres, est un premier argument pour la grammaire générative. Le second argument est que l’enfant maitrise cette règle très tôt, vers les 2-3 ans. Or sans un dispositif préétablit qui permette d’interioriser ces règles très compliquées, il est difficile d’expliquer comment un enfant, par la simple écoute de phrases prononcées par ses parents, et qui ne sont en réalité pas suffisantes pour justifier les thèses behavioristes, parvienne à maitriser aussi vite la syntaxe de sa langue. Il devient en fait beaucoup plus vraisemblable que l’être humain dispose d’une contrainte cognitive, ce qu’on appelle la grammaire générative, et qui vienne supporter et accueillir la langue maternelle de l’enfant, en imposant un certain nombre de limites et de règles qu’aucune langue ne viole. Et c’est sur la base de cette grammaire innée, mais minimale, que viennent se développer les différentes langues du monde. On dispose donc d’un ensemble de règles innées, qu’on appelle des “principes”, depuis lesquels on peut opérer des variations, qu’on appelle des “paramètres” (la place du verbe dans une phrase, la position du complément d’objets, etc.). Ainsi, le cerveau est comme un grand tableau électrique avec des commutateurs. On part des principes, et on fait varier les paramètres. En changeant le commutateur de la place du verbe, on passe du français à l’allemand. En changeant le paramètre de la position du complément d’objets pour le mettre en début de phrase, on obtient le turc. Mais on garde toujours les principes inchangés. Et c’est l’ensemble de ces principes qui forment la grammaire générative.
Sources:

http://fr.wikipedia.org/wiki/Linguistique

http://fr.wikipedia.org/wiki/Linguistique_compar%C3%A9e

http://fr.wikipedia.org/wiki/Acquisition_du_langage

http://fr.wikipedia.org/wiki/Psycholinguistique

http://fr.wikipedia.org/wiki/Noam_Chomsky

http://www.youtube.com/watch?v=ImQrUjlyHUg

http://sciencetonnante.wordpress.com/2011/07/04/out-of-africa-pour-le-langage-aussi/ 

http://media.radiofrance-podcast.net/podcast09/11549-02.07.2011-ITEMA_20294998-0.mp3

http://fr.wikipedia.org/wiki/Aphasie

http://fr.wikipedia.org/wiki/Histoire_des_langues

http://scienceblogs.com/pharyngula/2011/09/wiring_the_brain.php

 

VN:F [1.9.17_1161]
Rating: 3.0/5 (2 votes cast)
VN:F [1.9.17_1161]
Rating: 4.3/5 (4 votes cast)

Parler d’économie dans podcastscience peut surprendre, surtout pour tous les amateurs de sciences dures. Néanmoins l’économie s’inscrit dans le cadre des sciences humaines, un domaine des sciences que nous avons déjà abordé à quelques occasions dans ce podcast. L’idée m’est venue de revenir sur les thèses fondamentales de l’économie suite au visonnage d’une série de vidéos passionnantes et réellement inspirantes du professeur espagnol Julián Pavón de l’Université Polytechnique de Madrid. Ces vidéos dont je me suis amplement insiprées pour rédiger ce dossier reviennent sur les principes fondateurs de la macroéconomie qui ont été appliqués dans notre histoire récente du XXème siècle et dans la première décennie du XXIème siècle. Elles nous aident à mieux comprendre quels sont les fondamentaux qui nous ont amené à la situation de crise actuelle et à envisager quels sont les enjeux économiques avenirs.

Le keynésianisme et la demande agrégée

Keynes

Le keynésianisme est une école de pensée économique fondée par l’économiste britannique John Maynard Keynes (5 juin 1883 – 21 avril 1946). Pour les keynésiens, les marchés laissés à eux-mêmes ne conduisent pas forcément à l’optimum économique. En outre, l’État aurait un rôle à jouer dans le domaine économique notamment dans le cadre de politique de relance. Keynes est reconnu comme le fondateur de la macroéconomie moderne.

Un des principe fondamentaux sur lequel repose la politique économique keynésienne est la demande agrégée (notée  Y \ ) qui représente la demande totale dans une économie. Elle est composée 4 paramètres :

 Yd = C + I + G + NX \

  •  C \  est la consommation des ménages (demande des biens de consommation des familles)
  •  I \  est l’investissement (demande des biens d’investissement de la part des entreprises)
  •  G \  représente les dépenses des Administrations publiques (demande du secteur public)
  •  NX = X - M \  est le solde commercial (demande des marchés internationaux)
  •  X \  : exportation
  •  M \  : importation

Pour simplifier et mieux comprendre la demande agrégée, nous allons la noter de la manière suivante:

Demande agrégée = Consommation des ménages + Investissement + Dépenses des Administrations publiques + Solde commercial

Selon Keynes, la variable fondamentale qui dynamise l’activité économique est la demande agrégée. Et à travers cette formule toute simple, il propose de combattre les deux problèmes fondamentaux de toute économie:

  1. Le chômage.
  2. L’inflation.

Pour Keynes, le chômage est le produit d’un manque de demande agrégée, et pour le combattre il suffit donc d’augmenter la demande agrégée en agissant sur les termes de l’équation:

  • Stimuler la consommation en baissant les impôts et les taxes pour que les familles aient plus d’argent pour consommer.
  • Baisser les taux d’intérêt, c’est-à-dire le prix de l’argent, pour que les entrepreneurs puissent investir plus.
  • Augementer les dépenses publiques au-travers du budget de l’Etat, afin de créer de nouveaux services publics (écoles, hôpitaux…).
  • Favoriser les exportations en baissant le taux de change de la monnaie.
Pour combattre l‘inflation dont l’augmentation des prix est dûe à une demande excessive, il faut appliquer une politique inverse à celle appliquée pour combattre le chômage, il faut donc tenter de contrôler et réduire la demande agrégée:
  • Baisser la consommation des ménages en augmentant les impôts.
  • Diminuer l’investissement en augmentant les taux d’intérêt.
  • Diminuer les dépenses publiques de la part des Administrations.
  • Promouvoir une augmentation du taux de change de la monnaie.
On voit bien que pour Keynes, chômage et inflation ne peuvent pas coexister !! En effet, si le chômage est dû à un manque de demande, alors les prix ont tendance à baisser, donc pour Keynes le chômage est directement lié à une déflation. Et s’il y a inflation et donc excès de demande, l’excès de demande tire l’offre globale vers le haut, et plus d’offre a donc tendance à réduire le chômage.

Le choc pétrolier et l’inflation des coûts

Pétrole

Cette recette keynésienne a fonctionner parfaitement de 1945 jusqu’à 1973. Et que s’est-il passé en 1973? Le choc pétrolier ! Et dans la crise pétrolière des années 1970, pour la première fois dans l’histoire économique moderne vont coexister chômage et inflation. Situation que n’avait pas prévue Keynes. Et comment est-ce possible que coexistent chômage et inflation? Simplement parce que l’inflation qui apparaît en 1973, n’est pas une inflation dûe à une demande agrégée excessive, mais une inflation dûe au coûts.

Les prix montent parce que le prix de l’énergie et du pétrole montent, le prix du baril est passé de $2 à $35. Donc malgré un manque de demande et un contexte de crise économique et donc de chômage, les prix ont continué de monter amenant l’inflation à coexister avec le chômage. L’inflation de demande s’est transformée en une inflation des coûts et Keynes ne donne pas de réponse sur comment combattre une inflation des coûts.

La transition vers une politique économique néolibérale

Les politiques keynésiennes sont alors remplacées par des politiques néolibérales, théorisées principalement par Milton Friedman, qui considèrent que le budget public de l’Etat doit être neutre, les dépenses publiques doivent être équilibrées par les revenus de l’Etat, et qu’il faut uniquement agir sur les taux d’intérêt pour contrôler l’économie. De plus, ces politiques libérales préconisent que l’accent doit être mis sur le microéconomie et non plus sur la macroéconomie comme le préconisait Keynes.

S’il faut combattre l’inflation des coûts, ces coûts peuvent seulement être combattus au niveau microéconomique, c’est-à-dire au niveau des sociétés et des entreprises, en combattant l’augmentation des coûts salariaux et des coûts de production au moyen de l’innovation, d’une meilleure productivité, d’une meilleure compétitivité, d’une meilleure qualité, etc…

Keynes vs Hayek

keynes vs hayek

On voit que deux écoles de pensée ont surgies dans les pays démocratiques organisés autour d’une économie de marché:

Keynes propose une politique économique basée sur les principes suivants:
  • un Etat interventionniste en terme économique.
  • des marchés très régulés.
  • une politique fiscale active de dépenses publiques.
  • une politique économique à court terme.
  • une orientation vers la macroéconomie (régulation de la demande globale).
  • L’élément dynamisant d’une économie est la capacité de l’Etat à effectuer des dépenses publiques.
Friedrich Hayek (8 mai 1899, Vienne – 23 mars 1992, Fribourg) est un économiste de l’École autrichienne, promoteur du néolibéralisme. Il postule le contraire de Keynes:
  • une intervention minimume de l’Etat.
  • des marchés peu régulés.
  • un équilibre budgétaire à outrance.
  • une politique économique à long terme.
  • une orientation vers la microéconomie (l’application de politiques de compétivité).
  • L’élément dynamisant d’une économie est l’entrepreneur et l’innovation.

Du point de vue historique, les keynésianistes ont eu leur époque dorée jusqu’à la crise prétrolière et monétaire des années 1970. A partir de cette époque, les politiques économiques keynésiennes ont été alors mises de côté suite à la crise des années 1970, et le néolibéralisme prend le relais avec l’élection de Ronald Reagan aux USA et Maragret Thatcher en Grande-Bretagne qui inauguent l’âge d’or des politiques néolibérales à partir des années 1980 jusqu’en 2008.

La théorie du double déficit

Si un pays possède un déficit public très élevé, c’est-à-dire s’il dépense beaucoup plus que ce qu’il encaisse, alors le pays doit s’endetter pour que son déficit public soit couvert par une dette publique. Et lorsqu’un pays a un grand besoin d’émettre une dette publique pour couvrir son déficit, ce qu’il doit faire c’est d’élever les taux d’intérêt pour intérsser les investisseurs à souscrire à l’émission de la dette publique. Cette augmentation des taux d’intérêt attire naturellement une grande quantité d’investissements, et ces investissements vont automatiquement augmenter la demande de la monnaie d’émission de la dette, ce qui provoque à son tour une augmentation du taux de change de la monnaie en question, et la monnaie se révalue. La révaluation de la monnaie affecte alors les exportations (qui se renchérissent et diminuent) et les importations (qui deviennent meilleur marché et augmentent). Donc si les exportations diminuent et les importations augmentent, on génère un déficit commercial (balance commerciale des paiements). On voit alors qu’une augmentation du déficit public induit une augmentation du déficit commercial.

dollar faible

Le cas des Etats-Unis

Il faut savoir que Hayek (néolibéral) considère que l’origine d’une phase dépressive d’un cycle économique se produit lorsqu’il y a une période prolongée des taux d’intérêt très bas, ce qui provoque une augmentation considérable des investissements, qui peut engendrer un surinvestissement qui ne devient plus rentable, c’est-à dire un excès dans l’offre. Dans ce cas de figure, on voit des investisseurs comme des personnes, des familles et des entrepreneurs qui profitent du faible coût de l’argent, et qui s’endettent exagérément et qui au bout du compte ne sont plus capables de retourner les prêts accordés.

Si on prend on considération le cas des Etats-Unis, une période exagérément prolongée de faibles taux d’intérêt a provoqué une situation de surinvestissement, spécialement sur le marché immobilier dans lequel on a construit d’innombrables maisons qui n’ont pa pu être vendues. On a en parallèle aussi généré des hypothèques poubelles sous formes de crédits qu’on a vendus à des entreprises et familles qui n’ont pas pu les rembourser. Concrètement, les banques, qui ont été dérégulées selon la théorie néolibérale, ont prêté de l’argent exagérément d’une part aux promoteurs immobiliers et d’autre part aux familles pour qu’elles puissent acheter les maisons construites par les promoteurs immobiliers. Mais ces mêmes banques se sont endettées auprès d’autres banques pour continuer à prêter aux promoteurs et aux familles afin de profiter de ce contexte de bas taux d’intérêt.

Mais les Etats-Unis ont aussi un déficit public élevé situé entre le 5% et 10% du PIB, comment est-ce possible que les taux d’intérêt aient été si bas durant si longtemps aux Etats-Unis, contredisant ainsi la théorie du double déficit qui nous dit qu’un déficit élevé induit une augmentation des taux d’intérêt? Et bien la raison est simple et s’appelle la Chine

Le rôle de la Chine

Le grand débat économique de la deuxième partie du XXème siècle, après la deuxième guerre mondiale est celui qui confronte une organisation de la société basée sur les marchés contre celle qui organise la société sur une base de planification centrale.

Organisation de la société basée sur les marchés:

  • Pays: USA, Europe de l’Ouest, Japon.
  • Les marchés s’organisent autour de la démocratie.
Organisation de la société sur une base de planification centrale:
  • Pays: URSS, Chine.
  • La planification centrale s’organise autour de la dictature du prolétariat.

Ce que nous a montré l’histoire, c’est qu’une organisation économique autour des marchés est plus efficace qu’un organisation basée sur la planification centrale. Les marchés et le libéralisme économique ont gagné la bataille contre la planification centrale, et la démocratie la bataille contre le communisme.

A partir de la chute du mur de Berlin en 1989:

  • l’URSS se décompose et se transforme, pour le moins formellement, en une structure démocratique et accueille une économie de marché.
  • La Chine, par contre, maintient la dictature du prolétariat, mais adopte une économie de marché.
On se trouve alors dans le cas de la Chine dans une situation inédite, que n’avait prévue aucun économiste, une realité dans laquelle le marché ne s’appuient pas sur la démocratie, mais sur un système de parti unique chinois. Un système hybride entre économie de marché et dictature a donc émergé !!

Chine

On a vu que la période prolongée des bas taux d’intérêt aux Etats-Unis, alors que le pays était soumis à un déficit public élevé, allait clairement à l’encontre de la théorie du double déficit et des recommandations de Hayek pour éviter un cycle économique dépressif? Pourquoi donc a eu lieu cette période prolongée de taux d’intérêt bas? Pour le comprendre, il faut considérer que la Chine adopta une décision stratégique dans les années 1990, suite à la chute du mur de Berlin. Elle décida d’adopter une économie de marché et d’acheter de la dette des Etats-Unis. Les Etats-Unis ont alors pu vivre avec un haut déficit public sans avoir le besoin d’élever les taux d’intérêt (contrairement à ce que recommande la théorie du double déficit), car l’émission de sa dette était en permanence couverte par la Chine. Mais alors pouquoi les Chinois avaient-ils intérêt à ce que les taux d’intérêt américains ne montent pas? Les Chinois avaient intérêt à lier leur monnaie, le yuan, au dollar, car si le dollar est bas, le taux de change avec le yuan est aussi bas, ce qui favorise les exportations chinoises.

Le système hybride entre économie de marché et dictature permet donc à la Chine d’appliquer une politique économique basée sur deux composantes fondamentales:

  1. Le dumping social mis en place par le régime de parti unique qui permet d’appliquer des conditions de travail qui seraient inadmissibles dans les pays et marchés occidentaux, induisant des coûts du travail extrêmement bas.
  2. Un yuan dévalué connecté avec un dollar aussi dévalué pour attaquer les marchés étrangers, grâce à l’achat de dette américaine.

La Chine est, pour le mieux ou pour le pire, le grand événement politico-économique du XXIème siècle. La Chine est à l’origine de la crise économique, mais probablement aussi la solution apparente à celle-ci comme on va le voir.

La résurrection de Keynes

La crise financière de 2008 a dans un premier temps évolué vers un nouveau panormama économique dans lequel la situation du chômage en augmentation ne coexistait pas avec une situation inflationniste comme dans les années 1970 lors du choc pétrolier, mais avec une situation déflationniste. Le chômage coexistait, juste après la crise, à nouveau avec une baisse des prix. Néanmoins la déflation peut être très dangereuse, la baisse des prix correspond à une réduction de consommation, et si les prix baissent exagérément, en dessous des coûts de production, les sociétés font alors des pertes ce qui peut engendrer un risque économique majeur. Mais comme on l’a vu, Keynes a la réponse pour combattre simultanément ce scénario de chômage accompagné d’une déflation: stimuler la demande agrégée.

Demande agrégée = Consommation des ménages + Investissement + Dépenses des Administrations publiques + Solde commercial

La politique économique keynésienne à appliquer serait donc:

  • Baisser les impôts pour favoriser la consommation.
  • Baisser les taux d’intérêt pour stimuler les investissements.
  • Augmenter les dépenses publiques.
  • Diminuer le taux de change de la monnaie pour rendre plus compétitive les exportations.

La stagflation

Cependant en quelques mois la situation a à nouveau changé, l’augmentation des prix du pétrole, des matières premières et du prix des aliments amènent une augmentation des prix, donc une forte inflation, qui coexiste à nouveau avec un chômage élevé, c’est ce qu’on appelle la stagflation. Comme durant la crise pétrolière des années 1970, l’inflation n’est pas due à une demande excessive, mais plutôt à des coûts trop élevés. Faut-il donc prioriser le problème du chômage ou celui de l’inflation? Keynes ne donne pas de réponse, car selon sa théorie ces deux problèmes ne peuvent apparaître simultanément. Les néolibéraux préconisent que pour lutter contre l’inflation des coûts, il faut migrer du niveau macroéconomique keynésien vers le niveau microéconomique des entreprises qui est l’endroit où réellement se produisent les coûts. Et ils proposent donc d’agir directement au sein des entrepises, afin de pouvoir diminuer les coûts de production, réduire les salaires, diminuer les coûts énergétiques, diminuer les coûts financiers, augmenter la productivité via l’incorporation de nouvelles technologies, et augmenter la compétitivité grâce à l’innovation.

On voit se dessiner deux postures distinctes pour résoudre cette situation de stagflation:

  1. La posture des Etats-Unis.
  2. La position de l’Union Européenne.

La position des Etats-Unis

Les Etats-Unis ont deux problèmes majeurs:

  1. Un déficit public et une dette publique très élevée.
  2. Un chômage élevé oscillant autour des 9%, alors que habituellement le chômage américain se situe aux alentours de 5%.

Entre le problème de la dette et du chômage, les Etats-Unis optent pour donner priorité à la résolution du problème de chômage, entre autre parce qu’Obama sait que pour être réélu en 2012, le taux de chômage doit passer de 9% à moins de 7%. Et pour baisser le chômage, on sait depuis Keynes qu’il faut stimuler la demande globale. La position des Etats-Unis est donc typiquement keynésienne. Pour appliquer cette posture keynésienne, le Etats-Unis doivent donc baisser les impôts, maintenir les taux d’intérêt bas (au dessous de 1%), augmenter les dépenses publiques, et maintenir un dollar dévalué.

Mais Obama a été confronté à un problème pour augmenter les dépenses publiques, car le déficit public américain est déjà abyssal et les républicains, de tradition néolibérale, ont la majorité à la chambre des représentants, et ces derniers sont traditionnellement hostiles à l’augmentation des dépenses publiques. Obama a dû alors faire une concession et clarifier quelle dépense publique il désirait augmenter. Les dépenses publiques ont fondamentalement deux composantes:

  1. Les dépenses courantes (par exemple les salaires des fonctionnaires…).
  2. Les dépenses d’investissement public (comme par exemple l’amélioration des infrastructures publiques, les investissements énergétiques, les télécommunications, etc…).

Obama a dû se limiter à augmenter les dépenses d’investissement public et se compromettre à diminuer au maximum les dépenses courantes (diminuer le nombre de fonctionnaires, les salaires de ceux-ci, etc…). Mais les Etats-Unis peuvent dormir tranquillement, ils ont la Chine qui va continuer à acheter leur dette publique générée par l’augmentation du déficit et des dépenses publiques américaines. Car comme on l’a vu, les Chinois ont intérêt à ce que les taux d’intérêt des Etats-Unis ne montent pas, afin que le taux de change du dollar lié au yuan ne change pas, ce qui favorise leurs exportations. D’ailleurs les journalistes ont demandé lors d’une conférence de presse à Hillary Clinton si les Etats-Unis avaient l’intention de faire pression sur la Chine en ce qui concerne les droits de l’homme et la révaluation du yuan…et la réponse de Hillary Clinton a été: “C’est très difficile de faire pression sur notre banquier!“. Cette dépendance des Etats-Unis vis-à-vis de la Chine est très dangereuse et va sans aucun doute conditionner l’histoire du XXIème siècle.

Dette USA

La position de l’Union Européenne

Actuellement les pays intégrés dans la zone Euro ne peuvent plus utiliser les intruments de politique monétaire que propose Keynes dans son équation. Les pays de la zone Euro n’ont plus le contrôle ni sur les taux d’intérêt, qui est délégué à la BCE, et ni sur les taux de change par dévaluation de la monnaie, vu que l’euro est la monnaie commune à tous les pays. Les instruments de politique économique dont disposent les pays de l’Union Européenne sont uniquement des instruments fiscaux: les impôts et les dépenses publiques. Le problème qui surgit alors pour ces pays avec une telle compétence économique limitée est que l’augmentation de la demande agrégée peut uniquement passer par une baisse des impôts et une augmentation des dépenses publiques qui génère un déficit public et une dette publique.

Zone Euro

De plus, les pays de la zone Euro ont tous signé le Traité de Maastricht de stabilité économique qui les oblige à contrôler et limiter le déficit public (3% du PIB) et la dette publique (60% du PIB). Pour diminuer le chômage, une politique fiscale expansive keynésienne soutenue dans le temps de baisse des impôts et d’augmentation des dépenses publiques afin de stimuler l’économie est donc interdite aux pays de la zone Euro.

Donc face à la recette keynésienne des Etats-Unis pour résoudre la crise, on voit que l’Union Européenne est contrainte à appliquer une recette néolibérale qui est d’ailleurs soutenue par l’Allemagne et Angela Merkel. Car l’Allemagne n’a pas de problème de chômage, celui-ci se situe entre 6-7%. Angela Merkel n’a donc pas intérêt à vouloir lutter contre le chômage qui se porte relativement bien dans son pays, elle doit prioriser la résolution du problème de déficit public et de dette publique. Hors il faut rappeler que lutter contre le chômage et lutter contre le déficit public sont deux politiques économiquement incompatibles selon Keynes:

Demande agrégée = Consommation des ménages + Investissement + Dépenses des Administrations publiques + Solde commercial

Lutter contre le déficit et la dette publique implique augmenter les impôts et réduire les dépenses publiques, deux pratiques qui vont à l’encontre de l’augmentation de la demande agrégée que recommande Keynes pour lutter contre le chômage.

La discipline de la politique budgétaire européenne soutenue par l’Allemagne oblige certains pays comme la Grèce, le Portugal, et l’Espagne…dont le déficit public dépasse actuellement les 10% du PIB à le réduire pour arriver à 3%, alors que le chômage est extrêmement élevé dans ces pays (20% en Espagne – 40% chez les jeunes). Hors, comme on l’a vu, réduire le déficit public implique augmenter les impôts et réduire les dépenses publiques ce qui a pour conséquence de générer encore plus le chômage au lieu de le diminuer, comme l’a expliqué Keynes dans sa fameuse équation de demande agrégée.

Les pays en difficulté de la zone Euro se trouvent donc dans une situation dans laquelle ils devraient, en accord avec une politique keynésienne, appliquer une politique expansive d’endettement, mais leur appartenance à l’Union Européenne les oblige à appliquer une politique économique restricitve.

Pour lutter contre l’inflation, Jean-Claude Trichet et la BCE sont sur la voie d’augmenter les taux d’intérêt. Hors comme on l’a dit l’inflation présente actuellement en Europe est une inflation des coûts et non une inflation due à une demande excessive. On sait grâce à la théorie du double déficit, qu’une augmentation des taux d’intérêt va amener une revalorisation de l’euro. Et une revalorisation de l’euro va engendrer une diminution des investissements et des exportations, ce qui va provoquer une diminution de la demande agrégée de Keynes, et donc diminuer la déjà faible croissance que possède l’Union Européenne, ce qui va induire une augmentation du chômage dans les pays périphériques européens. Sans compter le fait qu’une augmentation des taux d’intérêt dans un contexte d’inflation des coûts va augmenter les charges financières des entreprises qui devraient justement tout au contraire pouvoir reduire cette charge financière afin de diminuer leurs coûts et donc l’inflation qui en découle. La décision de la BCE d’augmenter les taux d’intérêt semble donc aller dans le sens des intérêts de l’Allemagne et dans une moindre mesure de la France, mais va totalement à l’encontre de la situation de stagflation que vivent les pays européens pris dans leur ensemble.

Signalons aussi que l’Allemagne impose sa politique économique aux autres pays européens subissant une crise importante, parce que les banques de ces pays actuellement en crise ont demandé d’énormes quantités de crédits aux banques allemandes. Un excès de politique néolibérale durant les années 2000 (comme aux Etats-Unis) a permis un endettement démesuré de certaines banques et caisses d’épargne auprès des banques allemandes, dans le but de financer l’accès au crédit facile accordé aux citoyens des pays actuellement en crise. Et l’Allemagne désire nettoyer le système financier de ces pays européens en crise afin que les banques de ceux-ci puissent rembourser leurs dettes contractées auprès des banques allemandes.

L’euro comme monnaie unique appliquée à des pays dont les structures économiques sont différentes (Allemagne vs Grèce) génère inévitablement des chocs asymétriques, car leurs économies ne croissent pas de la même manière. La politique économique restrictive adéquate pour l’Allemagne devient contre-productive pour d’autres pays européeens. Et le prix Nobel d’économie de 1999 Robert Mundell l’avait prédit. Mundell expliqua que pour qu’une zone monéraire unique soit optimale il faut remplir un certain nombre de critères:

  • La convergence des amplitudes macroéconomiques entre les différents pays (même inflation, mêmes taux d’intérêt, déficit public -3% du PIB- et dette publique -60% du PIB- semblables)
  • La liberté de mouvement de tous les facteurs productifs entre les pays:
    • Facteur travail (libre circulation des personnes)
    • Facteur capital (libre circulation des flux financiers)

Et dans le cadre le zone Euro, tous ces critères de Mundell sont remplis, sauf celui de la liberté de circulation des personnes, qui est en théorie existe, mais en pratique est confrontée à des barrières culturelles. Par exemple dans le cas de l’Espagne avec un 40% de chômage chez les jeunes, l’Allemagne propose aux étudiants espagnols d’émigrer en Allemagne pour trouver du travail, soutenu par le programme Erasmus et de Bologne pour l’harmonisation et la reconnaissance des diplômes. Mais ce programme s’addresse uniquement aux étudiants qualifiés et universitaires, sans compter les barrières linguistiques qui sont un frein supplémentaire à la mobilité des personnes.

Conclusion

Ce qui a fait s’écrouler le keynésianisme et le néolibéralisme ce ne sont pas leurs politiques, mais leurs excès qui ont donné naissances aux plus grandes crises économiques récentes:

  • Excès du keynésianisme: une croissance démesurée du secteur public a converti beaucoup d’économies capitalistes en économies inefficaces lors de la crise pétrolière et monétaire des années 1970.
  • Excès du néolibéralisme: la dérégulation des marchés financiers est à l’origine de la crise financière de 2008 et de la crise des subprimes.

De la même manière que des cendres du keynésianisme a surgi triomphalement le néolibéralisme de Friedman et Hayek dans les années 1980, on constate actuellement que des cendres des excès du néolibéralisme resurgit une politique économique keynésienne au-travers des Etats qui a permis de réinjecter d’énormes quantités d’argent dans le système financier néolibéral pour le sauver et éviter que la récession économique se convertisse en grande dépression. Mais cette injection massive d’argent public a converti le problème de dette privée liée au marché financiers en un problème de dette publique des Etats.

Malgré le fait, comme on l’a vu, que la Chine soit à l’origine de la crise économique actuelle, elle est aussi à la base de la politique économique d’endettement qu’Obama met en place aux Etats-Unis. Il suffit aussi de se promener dans les différentes capitales européennes et dans les différents polygones industriels pour constater que la Chine applique implacablement son modèle d’expansion économique, qui consiste à créer des entreprise chinoises qui emploient des Chinois pour vendre des produits chinois fabriqué par des Chinois en Chine. Les revenus générés par ces entreprises chinoises installées dans les pays européens et consommées par des européens sont versés dans des banques chinoises qui renvoie cet argent en Chine. Ce modèle permet d’augmenter en permanence les reserves en devises de la Chine qui s’élèvent actuellement à 13 billions de dollars (13 mille milliards). Et avec cet argent la Chine peut acheter le monde, de fait la Chine est en train de racheter des sociétés qui contrôlent les matières premières stratégiques (matériaux, minéraux) présents en Afrique et en Amérique latine…la Chine est donc en train d’obtenir le contrôle de l’économie mondiale.

Pour ne pas terminer sur une note trop noire et se détendre un peu, voici 2 vidéos (en anglais) excellement produites sous forme de rap qui mettent en perspectives les théories de Keynes vs Hayek:

Sources:

http://efectoesponja.com/keynes-vs-hayek-china-y-julian-pavon/

http://fr.wikipedia.org/wiki/Demande_agr%C3%A9g%C3%A9e

http://fr.wikipedia.org/wiki/Keyn%C3%A9sianisme

http://fr.wikipedia.org/wiki/N%C3%A9olib%C3%A9ralisme

VN:F [1.9.17_1161]
Rating: 4.3/5 (4 votes cast)
Tagged with:  
VN:F [1.9.17_1161]
Rating: 0.0/5 (0 votes cast)
  • Créationnisme: doctrine religieuse fondée sur la croyance selon laquelle la vie, la Terre, et par extension l’Univers, ont été créés par Dieu, selon des modalités conformes à une lecture littérale de la Bible.
    • Ses partisans affirment que le monde a été créé par Dieu en six jours et soutiennent que Dieu aurait créé chaque espèce végétale ou animale de façon individuelle.
    • Le premier jour de la création aurait été le 23 octobre 4004 av. J.-C !!!
    • Né au XIXème siècle et très implanté aux Etats-Unis, particulièrement dans la communauté des mormons, et présent aussi dans de nombreuses autres Eglises protestantes, anglicanes et évangéliques.
    • Il est de plus en plus présent dans les écoles et dans l’éducation. L’enseignement de la théorie de l’évolution dans les écoles publiques de plusieurs États américains (dont le Tennessee) était interdite jusqu’en 1968.
    • Cette lecture littérale de la Bible telle que prônée par les créationnistes est refusée par la majorité des Églises chrétiennes actuelles privilégiant une lecture interprétative.
    • Différents sous-courants au sein même du créationnisme:
      • Le créationnisme littéraliste, qui part d’une lecture littérale de la Bible (adopté par 15 millions de personnes).
        • Le Créationnisme Jeune-Terre: une des formes les plus radicales de créationnisme défendue notamment dans les Églises chrétiennes évangéliques américaines, par une partie de l’Église orthodoxe russe hors frontières, et par certains courants islamistes, qui affirment que la Terre a littéralement été créée en six jours par Dieu, que l’évolution des espèces est un mythe, qu’Adam et Ève ont littéralement vécu et péché dans le jardin d’Eden, et que les fossiles retrouvés sont des objets créés par le Diable pour tromper les êtres humains.
      • Le créationnisme concordiste, qui cherche un accord entre le texte et la recherche scientifique (20 – 25 millions d’adeptes).
        • Le Créationnisme Vieille-Terre: vu les récentes découvertes en astrophysique et en biochimie, ce courant de créationnisme Vieille-Terre tente de conjuguer/réconcilier orthodoxie scientifique et orthodoxie religieuse. Comme son nom l’indique, sa caractéristique est qu’il conçoit que l’origine de l’Univers et de la vie sur Terre remonte à une longue période, des millions, voire des milliards d’années. C’est une forme de créationnisme qui accepte de reconnaître l’âge avancé de la Terre  (acceptant l’existence du Big Bang, que refusent les créationnistes Jeune-Terre), tout en adhérant à la croyance selon laquelle le Big Bang serait un événement créateur avec Dieu pour auteur.
      • Le créationnisme finaliste, qui adopte l’approche scientifique sans réserve mais en discute la finalité (tendance qui serait la plus répandue aux États-Unis et la mieux implantée en Europe également).
      • Le créationnisme théiste ou créationnisme évolutionniste, dans lequel Dieu est reconnu comme Créateur mais dont la Création suivrait son cours librement ensuite (environ 20 millions d’adeptes). Selon eux certains, voire tous les enseignements classiques sur Dieu et la Création sont compatibles avec tous ou presque tous les enseignements de la théorie de l’évolution.
        • Le Dessein Intelligent:
          • Le dessein intelligent (Intelligent Design) est l’hypothèse selon laquelle certaines observations de l’univers et du monde du vivant sont mieux expliquées par une cause intelligente que par des processus non dirigés tels que la sélection naturelle.
          • Cette thèse a été développée par le Discovery Institute (au-travers d’un document à usage interne The Wedge), un cercle de réflexion (Think Tank) conservateur chrétien américain.
          • Le dessein intelligent est présenté comme une théorie scientifique par ses promoteurs, mais dans le monde scientifique, il est considéré comme relevant de la pseudo-science, tant par des arguments aussi bien internes à la biologie (les promoteurs du dessein intelligent apparaissant aux biologistes comme ne tenant pas compte de nombreuses observations) qu’épistémologiques (ne répond donc pas en particulier au critère de réfutabilité de Karl Popper – une théorie ne peut être qualifiée de scientifique que si elle permet des prédictions pouvant être invalidées par l’expérimentation).
          • D’un point de vue idéologique, les principaux acteurs du mouvement du dessein intelligent acceptent un univers âgé de plus de 13 milliard d’années (voir créationnisme vieille terre) et la théorie du Big Bang, avec pour opinion personnelle qu’il est causé par une sorte de grand horloger.
          • Ils rejettent le mécanisme de mutation aléatoire couplé à une sélection naturelle comme moteur de l’apparition de nouvelles espèces. Ils affirment que la théorie scientifique traditionnelle de l’évolution par voie de sélection naturelle ne suffit pas pour rendre compte de l’origine, de la complexité et de la diversité de la vie.
          • Richard Dawkins, biologiste critique du dessein intelligent, soutient dans son livre “The God Delusion” que permettre à un designer intelligent d’être responsable pour une complexité improbable repousse seulement le problème, car selon lui, un tel designer devrait être au moins aussi complexe.
          • Les promoteurs du dessein intelligent affirment que certains groupes d’éléments biologiques forment un tout fonctionnel dont il est très improbable qu’il soit le résultat de l’évolution de sous-parties qui le constituent : tous ses éléments doivent être apparus simultanément et correctement reliés pour être fonctionnels.
          • Ils prônent que les racines de leur mouvement se retrouvent chez certains penseurs grecs antiques comme Socrate, Platon, Aristote qui pensaient que l’apparition du monde naturel nécessitait un esprit, ou encore Cicéron qui voyait dans les étoiles et l’adaptation des animaux une preuve d’un design rationnel.
          • Le dessein intelligent ne spécifie pas l’identité du designer (du grand horloger), et affirme que sa nature, extraterrestre ou supranaturelle, ne peut être déterminée par une science matérialiste.
          • Enfin, la démarche adoptée par les tenants du dessein intelligent s’oppose à la démarche scientifique en ce qu’ils ne tentent pas de démontrer que leurs arguments sont valables mais demandent à leurs détracteurs de prouver qu’ils ne le sont pas.
  • Quelques chiffres:
    • En 2011, l’institut français IPSOS a réalisé un sondage pour l’agence de presse Reuters sur la position de la population de 24 pays sur le créationnisme et l’évolutionnisme:
    • En Suisse, plusieurs associations militent contre la théorie de l’évolution et pour une lecture littérale de la Bible :
      • le Centre biblique européen, fondée en 1983 à Vuarrens.
      • l’Alliance Pierres Vivantes, fondée en 1986 à Siviriez.
      • l’association Création Bible Science, fondée en 1987 à Vevey
    • En Belgique, une enquête a montré que 20 % des Flamands adhéraient à la théorie du créationnisme en 2008.
    • En France, l’Université Interdisciplinaire de Paris (UIP) est une association qui regroupe 1 250 adhérents, qui existe depuis 1995 et qui organise des conférences soupçonnées de défendre le créationnisme.
    • L’institut de recherche Pew aux États-Unis a réalisé en juillet 2005 un sondage montrant que 64 % des Américains étaient favorables à l’enseignement du dessein intelligent en plus de la théorie de l’évolution et que 38 % ne voulaient pas que la théorie de l’évolution soit enseignée dans les écoles publiques. Un autre sondage mené fin 2007 par le journal des sociétés de biologie américaines (FASEBJ) affirme que 61 % des Américains sont d’accord avec le concept d’évolution et 29 % des sondés estiment que la vie a été créée sous sa forme actuelle.
      • La portée officielle du créationnisme est aujourd’hui délaissée au profit des théories de l’intelligent design. Plus aucun État américain n’a inscrit dans son programme l’enseignement à parité du créationnisme et de l’évolution, mais les écoles privées jouissent encore d’une liberté à ce sujet.
    • Dans les années 2000, l’enseignement du créationnisme progresse dans les établissements d’Allemagne, des Pays-Bas, de Russie, de Suède et de Pologne.
      • Dans plusieurs pays européens, il semblerait que de plus en plus d’étudiants s’opposent à l’enseignement de l’évolution en cours.
      • Un sondage effectué au début de 2006 par la chaîne BBC révèle que près de 40 % des personnes interrogées veulent que le créationnisme soit enseigné en cours de science au Royaume-Uni.
    • Les arguments créationnistes d’origine chrétienne sont aussi devenus populaires parmi les musulmans, notamment en Turquie, en Indonésie, en Malaisie et dans la diaspora musulmane européenne et nord-américaine.
      • Adnan Oktar (pseudonyme Harun Yahya) est une des figures centrales du créationnisme en Turquie. Il y quelques années son Atlas de la Création, un ouvrage créationniste de plus de huit cents pages, a été envoyé à de nombreuses institutions dans différents pays.
      • En 2008, la deuxième Cour Criminelle de Paix turque a fait bloquer l’accès au site RichardDawkins.net du Professeur Richard Dawkins suite à des critiques qu’il a formulé contre le créationnisme.
    • Le judaïsme n’est pas non plus en reste, certains courants contemporains du judaïsme acceptent le créationnisme évolutionniste (créationnisme théiste).
    • En juin 2007 un comité spécial du Conseil de l’Europe a préparé un dossier spécial sur les dangers du créationnisme dans l’éducation qui établit une liste d’organismes européens suspectés de faire la promotion du créationnisme.
  • Autres théories exotiques:
  • Panspermie: théorie qui affirme que la Terre aurait été fécondée de l’extérieur, par des moyens extraterrestres, à partir de corps rocheux comme les comètes. Elle a été proposée dans sa forme moderne par Hermann von Helmholtz en 1878.
  • Simulisme: il s’agit d’un concept qui consiste à supposer que la réalité que nous percevons puisse être le fruit d’une simulation informatique. C’est une théorie qui explore la possibilité que nous vivions dans une sorte de réalité simulée.
    • Etant donné que les puissances de calcul des ordinateurs sont de plus en plus performante et croissent exponentiellement (Loi de Moore), les promoteurs du simulisme avancent que d’ici 2029 on sera capable de créer un jeu virtuel qui pourrait simuler en grande partie notre Univers et ses lois physiques, avec des avatars capables comme les humains d’avoir des émotions, des relations sociales et une intelligence artificielle.
    • Les promoteurs de cette idée avancent que si l’humanité est capable de créer un tel environnement virtuel, une telle simulation informatique, il n’est pas impensable d’imaginer que nous même, notre humanité, notre civilisation, vivions dans une simulation informatique et que notre réalité soit simulée.
    • Pour l’anecdote, ils s’appuient sur le personnage de Morpheus dans Matrix qui dit: “Si le réel est ce que nous sentons, ce que nous goutons, ce que nous entendons et ce que nous voyons, alors le réel est seulement constitué de signaux interprétés par notre cerveau”.
    • Cette idée du simulisme est avancée par certains promoteurs du courant transhumaniste.

 

VN:F [1.9.17_1161]
Rating: 0.0/5 (0 votes cast)
Tagged with:  

Dossier – La Lumière

On 26.05.2011, in Dossiers, by Mathieu
VN:F [1.9.17_1161]
Rating: 4.0/5 (1 vote cast)

Il n’est pas facile de définir la lumière, car elle peut être représentée de deux façon différentes:

  • Nature ondulatoire.
  • Nature corpusculaire (particule).

La métaphore du cylindre est l’exemple d’un objet ayant des propriétés apparemment inconciliables. Il serait à première vue incongru d’affirmer qu’un objet a à la fois les propriétés d’un cercle et d’un rectangle; sur un plan (au sens géométrique), un objet est soit un cercle, soit un rectangle. Mais si l’on considère un cylindre : une projection dans l’axe du cylindre donne un cercle (source lumineuse dans l’axe projette une ombre en cercle sur un mur), et une projection perpendiculairement à cet axe donne un rectangle (source lumineuse perpendiculaire à l’axe projette un ombre rectangle sur un mur). On a donc bien un objet ayant les propriétés d’un cercle et d’un rectangle (mais il n’est ni l’un, ni l’autre).

Dualité

Quand on dit que la lumière est à la fois onde et particule, ce sont des manières de voir les choses et non pas les choses en elles-même, ce sont des représentations.

Nature ondulatoire

La lumière visible est composée de l’ensemble des ondes électromagnétiques visibles par l’oeil humain, c’est-à-dire comprises dans des longueurs d’onde situées entre le violet et le rouge.

Outre la lumière visible, par extension, on appelle aussi parfois « lumière » d’autres ondes électromagnétiques, telles que celles situées dans les domaines de fréquences de l’ultraviolet et de l’infrarouge.

Spectre optique

Ce sont les travaux sur l’életromagnétisme de James Clerk Maxwell aboutis en 1873 qui permettent d’expliquer le phénomène ondulatoire de la lumière. Il définit la lumière comme une onde qui se propage sous la forme d’un rayonnement électromagnétique (le rayonnement électromagnétique est une variation des champs électriques et magnétiques). Maxwell a montré que la lumière peut être modélisée par un champ électromagnétique (qui se propage dans une direction perpendiculaire à lui-même). Lorsque ce champ a une fréquence bien déterminée, l’onde associée peut être caractérisée par sa longueur d’onde qui dépend, d’ailleurs, du milieu où elle se propage. Dans le cas de la lumière visible, la couleur perçue par le cerveau, via l’œil, est la manifestation de la fréquence et non de la longueur d’onde (la diffraction, les interférences ou la polarisation nécessitent de prendre en compte la nature ondulatoire de la lumière).

Le spectre du rayonnement lumineux visible n’est qu’une partie de l’ensemble du rayonnement électromagnétique, beaucoup plus large : infrarouge, ultraviolet, ondes radio, rayons X, les rayons γ

Spèctre

Ce sont les fameuse équations de Maxwell qui permettent de développer une théorie générale de l’électromagnétisme. Elles permettent d’expliquer aussi bien la propagation de la lumière que le fonctionnement d’un électroaimant. Ces équations de Maxwell constituent des lois fondamentales de la physique et sont des postulats de base de l’électromagnétisme. Elles décrivent la force électromagnétique, qui est l’une des 4 forces fondamentales de l’Univers.

Nature corpusculaire

C’est Newton qui avait développé au départ une théorie purement corpusculaire de la lumière. Plus tard, la physique du XXéme siècle a montré que l’énergie transportée par la lumière est quantifiée grâce à des particules qu’on appelle photons. Le concept de photon a été développé par Albert Einstein entre 1905 et 1917 pour expliquer des observations expérimentales qui ne pouvaient être comprises dans le cadre d’un modèle ondulatoire classique de la lumière. Il a ainsi montré que parallèlement à son comportement ondulatoire — interférences et diffraction —, la propagation du champ électromagnétique présente simultanément des propriétés corpusculaires. On appelle photon:

  • le quantum d’énergie, c’est à dire la plus petite quantité d’énergie, indivisible, qui compose la lumière.
  • le photon peut être représenté comme une particule porteuse d’énergie, mais dépourvue de masse!

Le pénomène de rayonnement ou radiation en physique désigne le processus d’émission ou de transmission d’énergie impliquant une particule porteuse. Le rayonnement électromagnétique a comme vecteur le photon. À chaque type de radiation correspond sa particule porteuse : le photon pour le rayonnement électromagnétique, ou les particules alphabêta ou neutron pour respectivement les rayonnement alphabêta ou neutronique

Dualité onde-particule

La théorie ondulatoire de Maxwell ne rend pas compte de toutes les propriétés de la lumière. Cette théorie prédit que l’énergie d’une onde lumineuse dépend seulement de l’amplitude de l’onde, mais pas de sa fréquence. Or de nombreuses expériences indiquent que l’énergie transférée de la lumière aux atomes dépend seulement de la fréquence et non de l’amplitude. En 1905, Albert Einstein réconcilia la théorie de Maxwell avec celle de Newton : il expliqua l’effet photoélectrique, un effet dans lequel la lumière n’agit pas en tant qu’onde, mais en postulant l’existence des photons. L’effet laser s’explique aussi en terme de photons. Einstein postula que la fréquence ν de la lumière, est liée à l’énergie E des photons.

Le spectre électromagnétique est la décomposition du rayonnement électromagnétique selon ses différentes composantes en termes de fréquence ν (ou période T), de longueur d’onde λ associée ou d’énergie des photons E.

Spectre onde electromagnetique

Mise en évidence de la dualité grâce aux fentes de Young

Une des manières les plus claires de mettre en évidence la dualité onde-particule est l’expérience des fentes de Young. Cette expérience est connue depuis le XIXe siècle, où elle a d’abord mis clairement en évidence l’aspect purement ondulatoire de la lumière. Modifiée de manière adéquate, elle peut démontrer de manière spectaculaire la dualité onde-corpuscule de la lumière.

L’expérience consiste à éclairer par une source lumineuse un écran percé de deux fentes très fines et très rapprochées. Ces deux fentes se comportent comme deux sources secondaires d’émission lumineuse. Une plaque photographique placée derrière l’écran enregistre la lumière issue des deux fentes.

Fentes de Young

 

Ces deux sources interfèrent et forment sur la plaque photographique des franges lumineuses que l’on appelle une figure d’interférence. Cette figure est caractéristique d’un comportement ondulatoire de la lumière. Si l’expérience en reste à ce niveau, l’aspect corpusculaire n’apparaît pas.

Interférences

En fait, il est possible de diminuer l’intensité lumineuse de la source primaire de manière à ce que la lumière soit émise photon par photon. Le comportement de la lumière devient alors inexplicable sans faire appel à la dualité onde-corpuscule. Si on remplace la source lumineuse par un canon qui tire des micro-billes à travers les deux fentes, donc de “vraies” particules, on n’obtient aucune figure d’interférence, mais simplement une zone plus dense, en face des fentes, correspondant aux impacts des micro-billes. Or, dans le cas d’une émission lumineuse de faible intensité et envoyée par une sorte de canon à photons, on constate que l’impact de la lumière sur l’écran est marqué de la même manière que les micro-billes. Au fur et à mesure que les impacts augmentent sur la plaque photographique, on retrouve petit à petit une figure d’interférence reconstituée par l’ensemble des impacts des photons. On retrouve donc une figure d’interférence caractéristique des ondes, en même temps qu’un aspect corpusculaire des impacts sur la plaque photographique.

L’interprétation de cette expérience est difficile, car si on considère la lumière comme une onde, alors les points d’impacts sur la plaque photographique sont inexplicables; on devrait voir dans ce cas très faiblement, dès les premiers instants, la figure d’interférence, puis la voire de plus en plus intense. Au contraire, si on considère la lumière comme étant exclusivement composée de particules, alors les impacts sur la plaque photographique s’expliquent aisément, mais la figure d’interférence qui se crée peu à peu ne s’explique pas : comment et pourquoi certaines zones seraient privilégiées et d’autres interdites à ces particules ?

L’existence du photon ne contredit pas la théorie ondulatoire, au contraire : en mécanique quantique, la dualité onde-particule (ou onde-corpuscule) dit qu’à chacune des particules est associée une onde. Cette onde est appelée fonction d’onde de la particule, et c’est elle qui code la densité de probabilité des variables mesurables de la particule.  Si on considère le déplacement d’un unique photon (la position du photon est l’une des variables de la particule), les points d’arrivée possibles sont donnés sous forme de probabilités par l’onde associée. Sur un très grand nombre de photons, chaque lieu d’arrivée est illuminé avec une intensité proportionnelle à la probabilité de chacun des photons… ce qui correspond au résultat de la figure d’interférence de la théorie classique ondulatoire.

Sur la plaque photographique de l’expérience des fentes de Young, il se produit ce que l’on appelle une réduction du paquet d’onde, ou une décohérence de la fonction d’onde : le photon se matérialise, avec une probabilité donnée par la fonction d’onde: élevée à certains endroits (frange brillante), faible ou nulle à d’autres (franges sombres).

Cette expérience illustre également une caractéristique essentielle de la mécanique quantique:

  • Jusqu’à ce qu’une observation soit faite, la position d’une particule est décrite en termes d’ondes de probabilité, mais après que la particule est observée (ou mesurée), elle est décrite par une valeur fixe.

La lumière est donc considérée comme constituée de photons qui se comportent comme:

  • des corpuscules dans leurs interactions avec la matière.
  • des ondes pour leur propagation.

Optique Géométrique

L’optique géométrique est une approche complémentaire de l’optique ondulatoire et de l’optique quantique. Elle est en revanche plus ancienne, ayant été développée dès l’antiquité. C’est l’optique géométrique, qui reste l’outil le plus flexible et le plus efficace pour expliquer un certain nombre de phénomènes simples liés à la lumière. Par exemple, la lumière incidente sur l’interface entre deux milieux peut être réfléchieréfractée (dispersée) ou absorbée.

Réflexion-Réfraction

Réflexion

La lumière se déplace en ligne droite dans tout milieu transparent, en particulier dans le vide ou l’air. Dans le vide, la lumière se déplace à une vitesse fixe et indépassable d’environ 300’000 km/s. La lumière est un peu plus lente dans l’air, et notablement plus lente dans l’eau.

Le phénomène de réflexion est dû au fait que les rayons lumineux sont déviés (réfléchis) lors de la rencontre d’une surface réfléchissante (miroir). Les rayons lumineux réfléchis le sont tels que l’angle de réflexion est égal à l’angle d’incidence sur la surface réfléchissante.

Réfraction

La réfraction survient généralement à l’interface entre deux milieux, ou lors d’un changement de densité du milieu. Les rayons lumineux peuvent changer de trajectoire lors du passage d’un milieu à un autre. Tout milieu homogène dans lequel se propage un rayon lumineux possède un indice de réfraction. En tombant sur une surface (dioptre) séparant le milieu où il se propage (milieu d’incidence) d’un autre milieu possédant un autre indice de réfraction, ça donne naissance, dans ce second milieu, à un rayon qui n’est pas dans son prolongement, qui est dévié: c’est le rayon réfracté. Le fonctionnement des lentilles est basé sur ce phénomène de réfraction de la lumière.

Refraction Verre

Dans l’approche ondulatoire, la réfraction est un phénomène de déviation d’une onde lorsque sa vitesse change entre deux milieux. La vitesse de la lumière n’est pas la même dans les deux milieux. Ce changement de valeur suffit à interpréter le changement de direction de l’onde.

Lorsque la lumière incidente est monochromatique, on parle de simple pénomène de réfraction. Dans le cas de la lumière polychromatique, la réfraction conduit alors à un phénomène plus étendu et généralisé qu’on appelle de dispersion.

Dispersion

La dispersion est le phénomène affectant une onde dans un milieu dans lequel les différentes fréquences constituant l’onde ne se propagent pas à la même vitesse. L’indice de réfraction du milieu n’est pas le même pour toutes les composantes ondulatoires d’un rayon lumineux polychrome. L’indice de réfraction dépend de la longueur d’onde des composantes de la lumière.

Dispersion

Les arcs-en-ciel sont une manifestation de la dispersion induite par réfraction des rayons du soleil par les gouttelettes d’eau en suspension dans l’air.

La lumière blanche peut aussi se décomposer en arc-en-ciel à l’aide d’un prisme de verre. La décomposition de la lumière génère des raies spectrales qui correspondent aux différentes longueurs d’ondes émises. Le terme spectre fut employé pour la première fois en 1666 par Isaac Newton pour se référer à ce phénomène par lequel un prisme de verre peut séparer les couleurs contenues dans la lumière du Soleil. Chaque « couleur spectrale » de cette décomposition correspond à une longueur d’onde précise. Etant donné que l’indice de réfraction n’est pas le même pour les différentes longueurs d’onde d’un faisceau de lumière blanche: le bleu est plus dévié que le jaune, lui-même plus dévié que le rouge…

Dans les expériences du prisme, du point de vue de l’optique géométrique, un prisme est l’association de deux dioptres plans non parallèles (air-verre-air).

prisme

Absorption

L’absorption, en électromagnétisme, désigne un processus physique par lequel l’énergie électromagnétique est transformée en une autre forme d’énergie.

Au niveau des photons, l’absorption représente le phénomène par lequel l’énergie d’un photon est capturée par une autre particule, par exemple par les électrons qui se traduit par une transition entre 2 niveaux d’énergie électronique. Le photon est alors détruit par l’opération, l’énergie électromagnétique est absorbée et transformée en énergie électronique. On voit donc que l’absorption d’un photon peut provoquer des transitions atomiques, c’est-à-dire d’exciter un atome dont l’énergie augmente par la modification de l’orbite d’un de ses électrons. Cette énergie absorbée peut par la suite être:

  • re-transformée en énergie électromagnétique par l’émission de nouveau(x) photon(s). Lorsqu’un atome excité revient à son état d’énergie fondamental, il émet un photon dont l’énergie (et donc la fréquence) correspond à une différence entre deux états d’énergie de l’atome.
  • transformée en agitation particulaire (augmentation de la vitesse de la particule) ce qui se traduit au niveau macroscopique par une augmentation de la température (l’énergie électromagnétique a été transformée en chaleur).

C’est Niels Bohr qui interpréta l’émission de lumière par l’émission d’un photon lorsque l’atome passe d’un niveau d’énergie à un autre. Le spectre d’émission de n’importe quel élément peut être obtenu en chauffant cet élément, puis en analysant le rayonnement émis par la matière. Ce spectre est caractéristique de l’élément. Les photons sont ainsi des « paquets » d’énergie élémentaires, ou quanta de rayonnement électromagnétique, qui sont échangés lors de l’absorption ou de l’émission de lumière par la matière.

Pour la plupart des substances, le taux d’absorption varie avec la longueur d’onde de la lumière incidente, menant à l‘apparence de couleur dans les pigments qui absorbent certaines longueurs d’onde mais pas d’autres. Par exemple, avec une lumière blanche incidente, un objet qui absorbe les longueurs d’onde dans le bleu, vert et jaune, apparaîtra de couleur rouge. Un matériau de couleur noire absorbe toutes les longueurs d’onde (converties en chaleur), alors qu’un matériau de couleur blanche les réfléchit.

Diffraction

L’optique géométrique qui explique bien la grande partie des phénomènes de réflexion et réfraction ne permet pas d’expliquer tous les phénomènes lumineux. En particulier, elle ne tient pas compte du fait que la lumière est de nature ondulatoire. Lorsque tous les objets qui interagissent avec la lumière ont des tailles caractéristiques grandes devant la longueur d’onde du rayon lumineux alors il est convenable et plus simple d’utiliser l’optique géométrique pour décrire son comportement avec une bonne précision. Mais quand la lumière passe à travers des objets dont la taille est du même ordre de grandeur (voire plus petits) que sa longueur d’onde, alors il n’est plus possible de négliger l’aspect ondulatoire et on entre dans le domaine de l’optique ondulatoire. Deux phénomènes caractéristiques de l’optique ondulatoire, inexplicables dans le contexte de l’optique géométrique, sont les interférences lumineuses (Fentes de Young) et la diffraction.

La diffraction est le phénomène par lequel un rayonnement, comme la lumière, est dévié dans de multiples directions par une interaction avec d’autres objets ou un obstacle. La diffraction décrit donc le comportement des ondes lorsqu’elles rencontrent un obstacle. Elle se manifeste par le fait qu’après la rencontre d’un objet, la densité de l’onde n’est pas conservée selon les lois de l’optique géométrique. La diffraction s’observe avec la lumière, mais également avec le son, les vagues, les rayons X…. Elle est une signature de la nature ondulatoire d’un phénomène.

On parle d’interférence lorsque deux ondes de même type se rencontrent et interagissent l’une avec l’autre. La diffraction est le résultat de l’interférence des ondes diffusées par chaque point.

Diffraction

Exemple Pratique: Miroir et Photon

Soit un miroir avec un pouvoir réflecteur de 90 % (on considère qu’on reste dans le cadre la lumière visible humaine). Une source envoie simultanément 100 photons à la même fréquence contre ce miroir. Que va-t-il se passer?

  • Le miroir va réfléchir 90 photons et en absorber 10 (l’absorption des 10 photons pourrait se traduire par une petite augmentation de chaleur du miroir).

Sur quel critère 10% des photons vont passer à la “trappe” et vont être absorbé s’ils sont tous semblables. Qu’est ce qui va etre déterminant sur le choix des photons à réfléchir et ceux qui vont être absorbé ?

  • Sur la base de la nature corpusculaire de la lumière dont l’essence est intrinséquement probabiliste selon la mécanique quantique, le photon aura 9 chances sur 10 d’être réfléchi et 1 chance sur 10 d’être absorbé.

Un autre question plus tordue: un seul photon est émis, et envoyé à la rencontre du miroir. Celà voudrait-il dire que 0,9 photon est réfléchi et 0,1 est absorbé? Qu’est ce que 0,9 photon?

  • A nouveau, le photon aura 9 chances sur 10 d’être réfléchi, et 1 chance sur 10 d’être absorbé.

Ce qu’il faut savoir c’est que en réalité, ça n’a même pas de sens de se demander “lesquels” des 100 photons sont réfléchis et lesquels sont absorbés, parce qu’on ne peut pas les individualiser. Il faut plutot imaginer l’état d’un champ composés de 100 photons. Ce champs va évoluer vers un nouvel état composés de 90 photons réfléchis, l’énergie manquante ayant été absorbée. La même idée peut être expliqué dans le fonctionnement des comptes bancaires: c’est comme si la banque prélevait 10 euros de frais et commission sur 100 euros déposés sur un compte… on ne se pose pas la questions sur quels sont les euros parmi les 100 qui ont été prélevés!

Sources:

http://fr.wikipedia.org/wiki/Lumi%C3%A8re

http://fr.wikipedia.org/wiki/Rayonnement_%C3%A9lectromagn%C3%A9tique

http://fr.wikipedia.org/wiki/Photon

http://fr.wikipedia.org/wiki/Dualit%C3%A9_onde-particule

http://fr.wikipedia.org/wiki/Optique_g%C3%A9om%C3%A9trique

http://fr.wikipedia.org/wiki/R%C3%A9fraction_des_ondes

http://fr.wikipedia.org/wiki/Absorption_(optique)

http://fr.wikipedia.org/wiki/Dispersion

http://fr.wikipedia.org/wiki/Diffraction

http://forums.futura-sciences.com/physique/268537-miroir-photon-oeoeoeoemoi-2-autres-menervent.html

VN:F [1.9.17_1161]
Rating: 4.0/5 (1 vote cast)

Dossier – L’Energie Noire

On 12.05.2011, in Dossiers, by Mathieu
VN:F [1.9.17_1161]
Rating: 5.0/5 (1 vote cast)

L’énergie noire est une forme hypothétique d’énergie qui remplirait tout notre Univers et qui a été indirectement mise en évidence par diverses observations astrophysiques, notamment l’accélération de l’expansion de l’Univers.

  • L’Univers est non seulement dans une phase d’expansion, mais aussi dans une expansion qui s’accélère.
  • Du fait de sa nature répulsive, l’énergie noire a tendance à accélérer l’expansion de l’Univers, plutôt que la ralentir, comme le fait la matière normale par effet attractif gravitationnel.

Une façon intuitive de visualiser l’expansion de l’Univers est de prendre l’analogie d’une toile élastique que l’on étire dans toutes les directions:

  • Si l’on dessine des motifs sur la toile, alors ceux-ci vont grossir en même temps qu’ils semblent s’éloigner les uns des autres lorsque l’on étire la toile.
  • Par contre, si au lieu de dessiner des motifs on colle sur la toile un objet rigide (une pièce de monnaie par exemple), alors, en étirant la toile, on va éloigner les objets les uns des autres, mais cette fois ils vont garder une taille constante.
  • C’est un processus de ce type qui est à l’œuvre avec l’expansion de l’Univers.
    • L’expansion de l’Univers ne signifie pas que les objets astrophysiques voient leur taille varier.
    • Ce n’est que leur distance mutuelle qui varie au cours du temps, et ce uniquement pour des objets suffisamment éloignés.

Historique

Historiquement, la seule forme d’énergie (hypothétique) se comportant comme de l’énergie noire était la constante cosmologique, proposée dans un autre contexte par Albert Einstein en 1916.

En 1916, date à laquelle l’expansion de l’univers n’était pas connue, Albert Einstein considérait que l’Univers devait être statique, aussi lui fallait-il introduire une nouvelle force s’opposant à la force de gravitation, afin d’expliquer pourquoi l’Univers ne s’effondrait pas sur lui-même sous sa propre force d’attraction gravitationnelle.

  • Le candidat idéal qui fut trouvé est la constante cosmologique Λ, qui permettait de contrebalancer l’effet attractif de la force gravitationnelle.
  • La constante cosmologique est un paramètre rajouté par Einstein à ses équations de la relativité générale, dans le but de rendre sa théorie compatible avec l’idée qu’il y avait alors un Univers statique.
  • La constante cosmologique représente une densité d’énergie constante qui remplit l’espace de façon homogène.
  • Elle introduit une sorte d’énergie (un champ scalaire constant) présente en tout point du continuum spatio-temporel, qui, avec un choix convenable de signe et de valeur, peut s’opposer à la gravité et modifier le profil d’évolution de la taille de l’Univers.

En 1929, Edwin Hubble observe un décalage vers le rouge (redshift) des galaxies qui témoignerait d’un Univers en expansion.

  • La Loi d’Hubble énonce que les galaxies s’éloignent les unes des autres à une vitesse approximativement proportionnelle à leur distance.
    • Autrement dit, plus une galaxie est loin de nous, plus elle semble s’éloigner rapidement.
  • Cette loi ne concerne bien évidemment que la partie de l’Univers accessible aux observations (Univers observable).
    • L’extrapolation de la loi de Hubble sur des distances plus grandes est possible, mais uniquement si l’Univers demeure homogène et isotrope sur de plus grandes distances (ses propriétés ne changent pas).
    • C’est le principe cosmologique qui dit que l’Univers est:
      • homogène: l’Univers est invariant quand on se déplace dedans, son apparence générale ne dépend pas de la position de l’observateur.
      • isotrope: l’Univers est invariant quand on regarde dans différentes directions, son aspect ne dépend pas de la direction dans laquelle on l’observe.
  • La conséquence immédiate de la loi de Hubble et de l’expansion de l’Univers est que celui-ci était par le passé plus dense et donc plus chaud, et de là découle le modèle du Big Bang.
  • Il semblerait que, deux ans avant Hubble, Georges Lemaître avait prédit l’existence de cette loi…un nouvel exemple de la loi de Stigler.
  • Suite à la découverte de Hubble, Albert Einstein revient sur l’introduction de la constante cosmologique, la qualifiant de « plus grande bêtise de sa vie. »
  • Il est alors revenu à son équation originelle (où la constante cosmologique Λ ne figure pas),  jugée plus conforme avec les observations de l’époque.

Un temps abandonnée par la cosmologie, cette constante cosmologique a été récemment remise au goût du jour après la découverte dans les années 1990 de l’accélération de l’expansion de l’Univers (mis en évidence par des mesures sur des supernovae, le fond diffus cosmologique, lentilles gravitationnelles…), et on a vu apparaître un regain d’intérêt pour cette constante cosmologique.

  • Elle décrirait une force ou énergie, encore hypothétique, qui accélèrerait l’expansion de l’Univers, appelée énergie sombre (ou énergie noire).
  • Elle demeure compatible avec l’ensemble de la théorie de la relativité générale.
    • Dans le cadre de la théorie d’Albert Einstein, lorsque qu’on cherche à construire un modèle cosmologique, un univers dynamique est bien plus naturel qu’un univers statique.
    • Elle permet donc de s’appuyer sur les lois de la Relativité Générale pour définir une sorte d’énergie invisible qui se comporte contre la force de gravitation et qui accélère l’expansion de l’Univers.
  • L’énergie noire se comporterait ainsi comme une force gravitationnelle répulsive.

L’expansion accélérée de l’Univers

  • Selon la Loi de Hubble, toutes les galaxies lointaines s’éloigent de nous, de la Voie Lactée.
  • Leur spectre lumineux montre un déplacement vers le rouge dû à l’effet Doppler.
    • L’effet Doppler décrit le décalage de fréquence d’une onde électromagnétique entre la mesure à l’émission et la mesure à la réception lorsque la distance entre l’émetteur et le récepteur varie au cours du temps.
    • Un exemple connu de l’effet Doppler est celui du son émis par la sirène d’une ambulance qui parait d’autant plus grave que l’ambulance s’éloigne vite.
    • En cosmologie, l’effet Doppler se manifeste par un décalage vers le rouge (redshift en anglais), c’est à dire par un décalage vers les grandes longueurs d’onde du spectre visible (de la lumière) émis par les objets astronomiques lointains.
  • La théorie de la Relativité Générale nous dit aussi que l’espace peut se dilater au cours du temps.
    • Si l’on est capable aujourd’hui d’estimer la distance à laquelle se trouve un objet astronomique très lointain, c’est parce qu’au cours de son voyage vers nous, la lumière qu’il a émise a été modifiée par la dilatation de l’espace.
    • On peut comprendre le phénomène en se représentant la lumière comme une onde:
      • Si cette onde voyage dans l’espace et que l’espace se dilate, la longueur d’onde (c’est-à-dire la longueur entre deux pics de l’onde) se trouve augmentée.
      • Ainsi par exemple pour de la lumière bleue, l’étirement de l’espace peut lui donner au final une longueur d’onde corrrespondant au rouge.
    • C’est cette propriété de décalage vers le rouge qui nous indique l’âge de l’objet lointain:
      • plus l’objet émetteur est lointain, plus la lumière voyage longtemps avant de nous parvenir, plus elle sera décalée vers le rouge par la dilatation de l’espace qu’elle aura traversé .
    • Pour les objets astronomiques qui se rapprochent de nous, on parle de blueshift, ou décalage vers le bleu.
  • La constante de Hubble H0 (à ne pas confondre avec la constante cosmologique) est directement liée à la loi de Hubble et elle donne le taux d’expansion actuel de l’Univers.
  • Les supernovae de type SN 1a (les supernovae sont des phénomènes conséquents à l’explosion d’une étoile) fournissent la preuve principale directe de l’expansion accélérée de l’Univers.
    • Les physiciens connaissent la magnitude absolue (luminosité intrinsèque absolue) des supernovae 1a.
    • En mesurant leur distance à partir de leur luminosité intrinsèque et la mettant en relation avec le décalage vers le rouge, on arrive à reconstituer l’histoire de l’expansion de l’Univers sur plusieurs milliards d’années, et de voir de la sorte si l’expansion de l’Univers accélère ou décélère avec le temps.
    • En 1998, diverses observations sur ces supernovae situées dans des galaxies lointaines (et donc jeunes) ont montré que la constante de Hubble n’est pas si constante que ça et que sa valeur peut varier avec le temps.
    • Jusqu’à cette découverte, on pensait que l’expansion de l’Univers était plutôt en train de se fraîner dû à la force gravitationnelle.
    • Cependant, la découverte sur la variation de la valeur de la constante de Hubble se traduit par une accélération de l’expansion de l’Univers.
  • Il doit donc exister un type de force ou énergie qui accélère l’Univers.
  • De là est née la notion d’énergie noire.
  • L’accélération de l’expansion de l’Univers mise en évidence serait en fait un événement « récent » dans l’histoire cosmique:
    • L’énergie noire gouvernerait la dynamique de l’Univers que depuis quelques milliards d’années.
    • Avant cette phase, c’est en principe la matière qui dominait cette dynamique, conduisant à la décélération de l’expansion.
  • L’existence de l’énergie noire est aussi nécessaire pour réconcilier la géométrie qu’on a mesuré de l’espace avec la somme totale de la matière présente dans l’Univers.
    • Des mesures indiquent que l’Univers est très proche d’être géométriquement plat.
    • Pour que la forme de l’Univers soit plate, la densité d’énergie (matière) de l’Univers doit être égale à une certaine densité critique.
    • Comme on l’a vu dans le dossier sur la matière noire, cette densité critique d’énergie pour un Univers plat implique une limite quant à la quantité de matière baryonique et matière noire présentes dans l’Univers.
    • Pour un Univers plat, la matière (baryonique+noire) ne peut constituer qu’au maximum 30% de la denstié critique totale de l’Univers.
    • Ca implique l’existence d’une forme d’énergie additionnelle qui constituerait environ les 70% restants de la densité critique totale de l’Univers.

Dans le dossier sur la matière noire, on avait dit plus précisément que la densité énergétique de l’Univers était composée de:

  • 4% de matière baryonique ou matière observable (étoiles, planètes, gaz).
  • 23% de matière noire.
  • 73% d’énergie noire.

On voit que l’énergie noire est, en termes de densité d’énergie, la composante majeure de l’Univers.

Répartition de la Matière dans l'Univers

En additionnant les différentes énergies dans ces proportions, on arrive exactement à ce qu’il faut pour avoir un univers de courbure quasi-nulle (k=0).

“]Universe Geometry

The densities of dark energy and dark matter determine whether we live in a flat (k=0), closed (k=+1) or open (k=-1) universe [From J.M. Overduin & P.S. Wesson, Dark Sky, Dark Matter (Institute of Physics Press, 2003)

Observations

 

  • Pour observer l’influence de l’énergie noire sur le taux d’expansion de l’Univers:
    • on mesure l’accroissement de la taille, et donc de la masse des amas de galaxies, au cours de l’histoire de l’Univers.
  • Mais comment mesurer la masse des amas de galaxies ?
    • Il se trouve que les amas de galaxies baignent dans un gaz chaud porté à une température si élevée qu’une émission importante dans le domaine des rayons X a lieu.
    • De même que la luminosité des étoiles est reliée à leur masse, la luminosité du gaz dans le quel baigne l’amas de galaxies nous donne des informations sur sa masse.
    • A l’aide du satellite Chandra, on a mesuré la luminosité des amas dans ce domaine des longueurs d’onde des rayons X.
    • On a ainsi pu déduire le poids des amas galaxies.
  • Plus de 80 amas ont ainsi été examinés.
  • Il est clairement apparu que le taux de leur croissance au cours du temps est bien conforme à ce que l’on attend en présence de l’énergie noire dans un Univers à géométrie plate.

Le téléscope spatial Euclid (pas encore mis en service) est un satellite dédié qui aura pour mission de cartographier le ciel pour mesurer depuis l’espace en couvrant la totalité du ciel le taux d’accélération de l’Univers et d’explorer les propriétés de l’énergie noire:

  • S’agit-il d’une véritable nouvelle substance?
  • S’agit-il d’une modification de la gravité?

Ce téléscope nous donnera non seulement des information sur l’accélération de l’expansion de l’Univers , mais aussi comment varie et évolue cette accélération au cours du temps.

Le prix Nobel de physique Martin Perl pense qu’il est possible de détecter l’énergie noire en laboratoire en utilisant des expériences d’interférométrie atomique et ce d’ici 2014 ! Il s’agira de mesurer des fluctuations d’énergie noire dans une cloche à vide de 2 mètres de haut tout au plus.

Nature de l’énergie noire

La nature exacte de l’énergie noire fait largement partie du domaine de la spéculation. Différentes hypothèses ont été avancées:

La constante cosmologique

  • Certains estiment que l’énergie noire serait l’énergie du vide quantique, modélisée par la constante cosmologique de la relativité générale introduite par Einstein:
    • C’est l’explication la plus simple pour les physiciens.
    • Le “coût” lié à l’existence même de l’espace impliquerait que celui-ci doit posséder une sorte d’énergie fondamentale et intrinsèque.
    • Cet énergie fondamentale serait représentée par la constante cosmologique qui ne varie pas dans le temps.
    • En physique des particules (théorie quantique des champs):
      • on appelle énergie du vide (quantique) cette forme d’énergie fondamentale car sa densité est la même que celle de l’énergie du vide.
      • la physique des particules prédit des fluctuations du vide qui provoquerait exactement ce type d’énergie et aurait pu déclencher l’expansion de l’Univers.
    • Si l’énergie noire prend cette forme, cela signifie qu’il s’agit d’une propriété fondamentale de l’Univers.
    • Poser une constante cosmologique signifie que la densité de l’énergie noire est uniforme, et constante dans tout l’univers, invariable en fonction du temps.
    • Cependant les différentes théories physiques ne se mettent pas d’accord sur la valeur de cette constante cosmologique:
      • la théorie quantique des champs prédit une grande constante cosmologique.
      • la thérorie de supersymétrie a besoin que la valeur de la constante cosmologique soit proche de zéro.
    • C’est tout de même épatant qu’un simple numéro (la constante cosmologique) puisse expliquer de manière satisfaisante une multitude d’observations et la présence d’énergie noire!

La quintessence

  • L’énergie noire pourrait-elle être induite par l’existence de particules inconnues.
  • Certaines théories affirment que ces particules ont été créées en quantité suffisante lors du Big Bang pour remplir tout l’espace.
  • Néanmoins, si cela était le cas, on s’attendrait à ce qu’elles se regroupent, de la même manière que la matière ordinaire, et on observerait des variations de densité en fonction du temps.
  • Cependant, aucune preuve n’en a été observée, mais la précision des observations ne permet pas d’exclure cette hypothèse.
  • Ces modèles sont appelées quintessence.
  • Le terme de quintessence fait allusion au fait qu’il existe une cinquième forme d’énergie qui s’ajoute aux quatre types de matières (ou de formes d’énergie) dans l’Univers :
  • La quintessence, à la différence de la constante cosmologique, peut varier dans l’espace et dans le temps.
  • La théorie de la quintessence prédit aussi une accélération de l’expansion de l’Univers légèrement plus lente que la constante cosmologique.

Scénarios sur le destin de l’Univers

 

Destin de l'Univers

  • Si la densité de l’énergie noire n’augmente pas avec le temps (modèle de la constante cosmologique):
    • Le futur de l’Univers sera celui d’un Univers plat, éternellement en expansion.
    • Son expansion va continuer d’accélérer.
    • L’existence des systèmes liés par la gravitation, tels les galaxies ou les systèmes planétaires, n’est pas menacée.
      • Notre Système Solaire ou la Voie Lactée demeureront essentiellement identiques à ce qu’ils sont aujourd’hui.
      • Les forces nécessaires pour contrer le mouvement d’expansion de l’Univers à l’échelle d’un atome, d’une planète, d’une étoile, d’une galaxie, d’un amas de galaxies, sont suffisantes pour assurer la cohésion de ces objets.
    • Par contre le reste de l’Univers, au-delà de notre super-amas local, semblera s’éloigner constamment.
      • Les structures qui ne sont pas liées gravitationnellement finiront par s’éloigner les unes des autres.
    • Ainsi, cette accélération nous empêchera finalement d’observer des portions importantes de l’Univers qui sont aujourd’hui visibles pour nous.
    • Notre horizon cosmologique, plutôt que de reculer, finira par se rapprocher de nous.
    • L’Univers deviendra alors de plus en plus froid et de plus en plus vide.
  • Si l’énergie noire augmente avec le temps (modèle de la quintessence):
    • Une accélération exponentielle de l’expansion de l’Univers aurait lieu.
    • Une accélération si rapide qu’elle pourrait surmonter les forces d’attraction nucléaires et détruirait l’Univers dans environ 20 millards d’années.
    • C’est le scénario de type Big Rip, où toute la matière de l’Univers, jusque dans ses atomes mêmes, se désintégrerait, laissant un Univers infini et totalement vide.
  • Si l’énergie noire se dilue avec le temps, ou voire s’inverse (modèle de la quintessence):
    • Ca laisse la porte ouverte à ce que la gravité puisse un jour dominer l’Univers, qui se contracterait alors sur lui-même et disparaîtrait dans un Big Crunch.
    • De la même manière, si l’on considère que l’Univers est fermé (au lieu d’être plat), l’attraction gravitationnelle de la masse de l’Univers devient plus grande que son expansion, et celui-ci aura tendance à se contracter pour finalement disparaître dans un Big Crunch.
    • Ce scénario est néanmoins considéré comme le moins probable.

future of universe

Conclusion

Malgré la quasi unanimité actuelle apparente des cosmologistes autour de l’idée de l’accélération de l’expansion de l’Univers, la réalité de cette accélération ne sera établie que lorsque le phénomène pourra être inclus dans un cadre théorique solide, lequel fait encore défaut.

Comme pour la matière noire, on peut donc se poser la question si l’accélération de l’expansion de l’Univers est réellement due à cette énergie noire hypothétique ou si elle manifeste plutôt des erreurs dans les équations?

Sources:

http://fr.wikipedia.org/wiki/%C3%89nergie_noire

http://es.wikipedia.org/wiki/Energ%C3%ADa_oscura

http://fr.wikipedia.org/wiki/Expansion_de_l%27Univers

http://pages.towson.edu/joverdui/

http://www.futura-sciences.com/fr/doc/t/physique/d/energie-noire_1033/c3/221/p1/

http://www.futura-sciences.com/fr/news/t/physique-1/d/martin-perl-prix-nobel-veut-detecter-lenergie-noire-au-laboratoire_28121/

http://www.futura-sciences.com/fr/news/t/astronomie/d/lenergie-noire-controle-la-croissance-des-amas-de-galaxies_17750/

http://www.futura-sciences.com/fr/news/t/astronomie/d/hubble-refute-une-alternative-a-lexistence-de-lenergie-noire_28817/

VN:F [1.9.17_1161]
Rating: 5.0/5 (1 vote cast)

Dossier – La synesthésie

On 21.04.2011, in Dossiers, by Mathieu
VN:F [1.9.17_1161]
Rating: 3.0/5 (2 votes cast)

Qu’est-ce que la synesthésie

Synesthésie

  • La synesthésie est un phénomène neurologique par lequel deux ou plusieurs sens sont associés.
  • La synesthésie est une fusion de sensations, de percéptions et d’émotions.
  • Par exemple:
    • les lettres de l’alphabet ou nombres peuvent être perçus colorés (synesthésie graphèmes→ couleurs).
    • les nombres sont automatiquement et systématiquement associés avec des positions dans l’espace (synesthésie numérique).
    • les nombres, jours de la semaine, mois de l’année évoquent des caractères de personnalité (synesthésie de personnification).
    • la musique et d’autres sons peuvent être perçus colorés, ou ayant une forme particulière.
  • La synesthésie impliquant des formes et couleurs est plutôt répandue, alors que la synesthésie impliquant des goûts et odeurs est plutôt rare.
  • Une personne atteinte de synesthésie est appelée synesthète.
  • Bien que ce phénomène capta pour la première fois l’intérêt de la communauté scientifique au XIXème siècle, c’est seulement à partir de 1980 que les scientifiques commencèrent à réexaminer sérieusement ce phénomène fascinant.
  • Une synesthésie d’origine neurologique (involontaire) concernerait une personne sur 23, soit environ 4 % de la population.
  • Concernant l’origine de la synesthésie, il y aurait un facteur génétique probable, la synesthésie semble se transmettre par hérédité.
    • Il y a eu des cas de vrais jumeaux dans lesquels un seul jumeau était synesthète.
    • La synesthésie peut aussi sauter des générations dans une famille.
    • De plus, il est commun que les synesthètes d’une même famille présentent différents types de synesthésie, ce qui suggère que le gène ou les gènes impliqués dans le développement de la synesthésie n’entraînent pas des types spécifiques de synesthésie.
  • Se remémorant une expérience de son enfance, la synesthète Patricia Lynne Duffy écrivait :
    • « Un jour, je dis à mon père, “Je viens de me rendre compte que pour écrire la lettre “R”, tout ce que j’ai à faire est de dessiner un “P”, et ensuite une ligne partant de sa boucle.” Et j’étais tellement surprise de constater que je pouvais transformer une lettre jaune en une lettre orange, juste en ajoutant une ligne. »

Les différents types de synesthésie

 

Synesthesie_Musique_Couleur

  • Du fait de la grande variété de types de synesthésies, les chercheurs ont adopté une convention indiquant le type de synesthésie en utilisant la notation x → y, dans laquelle x est le déclencheur de l’expérience synesthétique, et y est l’expérience additionnelle.
    • Par exemple, percevoir les lettres et nombres (graphèmes) en couleurs indiquerait une synesthésie graphèmes → couleurs.
    • De la même façon, lorsque des synesthètes voient des couleurs et mouvements en écoutant de la musique, il s’agit d’une synesthésie sons → couleurs, mouvements.
  • Alors que presque toutes les combinaisons de sens sont théoriquement possibles, certaines catégories de synesthésie sont plus répandus que d’autres.
  • On classe la synesthésie en différents types:
    • Synesthésie graphèmes → couleurs:
      • Il s’agit d’un des types de synesthésie les plus répandus.
      • Les lettres individuelles de l’alphabet, ainsi que les nombres sont “teintés” d’une certaine couleur.
      • Deux synesthètes ne vont pas rapporter forcément les mêmes couleurs pour toutes les lettres et nombres, cependant des études montrent que certaines tendances se répètent (par exemple, la lettre A est souvent rouge chez les synesthètes anglophones).
      • Pour un synesthète graphèmes → couleurs:
        • si on lui demande de fermer les yeux et on lui récite rapidemment une suite de chiffres, il visualisera un arc-en-ciel.
        • les lettres d’un texte formeront aussi un arc-en-ciel lorsqu’il le lit.
      • La synesthésie graphèmes → couleurs paraît plus forte dans l’usage d’une langue dont l’orthographe est phonétique (breton, espagnol, allemand, etc.) plutôt que dans d’autres où les sonorités d’une lettre varient suivant son contexte (anglais) ou si les combinaisons de lettres modifient la sonorité (français, ex “ho” et “eau”).
      • On a aussi remarqué dans ce type de synesthésie que certaines personnes voient le chiffre arabe dans une certaine couleur, mais pas le chiffre romain correspondant.
      • Il semble donc que ce soit la forme écrite expressément qui fasse surgir la couleur.
    • Synesthésie musique → couleurs:
      • Dans ce cas, des couleurs sont perçues en réponse à des sons.
      • Les synesthètes rapportent rarement les mêmes couleurs pour des tons donnés (pour un synesthète, un la dièse peut être rouge ; pour un autre synesthète, il sera vert).
      • Cependant, les synesthètes sont constants : testé des mois plus tard, un synesthète va rapporter les mêmes expériences qu’il avait précédemment rapportées.
      • Les synesthètes musique → couleurs, à la différence des synesthètes graphèmes → couleurs, rapportent souvent que les couleurs se modulent, ou se déplacent dans leur champ de vision.
    • Synesthésie numérique:
      • Il s’agit d’une carte mentale des nombres qui apparaît automatiquement et involontairement lorsque le synesthète en question pense à des nombres ou des unités temporelles.
      • Ainsi, les nombres peuvent être alignés selon un axe montant, et les mois de l’année peuvent former un demi-cercle.
      • Le synesthète va alors faire des associations numériques/spatiales.
      • Il a été suggéré que ces “cartes numériques” sont le résultat d’une activation croisée entre les régions du lobe pariétal qui sont impliquées dans la cognition numérique et spatiale. Les chercheurs en cognition numérique ont commencé à explorer ce type de synesthésie pour les aperçus qu’il peut donner sur les mécanismes neurologiques des associations numériques/spatiales présentes inconsciemment en chacun de nous.
    • Synesthésie lexicale → gustative:
      • Un type peu répandu de synesthésie.
      • Les mots individuels ainsi que les phonèmes du langage parlé évoquent des sensations de goûts dans la bouche.
      • À chaque fois que ce type de synesthète entends, lis, ou pense à des mots/syllabes, il perçoit une sensation de goût immédiate et involontaire sur sa langue.
      • Le synesthète qui entend un son ressentira des goûts sur la langue (salé, amer, sucré…).
      • Ces associations de goût très spécifiques ne changent jamais et restent les mêmes.
      • On s’est rendu compte que les associations synesthétiques sont conditionnées par l’alimentation du sujet lors de son enfance. Par exemple, le synesthète James Wannerton n’a pas de perceptions synesthétiques impliquant du café ou du curry, alors qu’il en prend régulièrement à l’âge adulte. Par contre, il expérimente des perceptions synesthétiques gustatives de certaines marques de céréales et bonbons qui ne sont plus vendus à l’heure actuelle, mais qu’il mangeait assez régulièrement dans son enfance.
    • Synesthésie de personnification:
      • La personnification ordinale/linguistique est un type de synesthésie dans lequel des séquences, comme les nombres, les jours de la semaine, les mois et lettres sont associés avec des caractères de personnalité.
      • La lettre “T” est généralement peu charitable; le “U” est une chose sans âme; le “4″ est honnête; au “3″ on ne peut pas lui faire confiance; le “9″ est sombre; le “I” est parfois angoissé, même s’il est plutôt enjoué; le “J” est un homme, blagueur à première vue, mais avec une forte personnalité; le “K” est une femme, silencieuse et responsable.
      • Pour certaines personnes, outre les séquences de nombres ou de lettres, les objets sont parfois imbibés de personnalité, ce qui est parfois comparé à une forme d’animisme.
    • Autres formes plus rares de synesthésie:
      • Cas du synesthète qui touche un texture particulière et ressent une émotion:
        • Le denim des jeans, de la tristesse extrême.
        • Une pelure d’orange, un choc.
        • De la soie, le calme.
        • Du papier de verre, de la culpabilité.
        • Du papier de verre plus épais, la sensation de raconter un mensonge.
  • Malgré ces cas généraux qui permettent la définition du phénomène de la synesthésie, on ne doit cependant pas oublier que les expériences individuelles varient de nombreuses façons:
    • Certains synesthètes graphèmes → couleurs déclarent que leurs couleurs semblent “projetées” à l’extérieur.
    • D’autres déclarent que leurs couleurs sont perçues “dans leur tête”.
    • Certains synesthètes déclarent que leurs voyelles sont davantage colorées, alors que pour d’autres il s’agit des consonnes.

Etudes neurologiques

 

Synesthésie Mot Couleur

  • Il n’existe pas encore de concensus au sein de la communauté neuroscientifique pour expliquer le fonctionnement neurologique de la synesthésie.
  • Les différents types de synesthésie ne facilitent non plus pas la tâche pour mettre en place une explication globale.
  • Le neurologue Ramachandran est un des pionniers dans l’étude des différentes formes de synesthésie.
    • Il réalisa une expérience très simple et ingénieuse afin d’explorer la perception des synesthésies.
    • Sur une image présentée durant moins d’une demi-seconde sur un écran d’ordinateur, il y a un mélange de chiffres 5 et de chiffres 2.
    • Le chiffre 2 étant imprimé comme une image en miroir exacte du 5.
    • Mais les chiffres 2 sont disposés sur l’écran d’un manière particulière par rapport au chiffre 5, ils sont disposés de telle manière qu’ils dessinent entre eux une forme particulière, soit un cercle ou soit un triangle.
    • Dans un temps très court (1 demi-seconde), il n’est pas possible de distinguer et reconnaître sur une image des formes globales composées par des chiffres.
    • Personnes non-synesthétiques:
      • En 1 demi-seconde, les personnes non-synesthésiques répondent au hasard, cercle ou triangle, et se trompent une fois sur deux.
      • En revanche si on colore les chiffres 2,  la forme qu’ils dessinent ensemble, cercle ou triangle, saute aux yeux.
      • L’être humain groupe automatiquement les couleurs.
      • Lorsque les chiffres 2 sont colorés, les personnes non-synesthétiques répondent correctement cercle ou triangle dans 80%-90% des cas.
    • Personnes synesthétiques:
      • Lorsqu’on présente à des personnes ayant une synesthésie les chiffres non colorés, elles répondent correctement de 80%-90% des cas.
      • Elles ne colorent pas mentalement des chiffres qu’elles auraient d’abords reconnus à leur forme, noir sur blanc, elles voient réellement ces chiffres en couleur.
      • Il semble s’agir d’un véritable phénomène de perception sensorielle.
      • Parfois elles peuvent même détecter la forme globale, cercle ou triangle, avant même d’avoir perçu la couleur, ce qui suggère que la couleur est perçue de manière inconsciente.
  • Dans le cas de la synesthésie graphèmes → couleurs, on évoque le fait que les régions du cerveau impliquées dans l’identification de la forme des lettres et des chiffres sont adjacentes à la région impliquée dans le traitement des couleurs (aire V4).
  • L’expérience additionnelle de voir des couleurs en regardant des graphèmes peut être due à une activation croisée de ces régions (cross activation).
  • La vision d’un chiffre écrit noir sur blanc active donc chez les personnes synesthétiques non seulement l’air de la reconnaissance des chiffres, mais aussi l’aire V4 de la percéption des couleurs.
  • Cas du synesthète qui ne voit pas certaines couleurs:
    • Dans la rétine de l’oeil, on trouve des cellules en forme de cônes réceptrices à la lumière et qui contiennent des pigments qui permettent de détecter les couleurs.
    • Trois types de pigments, l’un répond au rouge, l’autre au vert, et le troisième au bleu.
    • Il existe des personnes chez qui un ou deux de ces pigments sont absents depuis la naissance, elles ne distinguent alors pas certaines couleurs.
    • L’une de ces personnes qui ne percevait pas toutes les couleurs et qui avait aussi une synesthésie chiffre  couleur voyait certains chiffres dans des couleurs qu’elle n’avait jamais vu dans son environnement et dans le monde qui l’entoure.
    • Comment peut-on voir sur des chiffres écrits en noir sur un fond blanc des couleurs auxquelles la rétine est incapable de répondre?
    • La rétine de cette personne ne pouvait répondre à certaines longueurs d’onde de la lumière en raison de l’absence du pigment correspondant.
    • Mais dans son cerveau l’aire V4 qui recompose les couleurs en réponse aux influx nerveux reçus de la rétine était intacte.
    • Cette aire V4 des couleurs était activée, non pas par les influx nerveux provenant de la rétine, mais par la vision de la forme des chiffres (liée à l’aire de reconnaissance des forme des chiffres et des lettres).
    • Ce lien entre la forme des chiffres et leur couleur révèle la capacité du cerveau à inventer des couleurs, à les faire surgir indépendemment des influx nerveux envoyés par la rétine.
    • Certaines couleurs invisibles par la rétine ne naissent pas des longueurs d’onde de la lumière, mais de la forme de chiffres écrits en noir sur blanc !
    • Ce phénomène nous amène à nous poser la question suivante:
      • Comment expliquer à quelqu’un qu’on voit une couleur qui n’est renvoyée par aucun objet autour de soi, sauf par un chiffre que l’autre personne voit en noir sur blanc?
      • Comment expliquer la couleur de cette couleur à qui ne la voit pas?
    • Ramachandran nous dit aussi que:
      • Les synesthésies provoquent chez la plupart des personnes qui les ressente de la joie, du plaisir.
      • Elles sont pour ces personnes une richesse, elles sont comme un sens supplémentaire.
      • Certaines personnes ayant fait une dépression ont perdu temporairement leur faculté de synesthésie.
      • Leur monde leur a semblé alors plus triste, plus plat, plus vide, plus banal…

Conclusion

  • Quelques synesthètes célèbres:
  • Comme le mentionne le neurologue Ramachandran, les personnes vivant une synesthésie font du monde qui nous paraît ordinaire, une expérience extraordinaire:
    • elles semblent habiter un étrange territoire, un no man’s land entre réalité et imaginaire.
    • elles peuvent voir des sons, goûter des couleurs, entendre des formes ou toucher des émotions.

Synesthésie Piano

Sources:

http://fr.wikipedia.org/wiki/Synesth%C3%A9sie

http://sites.radiofrance.fr/franceinter/em/sur-les-epaules-de-darwin/commentaire.php?id=101280

VN:F [1.9.17_1161]
Rating: 3.0/5 (2 votes cast)
Tagged with:  
*