Quand l'économie illustre l'algèbre matricielle


Jacques Bair

Les données des économistes peuvent souvent se disposer en tableaux rectangulaires qui se manipulent selon des règles précises, liées au concept mathématique de linéarité. Le calcul matriciel peut ainsi être illustré par des exemples concrets tirés du domaine économique.

L'algèbre linéaire est un outil extrêmement puissant, qui peut être appréhendé de plusieurs façons. Les mathématiciens y voient des espaces vectoriels et des transformations linéaires, dans lesquels les applications sont représentées par des tableaux carrés de nombres, les matrices. Pour beaucoup d'économistes, cette approche théorique semble abstraite et peu parlante. Pour un praticien, il importe surtout d'apprendre à manipuler des tableaux de nombres, résultant le plus souvent d'observations empiriques. Les définitions et les propriétés de base du calcul matriciel peuvent alors être illustrées simplement par des situations très concrètes, facilement accessibles, rencontrées dans l'univers économique. 

 

Matrices de commandes et de prix 

Ce jour-là, trois clients d'une entreprise souhaitent acheter quatre produits, dont certains en plusieurs exemplaires. Un premier « tableau de commandes » peut alors être présenté à l'aide d'une matrice, au sein de laquelle les lignes sont relatives aux clients tandis que les colonnes se rapportent aux différents produits que l'on peut acquérir. Ici, il s'agit de la matrice C suivante : 

\( \text{C}=\begin{pmatrix}3&2&1&2\\ 2&3&2&1\\ 1&1&4&0\\ \end{pmatrix}. \)

 

En effet, le premier client commande trois unités du premier bien, deux unités du deuxième produit, une seule unité du troisième et deux du quatrième… Le troisième client ne souhaite pas acheter le quatrième produit : on met 0. Que se passe-t-il si chaque client entend doubler sa commande ? La nouvelle matrice de commandes devient tout simplement 2C, dont tous les éléments sont les doubles de ceux de C :

\( \text{2C}=\begin{pmatrix}6&4&2&4\\ 4&6&4&2\\ 2&2&8&0\\ \end{pmatrix} $.\)

Concrètement, pour multiplier une matrice par un nombre (un scalaire), il suffit de multiplier chaque élément de cette matrice par ce scalaire.

Plus tard dans la journée, les mêmes clients effectuent une autre commande des mêmes produits, selon la matrice D suivante :

\( \text{D}=\begin{pmatrix}1&2&1&0\\ 2&0&1&4\\ 4&0&2&3\\ \end{pmatrix}.\)

 

La somme de ces deux commandes est alors donnée par la matrice C + D :

\( \text{C}+\text{D}=\begin{pmatrix}4&4&2&2\\ 4&3&3&5\\ 5&1&6&3\\ \end{pmatrix} .\)  

 

La règle, élémentaire, d'addition est que la somme de deux matrices possédant le même nombre de lignes et le même nombre de colonnes se calcule en sommant les éléments correspondants des deux matrices. La multiplication est plus subtile, mais avec un peu de réflexion elle est tout aussi naturelle (voir en encadré).


Les tables de contingence

L'utilité des matrices est multiple. Un bel exemple en est la répartition d'individus selon deux critères à l'aide d'une table de contingence, à savoir une matrice N, comprenant p lignes et q colonnes, qui croise les p modalités d'une grandeur x et les q modalités d'une autre grandeur y. L'élément ni,j de N, qui se situe à l'intersection de la ligne i (1 ≤ ip) et de la colonne j (1 ≤ jq), désigne le nombre d'occurrences simultanées des modalités i de x et j de y. Dans une étude économique sur la main-d'œuvre dans une région, on peut par exemple envisager pour x et y respectivement les deux variables « sexe » et « activités ». Les modalités de x sont « hommes » et « femmes », tandis que celles de y peuvent être « salariés » et « chômeurs ». Dans ce cas simple, p = q = 2.
Il sera utile de noter ni,
* la fréquence marginale de la ligne i, c'est-à-dire la somme des nombres figurant sur cette ligne (cela donne la répartition des ni,* individus possédant la modalité i de x selon les diverses modalités de y). Très souvent, on ne s'intéresse qu'au profil des individus de la ligne i, c'est-à-dire, en utilisant le vocabulaire probabiliste (voir l'article suivant), aux probabilités conditionnelles pour un individu d'appartenir à laème modalité de y sachant qu'il possède la ème modalité de x. Cela justifie le remplacement de la table N par la matrice P1 obtenue en divisant tous les coefficients ni,j de N par ni,*.

De même pour les modalités de y : on note n*,j la fréquence marginale de la ème colonne de N, et on considère alors la matrice P2 obtenue en divisant tous les coefficients ni,j de N par n*,j.

Ces deux nouvelles matrices peuvent être construites en multipliant N par une matrice diagonale appropriée et avec un ordre des facteurs adéquat. En écrivant « diag » une matrice ne possédant comme éléments non nuls que ceux de sa diagonale, on peut alors résumer : 

Dlignes = diag(n1,*, n2,* np,*

et Dcolonnes = diag(n*,1, n*,2n*,q).

La matrice Dlignes reprend ainsi, sur sa diagonale, les sommes des éléments de chacune de ses lignes. Elle est de format p \( \times\) p. La matrice correspondante Dcolonnes, de format q \( \times\) q, correspond aux sommes des colonnes disposées également sur la diagonale. On a P1 = (Dlignes)–1xN et P2 = Nx(Dcolonnes)–1, pour autant que chaque ni,* et chaque n*,j soit non nul.

Lorsque la table de contingence étudiée provient d'un échantillon, il est souvent intéressant de tester l'indépendance des deux grandeurs x et y au sein de la population mère. À cet effet, on compare les fréquences observées à des fréquences « théoriques » calculées en supposant les deux grandeurs x et y indépendantes ; ces fréquences théoriques forment une matrice T, comprenant également p lignes et q colonnes, qui est donnée par le produit matriciel T = (1/n) (Dlignes) \( \times\) U \( \times\) (Dcolonnes). Dans cette expression, n désigne l'effectif total de l'échantillon, soit la somme de tous les coefficients ni,j et U est la matrice, comptant p lignes et q colonnes, dont tous les éléments sont égaux à 1. Un exemple numérique réel (qui correspond aux données des États-Unis à un moment donné de leur histoire) illustre la méthode de comparaison. Les effectifs qui suivent sont donnés en millions d'individus :

  Salariés Chômeurs
Hommes 34 6,2
Femmes 11,2 1,8

 

La table de contingence donne naissance à la matrice 

\( \text{N}=\begin{pmatrix}34&6,2\\ 11,2&1,8\\ \end{pmatrix}, \)

ainsi qu'aux profils des lignes et des colonnes, décrits par les matrices diagonales suivantes :

  \( \) \( \text{D}_{\text{lignes}}=\begin{pmatrix}34+6,2&0\\ 0&11,2+1,8\\ \end{pmatrix} =\begin{pmatrix}40,2&0\\ 0&13\\ \end{pmatrix}\)

  et  

\( \text{D}_{\text{colonnes}}=\begin{pmatrix}34+11,2&0\\ 0&6,2+1,8\\ \end{pmatrix} =\begin{pmatrix}45,2&0\\ 0&8\\ \end{pmatrix}.\)  

 

En supposant l'indépendance des deux grandeurs x et y, on postule que la matrice des effectifs théoriques est donnée par T :

  \( \text{T}=\dfrac{1}{53,2}\text{D}_{\text{lignes}}\times \begin{pmatrix}1&1\\ 1&1\\ \end{pmatrix} \times \text{D}_{\text{colonnes}} =\begin{pmatrix}34,15&6,05\\ 11,05&1,95\\ \end{pmatrix}.\)

 
Intuitivement, ce résultat numérique semble « assez proche » de la matrice de contingence observée N. Il y a donc lieu d'accepter l'hypothèse de l'indépendance de la situation d'emploi et du sexe. Cette conclusion intuitive peut être confirmée rigoureusement par un test du khi-deux, dont la valeur observée (x2 = 0,0179) est nettement inférieure à la valeur théorique (6,63), pour un degré de liberté et au seuil de signification de 1 %. La valeur correspondant au seuil de 5 %, à savoir 3,84, est également nettement supérieure à la valeur observée.


Le double classement comptable

En comptabilité, il est courant d'enregistrer deux fois chaque opération : une première fois au crédit d'un certain compte, une deuxième fois au débit d'un autre compte. Pour éviter toute erreur, il convient de toujours vérifier l'égalité entre les sommes des crédits et des débits. Ce double classement peut avantageusement être réalisé sous forme matricielle : dans ce contexte, les contrôles sont automatiques grâce aux règles classiques de l'algèbre matricielle. Construisons une matrice carrée M comprenant n lignes et n colonnes. Les indices des lignes indiquent les numéros des comptes crédités et ceux des colonnes sont relatifs aux comptes débités. Chaque élément ai,j désigne la somme débitée au compte d'indice j et créditée au compte d'indice i. En introduisant le vecteur colonne U composé de n éléments tous égaux à 1, le produit matriciel M \( \times\) U définit alors un vecteur colonne dont les éléments (c1 c2cn) sont les sommes des crédits relatifs au compte correspondant aux indices de lignes, puisque ci représente la somme de tous les éléments ai,j de la colonne j.

Par ailleurs, en faisant appel au vecteur ligne V (transposé de U) dont les n éléments sont égaux à 1, le produit matriciel V \( \times\) M donne un vecteur ligne dont les éléments (d1 d2dn) représentent chacun les sommes des débits correspondant aux indices des colonnes, car dj représente la somme de tous les éléments ai,j de la ligne i. La balance des comptes s'effectue en comparant les sommes des crédits et des débits. Or, le total des débits de tous les comptes se trouve être (V \( \times\) M) \( \times\) U, et de même le total des crédits de tous les comptes est égal à V \( \times\) (M \( \times\) U). En vertu de l'associativité du produit matriciel, l'ensemble des comptes est toujours en équilibre dans le double classement comptable réalisé ainsi.

 

Lire la suite


références

- Algèbre linéaire pour l'économie et les sciences sociales.
Jacques Bair, De Boeck Université, 1990.
- Les matrices. Bibliothèque Tangente 44, 2012.
- Calcul matriciel pour économistes. Pietro Balestra, Castella, 1980.