Une manière innovante de gérer son risque

Aujourd'hui, j'ai envie de vous parler du "market partitioning", ou partitionnement du marché en français. Il s'agit de l'une des rares applications concrètes du machine learning dans la finance, et d'un sujet sur lequel je travaille par intermittence depuis maintenant trois ans.

Etienne Monceau

Publié le 27/10/2025 à 16:03 - Modifié le 27/10/2025 à 16:04

Zonebourse.com

Ajouter Zonebourse à vos sources

-0,22%

+1,04%

+1,65%

-0,70%

0,00%

L’intérêt pour cette technologie part d’un constat simple : la classification des entreprises dans des secteurs d’activité, lors de leur enregistrement sur les marchés, est loin d’être suffisante pour appréhender la diffusion des informations et s’assurer d’être correctement diversifié à tout instant.

Si cette classification n’est pas optimale, c’est parce que le compromis entre stabilité des classes (qui permet de suivre facilement sa diversification intersectorielle) et pertinence de celles-ci n’est pas bien équilibré.

La proposition de valeur est donc la suivante : réorganisons les entreprises en groupements (clusters) au sein desquels les titres semblent exposés aux mêmes facteurs, et faisons en sorte que chacun de ces clusters se ressemble le moins possible.

---

Le saviez-vous ? Ces articles existent aussi au format vidéo ! C'est le cas pour l'ensemble des articles de la playlist Big Data, écrit par Etienne Monceau.

---

Algorithmiquement, ce travail est relativement simple. Les modèles de clustering sont nombreux et conduisent à des résultats très satisfaisants. En particulier, le clustering ascendant hiérarchique, associé à la méthode de Ward, regroupe les titres de manière itérative en veillant à minimiser l’inertie intra-groupe et maximiser l’inertie inter-groupe.

Il reste cependant à définir la donnée utilisée et la mesure de similarité servant à quantifier la ressemblance entre deux éléments. On pourrait débattre longtemps des choix les plus judicieux à faire, mais pour cette introduction, restons simples et proches de ce qui vous parlera le plus.

Nous partirons donc de la matrice de corrélation calculée sur la base des rendements historiques. Chaque entreprise sera représentée par un vecteur dont les valeurs sont les coefficients de corrélation de cette entreprise avec toutes les autres. La mesure de similarité utilisée sera la distance euclidienne entre ces différents vecteurs.

Le clustering ascendant hiérarchique présente deux grands avantages :

Il n’est pas nécessaire de définir un nombre de groupements avant de lancer l’algorithme.
Il permet de visualiser le regroupement progressif à l’aide d’un dendrogramme, offrant ainsi une compréhension intuitive de la structure du marché à un instant t et la possibilité de déterminer le nombre optimal de clusters à partir de cette structure.

dendrogramme clustering cac40

Dendrogramme Clustering Ascendant Hierarchique avec la méthode de Ward. Données : matrice de corrélation. Mesure de similarité : Distance euclidienne. Source : Zonebourse.

Dans l’exemple ci-dessus, on réalise un clustering ascendant hiérarchique sur l’échantillon des entreprises du CAC 40. Le dendrogramme montre que le premier groupe formé est [ACA.PA – BNP.PA], soit Crédit Agricole SA et BNP Paribas. Suivent ensuite LVMH et Hermès, Legrand et Schneider, etc.
En suivant l’arborescence depuis la base, on peut observer ces regroupements progressifs. Choisir un nombre de clusters revient à tracer une ligne horizontale sur le dendrogramme.

Si l’on décide de former deux groupes, la ligne horizontale correspondante serait placée ainsi :

dendrogramme clustering cac40 2 groupes Pour quatre groupes, voici le résultat :

dendrogramme clustering cac40 4 groupes

Avec cet outil open source que j'ai crée, vous pouvez conduire cette analyse sur l’échantillon de votre choix : renseignez simplement vos tickers Yahoo Finance et la période d’analyse. Vous pouvez aussi sélectionner un nombre de clusters ; ce paramètre ne changera pas le dendrogramme affiché, seulement la couleur des entreprises (leur appartenance clusterielle) dans le graphique dynamique.

Notre introduction s’arrête là. Revenons à notre recherche et à la critique de cette solution en tant que prétendante pour remplacer la classification sectorielle.

Dans le cadre de cet article, notre champ d’étude se restreint aux entreprises composant le S&P 500 sur l’année 2021. Pour simplifier, nous partirons sur un nombre de groupements équivalent au nombre de secteurs de niveau 1 dans la classification Reuters, soit 10.

Un simple regard sur les heatmap de corrélation pré-clustering (organisée par secteur d'activité) et post-clustering suivants permet d’appréhender l’efficacité de l’algorithme.

Corrélations sectorielles SP500

Matrice de corrélation (présentée sous forme de Heatmap) des entreprises du S&P500 sur l’année 2021. Les entreprises sont triées par secteur d’activité TBRC niveau 1. Source : Zonebourse.

Corrélations clusterielles SP500

Matrice de corrélation (présentée sous forme de Heatmap) des entreprises du S&P500 sur l’année 2021. Les entreprises sont triées par appartenance aux différents clusters (les clusters 8 et 9 étant trop petits pour être visualisés).

Cela fonctionne relativement bien ! En revanche, ce travail ne suffit pas à démontrer la pertinence d’un tel outil dans la pratique. Nous réorganisons ici les titres sur la base de leurs rendements historiques, or les corrélations sont loin d’être constantes dans le temps. Que se passerait-il si l’on reconduisait exactement la même démarche sur l’année 2022 ? Comment les groupes se redéfiniraient-ils ? Observerait-on beaucoup de migrations ?

C’est là que les choses deviennent intéressantes. Contrairement aux modèles de classification, qui définissent des règles fixes pour déterminer une classe, les modèles de clustering produisent des groupements sans véritable identité stable : celle-ci dépend des titres composant les clusters à un instant t. Le problème, c’est que ces clusters se redéfinissent en permanence.

Ainsi, à l’inverse de la classification sectorielle, on obtient ici une solution pertinente mais instable, difficilement exploitable dans la gestion moyen-long terme. Il faudrait recalculer chaque jour ou chaque semaine son exposition aux différents groupements.

Il faut donc rajouter de la stabilité.

Mon intuition était la suivante : découper la période d’analyse en plusieurs sous-périodes légèrement chevauchantes (overlap). Sur chacune d’elles, j’applique le même algorithme de clustering, puis j’associe les clusters des différentes sous-périodes afin de créer des lignées de clusters dont on peut suivre l’évolution.

associations des clusters calculés sur différentes périodes

Exemple d'association de clusters calculés sur différentes sous-périodes. On prend ici le CAC40 et 5 clusters pour une question de visualisation (ce schéma date de 2021 à l'inverse des dendrogrammes récents en haut de cet article). Source : Zonebourse.

Pour relier ces clusters, j’ai utilisé la distance de Jaccard, qui mesure la proportion d’éléments communs entre deux groupes.

Nous pouvons ainsi compter le nombre d’occurrences de chaque entreprise dans chaque lignée. Cela permet de distinguer les entreprises “cœurs”, formant l’identité d’une lignée, des entreprises satellites, plus instables, qui migrent d’un cluster à l’autre.

Chaque cluster statistique peut donc être structuré en strates : cœur et satellites.

Clusters statistiques coeur et satellites organisation des clusters en strates

Représentation des clusters avec leurs strates. Schéma pédagogique avec entreprises coeurs et satellites. Source : Zonebourse.

Pour démontrer l’intérêt pratique de cette procédure, il faut l’évaluer. La méthode retenue ici est simple : chaque année est découpée en sous-périodes de 90 jours avec un chevauchement de 30. Ces paramètres servent à créer les lignées et donc les clusters statistiques de l’année n. On enregistre leurs compositions, puis, une année plus tard, on compare les corrélations intra-cluster et inter-cluster à celles intra-secteur et inter-secteur, sur la base des rendements de l’année n+1.

Le processus est répété pour chaque année entre 2010 et 2022, et les médianes des corrélations sont comparées à l’aide d’un test de Mood afin de vérifier la significativité statistique. En gros, la rigueur scientifique nous amène à considérer uniquement les années encadrées en noir dans le tableau ci-dessous.

Ce qu’il faut observer, ce sont les ratios d’organisation (médiane intra / médiane inter). Si le ratio des clusters est supérieur à celui des secteurs, cela signifie qu’il est plus pertinent de raisonner en termes de clusters qu’en termes de secteurs.

Résultats, avec contrainte sur le nombre de clusters (10). Source : Zonebourse.

Bon, on est d’accord, ce n’est pas terrible ! 3 points pour la méthode, 2 pour la classification sectorielle. Mieux vaut éviter de s’embêter et utiliser les secteurs !

Mais pas si vite.

Jusqu’ici, nous avons fixé le nombre de clusters à 10, par commodité. Or, faire cela revient à ignorer la dynamique des marchés. Si notre objectif est de réorganiser ces marchés, pourquoi se contraindre sur le nombre de groupements créés ? On peut très bien accepter de réajuster cette organisation chaque année.

Voici donc les résultats lorsque l’on optimise le nombre de clusters sur la base des ratios d'organisation de l'année de construction des clusters.

resultats sans contrainte sur le nombre de clusters

Résultats, sans contrainte sur le nombre de clusters. Source : Zonebourse.

Bingo ! Sur les 9 années où les tests statistiques valident les médianes, 8 donnent raison à la découpe en clusters.

Bon maintenant, comment une équipe de gestion peut-elle utiliser ce genre d’outil ?

Concrètement, à la fin de chaque année, une nouvelle découpe du marché est donnée par l’outil, avec la composition de chacun des groupes et les différentes strates (on aurait pu d’ailleurs réaliser les mêmes tests, mais qu’avec les cœurs de clusters, plus stables). Le gérant peut donc calculer son exposition clusterielle et l’a monitorer en temps réel, en la comparant par exemple à l’exposition de l’indice de référence qu’il doit battre.

Le hedge fund peut quant à lui mettre en place une stratégie de pair trading de volatilité, en jouant le retour à la normale quand un titre qui fait partie d’un cœur de cluster statistique se met à migrer.

Je laisse libre cours à votre imagination…

Dans le futur, je reviendrai surement vers vous pour vous en dire plus sur ce qui se fait de mieux dans le domaine du market partitionning qui me passionne tant. Aujourd’hui on aura planté des bases. Et j’espère que ça vous a plu !

Ajouter Zonebourse à vos sources

16:32	La Banque centrale d'Irlande commande un examen indépendant de ses activités de contrôle	RE
16:31	Aérien : l'Europe déconseille de survoler la Jordanie
16:27	Get Nice, cotée à Hong Kong, victime d'une cyberattaque impactant ses systèmes de trading	RE
16:27	Wall Street en ordre dispersé, la prudence l'emporte avant les résultats de la Big Tech	RE
16:23	Les cours de l'indium en Occident atteignent un sommet de vingt ans face aux restrictions chinoises et à une demande soutenue	RE
16:22	La banque centrale du Ghana maintient son principal taux directeur à 14 %	RE
16:15	Union européenne : les importations de soja s'élèvent à 0,38 million de tonnes au 19 juillet, le colza à 0,06 million	RE
16:14	UE : les exportations de blé tendre s'élèvent à 0,47 million de tonnes au 19 juillet pour la campagne 2026/27	RE
16:10	Le gaz naturel américain progresse de plus de 2 % face à la hausse des prévisions de demande et des cours du pétrole	RE
16:05	La maison mère d'Armani publie un bénéfice net de 67 millions d'euros pour 2025 et conteste l'amende de l'antitrust italien	RE
16:03	La société Get Nice, cotée à Hong Kong, visée par une cyberattaque	RE
15:58	OBLIGATIONS-Le rendement du Trésor à 10 ans atteint un sommet de deux mois face à la flambée du pétrole et aux craintes liées à la Fed	RE
15:55	La Bolivie proche d'un accord de financement de 2,5 à 2,8 milliards de dollars avec le FMI, selon le ministre	RE
15:48	Italie : la taxe sur les petits colis s'ajoutera au prélèvement européen, selon le ministre de l'Économie	RE
15:38	Le PDG d'AT&T commente les résultats, la croissance du parc d'abonnés mobiles et l'IA	MT

	La tech pour remettre la marche en avant
	Une économie mondiale "plus fragile qu'il n'y paraît", selon Standard Chartered
	Bourse : un nouveau titan au capital de Mistral ?
	Samsung en discussions pour investir dans Mistral sur la base d'une valorisation de 20 milliards d'euros, selon le FT
	Airbus décolle, Danone perd en saveur
	GE Vernova relève ses prévisions de chiffre d'affaires annuel, porté par la forte demande d'électricité
	Nestlé grimpe, Jefferies met de côté les erreurs du passé
	Marchés en Asie: le Brent dépasse 92 dollars, les Bourses agitées par la tech
	Bourse Zurich: le SMI devrait se réveiller dans le vert
	L'action Randstad bondit : le chiffre d'affaires supérieur aux attentes alimente les espoirs de reprise

Une manière innovante de gérer son risque

Économie : Plus d'actualités

Actualités à la une

Dernières analyses