Question 1

Quelle est la taille typique d'un chunk ?

Accepted Answer

La plupart des systèmes de récupération IA en production utilisent des chunks dans la plage de 200 à 800 tokens, avec 512 tokens comme valeur par défaut courante. Certains moteurs utilisent des passages beaucoup plus petits (100 à 200 tokens) pour une récupération de haute précision, et d'autres utilisent des passages plus grands (jusqu'à 1 500 tokens) quand la préservation du contexte compte plus que la granularité de récupération. La taille exacte est rarement divulguée par les moteurs IA, mais l'implication stratégique est constante : chaque section de votre contenu devrait avoir du sens à l'échelle d'un paragraphe à une courte section.

Question 2

Les moteurs IA utilisent-ils la même stratégie de chunking ?

Accepted Answer

Non — les stratégies de chunking varient selon les moteurs, les pipelines de récupération, et même selon les types de requêtes au sein du même moteur. Perplexity, Google AI Overviews, ChatGPT Search et Gemini utilisent tous des approches de chunking et d'embedding différentes, et celles-ci sont continuellement ajustées. La conclusion pratique est que vous ne pouvez pas optimiser pour une taille de chunk spécifique ; écrivez plutôt du contenu qui produit des passages cohérents et autonomes à plusieurs échelles.

Question 3

Puis-je contrôler comment mon contenu est découpé ?

Accepted Answer

Indirectement, oui. Vous ne pouvez pas dicter les frontières de chunk à un moteur IA, mais vous les influencez fortement via la structure HTML, la hiérarchie des titres, la longueur des paragraphes, le formatage des listes et les données structurées. Une page avec du HTML sémantique, des frontières

et

claires, des paragraphes bien délimités et des patterns FAQ ou définition cohérents sera découpée bien plus proprement — et les chunks résultants porteront plus de valeur récupérable.

Question 4

Quel est le lien entre le Chunking et les embeddings ?

Accepted Answer

Le chunking vient en premier, les embeddings en second. La page est découpée en chunks, chaque chunk est ensuite converti en embedding (un vecteur de haute dimension représentant sa signification), et ces embeddings sont ce qui est stocké dans l'index de récupération. Quand une requête utilisateur arrive, la requête est aussi vectorisée et comparée aux embeddings des chunks via une recherche vectorielle. Un mauvais chunking produit des embeddings incohérents ; un bon chunking produit des embeddings propres et sémantiquement focalisés qui se récupèrent bien.

Question 5

Le Chunking s'applique-t-il aux PDF et autres formats de documents ?

Accepted Answer

Oui. Les moteurs IA qui indexent les PDF, documents Word et autres formats leur appliquent aussi le chunking, souvent en utilisant des heuristiques spécifiques au format (sauts de page, titres de section, frontières de tableaux). Les mêmes principes s'appliquent : les documents bien structurés avec des sections claires et des passages autonomes se découpent proprement et remontent dans les réponses IA ; les documents longs et indifférenciés non. Ceci est particulièrement pertinent pour les marques B2B publiant des livres blancs, rapports de recherche et documentation technique.

Chunking (récupération par passages)

Qu'est-ce que Chunking (récupération par passages) ?

Points cles sur Chunking (récupération par passages)

Pour aller plus loin

Questions frequentes sur Chunking (récupération par passages)

Termes associes

Vous voulez mesurer votre visibilite IA ?