FirmAdapt
FirmAdapt
LIVE DEMO
Back to Blog
law-firmse-discoverypredictive-codinglitigation-cost-reduction

Réduction des coûts de l'e-Discovery : comment le codage prédictif a permis à un cabinet d'économiser 2,3 millions de dollars

By Basel IsmailApril 2, 2026

Une entreprise pharmaceutique confrontée à un litige multidistrict avait une obligation de divulgation couvrant 4,2 millions de documents. L'estimation initiale pour une revue linéaire traditionnelle, avec des avocats contractuels traitant les documents un par un, s'élevait à 3,4 millions de dollars sur 14 mois. Le cabinet a proposé le codage prédictif à la place. Coût total de la revue assistée par technologie : 1,1 million de dollars sur 5 mois, avec des indicateurs de défendabilité supérieurs à ce que la revue linéaire atteint habituellement.

La différence de 2,3 millions de dollars ne se résumait pas simplement à dépenser moins d'argent. La compression des délais importait davantage au client que les économies de coûts, car la stratégie contentieuse dépendait de l'achèvement de la phase de divulgation avant une échéance réglementaire clé.

Comment fonctionne réellement le codage prédictif

Le codage prédictif, parfois appelé revue assistée par technologie (TAR) ou apprentissage actif continu (CAL), utilise l'apprentissage automatique pour prioriser la revue documentaire. Le processus commence par un avocat senior qui examine un ensemble initial de documents, généralement 1 000 à 2 000 documents sélectionnés pour représenter l'éventail des questions en jeu dans l'affaire. L'avocat code chaque document comme pertinent, non pertinent ou privilégié.

L'algorithme apprend de ces décisions de codage et classe les documents restants par pertinence prédite. Les documents les mieux classés sont examinés ensuite, et ces décisions de codage entraînent davantage le modèle. À chaque itération, l'algorithme s'améliore dans sa capacité à prédire quels documents sont pertinents.

Le gain d'efficacité provient du fait que la plupart des grandes collections documentaires sont massivement non pertinentes. Dans un litige commercial typique, seuls 3 à 8 % des documents collectés sont réellement pertinents pour l'affaire. Le codage prédictif identifie ce sous-ensemble pertinent sans nécessiter une revue humaine des 92 à 97 % restants. Dans le cas pharmaceutique, seuls 4,1 % des 4,2 millions de documents ont finalement été codés comme pertinents, ce qui signifiait que l'approche de revue linéaire aurait obligé les avocats à examiner 4 millions de documents non pertinents pour trouver les 172 000 qui comptaient.

La ventilation des coûts

Les coûts de la revue linéaire sont simples à calculer. Les avocats contractuels facturent généralement entre 45 et 75 dollars de l'heure pour la revue documentaire. Un réviseur expérimenté traite 50 à 70 documents par heure. Pour 4,2 millions de documents à 60 documents par heure et 55 dollars de l'heure, le calcul produit environ 3,85 millions de dollars en coûts de réviseurs seuls, auxquels s'ajoutent la gestion de projet, le contrôle qualité et les frais d'hébergement. L'estimation de 3,4 millions de dollars du cabinet avait déjà intégré certains gains d'efficacité liés au traitement par lots et au filtrage par mots-clés.

Les coûts du codage prédictif se répartissaient différemment. La licence technologique et l'hébergement représentaient environ 180 000 dollars. Le temps de l'avocat senior pour l'entraînement du modèle, la revue de l'ensemble initial et la conduite des cycles de validation totalisait approximativement 320 000 dollars. La revue des documents priorisés par l'IA par une équipe réduite d'avocats expérimentés a coûté 480 000 dollars. Le contrôle qualité et les tests de défendabilité ont ajouté 120 000 dollars supplémentaires.

Le coût par document est passé d'environ 0,81 dollar avec la revue linéaire à 0,26 dollar avec le codage prédictif. Rapportées à 4,2 millions de documents, ces économies unitaires se cumulent de manière spectaculaire.

Les préoccupations de défendabilité et comment elles ont été traitées

L'objection la plus courante au codage prédictif concerne la défendabilité. L'avocat adverse peut arguer que l'algorithme a manqué des documents pertinents. Les tribunaux ont abordé cette question à de nombreuses reprises depuis l'opinion historique du juge Andrew Peck en 2012 dans l'affaire Da Silva Moore, et le consensus s'est fermement orienté vers l'acceptation de la revue assistée par technologie comme raisonnable, et dans certains cas plus défendable que la revue linéaire.

L'argument de la défendabilité favorise en réalité le codage prédictif de plusieurs manières. Premièrement, le processus génère des indicateurs détaillés : précision, rappel, scores F1 et calculs de richesse qui quantifient exactement la rigueur de la revue. La revue linéaire ne produit aucun indicateur de qualité comparable. Un cabinet effectuant une revue linéaire peut signaler que les avocats ont examiné chaque document, mais il ne peut pas quantifier la précision de ces avocats.

Deuxièmement, le codage prédictif permet une validation statistique. Dans le cas pharmaceutique, le cabinet a tiré un échantillon aléatoire de 2 500 documents que l'algorithme avait classés comme non pertinents et les a fait examiner manuellement par des avocats seniors. Le taux d'élusion (le pourcentage de documents pertinents dans l'ensemble non pertinent) était de 1,2 %, ce qui se traduit par un taux de rappel supérieur à 96 %. La plupart des revues linéaires, lorsqu'elles sont soumises à des tests de qualité similaires, affichent des taux de rappel entre 60 % et 80 %.

Troisièmement, l'ensemble du processus est documenté et reproductible. Les décisions sur l'ensemble initial, les itérations d'entraînement de l'algorithme, la méthodologie de validation et les résultats sont tous consignés. Si l'avocat adverse conteste la revue, le cabinet peut produire un dossier complet montrant comment chaque décision de codage a été prise.

Quand le codage prédictif est pertinent

Le codage prédictif produit les économies les plus importantes sur les grandes collections documentaires, généralement au-delà de 500 000 documents. En dessous de ce seuil, les coûts de mise en place et le temps d'avocat pour l'entraînement du modèle peuvent ne pas justifier l'investissement par rapport à une revue linéaire bien gérée avec filtrage par mots-clés.

La technologie fonctionne le mieux lorsque les documents pertinents partagent des schémas identifiables, que ce soit dans le langage, les participants, les plages de dates ou le sujet. Les affaires impliquant des événements distincts (un défaut de produit spécifique, une transaction particulière, une période définie de faute présumée) tendent à produire de meilleurs résultats de codage prédictif que les affaires impliquant une conduite diffuse et continue où la pertinence est plus difficile à définir.

Les affaires multi-enjeux présentent à la fois une opportunité et un défi. L'algorithme peut être entraîné à identifier simultanément les documents pertinents pour différentes questions, ce qui est plus efficace que de mener des revues séparées pour chaque enjeu. Mais l'ensemble d'entraînement doit inclure des exemples de chaque question, ce qui augmente le temps d'avocat senior requis pour les cycles de codage initiaux.

Pour les cabinets d'avocats gérant des litiges complexes, la capacité à proposer le codage prédictif comme outil standard est devenue un avantage concurrentiel. Les clients s'attendent de plus en plus à ce que leurs cabinets utilisent la revue assistée par technologie sur les affaires volumineuses, et ils sont réticents à payer pour une revue linéaire lorsqu'une alternative plus efficace existe.

Ce que donnent les chiffres selon les différentes tailles d'affaires

Les économies de 2,3 millions de dollars dans le cas pharmaceutique représentent un exemple à grande échelle, mais les économies proportionnelles s'appliquent à différentes tailles d'affaires. Sur une collection d'un million de documents, les cabinets rapportent généralement des réductions de coûts de 55 à 65 % par rapport à la revue linéaire. Sur les collections de plus de 5 millions de documents, les économies dépassent souvent 75 % car les coûts fixes de mise en place du flux de travail de codage prédictif sont amortis sur davantage de documents.

Les gains de temps suivent un schéma similaire. Une revue linéaire de 4,2 millions de documents qui prendrait 14 mois peut être achevée en 4 à 6 mois avec le codage prédictif, selon la complexité des questions et les exigences de validation. Pour les affaires soumises à des calendriers contentieux serrés, cette compression temporelle peut avoir plus de valeur que les économies de coûts.

Le calcul devient intéressant lorsqu'on intègre la précision. Si le codage prédictif atteint un rappel de 96 % contre 75 % pour la revue linéaire, l'approche assistée par technologie n'est pas seulement moins chère et plus rapide. Elle trouve également davantage de documents pertinents. Les documents que la revue linéaire manque tendent à être ceux au langage inhabituel ou à la pertinence inattendue, précisément les documents qui peuvent changer la trajectoire d'une affaire. Dépenser moins d'argent et obtenir de meilleurs résultats est une combinaison qui rend la décision d'adoption évidente pour les cabinets prêts à investir dans la courbe d'apprentissage initiale.

Ready to uncover operational inefficiencies and learn how to fix them with AI?
Try FirmAdapt free with 10 analysis credits. No credit card required.
Get Started Free