FirmAdapt
FirmAdapt
LIVE DEMO
Back to Blog
law-firmse-discoverypredictive-codinglitigation-cost-reduction

电子证据开示成本压缩:预测式编码为一家律所省下230万美元

By Basel IsmailApril 2, 2026

一家制药公司面临多地区诉讼,其证据开示义务涵盖420万份文件。传统线性审查的初步估算——由合同律师逐一处理文件——报价为340万美元,历时14个月。该律所提出改用预测编码。技术辅助审查的总成本:110万美元,历时5个月,且可辩护性指标超过了线性审查通常能达到的水平。

230万美元的差额不仅仅是少花钱的问题。时间线的压缩对客户来说比成本节省更为重要,因为诉讼策略取决于在关键监管截止日期之前完成证据开示。

预测编码的实际工作原理

预测编码,有时也称为技术辅助审查(TAR)或持续主动学习(CAL),利用机器学习来优先排序文件审查。该过程从一位资深律师审查一组种子文件开始,通常是1,000至2,000份文件,这些文件被选出以代表案件中涉及的各类问题。律师将每份文件编码为相关、不相关或享有特权。

算法从这些编码决策中学习,并按预测相关性对剩余文件进行排序。排名最高的文件接下来被审查,这些编码决策进一步训练模型。每次迭代后,算法在预测哪些文件相关方面变得更加准确。

效率提升源于这样一个事实:大多数大型文件集合中绝大部分是不相关的。在典型的商业诉讼中,收集的文件中只有3-8%与案件实际相关。预测编码能够识别出这一相关子集,而无需人工审查其余92-97%的文件。在该制药案例中,420万份文件中最终仅有4.1%被编码为相关,这意味着线性审查方法将要求律师查看400万份无关文件,才能找到那17.2万份有意义的文件。

成本明细

线性审查的成本计算很简单。合同律师的文件审查费率通常为每小时45-75美元。一位经验丰富的审查员每小时处理50-70份文件。以420万份文件、每小时60份文件、每小时55美元计算,仅审查员成本就约为385万美元,还需加上项目管理、质量控制和托管费用。该律所340万美元的估算已经假设了批量处理和关键词筛选带来的一些效率提升。

预测编码的成本构成则不同。技术许可和托管费用约为18万美元。资深律师用于训练模型、审查种子集和进行验证轮次的时间总计约32万美元。由一个较小的经验丰富律师团队审查AI优先排序的文件,成本为48万美元。质量控制和可辩护性测试又增加了约12万美元。

每份文件的成本从线性审查的约0.81美元降至预测编码的0.26美元。在420万份文件的规模上,这些单位成本的节省效果极为显著。

可辩护性问题及其解决方式

对预测编码最常见的反对意见是可辩护性。对方律师可能会主张算法遗漏了相关文件。自Andrew Peck法官2012年在Da Silva Moore案中作出里程碑式裁定以来,法院已多次处理这一问题,共识已明确转向接受技术辅助审查为合理方法,在某些情况下甚至比线性审查更具可辩护性。

可辩护性论点实际上在多个方面有利于预测编码。首先,该过程会生成详细的指标:精确率、召回率、F1分数和丰富度计算,能够精确量化审查的彻底程度。线性审查无法产生类似的质量指标。进行线性审查的律所可以报告律师查看了每一份文件,但无法量化这些律师的准确率。

其次,预测编码支持统计验证。在该制药案例中,律所从算法分类为不相关的文件中随机抽取了2,500份样本,由资深律师进行人工审查。遗漏率(不相关集合中相关文件的百分比)为1.2%,这意味着召回率超过96%。大多数线性审查在接受类似质量测试时,召回率在60%至80%之间。

第三,整个过程有记录且可重现。种子集决策、算法的训练迭代、验证方法和结果都有日志记录。如果对方律师质疑审查过程,律所可以提供每一个编码决策是如何做出的完整记录。

预测编码何时适用

预测编码在大型文件集合上能产生最大的成本节省,通常在50万份文件以上。低于该阈值时,设置成本和训练模型所需的律师时间可能不足以证明投资的合理性,相比之下,配合关键词过滤的良好管理的线性审查可能更为划算。

当相关文件具有可识别的模式时,该技术效果最佳——无论是在语言、参与者、日期范围还是主题方面。涉及具体事件的案件(特定产品缺陷、特定交易、特定时间段内的涉嫌不当行为)往往比涉及分散的、持续性行为且相关性难以界定的案件产生更好的预测编码结果。

多议题案件既是机遇也是挑战。算法可以被训练为同时识别与不同议题相关的文件,这比为每个议题分别运行审查更高效。但训练集需要包含每个议题的示例,这增加了初始编码轮次所需的资深律师时间。

对于管理复杂诉讼的律师事务所来说,能够将预测编码作为标准工具提供已成为一项竞争优势。客户越来越期望他们的律所在大型案件中使用技术辅助审查,当存在更高效的替代方案时,他们不愿意为线性审查买单。

不同案件规模下的数据表现

制药案例中230万美元的节省代表了一个大规模的案例,但按比例计算的节省适用于不同的案件规模。在100万份文件的集合上,律所通常报告相比线性审查节省55-65%的成本。在超过500万份文件的集合上,节省通常超过75%,因为设置预测编码工作流程的固定成本被分摊到更多文件上。

时间节省遵循类似的模式。一项420万份文件的线性审查需要14个月,而使用预测编码可在4-6个月内完成,具体取决于议题的复杂性和验证要求。对于诉讼时间表紧迫的案件,这种时间压缩可能比成本节省更有价值。

当考虑准确性因素时,计算变得更加有趣。如果预测编码实现96%的召回率,而线性审查为75%,那么技术辅助方法不仅更便宜、更快速,还能找到更多相关文件。线性审查遗漏的文件往往是那些语言不寻常或具有意外相关性的文件——恰恰是可能改变案件走向的文件。花更少的钱获得更好的结果,这种组合使得愿意投入初始学习曲线的律所在采用决策上变得非常明确。

Ready to uncover operational inefficiencies and learn how to fix them with AI?
Try FirmAdapt free with 10 analysis credits. No credit card required.
Get Started Free