开启法律大模型协作计划

朱非

本文字数：783

　　今年2月，东南大学法学院数字法学团队发布国内高校首个深度推理法律垂域大模型“法衡-R1”。此前，团队依托东南大学大数据计算中心，于2024年11月首次发布法律垂域大模型“法衡1.0”（320亿参数）。2025年1月，团队推动模型迭代，发布“法衡2.0”（720亿参数）。

　　作为法衡2.0的全面进化版，R1版本通过引入深度思考技术，将法律人工智能从“知识问答工具”升级为“人机协同伙伴”，标志着法律智能服务正式迈入深度推理时代。

　　“法衡-R1”的核心突破在于团队提出的“多角色扮演式法律深度思考数据合成方法”，通过递进式对话策略打造深度思考能力。同时，通过概念延伸、条件明确、后果探讨、实务应用、边界探讨五大追问维度，构建了包含150万条数据的多轮对话数据集；通过多轮对话内容借助DeepSeek-R1构建得到深度思考数据集，使模型具备类法律人的思维路径。

　　数据集原始上下文涵盖了现行法律法规、司法案例、法律词条、精选法律问答、司法考试资料、法学教材、法律文书模板等，全面覆盖了法律场景的典型数据类型。该方法通过模拟真实法律场景中的多方对话逻辑，突破传统法律数据集的单一问答模式局限。经统计，该数据集知识密度（平均触发关联法条）较单轮数据提升三倍；推理深度延伸40%，多轮对话平均长度达8.3轮。

　　即日起，“法衡-R1”将分阶段面向东南大学法学院师生开放内测。同时，团队将启动“法律大模型协作计划”，基于开源协议向法律科技研发开放法律深度思考数据集，共同推动行业智能化转型。

　　据介绍，“法衡-R1”生成于东南大学大数据计算中心校级智算平台（算力高达104 PFLOPS），平台性能与先进性在华东各高校中首屈一指。平台可高效适配各种模型的训练、微调、蒸馏与推理场景，具备完善的技术生态支撑体系，同时大数据计算中心专业的技术团队提供全流程技术支持，为模型高效训练保驾护航。

　　（朱非整理）

下载