课题1:基于知识图谱分析的均衡分案技术
发布者:xx    发布时间:2019-10-09

第1个课题是“基于知识图谱分析的均衡分案技术”,由上海交通大学牵头,上海交大慧谷通用技术有限公司参与,主要研究目标是围绕现有分案系统中信息单一、模型简单等问题,研究从司法文书和卷宗中提取关键因素并建立知识图谱并用于均衡分案的技术,构建均衡分案系统。该课题为课题六的应用示范提供支持,对整个项目研究提供案件的均衡分配。


(1)研究目标

针对均衡分案这一关键问题,本课题着重研究基于知识图谱分析的案件推荐系统。其主要的任务点为提出一种案件特征提取和法官画像刻画的分析技术和一种基于相似度聚类的案件推荐系统。主要的研究目标是期望能够为案件和法官建立知识图谱,并在此基础上实现智能的面向业务的均衡分案系统。


(2)主要研究内容

针对现有分案系统中信息单一、模型简单的问题, 建立融合案件复杂度和法官画像的均衡分案方法。即如何从司法文书和卷宗中提取关键因素,如何针对案件和法官特征建立分案模型,实现案件智能推荐。

研究任务1:案件特征提取与法官画像刻画

研究司法领域的专业词汇构建技术,研究司法领域词汇的分词及词性标注技术,构建法院案件的特定领域词库和专有停用词表;研究基于词嵌入的深度神经网络模型提取案件高层次特征;研究基于规则和统计的命名实体识别方法,提取案件中与时间和利益冲突有关的特征,为后续构建知识图谱建立基础。针对法官人物刻画的问题,研究根据法官审判历史案件特征挖掘潜在模式、负载和审判倾向,选取关键标签刻画法官人物画像,为法院智能分案提供有效依据。

研究任务2:知识图谱的构建与更新

在构建法院案件专有的知识图谱时,研究基于法院顶层本体资源的本体构建方法;为解决大数据环境下,计算复杂度高、数据质量差和先验对齐数据获取困难等问题,研究基于分区索引的知识实体对齐技术。为保持知识库知识一致性、完备性及减少后续数据维护成本,在新的知识如新的卷宗信息、新的法官信息需要添加更新图谱时,研究基于知识推理的知识图谱更新技术。

研究任务3:均衡案件推荐系统

研究构建多维度的法官和案件向量表示,进行特征建模;研究通过协同过滤技术,利用已有分案经验,预测匹配结果并进行推荐;研究将法官画像和案件模型,经由多模态深度神经网络模型拟合,生成具有专业性的评价矩阵和训练精确的判别模型;研究通过强化学习制定均衡策略,修正推荐结果,均衡资源分配。

研究任务4:均衡分案系统开发与集成

基于以上三项研究内容的成果,开发一套均衡分案的软件系统。该系统将集成为本项目法院综合管理平台的一部分。该软件分为训练和分案两个模块。其中训练模块的输入为案件和法官资料,其输出为一套知识图谱;分案模块的输入为新的案件、法官列表和可能的案件反馈,根据训练模块得到的知识图谱和相应的推荐技术,得到均衡的分案结果。


(3)拟解决的重大科学问题或关键技术问题

关键技术1:案件特征提取与法官画像刻画技术

本课题需要从文档中获取与时间、利益冲突和法官负载有关的诸多信息,但传统的法官和案件特征提取采用基于语法规则的文本挖掘方法。这些方法无法有效提取所需的信息,如何从繁杂多样的司法文书和卷宗中提取有效因素来刻画案件和法官特征是关键技术问题。具体包括:1)基于词嵌入表示方法的深度神经网络模型提取高层次案件特征的技术;2)基于结构化的三元组为基本存储单元的知识图谱,提供关联性的整体知识;3)基于知识图谱的法官人物刻画技术;这些关键技术为后续智能分案提供了有效依据。

关键技术2:均衡案件推荐系统技术

针对现有分案模型过于简单的问题,拟提出更加全面的推荐算法,提升推荐准确率,一方面通过新型的基于知识图谱的表达式来构建系统输入,取代传统模型,另一方面通过深度学习生成评价模型,拟合复杂的非线性关系。针对分案过程中出现的资源分配不均衡的问题,拟利用强化学习探索未知环境同时学习最优策略的机制,对分案结果进行调整,达到均衡的目的。


(4)考核指标及评测手段/方法

功能指标:

1)案件特征提取与法官画像刻画技术,构建基于自然语言处理等技术的人案特征提取方法;

2)知识图谱的构建与更新,构建法院专有知识图谱达百万量级;

3)均衡案件推荐系统技术,构建基于法官专业经验、案情、存案率等因素的人案推荐模型;

4)构建均衡分案原型系统,支持案件特征多维度分析,支持法官多标签人物画像,支持各审判人员的在案件分配上的基本均衡和排期优化。

性能指标:

1)人案匹配的准确率不低于90%。

2)服务响应速度每案平均不大于5秒。

知识产权指标:

受理技术发明专利2件,获得软件著作权2项,发表论文4篇。

测评手段/方法:

1)三项关键技术的评测通过编写技术文档,其先进性体现在发表相关论文的同行评议中。计划构建在真实数据集测试上由专家建立基准。

2)均衡分案原型系统的评测通过第三方软件测评报告。

3)知识产权测评通过专利受理通知书、软件著作权证书和论文收录证明。


(5)参加单位任务分工

上海交通大学:牵头单位,总体负责课题研究与实施;研究案件特征提取与法官画像刻画,研究知识图谱的构建与更新,研究基于相似度聚类的案件推荐系统。受理技术发明专利2件,获得软件著作权1项,发表论文4篇。

上海交大慧谷通用技术有限公司:参研单位,负责均衡分案原型系统开发、整合与评测。获得软件著作权1项。