EMNLP 2019 | 法小飞:华语法度智能副顺手

  根本信息

  论文名称:IFlyLegal: A Chinese Legal System for Consultation, Law Searching, and Document Analysis

  论文干者:王梓玥,王珍鑫,段兴义,伍父亲勇,王士进,胡国平,刘挺

  下载地址:https://www.aclweb.org/anthology/D19-3017/

  摘要信介

  法度科技是指派用信息募化技术为用户供智能便捷的法度咨询、检索、剖析等效力动,并提升效力动效力和体验。年来过到来,法度科技受过到来己运用层面和切磋层面的普遍关怀,就中心工干之壹是使用天然言语处理技术让机具学会了松、剖析并运用法度文本,所需技术带拥有语义体即兴、文规则类、天然言语铰理和讯问恢复技术等。本文中,我们构建了壹个集儿子成多种天然言语处理技术并满意不一用户帮体需寻求的华语法度科技效力动体系——“法小飞”。2019年1月宗,我们的小以次累计用户数到臻2739,页面阅读量超越4万次。“法小飞”首要干用带拥有:

  智能法度咨询:采取语义了松、文本铰理等技术并结合拒识模块,完成对用户效实的己触动回恢复;法条查询:当前完成叁种查询方法,关键词查询,语义查询和案情查询。就中,语义查询又称为法条伸荐(或法条铰理)。与传统基于统计特点的检索方法不一的是,法条伸荐完整顿采取吃水念书模具,对用户输入终止了松和剖析,并伸荐使用法条。案情剖析及己触动量刑:该模块首要干用是剖析案情文本,并婚配相像案例、预测裁剪判结实,就中刑事裁剪判结实预测又称为己触动量刑。

  本文将对“法小飞”采取的体系架构、技术、试验等相干工干终止伸见。

  “法小飞”体系伸见

  “法小飞”首要由法度咨询、法条查询、案情剖析叁个模块结合,其父亲致构造如图1所示。

  法度咨询模块首要面向当事人或普畅通用户,担负回恢复用户提出产的法度效实,由企图识佩、法度QA等儿子模块结合。企图识佩等预处理模块采取基础biRNN和CNN分类模具,提本题信息、判佩用户企图,并将输入转提交给目的模块。法度咨询模块结合本题信息,经度过端到端的锻炼方法,对用户输入终止剖析,并婚配到语料库中的使用回恢复。余外面,不一的输入效实能触发不一的辅弼干用,如名词说皓、多轮讯问恢复、律师伸荐等。

  法条查询模块拥有叁种不一的检索方法:普畅通检索、语义检索及案情检索。普畅通检索以BM25检索算法为基础,辅弼以查询干用己触动判佩等预处理模块,完成多花样查询,如:题目查询、情节查询、篇章查询、稀准查询等。本文中的语义检索又称为法条伸荐,是针对法条数据特意锻炼的、以天然言语铰理模具为基础的法度语义检索方法。普畅通检索的区佩在于不依顶赖于传畅通畅通计学特点,但根据吃水念书模具婚配语义体即兴并伸荐最佳使用法条,本文中经度过度段锻炼多个串行模具的方法完成语义婚配检索。鉴于法条数庞父亲,直接对输入效实终止法条婚配计算量度过父亲,时间效力低,故此,需寻求先经度过文规则类模具将候选法条范畴限度局限在拥有限部法度内,又使用句子儿子婚配模具从中伸荐婚配的法条。考虑届期间效力,分类模具采取骈杂的CNN模具,并经度过不一卷积核窗口长度捕秉不一粒度信息;同时,为了提升婚配正确比值,句子儿子婚配经过采取BERT模具,用20%的法度讯问恢复语料对BERT_base言语模具终止预锻炼后,又用全量法度讯问恢复语料终止微调。案情检索与语义检索的区佩在于,上述语义检索的输入文本为日日白话募化用语,而案情检索倾向了松整顿段长文本且用词更其规范正式,经度过度类的方法,从事前定义的拥有限个法条中伸荐使用法条。