大数据法律监督的渐进模式探究

大数据法律监督的渐进模式探究

——以河南省安阳市龙安区农用地领域的实践为例


  大数据法律监督是以大数据科技手段为支撑力,以类案、多案监督为着力点,以国家治理现代化为目标的高级法律监督。当前,大数据法律监督在全国各地的创新实践初见成效,比如,浙江总结了“个案发现—类案监督—系统治理”的基本思路。然而,全维度、完备的原始数据资源往往难以获取,“数到用时方恨少”的现象时有发生。本文结合河南省安阳市龙安区检察机关在农用地领域的探索实践,围绕“基于何种思维逻辑、收集什么数据资源、如何开发数据价值、如何实现业务转型”,试着探索形成操作性强、成本可控的大数据法律监督模式的路径。


  基础思维逻辑

  大数据思维的精髓可概括为三个方面,即全样思维、容错思维和相关思维。是否恰当运用这些基础思维模式,关系到法律监督数字化转型的达成,以下对此着重进行探析:

  全样思维决定类案监督。传统个案监督源于传统抽样思维,案源具有抽样思维下的随机性、偶发性,典型性和影响力选择性不足,与法律监督追求典型性、影响力的要求存在一定矛盾。大数据全样思维将处理数据从样本数据变为全部数据。首先,大规模收集潜在违法事实数据集,然后再建立大数据挖掘模型得出批量类案线索,甄选典型性强、潜在影响力大的线索成为可能,为类案监督驱动社会治理提供基础条件。龙安区在实践中,收集近五年囊括辖区所有土地利用变化信息的卫星影像序列,通过建立农用地侵占大数据挖掘模型,发现70余条涉嫌非法侵占农用地的类案线索。基于该批量类案线索,一方面办理了一批涉案面积大、影响力大的案件;另一方面从中发现规律和症结,为制发高质量检察建议创造基础条件,为检察监督有效嵌入社会治理提供重要依据。

  坚持容错思维,放弃追求精确性,聚焦挖掘数据的价值。这使得法律大数据监督在满足类案线索发现需求的同时,可以节省成本、降低门槛。龙安区人民检察院对利用卫星遥感掌握大数据的空间分辨率、时间分辨率、维度完备性、数据来源等进行容错考虑,有效降低了数据资源的门槛和成本,虽然在一定程度上影响类案线索的准确率,但是不影响大数据法律监督的可操作性。比如,该院实践中对光学卫星图像的空间分辨率以10米影像为主,少量优于2米的历史影像为辅;时间分辨率方面,采用连续5年每年一张图;维度完备性方面,最初只采用卫星图像,而不直接获取行政部门的数据,以降低时间成本;卫星遥感影像数据由公开渠道获取,原始数据采购成本低等。

  相关思维决定模型简化。公益诉讼中诉讼主体、权利主体处于分离状态,且检察机关不应过于主动干预行政权运转,使得检察机关提起公益诉讼案件的来源有限。换言之,检察机关通常难以获得与案件相关的完备数据。相关思维从不完备数据中利用特征相关性发现价值,基于其建立的类案挖掘模型,虽损失了一定的精确性,但简单实用、易于复制。比如,龙安区检察机关虽不依赖精确数据,仅利用公开的卫星图像数据开展筛查,但可以基于正射图像与实地图像的相关关系构建简单实用数据模型。例如,卫星正射影像中呈现高低不平、亮暗相间、纹理不规则、有车辆活动痕迹、周边是农田等特征的裸露地块,大概率与问题地块相关。

  综上,相较于传统案源获取模式,大数据思维模式跳出传统抽样思维、精确思维、因果思维模式,有利于在低成本、低门槛前提下构建简单实用的模型,主动挖掘批量、不精准但可用的类案监督线索。


  数据资源选用及线索挖掘路径

  根据《中华人民共和国土地管理法》《最高人民法院关于审理破坏土地资源刑事案件具体应用法律若干问题的解释》的有关规定,农用地大数据法律监督需要两类数据:一是能够反映农用地实际用途变化,如卫星遥感图像序列、无人机航拍图像等。其中,卫星图像反映农用地实际用途和范围变化具有大尺度、动态监测、成本可控等优势。而无人机大尺度航拍和处理成本大,不适合用于原始数据挖掘。二是直接反映农用地范围、分类、权属、审批等信息的数据源。

  构建农用地大数据法律监督模型,线索挖掘的路径主要包括四个步骤:全样数据收集、初步线索挖掘、批量实地勘查、多方调查甄别。它是一个漏斗式过滤、渐进式收敛的过程。

  全样数据收集。“全样”不等于“全维”。例如农用地法律监督领域,先要关注土地利用性质是否发生了变化,变化是否异常。因此,第一步要收集的数据是大规模全样卫星图像,而不是农用地权属、用途变更等更多维度的信息。比如,龙安区检察机关在构建农用地法律监督模型实践中,先从关注耕地、林地、水域周边是否被垃圾固废占用、是否构建建筑物、是否变更为工程用途等现象出发,收集多源、异构卫星图像大数据资源,从而以较小成本构建不完备但蕴藏重要价值的大规模数据资源。

  初步挖掘线索。运用收集的卫星图像全样数据,对土地覆盖和土地利用的性质进行自动分类并构建智能变化检测模型,再从中检测出问题地块,并估算面积。比如,龙安区检察机关利用该方式一次性提取出辖区内70余件问题地块线索。

  批量实地勘察。由于初步挖掘的线索存在一定误差,为排除错误线索、初步固定证据,还要组织人员进一步实地勘察地形地貌及土地用途。实践中,龙安区检察机关引入移动端“随手察”数字化辅助系统,进行聚合调查、精准无缝导航到问题地块,这使得初步核查线索总时间不超过一个星期,大大节省了人力。通过能动考量,排除少量不准确线索,得出需进一步调查核实的问题线索50余件。

  多方调查甄别。在上述三个步骤基础上,进一步过滤问题地块,到相关行政部门精准走访调查土地属性数据,补充完善信息。例如,问题地块的土地利用性质的变化可能是无审批的、合理审批的、错误审批的、未按照审批范围占用的、超期占用的、未缴纳耕地占用税的等,相关信息可从行政部门调查获得。实践中,龙安区通过对农业农村局、自然资源局等部门多方走访调查,将问题线索精筛至30余件。


  业务模式转型

  构建“个案启发—场景出发—数据驱动”的批量案源发现模式。个案是启发点,场景是出发点,数据是驱动力,批量案源线索发现是该大数据法律监督模型前期的目标。实践中,龙安区检察机关将生态环境与资源保护视作大领域、农用地保护视作中粒度场景,此场景又包括若干细分违法场景,如固废侵占农用地、非法取土、临时用地超期未复垦等。在构建线索发现模型时,中粒度场景具有很强的可操作性,其决定数据资源的选用方式。在选择和获取数据资源后,根据上述线索挖掘路径进行渐进式过滤,得出批量案源线索。该模式下,检察公益诉讼由“线下进场”转为“线上入局”,由“人力先行”变为“数据驱动”。这改变了以往“以脚丈量尺寸,以眼发现线索”的案源收集模式,转而采用上述线索挖掘路径,以达到从个案办理到类案监督的能级提升。龙安区人民检察院在构建农用地大数据法律监督模型后,改变过去被动监督局面,将有限的人力资源集中到案件的关键节点和重要环节上,3个月内在此领域立案13件,超过过去3年在该领域的年均办案量。

  形成“面向治理—类案驱动—能动融合”的法律监督履职模式。在加快推进社会治理现代化大目标下,检察监督需要启动“类案纠错、类案防错”双重模式,以制发公益诉讼检察建议和社会治理检察建议的方式促进社会治理。批量线索供给模式下,检察机关需能动甄选典型性强、影响力大的案件进行办理;检察机关各条线不再是单打独斗,可根据类案线索各司其职、相互融合。

  龙安区检察机关在引入农用地大数据法律监督模型后,满足刑事案件标准的,由刑检部门办理;造成涉水域污染、耕地污染等公共利益损害突出的,由公益诉讼部门立案调查;存在行政部门不作为、乱作为造成重大公共利益损害拒不整改的,提起行政公益诉讼等。形成了面向治理大目标、各司其职的融合监督效应。围绕农用地领域,龙安区人民检察院已办理刑事案件2件、提起行政公益诉讼1件,向辖区5个相关行政机关和乡镇政府发出针对性检察建议督促其履职,保护土地超千亩。此外,该院还与相关部门建立“田长+检察长”等内外融合的长效协作机制,加强数据共享,实现线索双向移送,探索建立行政执法和法律监督的有序衔接机制,做实做深耕地保护。同时,大数据法律监督应用重塑办案流程,为案件办理各阶段节约了时间,大大提高了公益诉讼工作质效。

  (作者祝现明、温俊波、杨安文供职于河南省安阳市龙安区人民检察院,李建元供职于浙大城市学院)