數(shù)據(jù)質(zhì)量與數(shù)字檢察工作緊密關(guān)聯(lián),提高數(shù)據(jù)質(zhì)量對(duì)提升大數(shù)據(jù)賦能法律監(jiān)督的準(zhǔn)確性、全面性、可靠性有著重要意義。山東省青島市檢察院從數(shù)字檢察工作開(kāi)展之初就充分認(rèn)識(shí)到數(shù)據(jù)質(zhì)量的重要性,堅(jiān)持從檢察機(jī)關(guān)內(nèi)部數(shù)據(jù)著手,探索全方位的內(nèi)部數(shù)據(jù)治理路徑。
一、檢察機(jī)關(guān)內(nèi)部數(shù)據(jù)質(zhì)量存在的主要問(wèn)題
筆者在對(duì)案卡項(xiàng)、辦案文書、生產(chǎn)庫(kù)、統(tǒng)計(jì)報(bào)表等多個(gè)數(shù)據(jù)源進(jìn)行全面比對(duì)和溯源分析發(fā)現(xiàn),目前影響檢察業(yè)務(wù)數(shù)據(jù)質(zhì)量的問(wèn)題主要分為三類。
一是案卡項(xiàng)本身填錄存在錯(cuò)、漏、遲。全國(guó)檢察業(yè)務(wù)應(yīng)用系統(tǒng)中,案卡項(xiàng)之間的業(yè)務(wù)邏輯性約束較少,大部分案卡項(xiàng)是否準(zhǔn)確填寫并不影響整個(gè)案件辦理流程,案卡項(xiàng)填寫欠缺邏輯性、存在滯后性的問(wèn)題普遍存在。自2021年6月全國(guó)檢察業(yè)務(wù)應(yīng)用系統(tǒng)2.0(以下簡(jiǎn)稱“2.0系統(tǒng)”)上線以來(lái),因案卡項(xiàng)的填錄節(jié)點(diǎn)、填錄位置、填錄方式等相較于之前的系統(tǒng)變化較大,2.0系統(tǒng)的案卡填錄不規(guī)范、不準(zhǔn)確、不及時(shí)的問(wèn)題呈增長(zhǎng)趨勢(shì)。例如,案卡“審查起訴階段檢察機(jī)關(guān)適用認(rèn)罪認(rèn)罰”的案卡項(xiàng)填寫為“是”,犯罪嫌疑人個(gè)人信息中“審查起訴階段檢察機(jī)關(guān)適用認(rèn)罪認(rèn)罰”卻均為“否”等問(wèn)題,均為案卡項(xiàng)內(nèi)部問(wèn)題,通過(guò)核查案卡項(xiàng)單一數(shù)據(jù)源就能發(fā)現(xiàn)。
二是案卡項(xiàng)填錄情況與文書內(nèi)容不一致。2.0系統(tǒng)設(shè)置了通過(guò)文書受理功能后,案卡項(xiàng)和文書不一致的問(wèn)題數(shù)量明顯減少。但部分案件因無(wú)法通過(guò)文書受理,在審查起訴階段大部分案卡項(xiàng)則為人工錄入,這就導(dǎo)致案卡項(xiàng)填錄和文書內(nèi)容不一致的問(wèn)題仍普遍存在。該類問(wèn)題既可能是案卡項(xiàng)填錄錯(cuò)誤,也可能是文書撰寫錯(cuò)誤,同時(shí)大部分無(wú)法通過(guò)核查案卡項(xiàng)單一數(shù)據(jù)源發(fā)現(xiàn)。例如,案卡項(xiàng)中犯罪嫌疑人姓名填錄為“李四”,起訴意見(jiàn)書中犯罪嫌疑人姓名填錄為“王五”,該問(wèn)題就無(wú)法通過(guò)核查案卡項(xiàng)發(fā)現(xiàn),僅能通過(guò)比對(duì)案卡項(xiàng)和文書才能發(fā)現(xiàn)。因案卡項(xiàng)和文書均是海量數(shù)據(jù)級(jí)別且在不斷遞增中,通過(guò)人工無(wú)法全面核查,亟需進(jìn)行自動(dòng)化核查或篩選。
三是案卡項(xiàng)填錄情況和2.0系統(tǒng)統(tǒng)計(jì)報(bào)表不一致。2.0系統(tǒng)自帶統(tǒng)計(jì)報(bào)表,其中的業(yè)務(wù)數(shù)據(jù)產(chǎn)生機(jī)制主要源于案卡項(xiàng)的填錄情況,因傳輸延時(shí)、上表機(jī)制、人為因素等原因,存在表卡不一的問(wèn)題。統(tǒng)計(jì)報(bào)表數(shù)據(jù)是業(yè)務(wù)指標(biāo)、案件質(zhì)量指標(biāo)評(píng)價(jià)的基礎(chǔ),涉及檢察院年度考核排名等,提升案卡項(xiàng)目填錄質(zhì)量繼而提升統(tǒng)計(jì)報(bào)表業(yè)務(wù)數(shù)據(jù)質(zhì)量是提高評(píng)價(jià)考核準(zhǔn)確性、科學(xué)性的重要支撐。
二、檢察機(jī)關(guān)內(nèi)部數(shù)據(jù)的治理路徑
檢察機(jī)關(guān)應(yīng)堅(jiān)持以問(wèn)題為導(dǎo)向,以解決實(shí)際問(wèn)題為目標(biāo),根據(jù)檢察機(jī)關(guān)內(nèi)部數(shù)據(jù)存在的不同問(wèn)題類型,采取有針對(duì)性的舉措,進(jìn)行全方位治理。
一是對(duì)檢察業(yè)務(wù)應(yīng)用系統(tǒng)案卡項(xiàng)填錄情況進(jìn)行實(shí)時(shí)核查。根據(jù)最高檢、省級(jí)院對(duì)案卡項(xiàng)填錄情況的通報(bào),創(chuàng)建對(duì)業(yè)務(wù)數(shù)據(jù)案卡項(xiàng)填錄準(zhǔn)確性的專項(xiàng)核查規(guī)則,通過(guò)案卡項(xiàng)之間邏輯性比對(duì)、空白項(xiàng)核實(shí)、流程節(jié)點(diǎn)判斷等多角度自動(dòng)核查案卡填錄的錯(cuò)、漏、遲問(wèn)題。實(shí)行每日自動(dòng)核查,對(duì)核查出的新問(wèn)題、已整改問(wèn)題、未整改問(wèn)題進(jìn)行分類、實(shí)時(shí)顯示。
二是通過(guò)文本解析技術(shù)實(shí)現(xiàn)案卡與文書的智能校驗(yàn)。通過(guò)對(duì)起訴意見(jiàn)書、起訴書、判決書等文書內(nèi)容進(jìn)行智能解析,將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),再和對(duì)應(yīng)的案卡項(xiàng)進(jìn)行逐項(xiàng)比對(duì),自動(dòng)找出文書內(nèi)容和案卡項(xiàng)實(shí)際填錄情況的差異。對(duì)于可以自動(dòng)判別為文書錯(cuò)誤或案卡項(xiàng)填錄錯(cuò)誤的問(wèn)題,實(shí)時(shí)發(fā)送辦案人整改;對(duì)于需要人工進(jìn)行進(jìn)一步判別的,將自動(dòng)化篩選結(jié)果發(fā)送辦案人辨別確認(rèn)。相較于上一功能,該功能的技術(shù)性難度在于需對(duì)起訴意見(jiàn)書、起訴書、判決書等主要文書的部分內(nèi)容進(jìn)行精準(zhǔn)提取。目前,法律文書解析提取類功能主要利用正則表達(dá)式技術(shù),該技術(shù)在較為規(guī)整的文書內(nèi)提取基本要素的應(yīng)用已非常成熟,2.0系統(tǒng)設(shè)置的通過(guò)文書受理功能和各地方檢察院研發(fā)的文書回填功能,均為該技術(shù)的具體應(yīng)用。
三是對(duì)異常數(shù)據(jù)自動(dòng)監(jiān)控提醒。研發(fā)2.0系統(tǒng)統(tǒng)計(jì)報(bào)表異常數(shù)據(jù)監(jiān)控提醒系統(tǒng),重點(diǎn)關(guān)注與檢察機(jī)關(guān)案件質(zhì)量主要評(píng)價(jià)指標(biāo)相關(guān)的統(tǒng)計(jì)數(shù)據(jù),設(shè)定異常數(shù)據(jù)提醒閥值,當(dāng)統(tǒng)計(jì)數(shù)據(jù)突破提醒值范圍的自動(dòng)提醒,并自動(dòng)轉(zhuǎn)向相關(guān)案卡項(xiàng)目,通過(guò)人工+機(jī)器的方式跟蹤上表進(jìn)程、研透問(wèn)題根源。對(duì)確實(shí)存在問(wèn)題的情形,及時(shí)通知辦案人整改,有力促進(jìn)業(yè)務(wù)數(shù)據(jù)“擠水分”,提升統(tǒng)計(jì)報(bào)表數(shù)據(jù)整體質(zhì)量。
(作者單位:山東省青島市檢察院)
堅(jiān)持問(wèn)題導(dǎo)向 破解發(fā)展難題 以學(xué)促干激發(fā)我市消費(fèi)市場(chǎng)活力
2023-08-16 13:48