美國加州公檢司法系統最近迎來了一次「大」升級,工作人員再也不用對著上千萬條案件找出大麻犯罪者,再一個個刪除紀錄了。
據《BBC》報導,背後的技術團隊只用了幾行代碼就搞定了這次升級,法院檢察官非常滿意。在他們的傳統觀念裡,政府技術中的任何東西都是要花費很多年時間和數百萬美元才能完成的。
「這是一套『突破性』算法,我們用AI處理了政府堆積已久的工作。」一位法官說道。
加州在2016年通過了64號提案將與大麻有關的定罪去除,使大麻在加州合法化。作為新法的一部分,之前有大麻前科的人都可以申請刪掉罪名。
據估計,加州過去有超過100萬人做過跟大麻有關的工作,對於那些有犯罪紀錄的人來說,如果不清除掉犯罪紀錄,會有4萬個「附帶後果」——超過一半與就業有關。此外,住房、醫療、購物等這些與生活密切相關的剛性需求,對有大麻犯罪紀錄的人來說都是麻煩,這將會導致他們陷入貧困死循環。
然而,在新法生效後,申請清除紀錄的人卻不到預計的3%,究其原因才發現,一些人是被繁瑣的申請流程嚇到了,另一些人則根本不知道去找什麽組織辦理申請。
不僅僅是那些想去除罪名的人感到無從下手,公檢法的工作人員在開始手動處理這件事時,也很快意識到這是一項耗時耗力的大工程。清除幾十萬條大麻犯罪紀錄成了加州政府公檢機構急需解決的問題。
這項工作預計需要耗費巨大人力、物力,耗時數月才能完成。於是刑事司法系統找來一家非營利組織Code for America, 該組織主要業務是為政府陳舊落後的信息系統提供高效便捷的改進服務。他們推出了一個「Clear My Record」的軟件解決方案。
據介紹,「Clear My Record」能分析法庭文件中的案件文本,可以用字符識別來掃描文件,對任何涉及暴力犯罪的紀錄都會標記不合格,對剩下的案件可以自動填寫文本。也就是說,該工具可以替代政府工作人員手動篩選大麻犯罪紀錄。
根據數據庫的原始文件,「Clear My Record」花了幾分鐘識別出了8,132個合格的犯罪紀錄(有1,230個是之前已經手動標註過)。這比人工處理快多了。
於是,在4月3日,舊金山法官Samuel K Feng與Code for America組織簽訂了合作協議。
《reddit》網友群嘲
批量刪除數據這種一般的操作也能被稱為「突破性」算法?
《BBC》報導後,「Clear My Record」在《reddit》網站上被大家集體群嘲了。
大多數人的看法是,這根本不是什麽突破性算法,甚至連「突破」的邊兒都沾不上,唯一的突破是政府終於擺脫他們的懶惰,開始尋求新技術來改善辦事效率。
有網友直接扔出自己編的一行代碼秒殺同行碼農。
《reddit》網站上的網友指出,「Clear My Record」和AI沒半點關係,簡單點說,相當於if語句加上一個Excel巨集,沒有一點技術含量,清除的可能只是一組相當基本的SQL腳本。
為了證實這一點,有人扒出該項目的Ruby代碼庫,發現並沒有執行所謂的文本挖掘,沒有用到自然語言處理(NLP),在查看分析法院文件時,有可能是非常簡單的關鍵字匹配。
一個曾經從事過處理法院紀錄的程式設計師說道,大家以為政府信息系統是一個10年前的程式設計師設計的,而現實是由幾百年前的哲學家和律師設計的,構建它是為了讓紙質文件和在不同地理位置的法院協同工作,適應的也是50年前非常笨拙的計算機系統。
「數據庫沒有『犯罪』變量,因為獲取這些信息需要自然語言處理才能理解案件文本中的意圖。我敢打賭,在系統中擦除大麻犯罪紀錄絕對要比想象中困難。」
也有網友表示,給多少錢,做多少活。幾年前,一個程式設計師看到法律系統的低效,於是他去讀了法學院,畢業後設計了一套程式,可以快速閱讀和分析常見的法律文件,律師們經常用它來協助辦案,這個程式設計師因此變得非常富有。
私營企業傾向於通過砸錢來提升效率,而依賴公共資金的政府部門習慣於不斷減少前端開發成本來維持運營,長期來看,結果會非常糟糕。
「免費的才是最貴的」。為高品質的解決方案付費,雖然支出似乎更高,但以正確的方式做事會產生更好、更便宜的長期結果。雖然目前的制度允許政府通過相關公司簽訂合同來解決問題,但並不是一開始就提供有競爭力的薪酬來吸引人才。因此才造成這麽多因短視和自私而落後的系統。
不過,也有網友保持理性客觀的態度,「Clear My Record」只是來輔助工作人員辦公,更重要還是得配合政府信息處理流程,要有決策人員來處理篩選後的信息。
你怎麽看?
此外,如果你對這個非營利組織提供的「Clear My Record」方案感興趣,可以在GitHub查看原始碼,連結奉上:https://github.com/codeforamerica/autoclearance
本文係由DeepTech深科技授權刊登。原文連結:美国加州用AI来清理案底,“突破性算法”被reddit网友群嘲