大數(shù)據(jù)算出“異常出行行為” 小小公交卡或能讓小偷“現(xiàn)形”
全國(guó)公安交管部門已經(jīng)在新浪微博開通認(rèn)證了4300余個(gè)賬號(hào),日均發(fā)布微博數(shù)量超過1.5萬條;公交卡大數(shù)據(jù)今后可能會(huì)抓住城市九成以上的小偷;南京蘇州已經(jīng)成為全國(guó)智能出行發(fā)展城市十強(qiáng)城市……近日由公安部交通管理科學(xué)研究所、高德地圖等機(jī)構(gòu)聯(lián)合主辦的“互聯(lián)網(wǎng)+交通出行服務(wù)”論壇上,專家介紹說,未來交通大數(shù)據(jù)的應(yīng)用將會(huì)給百姓帶來更多“不可能”的方便。
公交卡信息如何“算出”小偷
根據(jù)公交卡的大數(shù)據(jù),能夠篩選出九成以上的疑似小偷,這是怎么做到的?有參加論壇的專家介紹說,現(xiàn)在我們結(jié)合公交車GPS數(shù)據(jù)、乘客刷卡信息等數(shù)據(jù),能夠獲取每輛公交車每個(gè)站點(diǎn)停車時(shí)間、上下車乘客數(shù)量、乘客精細(xì)時(shí)空軌跡等,可以做“公交車線路、站點(diǎn)、發(fā)車頻次優(yōu)化”、“典型居住區(qū)和就業(yè)地的通勤出行分析”等分析。
A
驗(yàn)證原理:絕大多數(shù)乘客乘坐公交車或地鐵出行時(shí),會(huì)選擇最優(yōu)出行方案,要么用時(shí)最短,要么換乘次數(shù)最少;但有極少數(shù)人的乘車路線很奇怪,比如會(huì)繞行一大圈或者突然改變乘車路線,沒有什么規(guī)律可言,如果某人的異常行為足夠多,那么他有可能是小偷。
B
研究過程:此前發(fā)布的這一成果是一項(xiàng)大學(xué)教授做的研究,在一次國(guó)際會(huì)議上公布過成果。以北京為例,研究人員分析了兩個(gè)月約16億次公交卡刷卡數(shù)據(jù)記錄,共涉及約600萬名乘客。
第一步,研究者把北京劃分為居住、工作、教育、購物、娛樂、醫(yī)療等多個(gè)小功能區(qū)塊,建立起包括896條公交路線、近4.5萬個(gè)公交車站與18條地鐵路線、320個(gè)地鐵站的公共交通網(wǎng)絡(luò)數(shù)據(jù)集,通過數(shù)據(jù)建模從龐大的公交卡記錄中過濾掉普通乘客。
第二步,結(jié)合從警方報(bào)告和微博上收集到的失竊信息,通過機(jī)器學(xué)習(xí)算法從異常出行信息中挖掘出潛在的小偷。
實(shí)驗(yàn)結(jié)果:上述方法中被歸為“行為異?!闭撸蟊淮_認(rèn)為小偷的驗(yàn)證率高達(dá)92.7%。可是,如果小偷頻繁換用公交卡呢?據(jù)研究此項(xiàng)目的專家表示,就算換卡也有辦法,比如小偷經(jīng)常團(tuán)伙活動(dòng),這也是一個(gè)明顯的特征。
C
質(zhì)疑聲音:不過也有人表示,人的活動(dòng)是十分復(fù)雜和偶然的,也許乘客心情不好,或者坐過站回頭、臨時(shí)改變行程等等,都有可能出現(xiàn)行為異常,不能都判定為小偷吧。