機(jī)器學(xué)習(xí)使我們的工作和生活更加高效和智能。本文分析了如何利用機(jī)器學(xué)習(xí)建設(shè)智慧城市,主要從兩方面進(jìn)行展開(kāi):1)分析城市發(fā)生變化的原因;2)機(jī)器學(xué)習(xí)作為一門(mén)科學(xué)在智慧城市研究中的應(yīng)用。
機(jī)器學(xué)習(xí)正在幫助城市規(guī)劃師認(rèn)同或反駁長(zhǎng)期存在的關(guān)于城市的理論。
為什么某些城市讓人感到安全,而有些則讓人覺(jué)得危險(xiǎn)?為什么別的城市是美麗的?隨著時(shí)間的推移,城市是如何發(fā)展和變化的?最重要的是,我們?nèi)绾瘟炕覀兏兄鞘械目捶?,并用它?lái)更合理地規(guī)劃城市地區(qū)?
麻省理工學(xué)院媒體實(shí)驗(yàn)室集體學(xué)習(xí)小組主任CésarHidalgo花了數(shù)年時(shí)間, 他使用眾包數(shù)據(jù)和機(jī)器視覺(jué)技術(shù)來(lái)建立城市模型,以回答統(tǒng)計(jì)和調(diào)查根本無(wú)法解答的問(wèn)題。
Hidalgo的研究表明,人工智能已經(jīng)滲透在我們?nèi)粘I畹姆椒矫婷?,從芭比娃娃到網(wǎng)頁(yè)設(shè)計(jì),而且也開(kāi)始滲透到學(xué)術(shù)研究領(lǐng)域,尤其是在我們?cè)谘芯恐腔鄢鞘蟹矫?。但隨著這一新興領(lǐng)域的發(fā)展,人工智能也面臨著新的挑戰(zhàn)。
研究人員利用機(jī)器學(xué)習(xí)分析谷歌七年間的街景照片,觀察城市是如何發(fā)生變化的。
是什么使城市發(fā)生變化?
以該小組最近在《美國(guó)國(guó)家科學(xué)院院刊》上發(fā)表的論文為例。該研究使用了谷歌發(fā)布的五個(gè)城市在七年間的街景照片,分析了一些關(guān)于城市復(fù)興的著名觀點(diǎn)。這是一個(gè)已經(jīng)被研究了幾十年的關(guān)鍵問(wèn)題,人們圍繞著幾個(gè)學(xué)派關(guān)于如何以及為什么會(huì)出現(xiàn)城市復(fù)興的思想進(jìn)行了大量的辯論。Hidalgo和他的團(tuán)隊(duì)以160萬(wàn)張街景照片為對(duì)照組,通過(guò)機(jī)器學(xué)習(xí)對(duì)那些“經(jīng)典”的城市理論進(jìn)行測(cè)試。
研究小組發(fā)現(xiàn), 城市積極變化的最大因素實(shí)際上是受過(guò)高等教育人群的數(shù)量。 而且,整潔的城市和商業(yè)區(qū)也有聯(lián)系,其“安全評(píng)分”也一樣。但令人驚訝的是,與某些理論相反的是,收入和住房成本與城市的積極或消極的物理變化沒(méi)有關(guān)聯(lián)。Hidalgo在麻省理工學(xué)院新聞中解釋道:“城市復(fù)興這與收入理論無(wú)關(guān),也就是說(shuō),聚集高收入群體的城市并不代表受教育程度高。”
利用機(jī)器學(xué)習(xí)來(lái)加深我們對(duì)城市化的理解,類(lèi)似這樣的研究,我們可以把這門(mén)學(xué)科變成一門(mén)科學(xué),而不僅僅是一門(mén)社會(huì)科學(xué)。Hidalgo說(shuō):“我希望這個(gè)研究能夠幫助我們理解城市環(huán)境對(duì)人們的影響以及人們對(duì)環(huán)境的影響。這樣我們?cè)谥贫ǔ鞘幸?guī)劃方案時(shí),我們就會(huì)對(duì)不同設(shè)計(jì)方案有更加科學(xué)的解釋。這些方法還可以幫助我們了解官方數(shù)據(jù)未統(tǒng)計(jì)到的增長(zhǎng)與變化。”
從社會(huì)科學(xué)到科學(xué)
然而,在這種情況下使用機(jī)器學(xué)習(xí)仍然有許多挑戰(zhàn)。 最大的挑戰(zhàn)是什么呢?數(shù)據(jù)。
Hidalgo之前研究使用的數(shù)據(jù)來(lái)自于他和同事共同創(chuàng)建的網(wǎng)頁(yè)。在網(wǎng)頁(yè)上,用戶(hù)可以評(píng)價(jià)街景的安全和美觀程度,從而給研究員提供人們?nèi)绾慰创志暗臄?shù)據(jù)。但是要想全面開(kāi)展這項(xiàng)研究,他還需要更多的數(shù)據(jù)支撐。到目前為止,他們?nèi)匀灰揽烤W(wǎng)頁(yè)用戶(hù)的有機(jī)增長(zhǎng)來(lái)填充機(jī)器學(xué)習(xí)的數(shù)據(jù)。但是要想真正擴(kuò)大樣本容量,Hidalgo表示他們也許會(huì)為參與者提供一些報(bào)酬。
但是, 這種研究方法的挑戰(zhàn)不會(huì)隨著數(shù)據(jù)的獲得而結(jié)束。城市是不斷變化的,動(dòng)態(tài)的,而且不是每一個(gè)圖像都能理想地適用于算法處理。 Hidalgo說(shuō),Nikhil Naik是麻省理工學(xué)院Abdul Latif Jameel貧困行動(dòng)實(shí)驗(yàn)室的博士后,多年來(lái)致力于數(shù)據(jù)研究。研究過(guò)程中,主要的挑戰(zhàn)是解析谷歌街景圖像,因?yàn)榧词怪挥幸惠v卡車(chē)在行駛,也會(huì)導(dǎo)致圖像解析前后的巨大差異。而且,該小組還必須考慮季節(jié)性變化,比如地上的積雪和暴風(fēng)雨天氣。
為了修正數(shù)據(jù)中的這些異常,研究人員必須對(duì)數(shù)據(jù)庫(kù)中160萬(wàn)個(gè)圖像中的每個(gè)像素描繪的真實(shí)對(duì)象進(jìn)行分類(lèi)。如果有太多的像素被識(shí)別為卡車(chē)或行人,程序就不會(huì)使用那個(gè)很精確的圖像,反而在同一街區(qū)將其轉(zhuǎn)換為類(lèi)似的圖像。這個(gè)系統(tǒng)也被設(shè)置為忽略類(lèi)似于樹(shù)木或天空這樣的東西,因?yàn)樵诓煌募竟?jié),它們的變化太大,以至于不能得出準(zhǔn)確的變化圖像。
真正的挑戰(zhàn)在于把實(shí)驗(yàn)室的研究成果應(yīng)用于城市建設(shè)。Hidalgo說(shuō):“我認(rèn)為兩者結(jié)合的方法在城市規(guī)劃方面是比較常見(jiàn)的。但是,這個(gè)方法需要更好地?cái)U(kuò)展,那就是如何將這些方法整合到規(guī)劃者和架構(gòu)師手中。”
機(jī)器學(xué)習(xí)的前景是光明的,正如Hidalgo的工作成果一樣。他認(rèn)為,機(jī)器學(xué)習(xí)將在未來(lái)5-10年內(nèi)用于智慧城市的研究。而且變化具有相通性。城市隨著時(shí)間進(jìn)行變化,同時(shí)也適用于機(jī)器學(xué)習(xí)的傳播。
原文來(lái)自:IT時(shí)代網(wǎng)