首頁 >> 新聞中心 >> 行業資訊
統計局的(de)互聯網思維:拟用大數據預測房價走勢

[ 信息發布:www | 發布時間:2014-09-22 | 浏覽:1311 ]

國家統計局的(de)“大數據夢”肯定不是說說而已,而在這場圓夢之旅中,作為(wèi)中國互聯網翹楚的(de)BAT(百度、阿裏、騰訊)三家都不會缺席。

19日上午召開的(de)第五屆中國統計開放日上,國家統計局首次對外展示了其正在研究的(de)基于百度搜索數據來預測房地(dì)産價格的(de)新工具,并演示了這項工具對北京房價的(de)驚人預測力。在開放日上,國家統計局也展示了新研發的(de)網購數據統計,而其數據來源之一(yī)就是剛赴紐約上市的(de)阿裏巴巴。

騰訊也沒有缺席這場建立大數據統計的(de)國家戰役。甫一(yī)開年(nián),國家統計局局長(cháng)馬建堂就馬不停蹄地(dì)走訪了中國*代表性的(de)互聯網企業。馬建堂的(de)身影出現在京東商城和(hé)阿裏巴巴,以及1号店、CBI易貿集團、百度等企業。今年(nián)6月末,馬建堂來到了騰訊,并從馬化騰手中接過了一(yī)個企鵝公仔。

百度如(rú)何統計房價

更為(wèi)精确的(de)房地(dì)産價格統計一(yī)直是政府希圖攻克的(de)難題。因為(wèi)個人隐私、陰陽合同等問題存在可(kě)能影響源頭數據的(de)真實性,而現有房地(dì)産領域“數出多門”的(de)情況也增加了“數據打架”的(de)概率。

相對而言,海量的(de)搜索數據不經意透露了真實的(de)房地(dì)産走勢信息。

利用基于百度搜索數據,國家統計局篩選出同房地(dì)産價格有關的(de)一(yī)系列關鍵詞,然後通過這些關鍵詞出現的(de)時間頻次同以往實際發布的(de)新房數據和(hé)二手房數據價格的(de)走勢實施拟合并建立模型,*根據所建模型預測未來房地(dì)産價格的(de)走勢。這就是國家統計局新工具的(de)基本原理(lǐ)。除了國家統計局之外,美國的(de)谷歌也是在用這種原理(lǐ)來預測流行病的(de)暴發趨勢。

利用這一(yī)工具,國家統計局在開放日現場演示了一(yī)把對北京房價的(de)模拟和(hé)預測。

《*财經日報》記者注意到,通過百度數據所得出的(de)價格曲線預測值同實際價格曲線之間的(de)拟合程度較高(gāo),其中百度搜索數據對二手房價格拟合效果比新房更好。這或許是因為(wèi)剛需人群在尋找二手房交易時更能提供準确而真實的(de)信息。

如(rú)果這項工具投入應用,官方內(nèi)部有望提前多天就了解到下月房價的(de)大緻走勢。統計部門也希望,在房價實際數據出來後能使用這一(yī)工具檢驗官方數據的(de)有效性,從而提升統計數據的(de)有效性。

國家統計局同阿裏巴巴的(de)合作則由來已久。在向社會“找數據”的(de)進程中,淘寶網是統計部門*關注的(de)大數據來源。因為(wèi)淘寶網上的(de)交易數據既是實時成交數,又真實有效,這正是統計部門以往驅動龐大的(de)調查隊伍所希望尋找的(de)*數據。

早在2012年(nián),國家統計局上海調查總隊就開始了網絡采價試點。上海調查總隊發現,淘寶網上有大量銷量較大但不在CPI統計內(nèi)的(de)産品,比如(rú)進口糖果、進口巧克力、進口餅幹、進口奶粉、進口美容用品和(hé)鮮花快遞等,通過一(yī)定的(de)方式這些産品都可(kě)以被整合進CPI。另外,原有CPI規格品中有的(de)數據比統計部門抽樣調查得到的(de)數據更為(wèi)及時,比如(rú)書籍銷售價格就可(kě)以從亞馬遜、當當網、京東網上選取。上海的(de)試點發現,2012年(nián)含網絡采價的(de)CPI和(hé)不含網絡采價的(de)CPI銜接性非常好。

統計局的(de)互聯網思維

通過直接利用淘寶和(hé)天貓等電商交易平台的(de)數據,國家統計局就能統計出通過傳統調查無法拿到的(de)網絡交易數據。今年(nián)初,國家統計局開始對外公布這一(yī)成果。數據顯示,上半年(nián),全國網上零售額11375億元,同比增長(cháng)48.3%。其中,限額以上單位網上零售額1819億元,增長(cháng)56.3%,而同期的(de)社會消費品零售總額隻有12.1%。如(rú)果沒有網上銷售數據,市場也許會過低(dī)估計中國經濟增速放緩表象下的(de)新經濟動力。

馬建堂在對騰訊調研時再次提出,要進一(yī)步打造現代化服務型統計。積極利用互聯網和(hé)無線移動等現代信息技術手段以及新興媒體等平台不斷拓展統計服務渠道(dào)、提升服務品質。

他表示,要特别加強與大型綜合性互聯網公司的(de)合作,利用他們已有的(de)各類網絡平台提供統計服務,不斷推動常規統計和(hé)各類普查數據和(hé)産品展示的(de)空間化、可(kě)視(shì)化,為(wèi)社會公衆提供更加優質、友好的(de)統計服務。

為(wèi)了給公衆提供貼身服務,就在這次統計開放日上,國家統計局推出了更新版的(de)國家數據庫手機軟件,向海外推出了具有可(kě)視(shì)化功能的(de)英文版的(de)國家數據庫,還展示了未來将要推出的(de)應用第三次經濟普查數據的(de)地(dì)理(lǐ)信息系統。

利用這個地(dì)理(lǐ)信息系統,普通用戶能找到其自(zì)主劃定任意區域內(nèi)的(de)經濟單位數量、分布和(hé)單位基本信息,同時還可(kě)以圖形化顯示一(yī)個地(dì)區內(nèi)行業和(hé)企業數量的(de)分布。這就相當于一(yī)個商業的(de)GPS導航,無論是規劃寫字樓、建設百貨大樓、選定物流中心還是找到合作夥伴,都可(kě)以用這一(yī)GPS在商業的(de)“地(dì)圖”上自(zì)由馳騁。

用馬建堂自(zì)己的(de)話說,大數據時代正在來臨,“這一(yī)滾滾浪潮浩浩蕩蕩、不可(kě)阻擋”。

而在這場革新之潮中,馬建堂領導的(de)國家統計局也在構築一(yī)個“統計夢”。在統計開放日上,馬建堂用一(yī)個人的(de)頭腦四肢比喻他的(de)統計夢想。

這個統計夢有正确的(de)頭腦,“真實可(kě)信、科學(xué)嚴謹、創新進取、服務奉獻”的(de)統計核心價值觀入腦入心,統領一(yī)切統計工作。有健壯的(de)兩臂,一(yī)邊插上現代信息技術的(de)翅膀,實現統計生産全流程、*的(de)信息化、網絡化、電子(zǐ)化,實現統計調查和(hé)大數據共同成為(wèi)統計基礎數據兩大來源;一(yī)邊是統計法制建設更加健全,依法統計、獨立調查蔚然成風。有魁偉的(de)軀幹,統計生産流程再造,統計人員通過電子(zǐ)手段直接采集數據,調查對象利用互聯網直接上報數據,同一(yī)平台加工處理(lǐ)所有統計數據。有堅實的(de)雙腿,就是統計基層工作得到進一(yī)步加強,數據源頭更加透明;統計業務基礎更加鞏固,統計标準更加統一(yī)健全,統計制度更加規範完備,統計方法更加科學(xué)先進。