1.6 公共數據集
包括紐約和芝加哥在內的許多城市已經向公眾開放了它們的數據集。以下是一些公開數據集的鏈接:
? 紐約市公開數據:https://data.cityofnewyork.us/。
? 芝加哥公開數據:https://data.cityofchicago.org/。
? 微軟研究院的城市計算:https://www.microsoft.com/en-us/research/project/urban-computing/[66]。
? 城市噪聲:紐約市與社交媒體、POI和道路網絡有關的311投訴數據:https://www.microsoft.com/en-us/research/publication/diagnosing-new-york-citys-noises-with-ubiquitous-data/[73]。
? 城市空氣:根據五個中國城市的氣象數據和天氣預報分析它們的空氣質量數據[19,71,77]:https://www.microsoft.com/en-us/research/publication/forecasting-fine-grained-air-quality-based-on-big-data/。
? 交通速度、POI和道路網絡:從北京三個數據集中提取的特征被整合到三個矩陣中:https://www.microsoft.com/en-us/research/publication/travel-time-estimation-of-a-path-using-sparse-trajectories/[41]。通過向數據中添加一個用戶維度,建立一個張量來描述特定用戶在特定時間槽內在特定道路上的通行時間。該數據在參考文獻[46]中使用,并可以從以下URL下載:https://www.microsoft.com/en-us/research/publication/travel-time-estimation-of-a-path-using-sparse-trajectories/。
? GeoLife軌跡數據集[82]:來自微軟研究院GeoLife項目的GPS軌跡數據集[76],由182名用戶從2007年4月到2012年8月進行收集。該數據集已被用于估計用戶之間的相似性[25],從而實現朋友和位置推薦[75,79]。它還被參考文獻[8]用于研究找到離一系列查詢點最近軌跡的問題。
? T-Drive出租車軌跡[83]:來自微軟研究院T-Drive項目的軌跡樣本[52,53,55],由2008年一周內超過10000輛的北京出租車生成。完整的數據集用于為普通駕駛員提供最快的實際駕駛路線建議[53],為出租車駕駛員推薦乘客上車地點[55,57],實現動態出租車拼車[32,33],找出城市交通網絡中有問題的設計[74],以及識別城市功能區域[51,54]。
? 帶有交通標簽的GPS軌跡[84]:每個軌跡都有一組交通方式標簽,如駕駛、乘坐公交車、騎自行車和步行。該數據集可以用于評估軌跡分類和活動識別[67,70,72]。
? 基于位置的社交網絡的簽到數據[85]:這個數據集由超過49000名用戶在紐約和3100名用戶在洛杉磯產生的簽到數據組成,還包括用戶的社會結構。每個簽到數據包括場所ID、場所類別、時間戳和用戶ID。由于用戶的簽到數據可以被視為采樣率低的軌跡,這個數據集已被用于研究軌跡的不確定性[47]和評估位置推薦[3]。
? 颶風軌跡[86]:由美國國家颶風中心(NHC)提供的這個數據集包含從1851年到2012年的1740個北大西洋颶風軌跡(正式定義為熱帶氣旋)。NHC還提供了每年颶風季節(從6月到11月)中每個月典型颶風路徑的注釋。這個數據集可以用來測試軌跡聚類和不確定性。
? 希臘卡車軌跡[87]:這個數據集包含來自50輛不同卡車在希臘雅典周圍運送混凝土的1100個軌跡。參考文獻[12]中用它評估軌跡模式挖掘。
? Movebank動物追蹤數據[88]:Movebank是一個免費的在線數據庫,幫助動物追蹤研究人員管理、分享、保護、分析和歸檔數據。
- 企業數字化創新引擎:企業級PaaS平臺HZERO
- PyTorch深度學習實戰:從新手小白到數據科學家
- Voice Application Development for Android
- Architects of Intelligence
- Python廣告數據挖掘與分析實戰
- 數據庫系統原理及應用教程(第4版)
- 深入淺出MySQL:數據庫開發、優化與管理維護(第2版)
- 數據驅動設計:A/B測試提升用戶體驗
- INSTANT Apple iBooks How-to
- Hadoop大數據開發案例教程與項目實戰(在線實驗+在線自測)
- Hadoop集群與安全
- Google Cloud Platform for Developers
- 改變未來的九大算法
- 菜鳥學SPSS數據分析
- 利用Python進行數據分析(原書第2版)