官术网_书友最值得收藏!

  • 城市計算
  • 鄭宇
  • 954字
  • 2025-06-05 13:49:44

1.6 公共數據集

包括紐約和芝加哥在內的許多城市已經向公眾開放了它們的數據集。以下是一些公開數據集的鏈接:

? 紐約市公開數據:https://data.cityofnewyork.us/。

? 芝加哥公開數據:https://data.cityofchicago.org/。

? 微軟研究院的城市計算:https://www.microsoft.com/en-us/research/project/urban-computing/[66]

? 城市噪聲:紐約市與社交媒體、POI和道路網絡有關的311投訴數據:https://www.microsoft.com/en-us/research/publication/diagnosing-new-york-citys-noises-with-ubiquitous-data/[73]

? 城市空氣:根據五個中國城市的氣象數據和天氣預報分析它們的空氣質量數據[19,71,77]:https://www.microsoft.com/en-us/research/publication/forecasting-fine-grained-air-quality-based-on-big-data/。

? 交通速度、POI和道路網絡:從北京三個數據集中提取的特征被整合到三個矩陣中:https://www.microsoft.com/en-us/research/publication/travel-time-estimation-of-a-path-using-sparse-trajectories/[41]。通過向數據中添加一個用戶維度,建立一個張量來描述特定用戶在特定時間槽內在特定道路上的通行時間。該數據在參考文獻[46]中使用,并可以從以下URL下載:https://www.microsoft.com/en-us/research/publication/travel-time-estimation-of-a-path-using-sparse-trajectories/。

? GeoLife軌跡數據集[82]:來自微軟研究院GeoLife項目的GPS軌跡數據集[76],由182名用戶從2007年4月到2012年8月進行收集。該數據集已被用于估計用戶之間的相似性[25],從而實現朋友和位置推薦[75,79]。它還被參考文獻[8]用于研究找到離一系列查詢點最近軌跡的問題。

? T-Drive出租車軌跡[83]:來自微軟研究院T-Drive項目的軌跡樣本[52,53,55],由2008年一周內超過10000輛的北京出租車生成。完整的數據集用于為普通駕駛員提供最快的實際駕駛路線建議[53],為出租車駕駛員推薦乘客上車地點[55,57],實現動態出租車拼車[32,33],找出城市交通網絡中有問題的設計[74],以及識別城市功能區域[51,54]

? 帶有交通標簽的GPS軌跡[84]:每個軌跡都有一組交通方式標簽,如駕駛、乘坐公交車、騎自行車和步行。該數據集可以用于評估軌跡分類和活動識別[67,70,72]

? 基于位置的社交網絡的簽到數據[85]:這個數據集由超過49000名用戶在紐約和3100名用戶在洛杉磯產生的簽到數據組成,還包括用戶的社會結構。每個簽到數據包括場所ID、場所類別、時間戳和用戶ID。由于用戶的簽到數據可以被視為采樣率低的軌跡,這個數據集已被用于研究軌跡的不確定性[47]和評估位置推薦[3]

? 颶風軌跡[86]:由美國國家颶風中心(NHC)提供的這個數據集包含從1851年到2012年的1740個北大西洋颶風軌跡(正式定義為熱帶氣旋)。NHC還提供了每年颶風季節(從6月到11月)中每個月典型颶風路徑的注釋。這個數據集可以用來測試軌跡聚類和不確定性。

? 希臘卡車軌跡[87]:這個數據集包含來自50輛不同卡車在希臘雅典周圍運送混凝土的1100個軌跡。參考文獻[12]中用它評估軌跡模式挖掘。

? Movebank動物追蹤數據[88]:Movebank是一個免費的在線數據庫,幫助動物追蹤研究人員管理、分享、保護、分析和歸檔數據。

主站蜘蛛池模板: 乐业县| 凯里市| 铜梁县| 剑阁县| 金坛市| 三穗县| 淮北市| 微博| 华池县| 北碚区| 甘肃省| 精河县| 石棉县| 特克斯县| 镶黄旗| 镇宁| 达州市| 阳信县| 成安县| 鹿邑县| 正定县| 郑州市| 娄烦县| 湘阴县| 黎平县| 多伦县| 内黄县| 察隅县| 洛川县| 府谷县| 郯城县| 兴文县| 新化县| 缙云县| 泰和县| 伊宁县| 舞钢市| 鄯善县| 清水县| 密山市| 垦利县|