热门搜索 :
考研考公
您的当前位置:首页正文

城市人群的移动与交互

来源:东饰资讯网

“从物理学角度看,生命这种物质运动形式,与其他的物质运动相比并没有更高的含义,从生命中你找不到新的物理规律,所以从我的角度看,一个人的死与一块冰的消融并没有本质的区别。”


刘慈欣《地球往事》

目录

  1. 前言
  2. 局域移动
  3. 聚集倾向
  4. 交通效率
  5. 跨区流动
  6. 相互影响

1. 前言

通过与某运营商合作,我们获得了北京十万用户的三十天内的移动和上网记录数据。下文对一天内的数据做若干简单分析。可以做的事情有很多,有待更多人加入研究团队,一起把这个线发展成长期研究的方向。

2. 局域移动

每个点是一个基站,信息流量越大的基站颜色越红

数据中一共有一万多基站。显然,基站更多地会被安放在人口密度较大的地区。因此从基站的分布也能看出北京人口的聚集情况。

根据用户移动对基站进行聚类

3. 聚集倾向

基站流距离的分布及其与流量的关系 基站流距离

从上图中也能看出用户从四面八方聚集到城中心。

4. 交通效率

北京最大的四个交通障碍区:军博,奥体中心,亦庄,北理工 基站流距离与实际地理距离的关系

我们发现,基站之间流距离与地理距离正相关(Pearson r = 0.02, p-value < 0.01)。如果交通网络是一个球面上均匀分布的二维网格,那么流距离与地理距离之间应该是系数为1的线性关系。因此实际交通系统是一个比均匀分布的交通系统更高效的系统。然而即使对于这样一个高效系统,如上文分析,仍然有许多改善的余地。

5. 跨区流动

移动速度 移动速度及在信息传递中的位置

我们发现,用户的移动速度是对数正态分布。大多数人移动比较慢,少数人移动较快。人与人之间的移动速度差别是几何级的。从地图上可以看出,区域之间的移动比较快,区域内的移动比较慢。

6. 相互影响

移动速度及在信息传递中的位置

通过用户的上网行为,我们可以构建用户网络。如果用户i和用户j先后上了同一个网站,我们计算i上传的信息流量和j下载的信息流量,将两者加总作为链边权重,视为用户之间的互动强度。在这个网络上,对用户计算流长度,可以看出用户在信息交流中是主动还是被动的,是影响别人还是被别人影响。

我们发现,用户的移动速度与在信息传递链中的位置负相关(Pearson r = -0.01, p-value = 0.02)。这可能是由于移动速度较快的用户社会经济地位较高,在社会交往中也更加主动。

Top