“从物理学角度看,生命这种物质运动形式,与其他的物质运动相比并没有更高的含义,从生命中你找不到新的物理规律,所以从我的角度看,一个人的死与一块冰的消融并没有本质的区别。”
刘慈欣《地球往事》
目录
- 前言
- 局域移动
- 聚集倾向
- 交通效率
- 跨区流动
- 相互影响
1. 前言
通过与某运营商合作,我们获得了北京十万用户的三十天内的移动和上网记录数据。下文对一天内的数据做若干简单分析。可以做的事情有很多,有待更多人加入研究团队,一起把这个线发展成长期研究的方向。
2. 局域移动
每个点是一个基站,信息流量越大的基站颜色越红数据中一共有一万多基站。显然,基站更多地会被安放在人口密度较大的地区。因此从基站的分布也能看出北京人口的聚集情况。
根据用户移动对基站进行聚类3. 聚集倾向
基站流距离的分布及其与流量的关系 基站流距离从上图中也能看出用户从四面八方聚集到城中心。
4. 交通效率
北京最大的四个交通障碍区:军博,奥体中心,亦庄,北理工 基站流距离与实际地理距离的关系我们发现,基站之间流距离与地理距离正相关(Pearson r = 0.02, p-value < 0.01)。如果交通网络是一个球面上均匀分布的二维网格,那么流距离与地理距离之间应该是系数为1的线性关系。因此实际交通系统是一个比均匀分布的交通系统更高效的系统。然而即使对于这样一个高效系统,如上文分析,仍然有许多改善的余地。
5. 跨区流动
移动速度 移动速度及在信息传递中的位置我们发现,用户的移动速度是对数正态分布。大多数人移动比较慢,少数人移动较快。人与人之间的移动速度差别是几何级的。从地图上可以看出,区域之间的移动比较快,区域内的移动比较慢。
6. 相互影响
移动速度及在信息传递中的位置通过用户的上网行为,我们可以构建用户网络。如果用户i和用户j先后上了同一个网站,我们计算i上传的信息流量和j下载的信息流量,将两者加总作为链边权重,视为用户之间的互动强度。在这个网络上,对用户计算流长度,可以看出用户在信息交流中是主动还是被动的,是影响别人还是被别人影响。
我们发现,用户的移动速度与在信息传递链中的位置负相关(Pearson r = -0.01, p-value = 0.02)。这可能是由于移动速度较快的用户社会经济地位较高,在社会交往中也更加主动。