关于社交账号在线状态的一些研究
对于一些显示在线状态的社交媒体,如Telegram,我们能很轻松的统计出一个账号的上线时段和时长。
但对于一些不显示在线状态的社交媒体,如X,也可以通过例如发帖时间等信息推断出一个账号的活跃时间。
本篇就是以此为基础的一些研究。
活跃时间信息价值
在线状态信息的价值主要来自于:
- 在了解被研究者所处时区时,了解账号背后操作者的作息时间
- 在不了解其所处时区时,了解账号的活跃时间,可以帮助推断其所处时区
- 在活跃时间展现出一些明显特征时,可以推断操作者的现实身份
研究方法
1. 收集数据
人力收集不仅费时费力,而且容易受到各种干扰。因此,需要采用自动化的方法。
- 对于Telegram这类有开放api的,可以利用Telegram API获取账号活跃时间信息。
- 对于X这类没有开放api的,可以利用一些社交媒体的搜索功能,如搜索关键词“发帖时间”,“最后回复时间”等,获取账号活跃时间信息。
2. 数据处理
主要是利用Python进行数据处理,使用一些库来制作图表,如matplotlib,seaborn等。
3. 明显特征分析
通过分析活跃时间的一些明显特征,如季节性,节假日,节日等,可以推断出操作者当地的节假日安排。对于知晓明确国家的操作者,可以通过放假时间、活跃时间等分析其身份。
最典型的就是学生的上线规律。在中国,普遍学校不允许使用手机的情况下,只在晚上和节假日有活跃痕迹,并且节假日放假时间与国家安排完全一致则可以判断其是一名中学或小学生。
成果展示

以上是对一位telegram账号的上线时段统计图。大致记载了账号在不同时段的总上线时间。
可以看到这位用户的上线时段呈现出明显的周期性,约上午9点开始活跃,午夜终止活跃。
综合这位用户在社交平台上主要使用汉语的特征,这位用户是一位成年人,可能专职在telegram上从事一些工作。结合夜晚活跃世间更长的统计结论,这位用户还可能是一位大学生。
结论
通过上述研究,我们可以发现,社交媒体账号的活跃时间信息对推断其所处时区、了解其操作者作息时间、推断其现实身份等方面都有着重要的价值。
也提醒我们,在互联网中,隐私和个人信息的保护尤其重要,总会有人在盯着你。
别看今天闹得欢,小心将来拉清单。 ---习近平