# 概述

这篇 paper 主要考察了社交网络中 loyalty 这种属性,包括用户的 loyalty 和高 loyalty 用户数的 communities 他们之间的共同属性。

# 定义 loyalty

使用的数据集为 Reddit。

loyal users:说白了就是热衷于某一社区的用户,并且这个热衷度是要高于其他社区的。原文中说如果用户 X 在 t 月对 A 社区有超过 50% 的评论即说明 A prefer A。如果用户 X 同时在 t 和 t+1 月 prefer A,即 X loyal to A。

vagrant users

We define a vagrant of A as a user who comments between 1 and 3 times in A at t, and, while still active on Reddit at time t + 1, does not contribute to A in t + 1.

说白了就是三个月还在社区,但下个月就不在了。

Loyal communities:即高 loyalty rate 的社区,原文原则 top-25% 的社区作为 Loyal communities,底部 25% 的设为为 non-Loyalty communities。

# 数据集构建

这是我最关注的部分:

# 基于 chain 的构图

image-20211229111451330

Reddit 的特色,回复会形成一个 chain,这个构图方式会使用直接回复者和间接回复者作为 link。

# replied base

这个就是直接基于回复进行构图:

数据集:

image-20211229111703044

image-20211229111758539

# Communities-level Loyalty

这个虽然也很重要,但不是我感兴趣的。

就是 loyalty 社区具有的共同属性。

# User-level Loyalty

文章提出了一个重要的概念:loyal user 通常在进入社区后就会成了 loyal user,也就是这具有内在性。

Post popularity:loyal user 会选择更低点赞或评论数的 post。

# Linguistic style of comments

作者用了 LIWC and computerized text analysis methods. 提到的一些语言学特性。

image-20211229113238930

# Predicting loyalty from first contributions

作者还使用了最初开始了 3 个评论来预测,使用上了语言学特性和 post score 作为预测,效果很好。

image-20211229113404227

# 总结

这篇论文给我最大的启发,我觉得可以去整一篇 ——viewer to contributiors to prefer to loyal 这么一个演变过程。

github 用户在成为 contributor 之前经历了什么?star、fork、issue?

issue 的语言学相关性质是否会对用户成为 contributor 有影响?

在成为 contributor 之前 repo 是否有 co-contributor?

loyal 的流失是否会有长期较大影响?

loyal 与长期贡献是否有相关性?