免费论文查重: 大雅 万方 维普 turnitin paperpass

浅议社交基于微博社交网络信息传播分析

最后更新时间:2024-01-16 作者:用户投稿原创标记本站原创 点赞:9140 浏览:34160
论文导读:
摘要:微博作为重要的社交媒体,越来越受到人们的重视。同传统的网络媒体相比,微博的信息传播呈现出数据量大、及时、快速等特点。主要研究微博信息传播树的分析技术,提出了两种微博信息传播树的生成算法:基于转发关系的微博信息传播树的生成算法和一种快速的微博信息传播树的生成算法。通过实验,对这两种算法的性能进行了对比,并分析了传播树的节点分布情况。
关键词:信息传播; 微博; 信息传播树
2095-2163(2013)05-0070-05
0引言
随着新浪微博、人人网等社交类网站的迅速崛起,社交媒体正在成为当今网络技术发展的热点和趋势,也正日渐深刻地影响着人们生活的方方面面。社交媒体(Social Me源于:毕业论文理工www.7ctime.com
dia),也称为社会化媒体、社会性媒体,指允许人们撰写、分享、评价、讨论、相互沟通的网站和技术。具体来说,社交媒体就是人们彼此之间用来分享意见、见解、经验和观点的工具和平台。用户在这种新媒体上不再单纯是信息的被动接收者,而变身为信息的主动发布者和传播者,由此用户真正成为了互联网的主人。在社交媒体中,用户还可以建立不同类型的各种关系,这就产生了类似真实社会的虚拟在线社交网络,用户之间可以进行观点的交流互动和信息的发布扩散。
相比于传统媒体,微博作为Web2.0时代新生的社交媒体,因其新型的信息发布方式、快速的消息传播渠道、广泛的受众参与人群等特点使其迅速获得了大量的互联网拥趸。中国拥有全球最大的网络人群,互联网用户超过6亿、移动互联网用户

4.61亿。而截至2013年,新浪微博注册用户已经达到5亿。

相比较于传统的网页媒体,社交媒体中用户获取信息的方式发生了很大变化。对前者而言,用户在搜索引擎中输入关键词,从海量网页中获取自己所需信息。而在社交媒体中,搜索引擎不再是互联网用户获取信息的最主要途径,用户开始具有主动性,如果用户对某个主题的信息感兴趣,此时用户就可以同发布该主题信息的其他用户建立联系,构建自己的虚拟社交网络,这时相关信息就会通过虚拟社交网络扩散到该用户那里。由此可见,信息在社交媒体中的传播扩散对帮助用户获取需要的信息起到了至关重要的作用。另外,研究社交网络中的信息传播问题还可以发现现实生活中隐藏的不易察觉的社会现象。总而言之,研究社交媒体中信息的传播扩散不仅可以帮助用户获取所需要的信息,还可以研究社会现象,因此具有非常重要的意义。
信息传播的早期研究人员主要是一些经济学家、社会学家和传染病学专家,主要研究产品、创新和病毒在真实社会中的传播,但是由于真实社会的数据采集比较困难,研究中所使用的数据集通常都较小,无法给出准确结果。随着社交媒体的迅速发展,海量的数据可以简易获取,使得信息传播的研究得到了新的发展机遇。目前的主流研究大体可划分为两大类,基于理论扩散模型的研究和基于信息扩散树的研究。其中,基于理论扩散模型的研究包括:线性阈值模型、独立级联模型[2,3]、博弈论模型[4,5]和传染病模型[6-8];而基于信息扩散树的研究则包括:信息扩散特性研究[9]、用户影响力计算、信息扩散预测模型。
1基于新浪微博的信息传播树生成算法
微博类社交媒体并不同于传统社会网络中以信息为主体的传播方式,其信息依赖于人与人之间的好友关系进行散播,因此用户之间的结构在信息传播过程中发挥了至关重要的作用。新浪微博中的用户通过用户个体之间的关系影响信息的扩散,其提供的转发功能使得人们在获悉信息时,也能够同时对信息的来源一目了然,[JP2]使得用户可以轻松地找到微博的初始传播点。新浪微博中,每个用户都会拥有一定数量的粉丝,同时也可以关注自己感兴趣的人,即成为此人的粉丝,以此来建立好友关系。用户发布的信息会以广播的形式,发送到每个粉丝那里,粉丝收到信息时可以自行决定是否转发,如果粉丝转发此微博到自己微博,那么相应地,其粉丝也会接收到此条微博,以此类推,就形成了微博信息传播树。[JP]

1.1基于微博转发列表的信息传播树生成算法[HT5”SS]

用户登录新浪微博,可以通过点击一条微博,查看其引起的所有转发微博情况。因此可以采用解析网页的方式获得一条微博的所有转发微博列表。新浪对微博转发情况的处理是:最原始微博的转发列表可以获得全部的转发微博论文导读:表子节点数为n,1节点转发列表子节点数为n-1,2节点转发列表子节点数为n-2……以此类推,n-1节点转发列表子节点数为1,n节点转发列表子节点数为0。由等差数列求和公式可知转发列表子节点总数为n(n+1)/2,故算法复杂度为O(n2),此种情况为复杂度最高情况。综上可知。本算法的最好复杂度为O(n),最差复杂度为O(n2)。
(包括其转发微博引起的转发,都算入其根节点内)。具体如图1所示。其中,节点A为原始微博,其转发列表包括节点。节点B为二级转发节点,其转发列表包括节点。节点F为转发节点,
其转发列表包括节点。其它节点转发列表均为空。因此,基于如此状况,就要对转发树的生成进行剪枝操作。
本算法是由二叉树的先根遍历算法改进而来,并将微博转发列表获取方法与剪枝算法相结合共同进入递归遍历的过程中,最后完整还原微博转发树。其中,剪枝部分是比较根节点的创建时间与二次(及多次)转发节点的创建时间,并以此为依据更新节点间的父子关系。传播树生成算法的主要伪代码如下所示:
本算法的复杂度分析如下:
由本算法伪代码可知,for循环内操作均为O(1)简单操作,因此本算法的复杂度取决于每层节点的转发列表中子节点数。假设一棵传播树有n+1个节点,[JP3]现在分析两种极端情况:第一种情况如图3中(a)所示,除根节点0的转发列表子节点数为n外,其它节点转发列表子节点数均为0,因此算法中基本操作需要执行n次,故算法复杂度为O(n),此种情况为复杂度最低情况;第二种情况如图3中(b)所示,其中,0节点转发列表子节点数为n,1节点转发列表子节点数为n-1, 2节点转发列表子节点数为n-2……以此类推,n-1节点转发列表子节点数为1,n节点转发列表子节点数为0。由等差数列求和公式可知转发列表子节点总数为n(n+1)/2,故算法复杂度为O(n2),此种情况为复杂度最高情况。综上可知。本算法的最好复杂度为O(n),最差复杂度为O(n2)。 采用以上算法生成的信息传播树,是与新浪微博用户的转发情况完全一致的。由此可以很好地观测到在微博社交平台上的信息传播情况,并更好地掌握社会舆情。

1.2一种快速的信息传播树生成算法

现在,如果只得到转发某条微博的所有节点以及这些节点间的相互关注关系,却未得到相应的转发微博列表,该如何生成本条微博的传播树?在这种情况下,本算法尝试给出解决方案。本算法的主要依据为:在传播树中,如果存在某个节点关注的若干节点在该节点转发该微博之前转发了此微博,则该节点最有可能是从这些节点中最后转发该微博的节点(即距离该节点时间最近的那个节点)那里转发的本条微博。
算法描述:首先将转发某条微博的节点按照微博发表时间升序排列存放到表statusList中,将第一个发表本微博的节点作为根节点存放到tree_node_set中,遍历statusList列表,找到其中节点的关注列表friend_set,再将friend_set和tree_node_set取交集得到intersect_set列表。此时,如果intersect_set列表不为空,则选取其中微博发表时间最新的节点作为根节点,将此节点插入其孩子集合,否则将此节点插入到root的孩子集合,最后将该节点插入到tree_node_set列表中。伪代码如下所示:
下面举例说明本算法:假设为初始情况下某传播树的节点按发表微博时间的升序排列,其中节点B的关注列表为,C的关注列表为空,D的关注列表为,E的关注列表为,F的关注列表为,G的关注列表为。图4是本例在该算法下的传播树生成过程。
本算法是在特殊情形下的传播树生成近似算法,并不能保证100%正确率,但已通过大量实验证实本算法与真实传播树的相似度已达到了80%以上,如图5即是两种算法生成的传播树对比图。本算法与基于微博转发列表生成传播树相比,虽然准确度降低,但生成树的速度得到了大幅提升,适用于对传播树准确度要求不高,但对生成时间要求较高的情况下使用。
2微博信息传播树节点分布统计分析
根据信息在新浪微博上的传播情况转化成传播树的可视化图形,可以清楚地看到一些比较典型的情况的发生。本文列举出笔者通过大量实验观察得到的几种典型信息传播树模型,诸如:单节点爆炸型信息传播树、高影响力节点论文导读:
二次爆发型信息传播树、信息对抗性微博信息传播树以及多点争鸣型信息传播树。
如图6(a)所示为单节点爆炸型信息传播树,其第一层的转发数居多,几乎占据转发数80%以上。二次转发和居于其后的转发相对较少,层数不够深入。
如图6(b)所示为高影响力节点二次爆发型信息传播树,表现为某意见领袖发表微博后,又有几个意见领袖发表了微博,带来了二次甚至多次转发,使事件影响进一步扩大。
如图6(c)所示为信息对抗型信息传播树,这样的传播树图形往往出现在遇到分歧问题时,两大阵营的人们进行相互转载的情况。
如图6(d)所示为多点争鸣型信息传播树,具体表现为某用户发表微博后,能引起网络多个意见领袖的参与,覆盖人群广泛,并且能得到广大网民的转发认可。
通过图7可以清楚看到随着层数的增加,微博传播树的个数呈现了先上升、后下降的态势。当层数小于6时,随着层数的增加,传播树个数呈上升趋势;当层数达到6时,传播树的个数达到了顶点;此后,传播树个数随层数增加则逐步递减。由此可以看出,一定规模的传播树(1 000节点以上)的层数在6层左右的最多,这也与本文通过实验得出的传播树平均层数为

6.21层的结论相符。

微博传播树的层数与节点数之间的联系比较紧密,理论上说,随着节点数的增长,微博传播树的层数应当呈上升趋势。对此,笔者随机选取了3 000棵传播树做了实验,结果如表2所示。
3结束语
社交网络的信息扩散研究仍是一个很新的领域,各方面的研究还未足够深入。本文开展了微博媒体的信息传播树生成与分析技术的研究,提出了两种微博信息传播树的生成算法:基于转发关系的微博信息传播树的生成算法和一种快速的微博信息传播树的生成算法。并通过大量的实验,分析了微博信息传播树的节点分布情况。下一步的研究工作将考虑在大规模的微博数据上,对上述算法进行更细致的研究。 研究生论文www.7ctime.com