| 注册
home doc ppt pdf
请输入搜索内容

热门搜索

年终总结个人简历事迹材料租赁合同演讲稿项目管理职场社交

基于微博的信息热度评价与预测分析

王***朝

贡献于2020-09-01

字数:20428

基微博信息热度评价预测分析


微博已成时非常热门社交媒体台庞关信息分享话题交流台线社交活动中发挥着代作网络信息鱼龙混杂文通解微博热度机制进研究微博热度预测微博热门程度文研究容监控预测微博舆情重鉴意义
文新浪微博作研究象首先进行爬取工具选取通分析信息传播特征微博户容传播三方面提炼影响微博热度素提取关键指标建立热度体系评价指标运子分析法建立微博热度评估模型微博信息维度表达式热度计算公式数进行整理分析终结果进行排序发现模型较符合实际情况表明模型具较高准确性
提出基 PSO优化 BP 神网络话题热门程度预测模型构建出话题热门程度时间序列模型作预测模型输入优化预测模型完成话题热门程度值预测实验结果表明基 PSO 优化 BP 神网络话题热门程度预测模型够模拟话题热门程度变化趋势现实具定指导意义

关键词:微博子分析热度评价模型BP神网络预测模型
Abstract
Weibo has become a very popular social media platform today is a big topic about information sharing and exchange platform in people online play an irreplaceable role in social activities the good and evil people mixed up because of the network information so this article through understanding the heat mechanism and further study of weibo microblogging heat and predict microblogging popularity this article research content for monitoring the microblogging public opinion has important significance
Based on sina weibo this article crawl tools selection at first then through analyzing the characteristic of information dissemination and spread from weibo users content and three aspects of refining the main factors affecting heat weibo and extract the key indicators to establish the heat system of evaluation index heat weibo evaluation model is established by using factor analysis method get the microblog information dimension expression and heat calculation formula of sorts through the data analysis sorting and finally the results found model more in line with the actual situation show that the model has higher accuracy
Then a psobased BP neural network optimization model is proposed to predict the degree of hot topics The time series model of topic popularity is constructed as the input of the prediction model According to the optimized prediction model the prediction of topic popularity is completed The experimental results show that the PSO optimized BP neural network model can well simulate the change trend of the hot topic degree which has certain guiding significance to the reality

Keywords:weibofactor analysisheat evaluation modelBP neural networkprediction model

目 录
摘 I
Abstract 1
第1章 绪 1
11 选题背景意义 1
111 选题背景 1
112 研究意义 1
12 国外研究现状 2
121 热度评价研究现状 2
122热门话题预测现状分析 3
13 研究容 3
14 组织结构 4
第2章 预备知识 5
21爬取工具选取 5
22 热度评价研究 5
221媒体户关注度 5
222媒体影响力 6
223 容丰富程度 6
224话题时效性 7
23 热门预测算法 7
231预测 7
232 基PSO算法BP神网络 7
24 章结 8
第3章 热度评价模型建立 9
31微博登录信息爬取 9
32建立热度评价模型 10
33通热度排序模型进行检验 15
34章结 16
第4章 预测模型建立 17
41 热门微博判断指标 17
42 结合PSO算法BP 神网络热门预测模型 18
421 算法原理 18
422 模型实验环境数获取 19
423 预测模型参数设置 19
424 预测结果分析 20
43 章结 22
结 23
参考文献 24

第1章 绪
11 选题背景意义
111 选题背景
微博简称微型博客2009 年新浪客户端开始发行基关注机制通广播式信息扩散众发表实时信息2018年12月31日微博官方公布2018年第四季度财务审计报告报告说明激烈行业竞争中微博户数然持续飞涨户活跃度进步提升2018年微博客户端线活跃户约增加7000万左右12月总户已达462亿均日活跃户突破2亿显易见微博已成时非常热门社交媒体台庞关信息分享话题交流台户通注册登录完善更新信息台中户参热门话题讨解时发生事件时分享做想中推送次数浏览次数高互动次数微博会推送热门微博微博更注重信息时效性言性传播广泛性户第时间解参时事讨中微博舆情预警政务社会信息传播方面影响力日益增
微博台中户发布容户发送容发表评转发外年视频信息传播愈发火热图处理技术变更加成熟传播信息鱼龙混杂程度考量解微博热度机制微博热度进行评估预测监控预测微博舆情推动传播真实效信息营造活跃健康社交台具重作
112 研究意义
微博信息热度评估中曝光度高阅读数量者互动数较高容信息较容易成热门微博台中包括热搜排行榜热门话题等位户进行推送会根热度热门微博容进行排序文分析影响热门微博传播素拟建立热度评价模型热门微博预测模型通计算热门微博热度热门程度变化趋势话题热度监控预测更加效缩台负面信息虚假信息传播范围众浏览更真实时政信息
文结合微博信息容户行运子分析法建立微博热度评估模型
微博热度进行量化处理利 BP 神网络学建立热门微博预测模型判断微博容否成热点微博判断热门程度变化趋势文研究促进真实时政信息传播研究台商品营销推送推动政府舆情监测预警等方面提供鉴理实践
12 国外研究现状
121 热度评价研究现状
关网络信息热度评估研究Xi Maoetal利图形化法模拟新闻源寻找确定热门话题新闻容间相应联系考虑新闻时效性利衰退函数进行次迭代新闻类型设置速率参数终出容热度计算公式[1]少学者基微博传播体角度展开热度研究包括微博运营策略户间联系等方面进行探讨[2]关微博容热度研究TeutleGolder分微博关注机制户间扩散式联系做分析发现微博热度户间互动程度容推送象关[34]郑斐然等研究种万千微博题信息中提炼新闻题容方法原理通提取容中新闻关关键字结合词组出现频率容进行聚类分析挖掘指定话题[56]张鲁民等提出突发事件实现舆情监控种方法通建立情感符号模型通初始聚类扩散群集算法事件进行检测监控[7]Phuvipadawat 等基微博容性质创造推特中突发事件监测容合信息踪等算法[8]Weng等提出 Twitter Rank算法原理基博粉丝数量发博率目标户进行影响力分析基础挖取推特台热门容关干户[9]Pal 等定数基础综合考虑微博转发数点赞数评数提数等衡量容热度[10]
衡量微博热度研究重心应该放微博容户行两方面中户仅指发布者指该户面粉丝群体台会根部排序机制微博进行排序包括首页热搜指定话题搜索排名等缺点知道排序时热度计算原理热度差距产生原基文运子分析法建立微博热度评估模型出热度计算公式热度进行量化出新排序结果原排序进行
122热门话题预测现状分析
类热门话题预测学术界般采取两种预测方法第种指较典型线性预测方法仅仅适合稳曲线进行预测适合预测种类型热门话题第二种指基非线性理建立预测模型该种分析方法更具系统性智性支持量机数进行广义线性分类致实现非线性拟合足处会常陷入局部优法全局优解[1112]Suh等选取话题类型粉丝数等属性基成分分析法提炼影响户互动行素建立精确度较高子图模型户行进行合理预测[1314]刘功申等通定量计算户微博影响已算法进行优化微博发出者户属性预测该微博否会量转发进出舆情预警[15]张敬基话题热度提出微博热度预测算法结合维度数建立回预测模型实现话题热度预测[17]FDSahnehCScoglio根传染模型层网络传播原理建立预测模型预测话题未走详细阐述信息扩散时传播规律信息相互作BP神网络面较错综复杂问题收敛速度慢处理时间长容易收敛局部优值达全局优[18]
述问题许研究者提出相关改进方法颜文俊等基遗传算法优化 BP 神网络预测模型利光伏输出等原理提高算法收敛速度进提高预测效率精度未改进结果局部优缺陷[19]
丁硕巫庆辉通种典优化算法渐函数分析改进算法数规模分析效果发现种算法适范围适范围逼效果接良周爱武等通利优样集相关原理改进原始算法缩短算法运行时间迭代次数降低算法身然局限性[20]
13 研究容
研究基微博客户端运爬虫软件python中Selenium 爬取工具采集5话题热门微博相关数容户传播三角度运子分析法建立微博热度评估模型验证模型准确性利 BP 神网络研究基PSO算法热门微博预测算法通实例验证热点话题预测结果性
14 组织结构
文包括四章面介绍章容:
第章 绪 章简微博热度评价热门程度预测选题背景研究意义进行简阐述话题热度评价预测国外研究现状课题研究容流程进行概括
第二章 预备知识 部分阐述研究开始前需解预备知识包括爬取工具选取热度评价热门预测等方面理知识奠定全文理基础
第三章 热度评价模型建立章基爬取热门微博数运子分析法提取重素建立热度体系评级指标容户传播三角度运子分析法建立微博热度评估模型基该模型容热度进行排序实行热度评估模型验证
第四章 章建立结合PSO算法基BP神网络热门微博预测模型首先分析热门话题表现形式运算法原理进行预测微博信息作模型输入完成微博热门程度趋势预测终进行实际检验
第2章 预备知识
进行实际操作前首先涉基础理知识进行简单介绍
21爬取工具选取
微博相较网站涉功较齐全微博页面容进行爬取非易事外反爬虫技术更先进半爬虫工具法快速获取目标信息总说数格式较统综基微博网站运行机制助python中技术手段快捷爬取微博中指定容相关数
网络爬虫原理基爬虫语句目标网站信息进行获取年反爬虫技术发展迅速获取网站信息变没容易爬取数时会遇种样拦截常见403 Forbidden错误表示服务器已识出爬虫拒绝处理户请求Selenium Python API技术种非常直观方式访问浏览器技术包括定位元素动操作键盘鼠标提交页面表单抓取需信息Selenium爬虫原理先识需爬取容HTML源码通提供方法定位需信息结点位置获取文容文利python中pip工具安装selenium应浏览器驱动便进行续数爬取
22 热度评价研究
分析微博热门话题热度前需解影响热度干素:
221媒体户关注度
里媒体包括新闻媒体娱乐媒体等首发信息源媒体诸央视新闻新浪媒体等某话题报道信息数量影响媒体关注度关键素发布该话题信息数目越反映媒体话题关注度越高会引起更媒体重视传播范围变广众阅读量会明显增话题成热门话题率增加网络时代前基通报纸期刊杂志电视收音机等方式解热门时事获取时政信息网络时代传统媒体避免淘汰进入新媒体时代转型建立互联网台新媒体时代热门信息报道非全首发程度参考转发余媒体时事报道某话题报道频率越高媒体转发频率越高越说明媒体关注程度越成热门
户关注度衡量话题热度关键素户关注度中户指类时事报道阅读者条微博信息包括户阅读量转发数评数等数反映户该信息者该话题关注程度间接反映话题户中影响范围程度
某位户浏览某条信息觉趣者想会转载微信Facebook等社交台该信息会网络台传播外传播时事信息仅通线传播通生活中际关系进行扩散例户A网站W1中阅读篇报道认非常新奇趣分享讲述朋友BB会该条信息讲述朋友述指话题二次传播通种非线性网络式传播某话题众知晓知晓数越点击量会越越话题会较率评热门话题户评转发侧面反映出众某话题兴趣程度利社交台预测进行次传播率进衡量话题热度
222媒体影响力
媒体影响力决定微博热度第二素般说媒体指独立普遍信息传播者种类型线方式粉丝户推送时信息推广商品信息事件相关微博容会媒体台进行转发评媒体传播范围影响力相般说微博信息传播呈树状传递加v户微博发出通粉丝阅读互动断扩影响力粉丝数量越传播范围会越广阅读量互动数会越高会较容易成热点话题
般说媒体指通现代电子手段数特定传递规范性非规范性信息私公普遍独立传播者事件相关微博容会媒体户间复制传播体媒体传播力影响程度
223 容丰富程度
微博台户发布信息没限制户发布容较意日常生活记录倾诉悲喜遭遇时事思考评根互联网机调查报告显示4252加V户会发布新锐观点时事评等3747会微博分享日常1369加V户会常发布专业领域知识仅仅转发加评户较少769越表达思想微博户越会引起评转发关注
224话题时效性
话题热度衡量类媒体报道数量户关注程度某话题评热门话题该话题必定许关该话题容信息般情况热门话题里面讨事件者时发生事件户者表达立场者发表见解新发布新信息热度前发布信息热度高着描述事件慢慢时事件讨热度会逐渐降
热点话题收集量已发表信息热点话题收集篇新闻报道热点般说热门话题户描述前事件报告事件
23 热门预测算法
231预测
新浪微博年已成广泛社交媒体台话题形成断传播终成热门话题台条微博信息包括七部分户ID发送时间容(包括图片视频)评数转发数点赞数阅读量微博粉丝发布者互动行(包括观性评转发点赞)反映户该话题兴趣程度互动行预测微博传播趋势重意义衡量某条微博热门程度新浪微博提高户阅读效率户快速获取热门信息定标准热门微博规律进行排序该标准综合考虑微博容信息包括热搜榜热门话题等根否排行榜热搜话题微博分非热门微博热门微博
显易见判断某条微博否热门分析微博信息特征信息增益原理微博信息特征衡量热门程度预测微博否成热门者判断热门微博变化趋势
232 基PSO算法BP神网络
世纪八十年代 McCellandRumelhart提出BP神网络概念该算法拥非线性映射力等优势输入层输入信号隐含层处理输出节点产出输出信号输出信号未达预期期会通转入误差调整权值误差分摊隐含单元时进行参数修正重新计算结果直期输出结果BP神网络求解复杂非线性函数全局优值算法身采局部搜索优化策略缺点算法容易陷入局部优粒子群优化算法(简称PSO)具良局部开采力
通改变粒子学模式提高迭代速度快速更新粒子位置确立全局优粒子操作简单收敛速度快获取结果效果精度俱佳BP神网络嵌入PSO算法中提升局部搜索力实现BP神算法优势互补终完成BP神网络预测模型构建
24 章结
文首先全文涉基础理知识进行简单介绍爬取工具选取文选择运Selenium Python API技术爬取热门微博分析影响话题热门程度素预测方法实现方法做基阐述























第3章 热度评价模型建立
31微博登录信息爬取
通pathon中Selenium 动化工具 Firefox 浏览器通定位审查元素通头模式找户名密码HTML源码调selenium定位钮节点进行登录
核心代码:>>> # coding utf 8
from selenium import webdriver
……
# elem_sub driverfind_element_by_xpath(input[@class'W_btn_a btn_34px'])
elem_subclick()
print u'登录成功'
登录微博访问微博搜索页面通面核心代码搜索指定热门微博容研究搜索包括新闻体育娱乐情感学五种热门话题话题爬取2条热门微博相关信息
核心代码:>>>def Searchweibo (topic):
driver get( https weibo com)
……
elem_ topic send_ keys( Keys RETURN)
……
print u’ 爬取结束\n’
找热门微博进行信息爬取数爬取前首先确定获取信息包括户名容发布时间转发量评数点赞数分析微博热门情况户画等根查阅相关文献需正表达式字符串操作获取需字段容核心代码:
>>>infodriver find_ elements_by_xpath(’div[@ class WB_cardwrap S_bg2 clearfix’])
……
content  value Text

图31 爬取结果
爬取结果图31直接获新闻类热门话题第条发布容发布时间转发量评数点赞数等数信息
32建立热度评价模型
文基抓取五种类型热门微博数户容传播三角度提炼建立热度评价模型7参考指标根原始数进行相关性分析建立基子分析法热度评价模型出热度值计算公式计算结果进行整理分析类热门微博结果热度值进行排序分析模型准确性
表31 微博热度评价模型参考指标
微博热度评价体系
热度影响素
考量素
指标含义
容热度影响力

图片充实度
微博图片数量
字数充实度
微博文字数量100相
发布时长
发出记录数间时间间隔
发布者热度影响力
粉丝数量
记录数时粉丝数量
互动数
30天发布容产生互动行数统计指标
发博率
发博数量活跃天数值
传播热度影响力
转发数
某条微博转发数量
评数
某条微博评数量
点赞数
某条微博点赞数量
表31文首先围绕容热度影响力发布者热度影响力传播热度影响力三维度结合爬取微博原始数信息提出包括阅读量转发数点赞数评数博粉丝数发博次数发布时长文字图片数量等参考素
考虑转发数评数点赞数三原始数数值较利数处理分析文拟通互动数重度传播率反映微博传播热度互动数综合考察点赞数转发数评数博文曝光数等信息直接反映发博带网友互动传播情况外重度传播率结合转发评数阅读量数值含义转发评数
阅读量效考量传播热度
确立七子指标针容热度选取参考指标文字充实度图片充实度传播时长针发布者热度选取参考指标粉丝数发博率针传播热度选取参考指标重度传播率互动数
面进行数预处理根获相应微博子数初步建立微博热度评价体系2019年4月21日新浪微博台python分爬取关新闻体育学情感娱乐五热门话题前五条微博参考指标进行处理加工初步形成较完善微博热度体系评级体系32七子指标记录处理结果:
表32 五种话题类型热门微博指标数
话题类型
热门微博
粉丝数(万)
传播时长(h)
文字充实度
图片充实度
发博率
重度传播率
互动数(万)
新闻
1
8396
25
112
4
525
007
5373
新闻
2
6433
21
078
9
448
008
4106
新闻
3
4554
23
096
3
385
007
2629
新闻
4
5212
19
072
1
348
006
1280
新闻
5
3615
19
081
2
326
005
1005
体育
1
2064
96
104
9
642
004
1194
体育
2
2025
84
098
9
542
003
846
体育
3
1036
72
123
3
443
004
674
体育
4
546
78
072
2
322
002
619
体育
5
315
52
089
1
217
002
539

1
1690
205
038
9
241
001
1322

2
176
138
049
9
268
002
1154
续表32 五种话题类型热门微博指标数
话题类型
热门微博
粉丝数(万)
传播时长(h)
文字充实度
图片充实度
发博率
重度传播率
互动数(万)

3
146
148
051
9
205
001
923

4
142
89
014
9
146
000
1048


5
46
67
024
9
129
000
724
情感
1
2916
182
063
3
253
004
2693
情感
2
1145
197
028
1
256
002
2472
情感
3
666
138
124
3
183
003
1884
情感
4
226
124
108
2
176
001
2027
情感
5
124
154
044
1
217
001
1462
娱乐
1
2668
82
08
1
424
007
4639
娱乐
2
732
73
035
4
386
005
3721
娱乐
3
574
75
048
2
325
003
3642
娱乐
4
396
52
064
9
341
003
2473
娱乐
5
217
43
096
9
285
002
1755
表32计算25条热门微博七子指标具体数五种话题类型五条热门微博出现次序进行计算基七指标详细数开始进行子分析
进行子分析前首先确定变量间相关性需先进行KMO Bartlett检验中KMO检验统计量通较变量间简单相关系数偏相关系数反映变量间相关性取值越接1越说明变量相关性较强KMO>09时说明表示非常适合进行子分析07<KMO<09说明较适合进行子分析KMO<06说明相关性较弱子分析法失效
Bartlett球状检验原理判断相关阵中变量独立性变量相互独立法变量中提取公子法利子分析法建立模型数值越伴概率<001时说明数集适合子分析法建立模型
首先SPSS软件中选择分析工具栏中降维选项进行KMO Bartlett检验检验结果表33

表33 KMO 巴特利特检验
KMO 取样适切性量数
0824
巴特利特球形度检验
似卡方
532972

21
显著性
0003
SPSS检验结果KMO值0824Bartlett检验统计量观测值532974显示p值<005说明变量间具相关性说明子分析适合建立模型表34方差解释结果图32碎石图:
表34 方差解释结果
成分
初始特征值
提取载荷方
总计
方差百分
累积
总计
方差百分
累积
1
3654
52203
52203
3654
52203
52203
2
1616
23079
75282
1616
23079
75282
3
791
11304
86586
791
11304
86586
4
480
6852
93438



5
312
4455
97893



6
094
1345
99238



7
053
762
100000



提取方法:成分分析法


图32 碎石图
文累计方差百分少80特征值少1标准提取3公子表343公子累计解释信息86586子分解释信息522032307911304根碎石图前面三子特征值均1提取三子微博信息维度F1F2F3分代表微博容信息微博博信息微博传播信息
已三维度权重根维度数通公式计算热度:
(31)
公式(31)I表示提取子数量 代表第 i 子相关数代表第i 子占权重
计算热度指数需根成分分矩阵分析公子成分构成表35成分分系数矩阵结果
表35 成分分系数矩阵
成分
1
2
3
粉丝数(万)
257
046
100
互动数(万)
164
392
166
发博率
087
443
738
文字充实度
195
280
110
图片充实度
232
223
038
传播时长(h)
138
343
807
重度传播率
250
146
134
提取方法:成分分析法
表35中通较行相关系数直观出公子指标相关性较高表中展示7指标成分系数分分代表三微博信息维度文中代表第微博信息维度指代博信息包括粉丝数量互动数量发博率代表第二微博信息维度指代微博容信息包括文字图片充实度 代表第三微博信息维度指代微博传播信息包括传播时长重度传播率等微博信息维度计算公式:
第微博信息维度:
(32)
第二微博信息维度:
(33)
第三微博信息维度:
(34)
根三公子方差贡献率公子指标体系维度表达式根公式(31)微博热度计算公式(35):
(35)
33通热度排序模型进行检验
式(35)条热门微博综合热度结果外文根热度五种类型热门话题5条微博进行重新排名表36
表36 热门微博热度计算结果重新排名
话题类型
热度初始排名
新排名
F1
F2
F3
F
新闻
1
1
432132
2972
028
125678
新闻
2
3
365407
3053
026
113056

新闻
3
2
326154
3147
052
114812
新闻
4
4
240771
3224
034
108136
新闻
5
5
286482
3435
017
93025
体育
1
1
218138
2585
069
70689
体育
2
2
177456
2674
101
65715
体育
3
3
186138
1596
133
60474
体育
4
5
144744
2441
105
52171
体育
5
4
132867
2852
124
53894

1
1
129125
3863
057
27385

2
2
114762
3712
061
24636

3
3
123344
3845
042
24147

4
4
122551
3556
058
19626

5
5
90589
2378
065
18384
情感
1
1
207189
2215
043
73693
情感
2
2
167145
2159
059
64677
情感
3
4
121532
2175
066
47123
情感
4
3
97171
1753
024
49675
情感
5
5
81528
2197
038
35188
娱乐
1
1
377006
2864
072
107556
娱乐
2
2
296665
2331
056
86419
娱乐
3
3
277032
3317
065
77522
娱乐
4
4
146647
3728
047
62457
娱乐
5
5
177059
2539
053
56395
表36出文基新浪微博热门序截取五类热门话题热度计算出五类话题热门微博真实热度排序发现截取微博热度排序致相信息维度新闻类娱乐类微博第信息维度F值较博影响力较导致计算出热度值较高实际情况相符新闻类学类娱乐类第二信息维度F值较说明类热门微博容表示较充实总体热度值较结果新闻类>娱乐类>体育类>情感类>学类实际情况基相符出建立模型较准确反映微博真实热度问题
34章结
章基爬取热门微博数通分析信息传播特征提炼影响微博热度素提取重素建立热度体系评级指标运子分析法提取重素建立热度体系评级指标容户传播三角度运子分析法建立微博热度评估模型微博信息维度表达式热度计算公式数进行整理分析终结果进行排序发现模型较符合实际情况表明模型具较高准确性

第4章 预测模型建立
41 热门微博判断指标
形成热门话题需户类事件进行量转发评容观点需集中根微博容博特征微博传播特征预测转发数评数点赞数进判否成热门微博
微博容博特征复杂性微博传播影响非线性确定性 BP 神网络算法拥非线性映射力等优势输入层输入信号隐含层处理输出节点产出输出信号应范围十分广泛拓扑结构包括输入层隐层输出层文拟采典型三层 BP 网络结构图41

图41 进行预测拓扑结构
微博点赞行反映户话题关注程度容认程度转发行说明条微博传播范围评行反映户话题参度户行说明条微博热门程度文选取热门微博均讨数量均转发量均评数均点赞数衡量微博热门程度指标通公式进行计算:
(41)
中分转发量评数点赞数选取项指标综合构建出反映容热度度量公式公式:
+++++ + (42)
根式(42)容热门度量值该度量值根时间先存储时间序列中代表第i 时间间隔热门度量值序列 中前观测值关系诶非线性映射公式(43):
(43)
42 结合PSO算法BP 神网络热门预测模型
BP 神网络算法目求解全局优值BP神网络算法局部进行优化策略调整缺点算法容易陷入局部优PSO算法具良局部开采力通改变粒子学模式提高迭代速度快速更新粒子位置确立全局优粒子效果精度俱佳果BP神网络嵌入PSO算法中提升局部搜索力优化原算法初始权值阈值基训练集BP 神网络实行训练实现BP神算法优势互补完成预测模型构建文结合PSO算法建立BP 神网络热门预测模型
421 算法原理
结合PSO算法建立BP 神网络热门预测模型步骤:
步骤 1:章提微博热度评价指标根公式(45)计算微博热门度量值该度量值根时间先存储时间序列中构建模型数训练集输入层中作输入值作神网络输出值
步骤 2:粒子位置速度进行初始化时设置函数变量数粒子种群规模迭代次数粒子搜索空间位置信息
步骤 3:定义适应度函数计算全部粒子适应度值
步骤 4:判断Vi Xi否超出设定范围
步骤 5:时更新粒子速度位置达设定迭代次数差值满足界限时输出输出次全局优解果未达条件重复进行步骤4
步骤 6:粒子找优解中寻找全局优解输出作参考BP 神网络输入层输入权值初始阈值
步骤 7:基述数训练集建立BP 神网络预测模型计算预测误差通断迭代修正权值直进行输出
步骤 8:热度序预测阶段预测值Sl+1
通断调整位置参数次迭代找全局优解获取BP 神网络输入层输入权值初始阈值结合PSO算法构建BP神网络预测模型实现话题热度预测
422 模型实验环境数获取
章第三章研究基础基matlab仿真工具建立预测模型根章中通爬虫技术获取五种类型热点话题微博信息时间原种类型前两条微博公式(42)时间序列构建结合PSO算法BP神网络预测模型进行预测分析然热门微博变化趋势变化程度进行分析
423 预测模型参数设置
算法通断调整位置参数次迭代找全局优解确定终参数获取输入层输入权值初始阈值文中选取适应度函数时采matlab中Ackley函数该函数时首先进行参数设置粒子种群规模确定20加速常数设定粒子运动速度限制5迭代次数100粒子位置限定图42粒子迭代次数增加适应度值变化:


图42 粒子适应度值
图出着迭代次数增加粒子适应度值首先迅速降第十五代时适应度值趋稳定说明迭代次数越高粒子适应度值越性会越
文BP神网络结构设置粒子学速率设置默认优值精度化原理选择合理训练数集规模BP神网络中隐含层节点数会预测结果产生较影响般说隐含节点数越误差首先会降低达优值误差会节点数增长变实际研究目出发选取预测结果产生误差隐含节点数
文拟通结合文献验具体实验操作决定隐含层节点数目误差化
首先进行仿真实验时先隐含层节点数初始值设定成1观测区间设定节点数累次增1观察均误差值变化情况取隐含层节点书进行组独立试验提高实验准确性降低偶然素影响实验结果表明隐含层节点数均相误差波动图43







图43 隐含层节点数 MSE 值变化图
根图43隐含层节点数取5时预测结果均相误差
424 预测结果分析
文根均相误差(简称MSE)判断预测模型准确性通公式求:
(44)
式(44)中代表热度指数预测值热度指数实际值时间关系章第三章中五类话题前两热门微博BP神网络模型模拟话题热度变化预测时间阶段热度指数
话题推送热门热门程度会保持变会时间增降低时间热门程度指数变化率会存差异相隔时间短变化率会较相隔时间长变化率会越量化两者间联系文引入话题热门程度增长率衡量微博热门程度变化趋势计算公式:
(45)
式(45)中值含义预测点前时间间隔热门趋势增长率算数均值
第时间间隔预测值第时间间隔定程度反映热门微博趋势变化趋势变化程度值正负反映话题热门趋势值0时说明该微博热门指数会升值0时说明该微博热门指数会降通分析数值衡量微博热门程度变化时公式(45)够衡量时间间隔前热门程度值影响程度相隔时间影响程度越相隔时间短影响程度越
根章热门话题相关信息结合 PSO算法建立BP 神网络热门微博预测模型基该模型文五种话题时间阶段热度变化趋势进行预测计算预测值根公式(45)条微博热门程度增长率分析微博热门指数变化趋势变化程度结合实际情况进行分析出相应结表 41 基预测模型记录热门微博趋势预测数信息
表41 热门微博趋势预测情况
热门微博
热门程度
变化趋势
变化强度


1

03389
51793
4963
2

03389
162482
159982
3

03560
178374
16853
4

04573
7765
767
5

01484
136689
136624
6

01631
98437
96871
7

00017
93235
93317
8

02285
145718
145262
9

03179
49257
48568
10

02541
139535
138355
表41微博热门指数变化趋势变化程度预测值实际值直观预测值实际值间误差较根热门程度增长率较准确反映出微博热门程度变化趋势变化强度根表41中预测结果分析新闻类话题二条微博热门趋势相反新闻类第二条微博升程度较第条微博降程度更预测新闻类第二条微博时间阶段会成新闻类第条热搜微博时间验证发现实际相符反映文建立预测模型
较准确预测热门程度变化趋势
43 章结
章利PSO 算法较优全局搜索特点提出结合PSO算法BP神网络微博热门预测模型通熟练掌握PSO算法BP神网络算法步骤基matlab仿真工具完成实验参数设置隐含层节点数选取构建时间序列模型确定模型输入值终微博热门指数变化趋势变化程度热门程度指数预测值时间验证发现预测结果实际相符合反映文建立预测模型较准确预测热门程度变化趋势


文研究容新浪微博背景展开微博成日常生活中必少社交工具已成信息传播台微博热搜中曝光度高阅读数量者互动数较高容信息较容易成热门微博台中包括热搜排行榜热门话题等位户进行推送会根热度热门微博容进行排序文分析影响热门微博传播素拟建立热度评价模型热门微博预测模型通计算热门微博热度热门程度变化趋势话题热度监控预测文成果:
(1)运爬虫工具爬取五类话题热门微博结合户影响力容影响力传播影响力基子分析法建立微博热度评价模型选择子指标时外增加重度传播率互动数两指标建立较完善符合前微博热度体系评级指标2019年4月21日新浪微博台python分爬取关新闻体育学情感娱乐五热门话题前五条微博参考指标进行处理加工获相应微博子数通SPSS子分析微博信息维度表达式热度计算公式数进行整理分析终结果进行排序表明热度评估模型模型具较高信度
(2)弥补BO神网路算法容易陷入局部优缺陷提出结合PSO算法BP神网络微博热门预测模型分析热门微博判断指标确定通熟练掌握PSO算法BP神网络算法步骤基matlab仿真工具完成实验参数设置隐含层节点数选取构建时间序列模型确定模型输入值终微博热门指数变化趋势变化程度热门程度指数预测值时间验证发现预测结果实际相符合反映文建立预测模型较准确预测热门程度变化趋势次研究现实情况预判具定指导意义
参考文献
[1] Albert R Jeong H Barabasi AL Error and attack tolerance of complex networks[J] Nature 2000 406(6794) 378
[2] Lerman K Ghosh R Information Contagion an Empirical Study of the Spread of Newson Digg and Twitter Social Networks[J] Computer Science 201552 166176
[3] Yang Zi Guo Jingyi Cai Keke Understanding retweeting behaviors in social networks[C] Proceedings of the 19th International Conference on Information and Knowledge Management Toronto Canada 2010 16331636
[4] Zamparas V Kanavos A Makris C Real Time Analytics for Measuring User Influence on Twitter[C] IEEE International Conference on TOOLS with Artificial Intelligence IEEE 2016 591597
[5] Mei Y Zhong Y Yang J Finding and Analyzing Principal Features for Measuring User Influence on Twitter[C] IEEE First International Conference on Big Data Computing Service and Applications IEEE Computer Society 2015 478486
[6] Zhu YX Zhang XG Sun GQ etal Influence of Reciprocal Links in Social Networks[J] Plos One 2013 9(7) 103107
[7] Teutle ARMTwitter Network properties analysis International Conference on Electronics Communications and Computer 2017 415
[8] Golder S A Yardi S Structural Predictors of Tie Formation in Twitter Transitivity and Mutuality IEEE International Conference on Social Computing 201067
[9] 付文豪社交网络信息传播实证分析应[D] 南京:南京邮电学硕士文 2017 1027
[10] 郑斐然 苗夺谦 张志飞 等 种中文微博新闻话题检测方法[J] 计算机科学 201239(1) 138141
[11] 张鲁民 贾焰 周斌 等 种基情感符号线突发事件检测方法[J] 计算机学报 2013 36(8) 16591667
[12] 跃 蔡博驰 基子分析法微博热门程度评价模型[J] 统计决策 2016(18) 5254
[13] 宋蕾 张培晶 基LDA题建模微博舆情分析系统研究[J] 网络安全技术应 2014(4) 5
6
[14] Puvipadawat SMurata TBreaking news detectection and tracking in Twitter[C] Proc of the 9th IEEEWICACMIntConf on Web Intelligence and Intelligent Agent Technology (WIIAT'10) New York ACM 2010 120123
[15] 王长宁 陈维勤 许浩 微博舆情热门程度监测预警指标体系研究[J] 计算机现代化 2013(1) 126129
[16] 赵晓航 基情感分析题分析微博时代突发事件政府信息公开研究——新浪微博天津爆炸话题例[J] 图书情报工作 2016 60(20) 104111
[17] 刘功申 孟魁 谢婧 种微博预警算法[J] 计算机科学 2014 41(12) 3337.
[18] Zhang Zhenhai Li Shining Li Zhigang et alMultilabel featurese lection algorithm based on information entropy [J] Journal of Computer Research and Development 2013 50(6) 11771184.
[19] Yan Hong Guan Yanping Method to determine quantity of internal nodes of back propagation neural networks and its demonstration[J] Contro Engineering 2009 16(S1) 99103.
[20] 连芷萱 兰月新 夏雪 刘茉 张双狮 基首发信息微博舆情热度预测模型[J] 情报科学 2018 36(09) 107114
[21]
[22] 文档香网(httpswwwxiangdangnet)户传

《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
该内容是文档的文本内容,更好的格式请下载文档

下载文档,方便阅读与编辑

文档的实际排版效果,会与网站的显示效果略有不同!!

需要 20 香币 [ 分享文档获得香币 ]

该文档为用户出售和定价!

购买文档

相关文档

基于node的微博的设计与实现

基于node的微博的设计与实现design and implementation of microblog based on node 摘要千禧年后, Twitter开始进入中国,引发了一代新流行。紧接着微博就凭借它的立即互动特性快速成为新兴的大众信息交流平台。随着微博的热潮,人们由以前的传统媒体纯获取信息的身份转换为信息的发布者和获取者,在传统媒体时期

平***苏 10个月前 上传286   0

微博营销分析工作报告

微博营销分析工作报告微博热点数据分析· 医疗健康领域上榜情况较少,且留存时间较短· 能够占领热搜的以社会类事件为主,热度降得很快· 热搜话题的平均上升时长为3.5小时,相关账号在上升时间内给出有效反应· 其中“90后秃头焦虑症”虽然热搜数据不理想,但此类话题具有持续性微信关键词数据分析· 与微博以及全网的热议话题作重合,以微信指数体现· 油腻由冯唐文章引发的全民对

y***p 10年前 上传519   0

基于微信小程序的测试设计与分析

基于微信小程序的测试设计与分析Testing Design and Analysis Based on WeChat Mini Program日成绩评定 成绩项论文成绩(百分制)折合比例实得成绩(折合分)指导教师成绩30%评阅教师成绩20%答辩成绩50%总评成绩注:毕业设计(论文)成绩按百分制评定。答辩成绩不及格的(评分低于6

平***苏 3年前 上传966   0

基于微博的企业营销创新研究

基于微博的企业营销创新研究 摘要:近年来微博异军突起,在传递商品信息的过程中发挥着越来越重要的作用,也深刻影响了企业营销模式。在促进人际交流与信息传播的同时,微博作为营销平台的价值也逐步显现。本文旨在通过深入研究微博以微博营销,总结相关理论与方法,把微博营销与其他营销方式进行对比,探讨企业微博营销的局限性,针对存在的局限性提出应对之策,发挥微博在创新企业营销模式中的优势,提高企业营销效率,进而

d***g 10年前 上传8597   0

我看微博

我看微博 “微博”,已经不记得具体什么时候听说这个名词了,注册新浪微博是在2011年10月份,当时也不知道“新浪微博”到底是个什么东西,只是看到新闻经常提到它,并预测新浪微博会有多么火,于是抱着好奇的心理注册了一个,看看到底是干什么的…… 今年7月21日周六,大雨。北京市中心的工人体育场里聚集着两万球迷,8万人滞留首都机场,数千游客在郊区爬山,成千上万的行人走在街道上,没人知道,这场大雨将导

h***e 11年前 上传9911   0

微博微语 感悟人生

微博微语 感悟人生  岁月如同藏在手中的细沙,总是会从指间偷偷的滑落。她悄无声息,却总能留下一些不易觉察的痕迹。也如花开花落,花瓣离落之时,总会有暗香残存!于是不经意间,人们在时间的流动中,各自苍老。曾经的岁月已悠然遁去;渐行渐远;那么,又何苦为难自己。  人生就是一场旅游,所有的经历,看到的风景,都汇聚成赏心悦目的一幅画,有红、有绿,有白、有黑......。然而这幅画的完成,都是自己努

j***9 10年前 上传818   0

微博微信工作汇报

***微博微信对外宣传工作 开通“***发布”官方微博、微信对外宣传公共平台以来,我县对外宣传工作也紧跟时代步伐,正式迈入“微”时代。经过半年多的运行和推广,“***发布”官方微博、微信粉丝受众群初具规模,逐渐被更多的读者特别是新闻媒体所关注,成为对外宣传推介***的新利器。具体工作总结如下: 一、“微时代”对外传播体系初步形成,开辟***对外宣传推介新渠道 作为互联网新媒体时代的宠儿,

8***2 5年前 上传1975   0

微博热门话题

效果:新浪微博热门话题小时榜单前十规则:1.导语,如果要打广告,得上榜后再修改为带广告的导语,上榜前,不能为硬广告2.推荐和置顶的博文,上榜前也不得推荐和置顶,得上榜后,再推荐置顶 3.推荐的用户(一般为客户的官博),也是上榜后进行及时推荐,增加推广效果4.平时的话题主持人,蓝V一般不合适做,尽量用普通号或达人号或黄V 5.如果有图片,最好提供二三十张和话

M***n 12年前 上传1022   0

如何经营你的微博

如何经营你的微博(2011-09-08 19:10:33)迮钧权的博客针对企业微博有企业微博的经营方法,针对个人微博有经营个人微博的方法。为什么去经营微博,首先,这个时代如果你还没有微博你就真的OUT了,那个人微博如何经营呢,进入正题。 1、微博昵称使用职业+实名,让人家一看到你的微博就值得可信,并且知道你是做什么的,然后细看认证就清楚地知道你在哪家公司从事什么工作,如果有资源上的共

y***r 11年前 上传625   0

如何写好微博

如何写好微博如何写好微博【1】、要写好一个微博,就如果要做好一件事情,都最好在一开始脑中要有一个规划。明白自己开微博的定位,为什么要开,写微博想要获取什么?在一开始想好了这些,也就是给自己的微博做了一个定位。有了定位,也就有了方向,更容易操作。【2】、先认真看看那些写得不错的各类微博,争取有一个整体印象,并总结出这些微博的共性。例如背景是不是都比较和微博主题相接近,文字和图片是否

c***l 12年前 上传644   0

微博社区管理规定

微博社区管理规定第二条新浪微博用户在本平台的活动不得违反现行法律法规。本平台将按照相关法律法规及用户注册协议,配合司法机关维护被侵权人合法权益。第三条站方负责本规定的解释及执行。第二章 基本原则本规定通过以下基本原则,保障执行过程中的公正与透明:第四条本规定适用于新浪微博所有用户。第五条完成真实身份验证的用户,可通过新浪微博提供的“举报”功能对违规行为进行举报。完成真实身份验

h***0 2年前 上传707   0

基于信息流的流程协调分析

基于信息流的流程协调分析 摘要:流程的描述和再设计是变化管理的主要内容。通常流程是用活动及其逻辑关系来定义的,流程变化相应地集中在活动关系的调整或管理活动依赖的协调机制的调整。针对协调理论存在的问题,基于组织的信息处理观点,从参与者及其协调的角度研究了流程的描述和变化,并指出两种方法的互补性。 基于信息流的流程协调分析(一) 赵卫东 关键词 协调理论;流程分析;信息流;协调

s***1 12年前 上传7390   0

论微博信息传播的发展创新

微博是网络社会环境中新出现的一种信息传播形式,它具有即时性、便捷性、交互性强等优势。微博给信息传播和新闻报道注入了新的活力。然而,微博中也存在信息失真等问题,需要完善微博信息审核制度,实行微博用户注册实名制,创新微博信息内容呈现机制,引入更多优质的信息资源等策略进一步推进微博的创新与发展。

爱***享 3年前 上传550   0

各级官方微信、微博、网站管理办法

第一章 总 则第一条 为加强校园网络阵地的管理和建设,进一步规范学校各级各部门微信、微博、网站的运行与管理,满足广大师生、校友及公众对新媒体

w***i 4年前 上传1268   0

微博策划方案

微博策划方案  一、微博定位  做羽毛球产品推广,希望我的微博在被人眼里很有活力,因为是要推广体育用品,要让别人感受到做微博的人活力四射。有人在做同样的行业,但是不多,粉丝也不多。  二、微博页面设置  微博名称叫做羽球用品贩卖机,因为名字简单明了,容易让别人记住,意思明了,推销羽球用品意思表达出来。  微博头像头像是一个正在击打羽毛球的拍面,很有立体感,对羽毛球爱好者很有吸

蜗***1 9年前 上传662   0

法院微博管理办法

市中级人民法院微博管理办法(试行) 开通法院官方微博,是网络时代进一步推进司法公开,回应社会关切的积极举措。可以拓展司法宣传渠道,打造信息发布平台,并以此普及法律、宣传法院、汇聚民智、沟通民意、树立形象。为规范**中院官方微博的发布和管理工作,特制定以下管理办法。 一、微博管理原则     第一条 微博工作实行统一组织、统一管理、统一发布的运行模式。     第二条 微博信息发布、回复等

m***r 10年前 上传9894   0

微博易-产品总监

产品总监(总裁助理)岗位职责:1、负责网站产品的整体规划、运营、设计和产品生命周期管理(从概念提出到产品上线);2、分析项目、用户需求,分析竞争对手动态和市场动态,规划产品路线图;3、能够领导并带领团队执行产品线的生命周期管理,包括产品组合策略、市场研究、产品设计和原型设计、产品技术预研和方案,跟踪产品开发进展,产品的版本管理,评审发布,产品上线后改进等相关工作;4、根据产品

i***a 12年前 上传582   0

微博写作与管理技巧

微博写作与管理技巧专业微博写作十技巧一般将微博分为,个人微博、专家微博、企业微博(官方微博)几类,我突出专业微博,是认为,与专业人士(包括兴趣爱好相同的一群人)交流,更能发挥微博的价值,可以打破时间空间的界限,实现思维的碰撞,这与垂直门户的专业论坛类似(从这一点上看,专业微博实际很有市场,因为可以给予网站其他内容粘住的客户群,进行比门户微博,更有深度的探讨。这也适用于门户微博的微群)。

h***u 9年前 上传750   0

微博快速涨粉丝

粉丝墙是目前来说涨粉丝最快的一种涨粉方法!只需要每天关注它的粉丝,自己的微博也会跟着快速涨粉!关注的粉丝一周内不能取消关注,一周后再取消!每小时只能关注一次!这个是我微博涨粉最快的软件!每天要去操作!大家一定要好好利用起来!上图说下注册细节首先打开微博搜索栏,搜索粉丝墙!这里每小时点一次一健关注,关注多少粉丝,你就会有多少粉币,有粉丝上涨的话,粉币也是减少,一个粉

m***s 11年前 上传813   0

微博写作技巧

微博写作技巧微博写作技巧首先,要想好自己微博的定位,看自己能不能回答下面这两个问题?为谁写微博?是为亲友写,为自己写,还是为某个特定人群(如旅游爱好者、投资界朋友、科技界朋友)写?写微博主要为了什么?是为了记录自己的生活,为了社交交友,为了学习知识、技术,为了分享思想、经验,为了影响别人,为了展示自己,还是为了休闲、娱乐?回答了这些问题,你就会知道自己该写什么样的微博。1:

问***句 9年前 上传700   0

微博工作演讲稿

各位领导,同志们,大家好! 我今天演讲的题目是,我,是你的听众! 大家知道,经常听广播的人,都把自己定位为听众;可是,你知道吗?在微博领域,有一个名词也叫听众。微博**开通整整一年,拥有的听众已达50万人。作为微博**工作室的一名工作人员,我为拥有这么广泛的听众自豪、兴奋。自豪、兴奋之余,我一直思考,我是谁?现在,我可以告诉大家,对50万博友来说,我,是你的听众! 关键词——平淡 “微博

k***t 10年前 上传9132   0

曹国伟:新浪微博已是中国第7大网站 微博改变一切

曹国伟:新浪微博已是中国第7大网站 微博改变一切2011-09-18 17:23 推荐: P迪 浏览: 633 views 我要评论 字号: 大 中 小新浪CEO曹国伟在今天召开的第二届“中国数字媒体峰会”上谈及微博对媒体的影响时表示,微博的聚合和传播的效应根本上会改变整个媒体产业链。微博带来双向传播新媒体时代曹国伟认为,微博平台变成了聚合所有创作的内容,各种各样数字内容的平

y***1 9年前 上传427   0

基于Multi-Agent System预测支持系统

基于Multi-Agent System预测支持系统 数据特征分析Agent设计 国家自然科学基金资助项目(79970038) 刘文财2 刘文财,博士研究生,天津大学管理学院9051,Tel:022-27409862,E-mail:lwc106@263.net。 李英 刘豹 张维 (天津大学系统工程研究所 天津 300072) 摘要 本文从数据

花***鱼 7年前 上传23586   0

基于GIS徐州大型超市选址评价分析

基于 GIS 徐州大型超市选址评价分析摘 要超市的选址是影响商场经营效益的重要因素,超市经营的成功与否与它的选址息息相关,成功的选址意味着超市经营成功的一半。对于快速发展的中国大型超市来说,选址问题的分析研究是必不可少的。近些年,对于选址问题的研究渐渐被国内外所重视,国外的有法国家乐福大型商场在上海落户的选址策略研究、美国KFC 快餐连锁店地址的决策研究等; 国内的有杨海丽的零售

平***苏 3年前 上传448   0

“清廉**•驿路清风”网站及“廉洁**”微博多媒体信息服务协议

甲乙双方本着平等互利、诚实信用的原则,经友好协商,就甲方委托乙方为**市**驿区纪委监委官方网站“清廉**•驿路清风”网站(http://lon**uan.ljcd.gov.cn/)及甲方官方微博“廉洁**”提供多媒体信息服务的相关事宜达成一致意见,并签订本协议。

仙***🐏 5年前 上传1200   0