网络舆情导向分析文献综述

 2022-11-21 05:11

文献综述(或调研报告):

近年来,由于互联网的飞速发展,人们日常生活中各种信息的传播方式也发生了翻天覆地的变化,互联网对人们的影响日益增大。根据最新数据显示,目前我国的网民的总数量已经超过5.91亿,互联网的总覆盖率为44.1%,这将是网络舆情的发展和传播的主要信息来源,随着这种趋势的逐渐扩大,许多信息传播的方式也得到了迅速的发展,信息在传播过程中的互动性也逐渐增强。这种信息传送方式的变化也使得网络舆情的发展超越了原有的时间和空间两个方面的约束,也使得网络舆情传播得更加迅猛快捷。同时,由于互联网上面发表评论具有隐蔽性和主观性等特征,使网民可以没有后顾之忧地发表自己对某事或某人的看法。基于以上原因,近十几年来年我国网络舆论的力量得到了长足的发展。尤其是最近几年,纵观国内外,有很多国际上事件都是从网络上的激烈争辩继而在社会上形成舆论力量并最终引起轩然大波的,这些舆情的影响力可能对所牵涉的人或需要承担相关社会管理责任的机关单位都会带来强烈的影响。

由此可见,了解网络舆情的发展情况并能对其发展趋势进行一定的判断和预测成为当今管理者的一个重要素质,然而随着网民数量的迅速增加其成员结构也显得非常庞杂,几乎各年龄段各阶层都有加入其中的迹象,这种特点也给网络舆情的分析赋予多样性的色彩。然而,由于网络中的言论既可能是陈述的客观事实又可能存在一些居心叵测的人编造谣言来蒙骗大众,严重时会导致社会上的骚动甚至会威胁到社会治安与国家的和谐。因此,网络舆情分析与预测的作用就变得更加不容忽视,对网络舆情进行及时分析和准确预测对于维护社会治安以及促进国家和谐安定都有非常重大的意义。

据此,直观上就可以判断从以文本为载体的网络舆情中提取重要观点并对其进行情感倾向性分析将成为一种非常重要的技术,而这个技术的具体实现方法称为中文文本倾向性分析,分析的目的即为从中文文本中提取有价值的信息,将这种技术和其它现有的互联网技术结合起来就可以产生很大的社会和经济效益。

虽然国内对于网络舆情检测已经有了多年的研究,但是网络舆情监测依然面临着严峻挑战,这表现在:

(1)在舆情发生的第一时间客观准确地发出舆情预警。网络舆情是随着时间增加会愈变愈烈,如果短时间内网络舆情并没有得到政府部门的官方正面回应,舆情便会进一步扩散,甚至充斥着各种谣言,造成人们对于政府的不信任感。舆情监测应保持客观中立的态度不能被消极情绪蒙蔽,不去扩大偏激声音、加深意见分歧,同时也要及时发现潜在的舆情并发出预警,对于舆情的处置就要求使舆情信息带来的负面影响最小化。

(2)大量网络页面待监测与分析。目前,网络舆论活跃的地方主要有新闻以及新闻评论、各大论坛、微博与博客等等,光是国内知名的门户网站就有几十家,而光是新浪微博一家的注册用户数已超过3亿,平均每天发布超过1亿条微博内容,如何去分析海量的页面,并从页面中监测到舆情信息,这是网络舆情监测面临的难点之一。

(3)网络词语复杂多变。传统舆情分析主要侧重于文字本身与情感倾向,而现在互联网交流技术日新月异,人们不光可以在文字上进行交流,还通过文字中夹杂的图片、视频、链接等进行进一步沟通,这就要求舆情分析不仅仅是针对于文字,还要更深层次地分析图片等等。即使只分析文字本身,多种多样的网络用词也是舆情监测的难点之一,由于内容审核系统在门户网站的普及与使用,网民无法正常打出一些敏感词语,网民为了表达自己的看法,于是就自然而然地出现了大量自造词、谐音词、干扰字符等,对于这些不规则的网络用语的监测,常规的手段(包括分词、词性标注、依存句法分析等)将受到很大影响。

在网络舆情分析方法的研究方面: 文本倾向性分类就是对用户对某个事物的看法或评论文本的挖掘,从而得到该看法或评论是属于对该事物的积极或消极意见。目前,国内外对于文本倾向性的研究大体上分为两大类:基于语义规则的文本倾向性研究方法和基于统计的文本倾向性研究方法。

其中,基于统计的文本倾向性研究方法其本质上就是基于统计传统文本分类技术(与传统文本分类相比,文本倾向性分类只有“正面”和“负面”两类)。其核心思想就是先人工标注一些文档的倾向性,并将这些已标注文档作为训练集,再通过机器学习的方法构造一个褒贬两类分类器。最后使用构造好的褒贬两类分类器对待分析文档进行分类,即可识别出该文档的倾向性。Pang 等使用标准的机器学习技术对文本分类工作进行了研究。比较了朴素贝叶斯(Native Bayes)、最大熵(Maximum Entropy)及支持向量机(Support Vector Machines)方法文本分类上的效果,发现三者的效果差别并不太大,但 SVM 的效果稍微比前两种方法好一些,其准确率最高达到 80%,为几种方法中分类效果最好的。之后,Pang 提出了将分类结果按照语义倾向性强度进行细分的方法,并通过一系列的实验证明了其方法的可行性。基于统计的文本倾向性分析方法在国内也得到较为广泛的研究,如徐琳宏等选取带有褒贬倾向的词、否定词、连词和程度副词作为特征,用支持向量机和词频加权统计两种方法对影评文档进行情感倾向性分类,F 值达到85.58%。谭俊武首先构建一部领域极性词典,并使用 LIBSVM 作为分类算法构建完整的褒贬分类器,对 COAE2008(Chinese Opinion Analysis Evaluation)语料集进行测试,F 值最高达到 89.6%。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。