在线社交网络中用户情感分析算法的设计与实现文献综述

 2022-11-20 03:11

文献综述(或调研报告):

用户情感分析是对用户产生的文本、用户行为记录进行综合分析,得出用户对事件、产品的情感倾向的一种技术。随着互联网的飞速发展,产生了大量用户对事件、产品、人物等的评论信息,这些评论信息表达了人们的各种情感色彩和情感倾向性,如喜、怒、哀、乐和批评、赞扬等。

用户产生的文本信息包含了各种情感色彩和情感倾向性,因此很多用户情感分析研究都是基于用户文本。文献[1]通过情感词集WordNet及其同义词扩展对句子进行情感词的识别并统计得到整个句子的情感极性,在三个数据集上测试表明提取情感词的方法能有效检测情感语句。文献[2]将微博消息文本中的情感词作为特征选择方法,对微博消息文本中存在的否定词、程度副词、感叹句、反问句、以及微博表情符号等进行相应分析处理,最后对整条微博消息作加权计算获得其情感倾向性,最高准确率为74.2%,平均准确率为70.5%。但是中文中存在很多一词多义和多重否定等现象,仅依靠权重计算会产生很大误差。Pang等人[3]用机器学习的方法对电影评论进行情感极性分类,分为正向情感和负向情感,采用一系列不同的特征,比较了朴素贝叶斯、最大熵、SVM三种分类方法,发现SVM在这些机器学习方法中效果最好,分类精确度达到80%。Wang等人[4]引入了N-gram,N-gram Position ,POS等特征进行情感分类并对比了这些特征在MNB和LIBLINEAR分类器中表现效果,发现unigram、bigram、情感词和POS组合特征效果最好,最高准确率为65.57%对于特征选择,除了N-gram和词类特征之外,Wilson 等人[5]提出混合单词特征,否定词特征,情感修饰特征,情感转移特征等各类句法特征的情感分析,Abbasi等人[6]提出混合句子的句法(N元语法,词类,标点)和结构特征(单词的长度,词类中单词的个数,文本的结构特征等)的情感分析。很多基于中文评论的情感分析研究都是提取词汇的特点和句法特征,而忽略了词与词之间语义关系,Zhang等人[7]为了得到语义特征,提出了一种基于word2vec和的情感分类方法。

目前很多用户情感分析研究都是仅针对用户文本进行情感倾向分析,很少有研究将用户关系考虑进去。社交网络中的用户都是有关联的,由同质性[8]可知,想法的相似性和用户之间的关联倾向于同时出现。“birds of a feather flock together”[9]表明已连接用户(成为朋友)可能倾向于持有类似意见。社交网络中的每个文本并不是孤立存在的——每个文本通过同一作者和其他一些文本相关联,每个作者也会受到他所关注的人产生的文本的影响,相互关联的用户可能会有类似的观点或者情感。Tan等人[10]证明了社交网络结构可以帮助情感分析,用户关系可以对情感分析起到补充作用。文献[11]提出了一种新的基于网络的框架,它可通过探索相似和相反的意见推断用户之间隐含的相似性和差异性,从而提高用户级情感分类的效果。文献[12]提出了一个综合网络结构和语言信息的图模型以获得更好的分类效果。

因此,本课题将结合用户文本内容和用户关系分析用户情感倾向。其中,用户关系选取用户关注关系,文本情感分析选取基于情感词典的机器学习方法。

  1. Kim S M, Hovy E. Automatic detection of opinion bearing words and sentences[C]//Companion Volume to the Proceedings of the International Joint Conference on Natural Language Processing (IJCNLP). 2005: 61-66.
  2. 陈晓东. 基于情感词典的中文微博情感倾向分析研究[D]. 武汉: 华中科技大学, 2012.
  3. Pang B, Lee L, Vaithyanathan S. Thumbs up?: sentiment classification using machine learning techniques[C]//Proceedings of the ACL-02 conference on Empirical methods in natural language processing-Volume 10. Association for Computational Linguistics, 2002: 79-86.
  4. Wang W, Chen L, Thirunarayan K, et al. Harnessing twitter' big data' for automatic emotion identification[C]//Privacy, Security, Risk and Trust (PASSAT), 2012 International Conference on and 2012 International Confernece on Social Computing (SocialCom). IEEE, 2012: 587-592.
  5. Wilson T, Wiebe J, Hoffmann P. Recognizing contextual polarity: An exploration of features for phrase-level sentiment analysis[J]. Computational linguistics, 2009, 35(3): 399-433.
  6. Abbasi A, Chen H, Salem A. Sentiment analysis in multiple languages: Feature selection for opinion classification in Web forums[J]. ACM Transactions on Information Systems (TOIS), 2008, 26(3): 12.
  7. Zhang D, Xu H, Su Z, et al. Chinese comments sentiment classification based on word2vec and SVM perf[J]. Expert Systems with Applications, 2015, 42(4): 1857-1863.
  8. Lazarsfeld P F, Merton R K. Friendship as a social process: A substantive and methodological analysis[J]. Freedom and control in modern society, 1954, 18(1): 18-66.
  9. McPherson M, Smith-Lovin L, Cook J M. Birds of a feather: Homophily in social networks[J]. Annual review of sociology, 2001: 415-444.
  10. Tan C, Lee L, Tang J, et al. User-level sentiment analysis incorporating social networks[C]//Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 2011: 1397-1405.
  11. Deng H, Han J, Li H, et al. Exploring and inferring user–user pseudo‐friendship for sentiment analysis with heterogeneous networks[J]. Statistical Analysis and Data Mining: The ASA Data Science Journal, 2014, 7(4): 308-321.
  12. West R, Paskov H S, Leskovec J, et al. Exploiting Social Network Structure for Person-to-Person Sentiment Analysis[J]. arXiv preprint arXiv:1409.2450, 2014.
  13. ICTCLAS[EB/OL] http://ictclas.nlpir.org/

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。