情感计算中,很重要的
一个问题就是为目标情感数据进行分类,先行的很多文本分类技术与文本聚类技术SVM,K-means等,背后都是利用一些先决的条件,比如SVM的先决条件是建立文本向量空间VSM上。而这些文本分类技术都很少涉及到语义语法分析,或者建立十分微弱的语义语法分析基础上,比如上篇文章《评论潜在方面观点计算》。
本文为学习论文《Sentiment Analysis: A Combined Approach》,提取其中主要的方法-基于规则分类。 着重为基于规则分类RBC与基于统计分类SBC
情感计算中,很重要的
一个问题就是为目标情感数据进行分类,先行的很多文本分类技术与文本聚类技术SVM,K-means等,背后都是利用一些先决的条件,比如SVM的先决条件是建立文本向量空间VSM上。而这些文本分类技术都很少涉及到语义语法分析,或者建立十分微弱的语义语法分析基础上,比如上篇文章《评论潜在方面观点计算》。
本文为学习论文《Sentiment Analysis: A Combined Approach》,提取其中主要的方法-基于规则分类。 着重为基于规则分类RBC与基于统计分类SBC
在项目要进行最终界面展示开
发时,又得回到熟悉而久违的的SWT/JFACE,继而追寻Eclipse的优秀的WYSIWYG插件WindowBuilder(没用WB之前都是手工敲代码,并界面排版),却惊喜的发现,不用再漫天搜查注册码,如今WindowBuilder的Java/Ajax工具开发商Instantiations已经于2010年8月被Google给收购了,WindowBuilder也作为免费工具开放,强大的Google!
并传闻Google这一收购用意不仅在GWT设计工具,更在于Ajax和Java方面,Google所有网页应用都部署了大量的Ajax,而Android应用则使用Java来创建。
最近看英文论文,总结一部分平时可能误用到的英文缩写,如i.e.与e.g.及etc.做一点总结,并做个小分析。
原文:Latent Aspect Rating Analysis on Review Text Data: A Rating Regression Approach
个人三天时间完整翻译而成,本文对于理解话题识别,用户潜在观点挖掘,情感计算方面都有很好的借鉴意义。
目前在用户观点情感挖掘方面属于一个十分前沿的话题,广泛应用在产品研究,用户行为分析,推荐系统上。比现行的许多基于文本分类论文都是更为细致的研究,本文中大量运用统计概率学方面知识对话题识别,情感词的渐进识别,权重推断,以及结果估计验证,与应用探讨,值得深入学习。
同时个人认为一个最重要的不足的是,论文中还是主要通过挖掘文本中词语间的关联,类似tf/idf词频统计,先验概率推断等进行文本挖掘分析,而对于语义的理解,句法的解读分析仍然没有考虑在内,这样必然导致结果仍然存在很多偏差与误判,而鉴于语义理解,句法分析尚属一个十分困难的前沿研究领域。文本尤为可佳。
文本情感分析(Sentiment Analysis): 又称意见挖掘,
简单而言,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程.最初的情感分析源自前人对带有情感色彩的词语的分析。(右图参考论文[2])
应用背景与意义: 互联网(如博客和论坛以及社会服务网络如大众点评)上产生了大量的用户参与的、对于诸如人物、事件、产品等有价值的评论信息.这些评论信息表达了人们的各种情感色彩和情感倾向性,如喜、怒、哀、乐和批评、赞扬等. 基于此,潜在的用户就可以通过浏览这些主观色彩的评论来了解大众舆论对于某一事件或产品的看法。
本文主要介绍情感分析所要涉及的两个基础概念方面,情感分类主客观识别,情感信息提取,主客体的识别,与情感信息的计算。