分类 2010年11月

十一探乂

2010年11月30日 22:10:35 由 vanjor 发表 [107 次阅读] 回复 »

不经意的抬手看看时间,恰好手表那分针挡住了日期,多么希望看到时间为我所停驻,却已不由感觉只下徒劳,这是十一月的最后一天啊。

月首寄语已悄然变换为月末的那尚未及回味完的丝丝的留恋,为一件事前前后后忙碌了一月,已孵化成型,颇有些欣慰,莞尔也暂多了一份担忧。从没想过曾经看似久远的时代,如今那么贴近,平滑的过渡,转身。

就如同时光的消逝,动荡中求得安逸,却从来没有忘记过忧患的存在,就如同总是感觉到它静悄悄的沉寂在你身边的一个角度,待得你足够遗忘它时,悄然现身之时,即是被其吞噬时。

november for peace thumb 十一探乂

trans 十一探乂

» 阅读更多: 十一探乂

支持向量机SVM

2010年11月11日 22:10:51 由 vanjor 发表 [635 次阅读] 回复 »

031609 1027 SVM1 thumb1 支持向量机SVM支持向量机 – Support Vector Machine, 简称SVM(或SV机),是一种监督是学习的方法,广泛应用于统计分类及回归分析中。

其中,(machine,机器)实际上是一个算法。在机器学习(ML)领域里,常把一些算法看做是一个机器。

 

线性回归

2010年11月10日 16:04:21 由 vanjor 发表 [232 次阅读] 回复 »

线性回归-Linear regression

在统计学中,线性回归是利用称为线性回归方程的最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合[1]

400px Linear regression thumb 线性回归

带一个自变量的的线性回归:一元线性回归

» 阅读更多: 线性回归

向量空间模型VSM

2010年11月09日 13:01:09 由 vanjor 发表 [877 次阅读] 回复 »

向量空间模型 (VSM:Vector Space Model) 是一个应用于资讯过滤, 资讯撷取, 索引以及评估相关性的代数模型。由Salton等人于60年代提出,并成功地应用于著名的SMART文本检索系统。

向量空间模型(VSM)概念

文件(语料)被视为索引词(关键字)形成的多次元向量空间, 索引词的集合通常为文件中至少出现过一次的词组。在文本检索中,文档与查询词可以表示为以下向量空间模型[1] :

dj = (w1,j,w2,j,…,wt,j)

q = (w1,q,w2,q,…,wt,q)

» 阅读更多: 向量空间模型VSM

TF-IDF统计

2010年11月09日 13:01:21 由 vanjor 发表 [1,245 次阅读] 回复 »

TF-IDF(Term Frequency – Inverse Document Frequency)

TF-IDF是一种用于资讯检索文本挖掘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度,也是建立在向量空间模型理论中的一种统计技术。

» 阅读更多: TF-IDF统计

信息检索基本评价指标-P·R·F

2010年11月08日 21:09:34 由 vanjor 发表 [710 次阅读] 回复 »

任何研究都需要有一个客观的评价体系,信息检索系统也不例外。但是对于一项需要在实际生产生活中应用的系统,其评价导向又必须包含一定的主观性。

信息检索系统性能的两个基本客观指标是召回率(Recall Rate)准确率(Precision Rate),这与绝大多数的模式识别技术相同。

» 阅读更多: 信息检索基本评价指标-P·R·F

Java开源自然语言处理-LingPipe

2010年11月08日 18:06:24 由 vanjor 发表 [1,452 次阅读] 回复 »

LingPipeAlias-i公司开发的一款自然语言处理开源Java软件包,目前最高版本是4.0.1

LingPipe的优势是:

  • 比较全面的覆盖自然语言处理的各个分支,文本分词,聚类,语义情感分析,领域知识学习等等
  • 具有全套在research上免费的源码,样列代码,测试代码(商业与非商业均同一套代码),并且文档详细,对于其中模型所参考的论文都引用出来,适合研究学习.
  • 作为相对开源资源缺少的领域,项目一直持续更新中.

» 阅读更多: Java开源自然语言处理-LingPipe

设计模式-模板方法

2010年11月08日 16:04:13 由 vanjor 发表 [116 次阅读] 回复 »

Java Design Pattern – Template Method ( 模板方法 )

1. 模式概述

  • 归类:操作性模式
  • 目标:在一个方法中实现一个算法,把算法中的某些步骤定义进行抽象,推迟到子类中去重新定义,或具体实现。
  • 实现方法:准备一个抽象类,定义一个操作中的算法的骨架,将一些步聚声明为抽象方法迫使子类去实现。不同的子类可以以不同的方式实现这些抽象方法。 » 阅读更多: 设计模式-模板方法

pixel 设计模式 模板方法