分类 ‘技术相关’

Hadoop入门部署最佳实践

2011年8月14日 18:06:58 由 vanjor 发表 [1,668 次阅读] 回复 »

最近因为要使用Apache下的开源项目mahout做一image thumb Hadoop入门部署最佳实践些文本数据挖掘研究,要研究Hadoop分布式平台。

本文主要介绍hadoop基本入门概念,各实体含义及其作用。

并参考使用Hadoop 的版本r0.20.203.0,介绍简单集群部署入门,以及结合IDE开发入门实践。

排序算法大合集与思考

2011年5月24日 17:05:56 由 vanjor 发表 [518 次阅读] 回复 »

排序算法是数据结构课本中的经典问题,也是计算机科学的入门经典问题之一,同时排序中蕴含的思想也潜藏在其他很多其他算法问题中。这几天对排序算法进行细致的分析,研究、实现、与比较思考,做了一个较全面的综述。

算法:求字符串指定最小全集子串

2011年5月23日 15:03:53 由 vanjor 发表 [383 次阅读] 回复 »

问题

给定一字符串str,以及一个char数组序列dic,要求找到str中包含有dic中所有不同的char的一个最小长度的子串(如果有多个,找出最左边的一个)

例如:str="ffaaeaaecfeaec", dic={‘a’,'c’,'f’},则最小子串为aecf,这里满足包含dic所有序列的子串有:"ffaaeaaec","faaeaaec","aaeaaecf","aecf","cfea"等,但是即是长度最短又是最左边的一个子串只有一个为“aecf”。

» 阅读更多: 算法:求字符串指定最小全集子串

推荐系统之协同过滤概述

2011年5月10日 15:03:19 由 vanjor 发表 [3,543 次阅读] 回复 »

协同过滤(Collaborative Filtering)是现今推荐系统中应thumb 推荐系统之协同过滤概述用最为成熟的一个推荐算法系类,它利用兴趣相投、拥有共同经验之群体的喜好来推荐使用者感兴趣的资讯,个人透过合作的机制给予资讯相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选资讯(参考wiki,文字有点生硬,不过却很好的描述了协同过滤的一个互动性:用户参与用户获益)。

边整理边写了整整一天o(╯□╰)o

算法:图论中Dijkstra最短路径搜寻算法

2011年5月09日 16:04:58 由 vanjor 发表 [897 次阅读] 回复 »

依然记得去年在微软面试的时候,要求写出一个图论中最短路径算法,自己却倍感“欣慰”的写出Prim算法..然后还很疑惑的被告知不正确。算法中必须界定每一步无二性的规则,来不得半点模糊,否则看起来及时很容易理解,实现起来却困重重难。

» 阅读更多: 算法:图论中Dijkstra最短路径搜寻算法

算法:已排序数组中找出现最多的数字

2011年4月24日 23:11:54 由 vanjor 发表 [343 次阅读] 回复 »

最近心情始终不太好,每天看情况都亲自解决一个算法问题吧,权当练手。

题目如下:

给定一个数组,内容是已经排序好的整数,并且确定有一个数的出现次数大于数组长度的一半,试着最快找出那个数。

如{ 1, 1, 4, 6, 6, 6, 6, 6, 6, 7 } 对应所找的数为6

算法:科克曼女生问题的一种解法

2011年4月22日 18:06:40 由 vanjor 发表 [157 次阅读] 回复 »

今天evaine让看一道历史上的数学问题"科克曼女生问题"的算法解法时,尝试了下,3个小时,还是小为欣喜的解决出来,问题参照百度百科:

1850年,科克曼(Kirkman)在《女士与先生之日记》杂志上发表了题为的文章,提出了15个女学生问题:

某寄宿学校的15个学生,每天都要3人一行的外出散步一次,怎样安排才能使得每个女生7天内核其他14个女生散步各一次。

Java多线程Synchronized心得

2011年4月18日 22:10:41 由 vanjor 发表 [453 次阅读] 回复 »

两年前,在编写一个多线程采集器的时候,写了一篇心得《Java多线程Synchronized的注意细节》,但是随后的使用中,发现仍然没有完全分清场景与背后原理。现在随着实际应用,终于也有所新的成熟的理解了。

设计模式-命令模式

2011年3月21日 20:08:53 由 vanjor 发表 [108 次阅读] 回复 »

Java Design Pattern – Command Method ( 命令模式 )

1. 模式概述

  • 归类:操作性模式
  • 目标:将一个请求封装为一个对象,从而使你不同的请求对客户进行参数化
  • 实现方法:把请求封装在对象中,把请求调用变为对象的调用。可以想管理对象一样调用,在时机和环境适合时进行调用。
  • 特点:命令模式可以良好将请求进行封装,参数化,达到良好的底层封装,复用性,并且方便模块间的解耦,可对请求进行序列化,便于日志处理,以及撤销重做等。

情感计算概述与方法

2011年3月21日 12:12:19 由 vanjor 发表 [564 次阅读] 回复 »

科学研究表明,情感是智能的一部分,而不是与智能相分离的,因此人工智能领域的下一个突破可能在于赋予计算机情感能力。情感能力对于计算机与人的自然交往至关重要。传统的人机交互,主要通过键盘、鼠标、屏幕等方式进行,只追求便利和准确,无法理解和适应人的情绪或心境。而如果缺乏这种情感理解和表达能力,就很难指望计算机具有类似人一样的智能,也很难期望人机交互做到真正的和谐与自然。 由于人类之间的沟通与交流是自然而富有感情的,因此,在人机交互的过程中,人们也很自然地期望计算机具有情感能力。

pixel 情感计算概述与方法