2012没有奇迹

2012年1月01日 10:10:44 由 vanjor 发表 [15 次阅读] 暂无评论 »

还记得最近看的一篇天涯头条《你所不知道的冰冷的经济真相》,中间最唏嘘不已的是,现在的国家经济状况是由十年前的决定,所以很多应急的一些政策其实都是一种短视行为,因为早早的已近埋下祸根。

cat for 2011 thumb 2012没有奇迹

读《浪潮之巅》

2011年9月11日 20:08:08 由 vanjor 发表 [79 次阅读] 暂无评论 »

其实很早之前就看过《浪潮之巅》原来在Google黑板报贴出的 蓝色巨人 那一章,这次还是在中秋长假到来前看到一同事在看这本书的电子书,联想起这个原来网络连载最近已经出书了,并且李开复也推荐过,边周末饶有兴趣的看完了前十八章节。

《浪潮之巅》是Google的研究院吴军写的,Google黑板报中著名的连载《数学之美》也是他写的,对做数据挖掘,自然语言处理入门很有帮助,他写东西的特点是能将那些深奥的东西通过浅显易懂的方式让人理解与易于接受,比教科书中那些枯涩的公式概念更能让人快速入门与了解概况。

Hadoop入门部署最佳实践

2011年8月14日 18:06:58 由 vanjor 发表 [823 次阅读] 暂无评论 »

最近因为要使用Apache下的开源项目mahout做一image thumb Hadoop入门部署最佳实践些文本数据挖掘研究,要研究Hadoop分布式平台。

本文主要介绍hadoop基本入门概念,各实体含义及其作用。

并参考使用Hadoop 的版本r0.20.203.0,介绍简单集群部署入门,以及结合IDE开发入门实践。

拽着五月的尾巴

2011年5月29日 20:08:49 由 vanjor 发表 [68 次阅读] 2 条评论 »

很快春天已经随着五月的到来而渐渐消逝,夏天已经随着慢热的空气不断的袭来,如今已经到了拽住五月的尾巴的时候了。

依然还记得四月份的几次吃饭,聊天之中才发现自己已经悄然成为一个现实的人,讨论未来几年实际而又无法逃避的问题,或许自己才是那个最为不安的人。

排序算法大合集与思考

2011年5月24日 17:05:56 由 vanjor 发表 [313 次阅读] 1 条评论 »

排序算法是数据结构课本中的经典问题,也是计算机科学的入门经典问题之一,同时排序中蕴含的思想也潜藏在其他很多其他算法问题中。这几天对排序算法进行细致的分析,研究、实现、与比较思考,做了一个较全面的综述。

算法:求字符串指定最小全集子串

2011年5月23日 15:03:53 由 vanjor 发表 [285 次阅读] 暂无评论 »

问题

给定一字符串str,以及一个char数组序列dic,要求找到str中包含有dic中所有不同的char的一个最小长度的子串(如果有多个,找出最左边的一个)

例如:str="ffaaeaaecfeaec", dic={‘a’,'c’,'f’},则最小子串为aecf,这里满足包含dic所有序列的子串有:"ffaaeaaec","faaeaaec","aaeaaecf","aecf","cfea"等,但是即是长度最短又是最左边的一个子串只有一个为“aecf”。

» 阅读更多: 算法:求字符串指定最小全集子串

推荐系统之协同过滤概述

2011年5月10日 15:03:19 由 vanjor 发表 [1,508 次阅读] 1 条评论 »

协同过滤(Collaborative Filtering)是现今推荐系统中应thumb 推荐系统之协同过滤概述用最为成熟的一个推荐算法系类,它利用兴趣相投、拥有共同经验之群体的喜好来推荐使用者感兴趣的资讯,个人透过合作的机制给予资讯相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选资讯(参考wiki,文字有点生硬,不过却很好的描述了协同过滤的一个互动性:用户参与用户获益)。

边整理边写了整整一天o(╯□╰)o

算法:图论中Dijkstra最短路径搜寻算法

2011年5月09日 16:04:58 由 vanjor 发表 [615 次阅读] 暂无评论 »

依然记得去年在微软面试的时候,要求写出一个图论中最短路径算法,自己却倍感“欣慰”的写出Prim算法..然后还很疑惑的被告知不正确。算法中必须界定每一步无二性的规则,来不得半点模糊,否则看起来及时很容易理解,实现起来却困重重难。

» 阅读更多: 算法:图论中Dijkstra最短路径搜寻算法

你心中的成功与意义是什么?

2011年4月25日 0:12:30 由 vanjor 发表 [92 次阅读] 2 条评论 »

这个话题,是有感于最近的两条线索而引发的一些思考:

算法:已排序数组中找出现最多的数字

2011年4月24日 23:11:54 由 vanjor 发表 [244 次阅读] 2 条评论 »

最近心情始终不太好,每天看情况都亲自解决一个算法问题吧,权当练手。

题目如下:

给定一个数组,内容是已经排序好的整数,并且确定有一个数的出现次数大于数组长度的一半,试着最快找出那个数。

如{ 1, 1, 4, 6, 6, 6, 6, 6, 6, 7 } 对应所找的数为6

pixel 算法:已排序数组中找出现最多的数字