最近因为要使用Apache下的开源项目mahout做一
些文本数据挖掘研究,要研究Hadoop分布式平台。
本文主要介绍hadoop基本入门概念,各实体含义及其作用。
并参考使用Hadoop 的版本r0.20.203.0,介绍简单集群部署入门,以及结合IDE开发入门实践。
最近因为要使用Apache下的开源项目mahout做一
些文本数据挖掘研究,要研究Hadoop分布式平台。
本文主要介绍hadoop基本入门概念,各实体含义及其作用。
并参考使用Hadoop 的版本r0.20.203.0,介绍简单集群部署入门,以及结合IDE开发入门实践。
排序算法是数据结构课本中的经典问题,也是计算机科学的入门经典问题之一,同时排序中蕴含的思想也潜藏在其他很多其他算法问题中。这几天对排序算法进行细致的分析,研究、实现、与比较思考,做了一个较全面的综述。
给定一字符串str,以及一个char数组序列dic,要求找到str中包含有dic中所有不同的char的一个最小长度的子串(如果有多个,找出最左边的一个)
例如:str="ffaaeaaecfeaec", dic={‘a’,'c’,'f’},则最小子串为aecf,这里满足包含dic所有序列的子串有:"ffaaeaaec","faaeaaec","aaeaaecf","aecf","cfea"等,但是即是长度最短又是最左边的一个子串只有一个为“aecf”。
依然记得去年在微软面试的时候,要求写出一个图论中最短路径算法,自己却倍感“欣慰”的写出Prim算法..然后还很疑惑的被告知不正确。算法中必须界定每一步无二性的规则,来不得半点模糊,否则看起来及时很容易理解,实现起来却困重重难。
最近心情始终不太好,每天看情况都亲自解决一个算法问题吧,权当练手。
题目如下:
给定一个数组,内容是已经排序好的整数,并且确定有一个数的出现次数大于数组长度的一半,试着最快找出那个数。
如{ 1, 1, 4, 6, 6, 6, 6, 6, 6, 7 } 对应所找的数为6
今天evaine让看一道历史上的数学问题"科克曼女生问题"的算法解法时,尝试了下,3个小时,还是小为欣喜的解决出来,问题参照百度百科:
1850年,科克曼(Kirkman)在《女士与先生之日记》杂志上发表了题为的文章,提出了15个女学生问题:
某寄宿学校的15个学生,每天都要3人一行的外出散步一次,怎样安排才能使得每个女生7天内核其他14个女生散步各一次。
两年前,在编写一个多线程采集器的时候,写了一篇心得《Java多线程Synchronized的注意细节》,但是随后的使用中,发现仍然没有完全分清场景与背后原理。现在随着实际应用,终于也有所新的成熟的理解了。
Java Design Pattern – Command Method ( 命令模式 )
1. 模式概述