人脸识别算法综述-(LPP,PCA,K-L,SVM)

Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入（又叫做预映射， pre-image），通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，而不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。

HASH主要用于信息安全领域中加密算法，它把一些不同长度的信息转化成杂乱的128位的编码,这些编码值叫做HASH值. 也可以说，hash就是找到一种数据内容和数据存放地址之间的映射关系。继续阅读全文 →

Top K算法详细解析—百度面试

发表于 2010年9月23日作者 pkuoliver

问题描述：

这是在网上找到的一道百度的面试题：

搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来，每个查询串的长度为1-255字节。假设目前有一千万个记录，这些查询串的重复度比较高，虽然总数是1千万，但如果除去重复后，不超过3百万个。一个查询串的重复度越高，说明查询它的用户越多，也就是越热门。请你统计最热门的10个查询串，要求使用的内存不能超过1G。

问题解析：

【分析】：要统计最热门查询，首先就是要统计每个Query出现的次数，然后根据统计结果，找出Top 10。所以我们可以基于这个思路分两步来设计该算法。下面分别给出这两步的算法：继续阅读全文 →

聊聊STL中的算法

发表于 2010年9月17日作者 pkuoliver

STL算法学习，小结如下：

前提:

下载stl源码： http://www.sgi.com/tech/stl/download.html

打开网页： http://www.sgi.com/tech/stl/stl_index.html

一函数对象：因为很多的算法中多使用了函数对象

二元函数对象，V1和V2为输入，V3为结果继续阅读全文 →

《编程之美: 求二叉树中节点的最大距离》的另一个解法

发表于 2010年9月13日作者 pkuoliver

昨天花了一个晚上为《编程之美》，在豆瓣写了一篇书评《迟来的书评和感想──给喜爱编程的朋友》。书评就不转载到这里了，取而代之，在这里介绍书里其中一条问题的另一个解法。这个解法比较简短易读及降低了空间复杂度，或者可以说觉得比较「美」吧。

问题定义

如果我们把二叉树看成一个图，父子节点之间的连线看成是双向的，我们姑且定义”距离”为两节点之间边的个数。写一个程序求一棵二叉树中相距最远的两个节点之间的距离。

书上的解法

继续阅读全文 →

帝都码农

关注移动互联网与业界动态

标签：算法

人脸识别算法综述-(LPP,PCA,K-L,SVM)

一、引言

m进制转换为n进制-任意进制转换算法

海量数据处理专题（六）——双层桶划分

海量数据处理专题（三）——Hash