潍坊市论坛

注册

 

发新话题 回复该主题

海量数据算法与面试题全集令狐冲新课免 [复制链接]

1#
中国白癜风医院排名 http://baidianfeng.39.net/a_bdfzlff/130904/4250130.html
想成为通行面试者中的佼佼者,海量数据处理的面试题必须%秒杀,切忌方法错误,下面则告诉你如何在短短几天内系统掌握其精髓

你是如何掉进面试陷阱里的

我们来举一个最常见的例子:求数组A和数组B的交集

这个问题看起来是一个算法问题,我们通过Hash或者排序+二分法等方法可以十分容易的解决。你以为面试就到此为止了,而面试官马上跟进的问题让你措手不及:求两个超大文件中URLs的交集,内存不足以放下所有URLs(面试官角度分析解答请见文末的免费微课视频)

此外海量数据处理还有什么考点

算法方面:

外排序算法(ExternalSorting)

MapReduce

非精确算法

概率算法

哈希算法与哈希函数(HashFunction)

数据结构方面:

哈希表(HashTable)

堆(Heap)

布隆过滤器(BloomFilter)

位图(Bitmap)

而众所周知,最最高频的一类,则是TopKFrequentElements题了

这类问题怎样才能迅速掌握

九章算法《海量数据算法与面试题全集》,配套LintCode面试真题

《海量数据算法与面试题全集》

?课程简介

?详尽的介绍所有海量数据处理算法,包括在线算法,离线算法和概率算法。让你秒杀%的海量数据处理面试题

令狐冲

FLAG工程师/前算法竞赛中国国家集训队员

精通海量数据处理算法,刷题总数目超过道,详细独特的教学方式让无数学员受益匪浅;亦曾就职于超过2家硅谷顶尖IT企业,北美和国内顶尖IT企业offer数10+,面试人数超过人。前算法竞赛国家集训队员。

章节介绍

前言和大纲

第一章最高频K项问题

整数数组前K大

最高频K项的离线算法

Followup1:还有办法提速么?

Followup2:内存不够怎么办?

最高频K项的在线算法

Followup:内存不够怎么办?

相关面试题

离地球最近的K颗星星

最近7天的热门歌曲

访问Baidu次数最多的IP

在1B个数中找出最小的1M个数

第二章布隆过滤器(BloomFilter)

标准布隆过滤器StandardBloomFilter

计数布隆过滤器CountingBloomFilter

第三章外排序算法

外排序算法的基本步骤

相关面试题

合并K个排好序的大文件

求两个超大文件中URLs的交集

第四章概率类的大数据问题

相应面试题

等概率挑出文件中的一行

等概率的挑选Google搜索记录日志中的一百万条中文搜索记录

LintCode上对应的练习题汇总

如何免费试听课程

长按

分享 转发
TOP
发新话题 回复该主题