你是如何掉进面试陷阱里的
我们来举一个最常见的例子:求数组A和数组B的交集
这个问题看起来是一个算法问题,我们通过Hash或者排序+二分法等方法可以十分容易的解决。你以为面试就到此为止了,而面试官马上跟进的问题让你措手不及:求两个超大文件中URLs的交集,内存不足以放下所有URLs(面试官角度分析解答请见文末的免费微课视频)
此外海量数据处理还有什么考点
算法方面:
外排序算法(ExternalSorting)
MapReduce
非精确算法
概率算法
哈希算法与哈希函数(HashFunction)
数据结构方面:
哈希表(HashTable)
堆(Heap)
布隆过滤器(BloomFilter)
位图(Bitmap)
而众所周知,最最高频的一类,则是TopKFrequentElements题了
这类问题怎样才能迅速掌握
九章算法《海量数据算法与面试题全集》,配套LintCode面试真题
《海量数据算法与面试题全集》
?课程简介
?详尽的介绍所有海量数据处理算法,包括在线算法,离线算法和概率算法。让你秒杀%的海量数据处理面试题
令狐冲
FLAG工程师/前算法竞赛中国国家集训队员
精通海量数据处理算法,刷题总数目超过道,详细独特的教学方式让无数学员受益匪浅;亦曾就职于超过2家硅谷顶尖IT企业,北美和国内顶尖IT企业offer数10+,面试人数超过人。前算法竞赛国家集训队员。
章节介绍
前言和大纲
第一章最高频K项问题
整数数组前K大
最高频K项的离线算法
Followup1:还有办法提速么?
Followup2:内存不够怎么办?
最高频K项的在线算法
Followup:内存不够怎么办?
相关面试题
离地球最近的K颗星星
最近7天的热门歌曲
访问Baidu次数最多的IP
在1B个数中找出最小的1M个数
第二章布隆过滤器(BloomFilter)
标准布隆过滤器StandardBloomFilter
计数布隆过滤器CountingBloomFilter
第三章外排序算法
外排序算法的基本步骤
相关面试题
合并K个排好序的大文件
求两个超大文件中URLs的交集
第四章概率类的大数据问题
相应面试题
等概率挑出文件中的一行
等概率的挑选Google搜索记录日志中的一百万条中文搜索记录
LintCode上对应的练习题汇总
如何免费试听课程
长按