百度提前批java一面
一共60min,面試官很溫和
1.自我介紹
2.項目介紹、系統(tǒng)的設(shè)計思路,系統(tǒng)設(shè)計過程中遇到比較有挑戰(zhàn)的問題
3.Spring中面向切面編程,在項目中是否使用過AOP
4.查數(shù)據(jù)庫響應(yīng)慢怎么排查(慢查詢?nèi)罩?,Explain分析執(zhí)行語句情況)
5. 為什么加索引可以加快掃描范圍
6.Java集合類在項目有沒有用過,介紹一下HashMap底層數(shù)據(jù)結(jié)構(gòu)
7.為什么arraylist檢索快增刪慢(實現(xiàn)randomAccess接口,內(nèi)存分布均勻)
8.紅黑樹和鏈表的查詢效率對比?紅黑樹o(log(n)),鏈表o(n)
9. 多線程情況下想使用hashmap怎么辦?這里想到用ConcurrentHashMap,介紹了一下它的底層實現(xiàn)。面試官又問,為什么不加一個Synchronized鎖或者lock鎖而使用ConcurrentHashMap呢?對hashmap加鎖和直接用ConcurrentHashMap有什么區(qū)別?(想到了Hashtable的底層實現(xiàn),其實也是加了Synchronized),這里解釋說ConcurrentHashMap可能在并發(fā)方面更好,也不知道是否正確
10.常見多線程的使用方式(創(chuàng)建線程的方式)
11. 場景題1:現(xiàn)在有兩張表,A表和B表,第一張表里有兩行數(shù)據(jù),分別是A和B;第二張表里也有兩行數(shù)據(jù),是B和C。現(xiàn)在對這兩張表進行join,分別是內(nèi)連接和左連接,join完后結(jié)果分別有幾行
12.場景題2:一個大文件記錄著一個服務(wù)來源的所有訪問的IP地址,大文件遠超過你所處理的機器的內(nèi)存,如何找出訪問次數(shù)排名前十的IP地址
13.算法題:在長度為N的有序數(shù)組中快速查找所有值為M的元素下標(biāo)(M可能重復(fù)出現(xiàn))。
14. 反問環(huán)節(jié)
#百度##百度提前批#
1.自我介紹
2.項目介紹、系統(tǒng)的設(shè)計思路,系統(tǒng)設(shè)計過程中遇到比較有挑戰(zhàn)的問題
3.Spring中面向切面編程,在項目中是否使用過AOP
4.查數(shù)據(jù)庫響應(yīng)慢怎么排查(慢查詢?nèi)罩?,Explain分析執(zhí)行語句情況)
5. 為什么加索引可以加快掃描范圍
6.Java集合類在項目有沒有用過,介紹一下HashMap底層數(shù)據(jù)結(jié)構(gòu)
7.為什么arraylist檢索快增刪慢(實現(xiàn)randomAccess接口,內(nèi)存分布均勻)
8.紅黑樹和鏈表的查詢效率對比?紅黑樹o(log(n)),鏈表o(n)
9. 多線程情況下想使用hashmap怎么辦?這里想到用ConcurrentHashMap,介紹了一下它的底層實現(xiàn)。面試官又問,為什么不加一個Synchronized鎖或者lock鎖而使用ConcurrentHashMap呢?對hashmap加鎖和直接用ConcurrentHashMap有什么區(qū)別?(想到了Hashtable的底層實現(xiàn),其實也是加了Synchronized),這里解釋說ConcurrentHashMap可能在并發(fā)方面更好,也不知道是否正確
10.常見多線程的使用方式(創(chuàng)建線程的方式)
11. 場景題1:現(xiàn)在有兩張表,A表和B表,第一張表里有兩行數(shù)據(jù),分別是A和B;第二張表里也有兩行數(shù)據(jù),是B和C。現(xiàn)在對這兩張表進行join,分別是內(nèi)連接和左連接,join完后結(jié)果分別有幾行
12.場景題2:一個大文件記錄著一個服務(wù)來源的所有訪問的IP地址,大文件遠超過你所處理的機器的內(nèi)存,如何找出訪問次數(shù)排名前十的IP地址
13.算法題:在長度為N的有序數(shù)組中快速查找所有值為M的元素下標(biāo)(M可能重復(fù)出現(xiàn))。
14. 反問環(huán)節(jié)
#百度##百度提前批#
全部評論

八股文題解在這里:http://www.fangfengwang8.cn/discuss/644816607285374976
百度是真喜歡大文件處理??
大佬太強了
大佬過了嗎
首先是這一天,并且是訪問百度的日志中的IP取出來,逐個寫入到一個大文件中。注意到IP是32位的,最多有個2^32個IP。同樣可以采用映射的方法,比如模1000,把整個大文件映射為1000個小文件,再找出每個小文中出現(xiàn)頻率最大的IP(可以采用hash_map進行頻率統(tǒng)計,然后再找出頻率最大的幾個)及相應(yīng)的頻率。然后再在這1000個最大的IP中,找出那個頻率最大的IP,即為所求。
或者如下闡述(雪域之鷹):
算法思想:分而治之+Hash
1.IP地址最多有2^32=4G種取值情況,所以不能完全加載到內(nèi)存中處理;
2.可以考慮采用“分而治之”的思想,按照IP地址的Hash(IP)%1024值,把海量IP日志分別存儲到1024個小文件中。這樣,每個小文件最多包含4MB個IP地址;
3.對于每一個小文件,可以構(gòu)建一個IP為key,出現(xiàn)次數(shù)為value的Hash map,同時記錄當(dāng)前出現(xiàn)次數(shù)最多的那個IP地址;
4.可以得到1024個小文件中的出現(xiàn)次數(shù)最多的IP,再依據(jù)常規(guī)的排序算法得到總體上出現(xiàn)次數(shù)最多的IP
算法題怎么寫的呀

大文件那個是什么
我也剛剛面了百度二面。想問問能投遞幾個崗位呀。
2025拼多多校招,薪資福利非常好,http://www.fangfengwang8.cn/discuss/643104207888736256
哥們是本還是碩
老哥,七月多少號投的
哪個部門啊佬
全是八股頂不住啊
有結(jié)果了嗎
佬,第12題有什么比較好的思路嗎,我看gpt答得有點亂。
相關(guān)推薦
點贊 評論 收藏
分享
點贊 評論 收藏
分享
點贊 評論 收藏
分享