袋鼠云大数据面试题回忆
生活随笔
收集整理的這篇文章主要介紹了
袋鼠云大数据面试题回忆
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
spark數(shù)據(jù)傾斜的描述和解決方案(spark_data_skew)
如果有兩撥流數(shù)據(jù), 帶有相同的時(shí)間戳,你怎么形成報(bào)表(我覺得就不存在這種情況)
如果離線數(shù)據(jù)帶有日期(非時(shí)間戳),你怎么檢測近30天內(nèi)連續(xù)登陸的數(shù)據(jù),要求必須采用批處理。(我直接說CEP,他說假定只允許使用批處理)
Clickhouse原理
?
袋鼠云主要使用flink sql
這些題目還是有點(diǎn)挖坑的,需要自己想限制條件處理。
?
時(shí)間是2020年11月9日晚上電話面試。
?
總結(jié)
以上是生活随笔為你收集整理的袋鼠云大数据面试题回忆的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java流行的测试框架调研+市面上书籍调
- 下一篇: 余杭街道办的报名