We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
ep106 40分钟速通大数据开发 | 简易Big Data Infra吹逼指南
47:54
Share
2024/7/26
朝十晚久
AI Chapters
Transcribe
Chapters
数据平台是什么?
元数据管理的重要性是什么?
数据任务是如何调度的?
什么是ETL?
离线数据Hive/Spark是如何翻译SQL的?
Presto(Trino)为什么能更快查数据?
存储:文件(HDFS)和KV键值对(BigTable)
数据湖(Data Lake): Hudi和Iceberg
如何完美处理日志数据:ElasticSearch和ClickHouse
实时数据Flink和Spark Streaming
短视频平台是如何实时调整推荐视频的?
实时数据从何而来/存于何处?Push/Sub和Kafka
实时和离线如何结合:Lambda和Kappa框架
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.