大数据面试题(完整)
2020大数据面试题真题总结(附答案):点击这里
技术栈
Hadoop
万亿数据下 Hadoop 的核心竞争力:点击这里
HBase
HBase应用与高可用实践:点击这里
Kafka
基于 Kafka 的实时计算引擎如何选择?Spark or Flink ?:点击这里
Kafka 应用实践与生态集成:点击这里
Druid
深入分析Druid存储结构:点击这里
Kylin、Druid、ClickHouse核心技术对比:点击这里
ClickHouse
ClickHouse的核心特性及架构:点击这里
Phoenix
从理解 Phoenix 索引源码开始,构建全文索引:点击这里
用户画像
数据中台
关于数据中台的深度思考与总结:点击这里
各大厂大数据应用实践
Druid sql和Security在美团点评的实践:点击这里
阿里
菜鸟实时数仓2.0进阶之路:点击这里
Flink1.11+Hive批流一体数仓:点击这里
优酷大数据OLAP技术选型:点击这里
增强分析技术原理与实践:点击这里
菜鸟实时数仓技术架构演进:点击这里
Apache Flink OLAP引擎性能优化及应用 :点击这里
Flink如何支持特征工程、在线学习、在线预测等AI场景:点击这里
Apache Flink 与 Apache Hive 的集成 :点击这里
阿里1688实时数据工程实践:点击这里
Cassandra 在时空数据上的探索:点击这里
Cassandra 的过去、现在、未来:点击这里
优酷 DSP 广告投放系统架构实践:点击这里
解密商业化广告投放平台技术架构:点击这里
阿里巴巴双十一千万级实时监控系统技术揭秘:点击这里
云上HBase冷热分离实践:点击这里
Apache HBase的现状和发展:点击这里
快手
Flink在快手实时多维分析场景的应用:点击这里
快手 HBase 在千亿级用户特征数据分析中的应用与实践:点击这里
快手 Druid 精确去重的设计和实现:点击这里
滴滴
滴滴 Elasticsearch 集群跨版本升级与平台重构之路:点击这里
滴滴数据指标体系建设实践:点击这里
实时数仓在滴滴的落地实践:点击这里
AB实验在滴滴数据驱动中的应用:点击这里
时序数据在滴滴实时数据开发平台中的处理和应用:点击这里
Apache Flink在滴滴的应用与实践:点击这里
bilibili
bilibili 实时计算平台架构与实践:点击这里
网易
Impala在网易大数据的优化和实践::点击这里
网易数据湖探索与实践:点击这里
网易严选数仓规范与评价体系:点击这里
网易实时数仓实践与展望:点击这里
OLAP数仓入门:基础篇:点击这里
OLAP数仓入门:进阶篇:点击这里
Apache Flink 在网易的实践:点击这里
网易在智能分析领域的应用与实践:点击这里
网易大数据体系之时序数据技术:点击这里
网易数据基础平台建设:点击这里
网易HBase实践:点击这里
基于Flink的严选实时数仓实践:点击这里
趣头条
趣头条基于Flink+ClickHouse的实时数据分析平台:点击这里
字节跳动
Flink在字节跳动的时延和稳定性实践:点击这里
ClickHouse在字节跳动推荐和广告业务中的实时应用:点击这里
ClickHouse在字节跳动广告业务中的应用:点击这里
YARN 在字节跳动的优化与实践:点击这里
字节跳动自研强一致在线KV与表格存储实践:点击这里
字节跳动混沌工程实践总结:点击这里
字节跳动 EB 级 HDFS 实践:点击这里
爱奇艺
基于Apache Flink的爱奇艺实时计算平台建设实践:点击这里
Druid在爱奇艺的实践和技术演进:点击这里
爱奇艺在日志实时数据监控的探索与实践:点击这里
爱奇艺大数据实时分析平台的建设与实践:点击这里
爱奇艺大数据分析平台的演进之路:点击这里
爱奇艺流量反作弊的“术”与“道”:点击这里
Shopee
数仓大法好!跨境电商 Shopee 的实时数仓之路:点击这里
贝壳找房
实时计算引擎在贝壳的应用与实践:点击这里
贝壳:流式数据的平台化实践与挑战:点击这里
HBase在贝壳找房的实践经验:点击这里
大数据平台从0到1之后:点击这里
微博
微博广告策略工程架构体系演进:点击这里
微博基于Flink的机器学习实践:点击这里
涛思数据
Hadoop or TDengine,如何做物联网大数据平台的选型:点击这里
架构设计:比 Hadoop 快至少10倍的物联网大数据平台:点击这里
神策数据
蚂蚁金服
奇安信
柔性多模正则匹配引擎:点击这里
OPPO
OPPO 实时数仓揭秘:点击这里
第四范式
基于Spark的大规模推荐系统特征工程:点击这里
58同城
商业DMP数据管理平台的架构与实践:点击这里
金融数仓体系建设:点击这里
58同城 Elasticsearch 应用及平台建设实践:点击这里
基于Hadoop的58同城离线计算平台设计与实践:点击这里
基于 Flink 的实时计算平台在58同城的架构实践:点击这里
Bit Map在大数据精准营销中的应用:点击这里
58商业数仓建设实践:点击这里
VIPKID
VIPKID实时计算技术实践:点击这里
阅文集团
搜狐
数据仓库系统建设中的工作流及优化:点击这里
搜狐智能媒体数据仓库体系建设实践:点击这里
熵简科技
基于对象存储的离线大数据处理架构和应用实践:点击这里
华为
HBase RowKey与索引设计:点击这里
华为数据治理实践:点击这里
有赞
平安产险
Druid原理及产险实践:点击这里
快看漫画
上海久耶
基于HBase实时数仓探索实践:点击这里
海康威视
Apache Beam 架构原理及应用实践:点击这里
Lyft
Lyft 基于 Flink 的大规模准实时数据分析平台:点击这里
腾讯
360
Cassandra 在 360 的实践与改进:点击这里
ScyllaDB
通用高效的数据修复方法:Row level repair:点击这里
Apache Doris : 一个开源 MPP 数据库的架构与实践:点击这里
画像在外卖智能调度的实践:点击这里
Hulu
Sophon :Hulu智能OLAP缓存层技术实践:点击这里
京东
Apache Doris在京东广告的应用实践:点击这里
小米
基于Doris的小米增长分析平台实践点击这里
小米流式平台架构演进与实践:点击这里
Procedure V2介绍:点击这里
唯品会
都在说实时数据架构,你了解多少?:点击这里
携程
携程实时智能检测平台实践:点击这里
携程金融大数据风控算法实践:点击这里
携程HBase实践:点击这里
陌陌
百亿数据处理实践:点击这里
PingCAP
TiDB 的 HTAP 之路:过去,现在和将来:点击这里
人人车
举重若轻的人人车移动端数据平台:点击这里