首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
首页标签数据仓库

#数据仓库

2024系统分析师考试---数据仓库相关概念

小马哥学JAVA

软通动力信息技术(集团)股份有限 | 高级工程师 (已认证)

传统的操作型数据库主要面向业务的,所执行的操作基本上也是联机事务处理,随着企业规模的增长,历史积累的数据越来越多,如何利用历史数据来为未来决策服...

2120

真的懂数据库分区吗?数仓为什么要作分区处理不麻烦吗?一文详解数仓分区

fanstuck

最近要搭某个业务域的数仓,本来设计规划的挺好的,该搭DIM,DWD,DWS的也都设计好了,结果一跑数仓,全是大大小小的1BUG,最后揪出来整个过程,最大的烦人东...

23920

数仓基础(二):数据仓库建模概述

Lansonli

如果把数据看作图书馆里的书,我们希望看到它们在书架上分门别类地放置;如果把数据看作城市的建筑,我们希望城市规划布局合理;如果把数据看作电脑文件和文件夹,我们希望...

14710

数仓基础(一):数据仓库中常见的名词解释

Lansonli

作为一个大数据开发技术人,是不是经常被各种名词围绕,对其中很多概念认知模糊。有些词虽然只有一字之差,但是它们意思完全不同,这些名词对于理解和构建数据仓库至关重要...

11710

快手:从 Clickhouse 到 Apache Doris,实现湖仓分离向湖仓一体架构升级

SelectDB技术团队

在当今这个数据洪流的信息时代下,数据已跃升为企业不可或缺的核心资产。深度挖掘并提炼数据内在价值,成为支撑企业战略决策的重要依据。在此背景下,快手建立了 OLAP...

14810

Apache Doris 2.1.6 版本正式发布

SelectDB技术团队

亲爱的社区小伙伴们,Apache Doris 2.1.6 版本已于 2024 年 9 月 10 日正式发布。2.1.6 版本在 Lakehouse、异步物化视图...

8310

资深ETL工程师经验分享:ETL项目的5大挑战与策略

用户7966476

在我十多年的数据仓库建设经验中,ETL(Extract, Transform, Load)一直是最具挑战性的环节之一。简单来说,ETL就是将分散在各个业务系统中...

12810

查询性能提升 10 倍、存储空间节省 65%,Apache Doris 半结构化数据分析方案及典型场景

SelectDB技术团队

随着业务的蓬勃发展,各企业对数据处理的灵活性和可扩展性提出了更高的要求。在此背景下,JSON、XML 等半结构化数据凭借其较强的灵活性在众多企业得到广泛应用。然...

13810

Apache Doris Flink Connector 24.0.0 版本正式发布

SelectDB技术团队

亲爱的社区伙伴们,Apache Doris Flink Connector 24.0.0 版本已于 2024 年 9 月 5 日正式发布。该版本新增了对 Fli...

11110

SelectDB 多计算集群核心设计要点揭秘与场景应用

SelectDB技术团队

SelectDB Cloud 是基于 Apache Doris 研发的全托管实时数据仓库服务,采用全新的云原生存算分离架构。当计算层与存储层进行了分离设计后,计...

11110

招联金融基于 Apache Doris 数仓升级:单集群 QPS 超 10w,存储成本降低 70%

SelectDB技术团队

在上述目标驱使下,招联迅速定位到 Apache Doris 这一开源实时数据仓库 ,Doris 以其简洁的架构设计、丰富的数据接口、高效的查询性能以及低廉的运维...

19410

谈谈我对实时计算的理解

阿超

实时数仓是数据仓库的一种形式,它能够实时处理和分析数据。相比传统数据仓库,它的优势在于能够处理流式数据(不断产生的数据流),并实时更新分析结果。这对于需要即时决...

8910

AI大模型独角兽 MiniMax 基于 Apache Doris 升级日志系统,PB 数据秒级查询响应

SelectDB技术团队

MiniMax 是领先的通用人工智能科技公司,自主研发了不同模态的通用大模型,其中包括拥有万亿参数的 MoE 文本大模型、语音大模型以及图像大模型。MiniMa...

14110

列转行-多列转多行(横表变竖表)

数据仓库晨曦

原始数据为一张横表,分别有三列成绩列,想要转成竖表,需要转换成三列分别为 学生id、学科、成绩,转换完成之后学生id将不再是主键。

10010

行转列-多行转多列(竖表转横表)

数据仓库晨曦

原始数据中是一个竖表,每个学生的每个学科一行数据,对其转换成一张横表,即表中学生id为主键,包含语文、数学、英语三列,列值为对应学科分数。

9310

行转列-有序行转列

数据仓库晨曦

根据配送订单记录表,查询出骑手id,顾客id列表,要求顾客id列表中的顺序按照送达时间早晚排序。

5910

数据开发/数仓工程师上手指南(七)CDM-DWS层搭建规范及流程

fanstuck

进入到了CMD公共数据层的结尾最后一层-DWS层了,该层基本就是直接与业务强关联,也就是说产品提出的需求,或是报表、用户画像统计好还是数据大屏都是在这一层给处理...

39220

数据开发/数仓工程师上手指南(六)CDM-DWD层搭建规范及流程

fanstuck

明细粒度事实层(DWD)在数据仓库中是非常重要的一个层次,其设计与企业的业务过程紧密相关。通过理解DWD层的特点和设计方法,可以更好地支持企业的数据分析需求。

26342
领券
http://www.vxiaotou.com