摘要: 第1章 HBase简介 1.1 什么是HBase HBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为Hadoop的子项目来开发维护,用于支持结构化的数据存储。 官方网站:http://hbase.apache.org -- 2006年Google发表BigTabl 阅读全文
posted @ 2024-03-15 10:24 数据阮小白 阅读(9) 评论(0) 推荐(0) 编辑
摘要: 一.Hive语法详解 Hive 是基于Hadoop 构建的一套数据仓库分析系统,是一个用来搭建数仓的工具。它提供了丰富的SQL查询方式来分析存储在Hadoop分布式文件系统中的数据,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行 阅读全文
posted @ 2024-03-15 10:22 数据阮小白 阅读(391) 评论(0) 推荐(0) 编辑
摘要: Hologres 一.什么是实时数仓Hologres Hologres是阿里巴巴自主研发的一站式实时数仓引擎(Real-Time Data Warehouse),支持海量数据实时写入、实时更新、实时加工、实时分析,支持标准SQL(兼容PostgreSQL协议和语法,支持大部分PostgreSQL函数 阅读全文
posted @ 2024-03-15 10:14 数据阮小白 阅读(197) 评论(0) 推荐(0) 编辑
摘要: MaxCompute 一.简介 MaxCompute作为阿里云自研的海量大数据处理平台已经有十几年的发展历史,在规模和扩展性方面一直表现比较优秀。其依托阿里云飞天分布式操作系统,能够提供快速,完全托管的EB级数据仓库及数据湖解决方案,可经济高效的处理海量数据。目前,其承担着阿里集团绝大部分离线数据存 阅读全文
posted @ 2024-03-15 10:11 数据阮小白 阅读(27) 评论(0) 推荐(0) 编辑