在进行数仓搭建和数据分析时最常用的就是 sql,其语法简洁明了,易于理解,目前大数据领域的几大主流框架全部都支持sql语法,包括 hive,spark,flink等,在进行查询分析时急需细心。
行业好文
2024-12-13 17:28 70
可信数据空间是一个全新的数据管理与共享的概念,它旨在为数据交换、流通和共享提供一个安全、透明、可控的环境。在这一空间内,各类数据——包括公共数据、企业数据、个人数据等——通过可信的数据治理机制进行管理,并在确保数据隐私、合规性和安全性的前提下,实现数据的高效流通和利用。
2024-12-12 10:32 82
数据要素市场化配置需要在市场经济条件下,围绕数据“供得出、流得动、用得好、保安全”。但数据要素的流通面临供需信息不对称、标准缺失、安全及定价问题,这些问题限制了流通效率,影响了数字经济的发展。
2024-12-11 11:13 87
随着企业数字化转型深入推进,针对数据要素的治理工作越来越受到重点关注,数据治理已经成为企业数字化转型的重要一环。
2024-12-10 16:54 85
在数据产品权限的设计逻辑中,RBAC的原则是一个典型的权限管理的方法论,来源于B端后台工具产品,即:Role-Based Access Control),基于角色的访问控制。
2024-12-09 16:31 84
本文分为三部分讲解,第一部分详解MPP架构,第二部分剖析MPP架构与批处理架构的异同点,第三部分是采用MPP架构的OLAP引擎介绍。
2024-12-06 16:41 97
省十四届人大常委会第十二次会议对《江苏省数据条例(草案修改稿)》(以下简称草案修改稿)进行了第二次审议,草案修改稿对数据权益、数据资源、数据流通、数据产业等多方面内容进行了补充完善。
数据政策
2024-12-05 17:50 108
石数据数据质量业务专家杨毓慧受邀担任无锡市数据交易师高层次人才培训班(第三期)讲师,就“数据质量评估与提升”的主题进行了知识和经验分享。
公司动态
2024-12-04 18:22 116
本文将分别介绍Spark的两种核心Shuffle:一种是基于 Hash 的 Shuffle;另一种是基于 Sort 的 Shuffle。
2024-12-03 10:44 115
Apache SeaTunnel 是一个非常易用的超高性能分布式数据集成产品,支持海量数据的离线及实时同步。
2024-12-02 11:33 164
热门文章
商务联系微信
0512-87811036,
18013092598
咨询电话