subtitle
Flink sql 最佳实践 Flink sql 最佳实践
【最佳实践】实时计算Flink在在线教育行业的实时数仓建设实践 https://developer.aliyun.com/article/769798?spm=a2c6h.14164896.0.0.73501154kejd15 【最佳实践
2020-08-24
Flink 工作原理 Flink 工作原理
一个Flink程序是由多个任务组成(source、transformation和sink)。
2020-08-12
Flink 的 task subtask operator-chain Flink 的 task subtask operator-chain
一个Flink程序是由多个任务组成(source、transformation和sink)。
2020-08-12
Hello World Hello World
分享如何创建一个hexo的blog。
2020-08-06
20200730 布隆过滤器是啥 20200730 布隆过滤器是啥
布隆过滤器比如HBase里面的应用,构建scannner时,判断scanner的是否包含所需要的数据列或者列族,来判断rowkey是否在一个region里?用到了布隆过滤器。 说人话的解释如下 https://developer.aliyu
2020-07-30
20200728 spark-sql的执行过程 20200728 spark-sql的执行过程
spark执行SQL的过程总体流程parser;基于antlr框架对 sql解析,生成抽象语法树变量替换,通过正则表达式找出符合规则的字符串,替换成系统缓存环境的变量SQLConf中的spark.sql.variable.substitut
2020-07-28
20200724 用户画像基础 20200724 用户画像基础
何为用户画像用户画像,即用户信息标签化,户画像建模其实就是对用户“打标签”。通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出一个用户的商业全貌作是企业应用大数据技术的基本方式。 用户信息标签分类按照标签的变
2020-07-24
20200721 Linux kill -n n到底是啥 20200721 Linux kill -n n到底是啥
Linux kill -n这里的-n 其实就是操作系统信号量的编号,下边来举两个具体的常用🌰 kill -15 pid系统会发送一个SIGTERM的信号给对应的程序。当程序接收到该signal后,将会发生以下的事情 程序立刻停止 当程序
2020-07-21
20200720 元数据的理解 20200720 元数据的理解
元数据元数据元数据,简单定义就是描述数据的数据。在企业中,只要有数据存在的地方,就有其对应元数据。只有完整、准确的元数据存在,才能更好地理解数据,充分挖掘数据的价值。本文针对数据分析类场景,描述其包含元数据,方便读者更好地理解它。 技术元数
2020-07-20
20200717 数仓建模 20200717 数仓建模
​基础架构 https://cloud.tencent.com/developer/article/1510576 数据模型 https://cloud.tencent.com/developer/article/1514014 ETL
2020-07-17
6 / 12