学生成绩表 score 的示例数据如下: [图片] 《下载测试数据》 1、统计各科前 3 名 统计结果要如下展示,每个名次一行,每个学科一列,并列名次的多人用逗号连结: [图片] …
早期 SQL 对有序计算极端不适应,理论上可以写,但实际的麻烦程度基本上等同于不能用。 在引入窗口函数后,有序计算得到了一定的改善,但 SQL 的基础还是无序集合,即使打…
简化后的进货表 purchases、销售表 sales 的部分数据如下: sales: [图片] purchases: [图片] 《下载测试数据》 1、统计各产品多少周发生过断货 这里只统计断 ..
简化后的账户表 user、访问表 view 的部分数据如下: user: [图片] view: [图片] 《下载测试数据》 1、统计每个账号访问各个产品的分钟数 按账户 id、产品分组汇总出分 …
数据结构 就诊记录表 Appointments [图片] appid 是就诊编号,patientid 是患者编号,depid 是科室编号,appdate 是就诊日期。 1. 查询 2020 与 ..
简化后的用户行为表 actions 的部分数据如下,记录各个用户 9 种事件的发生时间: [图片] 《下载测试数据》 1、查找按顺序触发过 e2、e3、e7 事件的用户 顺序事件不要求连…
本篇接续《数据分析编程从 SQL 到 SPL:用户事件统计》, 延用用户行为表 actions,记录各个用户 9 种事件的发生时间: [图片] 【下载测试数据】 3、连续 4 天活跃度排名…
数据结构 国家表 world.country [图片] Code 是国家编码,Name 是国家名称,Population 是国家人口。 国家语言表 world.countrylanguage ..
简化后的用户行为表 actions 的部分数据如下,记录各个用户 9 种事件的发生时间: [图片] 【下载测试数据】 1、计算每个用户会话次数 一个用户超过 2 天无操作或 e8 事件…
一、 测试任务 基于位置计算两个实体之间的距离,进而决定是否建立关联关系。这是典型的非等值关联运算,此时不能再使用 HASH 方法来优化。 任务原型来自国家天文台的星体…
在统计分析应用中,从明细数据计算出来的各种指标是支撑业务的重要数据。但是,要做到快速而且灵活的多指标计算,后台数据源面临多个难题。 多指标计算的一个难题是涉及的…
日常工作中,经常需要把多个 Excel 文件的数据合并到一起,便于做各种统计分析。 1 纵向合并 - 列名列数相同 最简单常见的 ..
现实中绝大多数 JOIN 都是字段相等的等值连接,非等值 JOIN 很少见,而且大多数可以转换成等值 JOIN 处理,我们在这里主要讨论等值 JOIN。 与 SQL 不同,SPL ..
问题描述 在SQL 提速:高并发帐户查询(下面简称前文)中讨论过单表高并发查询方案。有时情况复杂,查询还会涉及关联运算。比如:帐户查询时,明细数据还要与网点表等维表…
【摘要】 从原理上分析 SQL 语句慢的原因,用代码示例给出提速办法。点击了解 ${article} 问题描述 高并发帐户查询的应用场景有很多,例如:手机银行查流水、网上营业厅查…
【摘要】 从原理上分析 SQL 语句慢的原因,用代码示例给出提速办法。点击了解 ${article} 问题描述 我们把用来实现某种标记的“是否”型数据称为二值标签。在二值标签总数不…
【摘要】 从原理上分析 SQL 语句慢的原因,用代码示例给出提速办法。点击了解 ${article} 问题描述 对数据表做分组汇总时要全表遍历。如果要做 n 种不同的分组,就要对数…
【摘要】 从原理上分析 SQL 语句慢的原因,用代码示例给出提速办法。点击了解 ${article} 问题描述 数据表 T 的字段 x 按照集合 X={X1=Xn。分段之后,按照段号分组汇总。 …
【摘要】 从原理上分析 SQL 语句慢的原因,用代码示例给出提速办法。点击了解 ${article} 问题描述 TopN 是指从数据中查找前 N 名 / 后 N 名。以 Oracle 为例,S ..
【摘要】 从原理上分析 SQL 语句慢的原因,用代码示例给出提速办法。点击了解 ${article} 问题描述 去重本质上是分组运算,需要遍历原数据。计算时要一直保持一个去重后的…
【摘要】 从原理上分析 SQL 语句慢的原因,用代码示例给出提速办法。点击了解 ${article} 问题描述 WHERE 子句中出现 IN 比较常见,比如:按照客户年龄段枚举值过滤,还有…
时间序列数据的计算脚本须具备较强的有序计算能力,本文从此类工具中精心挑选了三种,从开发效率、语法表达能力、结构化函数库等方面进行深度对比,考察了各脚本在序号计…
SQL 的后计算脚本用于实现 SQL 不适合的某些复杂运算,本文从此类工具中精心挑选了三种,从开发效率、语法表达能力、结构化函数库等方面进行深度对比,考察了各脚本在集合…
轻量级数据处理脚本是桌面数据分析师的必备工具,本文从此类工具中精心挑选了四种,从易用性、开发效率、数据源支持种类、结构化计算函数等方面进行深度对比,并着重考察…
全文下载 [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] 资源 •《常用计算的 SPL 代码》 http://doc.raqsoft.com.cn/e ..
在数据库应用开发中,我们有时会需要将具有层次的分组数据“扁平化”,按顺序拼为一列,通过不同类型的标识来区别分组和明细,如下所示: [图片] 此类需求常见于为报表整理…