Skip to content

Commit

Permalink
Fix blog mistake
Browse files Browse the repository at this point in the history
  • Loading branch information
lewiszlw committed Sep 10, 2024
1 parent 2195d1f commit 0ff6bcf
Show file tree
Hide file tree
Showing 2 changed files with 8 additions and 4 deletions.
Original file line number Diff line number Diff line change
Expand Up @@ -92,7 +92,7 @@ DataFusion 会利用聚合算子的输入在 group keys 上的(部分/完全

**第一阶段判断是否跳过聚合计算时,为什么需要输入无任何在 group keys 上的排序特性?**

因为如果输入具有排序特性,那么可以利用排序特性来提前输出部分已聚合完毕的 group,这样不会因为高基数聚合导致需要在内存中维护巨大的哈希表(Spill 也是同样地需要输入无任何在 group keys 上的排序特性)
因为如果输入具有排序特性,那么可以利用排序特性来提前输出部分已聚合完毕的 group,这样不会因为高基数聚合导致需要在内存中维护巨大的哈希表。

**为什么 Spill(溢出到磁盘)仅发生在第二阶段(FinalPartitioned),而不会在第一阶段(Partial)发生?**

Expand Down
10 changes: 7 additions & 3 deletions content/blog/2024-09-04-csapp-overview/index.md
Original file line number Diff line number Diff line change
@@ -1,10 +1,14 @@
+++
title = "《深入理解计算机系统》提炼总结"
title = "《深入理解计算机系统》高度提炼总结"
date = 2024-09-04
draft = true
+++

## 第一章 计算机系统漫游

线程级并发、指令级并发、SIMD并发
##
信息就是位 + 上下文(在不同的上下文中,一个同样的字节序列可能表示一个整数、浮点数、字符串或者机器指令)。

程序的生命周期:源程序(文本) --编译器--> 汇编程序(文本) --汇编器--> 可重定位目标程序(二进制) --链接器--> 可执行目标程序(二进制)。

## 第二章 信息的表示和处理

0 comments on commit 0ff6bcf

Please sign in to comment.