|
| 1 | +--- |
| 2 | +title: 2024秋冬季开源操作系统训练营第三阶段实验报告-寒冰 |
| 3 | +date: 2024-12-04 05:10:00 |
| 4 | +categories: |
| 5 | + - 2024秋冬季开源操作系统训练营第三阶段实验报告-寒冰 |
| 6 | +tags: |
| 7 | + - author:hanbings |
| 8 | + - repo:https://github.com/hanbings/canicula |
| 9 | +--- |
| 10 | + |
| 11 | +# 内存分配器-字节分配器:Chaos 一点都不 Chaos |
| 12 | + |
| 13 | +## 分析内存结构 |
| 14 | + |
| 15 | +### 堆中的 `Vec<Vec<u8>>` 结构数据 |
| 16 | + |
| 17 | +使用上述任意分配器,并在 alloc 和 dealloc 函数,中分别打印 Layout。在打印结果中可以看到一些比较特殊的内存大小分别为 96、192、384 |
| 18 | + |
| 19 | +这是什么呢?根据 `lab1/src/main.rs` 中的测例代码分析可得知 `let mut items: Vec<Vec<u8>> = Vec::new();` 的内层 `Vec` 将存放在堆内存中。 |
| 20 | + |
| 21 | +而 [Rust 中的堆数据结构](https://rcore-os.cn/rCore-Tutorial-Book-v3/chapter4/1rust-dynamic-allocation.html?highlight=vec#rust-heap-data-structures) 中的一张图片展示了 Vec 的内存结构为指针、长度和容量,每一部分各占 usize,在 64 位系统中,uszie 大小为 8 字节,即一个空数组内存占用为 24 字节,这与 96 字节仍有出入。 |
| 22 | + |
| 23 | +再观察分配情况,在 `Indicator: 0` 时,96 字节的 alloc 是在第一次 32 字节 alloc 后产生的,猜测是在 `items.push` 后进行了一次 [扩容](https://doc.rust-lang.org/std/vec/struct.Vec.html#capacity-and-reallocation),`alloc_pass` 修改为如下代码进行验证: |
| 24 | + |
| 25 | +```rust |
| 26 | +fn alloc_pass(delta: usize) -> Vec<Vec<u8>> { |
| 27 | + let mut items = Vec::new(); |
| 28 | + let mut base = 32; |
| 29 | + loop { |
| 30 | + let c = (delta % 256) as u8; |
| 31 | + let a = vec![c; base+delta]; |
| 32 | + items.push(a); |
| 33 | + println!("Item Capacity: {}", items.capacity()); |
| 34 | + if base >= 512*1024 { |
| 35 | + break; |
| 36 | + } |
| 37 | + base *= 2; |
| 38 | + } |
| 39 | + items |
| 40 | +} |
| 41 | +``` |
| 42 | + |
| 43 | +结果为: |
| 44 | + |
| 45 | +``` |
| 46 | +Running bumb tests... |
| 47 | +Indicator: 0 |
| 48 | +Item Capacity: 4 |
| 49 | +Item Capacity: 4 |
| 50 | +Item Capacity: 4 |
| 51 | +Item Capacity: 4 |
| 52 | +Item Capacity: 8 |
| 53 | +Item Capacity: 8 |
| 54 | +Item Capacity: 8 |
| 55 | +Item Capacity: 8 |
| 56 | +Item Capacity: 16 |
| 57 | +Item Capacity: 16 |
| 58 | +Item Capacity: 16 |
| 59 | +Item Capacity: 16 |
| 60 | +Item Capacity: 16 |
| 61 | +Item Capacity: 16 |
| 62 | +Item Capacity: 16 |
| 63 | +``` |
| 64 | + |
| 65 | +就对上了,`24 * 4 = 96` `24 * 8 = 192` `24 * 16 = 384` |
| 66 | + |
| 67 | +同时,至少在这里来说,`Vec` 初始容量为 0,第一次扩容时为 4,扩容机制为每次容量翻倍。 |
| 68 | + |
| 69 | +### 存放数据的堆空间 |
| 70 | + |
| 71 | +再回到测例代码: |
| 72 | + |
| 73 | +```rust |
| 74 | +fn free_pass(items: &mut Vec<Vec<u8>>, delta: u8) { |
| 75 | + let total = items.len(); |
| 76 | + for j in (0..total).rev() { |
| 77 | + if j % 2 == 0 { |
| 78 | + let ret = items.remove(j); |
| 79 | + assert_eq!(delta, ret[0]); |
| 80 | + assert_eq!(delta, ret[ret.len()-1]); |
| 81 | + } |
| 82 | + } |
| 83 | +} |
| 84 | +``` |
| 85 | + |
| 86 | +这段代码在检查是否为偶数项,偶数项数组才会被 `free_pass` 的 `remove()` 释放。 |
| 87 | + |
| 88 | +因此针对这段代码,可以在分配器中设置一个奇偶标志位,当标志位为奇数时将数据从内存的起始位置开始分配,偶数时分配在末尾位置且向起始位置增长。扩容时,不考虑内存扩容时传入的内存地址起始位置而只改变结尾位置时也无需多余操作。 |
| 89 | + |
| 90 | +## Chaos 真的不 Chaos |
| 91 | + |
| 92 | +### 整体结构 |
| 93 | + |
| 94 | +考虑: |
| 95 | + |
| 96 | +1. 堆中的 `Vec<Vec<u8>>` 数据结构,大小固定为 `96 + 192 + 384 = 672` 字节,位于可分配内存的起始位置 |
| 97 | +2. 奇数项堆,动态增长,紧跟 672 字节 |
| 98 | +3. 偶数项堆,动态增长,位于可分配内存的末尾位置 |
| 99 | + |
| 100 | +使用以下结构体来描述整个可分配内存区域 |
| 101 | + |
| 102 | + |
| 103 | +```rust |
| 104 | +pub struct Chaos { |
| 105 | + pub vec_reserve: (usize, usize, usize), |
| 106 | + |
| 107 | + pub start: usize, |
| 108 | + pub end: usize, |
| 109 | + pub head: usize, |
| 110 | + pub tail: usize, |
| 111 | + pub is_even: bool, |
| 112 | + |
| 113 | + pub allocated: usize, |
| 114 | + pub total: usize, |
| 115 | +} |
| 116 | +``` |
| 117 | + |
| 118 | + |
| 119 | +内存结构如下: |
| 120 | + |
| 121 | + |
| 122 | + |
| 123 | +`vec_reserve: (usize, usize, usize)` 用作存储先前描述的三片特殊的堆中 Vec 元数据结构,`vec_reserve` 为固定长度:`96 + 192 + 384` 字节。 |
| 124 | + |
| 125 | +`pub start: usize` 和 `pub end: usize` 分别存储 init 或是 add_to_heap 时给定的可分配内存地址范围。 |
| 126 | + |
| 127 | +`pub head: usize` 和 `pub tail: usize` 分别存储当前奇数堆的末尾位置和偶数堆的起始位置,通过 `head - start + vec_reserve` 可以得出奇数堆大小,通过 `end - tail` 则可以得出偶数堆大小。 |
| 128 | + |
| 129 | +`pub is_even: bool` 用于记录上一次分配是奇数还是偶数,在分配的最后将其翻转。 |
| 130 | + |
| 131 | +### 实现 |
| 132 | + |
| 133 | +在开始之前,还要确定一个很重要的问题。目前的设计,并没有考虑扩容时分配在本程序堆内存前内存区域的地址,因此使用代码简单判断下: |
| 134 | + |
| 135 | +```rust |
| 136 | +pub fn add_to_heap(&mut self, start: usize, end: usize) { |
| 137 | + log::warn!("head: 0x{:x}, tail: 0x{:x}, start: 0x{:x}, end: 0x{:x}", self.head, self.tail, start, end); |
| 138 | + |
| 139 | + self.head = start; |
| 140 | + self.tail = end; |
| 141 | + |
| 142 | + panic!("add_to_heap"); |
| 143 | +} |
| 144 | +``` |
| 145 | + |
| 146 | +从 `add_to_heap` 的输出: |
| 147 | + |
| 148 | +``` |
| 149 | +Running bumb tests... |
| 150 | +Indicator: 0 |
| 151 | +[ 0.082919 0 lab_allocator::chaos:66] head, tail: 0xffffffc08026d2a0, 0xffffffc080275000 |
| 152 | +[ 0.087323 0 lab_allocator::chaos:44] head: 0xffffffc08026d2a0, tail: 0xffffffc080275000, start: 0xffffffc080275000, end: 0xffffffc08027d000 |
| 153 | +[ 0.091091 0 axruntime::lang_items:5] panicked at labs/lab_allocator/src/chaos.rs:49:9: |
| 154 | +add_to_heap |
| 155 | +``` |
| 156 | + |
| 157 | +可以看到后续追加的内存与当前程序的堆尾部是连续的,只需要更改 `tail` 字段扩容当前内存即可。 |
| 158 | + |
| 159 | +1. 初始化以及扩容 |
| 160 | + |
| 161 | + ```rust |
| 162 | + pub unsafe fn init(&mut self, start: usize, size: usize) { |
| 163 | + self.vec_reserve = (start, start + 96, start + 96 + 192); |
| 164 | + |
| 165 | + self.start = start + 96 + 192 + 384; |
| 166 | + self.head = start + 96 + 192 + 384; |
| 167 | + |
| 168 | + self.end = start + size; |
| 169 | + self.tail = start + size; |
| 170 | + |
| 171 | + self.allocated = 96 + 192 + 384; |
| 172 | + self.total = self.end - self.start; |
| 173 | + } |
| 174 | + |
| 175 | + pub fn add_to_heap(&mut self, start: usize, end: usize) { |
| 176 | + self.end = end; |
| 177 | + self.tail = end; |
| 178 | + |
| 179 | + self.total += end - start; |
| 180 | + } |
| 181 | + ``` |
| 182 | + |
| 183 | +2. 分配 |
| 184 | + |
| 185 | + ```rust |
| 186 | + pub fn alloc(&mut self, layout: Layout) -> Result<NonNull<u8>, ()> { |
| 187 | + let vec_reserve_ptr = match layout.size() { |
| 188 | + 96 => Some(self.vec_reserve.0 as *const u8), |
| 189 | + 192 => Some(self.vec_reserve.1 as *const u8), |
| 190 | + 384 => Some(self.vec_reserve.2 as *const u8), |
| 191 | + _ => None, |
| 192 | + }; |
| 193 | + |
| 194 | + if vec_reserve_ptr.is_some() { |
| 195 | + return Ok(NonNull::new(vec_reserve_ptr.unwrap() as *mut u8).unwrap()); |
| 196 | + } |
| 197 | + |
| 198 | + // check if memory is overflow |
| 199 | + if self.tail - layout.size() <= self.head { |
| 200 | + return Err(()); |
| 201 | + } |
| 202 | + |
| 203 | + let ptr = if self.is_even { |
| 204 | + let mem = self.tail - layout.size(); |
| 205 | + self.tail = mem; |
| 206 | + |
| 207 | + NonNull::new(mem as *mut u8).unwrap() |
| 208 | + } else { |
| 209 | + let mem = self.head; |
| 210 | + self.head = mem + layout.size(); |
| 211 | + |
| 212 | + NonNull::new(mem as *mut u8).unwrap() |
| 213 | + }; |
| 214 | + |
| 215 | + self.is_even = !self.is_even; |
| 216 | + self.allocated += layout.size(); |
| 217 | + |
| 218 | + Ok(ptr) |
| 219 | + } |
| 220 | + ``` |
| 221 | + |
| 222 | +3. 释放 |
| 223 | + |
| 224 | + ```rust |
| 225 | + pub fn dealloc(&mut self, pos: NonNull<u8>, layout: Layout) { |
| 226 | + if (pos.as_ptr() as usize) < self.start + 96 + 192 + 384 { |
| 227 | + return; |
| 228 | + } |
| 229 | + |
| 230 | + self.tail +=layout.size(); |
| 231 | + self.allocated -= layout.size(); |
| 232 | + } |
| 233 | + ``` |
| 234 | + |
| 235 | +### 越界访问 |
| 236 | + |
| 237 | +第 32 轮分配时发生了 `Unhandled Supervisor Page Fault`,本机的 `panic` 位置为 `0xffffffc0802005fc`,远在可分配的起始地址 `0xffffffc08026d2a0` 前,猜测本次的 `panic` 发生在栈区或是发生在从 tail 进行分配或释放时发生的。 |
| 238 | + |
| 239 | +说起来很好笑,`let mut pool = Vec::new();` 和 items 一样,也会占用一些堆区内存,但因为其只写不读,即使内部全部都是无效的堆内存地址也没有问题。但这提醒到了一点:在分配用于 `items: Vec<Vec<u8>>` 的堆内存时,使用了一个特判: |
| 240 | + |
| 241 | +```rust |
| 242 | +let vec_reserve_ptr = match layout.size() { |
| 243 | + 96 => Some(self.vec_reserve.0 as *const u8), |
| 244 | + 192 => Some(self.vec_reserve.1 as *const u8), |
| 245 | + 384 => Some(self.vec_reserve.2 as *const u8), |
| 246 | + _ => None, |
| 247 | +}; |
| 248 | +``` |
| 249 | + |
| 250 | +这几个数字并没有问题,但先前我们忽略了 `let a = vec![c; base+delta];` 的 `base` 总是从 32 开始,每次 `alloc` 翻倍,`delta` 则每轮增加 `1`。恰好, 第 32 轮的第二次 `alloc` 时那么不恰好的 `base = 64` 和 `delta = 32`,这不是 `96` 了嘛 uwu,所以到这时候,原本该分配给 `items: Vec<Vec<u8>>` 的地址被当作了 tail 堆的起始地址,又因为 `tail` 是 `tail = tail - size` 取得空闲地址,所以结果是越界了。 |
| 251 | + |
| 252 | +根据观察后,在 `Layout` 中存在字段 `align`,`align` 字段在 `items: Vec<Vec<u8>>` 分配中总是 `8`,而普通分配总是 `1`。 |
| 253 | + |
| 254 | +因此简单写个判断就可以解决了: |
| 255 | + |
| 256 | +```rust |
| 257 | +if vec_reserve_ptr.is_some() && layout.align() == 8 { |
| 258 | + return Ok(NonNull::new(vec_reserve_ptr.unwrap() as *mut u8).unwrap()); |
| 259 | +} |
| 260 | +``` |
| 261 | + |
| 262 | +处理完这个问题后,算法成功跑到 152 轮。 |
| 263 | + |
| 264 | +```shell |
| 265 | +Indicator: 152 |
| 266 | +[ 25.511024 0 lab_allocator::chaos:71] alloc_memory: head=0xffffffc084f352a8, tail=0xffffffc085015be2, size=0xb8 |
| 267 | +[ 25.513985 0 lab_allocator::chaos:85] alloc_memory: ptr=0xffffffc085015b2a |
| 268 | +[ 25.516487 0 lab_allocator::chaos:71] alloc_memory: head=0xffffffc084f352a8, tail=0xffffffc085015b2a, size=0xd8 |
| 269 | +[ 25.519232 0 lab_allocator::chaos:85] alloc_memory: ptr=0xffffffc084f352a8 |
| 270 | +[ 25.521127 0 lab_allocator::chaos:71] alloc_memory: head=0xffffffc084f35380, tail=0xffffffc085015b2a, size=0x118 |
| 271 | +[ 25.523938 0 lab_allocator::chaos:85] alloc_memory: ptr=0xffffffc085015a12 |
| 272 | +[ 25.525770 0 lab_allocator::chaos:71] alloc_memory: head=0xffffffc084f35380, tail=0xffffffc085015a12, size=0x198 |
| 273 | +[ 25.528492 0 lab_allocator::chaos:85] alloc_memory: ptr=0xffffffc084f35380 |
| 274 | +[ 25.530458 0 lab_allocator::chaos:71] alloc_memory: head=0xffffffc084f35518, tail=0xffffffc085015a12, size=0x298 |
| 275 | +[ 25.533267 0 lab_allocator::chaos:85] alloc_memory: ptr=0xffffffc08501577a |
| 276 | +[ 25.535172 0 lab_allocator::chaos:94] head, tail: 0xffffffc084f35518, 0xffffffc08501577a |
| 277 | +[ 25.537270 0 lab_allocator::chaos:95] dealloc_memory: pos=0xffffffc08026f000, size=0x60 |
| 278 | +[ 25.540115 0 lab_allocator::chaos:71] alloc_memory: head=0xffffffc084f35518, tail=0xffffffc08501577a, size=0x498 |
| 279 | +[ 25.542925 0 lab_allocator::chaos:85] alloc_memory: ptr=0xffffffc084f35518 |
| 280 | +[ 25.544869 0 lab_allocator::chaos:71] alloc_memory: head=0xffffffc084f359b0, tail=0xffffffc08501577a, size=0x898 |
| 281 | +[ 25.547528 0 lab_allocator::chaos:85] alloc_memory: ptr=0xffffffc085014ee2 |
| 282 | +[ 25.549466 0 lab_allocator::chaos:71] alloc_memory: head=0xffffffc084f359b0, tail=0xffffffc085014ee2, size=0x1098 |
| 283 | +[ 25.552112 0 lab_allocator::chaos:85] alloc_memory: ptr=0xffffffc084f359b0 |
| 284 | +[ 25.554013 0 lab_allocator::chaos:71] alloc_memory: head=0xffffffc084f36a48, tail=0xffffffc085014ee2, size=0x2098 |
| 285 | +[ 25.558305 0 lab_allocator::chaos:85] alloc_memory: ptr=0xffffffc085012e4a |
| 286 | +[ 25.560458 0 lab_allocator::chaos:94] head, tail: 0xffffffc084f36a48, 0xffffffc085012e4a |
| 287 | +[ 25.562665 0 lab_allocator::chaos:95] dealloc_memory: pos=0xffffffc08026f060, size=0xc0 |
| 288 | +[ 25.564900 0 lab_allocator::chaos:71] alloc_memory: head=0xffffffc084f36a48, tail=0xffffffc085012e4a, size=0x4098 |
| 289 | +[ 25.567790 0 lab_allocator::chaos:85] alloc_memory: ptr=0xffffffc084f36a48 |
| 290 | +[ 25.569725 0 lab_allocator::chaos:71] alloc_memory: head=0xffffffc084f3aae0, tail=0xffffffc085012e4a, size=0x8098 |
| 291 | +[ 25.572420 0 lab_allocator::chaos:85] alloc_memory: ptr=0xffffffc08500adb2 |
| 292 | +[ 25.575027 0 lab_allocator::chaos:71] alloc_memory: head=0xffffffc084f3aae0, tail=0xffffffc08500adb2, size=0x10098 |
| 293 | +[ 25.577664 0 lab_allocator::chaos:85] alloc_memory: ptr=0xffffffc084f3aae0 |
| 294 | +[ 25.579570 0 lab_allocator::chaos:71] alloc_memory: head=0xffffffc084f4ab78, tail=0xffffffc08500adb2, size=0x20098 |
| 295 | +[ 25.582385 0 lab_allocator::chaos:85] alloc_memory: ptr=0xffffffc084fead1a |
| 296 | +[ 25.584478 0 lab_allocator::chaos:71] alloc_memory: head=0xffffffc084f4ab78, tail=0xffffffc084fead1a, size=0x40098 |
| 297 | +[ 25.587429 0 lab_allocator::chaos:85] alloc_memory: ptr=0xffffffc084f4ab78 |
| 298 | +[ 25.591690 0 axruntime::lang_items:5] panicked at modules/axalloc/src/lib.rs:124:31: |
| 299 | +Bumb: NoMemory. |
| 300 | +``` |
| 301 | + |
| 302 | +### 预分配:尽可能使用更多的内存 |
| 303 | + |
| 304 | +在观察 152 轮和 `add_memory` 的 `log` 时发现: |
| 305 | + |
| 306 | +1. 本轮的偶数区并没有得到释放。 |
| 307 | +2. 内存从一开始分配起,每次扩容即为前一次空间 `x2`,最大为 `32 MB`。而 qemu 虚拟机分配的是 `128MB`,只分配到了 `32MB`,显然还不是极限。 |
| 308 | + |
| 309 | +```rust |
| 310 | +pub fn alloc(&mut self, layout: Layout) -> Result<NonNull<u8>, ()> { Err(()) } |
| 311 | +``` |
| 312 | + |
| 313 | +```shell |
| 314 | +Indicator: 0 |
| 315 | +[ 0.088199 0 lab_allocator::chaos:46] add_memory: start=0xffffffc080275000, end=0xffffffc08027d000 # 32768 |
| 316 | +[ 0.090785 0 lab_allocator::chaos:46] add_memory: start=0xffffffc08027d000, end=0xffffffc08028d000 # 65536 |
| 317 | +[ 0.093210 0 lab_allocator::chaos:46] add_memory: start=0xffffffc08028d000, end=0xffffffc0802ad000 # 131072 |
| 318 | +[ 0.095720 0 lab_allocator::chaos:46] add_memory: start=0xffffffc0802ad000, end=0xffffffc0802ed000 # 262144 |
| 319 | +[ 0.098368 0 lab_allocator::chaos:46] add_memory: start=0xffffffc0802ed000, end=0xffffffc08036d000 # 524288 |
| 320 | +[ 0.100928 0 lab_allocator::chaos:46] add_memory: start=0xffffffc08036d000, end=0xffffffc08046d000 # 1048576 |
| 321 | +[ 0.103497 0 lab_allocator::chaos:46] add_memory: start=0xffffffc08046d000, end=0xffffffc08066d000 # 2097152 |
| 322 | +[ 0.106127 0 lab_allocator::chaos:46] add_memory: start=0xffffffc08066d000, end=0xffffffc080a6d000 # 4194304 |
| 323 | +[ 0.108677 0 lab_allocator::chaos:46] add_memory: start=0xffffffc080a6d000, end=0xffffffc08126d000 # 8388608 |
| 324 | +[ 0.111219 0 lab_allocator::chaos:46] add_memory: start=0xffffffc08126d000, end=0xffffffc08226d000 # 16777216 |
| 325 | +[ 0.114057 0 lab_allocator::chaos:46] add_memory: start=0xffffffc08226d000, end=0xffffffc08426d000 # 33554432 byte = 32MB |
| 326 | +[ 0.117634 0 axruntime::lang_items:5] panicked at modules/axalloc/src/lib.rs:124:31: |
| 327 | +Bumb: NoMemory. |
| 328 | +``` |
| 329 | + |
| 330 | +因此,我们可以打第一次 alloc 开始就强迫系统预分配一大堆内存给测例。比如在 `pub fn alloc(&mut self, layout: Layout) -> Result<NonNull<u8>, ()> ` 的合理位置添加下面的代码: |
| 331 | + |
| 332 | +```rust |
| 333 | +// get as much memory as possible |
| 334 | +if self.end <= 0xffffffc08426d000 { |
| 335 | + return Err(()); |
| 336 | +} |
| 337 | +``` |
| 338 | + |
| 339 | +修改后,轮数为 189。此时,内存分配量到达了 `64MB`,这样下来仍有很多剩余空间。 |
| 340 | + |
| 341 | +### 再挤一挤,内存还是有的 |
| 342 | + |
| 343 | +看一眼 `axalloc` 中: |
| 344 | + |
| 345 | +```rust |
| 346 | +let old_size = balloc.total_bytes(); |
| 347 | +let expand_size = old_size |
| 348 | + .max(layout.size()) |
| 349 | + .next_power_of_two() |
| 350 | + .max(PAGE_SIZE); |
| 351 | +let heap_ptr = match self.alloc_pages(expand_size / PAGE_SIZE, PAGE_SIZE) { |
| 352 | + Ok(ptr) => ptr, |
| 353 | + Err(e) => panic!("Bumb: {:?}.", e), |
| 354 | +}; |
| 355 | +``` |
| 356 | + |
| 357 | +不难发现 `axalloc` 是依赖于 `total_bytes()` 来判断该扩容多少内存。 |
| 358 | + |
| 359 | +简单一些处理,只需要修改原先的 `total_bytes` 代码,使得 `total_bytes` 永远返回 `0`。 |
| 360 | + |
| 361 | +```rust |
| 362 | +pub fn total_bytes(&self) -> usize { |
| 363 | + 0 |
| 364 | +} |
| 365 | +``` |
| 366 | + |
| 367 | +修改后的最终轮数为 245。 |
| 368 | + |
| 369 | +> 也许还会在 [我的博客](https://blog.hanbings.io) 更新,代码仓库可能会在后续删除,为了不再占用的过多空间,完整代码同样也附带在我的博客里 |
| 370 | +
|
0 commit comments