ARMv8.3-A PA在GCC里的相关实现

栏目: 服务器 · 编程工具 · 发布时间: 7年前

内容简介:ARMv8.3-A PA在GCC里的相关实现

ARMv8.3-A PA在GCC里的相关实现

@(GCC)[GNU System-Security] – zet

00 导引

很多的安全问题通过攻击者人为制造的恶意指针,然后处理器解释恶意指针为代码地址,然 后执行恶意指针所指的代码,这里的代码恰恰就是攻击者预先准备的恶意代码。所以对于指 针的合法性问题一直是安全防御的重点,有很多的防御手段以保证指针没有被污染为重点: SSP(software statck protection),CFI(control flow integrity)。这些防御手段的核心 思想就是检查指针有没有被更改过,这些防御手段几乎都需要多条软件指令来实现。

在2016年的时候ARMv8架构里增加了ARMv8.3-A,这个版本里增加了Pointer Authentication 指令:强化指针安全的一种机制。硬件级别的安全防御可以预见将会是趋势,因为不论是从 代码执行效率代码的清晰度还是加固的彻底程度来说都明显优于软件级别的实现。所以这也 是一个非常让人兴奋的ARM处理器特性。

本文的描述基于GCC最新的一个release: GCC-7.1.0,由于PA是一个非常新的特性,即便是 最新的GCC版本(GCC-7.1.0)目前也只是做了一个大概雏型,计划的让GCC选择key(A/B key) 用作返回地址签名的选项:-msign-return-address-key=key_name(key_name可选的值为: a_key/b_key分别对应A/B key)并没有在GCC-7.1.0里完成。目前相关key的代码还在GNU binutils里进行。所以本文只是在GCC-7.1.0现有代码的基础上做一个分析。后面随着相关 代码在GCC里的merge再进行补充完善。

01 细节

ARMv8.3-A能够支持PA的根本原因是因为当前的64位的 linux 下,地址空间也就是指针的实际 长度并不是64位,比如三级页表的情况下实际有效值只有低40位,这样高位的未使用的bit 就可以用来存储特定于某个指针的签名:Pointer Authentication Code(PAC)。

总得来说很简单,就是处理器内部在硬件级别以指针为一个参数来计算其特别的PAC然后存 储在指针的未使用的高位,计算的算法采用了一种叫做QARMA的可调分组密码(tweakable block ciphers)。计算/验证PAC的时候有(数据/指令 x A-key/B-key)四种组合指令: PAC*/AUT*,还有另外一种使用普通key计算PAC的指令PACGA。ARMv8.3-A还提供了检测PAC 的跳转指令族BRA*。

key存放在处理器内部的不可见寄存器里。所以攻击者很难不知道key的情况下得到PAC。

02 示例

在SSP(software statck protection)下如果不使用PA指令和使用PA指令的对比示例如下:

不使用PA指令

+--------------------------------------------------------------------+
|           | No SSP                    |   SSP                      |
+-----------|---------------------------|----------------------------+
|           | SUB sp, sp, #0x40         | SUB sp, sp, #0x50          |
|           | STP x29, x30, [sp,#0x30]  | STP x29, x30, [sp, #0x40]  |
| Prologue  | ADD x29, sp, #0x30        | ADD x29, sp, #0x40         |
|           | ...                       | ` ADRP x3, {pc} `          |
|           |                           | ` LDR x4, [x3, #SSP] `     |
|           |                           | ` STR x4, [sp, #0x38] `    |
|           |                           | ...                        |
+-----------|---------------------------|----------------------------+
|           | ...                       | ...                        |
|           | LDP x29,x30,[sp,#0x30]    | ` LDR x1, [x3, #SSP] `     |
| Epilogue  | ADD sp,sp,#0x40           | ` LDR x2, [sp, #0x38] `    |
|           | RET                       | ` CMP x1, x2 `             |
|           |                           | ` B.NE __stack_chk_fail `  |
|           |                           | LDP x29, x30, [sp, #0x40]  |
|           |                           | ADD sp, sp, #0x50          |
|           |                           | RET                        |
+--------------------------------------------------------------------+

使用PA指令

+--------------------------------------------------------------------+
|           | No SSP                    |   SSP                      |
+-----------|---------------------------|----------------------------+
|           | SUB sp, sp, #0x40         | ` PACIASP `                |
|           | STP x29, x30, [sp,#0x30]  | SUB sp, sp, #0x40          |
| Prologue  | ADD x29, sp, #0x30        | STP x29, x30, [sp,#0x30]   |
|           | ...                       | ADD x29, sp, #0x30         |
|           |                           | ...                        |
+-----------|---------------------------|----------------------------+
|           | ...                       | ...                        |
|           | LDP x29,x30,[sp,#0x30]    | LDP x29,x30,[sp,#0x30]     |
| Epilogue  | ADD sp,sp,#0x40           | ADD sp,sp,#0x40            |
|           | RET                       | ` AUTIASP `                |
|           |                           | RET                        |
+--------------------------------------------------------------------+

注意反引号里指令的对应。可以看出PA的优势。

03 实现

下面来查看要输出上面示例代码在GCC里的实现。

因为GCC在后端和处理调用参数的时候使用了大量的文本处理程序来自动生成C++源代码,所 以在GCC后端特性的实现和参数的实现上基本就是一些配置文件加回调的特化C++代码。

void
aarch64_expand_prologue (void)
{
  ... // 删掉不重要代码

  /* Sign return address for functions.  */
  if (aarch64_return_address_signing_enabled ())
    {
      // 指导输出PACIASP,这里的insn再经过一个简单匹配就是输出汇编代码了。
      insn = emit_insn (gen_pacisp ());
      add_reg_note (insn, REG_CFA_TOGGLE_RA_MANGLE, const0_rtx);
      RTX_FRAME_RELATED_P (insn) = 1;
    }

  ... // 删掉不重要代码

}

void
aarch64_expand_epilogue (bool for_sibcall)
{
  ... // 删掉不重要代码

  if (aarch64_return_address_signing_enabled ()
      && (for_sibcall || !TARGET_ARMV8_3 || crtl->calls_eh_return))
    {
      // 指导输出AUTIASP
      insn = emit_insn (gen_autisp ());
      add_reg_note (insn, REG_CFA_TOGGLE_RA_MANGLE, const0_rtx);
      RTX_FRAME_RELATED_P (insn) = 1;
    }

  ... // 删掉不重要代码

}

上面输出的insn都是GCC rtl的一种表示。

04 总结

虽然硬件级别的加固特性目前很少,PA这种指针级别的加密验证更是属于开创阶段,不过由 于硬件加固的优势:代码清晰,效率高,易于实现。预计在安全问题越来越重要的今天将会 是未来的发展方向。

live long and prosper.


以上所述就是小编给大家介绍的《ARMv8.3-A PA在GCC里的相关实现》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

零工经济

零工经济

Diane Mulcahy / 陈桂芳 / 中信出版集团股份有限公司 / 2017-11-1 / CNY 39.00

// 国内第一本讲述“零工经济”概念的图书! // 互联网时代,你的技能与兴趣可以与市场需求产生更佳的匹配! // 通过工作模式的转型,你的财务状况可以获得更多的灵活性与稳定性! 如果把当前的工作世界看作一把尺子,设想它一头是传统意义上由企业提供的职业阶梯,另一头是失业,那么两头之间范围广、种类多的工作选择便是零工经济。它包括咨询顾问、承接协定、兼职工作、临时工作、自由职业、个体......一起来看看 《零工经济》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具