内容简介:接下来选两个具体的命令,来走读一遍实现功能的流程、使用了哪些功能库。第一个选择解析dex的最后一个功能,打印指定类、方法的反编译代码;第二个选择资源文件解析的最后一个命令,输出指定xml二进制文件对应的可读版本。首先,一定是从cli库中找到对应的命令枚举类型实现。在DEX_CODE类型的执行函数部分,可以找到impl类中对应的方法dexCode——ApkAnalyzerImpl类的功能函数代码如下:
接下来选两个具体的命令,来走读一遍实现功能的流程、使用了哪些功能库。第一个选择解析dex的最后一个功能,打印指定类、方法的反编译代码;第二个选择资源文件解析的最后一个命令,输出指定xml二进制文件对应的可读版本。
1. 打印dex中某个类、方法的smali代码
首先,一定是从cli库中找到对应的命令枚举类型实现。
DEX_CODE("dex", "code", "Prints the bytecode of a class or method in smali format") { public ArgumentAcceptingOptionSpec<String> classSpec; public ArgumentAcceptingOptionSpec<String> methodSpec; public OptionParser parser; @Override public OptionParser getParser(){ // 参数解析 if (this.parser == null) { this.parser = super.getParser(); this.classSpec = (ArgumentAcceptingOptionSpec<String>)this.parser.accepts("class", "Fully qualified class name to decompile.").withRequiredArg().ofType((Class)String.class).required(); this.methodSpec = (ArgumentAcceptingOptionSpec<String>)this.parser.accepts("method", "Method to decompile. Format: name(params)returnType, e.g. someMethod(Ljava/lang/String;I)V").withRequiredArg().ofType((Class)String.class); } return this.parser; } @Override public void execute(final PrintStream out, final PrintStream err, final ApkAnalyzerImpl impl, final String... args){ final OptionParser parser = this.getParser(); final OptionSet opts = parseOrPrintHelp(parser, err, args); // 解析dex部分 impl.dexCode(((File)opts.valueOf((OptionSpec)this.getFileSpec())).toPath(), (String)opts.valueOf((OptionSpec)this.classSpec), (String)opts.valueOf((OptionSpec)this.methodSpec)); } },
在DEX_CODE类型的执行函数部分,可以找到impl类中对应的方法dexCode——ApkAnalyzerImpl类的功能函数代码如下:
public void dexCode(final Path apk, final String fqcn, String method){ //解压apk文件 try (final Archive archive = Archives.open(apk)) { final Collection<Path> dexPaths = Files.list(archive.getContentRoot()).filter(path -> Files.isRegularFile(path, new LinkOption[0]) && path.getFileName().toString().endsWith(".dex")).collect((Collector<? super Path, ?, Collection<Path>>)Collectors.toList()); boolean dexFound = false; //遍历dex文件 for (final Path dexPath : dexPaths) { //核心文件解析类 final DexBackedDexFile dexBackedDexFile = DexFiles.getDexFile(dexPath); //核心文件反编译的管理类 final DexDisassembler disassembler = new DexDisassembler(dexBackedDexFile); if (method == null) { try { //打印该文件的所有反编译代码 this.out.println(disassembler.disassembleClass(fqcn)); dexFound = true; } catch (IllegalStateException ex) {} } else { final Optional<? extends DexBackedClassDef> classDef = (Optional<? extends DexBackedClassDef>)dexBackedDexFile.getClasses().stream().filter(c -> fqcn.equals(SigUtils.signatureToName(c.getType()))).findFirst(); //找到参数指定的方法 if (classDef.isPresent()) { method = ((DexBackedClassDef)classDef.get()).getType() + "->" + method; } try { //打印方法对应的反编译代码段 this.out.println(disassembler.disassembleMethod(fqcn, method)); dexFound = true; } catch (IllegalStateException ex2) {} } } //异常情况处理 if (!dexFound) { if (method == null) { throw new IllegalArgumentException(String.format("The given class (%s) not found", fqcn)); } throw new IllegalArgumentException(String.format("The given class (%s) or method (%s) not found", fqcn, method)); } } catch (IOException e) { throw new UncheckedIOException(e); } }
流程比较明确,加了一些简单的注释。
第一步,解压APK
Archives工具类在apkanalyzer.jar中,open这个函数基本上是所有命令的调用必经之路——毕竟解析内容第一步就是解压APK文件。可以看到里面根据zip和其他两种情况,使用了不同的 工具 类来做解压:
public static Archive open(final Path archive)throws IOException { if (archive.getFileName().toString().toLowerCase().endsWith(".zip")) { return ZipArtifact.fromZippedBundle(archive); } final FileSystem fileSystem = FileUtils.createZipFilesystem(archive); return new AndroidArtifact(archive, fileSystem); }
open函数返回的Archive是个接口,具体如下:
public interface Archiveextends AutoCloseable { PathgetPath(); PathgetContentRoot(); boolean isBinaryXml(final Path p0, final byte[] p1); void close()throws IOException; }
结合Archives来看,无非是使用java nio的一些文件工具,来实现解压方法。具体到AndroidArtifact上,有一些特殊的分析功能。
第二步,解析dex文件
DexBackedDexFile,该类在dexlib2-2.2.1.jar包中,包名路径是org.jf.dexlib2.dexbacked。这个包在sdk同目录下,也可以在网络上找到它的信息—— dexlib2 。
dexlib2 is a library for reading/modifying/writing Android dex files
简单讲,这个库可以读、写、改dex文件,很多搞hook、修改dex的工具插件等黑科技都会使用到这个库。可以查询它的javadoc看它具体的功能接口。
呃……不是很友好,没有什么注释的样子。这个类走读的话,看下构造就好了:
protected DexBackedDexFile(@Nonnull Opcodes opcodes, @Nonnullbyte[] buf,int offset, boolean verifyMagic) { super(buf, offset); this.opcodes = opcodes; if (verifyMagic) { DexUtil.verifyDexHeader(buf, offset); } this.stringCount = readSmallUint(56); this.stringStartOffset = readSmallUint(60); this.typeCount = readSmallUint(64); this.typeStartOffset = readSmallUint(68); this.protoCount = readSmallUint(72); this.protoStartOffset = readSmallUint(76); this.fieldCount = readSmallUint(80); this.fieldStartOffset = readSmallUint(84); this.methodCount = readSmallUint(88); this.methodStartOffset = readSmallUint(92); this.classCount = readSmallUint(96); this.classStartOffset = readSmallUint(100); }
成员属性的初始化,各种数据是如何从dex文件流中解析出来的,找对应的read函数就好了。
DexDisassembler 该类是apkanalyzer.jar里面的类,包名目录是com.android.tools.apk.analyzer.dex。它只有不到70行的长度,构造参数要求传入DexBackedDexFile实体,其中只有两个公用方法:
- public String disassembleMethod(final String fqcn, final String methodDescriptor) throws IOException
- public String disassembleClass(final String fqcn) throws IOException
逻辑也比较简单,通过构造传入的DexBackedDexFile实体,获得dex文件的解析的class信息,然后根据方法需要来输方法或者类的反编译信息。
第三步,根据参数要求输出,并处理异常情况
后面的输出逻辑也是一目了然的。根据是否有method参数,走不通的逻辑。有的话,查找对应的method;没有就输出整个类。如果找不到或者发生其他解析问题,抛出异常。
2. 把二进制XML文件的转换成可读的XML文件打印出来
相比而言,这条命令同样是代码的还原,只不过针对的是资源文件的二进制文件。同样的,找到对应的命令枚举类型的实现定义:
RESOURCES_XML("resources", "xml", "Prints the human readable form of a binary XML") { public OptionParser parser; private ArgumentAcceptingOptionSpec<String> filePathSpec; //解析参数 @Override public OptionParser getParser(){ if (this.parser == null) { this.parser = super.getParser(); this.filePathSpec = (ArgumentAcceptingOptionSpec<String>)this.parser.accepts("file", "File path within the APK.").withRequiredArg().ofType((Class)String.class); } return this.parser; } @Override public void execute(final PrintStream out, final PrintStream err, final ApkAnalyzerImpl impl, final String... args){ final OptionParser parser = this.getParser(); final OptionSet opts = parseOrPrintHelp(parser, err, args); assert this.filePathSpec != null; //执行解析 impl.resXml(((File)opts.valueOf((OptionSpec)this.getFileSpec())).toPath(), (String)opts.valueOf((OptionSpec)this.filePathSpec)); } };
同样具体功能函数会追溯到impl类中,找到对应的方法:
public void resXml(final Path apk, final String filePath){ //解压apk try (final Archive archive = Archives.open(apk)) { final Path path = archive.getContentRoot().resolve(filePath); //读文件 final byte[] bytes = Files.readAllBytes(path); //校验 if (!archive.isBinaryXml(path, bytes)) { throw new IOException("The supplied file is not a binary XML resource."); } //解析xml二进制码 this.out.write(BinaryXmlParser.decodeXml(path.getFileName().toString(), bytes)); } catch (IOException e) { throw new UncheckedIOException(e); } }
同样的open函数,解压好目标APK文件。在校验好文件类型后,调用了BinaryXmlParser的静态方法,该类在apkanalyzer.jar中,具体实现如下:
public static byte[] decodeXml(final String fileName, final byte[] bytes) { //文件解析 final BinaryResourceFile file = new BinaryResourceFile(bytes); final List<Chunk> chunks = (List<Chunk>)file.getChunks(); //各种情况处理 if (chunks.size() != 1) { return bytes; } if (!(chunks.get(0) instanceof XmlChunk)) { return bytes; } final XmlPrinter printer = new XmlPrinter(); final XmlChunk xmlChunk = (XmlChunk)chunks.get(0); visitChunks(xmlChunk.getChunks(), printer); final String reconstructedXml = "<?xml version=\"1.0\" encoding=\"utf-8\"?>\n" + printer.getReconstructedXml(); return reconstructedXml.getBytes(Charsets.UTF_8); }
文件解析
核心的文件解析部分在binary-resources.jar中,即BinaryResourceFile、Chunk类,包名目录是com.google.devrel.gmscore.tools.apk.arsc。根据BinaryResourceFile的构造可以看出这一点:
public BinaryResourceFile(byte[] buf) { ByteBuffer buffer = ByteBuffer.wrap(buf).order(ByteOrder.LITTLE_ENDIAN); while (buffer.remaining() > 0) { this.chunks.add(Chunk.newInstance(buffer)); } }
Chunk略上,贴一部分代码基本就可以看出,是个根据资源文件二进制的数据结构特点来处理的具体解析类:
public abstract class Chunk implements SerializableResource { public static final int PAD_BOUNDARY = 4; public static final int METADATA_SIZE = 8; private static final int CHUNK_SIZE_OFFSET = 4; @Nullable private final Chunk parent; protected final int headerSize; protected final int chunkSize; protected final int offset; public static enum Type { NULL(0), STRING_POOL(1), TABLE(2), XML(3), XML_START_NAMESPACE(256), XML_END_NAMESPACE(257), XML_START_ELEMENT(258), XML_END_ELEMENT(259), XML_CDATA(260), XML_RESOURCE_MAP(384), TABLE_PACKAGE(512), TABLE_TYPE(513), TABLE_TYPE_SPEC(514), TABLE_LIBRARY(515); private final short code; private static final Map<Short, Type> FROM_SHORT; ... } ... }
各种情况处理
解析后有几种情况。具体情况需要分析BinaryResourceFile的具体实现,来看。这里不做深入。最后一种情况则是解析XmlChunk。对应的使用XmlPrinter,该类是BinaryXmlParser中的一个内部工具类。看代码基本可以推断是转化各种Chunk内容的一个内容管理类。通过visitChunks,把XmlChunk的各种属性、元素内容写入XmlPrinter,最终输出可读的xml内容。
这里面除了上面提到的binary-resources相关的工具类和数据Bean之外,还涉及到一个XmlBuilder类,包名目录是com.android.xml,在common-26.0.0-dev.jar中,用于组装xml的各种零部件。
小结
也仅仅是走读代码,读其大略而已。没有深入研究dex、arsc具体的文件格式。
- sdk tools里面有很多工具jar,基本上可以包含所有的apk打包相关的各个环节
- 了解一些反编译的细节之后,多少对打包这件事本身会有更进一步的掌控
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- Envoy(四):envoy源代码走读&启动过程分析
- SpringCloud-Zuul(一):技术选型及请求流程源码走读
- java版JieBa分词源码走读 -- Trie树、Viterbi算法与HMM
- 每秒解析千兆字节的 JSON 解析器开源,秒杀一大波解析器!
- 注册中心 Eureka 源码解析 —— EndPoint 与 解析器
- 新一代Json解析库Moshi源码解析
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
《裂变:秒懂人工智能的基础课》
王天一 / 电子工业出版社·博文视点 / 2018-6-13 / 59.00元
人工智能是指通过普通计算机程序实现的人类智能技术,这一学科不仅具有非凡的科学意义,对人类自身生存方式的影响也在不断加深。本书作为人工智能领域的入门读物,内容围绕人工智能的核心框架展开,具体包括数学基础知识、机器学习算法、人工神经网络原理、深度学习方法与实例、深度学习之外的人工智能和实践应用场景等模块。本书力图为人工智能初学者提供关于这一领域的全面认识,也为进一步的深入研究建立坚实的基础。一起来看看 《《裂变:秒懂人工智能的基础课》》 这本书的介绍吧!