查看原文
其他

【APP 聊天协议逆向分析】

电子物证 2023-06-10

环境


主机:win10

手机:Pixel 4 ,Android 10

APP版本:V4.70.0


工具


IDA、JADX、Frida、Charles、WireShark


逆向思路


总结:猜


流量抓包分析


聊天数据一般都为TCP传输,所以直接使用WireShark抓包。


经过不断观察以下特征数据很像聊天数据:

接下来的思路就是Hook libc.so 的send函数,打印调用堆栈。


查壳、脱壳


未查到,那就先将APK拖进JADX里进行分析。


Frida Hook


撸起袖子就准备直接开干,Frida Server已启动,直接运行。

frida -Uf cn.xxxx.android -l .\xxx.js --no-pause


世间万般逆向怎么都如我所愿?不出意外的意外,Process terminated。


狗贼将我的Frida大法拒之门外,作为Frida忠实爱好者(别的不会),这哪能忍?

往上看,/lib/arm64/libmsaoaidsec.so这小子名字一看就不是什么好东西。拖进IDA里将之底裤扒光。


我们知道一般检测Frida的函数无非是strstr、strcmp、readline,fgets这些。我们当然也知道一般检测函数大多都在init_proc、JNI_OnLoad中进行调用执行。


打开so 定位到init_proc,然后又闻到了熟悉的味道。


里面调用的函数不是很多,所以直接人肉分析,那这样不是外套脱了还剩里面的?不行不行。

通过观察上面的CFG发现,该混淆符合以下逻辑:

整体思路就是先查找主分发器,一般被引用次数最多的那个块就是主分发器,引用主分发器的块大概率是真实块,再使用unicorn模拟执行,遍历每一个分支,记录每一个块,如果某一个块是上次记录的块则也为真实块,无后继的块则为retn块,剩下的就是无用块。最终处理后样子如下:

经过一个一个的点,最终找到了一个十分可疑的家伙sub_1A8A0()。

再次跟进去,发现了重点胖揍对象。

result = pthread_create(qword_45658, 0LL, (void *(*)(void *))sub_18C88, 0LL);

那可不就是这小子阻碍了Frida大军的步伐。


下面编写Frida脚本去绕过该检测手段。

function hook_pthread_create(){ var pt_create_func = Module.findExportByName(null,'pthread_create'); var detect_frida_loop_addr = null; console.log('pt_create_func:',pt_create_func); Interceptor.attach(pt_create_func,{ onEnter:function(){ if(detect_frida_loop_addr == null) { var base_addr = Module.findBaseAddress('libmsaoaidsec.so'); if(base_addr != null){ detect_frida_loop_addr = base_addr.add(0x0000000000018C88) console.log('this.context.x2: ', detect_frida_loop_addr , this.context.x2); if(this.context.x2.compare(detect_frida_loop_addr) == 0) { hook_anti_frida_replace(this.context.x2); } } } }, onLeave : function(retval){ // console.log('retval',retval); } })}function hook_anti_frida_replace(addr){ console.log('replace anti_addr :',addr); Interceptor.replace(addr,new NativeCallback(function(a1){ console.log('replace success'); return; },'pointer',[])); }setImmediate(hook_pthread_create(),3000);


然后就可以愉快的使用Frida了。


加密流程分析


通过Frida Hook libc.so后发现,聊天协议走的是JAVA层的socket,然后Hook JAVA层相关函数得到如下调用堆栈。

那么组包和加密大概率是在wq这个类里面的某些函数实现的。


打开JADX,查看wq.d$d.e函数。

e函数里可以看到body即为tcp数据,经过body = EncryptUtils.encryptMessage(body);加密,跟进encryptMessage函数。


最终发现为DES(DES/ECB/pkcs5padding)加密,加密key由getUserIdKey生成。


再次发起Frida魔法攻击。



未加密的数据结构为protobuf。


result结果即为TCP data。

解密后就可以拿到聊天内容,发送方昵称,发送时间等信息。


转自:网络安全与取证研究

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存