今天继续昨天,一鼓作气,争取这个礼拜全部写完。
上一篇文章留了一个别人的github链接,他里面的native保活实现方案也是大多数公司采用的方案。
我们先来讲一下他的方案。
他是首先开启一个c进程,将需要保活的service名字传递进去
然后定时给自己主进程发一个intent,如果主进程挂掉了,就可以顺利拉起来保证存活。
所以他只是一个没有主动权的消息轮询器,说是守护其实很勉强
而且,这是要建立在保证c进程不挂的基础上,才能轮询,但是就目前来看,只有5.0以下的非国产机才会有这样的漏洞。也就是说在force close的时候,系统忽略c进程的存在,5.0以上包括5.0的哪怕源生系统也会连同c进程一起清理掉,国产机就更不用说了。就算是这样,在5.0以下的非国产机上,如果安装了获取root权限的360\cm的话,也是可以直接清理掉,也就是说会失效。
而且他不但不算守护,而且还是单向的,也就是说只能a保b,b保不了a;a保b也不是在b死了立刻拉起来,要等到了时间才会去拉。
最后,就算把刚才说的都排除掉,在很少的一部分手机,也就是低端且没有安装安全软件的手机上,他仍然无法保证时时存活。
技术关键点:开启native子进程,定时发intent
结论:单杀可以杀死,force close 5.0以上无效,5.0以下部分手机无效,第三方软件下无效,且无法保证实时常驻
好了,那么怎样才是双向的守护进程呢?
第一,如果a守护b,则b挂掉的一瞬间,a就应该把b启动起来
第二,a和b应该是互相守护,无论谁挂掉,对方就把他拉起来
那么怎么样才能实现双向守护呢?
首先我们想到的是fork这个函数,他会创建一个子进程,然后在父进程中调用waitpid()这个函数,这是一个阻塞函数,他会一直wait到子进程挂掉,才会继续向下执行,利用这个机制,我们可以在主进程的c层fork一个子进程,然后父进程就可以监听到子进程的死亡,死亡的时候再重启子进程。
似乎可以用这个机制改进刚刚上面分析的那个工程,因为这样的话:1,无法直接杀掉子进程。2、子进程不死,他就会按时发intent给父进程。
这样做,普通杀是没有问题。但是force close不会按照你的要求先杀孩子,等你把孩子启动起来,再杀父亲,然后坐视子进程在那不管,三方软件自不必说。那么先杀父进程的话,子进程就没办法监听到父进程的死亡吗?
有朋友要说可以利用linux的进程领养机制,如果父进程挂掉,那么子进程就会被linux的init进程领养,进程所对应的父进程id也会变成1。这的确是一个很好的标示,但是要怎样监听这个状态的变化呢?轮询获取父进程id,然后判断是否等于1?那么轮询的间隔为多少合适?1秒间隔算短算长?设为1秒的话force close掉你的时候,根本不会等到你那每秒正时正点的轮询点上,会被forceclose直接干掉,我试过更短的时间,基本要小到小于10毫秒的时间间隔,才有可能再force close的时候检测到,并成功拉起父进程。注意我的关键词,小于10毫秒!才可能!对,一秒100次的检查,才有可能,只是可能!手机待机十分钟就已经可以开始烫手,三个小时电池发出了低电量警告。代码:
(代码已经不在工程里面了,工程里的代码删除了好多,做过无数试验)
技术关键点:fork子进程 ,waitpid监听子进程 ,通过linux进程领养机制监听父进程
结论:保证单杀存活,保活效果与耗电成正比,得不偿失(5.0以上无效)
好,我们继续。
waitpid是阻塞函数,所以他一定是没有耗电问题的,即时性也没有问题。那么问题就集中在了子进程如何监听到父进程的死亡上面,把那个轮询替掉。
然后,我想到的是管道,linux中有多种ipc通信机制,管道是最基本的一种通信方式,且这种管道只能在父子进程间建立,于是我想是否能利用这个机制呢?在父子进程间建立管道,但是并不写入数据,只是使用阻塞方法在另一端去读取管道,这样如果对方进程挂掉,管道会被破坏,那么另一端的读取方法就会执行返回,由此确定对方挂掉然后重启对方。
代码:
这做样确实解决了耗电问题,父子进程两端的监听都是阻塞方法,耗电基本可以忽略不记,也基本实现双向守护。(以上代码不在项目工程里)
但是问题又来了
1、用ps命令发现fork出来的进程内存占用很大
2、fork出来的进程名字与父进程名字相同
原因:
1、fork函数调用的时候,会复制父进程的全部内存,因为父进程一定是我们需要保证常驻的java进程,他在初始化的时候是fork的一个zygote进程,即时在应用刚初始化的时候fork,进程里面是有一个java虚拟机的内存在里面的,最少一二十兆是有了。fork出来子进程多的内存最后都会算到我们自己应用的内存中。
2、机制如此
技术关键点:fork子进程 ,waitpid监听子进程, 管道pipe监听父进程
结论:保证双向守护,无耗电问题,fork出来的进程名字与父进程同名用户体验不好,而且有内存浪费(5.0以上无效)
===============分割线===================
我们继续讨论内存的问题,如何不用fork也能建立管道呢。于是我想到了运行一个二进制可执行文件,这样他是一个相对独立的进程,但是又可以建立父子进程之间的管道。将真正用来实现的子进程写到一个二进制文件中(对应文件源码/MarsDaemon/LibMarsdaemon/jni/daemon.c),这样既解决了内存问题,又可以自己给新的进程命名。
问题解决了吗?没有,直接execute一个binary文件之后
1、发现代码不再继续向下执行
2、waitpid又不能用了
原因和解决方法:
1、直接运行一个二进制文件,他会占用原进程,于是我们这里仅将fork用作一个启动binary的工具,fork终于回归到了Linus希望他作用的地方
2、父子进程间的管道是单向的,于是我们可以建两根管道。ab两个进程,建12两个管道。a进程关掉管道1的写端,堵瑟调用管道2的读取方法;b进程关掉管道2的写端,堵瑟调用管道1的读取方法。这样就可以实现双向监听。任何一方监听到对方死掉就作出相应的动作,启动对方。至此,完全摒弃开始的fork方案。
代码:
此为最终方案,代码见下
技术关键点:双管道互相监听
结论:保证双向守护,无耗电问题,无内存问题,进程名自定义(5.0以上无效)
好了,这就是我5.0以下的最终解决方案
下面讲一下代码
二进制文件存放在assets下面,程序第一次启动的时候会将他拷贝到手机项目/data/data/...下,然后
源码/MarsDaemon/LibMarsdaemon/src/main/java/com/marswin89/marsdaemon/strategy/DaemonStrategyUnder21.java
load对应c库,执行代码
源码/MarsDaemon/LibMarsdaemon/jni/daemon_api20.c
1、将对应的packagename,servicename以及二进制可执行文件的路径传进来
2、清理僵尸进程,就像最开始讲的,低端手机会忽略c进程,如果我们恰巧运行在低端手机上,那么c进程得不到释放会越来越多,我们称他为僵尸进程,需要清理一下
3、建立两条管道
4、执行二进制文件,将上面的参数传递进去
5、然后关掉自己管道1的写端和管道2的读端,然后阻塞读取管道1,如果读取到,则代表子进程挂掉
再来看二进制可执行文件的代码
源码/MarsDaemon/LibMarsdaemon/jni/daemon.c
二进制文件在程序启动起来的时候,将参数解析出来
关掉管道1的读端和管道2的写端,然后调用管道2的阻塞读取方法,如果执行过去,说明父进程死掉
这里用fork是为了让他的父进程id好看一些,别无他意
监听到之后的策略看下面。
================分割线==================
然后说一下监听到对方进程死后的策略
你会说谁监听到对方死了,就直接拉起来就好了呀。
问题:
1、重新拉起来要重新建立双管道,子进程挂掉,父进程把他重启起来建立双管道还好说,如果父进程挂掉,子进程把父进程启动起来,他们之间就无法建立连接,而且如果中间出了差错,同步起来很费劲,于是我选择,无论谁监听到谁死了,都重启对方,然后自杀,重新初始化!
2、如果执行force close, 系统先杀父进程,子进程监听到之后拉起父进程然后自杀,但是系统杀你两个进程的间隔时间非常非常短,父进程刚起来还没来得及初始化,系统赶过来杀父进程。有的手机强杀之后很短一段时间无法拉起父进程。于是我选择用第三个进程。
第三个进程和之前的父子进程都没有任何关系,他的作用只是用做拉起常驻进程。父子进程无论谁监听到谁死,都拉起第三个进程,第三个进程负责拉起常驻进程,然后自杀。(用户实际上是看不到他的存在的,因为他可能只存活不到一秒就自杀了)
代码
/MarsDaemon/LibMarsdaemon/src/main/java/com/marswin89/marsdaemon/strategy/DaemonStrategyUnder21.java
在常驻进程初始化的时候,初始化一个alarm,保存在内存中,以便以后使用
监听到子进程死了时候使用闹钟拉起第三个进程,二进制文件监听到父进程死掉,直接用c代码发intent,见上面c代码
第三进程启动起来,就是负责把常驻进程拉起来,然后自杀掉。
=================分割线=================
好了,这只是5.0以下的策略,5.0以上,以及6.0都不好用
下面我们开始分析5.0+的策略