在native code中使用多線程好處多多,但是Android的bionic並沒有完全實現標准POSIX線程庫的所有API,例如pthread_cancel()。但是google這樣做肯定有原因,被cancel的thread不一定已經把自己擁有的資源釋放掉,因此很可能帶來內存洩露,鎖沒有釋放等問題。這些問題在移動設備上更加突出。
首先介紹一個指標的方法,使用signal替代cancel調用:
當worker thread超時時,在主線程(或者是監視進程)中調用
- if ( (status = pthread_kill(pthread_id, SIGUSR1)) != 0)
- {
- printf("Error cancelling thread %d, error = %d (%s)", pthread_id, status, strerror status));
- }
在worker thread中加入對SIGUSR1信號的處理
- struct sigaction actions;
- memset(&actions, 0, sizeof(actions));
- sigemptyset(&actions.sa_mask);
- actions.sa_flags = 0;
- actions.sa_handler = thread_exit_handler;
- rc = sigaction(SIGUSR1,&actions,NULL);
- void thread_exit_handler(int sig)
- {
- printf("this signal is %d \n", sig);
- pthread_exit(0);
- }
最根本的解決方法是重寫worker thread,使用poll或者select等處理IO操作防止stuck的發生,下面是Android源碼system/libsysutils/src/SocketListener.cpp的處理方法
1,創建worker thread前先創建通訊管道
- if (pipe(mCtrlPipe)) {
- SLOGE("pipe failed (%s)", strerror(errno));
- return -1;
- }
-
- if (pthread_create(&mThread, NULL, SocketListener::threadStart, this)) {
- SLOGE("pthread_create (%s)", strerror(errno));
- return -1;
- }
2,在worker thread的大循環中使用select同時監控管道和IO fd
- while(1){ // 一般工作進程都帶一個大循環
- FD_SET(mCtrlPipe[0], &read_fds);
- if (mCtrlPipe[0] > max)
- max = mCtrlPipe[0];
- if ((rc = select(max + 1, &read_fds, NULL, NULL, NULL)) < 0) {
- SLOGE("select failed (%s)", strerror(errno));
- sleep(1);
- continue;
- } else if (!rc)
- continue;
-
- // 有人喊停了
- if (FD_ISSET(mCtrlPipe[0], &read_fds))
- break;
- }
3,需要退出時通過管道通知worker thread
- if (write(mCtrlPipe[1], &c, 1) != 1) {
- SLOGE("Error writing to control pipe (%s)", strerror(errno));
- return -1;
- }