Linux线程的创建、退出、线程池

数完星星数月亮

已于 2025-05-27 17:49:57 修改

阅读量881

点赞数 22

CC 4.0 BY-SA版权

文章标签： c语言 linux

于 2025-05-21 13:35:53 首次发布

本文链接：https://blog.csdn.net/2302_77530416/article/details/148098895

线程简介

Linux 中的线程是指轻量级的执行单元，相比于进程，具有以下特点：

进程（Process）是正在执行的程序的实例。每个进程都有自己的地址空间、代码段、数据段和打开的文件描述符等资源。线程（Thread）是进程内的一个执行单元，它共享相同的地址空间和其他资源，包括文件描述符、信号处理等，但每个线程都有自己的栈空间。

由于共享地址空间和数据段，同一进程的多线程之间进行数据交换比进程间通信方便很多，但也由此带来线程同步问题。

同一进程的多线程共享大部分资源，除了每个线程独立的栈空间。这代表线程的创建、销毁、切换要比进程的创建、销毁、切换的资源消耗小很多，所以多线程比多进程更适合高并发。

线程的创建

线程通过唯一的ID来区分不同的线程，描述线程ID的数据类型为pthread_t，实际为无符号长整数型。

ttypedef unsigned long int pthread_t;

线程创建函数pthread_create的函数原型如下，

int pthread_create(pthread_t *thread, const pthread_attr_t *attr,void *(*start_routine)(void *), void *arg);

作用是创建一个新线程

pthread_t *thread: 指向线程标识符的指针,线程创建成功时,用于存储新创建线程的线程标识符

const pthread_attr_t *attr: pthead_attr_t结构体,这个参数可以用来设置线程的属性,如优先级、栈大小等。如果不需要定制线程属性,可以传入 NULL,此时线程将采用默认属性。

void *(*start_routine)(void *): 一个指向函数的指针,它定义了新线程开始执行时的入口点。这个函数必须接受一个 void * 类型的参数,并返回 void * 类型的结果

void *arg: start_routine 函数的参数,可以是一个指向任意类型数据的指针

return: int 线程创建结果，成功返回0，失败返回非0。

线程函数的声明方式例如

void *new_thread(void *argv)

{

}

新建一个thread_create.c，写入以下内容

#include <stdio.h>
#include <pthread.h>
#include <stdlib.h>
#include <unistd.h>

#define handle_error(cmd,result)    \
        if(result < 0)              \
        {                           \
            perror(cmd);            \
            exit(EXIT_FAILURE);     \
        }                           \

char *buf1 = "hello csdn";
char *buf2 = "hello world";

void *thread1(void *argv)
{
    printf("%s\n",buf1);
}

void *thread2(void *argv)
{
    printf("%s\n",buf2);
}

int main(int argc, char const *argv[])
{
    pthread_t pthread1_id;
    pthread_t pthread2_id;

    int tmp = 0;

    tmp = pthread_create(&pthread1_id,NULL,thread1,NULL);
    handle_error("thread_create",tmp)

    tmp = pthread_create(&pthread2_id,NULL,thread2,NULL);
    handle_error("thread_create",tmp)

    pthread_join(pthread1_id,NULL);
    pthread_join(pthread2_id,NULL);

    return 0;
}

pthread_join有等待指定线程停止的功能。运行结果如下

线程的退出与销毁

线程的退出有以下几种方法：

线程函数内部执行return语句；不推荐使用，因为不会执行清理等操作

线程函数内部调用pthread_exit函数；

其他线程调用pthread_cancel函数。

pthread_exit函数

函数原型为void pthread_exit(void *retval);

作用是结束关闭调用该方法的线程，并返回一个内存指针用于存放结果

void *retval: 要返回给其它线程的数据

当某个线程调用pthread_exit方法后，该线程会被关闭（相当于return）。线程可以通过retval向其它线程传递信息，retval指向的区域不可以放在线程函数的栈内，所以定义指针之后，要用malloc申请空间，malloc申请的空间在堆中（防止悬垂指针）。其他线程（例如主线程）如果需要获得这个返回值，需要调用pthread_join方法。

pthread_join函数

函数原型为int pthread_join(pthread_t thread, void **retval);

作用是等待指定线程结束，获取目标线程的返回值，并在目标线程结束后回收它的资源，如果线程是使用exit结束的，就可以决定返回什么，如果是自然结束或者被cancel掉的，则会返回线程是否取消成功的宏定义

pthread_t thread: 指定线程ID

void **retval: 这是一个可选参数，用于接收线程结束后传递的返回值。如果非空，pthread_join 会在成功时将线程的 exit status 复制到 *retval 所指向的内存位置。如果线程没有显式地通过 pthread_exit 提供返回值，则该参数将被设为 NULL 或忽略

return: int 成功 0失败 1

pthread_join会阻塞当前线程，直到等待的线程结束之后才会继续进行，如果线程被取消成功，则retval == PTHREAD_CANCELED。

pthread_detach函数

函数原型为int pthread_detach(pthread_t thread);

作用是将线程标记为detached状态。POSIX线程终止后，如果没有调用pthread_detach或pthread_join，其资源会继续占用内存，类似于僵尸进程的未回收状态。默认情况下创建线程后，它处于可join状态，此时可以调用pthread_join等待线程终止并回收资源。但是如果主线程不需要等待线程终止，可以将其标记为detached状态，这意味着线程终止后，其资源会自动被系统回收。

thread 线程ID

return int 成功返回0，失败返回错误码

pthread_detach不会阻塞当前线程，等要等待的线程结束之后会自动将其回收。

pthread_cancel函数

函数原型为int pthread_cancel(pthread_t thread);

作用是向目标线程发送取消请求。目标线程是否和何时响应取决于它的取消状态和类型

取消状态（Cancelability State）：可以是enabled（默认）或disabled。如果取消状态为禁用，则取消请求会被挂起，直至线程启用取消功能。如果取消状态为启用，则线程的取消类型决定它何时取消。

取消类型（Cancelability Type）：可以是asynchronous（异步）或deferred（被推迟，默认值）。

asynchronous：意味着线程可能在任何时候被取消（通常立即被取消，但系统并不保证这一点）

deferred：被推迟意味着取消请求会被挂起，直至被取消的线程执行取消点（cancellation point）函数时才会真正执行线程的取消操作。

取消点函数：是在POSIX线程库中专门设计用于检查和处理取消请求的函数。当被取消的线程执行这些函数时，如果线程的取消状态是enabled且类型是deferred，则它会立即响应取消请求并终止执行。

创建线程的时候，设置一般都是NULL，采取默认的设置，上述总结就是，cancel发送取消命令后，被取消的线程执行到取消点函数时才执行取消操作

thread 目标线程，即被取消的线程

return int 成功返回0，失败返回非零的错误码

需要注意的是，取消操作和pthread_cancel函数的调用是异步的，这个函数的返回值只能告诉调用者取消请求是否成功发送。当线程被成功取消后，通过pthread_join和线程关联将会获得PTHREAD_CANCELED作为返回信息，这是判断取消是否完成的唯一方式。

cancel只是发送取消的命令，命令发送成功就返回成功，而线程什么时候取消，是否被取消就要通过join获取返回信息来查询。

取消点函数

上述提到当取消类型设置为deferred时，线程在执行到取消点函数时才会终止。这里的取消点函数并不是特指某一个函数，是线程中能够响应取消请求的特定函数或位置，是线程执行流程中的一个检查点，当线程运行到这些函数时，会检测是否有待处理的取消请求（例如通过线程取消函数 pthread_cancel 发送）。若存在请求，线程会终止并执行清理操作。可以理解为当程序挂起时，可以被取消的点，一般发生在阻塞时，例如read，write，open等函数都被视为取消点函数。还有一种显示取消点函数pthread_testcancel，这个函数的作用是在此处显示插入取消点，也就是在此处响应取消请求。

pthread_setcancelstate函数

函数原型为int pthread_setcancelstate(int state, int *oldstate);

作用是设置调用线程的取消状态，需要在要设置的线程里执行

PTHREAD_CANCEL_ENABLE：启用取消功能

PTHREAD_CANCEL_DISABLE：禁用取消功能

state 目标状态

oldstate 指针，用于返回历史状态

return int 成功返回0，失败返回非零错误码

pthread_setcanceltype函数

函数原型为int pthread_setcanceltype(int type, int *oldtype);

作用是设置调用线程的取消类型，需要在要设置的线程里执行

PTHREAD_CANCEL_DEFERRED：设置取消类型为推迟

PTHREAD_CANCEL_ASYNCHRONOUS：设置取消类型为异步

type 目标类型

oldtype 指针，用于接收历史类型，不需要可以填NULL

return int 成功返回0，失败返回非零错误码

例程展示

线程自然结束

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <pthread.h>

void *pthread_test(void *argv)
{
    sleep(1);
    printf("test线程休眠了1s，马上结束\n");
}

int main(int argc, char const *argv[])
{

    pthread_t test_id;

    pthread_create(&test_id,NULL,pthread_test,NULL);

    printf("等待线程%ld结束\n",test_id);

    pthread_join(test_id,NULL);

    printf("等待到了线程%ld结束\n",test_id);
    
    return 0;
}

主线程等待测试线程结束之后再结束

运行结果如下

主线程pthread_detach函数

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <pthread.h>

void *thread_test(void *argv)
{
    pthread_t test_id;
    test_id = *((pthread_t *)argv);
    printf("进入%ld线程\n",test_id);
    sleep(1);
    printf("休眠1s\n");
    sleep(1);
    printf("休眠2s\n");
}

int main(int argc, char const *argv[])
{
    pthread_t test_id;

    pthread_create(&test_id,NULL,thread_test,(void *)&test_id);

    sleep(1);

    pthread_detach(test_id);

    return 0;
}

运行结果如下

主线程调用pthread_detach函数后不会等待线程结束，而是立即返回，这样主线程就会早于子线程结束，子线程会被强制终止，结合上述例程来看就是子线程不会打印后两句的内容。

线程自身调用thread_exit函数

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <pthread.h>

void *pthread_test(void *argv)
{
    sleep(1);
    printf("test线程休眠了1s\n");

    pthread_exit(NULL);

    sleep(1);
    printf("test线程又休眠了1s\n");//之前已经调用了exit函数，此处不会执行
}

int main(int argc, char const *argv[])
{

    pthread_t test_id;

    pthread_create(&test_id,NULL,pthread_test,NULL);

    printf("等待线程%ld结束\n",test_id);

    pthread_join(test_id,NULL);

    printf("等待到了线程%ld结束\n",test_id);
    
    return 0;
}

运行结果如下，除了线程ID不同，其余和上个例程相同

其他线程调用pthread_cancel函数

线程创建采取默认配置，即响应取消请求，取消类型为延迟取消，当执行到取消点函数时终止。需要设置其余状态可以在创建线程时更改，或者在线程中调用pthread_setcancelstate和pthread_setcanceltype

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <pthread.h>

void *thread_test(void *argv)
{
    pthread_t test_id;
    test_id = *((pthread_t *)argv);
    printf("进入%ld线程\n",test_id);
    sleep(2);
    printf("%ld线程结束\n",test_id);
}

int main(int argc, char const *argv[])
{
    pthread_t test_id;

    pthread_create(&test_id,NULL,thread_test,(void *)&test_id);

    sleep(1);

    pthread_cancel(test_id);
    //防止因为主线程结束而强制结束子线程
    pthread_join(test_id,NULL);

    return 0;
}

运行结果如下

可以看到只打印了进入线程，没有打印线程结束，是因为主线程沉睡一秒之后调用取消函数，此时子线程正在执行sleep函数，sleep被视为取消点函数，线程终止。

线程池

线程池是一种用于管理和重用多个线程的设计模式。它通过维护一个线程池（线程的集合），可以有效地处理并发任务而无需每次都创建和销毁线程。这种方法可以减少线程创建和销毁的开销，提高性能和资源利用率。

线程池的使用主要包含以下几个步骤：

线程池创建：首先创建一个线程池，指定任务函数和其他参数。线程池会创建一定数量的线程，这些线程进入等待状态，准备执行任务，或在提交任务后才创建线程（取决于配置）。线程池中的所有任务执行的都是同一个任务函数。

任务队列：线程池维护一个任务队列。当我们向线程池提交任务时，任务会被放入这个队列中。实际上，放入任务队列的是我们在提交任务时传递的任务数据。

线程执行任务：线程池中的线程从任务队列中取出任务数据，然后调用任务函数，执行任务。执行完成后，线程不会退出，而是继续从任务队列中取下一个任务执行。如果没有待执行的任务，线程通常在等待一段时间后被回收（取决于具体的配置）。

g_thread_pool_new函数

函数原型为

GThreadPool *g_thread_pool_new(

GFunc func,

gpointer user_data,

gint max_threads,

gboolean exclusive,

GError **error);

作用是创建新的线程池

func 池中线程执行的函数

user_data 传递给func的数据，可以为NULL，这里的user_data最终会被存储在GThreadPool结构体的user_data属性中， user_data 是在创建线程池时传入的共享数据，对于每个任务都是一样的

max_threads 线程池容量，即当前线程池中可以同时运行的线程数。-1表示没有限制

exclusive 独占标记位。决定当前的线程池独占所有的线程还是与其它线程池共享这些线程。取值可以是TRUE或FALSE

TRUE：立即启动数量为max_threads的线程，且启动的线程只能被当前线程池使用

FALSE：只有在需要时，即需要执行任务时才创建线程，且线程可以被多个非独享资源的线程池共用

error 用于报告错误信息，可以是NULL，表示忽略错误

return GThreadPool* 线程池实例指针。无论是否发生错误，都会返回有效的线程池

g_thread_pool_push函数

函数原型为

gboolean g_thread_pool_push(

GThreadPool *pool,

gpointer data,

GError **error);

作用是向pool指向的线程池实例添加数据，这一行为实际上会向任务队列添加新的任务。当存在可用线程时任务立即执行，否则任务数据会一直待在队列中，直至腾出可用线程执行任务

pool 指向线程池实例的指针

data 传递给每个任务的独享数据，不同于user_data

error 错误信息

return gboolean 成功返回TRUE，失败返回FALSE

g_thread_pool_free函数

函数原型为

void g_thread_pool_free (

GThreadPool* pool,

gboolean immediate,

gboolean wait_

);

作用是释放为pool指向的线程池分配的所有资源

pool 线程池指针

immediate 是否立即释放线程池

TRUE：立即释放所有资源，未处理的数据不被处理

FALSE：在最后一个任务执行完毕之前，线程池不会被释放

需要注意的是：执行任务时，线程池的任何一个线程都不会被打断。无论这个参数是何取值，都可以保证至少线程池释放前正在运行的线程可以完成它们的任务。

wait_ 当前函数是否阻塞等待所有任务完成

TRUE：所有需要处理的任务执行完毕当前函数才会返回

FALSE：当前函数立即返回

线程池中线程函数的格式

void task_func(gpointer data, gpointer user_data)

{

}

示例程序

本次程序的思路是，定义一个任务函数，执行+1的操作，通过线程池维护5个线程，像其中push20个数据，也就是累加20次，最终结果为20

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <pthread.h>
#include <glib-2.0/glib.h>

int *data;

void plus_one(gpointer data,gpointer user_data)
{
    int *tmp;
    tmp = (int *)data;

    (*tmp)++;
    printf("线程执行完毕，本次data为:%d\n",*tmp);
}

int main(int argc, char const *argv[])
{
    GThreadPool *pool;

    //定义一个新的线程池，最大数量为5,独享
    pool = g_thread_pool_new(plus_one,NULL,5,TRUE,NULL);

    data = malloc(sizeof(int));
    (*data) = 0;

    for (int i = 0; i < 20; i++)
    {
        //向线程池中push数据，也就代表着启动了一个新的线程
        g_thread_pool_push(pool,data,NULL);
    }
    //释放线程池，不立即释放，等待线程执行完毕再释放，阻塞等待所有线程完成
    g_thread_pool_free(pool,FALSE,TRUE);

    printf("最终的data:%d\n",*data);

    free(data);
    
    return 0;
}