Linux线程的创建、退出、线程池

线程简介

        Linux 中的线程是指轻量级的执行单元,相比于进程,具有以下特点:

        进程(Process)是正在执行的程序的实例。每个进程都有自己的地址空间、代码段、数据段和打开的文件描述符等资源。线程(Thread)是进程内的一个执行单元,它共享相同的地址空间和其他资源,包括文件描述符、信号处理等,但每个线程都有自己的栈空间。

        由于共享地址空间和数据段,同一进程的多线程之间进行数据交换比进程间通信方便很多,但也由此带来线程同步问题。

        同一进程的多线程共享大部分资源,除了每个线程独立的栈空间。这代表线程的创建、销毁、切换要比进程的创建、销毁、切换的资源消耗小很多,所以多线程比多进程更适合高并发。

线程的创建

        线程通过唯一的ID来区分不同的线程,描述线程ID的数据类型为pthread_t,实际为无符号长整数型。

        ttypedef unsigned long int pthread_t;

        线程创建函数pthread_create的函数原型如下,

        int pthread_create(pthread_t *thread, const pthread_attr_t *attr,void *(*start_routine)(void *), void *arg);

        作用是创建一个新线程

        pthread_t *thread: 指向线程标识符的指针,线程创建成功时,用于存储新创建线程的线程标识符

        const pthread_attr_t *attr: pthead_attr_t结构体,这个参数可以用来设置线程的属性,如优先级、栈大小等。如果不需要定制线程属性,可以传入 NULL,此时线程将采用默认属性。

        void *(*start_routine)(void *): 一个指向函数的指针,它定义了新线程开始执行时的入口点。这个函数必须接受一个 void * 类型的参数,并返回 void * 类型的结果

        void *arg: start_routine 函数的参数,可以是一个指向任意类型数据的指针

        return: int 线程创建结果,成功返回0,失败返回非0。

        线程函数的声明方式例如

        void *new_thread(void *argv)

        {

                

        }

        新建一个thread_create.c,写入以下内容

#include <stdio.h>
#include <pthread.h>
#include <stdlib.h>
#include <unistd.h>

#define handle_error(cmd,result)    \
        if(result < 0)              \
        {                           \
            perror(cmd);            \
            exit(EXIT_FAILURE);     \
        }                           \

char *buf1 = "hello csdn";
char *buf2 = "hello world";

void *thread1(void *argv)
{
    printf("%s\n",buf1);
}

void *thread2(void *argv)
{
    printf("%s\n",buf2);
}

int main(int argc, char const *argv[])
{
    pthread_t pthread1_id;
    pthread_t pthread2_id;

    int tmp = 0;

    tmp = pthread_create(&pthread1_id,NULL,thread1,NULL);
    handle_error("thread_create",tmp)

    tmp = pthread_create(&pthread2_id,NULL,thread2,NULL);
    handle_error("thread_create",tmp)

    pthread_join(pthread1_id,NULL);
    pthread_join(pthread2_id,NULL);

    return 0;
}

         pthread_join有等待指定线程停止的功能。运行结果如下

线程的退出与销毁

        线程的退出有以下几种方法:

        线程函数内部执行return语句;不推荐使用,因为不会执行清理等操作

        线程函数内部调用pthread_exit函数;

        其他线程调用pthread_cancel函数。

pthread_exit函数

        函数原型为void pthread_exit(void *retval);

        作用是结束关闭调用该方法的线程,并返回一个内存指针用于存放结果

        void *retval: 要返回给其它线程的数据

        当某个线程调用pthread_exit方法后,该线程会被关闭(相当于return)。线程可以通过retval向其它线程传递信息,retval指向的区域不可以放在线程函数的栈内,所以定义指针之后,要用malloc申请空间,malloc申请的空间在堆中(防止悬垂指针)。其他线程(例如主线程)如果需要获得这个返回值,需要调用pthread_join方法。

pthread_join函数

        函数原型为int pthread_join(pthread_t thread, void **retval);

        作用是等待指定线程结束,获取目标线程的返回值,并在目标线程结束后回收它的资源,如果线程是使用exit结束的,就可以决定返回什么,如果是自然结束或者被cancel掉的,则会返回线程是否取消成功的宏定义

        pthread_t thread: 指定线程ID

        void **retval: 这是一个可选参数,用于接收线程结束后传递的返回值。如果非空,pthread_join 会在成功时将线程的 exit status 复制到 *retval 所指向的内存位置。如果线程没有显式地通过 pthread_exit 提供返回值,则该参数将被设为 NULL 或忽略

        return: int 成功 0失败 1

        pthread_join会阻塞当前线程,直到等待的线程结束之后才会继续进行,如果线程被取消成功,则retval == PTHREAD_CANCELED。

pthread_detach函数

        函数原型为int pthread_detach(pthread_t thread);

        作用是将线程标记为detached状态。POSIX线程终止后,如果没有调用pthread_detach或pthread_join,其资源会继续占用内存,类似于僵尸进程的未回收状态。默认情况下创建线程后,它处于可join状态,此时可以调用pthread_join等待线程终止并回收资源。但是如果主线程不需要等待线程终止,可以将其标记为detached状态,这意味着线程终止后,其资源会自动被系统回收。

        thread 线程ID

        return int 成功返回0,失败返回错误码

        pthread_detach不会阻塞当前线程,等要等待的线程结束之后会自动将其回收。

pthread_cancel函数

        函数原型为int pthread_cancel(pthread_t thread);

        作用是向目标线程发送取消请求。目标线程是否和何时响应取决于它的取消状态和类型

        取消状态(Cancelability State):可以是enabled(默认)或disabled。如果取消状态为禁用,则取消请求会被挂起,直至线程启用取消功能。如果取消状态为启用,则线程的取消类型决定它何时取消。

        取消类型(Cancelability Type):可以是asynchronous(异步)或deferred(被推迟,默认值)。

        asynchronous:意味着线程可能在任何时候被取消(通常立即被取消,但系统并不保证这一点)

        deferred:被推迟意味着取消请求会被挂起,直至被取消的线程执行取消点(cancellation point)函数时才会真正执行线程的取消操作。

        取消点函数:是在POSIX线程库中专门设计用于检查和处理取消请求的函数。当被取消的线程执行这些函数时,如果线程的取消状态是enabled且类型是deferred,则它会立即响应取消请求并终止执行。

         创建线程的时候,设置一般都是NULL,采取默认的设置,上述总结就是,cancel发送取消命令后,被取消的线程执行到取消点函数时才执行取消操作

        thread 目标线程,即被取消的线程

        return int 成功返回0,失败返回非零的错误码

        需要注意的是,取消操作和pthread_cancel函数的调用是异步的,这个函数的返回值只能告诉调用者取消请求是否成功发送。当线程被成功取消后,通过pthread_join和线程关联将会获得PTHREAD_CANCELED作为返回信息,这是判断取消是否完成的唯一方式。

        cancel只是发送取消的命令,命令发送成功就返回成功,而线程什么时候取消,是否被取消就要通过join获取返回信息来查询。

取消点函数

        上述提到当取消类型设置为deferred时,线程在执行到取消点函数时才会终止。这里的取消点函数并不是特指某一个函数,是线程中能够响应取消请求的特定函数或位置,是线程执行流程中的一个检查点,当线程运行到这些函数时,会检测是否有待处理的取消请求(例如通过线程取消函数 pthread_cancel 发送)。若存在请求,线程会终止并执行清理操作。可以理解为当程序挂起时,可以被取消的点,一般发生在阻塞时,例如read,write,open等函数都被视为取消点函数。还有一种显示取消点函数pthread_testcancel,这个函数的作用是在此处显示插入取消点,也就是在此处响应取消请求。

pthread_setcancelstate函数

        函数原型为int pthread_setcancelstate(int state, int *oldstate);

        作用是设置调用线程的取消状态,需要在要设置的线程里执行

        PTHREAD_CANCEL_ENABLE:启用取消功能

        PTHREAD_CANCEL_DISABLE:禁用取消功能

        state 目标状态

        oldstate 指针,用于返回历史状态

        return int 成功返回0,失败返回非零错误码

pthread_setcanceltype函数

        函数原型为int pthread_setcanceltype(int type, int *oldtype);

        作用是设置调用线程的取消类型,需要在要设置的线程里执行

        PTHREAD_CANCEL_DEFERRED:设置取消类型为推迟

        PTHREAD_CANCEL_ASYNCHRONOUS:设置取消类型为异步

        type 目标类型

        oldtype 指针,用于接收历史类型,不需要可以填NULL

        return int 成功返回0,失败返回非零错误码

例程展示

线程自然结束

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <pthread.h>

void *pthread_test(void *argv)
{
    sleep(1);
    printf("test线程休眠了1s,马上结束\n");
}

int main(int argc, char const *argv[])
{

    pthread_t test_id;

    pthread_create(&test_id,NULL,pthread_test,NULL);

    printf("等待线程%ld结束\n",test_id);

    pthread_join(test_id,NULL);

    printf("等待到了线程%ld结束\n",test_id);
    
    return 0;
}

        主线程等待测试线程结束之后再结束

        运行结果如下

主线程pthread_detach函数

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <pthread.h>

void *thread_test(void *argv)
{
    pthread_t test_id;
    test_id = *((pthread_t *)argv);
    printf("进入%ld线程\n",test_id);
    sleep(1);
    printf("休眠1s\n");
    sleep(1);
    printf("休眠2s\n");
}

int main(int argc, char const *argv[])
{
    pthread_t test_id;

    pthread_create(&test_id,NULL,thread_test,(void *)&test_id);

    sleep(1);

    pthread_detach(test_id);

    return 0;
}

运行结果如下

         主线程调用pthread_detach函数后不会等待线程结束,而是立即返回,这样主线程就会早于子线程结束,子线程会被强制终止,结合上述例程来看就是子线程不会打印后两句的内容。

线程自身调用thread_exit函数 

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <pthread.h>

void *pthread_test(void *argv)
{
    sleep(1);
    printf("test线程休眠了1s\n");

    pthread_exit(NULL);

    sleep(1);
    printf("test线程又休眠了1s\n");//之前已经调用了exit函数,此处不会执行
}

int main(int argc, char const *argv[])
{

    pthread_t test_id;

    pthread_create(&test_id,NULL,pthread_test,NULL);

    printf("等待线程%ld结束\n",test_id);

    pthread_join(test_id,NULL);

    printf("等待到了线程%ld结束\n",test_id);
    
    return 0;
}

        运行结果如下,除了线程ID不同,其余和上个例程相同

 其他线程调用pthread_cancel函数

        线程创建采取默认配置,即响应取消请求,取消类型为延迟取消,当执行到取消点函数时终止。需要设置其余状态可以在创建线程时更改,或者在线程中调用pthread_setcancelstate和pthread_setcanceltype

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <pthread.h>

void *thread_test(void *argv)
{
    pthread_t test_id;
    test_id = *((pthread_t *)argv);
    printf("进入%ld线程\n",test_id);
    sleep(2);
    printf("%ld线程结束\n",test_id);
}

int main(int argc, char const *argv[])
{
    pthread_t test_id;

    pthread_create(&test_id,NULL,thread_test,(void *)&test_id);

    sleep(1);

    pthread_cancel(test_id);
    //防止因为主线程结束而强制结束子线程
    pthread_join(test_id,NULL);

    return 0;
}

        运行结果如下

         可以看到只打印了进入线程,没有打印线程结束,是因为主线程沉睡一秒之后调用取消函数,此时子线程正在执行sleep函数,sleep被视为取消点函数,线程终止。

线程池

        线程池是一种用于管理和重用多个线程的设计模式。它通过维护一个线程池(线程的集合),可以有效地处理并发任务而无需每次都创建和销毁线程。这种方法可以减少线程创建和销毁的开销,提高性能和资源利用率。

        线程池的使用主要包含以下几个步骤:

        线程池创建:首先创建一个线程池,指定任务函数和其他参数。线程池会创建一定数量的线程,这些线程进入等待状态,准备执行任务,或在提交任务后才创建线程(取决于配置)。线程池中的所有任务执行的都是同一个任务函数。

        任务队列:线程池维护一个任务队列。当我们向线程池提交任务时,任务会被放入这个队列中。实际上,放入任务队列的是我们在提交任务时传递的任务数据。

        线程执行任务:线程池中的线程从任务队列中取出任务数据,然后调用任务函数,执行任务。执行完成后,线程不会退出,而是继续从任务队列中取下一个任务执行。如果没有待执行的任务,线程通常在等待一段时间后被回收(取决于具体的配置)。

g_thread_pool_new函数

        函数原型为

GThreadPool *g_thread_pool_new(

    GFunc func,

    gpointer user_data,

    gint max_threads,

    gboolean exclusive,

    GError **error);

        作用是创建新的线程池

        func 池中线程执行的函数

        user_data 传递给func的数据,可以为NULL,这里的user_data最终会被存储在GThreadPool结构体的user_data属性中, user_data 是在创建线程池时传入的共享数据,对于每个任务都是一样的

        max_threads 线程池容量,即当前线程池中可以同时运行的线程数。-1表示没有限制

        exclusive 独占标记位。决定当前的线程池独占所有的线程还是与其它线程池共享这些线程。取值可以是TRUE或FALSE

        TRUE:立即启动数量为max_threads的线程,且启动的线程只能被当前线程池使用

        FALSE:只有在需要时,即需要执行任务时才创建线程,且线程可以被多个非独享资源的线程池共用

        error 用于报告错误信息,可以是NULL,表示忽略错误

        return GThreadPool* 线程池实例指针。无论是否发生错误,都会返回有效的线程池

g_thread_pool_push函数

        函数原型为

gboolean g_thread_pool_push(

    GThreadPool *pool,

    gpointer data,

    GError **error);

        作用是向pool指向的线程池实例添加数据,这一行为实际上会向任务队列添加新的任务。当存在可用线程时任务立即执行,否则任务数据会一直待在队列中,直至腾出可用线程执行任务

        pool 指向线程池实例的指针

        data 传递给每个任务的独享数据,不同于user_data

        error 错误信息

        return gboolean 成功返回TRUE,失败返回FALSE

g_thread_pool_free函数

        函数原型为

void g_thread_pool_free (

  GThreadPool* pool,

  gboolean immediate,

  gboolean wait_

);

        作用是释放为pool指向的线程池分配的所有资源

        pool 线程池指针

        immediate 是否立即释放线程池

        TRUE:立即释放所有资源,未处理的数据不被处理

        FALSE:在最后一个任务执行完毕之前,线程池不会被释放

        需要注意的是:执行任务时,线程池的任何一个线程都不会被打断。无论这个参数是何取值,都可以保证至少线程池释放前正在运行的线程可以完成它们的任务。

        wait_ 当前函数是否阻塞等待所有任务完成

        TRUE:所有需要处理的任务执行完毕当前函数才会返回

        FALSE:当前函数立即返回

线程池中线程函数的格式

void task_func(gpointer data, gpointer user_data) 

{

        

}

示例程序

        本次程序的思路是,定义一个任务函数,执行+1的操作,通过线程池维护5个线程,像其中push20个数据,也就是累加20次,最终结果为20

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <pthread.h>
#include <glib-2.0/glib.h>

int *data;

void plus_one(gpointer data,gpointer user_data)
{
    int *tmp;
    tmp = (int *)data;

    (*tmp)++;
    printf("线程执行完毕,本次data为:%d\n",*tmp);
}

int main(int argc, char const *argv[])
{
    GThreadPool *pool;

    //定义一个新的线程池,最大数量为5,独享
    pool = g_thread_pool_new(plus_one,NULL,5,TRUE,NULL);

    data = malloc(sizeof(int));
    (*data) = 0;

    for (int i = 0; i < 20; i++)
    {
        //向线程池中push数据,也就代表着启动了一个新的线程
        g_thread_pool_push(pool,data,NULL);
    }
    //释放线程池,不立即释放,等待线程执行完毕再释放,阻塞等待所有线程完成
    g_thread_pool_free(pool,FALSE,TRUE);

    printf("最终的data:%d\n",*data);

    free(data);
    
    return 0;
}

         可以看到线程的执行顺序并不是固定的,并不是简单的谁先创建谁就执行,而且多个线程被分配到了不同的处理器核心执行,属于并发执行。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值