线程简介
Linux 中的线程是指轻量级的执行单元,相比于进程,具有以下特点:
进程(Process)是正在执行的程序的实例。每个进程都有自己的地址空间、代码段、数据段和打开的文件描述符等资源。线程(Thread)是进程内的一个执行单元,它共享相同的地址空间和其他资源,包括文件描述符、信号处理等,但每个线程都有自己的栈空间。
由于共享地址空间和数据段,同一进程的多线程之间进行数据交换比进程间通信方便很多,但也由此带来线程同步问题。
同一进程的多线程共享大部分资源,除了每个线程独立的栈空间。这代表线程的创建、销毁、切换要比进程的创建、销毁、切换的资源消耗小很多,所以多线程比多进程更适合高并发。
线程的创建
线程通过唯一的ID来区分不同的线程,描述线程ID的数据类型为pthread_t,实际为无符号长整数型。
ttypedef unsigned long int pthread_t;
线程创建函数pthread_create的函数原型如下,
int pthread_create(pthread_t *thread, const pthread_attr_t *attr,void *(*start_routine)(void *), void *arg);
作用是创建一个新线程
pthread_t *thread: 指向线程标识符的指针,线程创建成功时,用于存储新创建线程的线程标识符
const pthread_attr_t *attr: pthead_attr_t结构体,这个参数可以用来设置线程的属性,如优先级、栈大小等。如果不需要定制线程属性,可以传入 NULL,此时线程将采用默认属性。
void *(*start_routine)(void *): 一个指向函数的指针,它定义了新线程开始执行时的入口点。这个函数必须接受一个 void * 类型的参数,并返回 void * 类型的结果
void *arg: start_routine 函数的参数,可以是一个指向任意类型数据的指针
return: int 线程创建结果,成功返回0,失败返回非0。
线程函数的声明方式例如
void *new_thread(void *argv)
{
}
新建一个thread_create.c,写入以下内容
#include <stdio.h>
#include <pthread.h>
#include <stdlib.h>
#include <unistd.h>
#define handle_error(cmd,result) \
if(result < 0) \
{ \
perror(cmd); \
exit(EXIT_FAILURE); \
} \
char *buf1 = "hello csdn";
char *buf2 = "hello world";
void *thread1(void *argv)
{
printf("%s\n",buf1);
}
void *thread2(void *argv)
{
printf("%s\n",buf2);
}
int main(int argc, char const *argv[])
{
pthread_t pthread1_id;
pthread_t pthread2_id;
int tmp = 0;
tmp = pthread_create(&pthread1_id,NULL,thread1,NULL);
handle_error("thread_create",tmp)
tmp = pthread_create(&pthread2_id,NULL,thread2,NULL);
handle_error("thread_create",tmp)
pthread_join(pthread1_id,NULL);
pthread_join(pthread2_id,NULL);
return 0;
}
pthread_join有等待指定线程停止的功能。运行结果如下
线程的退出与销毁
线程的退出有以下几种方法:
线程函数内部执行return语句;不推荐使用,因为不会执行清理等操作
线程函数内部调用pthread_exit函数;
其他线程调用pthread_cancel函数。
pthread_exit函数
函数原型为void pthread_exit(void *retval);
作用是结束关闭调用该方法的线程,并返回一个内存指针用于存放结果
void *retval: 要返回给其它线程的数据
当某个线程调用pthread_exit方法后,该线程会被关闭(相当于return)。线程可以通过retval向其它线程传递信息,retval指向的区域不可以放在线程函数的栈内,所以定义指针之后,要用malloc申请空间,malloc申请的空间在堆中(防止悬垂指针)。其他线程(例如主线程)如果需要获得这个返回值,需要调用pthread_join方法。
pthread_join函数
函数原型为int pthread_join(pthread_t thread, void **retval);
作用是等待指定线程结束,获取目标线程的返回值,并在目标线程结束后回收它的资源,如果线程是使用exit结束的,就可以决定返回什么,如果是自然结束或者被cancel掉的,则会返回线程是否取消成功的宏定义
pthread_t thread: 指定线程ID
void **retval: 这是一个可选参数,用于接收线程结束后传递的返回值。如果非空,pthread_join 会在成功时将线程的 exit status 复制到 *retval 所指向的内存位置。如果线程没有显式地通过 pthread_exit 提供返回值,则该参数将被设为 NULL 或忽略
return: int 成功 0失败 1
pthread_join会阻塞当前线程,直到等待的线程结束之后才会继续进行,如果线程被取消成功,则retval == PTHREAD_CANCELED。
pthread_detach函数
函数原型为int pthread_detach(pthread_t thread);
作用是将线程标记为detached状态。POSIX线程终止后,如果没有调用pthread_detach或pthread_join,其资源会继续占用内存,类似于僵尸进程的未回收状态。默认情况下创建线程后,它处于可join状态,此时可以调用pthread_join等待线程终止并回收资源。但是如果主线程不需要等待线程终止,可以将其标记为detached状态,这意味着线程终止后,其资源会自动被系统回收。
thread 线程ID
return int 成功返回0,失败返回错误码
pthread_detach不会阻塞当前线程,等要等待的线程结束之后会自动将其回收。
pthread_cancel函数
函数原型为int pthread_cancel(pthread_t thread);
作用是向目标线程发送取消请求。目标线程是否和何时响应取决于它的取消状态和类型
取消状态(Cancelability State):可以是enabled(默认)或disabled。如果取消状态为禁用,则取消请求会被挂起,直至线程启用取消功能。如果取消状态为启用,则线程的取消类型决定它何时取消。
取消类型(Cancelability Type):可以是asynchronous(异步)或deferred(被推迟,默认值)。
asynchronous:意味着线程可能在任何时候被取消(通常立即被取消,但系统并不保证这一点)
deferred:被推迟意味着取消请求会被挂起,直至被取消的线程执行取消点(cancellation point)函数时才会真正执行线程的取消操作。
取消点函数:是在POSIX线程库中专门设计用于检查和处理取消请求的函数。当被取消的线程执行这些函数时,如果线程的取消状态是enabled且类型是deferred,则它会立即响应取消请求并终止执行。
创建线程的时候,设置一般都是NULL,采取默认的设置,上述总结就是,cancel发送取消命令后,被取消的线程执行到取消点函数时才执行取消操作
thread 目标线程,即被取消的线程
return int 成功返回0,失败返回非零的错误码
需要注意的是,取消操作和pthread_cancel函数的调用是异步的,这个函数的返回值只能告诉调用者取消请求是否成功发送。当线程被成功取消后,通过pthread_join和线程关联将会获得PTHREAD_CANCELED作为返回信息,这是判断取消是否完成的唯一方式。
cancel只是发送取消的命令,命令发送成功就返回成功,而线程什么时候取消,是否被取消就要通过join获取返回信息来查询。
取消点函数
上述提到当取消类型设置为deferred时,线程在执行到取消点函数时才会终止。这里的取消点函数并不是特指某一个函数,是线程中能够响应取消请求的特定函数或位置,是线程执行流程中的一个检查点,当线程运行到这些函数时,会检测是否有待处理的取消请求(例如通过线程取消函数 pthread_cancel
发送)。若存在请求,线程会终止并执行清理操作。可以理解为当程序挂起时,可以被取消的点,一般发生在阻塞时,例如read,write,open等函数都被视为取消点函数。还有一种显示取消点函数pthread_testcancel,这个函数的作用是在此处显示插入取消点,也就是在此处响应取消请求。
pthread_setcancelstate函数
函数原型为int pthread_setcancelstate(int state, int *oldstate);
作用是设置调用线程的取消状态,需要在要设置的线程里执行
PTHREAD_CANCEL_ENABLE:启用取消功能
PTHREAD_CANCEL_DISABLE:禁用取消功能
state 目标状态
oldstate 指针,用于返回历史状态
return int 成功返回0,失败返回非零错误码
pthread_setcanceltype函数
函数原型为int pthread_setcanceltype(int type, int *oldtype);
作用是设置调用线程的取消类型,需要在要设置的线程里执行
PTHREAD_CANCEL_DEFERRED:设置取消类型为推迟
PTHREAD_CANCEL_ASYNCHRONOUS:设置取消类型为异步
type 目标类型
oldtype 指针,用于接收历史类型,不需要可以填NULL
return int 成功返回0,失败返回非零错误码
例程展示
线程自然结束
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <pthread.h>
void *pthread_test(void *argv)
{
sleep(1);
printf("test线程休眠了1s,马上结束\n");
}
int main(int argc, char const *argv[])
{
pthread_t test_id;
pthread_create(&test_id,NULL,pthread_test,NULL);
printf("等待线程%ld结束\n",test_id);
pthread_join(test_id,NULL);
printf("等待到了线程%ld结束\n",test_id);
return 0;
}
主线程等待测试线程结束之后再结束
运行结果如下
主线程pthread_detach函数
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <pthread.h>
void *thread_test(void *argv)
{
pthread_t test_id;
test_id = *((pthread_t *)argv);
printf("进入%ld线程\n",test_id);
sleep(1);
printf("休眠1s\n");
sleep(1);
printf("休眠2s\n");
}
int main(int argc, char const *argv[])
{
pthread_t test_id;
pthread_create(&test_id,NULL,thread_test,(void *)&test_id);
sleep(1);
pthread_detach(test_id);
return 0;
}
运行结果如下
主线程调用pthread_detach函数后不会等待线程结束,而是立即返回,这样主线程就会早于子线程结束,子线程会被强制终止,结合上述例程来看就是子线程不会打印后两句的内容。
线程自身调用thread_exit函数
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <pthread.h>
void *pthread_test(void *argv)
{
sleep(1);
printf("test线程休眠了1s\n");
pthread_exit(NULL);
sleep(1);
printf("test线程又休眠了1s\n");//之前已经调用了exit函数,此处不会执行
}
int main(int argc, char const *argv[])
{
pthread_t test_id;
pthread_create(&test_id,NULL,pthread_test,NULL);
printf("等待线程%ld结束\n",test_id);
pthread_join(test_id,NULL);
printf("等待到了线程%ld结束\n",test_id);
return 0;
}
运行结果如下,除了线程ID不同,其余和上个例程相同
其他线程调用pthread_cancel函数
线程创建采取默认配置,即响应取消请求,取消类型为延迟取消,当执行到取消点函数时终止。需要设置其余状态可以在创建线程时更改,或者在线程中调用pthread_setcancelstate和pthread_setcanceltype
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <pthread.h>
void *thread_test(void *argv)
{
pthread_t test_id;
test_id = *((pthread_t *)argv);
printf("进入%ld线程\n",test_id);
sleep(2);
printf("%ld线程结束\n",test_id);
}
int main(int argc, char const *argv[])
{
pthread_t test_id;
pthread_create(&test_id,NULL,thread_test,(void *)&test_id);
sleep(1);
pthread_cancel(test_id);
//防止因为主线程结束而强制结束子线程
pthread_join(test_id,NULL);
return 0;
}
运行结果如下
可以看到只打印了进入线程,没有打印线程结束,是因为主线程沉睡一秒之后调用取消函数,此时子线程正在执行sleep函数,sleep被视为取消点函数,线程终止。
线程池
线程池是一种用于管理和重用多个线程的设计模式。它通过维护一个线程池(线程的集合),可以有效地处理并发任务而无需每次都创建和销毁线程。这种方法可以减少线程创建和销毁的开销,提高性能和资源利用率。
线程池的使用主要包含以下几个步骤:
线程池创建:首先创建一个线程池,指定任务函数和其他参数。线程池会创建一定数量的线程,这些线程进入等待状态,准备执行任务,或在提交任务后才创建线程(取决于配置)。线程池中的所有任务执行的都是同一个任务函数。
任务队列:线程池维护一个任务队列。当我们向线程池提交任务时,任务会被放入这个队列中。实际上,放入任务队列的是我们在提交任务时传递的任务数据。
线程执行任务:线程池中的线程从任务队列中取出任务数据,然后调用任务函数,执行任务。执行完成后,线程不会退出,而是继续从任务队列中取下一个任务执行。如果没有待执行的任务,线程通常在等待一段时间后被回收(取决于具体的配置)。
g_thread_pool_new函数
函数原型为
GThreadPool *g_thread_pool_new(
GFunc func,
gpointer user_data,
gint max_threads,
gboolean exclusive,
GError **error);
作用是创建新的线程池
func 池中线程执行的函数
user_data 传递给func的数据,可以为NULL,这里的user_data最终会被存储在GThreadPool结构体的user_data属性中, user_data 是在创建线程池时传入的共享数据,对于每个任务都是一样的
max_threads 线程池容量,即当前线程池中可以同时运行的线程数。-1表示没有限制
exclusive 独占标记位。决定当前的线程池独占所有的线程还是与其它线程池共享这些线程。取值可以是TRUE或FALSE
TRUE:立即启动数量为max_threads的线程,且启动的线程只能被当前线程池使用
FALSE:只有在需要时,即需要执行任务时才创建线程,且线程可以被多个非独享资源的线程池共用
error 用于报告错误信息,可以是NULL,表示忽略错误
return GThreadPool* 线程池实例指针。无论是否发生错误,都会返回有效的线程池
g_thread_pool_push函数
函数原型为
gboolean g_thread_pool_push(
GThreadPool *pool,
gpointer data,
GError **error);
作用是向pool指向的线程池实例添加数据,这一行为实际上会向任务队列添加新的任务。当存在可用线程时任务立即执行,否则任务数据会一直待在队列中,直至腾出可用线程执行任务
pool 指向线程池实例的指针
data 传递给每个任务的独享数据,不同于user_data
error 错误信息
return gboolean 成功返回TRUE,失败返回FALSE
g_thread_pool_free函数
函数原型为
void g_thread_pool_free (
GThreadPool* pool,
gboolean immediate,
gboolean wait_
);
作用是释放为pool指向的线程池分配的所有资源
pool 线程池指针
immediate 是否立即释放线程池
TRUE:立即释放所有资源,未处理的数据不被处理
FALSE:在最后一个任务执行完毕之前,线程池不会被释放
需要注意的是:执行任务时,线程池的任何一个线程都不会被打断。无论这个参数是何取值,都可以保证至少线程池释放前正在运行的线程可以完成它们的任务。
wait_ 当前函数是否阻塞等待所有任务完成
TRUE:所有需要处理的任务执行完毕当前函数才会返回
FALSE:当前函数立即返回
线程池中线程函数的格式
void task_func(gpointer data, gpointer user_data)
{
}
示例程序
本次程序的思路是,定义一个任务函数,执行+1的操作,通过线程池维护5个线程,像其中push20个数据,也就是累加20次,最终结果为20
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <pthread.h>
#include <glib-2.0/glib.h>
int *data;
void plus_one(gpointer data,gpointer user_data)
{
int *tmp;
tmp = (int *)data;
(*tmp)++;
printf("线程执行完毕,本次data为:%d\n",*tmp);
}
int main(int argc, char const *argv[])
{
GThreadPool *pool;
//定义一个新的线程池,最大数量为5,独享
pool = g_thread_pool_new(plus_one,NULL,5,TRUE,NULL);
data = malloc(sizeof(int));
(*data) = 0;
for (int i = 0; i < 20; i++)
{
//向线程池中push数据,也就代表着启动了一个新的线程
g_thread_pool_push(pool,data,NULL);
}
//释放线程池,不立即释放,等待线程执行完毕再释放,阻塞等待所有线程完成
g_thread_pool_free(pool,FALSE,TRUE);
printf("最终的data:%d\n",*data);
free(data);
return 0;
}
可以看到线程的执行顺序并不是固定的,并不是简单的谁先创建谁就执行,而且多个线程被分配到了不同的处理器核心执行,属于并发执行。