100% encontró este documento útil (1 voto)

153 vistas36 páginas

Introducción a Arquitecturas GPU

Este documento presenta las arquitecturas de las GPU y comparte conceptos clave sobre sus diferencias con las CPU. Explica que las GPU están diseñadas para procesamiento masivamente paralelo de granos finos a través de shaders programables, mientras que las CPU están optimizadas para instrucciones secuenciales. También introduce modelos de programación como CUDA y OpenCL para aprovechar las GPU en aplicaciones de propósito general.

Cargado por

Nadia M

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

100% encontró este documento útil (1 voto)

153 vistas36 páginas

Introducción a Arquitecturas GPU

Cargado por

Nadia M

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 36

Procesadores avanzados

Arquitecturas de GPU

Ing. Alejandro C. Rodríguez Costello

([email protected])

“Those who can imagine anything, can create the impossible.”

Alan Turing
Objetivo
 Entender que es una GPU (graphic processing unit).
 Comparar las arquitecturas de CPU con GPU.
 Entender la importancia de la programación masiva
paralela y las motivaciones para GPGPU (General
Programing on GPU).
 Presentar un caso de uso básico: Nvidia Gforce
 Aprender conceptos básicos para programar GPUs con
CUDA y OpenCL.

Arquitectura de las Computadoras II Arquitecturas de GPU 2

Pipeline gráfico conceptual

Arquitectura de las Computadoras II Arquitecturas de GPU 3

Etapas de un pipeline gráfico

Arquitectura de las Computadoras II Arquitecturas de GPU 4

Motivación para usar GPU vs CPU
 No se puede serguir aumentando el clock: debido a
límites físicos de los materiales actuales.
 Límites de integración: no se pueden hacer transistores
más pequeños por problemas de fabricación.
 Restricciones de energía y calor: límites tecnológicos
(CMOS) y elevado consumo.
 Límites al paralelismo ILP: pipelines más largos
terminan con menor rendimiento.
 Límite a manycore: no se pueden integrar demasiados
cores en una sola pastilla (128 cores AMD Epic, 2019).

Arquitectura de las Computadoras II Arquitecturas de GPU 5

Rendimiento GPU vs CPU

Arquitectura de las Computadoras II Arquitecturas de GPU 6

Aspectos importantes de la GPU
 Poseen un pipeline gráfico.
 Utilizan unidades aritméticas programables (shaders).
 Fueron pensadas desde el inicio SIMD.
 Soportan muchos flujos de ejecución (threads) por eso
tambien se las llama SIMT (single instruction multiple
threads)
 Pueden generalizar los shaders (unified architecture).
 Tienen una jerarquía de memoria compleja.
 Aprovechan al máximo el principio de localidad.
 Gran velocidad de acceso a memoria (DDR5).

Arquitectura de las Computadoras II Arquitecturas de GPU 7

Arquitectura CPU vs GPU

Arquitectura de las Computadoras II Arquitecturas de GPU 8

Comunicación GPU-CPU

Arquitectura de las Computadoras II Arquitecturas de GPU 9

Limitaciones de la GPU
 No puede acceder directamente a la memoria del
procesador.
 Se requiere hacer copia explícita de los datos entre
CPU y GPU (memcpy).
 No se puede hacer uso en el código de la salida
estandar (printf).
 Depuración compleja y ardua.

Arquitectura de las Computadoras II Arquitecturas de GPU 10

Familia de GPUs Nvidia
 Gforce: orientada al consumo masivo multimedia
(videojuegos, edición de video, fotografía digital, etc.).
 Quadro: orientada a soluciones profesionales en
workstations 3D (ingeniería, arquitectura, animación).
 Tesla: orientada al computación de alta prestaciones
(HPC)

Arquitectura de las Computadoras II Arquitecturas de GPU 11

Aplicaciones de la GPU
 GPGPU: usar la GPU para aplicaciones de propósito
general.
 Las aplicaciones que mejor se adaptan:
 Trabajan sobre grandes vectores de datos
 Tienen paralelismo de grano fino SIMD
 Dominios adecuados de aplicación:
 Álgebra lineal (producto escalar y suma de matrices)
 Procesamiento de señales (digital image processing)
 Mecánica computacional (computational fluidic
dynamics).
 Inteligencia artificial

Arquitectura de las Computadoras II Arquitecturas de GPU 12

Desafios para programar GPU
 La programación CPU y GPU no son compatibles.
 Todo dato a procesar debe convertirse en texturas para
aprovechar el procesamiento por shaders.
 Se usa la técnica render-to-texture para escribir ya que
no se puede acceder trivialmente a la memoria.
 El cálculo se realiza mediante flujos de procesador de
fragmentos (pixel shader threads).
 Se hacen necesarios estandars como CUDA u OpenCL.

Arquitectura de las Computadoras II Arquitecturas de GPU 13

Caso Nvidia G80
 2006 aparece la arquitectura G80 (Tesla).
 Utiliza shaders unificados: no diferencia entre vectors o
pixel shaders a nivel procesadores (SP).
 Se orienta a flujos masivos (massive threads).
 Utiliza IEEE 754 (floats).
 Pipeline gráfico con soporta DirectX 10 y OpenGL 3.3
 Utiliza dos etapas: carga y control de flujos.
 Los flujos se diferencian por su clasificación.
 El procesamiento se realiza en bloques de 16 SPs
 Comparten cache y texturas.
https://en.wikipedia.org/wiki/GeForce_8_series

Arquitectura de las Computadoras II Arquitecturas de GPU 14

Uso de shaders unificados

Arquitectura de las Computadoras II Arquitecturas de GPU 15

Stream processors SP

Arquitectura de las Computadoras II Arquitecturas de GPU 16

Nvidia G80 Unified arquitecture

Arquitectura de las Computadoras II Arquitecturas de GPU 17

Otras alternativas AMD R600

Arquitectura de las Computadoras II Arquitecturas de GPU 18

Otras alternativas Intel Larrabee (x86)

La cantidad de núcleos y la cantidad y tipo de coprocesadores y bloques de E/S son dependientes de la implementación.

Arquitectura de las Computadoras II Arquitecturas de GPU 19

Modelos de programación GPGPU
 OpenGL: es un modelo open source para programación
gráfica.
 Direct3D: es otro modelo de programación gráfica.
 CUDA: Compute Unified Device Architecture, es un
modelo propietario para programación general de las
GPUs de Nvidia.
 OpenCL: es un modelo open source multiplataforma
para programación paralela, subconjunto de C99.

Arquitectura de las Computadoras II Arquitecturas de GPU 20

Arquitectura conceptual CUDA

Arquitectura de las Computadoras II Arquitecturas de GPU 21

Entorno de programación CUDA

nvcc

Arquitectura de las Computadoras II Arquitecturas de GPU 22

Terminología CUDA
 Kernels: funciones especiales en ANSI C. Usan palabras
claves para poder tratar con el paralelismo.
 Threads: o flujos, son la unidad de ejecución básica de
un kernel.
 Grids: grupos de ejecución de threads pertenecientes a
un kernel.
 Block: subconjunto de ejecución de threads dentro de un
grid.

Arquitectura de las Computadoras II Arquitecturas de GPU 23

Ejemplo de ejecución de un programa CUDA

Arquitectura de las Computadoras II Arquitecturas de GPU 24

Ejemplo de ejecución de un kernel

Arquitectura de las Computadoras II Arquitecturas de GPU 25

Modelo de memoria CUDA

Arquitectura de las Computadoras II Arquitecturas de GPU 26

Ejemplo CPU vs kernel de CUDA
void matrix_add_cpu (fload *A, float *B, float *C, int N)
{
int i, j, index;
for (i=0; i<N; i++){
for (j=0; j<N; j++){
index = i+j*N;
C[index] = C[index] + B[index];
}
}
}

int main(){matrix_add_gpu (fload A, float B, float *C, int N)

__global__
{ matrix_add_cpu(a, b, c, N);
} int i = blockIdx.x * blockDim.x + threadIdx.x;
int j = blockIdx.y * blockDim.y + threadIdx.y;
int index = i + j*N;
if (i<N && j<N){
C[index] = A[index] + B[index];
}
}
int main(){
dim3 dimBlock(blocksize, blocksize);
dim3 dimGrid(N/dimBlock.x, N/dimBlock.y);
matrix_add_gpu<<<dimGrid, dimBlock>>>(a, b, c, N);
}
Arquitectura de las Computadoras II Arquitecturas de GPU 27
Identificación de un thread dentro de un kernel

Arquitectura de las Computadoras II Arquitecturas de GPU 28

Organización de los threads dentro de un grid

Arquitectura de las Computadoras II Arquitecturas de GPU 29

Similitudes entre OpenCL y CUDA
OpenCL CUDA

Kernel Kernel

Programa procesador principal Programa procesador principal

NDRange (rango de dimensión N) Grid

Tarea elemental (work item) Flujo

Grupo de tareas (work group) Bloque

get_global_id(0); blockIdx.x * blockDim.x +threadIdx.x

get_local_id(0); threadIdx.x

get_global_size(0); gridDim.x*blockDim.x

get_local_size(0); blockDim.x

Arquitectura de las Computadoras II Arquitecturas de GPU 30

Relación entre tareas y grupos

Arquitectura de las Computadoras II Arquitecturas de GPU 31

Arquitectura conceptual OpenCL

Arquitectura de las Computadoras II Arquitecturas de GPU 32

Modelo de memoria OpenCL

Arquitectura de las Computadoras II Arquitecturas de GPU 33

Ejemplo de un kernel OpenCL

__kernel void matrix_add_opencl ( __global const float *A,

__global const float *B,
__global float *C,
int N) {
int i = get_global_id(0);
int j = get_global_id(1);
int index = i + j*N;
if (i<N && j<N){
C[index] = A[index] + B[index];
}
}

Arquitectura de las Computadoras II Arquitecturas de GPU 34

Gestión de dispositivos mediante contextos

Arquitectura de las Computadoras II Arquitecturas de GPU 35

Ejemplo de uso de contextos en OpenCL
main(){
// Inicialización de variables, etc.
(...)

// 1. Creación del contexto y cola en el dispositivo

cl_context context = clCreateContextFromType(0, CL_DEVICE_TYPE_GPU, NULL, NULL, NULL);
// Para obtener la lista de dispositivos GPU asociados al contexto
size_t cb;
clGetContextInfo( context, CL_CONTEXT_DEVICES, 0, NULL, &cb);
cl_device_id *devices = malugar(cb);
clGetContextInfo( context, CL_CONTEXT_DEVICES, cb, devices, NULL);
cl_cmd_queue cmd_queue = clCreateCommandQueue(context, devices[0], 0 , NULL);
// 2. Definición de los objetos en memoria (matrices A, B y C)
cl_mem memobjs[3];
memobjs[0] = clCreateBuffer(context, CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR,
sizeof(cl_float)*n, srcA, NULL);
memobjs[1] = clCreateBuffer(context, CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR,
sizeof(cl_float)*n, srcB, NULL);
memobjs[2] = clCreateBuffer(context, CL_MEM_WRITE_ONLY, sizeof(cl_float)*n, NULL, NULL);

// 3. Definición del kernel y argumentos

cl_program program = clCreateProgramWithSource(context, 1, &program_source, NULL, NULL);
cl_int err = clBuildProgram(program, 0, NULL, NULL, NULL, NULL);
cl_kernel kernel = clCreateKernel(program, "matrix_add_opencl", NULL);
err = clSetKernelArg(kernel, 0, sizeof(cl_mem), (void *)&memobjs[0]);
err |= clSetKernelArg(kernel, 1, sizeof(cl_mem), (void *)&memobjs[1]);
err |= clSetKernelArg(kernel, 2, sizeof(cl_mem), (void *)&memobjs[2]);
err |= clSetKernelArg(kernel, 3, sizeof(int), (void *)&N);

// 4. Invocación del kernel

size_t global_work_size[1] = n;
err = clEnqueueNDRangeKernel(cmd_queue, kernel, 1, NULL, global_work_size,
NULL, 0, NULL, NULL);

// 5. Lectura de los resultados (matriz C)

err = clEnqueueReadBuffer(context, memobjs[2], CL_TRUE, 0, n*sizeof(cl_float),
dstC, 0, NULL, NULL);
(...)

Arquitectura de las Computadoras II Arquitecturas de GPU 36

También podría gustarte

Desarrollo de Videojuegos Un Enfoque Práctico Volumen 2 Programación Gráfica Volume 2 Spanish Edition González Carlos Albusac Javier Mora César Download
100% (9)
Desarrollo de Videojuegos Un Enfoque Práctico Volumen 2 Programación Gráfica Volume 2 Spanish Edition González Carlos Albusac Javier Mora César Download
70 páginas
TuxInfo 40
Aún no hay calificaciones
TuxInfo 40
80 páginas
Amstrad User 028 Enero 1988
Aún no hay calificaciones
Amstrad User 028 Enero 1988
184 páginas
Aplicaciones y Programas VIC-20
Aún no hay calificaciones
Aplicaciones y Programas VIC-20
20 páginas
Programacion Orientada A Objetos - Carlos Fontela
Aún no hay calificaciones
Programacion Orientada A Objetos - Carlos Fontela
357 páginas
Biblioteca Práctica Taller de Informática (Tomo 2)
Aún no hay calificaciones
Biblioteca Práctica Taller de Informática (Tomo 2)
64 páginas
USERS - Técnico PC - 13 PDF
Aún no hay calificaciones
USERS - Técnico PC - 13 PDF
21 páginas
El Universo Digital Del IBM PC AT y PS2 (4 Edicion)
Aún no hay calificaciones
El Universo Digital Del IBM PC AT y PS2 (4 Edicion)
372 páginas
Amstrad Desensamblado de La Rom y Mapa de Memoria Don Thomasson
100% (2)
Amstrad Desensamblado de La Rom y Mapa de Memoria Don Thomasson
248 páginas
02hola Mundo Processing
100% (1)
02hola Mundo Processing
91 páginas
Amstrad CPC464 Manual Del Usuario 1987 Amstrad ES Text
Aún no hay calificaciones
Amstrad CPC464 Manual Del Usuario 1987 Amstrad ES Text
296 páginas
Manual de PovRay
100% (1)
Manual de PovRay
147 páginas
RNA Aplicadas Al Analsis de Datos
Aún no hay calificaciones
RNA Aplicadas Al Analsis de Datos
103 páginas
LI 1364 120319 A Arquitectura de Computadoras Plan 2016
Aún no hay calificaciones
LI 1364 120319 A Arquitectura de Computadoras Plan 2016
374 páginas
Guía de Memoria Estática en RAM
Aún no hay calificaciones
Guía de Memoria Estática en RAM
3 páginas
Tecnología Neuromorfica
Aún no hay calificaciones
Tecnología Neuromorfica
10 páginas
Arquitectura Computadoras I
Aún no hay calificaciones
Arquitectura Computadoras I
115 páginas
UML y Patrones - Larman 2 Edicion
Aún no hay calificaciones
UML y Patrones - Larman 2 Edicion
311 páginas
El Universo Digital Del IBM PC, at y PS-2
100% (4)
El Universo Digital Del IBM PC, at y PS-2
751 páginas
Fundamentos
Aún no hay calificaciones
Fundamentos
8 páginas
Programación Kernel y Drivers Linux
Aún no hay calificaciones
Programación Kernel y Drivers Linux
66 páginas
Inteligencia Artificial Resolucion de Problemas Algoritmos de Busqueda
0% (1)
Inteligencia Artificial Resolucion de Problemas Algoritmos de Busqueda
75 páginas
Videojuegos Multiplataforma OpenFL
Aún no hay calificaciones
Videojuegos Multiplataforma OpenFL
252 páginas
Intro OpenGL v6
Aún no hay calificaciones
Intro OpenGL v6
24 páginas
POO Fontela
100% (1)
POO Fontela
83 páginas
1500 Cuestiones y Ejercicios de Matemáticas - Andrés Nortes Checa
100% (3)
1500 Cuestiones y Ejercicios de Matemáticas - Andrés Nortes Checa
260 páginas
Guía de OpenGL y JOGL para Programadores
100% (1)
Guía de OpenGL y JOGL para Programadores
53 páginas
Arqii - 11 Gpu 2015
Aún no hay calificaciones
Arqii - 11 Gpu 2015
17 páginas
01 Introduccion GPGPU CUDA 2en1 MartinezZarzuela
Aún no hay calificaciones
01 Introduccion GPGPU CUDA 2en1 MartinezZarzuela
29 páginas
Introducción a GPU y CUDA
Aún no hay calificaciones
Introducción a GPU y CUDA
39 páginas
CUDA Tutorial ECAR
Aún no hay calificaciones
CUDA Tutorial ECAR
34 páginas
T4 Mem+Prog+Ejec CUDA
Aún no hay calificaciones
T4 Mem+Prog+Ejec CUDA
75 páginas
Tema1 v1
Aún no hay calificaciones
Tema1 v1
62 páginas
I Cuda
Aún no hay calificaciones
I Cuda
15 páginas
Clase 4 - Arquitectura - 2025
Aún no hay calificaciones
Clase 4 - Arquitectura - 2025
53 páginas
Procesadores Gráficos GPU
Aún no hay calificaciones
Procesadores Gráficos GPU
5 páginas
Pid 00280138
Aún no hay calificaciones
Pid 00280138
88 páginas
Guia de Instalacion de CUDA C
Aún no hay calificaciones
Guia de Instalacion de CUDA C
39 páginas
Actividad 1. Arquitectura
Aún no hay calificaciones
Actividad 1. Arquitectura
5 páginas
Semana 5 Opengl
Aún no hay calificaciones
Semana 5 Opengl
10 páginas
Talle GPU
Aún no hay calificaciones
Talle GPU
19 páginas
Arquitectura de Procesadores
Aún no hay calificaciones
Arquitectura de Procesadores
7 páginas
Implementación RTL de Un Procesador de Shader de GPU
Aún no hay calificaciones
Implementación RTL de Un Procesador de Shader de GPU
109 páginas
Trabajo CUDA
Aún no hay calificaciones
Trabajo CUDA
12 páginas
Arquitectura de Computadoras
Aún no hay calificaciones
Arquitectura de Computadoras
30 páginas
Introducción a CUDA para GPUs
Aún no hay calificaciones
Introducción a CUDA para GPUs
88 páginas
Modelos de Arquitectura de Cómputo
100% (1)
Modelos de Arquitectura de Cómputo
11 páginas
Arch - 2023 10 26
Aún no hay calificaciones
Arch - 2023 10 26
4 páginas
Comparativa de Arquitecturas de Cómputo
100% (6)
Comparativa de Arquitecturas de Cómputo
4 páginas
Comparativa de APIs y Hardware Gráfico
Aún no hay calificaciones
Comparativa de APIs y Hardware Gráfico
5 páginas
GPU: Procesamiento Gráfico Avanzado
Aún no hay calificaciones
GPU: Procesamiento Gráfico Avanzado
4 páginas
Sistemas de Partículas en La GPU
Aún no hay calificaciones
Sistemas de Partículas en La GPU
4 páginas
Computation On The Gpu
100% (1)
Computation On The Gpu
21 páginas
2024-2025 APAP Bloque01 T01 Introduccion GPGPU ParteI COMPLETO
Aún no hay calificaciones
2024-2025 APAP Bloque01 T01 Introduccion GPGPU ParteI COMPLETO
42 páginas
Wuolah Free ASD L5
Aún no hay calificaciones
Wuolah Free ASD L5
7 páginas
Pipeline Grafico Joel Rodriguez Herbig
Aún no hay calificaciones
Pipeline Grafico Joel Rodriguez Herbig
37 páginas
Arquitectura Clásica de Computadoras
100% (1)
Arquitectura Clásica de Computadoras
8 páginas
Introducción a CUDA para GPUs
Aún no hay calificaciones
Introducción a CUDA para GPUs
19 páginas
Resumen A
Aún no hay calificaciones
Resumen A
24 páginas
Arquitectura de Computadoras 2014
Aún no hay calificaciones
Arquitectura de Computadoras 2014
10 páginas
Programacion en Python
100% (20)
Programacion en Python
261 páginas
Redes Neuronales Artificiales Aplicadas Al Reconomiento de Patrones
80% (10)
Redes Neuronales Artificiales Aplicadas Al Reconomiento de Patrones
201 páginas
Python para Todos Explorando La Información Con Python 3
92% (13)
Python para Todos Explorando La Información Con Python 3
265 páginas
El Libro de Las Matematicas
100% (21)
El Libro de Las Matematicas
360 páginas
Programacion Desde Cero
100% (23)
Programacion Desde Cero
196 páginas
Python Curso Crash
80% (20)
Python Curso Crash
548 páginas
Algoritmos Resueltos Con Python
100% (30)
Algoritmos Resueltos Con Python
257 páginas
Aprende Python Avanzado en Un Fin de Semana - Moreno
100% (18)
Aprende Python Avanzado en Un Fin de Semana - Moreno
207 páginas
Problemas Resueltos de Inteligencia Artificial Aplicada. Búsqueda y Representación.
100% (16)
Problemas Resueltos de Inteligencia Artificial Aplicada. Búsqueda y Representación.
422 páginas
Curso Intensivo de Python Versión 3
81% (16)
Curso Intensivo de Python Versión 3
554 páginas
Matematicas para Ai
100% (6)
Matematicas para Ai
611 páginas
Aprendizaje Profundo Una Introducción A Los Fundamentos Del Aprendizaje Profundo Utilizando Python (Deep Learning Fundamentals Guide Spanish Edition en Español) by Sebastian Dark (Dark, Sebastian)
100% (10)
Aprendizaje Profundo Una Introducción A Los Fundamentos Del Aprendizaje Profundo Utilizando Python (Deep Learning Fundamentals Guide Spanish Edition en Español) by Sebastian Dark (Dark, Sebastian)
101 páginas
Inteligencia Artificial para Emprendedores - José L. Garde
87% (15)
Inteligencia Artificial para Emprendedores - José L. Garde
350 páginas
Python para Principiantes Guia Completa
100% (10)
Python para Principiantes Guia Completa
59 páginas
Breve Historia Del Tiempo, Stephen Hawking
100% (13)
Breve Historia Del Tiempo, Stephen Hawking
171 páginas
R. v. Churchill, J. W. Brown - Variable Compleja
100% (9)
R. v. Churchill, J. W. Brown - Variable Compleja
416 páginas
Precalculo 1
100% (10)
Precalculo 1
250 páginas
El Libro de Las Matematicas - Clifford1
100% (15)
El Libro de Las Matematicas - Clifford1
526 páginas
Cálculo de Varias Variables-Rogawski
100% (12)
Cálculo de Varias Variables-Rogawski
540 páginas
Análisis Matematico - Tom Apostol 2da Edicion
90% (20)
Análisis Matematico - Tom Apostol 2da Edicion
606 páginas
Cálculo Una Variable. Rogawski, J
90% (10)
Cálculo Una Variable. Rogawski, J
816 páginas
Python For Excel - ESPAÑOL
100% (12)
Python For Excel - ESPAÑOL
338 páginas
Matemáticas Simplificadas
98% (45)
Matemáticas Simplificadas
1641 páginas
Curso de Programacion Python - Arturo Montejo Raez
100% (14)
Curso de Programacion Python - Arturo Montejo Raez
588 páginas
Automatizar
91% (11)
Automatizar
181 páginas
Metodos Numericos para Ingenieros 5ed
100% (20)
Metodos Numericos para Ingenieros 5ed
1001 páginas
Inbound 7777832239088053368
92% (13)
Inbound 7777832239088053368
478 páginas
Curso Basico de Python
100% (8)
Curso Basico de Python
106 páginas
Algoritmos y Programacion
100% (3)
Algoritmos y Programacion
283 páginas
Componentes de PC y Precios
Aún no hay calificaciones
Componentes de PC y Precios
4 páginas
Números en Secuencia Repetitiva
Aún no hay calificaciones
Números en Secuencia Repetitiva
3 páginas
Esquema de Interfaz de Usuario
100% (1)
Esquema de Interfaz de Usuario
3 páginas
Reporte de Nvidia
Aún no hay calificaciones
Reporte de Nvidia
5 páginas
Cable VGA
Aún no hay calificaciones
Cable VGA
7 páginas
Tema 5.1 Tarjeta Gráfica
Aún no hay calificaciones
Tema 5.1 Tarjeta Gráfica
29 páginas
Catalogo Marzo 025
Aún no hay calificaciones
Catalogo Marzo 025
56 páginas
Proforma de PC
Aún no hay calificaciones
Proforma de PC
1 página
Descargar Despierta La Furia Año 2021 Torrent Gratis - DonTorrent
Aún no hay calificaciones
Descargar Despierta La Furia Año 2021 Torrent Gratis - DonTorrent
1 página
Kits de CCTV Marca Xts Febrero
Aún no hay calificaciones
Kits de CCTV Marca Xts Febrero
1 página
Laptops Reacondicionadas y Accesorios en Oferta
Aún no hay calificaciones
Laptops Reacondicionadas y Accesorios en Oferta
3 páginas
Proyecto Rig de Mineria
Aún no hay calificaciones
Proyecto Rig de Mineria
4 páginas
19-2 Monitores
Aún no hay calificaciones
19-2 Monitores
5 páginas
Tarjeta Gráfica
Aún no hay calificaciones
Tarjeta Gráfica
11 páginas
Catalogo de Laptop JULIO
Aún no hay calificaciones
Catalogo de Laptop JULIO
6 páginas
MONITORES
Aún no hay calificaciones
MONITORES
10 páginas
Evolucion de Las Tarjetas de Video.
Aún no hay calificaciones
Evolucion de Las Tarjetas de Video.
4 páginas
Ndla GeForce 9400 GT Guia de Procesadores Graficos GeForce HighRes
Aún no hay calificaciones
Ndla GeForce 9400 GT Guia de Procesadores Graficos GeForce HighRes
2 páginas
Juegos Yogurt...
Aún no hay calificaciones
Juegos Yogurt...
315 páginas
Copia de Formato Actual PSI 4K - OLED 10082016 28 11 JaV
Aún no hay calificaciones
Copia de Formato Actual PSI 4K - OLED 10082016 28 11 JaV
15 páginas
PU011 - End - Monitores Hercules
Aún no hay calificaciones
PU011 - End - Monitores Hercules
1 página
Lista Cuadrado Electronics 16-12-23-1
Aún no hay calificaciones
Lista Cuadrado Electronics 16-12-23-1
19 páginas
Monitor TEROS 27" FHD IPS: Especificaciones
Aún no hay calificaciones
Monitor TEROS 27" FHD IPS: Especificaciones
3 páginas
GT 710 1GD3H LP
Aún no hay calificaciones
GT 710 1GD3H LP
1 página
Clase 10 Placa de Video y Sonido
Aún no hay calificaciones
Clase 10 Placa de Video y Sonido
39 páginas
Excel Basico I
Aún no hay calificaciones
Excel Basico I
6 páginas
Evolución de Monitores de PC
Aún no hay calificaciones
Evolución de Monitores de PC
14 páginas
Tarjetas Graficas
Aún no hay calificaciones
Tarjetas Graficas
11 páginas
Pantalla
Aún no hay calificaciones
Pantalla
8 páginas

Introducción a Arquitecturas GPU

Cargado por

Introducción a Arquitecturas GPU

Cargado por

Procesadores avanzados

Ing. Alejandro C. Rodríguez Costello

“Those who can imagine anything, can create the impossible.”

Arquitectura de las Computadoras II Arquitecturas de GPU 2

Arquitectura de las Computadoras II Arquitecturas de GPU 3

Arquitectura de las Computadoras II Arquitecturas de GPU 4

Arquitectura de las Computadoras II Arquitecturas de GPU 5

Arquitectura de las Computadoras II Arquitecturas de GPU 6

Arquitectura de las Computadoras II Arquitecturas de GPU 7

Arquitectura de las Computadoras II Arquitecturas de GPU 8

Arquitectura de las Computadoras II Arquitecturas de GPU 9

Arquitectura de las Computadoras II Arquitecturas de GPU 10

Arquitectura de las Computadoras II Arquitecturas de GPU 11

Arquitectura de las Computadoras II Arquitecturas de GPU 12

Arquitectura de las Computadoras II Arquitecturas de GPU 13

Arquitectura de las Computadoras II Arquitecturas de GPU 14

Arquitectura de las Computadoras II Arquitecturas de GPU 15

Arquitectura de las Computadoras II Arquitecturas de GPU 16

Arquitectura de las Computadoras II Arquitecturas de GPU 17

Arquitectura de las Computadoras II Arquitecturas de GPU 18

Arquitectura de las Computadoras II Arquitecturas de GPU 19

Arquitectura de las Computadoras II Arquitecturas de GPU 20

Arquitectura de las Computadoras II Arquitecturas de GPU 21

Arquitectura de las Computadoras II Arquitecturas de GPU 22

Arquitectura de las Computadoras II Arquitecturas de GPU 23

Arquitectura de las Computadoras II Arquitecturas de GPU 24

Arquitectura de las Computadoras II Arquitecturas de GPU 25

Arquitectura de las Computadoras II Arquitecturas de GPU 26

int main(){matrix_add_gpu (fload *A, float *B, float *C, int N)

Arquitectura de las Computadoras II Arquitecturas de GPU 28

Arquitectura de las Computadoras II Arquitecturas de GPU 29

Programa procesador principal Programa procesador principal

NDRange (rango de dimensión N) Grid

Tarea elemental (work item) Flujo

Grupo de tareas (work group) Bloque

get_global_id(0); blockIdx.x * blockDim.x +threadIdx.x

Arquitectura de las Computadoras II Arquitecturas de GPU 30

Arquitectura de las Computadoras II Arquitecturas de GPU 31

Arquitectura de las Computadoras II Arquitecturas de GPU 32

Arquitectura de las Computadoras II Arquitecturas de GPU 33

__kernel void matrix_add_opencl ( __global const float *A,

Arquitectura de las Computadoras II Arquitecturas de GPU 34

Arquitectura de las Computadoras II Arquitecturas de GPU 35

// 1. Creación del contexto y cola en el dispositivo

// 3. Definición del kernel y argumentos

// 4. Invocación del kernel

// 5. Lectura de los resultados (matriz C)

Arquitectura de las Computadoras II Arquitecturas de GPU 36

También podría gustarte

int main(){matrix_add_gpu (fload A, float B, float *C, int N)