0% acharam este documento útil (0 voto)
39 visualizações12 páginas

23 - Regressao Multinomial

A aula aborda a interpretação dos parâmetros da regressão multinomial, que é uma extensão da regressão logística para variáveis categóricas com mais de duas categorias. O modelo multinomial compara as categorias em relação a uma categoria de referência, permitindo a análise de probabilidades de escolha entre diferentes opções, como tipos de planos de saúde. A estrutura do modelo envolve a comparação de probabilidades de sucesso entre as categorias, mantendo a soma das probabilidades igual a 1.

Enviado por

lauraa.yb
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
39 visualizações12 páginas

23 - Regressao Multinomial

A aula aborda a interpretação dos parâmetros da regressão multinomial, que é uma extensão da regressão logística para variáveis categóricas com mais de duas categorias. O modelo multinomial compara as categorias em relação a uma categoria de referência, permitindo a análise de probabilidades de escolha entre diferentes opções, como tipos de planos de saúde. A estrutura do modelo envolve a comparação de probabilidades de sucesso entre as categorias, mantendo a soma das probabilidades igual a 1.

Enviado por

lauraa.yb
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
Você está na página 1/ 12

Regressão Multinomial

Nesta aula iremos entender sobre a interpretação dos parâmetros de uma


regressão multinomial

1
GLM – Regressão Binária
Resposta
(Y)

+ de duas
Binária
categorias

Logística Multinomial

Então apenas um comparativo com os modelos


anteriormente estudados.
Na regressão logística temos apenas duas possíveis
respostas. Sucesso ou fracasso, ou 0 e 1

Ou seja nossa variável agora, é uma variável categórica,


podemos lembrar aqui das variáveis dummy , onde
tínhamos uma variável qualitativa com duas categorias e
criamos uma variável 0 e1 para conseguirmos trabalhar
numericamente com elas. Então é exatamente o que
ocorre na regressão logística.

Porem tmabem podemos ter mais de 2 categorias em nossa variável repsostae

2
quando isso ocorre estamos falando no caso de uma regressão chamada
multinomial. Que também sera um modelo linear generalizado

2
Recapitulando a Regressão Logística
Suponha que o modelo tenha a seguinte forma:

η
Em que 𝑋 = [1, 𝑋 , 𝑋 , … , 𝑋 ], B = [𝛽 , 𝛽 , 𝛽 , … , 𝛽 ], e a variável resposta
entre 0 e 1.

Assumimos que a variável reposta é uma variável aleatória Binomial.

Então para recapitular tudo que foi criado em regressão


logística, pois iremos observar que muitas coisas serão
reaproveitadas.
Entao temos o modelo com nosso componente
sistemático XB e nossa matriz de erros aleatórios
(componente aleatório)

Observe que nesse modelo como já vimos, não estou


separando a variável logística com uma ou várias
variáveis preditivas, para o cálculo dos estimadores,

3
vimos que isso não irá importar utilizando o conceito
matricial.

Na forma tradicional da regressão linear teríamos um


problema no Y, pois iria ultrapassar 0 e 1

Como a nossa variável resposta agora é uma


probabilidade, inicialmente, com duas possibilidade,
então iremos assumir que ela segue uma distribuição de
bernoulli.

Na distribuição de bernoulli , estudasse o sucesso e a


probabilidade de se obter o sucesso.
Como a variável resposta segue uma distribuição de
bernoulli .

Temos que Y = 1 seria a prob de sucesso que pode ser


descrita por pi

E no caso contrário, Y = 0, ou fracasso terimos entao a probabilidade


complementar do sucesso , que é dada por 1 - p

3
Recapitulando a Regressão Logística
Probabilidade de sucesso:
𝑛º 𝑑𝑒 𝑠𝑢𝑐𝑒𝑠𝑠𝑜
𝑝=
𝑛º 𝑑𝑒 𝑡𝑒𝑛𝑡𝑎𝑡𝑖𝑣𝑎𝑠

Probabilidade de falha :
º
q= q= 1 −𝑝
º

º
Chance de sucesso (Odds): Odds = =
º

Entao podemos pontuar alguns conceitos importantes desse modelo

A probabilidade de sucesso , ous eja de obtermos y = 1 , pode ser definida com o


número de sucesso sobre o número de tentativas .

Já a probabilidade de fracasso , ous eja de obtermos y = 0 , pode ser definida


com o número de falhas sobre o número de tentativas .

O que foi utilizado e calculado anteriormente como 1 – p

E a odds ou chance pode ser definida como a probabilidade de sucesso sobre a


probabilidade de fracasso.

4
Regressão logística / Binomial binária
Seja Y uma variável aleatória binária com distribuição binomial de
probabilidade de sucesso π(x).
A notação π(x) sugere que a probabilidade de sucesso está condicionada a um
valor/categoria x.
Ou seja, π(x)=Pr(Y=1|X=x). Define-se então:

𝜂=𝑥 𝛽

( )
𝜂 = log ( )
=𝛽 +𝛽 𝑋 = ( )

Logo , vimos que a regressão binaria, ou logística , é aplicável quando temos que
Y é uma variável aleatória binaria com probabilidade de sucesso pi(x) ou p

E observe que a probabilidade de sucesso sempre estará condicionada a um


valor ou categoria de x

Ou seja , pi(x) que é a probabilidade de Y ser 1 dado que x = x é dado por

Eta = ao componente sistemático que pode ser dado por x transpoto beta

Que sera o log (p/ 1 – p) = b0 + b1x =

( )
𝜂 = log =𝛽 +𝛽 𝑋 = ( )
( )

5
Regressão logística / Binomial binária

• Na regressão binomial binária ou regressão logística clássica temos que Y


poderia tomar dois valores:

• Pr(Y=0|X=x).
Pr(Y=1|X=x).

Observe que na regressão logística temos que Y pode assumir apenas 2 valores
0 e 1, então teríamos duas hipóteses de estudo de probabilidade

Probabilidade de y = 0 dado o valor de x

E a probabilidade de y = 1 dado um certo valor x

6
Regressão Multinominal
• Seja Y uma variável aleatória categórica com J categorias.
• Seja 𝜋 𝑥 = Pr 𝑌 = 𝑗 𝑥), 𝑐𝑜𝑚 ∑ 𝜋 𝑥 = 1
• O modelo compara cada categoria j com uma categoria de referência J,
totalizando combinações.

( )
𝜂 = log ( )
= 𝛼 + 𝛽′ 𝑥 = ( )

SEMPRE IREMOS OLHAR EM RELAÇÃO A UMA CATEGORIA DE REFERÊNCIA

Agora já pensando em uma regressão multinomial

Temos que nossa variável resposta pode assumir ate J categorias.

Logo agora iremos pensar na probabilidade de sucesso de Y ser igual a j dado


um valor de x, observe que pela teoria da probabilidade o somatório dessas
probabilidade continua sedo igual a 1.

Entao para o modelo multinomial vamos ter o seguinte,

Iremos sempre olhar em relação a uma categoria diferente , ou seja iremos


sempre comparar as categorias de dois a dois.

7
Regressão Multinominal / Binomial
• Variável resposta: Qualquer nº de níveis

• Ex: Estudo da escolha de um plano de saúde.


• Y : Tipos de plano (A,B,C)
• X: Idade, tamanho da família, renda, etc.

• A regressão logística Multinominal pode também ser chamada de Regressão


Logística Politômica

A regressão logística Multinominal pode também ser chamada de Regressão


Logística Politômica

Tao temos que como variável resposta agora poderemos ter qualquer
quantidade de níveis ou categorias

Entao por exemplo podemos comparar 3 tipos de planos de saúde e verificar


qual a probabilidade da pessoa escolher o tipo A b e c dados a idade , tamenho
da família e renda por exemplo

8
Regressão Multinominal / Binomial
Considerando Y com 3 categorias: Comparação de categorias:
Modelo necessita de 2 funções. • Y =0 -> Referencia
• Comparar com Y =1 e Y =2.

)
𝑔 𝑥 = ln )
=𝛽 + 𝛽 𝑥 + 𝛽 𝑥 + ⋯+ 𝛽 𝑥 = 𝑥 𝛽

)
𝑔 𝑥 = ln =𝛽 + 𝛽 𝑥 + 𝛽 𝑥 + ⋯+ 𝛽 𝑥 = 𝑥 𝛽
)

E para isso iriamos considerar a comparação das categorias de 2 em duas. Logo


iriamos ter a mesma ideia da regressão pois transformaríamos as 3 variáveis em
comparações de dois a dois. E sempre teríamos uma determinada categoria de
referência. Neste caso a categoria 0.

9
10

Você também pode gostar