QUÍMICA ANALÍTICA AVANÇADA – 1S 2017
MÓDULO 2
Estatística Aplicada à Química Analítica
- Conceitos básicos
Prof. Rafael Arromba de Sousa
Departamento de Química - ICE
[email protected] Notas de aula: www.ufjf.br/baccan
Estatística Aplicada à Química Analítica
Aula anterior:
Conceitos e definições básicos
Não existe um valor absoluto para um resultado analítico
Forma correta de expressar os resultados
Definição de exatidão e precisão
Importância de rejeitar resultados anômalos
Exercícios:
Exerc. 1 Algarismos significativos
Exerc. 2 Precisão e rejeição de resultados 3
Estatística Aplicada à Química Analítica
Aula anterior:
Conceitos e definições básicos
Não existe um valor absoluto para um resultado analítico
Forma correta de expressar os resultados
Definição de exatidão e precisão
Importância de rejeitar resultados anômalos
Nessa aula:
- Conceitos básicos (continuação)
- Noções de Quimiometria (?)
3
RELAÇÃO ENTRE EXATIDÃO E PRECISÃO
A Exatidão e a Precisão se relacionam de 3 formas principais:
Método
de análise
C preciso e exato !
B preciso mas inexato
A impreciso e inexato
valor Conc. do analito
verdadeiro
EXEMPLOS PRÁTICOS ?? 4
Algumas formalidades... TERMINOLOGIAS
1) Boa precisão = Boa repetibilidade ≠ reprodutibilidade
Codex Committee on Methods of Analysis and Sampling. Guidelines on
Analytical Terminology (CAC/GL72 – 2009)
5
TERMINOLOGIAS
2) Precisão intermediária
(Semelhante ao apresentado na Rev. 05 – Ago 2016) 6
A ESTATÍSTICA NA ANÁLISE QUÍMICA
Comparação de Resultados:
1. Definição do problema analítico
2. Escolha do método de análise
3. Amostragem
4. Tratamento da amostra (e separação da espécie de interesse)
5. Calibração
6. Medida analítica RESULTADO (MÉDIA ± INCERTEZA)
7. Avaliação dos resultados : RESULTADO OBTIDO x RESULTADO ESPERADO
8. Ação
Precisões (Teste F)
Comparação
Médias (Teste t de Student)
7
Teste F (ou Teste de Snedecor)
Comparar precisões SA2
(ou variâncias) F=
de duas médias (A e B) S B2
“A” refere-se à média com o maior desvio
SE Fcalculado < Fcrítico para a confiabilidade desejada
Não existe diferença significativa entre os conjuntos
de dados em termos de precisão…
SE Fcalculado Ftabelado para a confiabilidade desejada
Existe diferença significativa entre os conjuntos
de dados
8
Tabelas para os valores críticos de F
Ex: Valores críticos para F ao nível de 5%*
Graus
lib. 3 4 5 6 12 20 Numer.
3 9,28 9,12 9,01 8,94 8,74 8,64
4 6,59 6,39 6,26 6,16 5,91 5,80
5 5,41 5,19 5,05 4,95 4,68 4,56
6 4,76 4,53 4,39 4,28 4,00 3,87
12 3,49 3,26 3,11 3,00 2,69 2,54
20 3,10 2,87 2,71 2,60 2,28 2,12
Denom.
* A tabela indica as probabilidades dos valores serem diferentes
(confiabilidade de 95% para não haver diferença significativa entre os resultados)
9
EXERCÍCIO
Exercício 3-
Comente sobre a diferença na precisão obtida nos laboratórios
A e B para a determinação de Mg em uma mesma amostra de
leite considerando um nível de confiança de 95%.
Dados:
Lab. A : 34,97; 34,85; 34,94 e 34,88 mg L-1 e
Lab. B : 35,02; 34,96; 34,99; 35,07 e 34,85 mg L-1
(Precisões semelhantes, comparáveis) 10
MAS para avaliar os parâmetros precisão e
exatidão: entender que erros afetam esses
parâmetros ?
TIPOS ERROS:
- SISTEMÁTICOS (rastreáveis e pode ser evitados)
- ALEATÓRIOS (sempre presentes... )
11
1) Erros Sistemáticos ou Determinados
(Podem ser conhecidos e rastreados)
Erros de Método : surgem do comportamento
químico ou físico não ideal de sistemas analíticos
Erros Pessoais : resultam da falta de cuidado,
falta de atenção ou limitações pessoais do afetam a
analista
exatidão
Erros Instrumentais: causados pelo
comportamento não ideal de um instrumento, por
calibrações falhas ou pelo uso de condições
inadequadas
12
Erros Sistemáticos ou Determinados
(Podem ser conhecidos e rastreados)
Como detectar um erro sistemático?
• Materiais de Referência Certificados (CRM)
• Método de adição e recuperação de analito
(“spike”)
• Métodos comparativos
• Testes interlaboratoriais
13
Erros Sistemáticos ou Determinados
CRM
- Adquirir de empresas especializadas (NIST*)
• Amostras com certificado de análise (resultado ± incertza)
Substâncias comumente encontradas em amostras:
AMBIENTAIS – CLÍNICAS – BIOLÓGICAS – FORENSES
(*) National Institute and Technology
14
Erros Sistemáticos ou Determinados
Exercício 4-
PESQUISAR PARA A PRÓXIMA AULA
- Se existem CRMs disponíveis comercialmente para as
suas matrizes de estudo (ou interesse)
15
2) Erros Indeterminados
(aleatórios ou randômicos)
Não podem ser localizados…
Medidas flutuam
aleatoriamente
ao redor da média
afetam a precisão
Variam de acordo com
uma distribuição normal
16
Ex de uma Distribuição Normal (Calibração de uma pipeta)
50
% das medidas
Curva de Gauss
30
(Perfil da distribuição)
10
9.969 9.975 9.981 9.987 9.993
9.971 9.977 9.983 9989 9.995 volume (mL)
Histograma mostrando a
distribuição de 50 medidas do
volume escoado por uma pipeta
de 10,00 mL
17
OBS: Transparência preparada a partir de material do Prof Célio Pasquini (IQ-Unicamp)
Karl F. Gauss
Característica de uma Distribuição Normal
Os resultados são alterados ora para menos, ora para mais,
por erros que parecem se dar ao acaso (aleatórios), que é um
comportamento esperado e, por isso, “normal”
18
Distribuição Normal de Gauss
Probabilidade de ocorrência de um resultado (Y)
(X
1 exp - 1 i - )2
Y=
2 2 2
µ corresponde a média da população
(situação de várias medidas)
Assim, pode-se calcular uma faixa para um resultado R supondo que
os desvios observados seguem uma distribuição normal
19
OBS: Transparência preparada a partir de material do Prof Célio Pasquini (IQ-Unicamp)
Distribuição Normal e a Estatística Clássica
Para a estatística clássica os desvios da normalidade não afetam os
resultados do ponto de vista estatístico (métodos robustos) e esta
ideia é apresentada no “Teorema do Limite Central”:
“Se a flutuação total numa certa variável aleatória for o resultado da
soma das flutuações de muitas variáveis independentes e de
importância mais ou menos igual, a sua distribuição tenderá para a
normalidade, não importa qual seja a natureza das distribuições das
variáveis individuais”
W S Gossett (1868 – 1937):
Desenvolveu a distribuição de Student para analisar
resultados do teor de álcool em cerveja
20
Limites de confiança para a media de um resultado
=x z
0,4 -2 -1 +1+2
N
Frequência relativa
0,3 Níveis de
Confiança para Z %
50 0,67
0,2 68 1,00
80 1,28
90 1,64
0,1
95 1,96
95,4 2,00
0_ 99 2,58
0 + 99,7 3,00
Distribuição Normal de Gauss 99,9 3,29
21
OBS: Transparência preparada a partir de material do Prof Célio Pasquini (IQ-Unicamp)
Limites de confiança da média quando não se tem µ
=x z =x tS
N N
Graus de liberdade 95% 99%
1 12,71 63,66
2 4,30 9,93
3 3,18 5,84
4 2,78 4,60
5 2,57 4,03
6 2,45 3,71
7 2,36 3,50
8 2,31 3,36
9 2,26 3,25
10 2,23 3,17
. . .
. . .
1,96 2,58
22
OBS: Transparência preparada a partir de material do Prof Célio Pasquini (IQ-Unicamp)
Exemplo 4 (aplicação do conceito na expressão de um resultado):
Um indivíduo fez quatro determinações de ferro em uma
liga metálica, encontrando um valor médio de 31,40% m/m
e uma estimativa do desvio padrão de 0,11% m/m. Qual o
intervalo em que deve estar a média da população, com um
grau de confiança de 95%?
µ=?
=x tS
N
µ = 31,40 ± (3,18 x 0,11) / 4
µ = 31,40 ± 0,17 C Fe = (31,23 – 31,57)% m/m
23
Comparação de médias
Situação 1 Situação 2
Resultado ± incerteza Resultado ± incerteza
Valor de referência Valor de referência ± incerteza
24
Exemplo de aplicação – SITUAÇÃO 1 (Exp. de amostragem)
Ex: Comparação da distribuição de cores de confeitos M&M
com a especificação do fabricante
Com base na amostragem e análise (contagem) dos analistas
diferentes
média (X) e estimativa do desvio (S) para cada cor
Média do fabricante (µ)
Calcula-se t com a confiança desejada e compara-se com o valor
tabelado:
t = - x
N
S
Se o t calc < t tab
não existe diferença significativa entre as médias 25
Outro modo de usar o Limite de confiança da média pra esse mesmo
tipo de comparação
Comparação de uma média com um valor de referência
quando não se tem o desvio do valor de referência
Ex de situação em
Valor referência que o resultado
obtido
concorda com o
IC para o resultado “R” valor de referência
=x tS
ν t tabelado = N-1
N 26
PARA A SITUÃO 2: Se as precisões forem
comparáveis, compararam-se as médias:
Teste t, de Student
x 1 - x2
t= n é o número das medidas
para cada média
n1 + n2
Sp n1 . n2 Sp corresponde a S “agrupado”
(n1-1) S12 + (n2 -1) S22 ν = n1+n2-2
Sp= n1 + n2 - 2
t tabelado
SE tcalculado < tcrítico para o nível de confiança desejado:
não existe diferença significativa entre as médias e as
diferenças observadas se devem a erros aleatórios 27
MAS se as precisões não forem comparáveis:
x1 - x2
t= (n1-1) S12 + (n2 -1) S22
n1 + n2 Sp= n1 + n2 - 2
Sp n1 . n2
ν t tabelado:
FÓRMULAS ESPECÍFICAS (Pesquisar...)
ν t tabelado = n1+n2-2
n1 = n2
n1 ≠ n2
28
Valores críticos para t nos níveis de 95 e 99%
(P= 0,025 e P= 0,005)
Graus de liberdade 95% 99%
1 12,71 63,66
2 4,30 9,93
3 3,18 5,84
4 2,78 4,60
5 2,57 4,03
6 2,45 3,71
7 2,37 3,50
8 2,31 3,36
9 2,26 3,25
10 2,23 3,17
. . .
. . .
1,96 2,58
Testes estatísticos são válidos quando os erros envolvidos são aleatórios
Mais confiáveis serão os testes quanto maior o ν (graus de liberdade)
29
Outras formas de utilizar o teste-t
Comparação de dados em pares (teste-t pareado)
Amostras diferentes (do mesmo tipo ou de lotes diferentes) analisadas por
métodos diferentes ou analistas diferentes
Procedimento:
1) Organizar os dados em pares
2) Calcular o “desvio padrão” entre as diferenças das médias (dos pares)
3) Calcular o valor de t:
d
t = ν = N-1
Sd N t tabelado
ν= número de graus de liberdade 30
EXERCÍCIO
Exercício 5-
No seu trabalho de pós-graduação você fará comparação de resultados?
Em caso afirmativo, qual teste será usado? Por quê?
31
Testes estatísticos para
comparação de resultados
- Precisão
- Exatidão
Testes de hipóteses
- Hipótese nula (H0)
H0: µ = µ0
(µ0 é o valor verdadeiro ou de referência)
- Hipótese alternativa (Ha)
Ha: µ ≠ µ0 32
33
Alguns Exemplos de Propagação de “Erros”
Leva-se em consideração as incertezas de cada etapa do
processo
Para erros indeterminados (situação mais usual)
Para um resultado “R”:
AB
R = A + B – C (soma e sub.) R = (multiplicação e divisão)
C
2 2 2
SR SA SB SC
SR = SA2 + SB2 + SC2 = + +
R A B C
34
Propagação de Erros
Para “casa”
Exerc. 6:
Considerando que o S de uma balança seja de 0,0001 g,
calcule a estimativa do desvio-padrão de uma pesagem
feita nesta balança.
(SR= 0,0001g)
35
CASO DE MÉTODOS INSTRUMENTAIS DE ANÁLISE
O TRATAMENTO ESTATÍSTICO INCLUE TAMBÉM:
Regressão linear
Curva de calibração (ou analítica)
Tipos: - univariada (“convencional”)
- multivariada (métodos quimiométricos)
Estimativa dos Limites de detecção e quantificação
Cálculos baseados na Estimativa do desvio padrão do
branco para prever a detectabilidade do instrumento e
método
36
REGRESSÃO LINEAR
É a reta que melhor representa a relação entre a
propriedade medida (Abs, p. ex) e a concentração dos
padrões
Padrões
Abs= 48,3x + 0,24
r= 0,9987
Absorbância
Branco
0 Concentração (mg L-1) 1
- O coeficiente de correlação (r) varia entre -1 e +1 37
- Quanto mais próximo da “unidade”, melhor é a correlação
REGRESSÃO LINEAR
Uma Curva analítica linear nem sempre é possível e uma
Regressão não-linear pode ser usada desde que apresente “boa
correlação”
As Regressões lineares são as mais usuais e podem ser obtidas
por meio de softwares, que usam o “Método dos mínimos quadrados”:
Para y= ax + b, com coef. correlação “r”:
n Σxiyi – ΣxiΣyi
a = ______________ b = y - x
n Σxi2 – (Σxi)2
n= no de pontos (x1;y1) da calibração
n Σxiyi – ΣxiΣyi
r = _______________________________
{ [nΣxi2 – (Σxi2)] [nΣyi2 – (Σyi )2] } 1/2 38
REGRESSÃO LINEAR
O “Método dos mínimos
quadrados” minimiza os “resíduos”
(erros) que a reta de regressão
gera para cada um dos pontos
Nos pontos centrais de uma
curva de calibração os resíduos
são sempre menores
Implicações ...
39
REGRESSÃO LINEAR
“Para casa”:
Vide ex. 4.9 e 4.10 do “Vogel – Análise Química Quantitativa”, 6ª Ed:
Para determinar quitina por fluorescência molecular utilizou-se
padrões de quitina nas seguintes concentrações: 0,10; 0,20; 0,30 e
0,40 µg mL-1 e que resultaram nos seguintes valores de emissão,
respectivamente: 5,20; 9,90; 15,30 e 19,10, Cps sendo que o branco
gerou leitura de 0,00 Cps. Considerando-se que um coeficiente de
correlação linear superior a 0,99 é satisfatório, calcule a concentração
de quitina de uma amostra cujo sinal analítico foi de 16,10 Cps.
(r= 0,9987 e C quitina = 0,32 µg mL-1)
40
REGRESSÃO LINEAR
Para se obter uma “boa calibração” é preciso que:
a) Os únicos erros nas medidas sejam devidos a flutuações na variável
dependente “y”
b) Os pontos tenham comportamento homocedástico (erros aleatórios
com média zero e variância constante)
Testes: Cochran (Q) ou Levene
Regressão “normal” ou ponderada
c) Garantir que os erros não sejam correlacionados
Preparar todos os padrões do mesmo jeito e realizar as
medidas experimentais de forma aleatória
d) Os erros sigam uma distribuição normal
Teste de Shapiro Wilk
e) O modelo obtido não apresente falta de ajuste (ANOVA) 41
REGRESSÃO LINEAR E EFEITO MATRIZ
Sendo a Regressão linear uma reta “média” pode-se calcular a incerteza dos
seus coeficientes angulares e lineares
As incertezas desses coeficientes podem ser usadas para avaliar a própria
regressão bem como outros parâmetros
Avaliação do efeito matriz no desenvolvimento de um método
analítico * (comparação dos coef. angulares, “a”):
0.020 Curva de adição de padrão
Curva analítica em meio ácido
0.018 a a
0.016
meio alcalino meio ácido
( y= ax + b )
0.014
0.012
1,60 10-3 ± 0,05 10 -3 1,78 10-3 ± 0,03 10-3
0.010
AI
0.008
0.006
0.004 Comparação para um nível de 95% de
0.002
confiança para saber se a calibração
poderia ser feita em meio ácido !
0.000
-0.002
0 2 4 6 8 10
Concentração de Pb (ug/L)
(*) R.A.de Sousa et al. / Talanta 104 (2013) 90–96 42
REGRESSÃO LINEAR E EFEITO MATRIZ
Cálculo das incertezas de a e b :
S S y/x
= ______________
a S b = S y/x [ Σxi2 / nΣ(xi- x )2 ]1/2
[ Σ(xi – x )2 ]1/2
S y/x = [ Σ(yi – y^ )2 / (n-2) ] 1/2
Obtido usando a própria
equação de regressão
Uma observação cuidadosa dos valores de yi - y ^
mostram que o erro da regressão é menor nas
vizinhanças do centro da curva de calibração ! 43
REGRESSÃO LINEAR E OS PARÂMETROS DE MÉRITO
Estimativa dos LIMITE DE DETECÇÃO (LOD) e
LIMITE DE QUANTIFICAÇÃO (LOQ)
Representam a DETECTABILIDADE DO MÉTODO
“LEMBRAR”: LOD instrumental é diferente do LOD método
Exemplo
Para quantificar 0,02 mg.kg-1 Pb em uma amostra de peixe por GF AAS
o LOQ deve ser consideravelmente menor que 0,02 mg.kg-1 Pb
Análise elementar = Amostra é digerida
Na solução final a amostra fica diluída (10x p. ex)
C Pb sol. amostra= 0,02 mg kg-1 / 10 = 0,002 mg kg-1
LOQ instrumental ≤ 0,002 mg.kg-1 Pb e não 0,02 mg kg-1 44
REGRESSÃO LINEAR E OS PARÂMETROS DE MÉRITO
Estimativa dos LIMITE DE DETECÇÃO (LOD) e
LIMITE DE QUANTIFICAÇÃO (LOQ)
Definições
Limite de detecção:
É a menor concentração ou massa de analito que pode ser detectado
com uma certa confiança
Depende da magnitude do sinal analítico em relação à flutuação do
branco:
3 Sbranco
LOD=
m m= inclinação curva analítica
45
REGRESSÃO LINEAR E OS PARÂMETROS DE MÉRITO
CÁLCULO do LIMITE DE DETECÇÃO (LOD)
CONSIDERAÇÃO:
LOD concentração correspondente ao Menor sinal detectável
Menor sinal detectável = Sinal branco + 3 S branco
Para que se tenha 99% de confiança
SE Curva analítica: (1) Y= m X + b b= Sinal branco
Na concentração limite Y = Menor sinal detectável (2)
X = LOD
Substituindo (2) em (1): Sinalbranco + 3 Sbranco = m LOD + Sinalbranco
3 Sbranco = LOD 46
m
REGRESSÃO LINEAR E OS PARÂMETROS DE MÉRITO
O LIMITE DE QUANTIFICAÇÃO (LOQ)
No nível do LOD a medida é significativamente afetada pelo
ruído instrumental (baixa precisão)
As medidas quantitativas devem ser feitas num nível superior
ao LOD, geralmente:
10 Sbranco
LOQ=
m
PODE ser determinado experimentalmente (em função da
precisão) ou considerado igual ao primeiro ponto da curva analítica
47
Sabemos calcular (estimar) ?
Dúvidas ?
Comentários ?
OBS: Existem outras formas de calcular os valores
de LOD e LOQ, dependendo da técnica e objetivo do
método/análise
48
Outros Usos da Estatística no Laboratório ...
Métodos quimiométricos para planejamento e
otimização de experimentos, análise multivariada de dados e
calibração multivariada
“A quimiometria pode ser definida como sendo a aplicação de
métodos matemáticos e estatísticos no planejamento ou na
otimização de procedimentos e na obtenção de informações
químicas através da análise de resultados relevantes”
49
Recomendação
Literatura básica para estudos iniciais
Bruns, RE; Faigle, FG. “Quimiometria”,
Quím. Nova, 8 (1985) 84
Gemperline, PJ.
Practical Guide to Chemometrics (2nd Ed),
CRC Press Taylor and Francis, New York (2006)
50
Alguns exemplos:
1- Planejamento fatorial e otimização multivariada
- Conhecer como os diferentes parâmetros experimentais afetam
o resultado do experimento (ou análise).
Seleção das condições instrumentais para determinar Se por GF
AAS em adoçantes dietéticos
Tpyr Tat tpyr Mod 51
1- Planejamento fatorial e otimização multivariada
- Estabelecer condições experimentais (instrumentais) otimizadas
Sousa, RA; Silva, JCJ; Teófilo, RF; Cadore, S.; Baccan, N.
“Study of Instrumental Parameters for the Analysis of Milk by
ICP OES Employing Factorial Design”,
Brazilian Meeting on Chemistry of Food and Beverages, 2004.
Seleção das condições instrumentais para análise de leite por
ICP OES
16
14
y= 6.74 + 1.89 P –
12
Mg II / Mg I
10
6
8
4.34 N – 0.59 A – 0.69
-1,2
-0,72
-0,24
2
4
PN – 0.34 PA + 0.34 NA
0
0,24
-1,2 6
- 0 ,9 2
-0,7 8
N
-0,4
0,72
- 0 ,2
0
4
0,2
0 ,4
1,2 P
8
0,7
52
2
0,9
6
1,2
2- Análise multivariada de resultados
Um exemplo na área de Química analítica:
Dados experimentais obtidos para as diferentes amostras:
ACP ACN
Ca (mg L-1) 178 - 232 107 – 237
Mg 87 - 129 50 – 88
Mn 1,8 – 2,8 1,0 – 4,8
Fe 0,08 – 0,18 0,04 – 0,18
Zn 0,20 – 0,36 não detectado
Cu 0,09 – 0,19 não detectado
53
2- Análise multivariada de resultados
Considerando as variações para cada parâmetro (analito), busca-se
as possíveis similaridades entre as amostras
UTILIZAR: Recursos para Análise exploratória, como PCA
Gráfico de scores:
Amostras num espaço
multidimensional
54
PCA: Análise de Componentes Principais
Na PCA realizada compara-se o Gráfico de scores com o de
loadings para se entender as “separações” encontradas
Verificação de correlações entre dados
55
3- Calibração multivariada para análise de solos, alimentos,
medicamentos, fluidos biológicos, ...
- Utiliza-se um único método analítico para detectar e
quantificar vários parâmetros em uma mesma análise
56
3- Calibração multivariada para análise de solos, alimentos
e medicamentos
TABLE I:
Correlation Coefficient Values for Both Calibration and Validation Models Obtained via PLSR 1 for All Inorganic Elements
Correlation Coefficient Correlation Coefficient
Element Element
Calibration Validation Calibration Validation
Ca 0.99992 0.84705 K 0.99751 0.99558
P 0.98802 0.96488 Mg 0.96973 0.90379
Na 0.99367 0.98957 Cl 0.99982 0.99275
57
3- Calibração multivariada para análise de solos, alimentos
e medicamentos
TABLE II: Correlation Coefficient Values for Calibration and Validation
Models Obtained via PLSR 1 for the Organic Compounds
Correlation Coefficient
Compounds
Calibration Validation
Glucose 0.99165 0.94337
Urea 0.99925 0.95103
Creatinine 0.99093 0.96018
58
Outros exemplos importantes podem ser
encontrados na literatura
Trata-se de um área em constante
desenvolvimento
OBS: Várias ferramentas além destas
exemplificadas podem ser usadas com finalidades
analíticas (desenvolvimento do método, avaliação de
resultados e na própria calibração)
Estudem quimiometria !! 59
BIBLIOGRAFIA
1) D. A. Skoog, D. M. West, F. J. Holler, Stanley R. Crouch
Fundamentos de Química Analítica,
8a Ed., CENGAGE Learning, 2009
2) J. Mendham, R. C. Denney, J. D. Barnes, M. Thomas
Vogel - Análise Química Quantitativa,
6a ed., LTC, 2002
3) D. C. Harris,
Análise Química Quantitativa,
7a ed., LTC, 2008
4) B. B. Neto, I. E. Scarminio, R. E. Bruns,
Como Fazer Experimentos,
Editora da Unicamp, 2001
5) J. N. Miller, J. C. Miller,
Statistics and Chemometrics for Analytical Chemistry,
5th Ed, Pearson Education Limited, 2005
60