Inteligência Artificial I - Visão Computacional
Michel Alves dos Santos ∗
07 de Junho de 2011
1 Percebendo o Mundo
Como podemos perceber o mundo a nossa volta? Resposta: através de nossos sentidos.
E o mais importante deles é a visão. Nesse momento faz-se juízo a celebre frase ‘uma
imagem vale mais do que mil palavras’.
2 Anatomia do Olho Humano e Processo de Visão
O globo ocular, com cerca de 25 milímetros de diâmetro, é o responsável pela captação
da luz refletida pelos objetos à nossa volta. Essa luz atinge em primeiro lugar nossa córnea,
que é um tecido transparente que cobre nossa íris como o vidro de um relógio. Em seu
caminho, a luz agora passa através do humor aquoso, penetrando no globo ocular pela
pupila, atingindo imediatamente o cristalino que funciona como uma lente de focalização,
convergindo então os raios luminosos para um ponto focal sobre a retina. Na retina, mais
de cem milhões de células fotossensíveis transformam a luz em impulsos eletroquímicos, que
são enviados ao cérebro pelo nervo óptico. No cérebro, mais precisamente no córtex visual
ocorre o processamento das imagens recebidas pelo olho direito e esquerdo completando
então nossa sensação visual.
O olho humano é um órgão da visão, no qual uma imagem óptica do mundo externo é
produzida e transformada em impulsos nervosos e conduzida ao cérebro.
3 Visão Computacional
Campo da Computação Gráfica que desenvolve teoria e tecnologia para a construção
de sistemas artificiais capazes de analisar entradas visuais.
∗
Bacharelando em Ciência da Computação, Universidade Federal do Estado de Alagoas(UFAL), Bol-
sista do Laboratório de Modelagem Geométrica e Visão Computacional do Centro de Pesquisa em Ma-
temática Computacional(CPMAT), Brasil - Maceió/AL, Tel: 8805-0582 E-mail: michel.mas@gmail.com,
michelalvessantos@hotmail.com
1
4 Máquinas e Percepção
Percepção de máquina é a habilidade de usar a entrada de sensores (como câmeras, mi-
crofones, sonar e outrs aparelhos) para deduzir aspectos do mundo. Visão Computacional
é a habilidade de analisar entradas visuais. Alguns subproblemas da área de percepção de
máquina são o reconhecimento de linguagem(fala ou discurso), o reconhecimento facial e o
reconhecimento de objetos.
http://en.wikipedia.org/wiki/Artificial_intelligence
5 Harry Porter’s Collection of Robot Videos
http://web.cecs.pdx.edu/~harry/Robots/index.html
6 Kismet
O Robô-babá, que toma conta de bebês enquanto os pais trabalham ou vão jantar fora,
por enquanto só existe em desenho animados. Mas a situação oposta já é realidade - um
robô-bebê, paparicado o tempo todo por uma babá humana. Kismet, uma cabeça metá-
lica de 3,6 quilos acoplada a um computador, é o projeto mais recente do Laboratório de
Inteligência Artificial do MIT, o Instituto de Tecnologia de Massachusetts, nos Estados
Unidos. Ele sorri e arregala doces olhos azuis quando tem um companheiro para brincar.
Se está sozinho, fica triste e entediado. Kismet é o irmão caçula de Cog, o robô do MIT que
está sendo desenvolvido há quatro anos para "aprender"por conta própria - quando algum
de seus movimentos dá errado, seu computador apaga as conexões elétricas responsáveis
pelo fracasso. No estágio atual, o Cog já tem a inteligência de um gatinho recém-nascido.
Para avançar mais, terá de aprender a se comunicar com os humanos. A cabeça robótica
interativa surgiu para ajudar na tarefa. No futuro, as duas engenhocas deverão ser fun-
didas numa só. "Queremos construir sistemas capazes de interagir com seres humanos",
explica a cientista da computação Cynthia Breazeal, a "mãe"do Kismet. Por enquanto,
suas habilidades se limitam a um repertório de nove expressões faciais, que ele manifesta
em reação aos estímulos recebidos de fora. Quando Cynthia agita na sua frente um ursinho
de pelúcia ou qualquer outro objeto, ele sorri, satisfeito. Se a pesquisadora fica imóvel,
Kismet faz cara de triste; e fica irritado quando o brinquedo é chacoalhado num ritmo
rápido. Essa é a sua maneira de sinalizar se o estímulo recebido é adequado, insuficente
ou excessivo. Kismet não ouve, não fala e é incapaz de perceber o que significam os gestos
captados pela sua visão. Para os seus criadores, tudo bem. O bebê-robô não veio ao mundo
para ser um Einstein - basta conseguir se expressar. Cynthia acredita que, com o tempo,
seus recursos se tornarão mais sofisticados. "Nós também não nascemos com a capacidade
de nos relacionar com o mundo", observa. "Se os seres humanos podem aprender, nada
impede que um dia as máquinas também desenvolvam essa habilidade", diz a mãe coruja.
Se a sua criatura não chegar tão longe, servirá ao menos como inspiração para as fábricas
de brinquedos eletrônicos.
2
7 Curiosidades sobre o Kismet
Rodney Brooks, que dirigia até recentemente o Laboratório de Ciência da Computação e
Inteligência Artificial do MIT, decidiu em 1993 que desenvolveria um novo robô, invertendo
o processo dominante nas pesquisas da época. Ele abandonou a idéia de que as máquinas
deveriam dispor de um sistema cognitivo, e se concentrou em equipá-las com sentidos e
torná-las capazes de ação. O Cog, criado em 1993 e desenvolvido nos 11 anos posteriores,
foi criado para aprender como se fosse uma criança, com base em impulsos sensórios e
motores.
Já Cynthia Breazal, que começou a trabalhar com Brooks como aluna de pós-graduação,
em 1990, depois de cuidar de boa parte do trabalho básico de computação do Cog, decidiu
que seu projeto de doutorado seria a criação de um novo robô sociável. O projeto ganhou
o nome de Kismet, e se tornou o mais expressivo dos robôs sociáveis construídos até então,
dada sua capacidade de expressar algumas emoções básicas por meio de mudanças em
sua expressão facial - ou seja, posição dos olhos, lábios, sobrancelhas e orelhas de papel
cor-de-rosa.
Acionado por 15 computadores funcionando em paralelo, o Kismet funcionava mais
por aprendizado social do que em modo cognitivo. O robô foi dotado da capacidade de
reconhecer objetos de cores brilhantes, e de reagir à presença deles com uma expressão
entusiasmada. Na ausência de estímulos, ele assumia uma expressão entediada. Quando
os cientistas começaram a acenar com objetos coloridos para o aparelho, surgiu um des-
dobramento inesperado: o robô reconhecia os objetos e demonstrava entusiasmo; os seres
humanos, animados com a reação, redobravam seus esforços de exibição do objeto. Com
isso, era estabelecido um loop de retroalimentação social semelhante ao que surge quando
uma pessoa brinca com um bebê.
8 Site com Alguns Trabalhos Interessantes
http://www.math.tau.ac.il/~dcor/
3

Mais conteúdo relacionado

PPT
Aula1 Psicologia Do Dia A Dia
PPTX
o que é Inteligencia artificial (IA)
PDF
Computação vestível e 
interações com o corpo consciente
PDF
Ilusao de Otica
DOC
Monografía final
PPT
Examen informática educativa
DOCX
Orçamento público
PPTX
Diseño de Campañas y Web Marketing
Aula1 Psicologia Do Dia A Dia
o que é Inteligencia artificial (IA)
Computação vestível e 
interações com o corpo consciente
Ilusao de Otica
Monografía final
Examen informática educativa
Orçamento público
Diseño de Campañas y Web Marketing

Destaque (20)

DOCX
Desarrollo sustentable
PPTX
E portafolio melisa pabon
PPT
Cfsd 2010 aula 1ppt
PDF
Graphics Capabilities of Java Platform
PDF
Ambiente de desenvolvimento unificado com vagrant
PPT
Trabajo final Diseño de Proyectos
PPS
A logica dos_caes
PPTX
El origen y evolucion de los huracanes diusan
DOC
Ud definitiva
PDF
HSM ExpoManagement 2012
PDF
1º Trimestre de 2014 Lição 08 - Moisés e sua Liderança
PPTX
Diapositivas
PDF
Evaluación de riesgos
PPTX
Diapositivas sena
PDF
Manual rastrearinfo
DOC
Flexion final
DOCX
Objetivo unidad 1
PPT
Sp3 jeopardy midterm_review 2014
PPSX
Presentacion semana 6
PPTX
EL AMOR Y LAS PAREJAS.
Desarrollo sustentable
E portafolio melisa pabon
Cfsd 2010 aula 1ppt
Graphics Capabilities of Java Platform
Ambiente de desenvolvimento unificado com vagrant
Trabajo final Diseño de Proyectos
A logica dos_caes
El origen y evolucion de los huracanes diusan
Ud definitiva
HSM ExpoManagement 2012
1º Trimestre de 2014 Lição 08 - Moisés e sua Liderança
Diapositivas
Evaluación de riesgos
Diapositivas sena
Manual rastrearinfo
Flexion final
Objetivo unidad 1
Sp3 jeopardy midterm_review 2014
Presentacion semana 6
EL AMOR Y LAS PAREJAS.
Anúncio

Semelhante a Computer Vision - Presentation Notes (20)

PDF
Inteligência Artificial-Ficção Científica e Realidade
PDF
A Mente e o Significado - Jerome Bruner
PDF
Bruner-a-mente-e-o-significado
DOCX
A impossibilidade do computador pensar como o ser humano
PPTX
Workshop Interface cérebro-máquina
PPTX
Aula 4 Fatores Humanos - parte 1 - Disciplina de IHC
PPT
Hamlet no holoedeck: A descendência de eliza
PDF
Do criador à Criatura: Os passos do Processo Criativo
PPT
UnimobilevillecomunicaçãOea
PDF
94 orgãos dos sentidos 1
PPTX
Ia labidi p1
PDF
Apostila lógica e criatividade
PPS
Uma mente e dois cérebros
PDF
Comunicação e inteligência artificial: interagindo com a robô de conversação ...
PDF
HCI - Mental Model
PPS
Trabalho do Grupo 3 - Psicologia
PPTX
multideterminacao do ser humano socio historia
PDF
Reflexões sobre temas polêmicos
PPTX
Inteligência Artificial e Oportunidades.pptx
DOC
Inteligência Artificial-Ficção Científica e Realidade
A Mente e o Significado - Jerome Bruner
Bruner-a-mente-e-o-significado
A impossibilidade do computador pensar como o ser humano
Workshop Interface cérebro-máquina
Aula 4 Fatores Humanos - parte 1 - Disciplina de IHC
Hamlet no holoedeck: A descendência de eliza
Do criador à Criatura: Os passos do Processo Criativo
UnimobilevillecomunicaçãOea
94 orgãos dos sentidos 1
Ia labidi p1
Apostila lógica e criatividade
Uma mente e dois cérebros
Comunicação e inteligência artificial: interagindo com a robô de conversação ...
HCI - Mental Model
Trabalho do Grupo 3 - Psicologia
multideterminacao do ser humano socio historia
Reflexões sobre temas polêmicos
Inteligência Artificial e Oportunidades.pptx
Anúncio

Mais de Michel Alves (20)

PDF
Texture Synthesis: An Approach Based on GPU Use
PDF
Intelligent Transfer of Thematic Harmonic Color Palettes
PDF
A Framework for Harmonic Color Measures
PDF
Effectiveness of Image Quality Assessment Indexes
PDF
Introduction to Kernel Functions
PDF
About Perception and Hue Histograms in HSV Space
PDF
Color Harmonization - Results
PDF
Wave Simulation Using Perlin Noise
PDF
Similarity Maps Using SSIM Index
PDF
Qualifying Exam - Image-Based Reconstruction With Color Harmonization
PDF
TMS - Schedule of Presentations and Reports
PDF
Month Presentations Schedule - March/2015 - LCG/UFRJ
PDF
Color Palettes in R
PDF
Sigmoid Curve Erf
PDF
Hue Wheel Prototype
PDF
Cosine Curve
PDF
Triangle Mesh Plot
PDF
Triangle Plot
PDF
Capacity-Constrained Point Distributions :: Video Slides
PDF
Capacity-Constrained Point Distributions :: Density Function Catalog
Texture Synthesis: An Approach Based on GPU Use
Intelligent Transfer of Thematic Harmonic Color Palettes
A Framework for Harmonic Color Measures
Effectiveness of Image Quality Assessment Indexes
Introduction to Kernel Functions
About Perception and Hue Histograms in HSV Space
Color Harmonization - Results
Wave Simulation Using Perlin Noise
Similarity Maps Using SSIM Index
Qualifying Exam - Image-Based Reconstruction With Color Harmonization
TMS - Schedule of Presentations and Reports
Month Presentations Schedule - March/2015 - LCG/UFRJ
Color Palettes in R
Sigmoid Curve Erf
Hue Wheel Prototype
Cosine Curve
Triangle Mesh Plot
Triangle Plot
Capacity-Constrained Point Distributions :: Video Slides
Capacity-Constrained Point Distributions :: Density Function Catalog

Último (20)

PPTX
Aula de psicofarmacologia: classes de psicofármacos
PPTX
Slides Lição 9, Betel, A Triunidade Divina, 3Tr25.pptx
PDF
SLIDES da Palestra Da Educação especial para Educação Inclusiva.pdf
PDF
DIÁLOGO DE LÍNGUA PORTUGUESA_ A NOVA MATRIZ .pptx (1).pdf
PDF
ebook_historia_pessoal_dos_mitos_gregos.pdf
PPTX
introdução a informatica e suas peculiaridades
PDF
Sociologia Cultural, Aspecto teóricos e conceitos
PDF
Ditadura Militar 🪖 -Estanlley_20250820_214056_0000.pdf
PDF
Solucões-inovadoras-para-reduzir-desigualdades-educacionais (2).pdf
PPTX
Treinamento de Espaço Confinado_Trabalhadores e Vigias NR 33.pptx
PPT
Histologia e Fisiologia Vegetal.ppt Aula
PPTX
Guerra Fria, seus desdobramentos e resultados
PDF
Poema Minha Pátria. Análise e compreensão do poema
DOCX
Aula 3- Direitos Humanos e Prevenção à Violência .docx
PPTX
sistema circulatório ppt.pptxxxxxxxxxxxxxxx
PPTX
CIPA+-++Mapa+de+Risco-1.pptx levantamento
PDF
diário de palestra DDS Online - Apostila.pdf
PDF
Escala de Proficiência do SAEB_Escala de Proficiência do SAEB
PDF
Educacao_Contempranea_educação paulo freire
PPTX
Apresentacao-Plano-de-Gestao-Escolar-1.pptx
Aula de psicofarmacologia: classes de psicofármacos
Slides Lição 9, Betel, A Triunidade Divina, 3Tr25.pptx
SLIDES da Palestra Da Educação especial para Educação Inclusiva.pdf
DIÁLOGO DE LÍNGUA PORTUGUESA_ A NOVA MATRIZ .pptx (1).pdf
ebook_historia_pessoal_dos_mitos_gregos.pdf
introdução a informatica e suas peculiaridades
Sociologia Cultural, Aspecto teóricos e conceitos
Ditadura Militar 🪖 -Estanlley_20250820_214056_0000.pdf
Solucões-inovadoras-para-reduzir-desigualdades-educacionais (2).pdf
Treinamento de Espaço Confinado_Trabalhadores e Vigias NR 33.pptx
Histologia e Fisiologia Vegetal.ppt Aula
Guerra Fria, seus desdobramentos e resultados
Poema Minha Pátria. Análise e compreensão do poema
Aula 3- Direitos Humanos e Prevenção à Violência .docx
sistema circulatório ppt.pptxxxxxxxxxxxxxxx
CIPA+-++Mapa+de+Risco-1.pptx levantamento
diário de palestra DDS Online - Apostila.pdf
Escala de Proficiência do SAEB_Escala de Proficiência do SAEB
Educacao_Contempranea_educação paulo freire
Apresentacao-Plano-de-Gestao-Escolar-1.pptx

Computer Vision - Presentation Notes

  • 1. Inteligência Artificial I - Visão Computacional Michel Alves dos Santos ∗ 07 de Junho de 2011 1 Percebendo o Mundo Como podemos perceber o mundo a nossa volta? Resposta: através de nossos sentidos. E o mais importante deles é a visão. Nesse momento faz-se juízo a celebre frase ‘uma imagem vale mais do que mil palavras’. 2 Anatomia do Olho Humano e Processo de Visão O globo ocular, com cerca de 25 milímetros de diâmetro, é o responsável pela captação da luz refletida pelos objetos à nossa volta. Essa luz atinge em primeiro lugar nossa córnea, que é um tecido transparente que cobre nossa íris como o vidro de um relógio. Em seu caminho, a luz agora passa através do humor aquoso, penetrando no globo ocular pela pupila, atingindo imediatamente o cristalino que funciona como uma lente de focalização, convergindo então os raios luminosos para um ponto focal sobre a retina. Na retina, mais de cem milhões de células fotossensíveis transformam a luz em impulsos eletroquímicos, que são enviados ao cérebro pelo nervo óptico. No cérebro, mais precisamente no córtex visual ocorre o processamento das imagens recebidas pelo olho direito e esquerdo completando então nossa sensação visual. O olho humano é um órgão da visão, no qual uma imagem óptica do mundo externo é produzida e transformada em impulsos nervosos e conduzida ao cérebro. 3 Visão Computacional Campo da Computação Gráfica que desenvolve teoria e tecnologia para a construção de sistemas artificiais capazes de analisar entradas visuais. ∗ Bacharelando em Ciência da Computação, Universidade Federal do Estado de Alagoas(UFAL), Bol- sista do Laboratório de Modelagem Geométrica e Visão Computacional do Centro de Pesquisa em Ma- temática Computacional(CPMAT), Brasil - Maceió/AL, Tel: 8805-0582 E-mail: [email protected], [email protected] 1
  • 2. 4 Máquinas e Percepção Percepção de máquina é a habilidade de usar a entrada de sensores (como câmeras, mi- crofones, sonar e outrs aparelhos) para deduzir aspectos do mundo. Visão Computacional é a habilidade de analisar entradas visuais. Alguns subproblemas da área de percepção de máquina são o reconhecimento de linguagem(fala ou discurso), o reconhecimento facial e o reconhecimento de objetos. http://en.wikipedia.org/wiki/Artificial_intelligence 5 Harry Porter’s Collection of Robot Videos http://web.cecs.pdx.edu/~harry/Robots/index.html 6 Kismet O Robô-babá, que toma conta de bebês enquanto os pais trabalham ou vão jantar fora, por enquanto só existe em desenho animados. Mas a situação oposta já é realidade - um robô-bebê, paparicado o tempo todo por uma babá humana. Kismet, uma cabeça metá- lica de 3,6 quilos acoplada a um computador, é o projeto mais recente do Laboratório de Inteligência Artificial do MIT, o Instituto de Tecnologia de Massachusetts, nos Estados Unidos. Ele sorri e arregala doces olhos azuis quando tem um companheiro para brincar. Se está sozinho, fica triste e entediado. Kismet é o irmão caçula de Cog, o robô do MIT que está sendo desenvolvido há quatro anos para "aprender"por conta própria - quando algum de seus movimentos dá errado, seu computador apaga as conexões elétricas responsáveis pelo fracasso. No estágio atual, o Cog já tem a inteligência de um gatinho recém-nascido. Para avançar mais, terá de aprender a se comunicar com os humanos. A cabeça robótica interativa surgiu para ajudar na tarefa. No futuro, as duas engenhocas deverão ser fun- didas numa só. "Queremos construir sistemas capazes de interagir com seres humanos", explica a cientista da computação Cynthia Breazeal, a "mãe"do Kismet. Por enquanto, suas habilidades se limitam a um repertório de nove expressões faciais, que ele manifesta em reação aos estímulos recebidos de fora. Quando Cynthia agita na sua frente um ursinho de pelúcia ou qualquer outro objeto, ele sorri, satisfeito. Se a pesquisadora fica imóvel, Kismet faz cara de triste; e fica irritado quando o brinquedo é chacoalhado num ritmo rápido. Essa é a sua maneira de sinalizar se o estímulo recebido é adequado, insuficente ou excessivo. Kismet não ouve, não fala e é incapaz de perceber o que significam os gestos captados pela sua visão. Para os seus criadores, tudo bem. O bebê-robô não veio ao mundo para ser um Einstein - basta conseguir se expressar. Cynthia acredita que, com o tempo, seus recursos se tornarão mais sofisticados. "Nós também não nascemos com a capacidade de nos relacionar com o mundo", observa. "Se os seres humanos podem aprender, nada impede que um dia as máquinas também desenvolvam essa habilidade", diz a mãe coruja. Se a sua criatura não chegar tão longe, servirá ao menos como inspiração para as fábricas de brinquedos eletrônicos. 2
  • 3. 7 Curiosidades sobre o Kismet Rodney Brooks, que dirigia até recentemente o Laboratório de Ciência da Computação e Inteligência Artificial do MIT, decidiu em 1993 que desenvolveria um novo robô, invertendo o processo dominante nas pesquisas da época. Ele abandonou a idéia de que as máquinas deveriam dispor de um sistema cognitivo, e se concentrou em equipá-las com sentidos e torná-las capazes de ação. O Cog, criado em 1993 e desenvolvido nos 11 anos posteriores, foi criado para aprender como se fosse uma criança, com base em impulsos sensórios e motores. Já Cynthia Breazal, que começou a trabalhar com Brooks como aluna de pós-graduação, em 1990, depois de cuidar de boa parte do trabalho básico de computação do Cog, decidiu que seu projeto de doutorado seria a criação de um novo robô sociável. O projeto ganhou o nome de Kismet, e se tornou o mais expressivo dos robôs sociáveis construídos até então, dada sua capacidade de expressar algumas emoções básicas por meio de mudanças em sua expressão facial - ou seja, posição dos olhos, lábios, sobrancelhas e orelhas de papel cor-de-rosa. Acionado por 15 computadores funcionando em paralelo, o Kismet funcionava mais por aprendizado social do que em modo cognitivo. O robô foi dotado da capacidade de reconhecer objetos de cores brilhantes, e de reagir à presença deles com uma expressão entusiasmada. Na ausência de estímulos, ele assumia uma expressão entediada. Quando os cientistas começaram a acenar com objetos coloridos para o aparelho, surgiu um des- dobramento inesperado: o robô reconhecia os objetos e demonstrava entusiasmo; os seres humanos, animados com a reação, redobravam seus esforços de exibição do objeto. Com isso, era estabelecido um loop de retroalimentação social semelhante ao que surge quando uma pessoa brinca com um bebê. 8 Site com Alguns Trabalhos Interessantes http://www.math.tau.ac.il/~dcor/ 3