Image Captioning with RNN and CNN

Uploaded by

Rubak Daniel W

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

52 views18 pages

Image Captioning with RNN and CNN

Uploaded by

Rubak Daniel W

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

IMAGE CAPTIONING BOT

Made By ~
Aman Bahuguna (18BCS2441)
Deepak Yadav (18BCS2446)
Gyan Ranjan Kumar (18BCS2431)
TABLE OF CONTENT

• Project Description
• Datasets
• Models: RNN + CNN
• Architecture details
• Evaluation problems
• Results
INTRODUCTION
What do you See in the Picture?
Well some of you
might say “A white
dog in a grassy area”,
some may say “White
dog with brown spots”
and yet some others
might say “A dog on
grass and some pink
flowers”.
But, can you write a computer program that takes an image as
input and produces a relevant caption as output?
APPLICATION OF IMAGE CAPTIONING

 Probably can be used in the applications where text is used mostly and with the
use of this we can infer a image in form of text.
 NLP is used extensively in the market now-a-days. For example, summarizing
or gaining insights from a large corpus of text. In the same way, we can use the
same concept to get insights from images as well.
 We can build a 360-degree metastore and make use of it in a wide variety of
business like making user searches more efficient on an e-commerce platform
based on metadata of products, other may be some other things like
recommendations and all.
 We can describe like what happen in a given video segment.
 Can be used to give something back to mankind for visually impaired people.
and many more.
DATASETS
 Flickr8k
 8000 images, each annotated with 5 sentences via AMT
Training Set — 6000 images
Dev Set — 1000 images
Test Set — 1000 images

• A child in a pink dress is climbing up a set of stairs in an

entry way
• A girl going into a wooden building .
• A little girl climbing into a wooden playhouse .
• A little girl climbing the stairs to her playhouse .
• A little girl in a pink dress going into a wooden cabin .
Keras is an open-source software library that provides
a Python interface for artificial neural networks. Keras acts as an
interface for the TensorFlow library.
MODELS: RNN + CNN

How to combine image and and sentence

RNN + CNN:
• Encoder-decoder model
• Multimodal layer
Encoder-decoder model: image caption
Multimodal Layer
ENCODER-DECODER MODEL:
MODEL ARCHITECTURE
ARCHITECTURE DETAILS:
WORD EMBEDDINGS

To encode the words in form of vector using Gloves

FULL MODEL DETAILS
OUTPUT GENERATIONS
OUTPUT
THANK YOU

Image Caption Generator Project Report
No ratings yet
Image Caption Generator Project Report
27 pages
Image Caption Generator Project Report
No ratings yet
Image Caption Generator Project Report
39 pages
Deep Learning for Image Captioning
No ratings yet
Deep Learning for Image Captioning
6 pages
Image Caption Generator Project Report
No ratings yet
Image Caption Generator Project Report
27 pages
Automated Image Captioning with CNN-RNN
No ratings yet
Automated Image Captioning with CNN-RNN
17 pages
CNN-LSTM Image Captioning System
No ratings yet
CNN-LSTM Image Captioning System
34 pages
Automated Image Captioning System
No ratings yet
Automated Image Captioning System
12 pages
Implementation of Simple and Efficient P
No ratings yet
Implementation of Simple and Efficient P
8 pages
CNN and LSTM for Image Captioning
No ratings yet
CNN and LSTM for Image Captioning
4 pages
Image Caption Generator Using CNN & LSTM
No ratings yet
Image Caption Generator Using CNN & LSTM
6 pages
Image Captioning with CNN and LSTM
No ratings yet
Image Captioning with CNN and LSTM
11 pages
Image Caption Generator Using Deep Learning
No ratings yet
Image Caption Generator Using Deep Learning
9 pages
Image Caption Generator Using CNN-LSTM
No ratings yet
Image Caption Generator Using CNN-LSTM
19 pages
Building A Voice Based Image Caption Generator With Deep Learning
No ratings yet
Building A Voice Based Image Caption Generator With Deep Learning
6 pages
Deep Learning Image Caption Generator
No ratings yet
Deep Learning Image Caption Generator
9 pages
Image Caption Detection Using CNN and LSTM
No ratings yet
Image Caption Detection Using CNN and LSTM
14 pages
DL Group 6 Rep
No ratings yet
DL Group 6 Rep
11 pages
CNN-LSTM Image Captioning Model
No ratings yet
CNN-LSTM Image Captioning Model
9 pages
RP Springer
No ratings yet
RP Springer
10 pages
Image To Caption Generator
No ratings yet
Image To Caption Generator
7 pages
Image Caption Generation with Deep Learning
No ratings yet
Image Caption Generation with Deep Learning
6 pages
Neural Image Caption Generator Overview
No ratings yet
Neural Image Caption Generator Overview
9 pages
Image Captioning with Flickr Datasets
No ratings yet
Image Captioning with Flickr Datasets
51 pages
Deep Learning Image Caption Generator
No ratings yet
Deep Learning Image Caption Generator
16 pages
AI Image Captioning Techniques
No ratings yet
AI Image Captioning Techniques
17 pages
IJIEMR March 2023 COPY RIGHT (2 Files Merged)
No ratings yet
IJIEMR March 2023 COPY RIGHT (2 Files Merged)
8 pages
Image Captioning for Visually Impaired
No ratings yet
Image Captioning for Visually Impaired
16 pages
Deep Learning for Image Captioning
No ratings yet
Deep Learning for Image Captioning
6 pages
Research Paper Final
No ratings yet
Research Paper Final
5 pages
Autonomous Image Captioning Project
No ratings yet
Autonomous Image Captioning Project
35 pages
RNN vs LSTM for Image Captioning Accuracy
No ratings yet
RNN vs LSTM for Image Captioning Accuracy
8 pages
Image Caption Generation with Deep Learning
No ratings yet
Image Caption Generation with Deep Learning
7 pages
Image Captioning Generator Using Deep Machine Learning
No ratings yet
Image Captioning Generator Using Deep Machine Learning
3 pages
Deep Learning for Image Captioning
No ratings yet
Deep Learning for Image Captioning
21 pages
Image Caption Generator with CNN & LSTM
No ratings yet
Image Caption Generator with CNN & LSTM
5 pages
AI Image Caption Generation Overview
No ratings yet
AI Image Caption Generation Overview
9 pages
Image Caption Generation with Deep Learning
No ratings yet
Image Caption Generation with Deep Learning
5 pages
Image Captioning with Neural Networks
No ratings yet
Image Captioning with Neural Networks
17 pages
Deep Learning for Image Captioning
No ratings yet
Deep Learning for Image Captioning
14 pages
AI Digital Assistant for the Visually Impaired
50% (2)
AI Digital Assistant for the Visually Impaired
28 pages
Image Caption Generator Project Overview
No ratings yet
Image Caption Generator Project Overview
13 pages
Deep Learning for Image Captioning
No ratings yet
Deep Learning for Image Captioning
6 pages
Bengali Image Captioning with Transformers
No ratings yet
Bengali Image Captioning with Transformers
72 pages
Image Captioning Generator Using CNN and LSTM
No ratings yet
Image Captioning Generator Using CNN and LSTM
8 pages
Deep Learning for Image Captioning
No ratings yet
Deep Learning for Image Captioning
18 pages
Automatic Image Captioning Overview
No ratings yet
Automatic Image Captioning Overview
10 pages
Image Caption Generator Project Overview
No ratings yet
Image Caption Generator Project Overview
10 pages
Image Captioning with CNN and LSTM
No ratings yet
Image Captioning with CNN and LSTM
8 pages
Automatic Image Captioning Proposal
No ratings yet
Automatic Image Captioning Proposal
3 pages
Use Case Diagram for Image Captioning
No ratings yet
Use Case Diagram for Image Captioning
31 pages
Streamlined Image Captioning Project
No ratings yet
Streamlined Image Captioning Project
3 pages
Neural Network Image Captioning Techniques
No ratings yet
Neural Network Image Captioning Techniques
9 pages
Image Captioning AI for Visual Aid
No ratings yet
Image Captioning AI for Visual Aid
7 pages
Image Captioning with Deep Learning Models
No ratings yet
Image Captioning with Deep Learning Models
3 pages
Image Captioning with Deep Learning
No ratings yet
Image Captioning with Deep Learning
66 pages
Attention-Based Image Captioning Model
No ratings yet
Attention-Based Image Captioning Model
9 pages
IJNRD2309143
No ratings yet
IJNRD2309143
11 pages
Deep Learning Image Caption Generator
100% (1)
Deep Learning Image Caption Generator
20 pages
Intel's Evolving Advertising Strategies
No ratings yet
Intel's Evolving Advertising Strategies
3 pages
KPIT Internship: AutoTrack Project Report
No ratings yet
KPIT Internship: AutoTrack Project Report
35 pages
Carrier Selection in Land Transport
No ratings yet
Carrier Selection in Land Transport
5 pages
Iphone Configuration Utility
100% (1)
Iphone Configuration Utility
20 pages
YMF262 Datasheet Configuration Guide
No ratings yet
YMF262 Datasheet Configuration Guide
9 pages
Optical LNB: Revolutionizing Satellite Reception
No ratings yet
Optical LNB: Revolutionizing Satellite Reception
4 pages
Eclipse Burners Parts List 140-3
No ratings yet
Eclipse Burners Parts List 140-3
2 pages
1 Mbit (128 Kbit X 8) UV EPROM and OTP EPROM: Features
No ratings yet
1 Mbit (128 Kbit X 8) UV EPROM and OTP EPROM: Features
24 pages
ELEQ GSA Cast Resin Transformers
No ratings yet
ELEQ GSA Cast Resin Transformers
4 pages
AIS-038: Battery Vehicle Safety Standards
No ratings yet
AIS-038: Battery Vehicle Safety Standards
20 pages
LG Chem Resu Datasheet
No ratings yet
LG Chem Resu Datasheet
14 pages
HVAC Maintenance Engineer Role in Sarawak
No ratings yet
HVAC Maintenance Engineer Role in Sarawak
2 pages
Understanding SSD: Types and Benefits
No ratings yet
Understanding SSD: Types and Benefits
21 pages
Virus Threats on Datapro Website
No ratings yet
Virus Threats on Datapro Website
10 pages
CSE 425 Final Exam: Microprocessors
No ratings yet
CSE 425 Final Exam: Microprocessors
3 pages
Database Backup and Recovery Guide
No ratings yet
Database Backup and Recovery Guide
10 pages
TFT-LCD TV/Monitor Service Manual
100% (1)
TFT-LCD TV/Monitor Service Manual
115 pages
Eltek Flatpack2 48V Solar Charger
No ratings yet
Eltek Flatpack2 48V Solar Charger
2 pages
Implementing User Exits in SAP
No ratings yet
Implementing User Exits in SAP
9 pages
DHI-ARC3008C Video Surveillance Guide
No ratings yet
DHI-ARC3008C Video Surveillance Guide
5 pages
Se License Manager Guide
No ratings yet
Se License Manager Guide
93 pages
HVDC Transmission Systems Overview
100% (1)
HVDC Transmission Systems Overview
19 pages
Mini Machine Programming Guide
No ratings yet
Mini Machine Programming Guide
2 pages
Framework for Automating Software Testing
No ratings yet
Framework for Automating Software Testing
15 pages
Java Control Flow Statements Explained
No ratings yet
Java Control Flow Statements Explained
20 pages
Report
No ratings yet
Report
197 pages
Line Isolation Monitor Software Guide
No ratings yet
Line Isolation Monitor Software Guide
488 pages
Resume of Mohammed Shamsuddin
No ratings yet
Resume of Mohammed Shamsuddin
3 pages
PLTools Magazine
No ratings yet
PLTools Magazine
32 pages
PMP Time Management Quiz
No ratings yet
PMP Time Management Quiz
5 pages