0% found this document useful (0 votes)

265 views2 pages

Data Science and Analytics Expertise

This document contains a resume for Arunabha Gupta, including contact information, past work experience at TCS, IBM, and Cognizant, technical skills in Python, SQL, machine learning algorithms, and tools like Palantir Foundry and Databricks. It also summarizes projects done in areas like claims analysis, customer insights, and dashboard design.

Uploaded by

Arunabha Gupta

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

265 views2 pages

Data Science and Analytics Expertise

Uploaded by

Arunabha Gupta

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

ARUNABHA GUPTA

arunabhagupta11@[Link]
Contact No - 9903827152
Permanent Address: The Preserve, Flat 101, Belathur Colony, Bangalore-560067

My Belief: To learn continuously, contribute effectively and grow consistently both as an individual & as a team.
Past Experience:
TCS - 4.75 Years, Bangalore (Swiss Reinsurance (Life & Health), Deutsche Bank (Private& Commercial Clients (PCC) International))
IBM - 11 Months, Kolkata (DHL (Customer Analytics), XL (Claims Analytics))
Cognizant - 4.83 Years, Kolkata (Travelers (Claims Analytics), BNY Mellon, Nike (Order Fulfillment), Walmart, Belk)
PROFILE
 Design and build data pipelines for business use case which in turn populates a use case specific data lake
 Design and build data utilities for data cleaning, harmonizing and anonymization
 Design and build write back enabled applications with interactive widgets
 Carry out exploratory analysis on data science use cases
 Hands on experience on Sentiment Analysis, Text Mining, NLP, Unsupervised and Supervised techniques such as
regression, classification, clustering and other applied predictive techniques

TECHNICAL DETAILS
 Languages: Python, Pyspark, SQL, YAML, PostgresSQL , Spark ML
 Analytical Skills: Exploratory Data Analysis, Hypothesis Testing
Supervised and Un-Supervised Machine Learning Techniques such as Linear Regression, Logistic Regression,
Ensemble Techniques-Bagging, boosting, Random Forest, Natural Language processing-Sentiment Analysis, Topic
Mining, Neural Network, KNN,PCA
 Tools: Palantir Foundry (SLATE, CONTOUR, HUBBLE, CODE_REPO, CODE_WORKBOOK)
Cognos, Azure ML Databricks, Jupyter Notebook, PowerBI, GCP, AWS
PROFESSIONAL EXPERIENCE
Data Science:
Claims Customer International Address Parsing:
 Multilingual tokenization (Using Hidden Markov Model)
 Abbreviation expansion (Using Wordnet)
 Address language classification (Using the FTRL-Proximal method to induce sparsity)
 Numeric expression parsing
Health-Care Claims Customer insights:
 Analyzing customer feedback records for Topic Modelling. (Using Hierarchical Bayesian Model-Latent Dirichlet Allocation).
 Emotion Mining and getting Sentiment Scores.
Twitter Customer Sentiment Analysis:
 Sourcing data via spark streaming and twitter API, data cleaning
 Data understanding and pre-processing text by translating non-English comments using goggle translator, handling
emoji etc.
 Identifying different aspects in text data using analytical techniques such as topic modelling
Industry Categorization:
 Gathering data from client provided API via customized scrapper
 Cleaning data, preprocessing steps
 Data visualization and EDA to determine variable importance
 Feature engineering to create variables that were used in training model
 Model Selection (Used Random Forest and Stochastic Gradient Descent Model)
 Building machine learning data pipelines
Clustering - Statistically grouping furnaces with similar efficiency & finding factors affecting efficiency:
 Pre-processing data and cleaning of data
 Dimensionality Reduction using (PCA/LDA)
 Determining optimal number of clusters using Elbow curve
 Internal Cluster Validation using Silhouette score
Data Utilities:
Designing data utilities to ensure seamless ingestion of data from unstructured raw files.
 Data cleaning and data harmonization
 Data anonymization and combining multiple data files into a single source
 Snake casing using customized library
 Dataset homogeneity utility
 Dataset formatting utility
 Palantir Foundry platform specific tools used: CODE-Workbook for automation
 Build tool: gradle
 Versioning: GIT
Data Engineering:
Build Data pipelines on a scalable data platform.
 Sourcing data from unstructured/structured raw files
 Cleaning data as per industry standards
 Building data pipelines for the underlying business logic
 Optimizing the code for efficient memory utilization
 Explaining the technical implications in an understandable manner to end business users
 Designing Dashboards for business users to validate the changes
Data Pipeline Business Use Cases I have so far worked on
 Premium Validation and Anomaly detection
 Mortality Analysis
 Medical Reinsurance
 Smart Underwriting Risk Assessment
 Valuations
 Covid-19 Response
 Covid-19 What If analysis – In partnership with Palantir
 Palantir platform specific tools used: CONTOUR/HUBBLE/CODE-REPO
 Build Tool: Gradle
 Versioning: GIT
Dashboard Designing/Application Design:
Building applications on scalable analytics platform
Primarily responsible for developing interactive dashboards using Cognos/PowerBI for end business users.
Additionally I was able to scale up to developing front-end applications on SLATE - Palantir Foundry
Applications Contributed In:
 Actual vs. Expected & Data Freshness dashboard for SwissRe Life and Health
Dashboards Contributed In:
 Private and Commercial Clients International for Deutsche Bank Spain
 Claims dashboard for XL Catlin Group
 Order Fulfillment System dashboard for Nike US
 Insurance dashboard for Travelers Inc.
 Store Expansion Dashboard for Walmart US
 Tools: Cognos/PowerBI/Palantir Foundry SLATE
 Build Tool: Gradle
 Versioning: GIT

AWARDS AND RECOGNITION

TCS: [Link]
IBM: Best Performer (Internal)
CTS: Pearls of Wisdom (Internal)

ACADEMIC PROFILE
Degree University/Institution Year (CGPA)
Bachelor in Comp App WBUT 2010(83%)

Market Guide for Materials Informatics
No ratings yet
Market Guide for Materials Informatics
30 pages
Challenges and Strategies in PKPD Programming
No ratings yet
Challenges and Strategies in PKPD Programming
6 pages
Life Sciences Technology Insights 2024
No ratings yet
Life Sciences Technology Insights 2024
14 pages
Veeva's Market Challenges and Valuation Risks
No ratings yet
Veeva's Market Challenges and Valuation Risks
19 pages
New Hire Orientation Veeva Spain 2023
No ratings yet
New Hire Orientation Veeva Spain 2023
17 pages
Unlocking Insights with AI in Metabolomics
No ratings yet
Unlocking Insights with AI in Metabolomics
34 pages
Why BI Fails When It Does
No ratings yet
Why BI Fails When It Does
7 pages
Merck - Cromatografia
No ratings yet
Merck - Cromatografia
406 pages
Palantir Privacy Governance Overview
No ratings yet
Palantir Privacy Governance Overview
25 pages
Tcs Book
No ratings yet
Tcs Book
40 pages
Palantir's Secure Communication Strategies
No ratings yet
Palantir's Secure Communication Strategies
11 pages
Hortonworks Data Platform Installing HDP On Windows
No ratings yet
Hortonworks Data Platform Installing HDP On Windows
84 pages
Machine Learning for Sales Prediction
No ratings yet
Machine Learning for Sales Prediction
11 pages
Data Science Resume for Tech Roles
No ratings yet
Data Science Resume for Tech Roles
3 pages
Persistent Forecasting of Disruptive Technologies
No ratings yet
Persistent Forecasting of Disruptive Technologies
137 pages
Palantir Foundry Data Engineer Exam Guide
No ratings yet
Palantir Foundry Data Engineer Exam Guide
7 pages
BLACK and JOLLY Chapt. 1-3-7-8.ArchByDesignChapters
No ratings yet
BLACK and JOLLY Chapt. 1-3-7-8.ArchByDesignChapters
34 pages
Dell and Intel Security Thought Leadership
No ratings yet
Dell and Intel Security Thought Leadership
11 pages
Automated eCRF Development in Trials
No ratings yet
Automated eCRF Development in Trials
6 pages
Digital Life Science Platform Insights
100% (1)
Digital Life Science Platform Insights
15 pages
POROS™ Chromatography Resins
No ratings yet
POROS™ Chromatography Resins
55 pages
Creating Value From Next-Generation Real-World Evidence
No ratings yet
Creating Value From Next-Generation Real-World Evidence
9 pages
Pharmaceutical Success Probability Analysis
100% (1)
Pharmaceutical Success Probability Analysis
42 pages
Trimble Sps 930 Uts
No ratings yet
Trimble Sps 930 Uts
2 pages
Data Science & Engineering Program Overview
No ratings yet
Data Science & Engineering Program Overview
20 pages
FPLC SystemManual
No ratings yet
FPLC SystemManual
86 pages
Big Data and ML in Bank Supervision
No ratings yet
Big Data and ML in Bank Supervision
13 pages
Veeva Systems: Market Analysis & Risks
No ratings yet
Veeva Systems: Market Analysis & Risks
23 pages
Anomaly Detection Techniques Explained
No ratings yet
Anomaly Detection Techniques Explained
8 pages
Raspberry Pi Portable Surveillance System
100% (1)
Raspberry Pi Portable Surveillance System
37 pages
Churn Prediction with Machine Learning
No ratings yet
Churn Prediction with Machine Learning
77 pages
Intelligent Decision Support in Textiles
No ratings yet
Intelligent Decision Support in Textiles
132 pages
Similar Jobs: CRA I/II/SCRA/Principal CRA - Homebased Anywhere in New Zealand
No ratings yet
Similar Jobs: CRA I/II/SCRA/Principal CRA - Homebased Anywhere in New Zealand
1 page
Decentralized Clinical Trials Guidance
No ratings yet
Decentralized Clinical Trials Guidance
19 pages
Calibre nm Platform Overview and DRC
No ratings yet
Calibre nm Platform Overview and DRC
39 pages
qwikMD and NAMD Tutorial Guide
No ratings yet
qwikMD and NAMD Tutorial Guide
22 pages
Capturing Factor Premia: September 2015
No ratings yet
Capturing Factor Premia: September 2015
10 pages
Understanding the Genesis of IoT
No ratings yet
Understanding the Genesis of IoT
15 pages
Testing Online Banking Applications - A Hypothesis
0% (1)
Testing Online Banking Applications - A Hypothesis
6 pages
Quality Engineer Resume: Pharma & Biotech
No ratings yet
Quality Engineer Resume: Pharma & Biotech
5 pages
Unified Analytics Disrupting Traditional Healthcare Delivery and Driving The Future of Health
No ratings yet
Unified Analytics Disrupting Traditional Healthcare Delivery and Driving The Future of Health
13 pages
Fortify Sys Reqs 22.1.0
100% (1)
Fortify Sys Reqs 22.1.0
66 pages
FlexMix: Finite Mixture Models in R
No ratings yet
FlexMix: Finite Mixture Models in R
18 pages
SR-2000 Manuale Completo
No ratings yet
SR-2000 Manuale Completo
118 pages
AI's Disruption in Neurology and Healthcare
No ratings yet
AI's Disruption in Neurology and Healthcare
29 pages
ADAM
No ratings yet
ADAM
12 pages
MAN - MFG013 - RevE - Plate Express Users Manual
No ratings yet
MAN - MFG013 - RevE - Plate Express Users Manual
30 pages
Digital Twins for Health: Scoping Review
No ratings yet
Digital Twins for Health: Scoping Review
11 pages
BDA Course Overview at Apex Institute
No ratings yet
BDA Course Overview at Apex Institute
13 pages
Data Strategies for Modern Marketers
No ratings yet
Data Strategies for Modern Marketers
4 pages
Nationwide Ventilator Database Proposal
No ratings yet
Nationwide Ventilator Database Proposal
2 pages
Veracode Manual Penetration Testing Overview
No ratings yet
Veracode Manual Penetration Testing Overview
2 pages
Scribed
No ratings yet
Scribed
12 pages
Syed Ismail Khadry: Website
No ratings yet
Syed Ismail Khadry: Website
4 pages
PharmasAlmanac Q4 2020
No ratings yet
PharmasAlmanac Q4 2020
92 pages
U.S. Food & Drug Administration 10903 New Hampshire Avenue: Silver Spring, MD 20993
No ratings yet
U.S. Food & Drug Administration 10903 New Hampshire Avenue: Silver Spring, MD 20993
7 pages
ETL Informatica Developer Resume
No ratings yet
ETL Informatica Developer Resume
4 pages
Data Scientist Profile: Bala Bandaru
No ratings yet
Data Scientist Profile: Bala Bandaru
5 pages
SuvarnaAglave Resume US
No ratings yet
SuvarnaAglave Resume US
1 page
Multi-task Learning for Hate Detection
No ratings yet
Multi-task Learning for Hate Detection
7 pages
Future of Robotics
No ratings yet
Future of Robotics
7 pages
Jignasa Week-4 Preactivity Report
No ratings yet
Jignasa Week-4 Preactivity Report
2 pages
AI Biases in Newsvendor Decision-Making
No ratings yet
AI Biases in Newsvendor Decision-Making
26 pages
AI Innovations in Cultural Heritage R&D
No ratings yet
AI Innovations in Cultural Heritage R&D
23 pages
Dell Enterprise SONiC Distribution Overview
No ratings yet
Dell Enterprise SONiC Distribution Overview
3 pages
Python Machine Learning Projects Guide
100% (2)
Python Machine Learning Projects Guide
135 pages
Digital Agriculture for Sustainable Food Production
No ratings yet
Digital Agriculture for Sustainable Food Production
25 pages
AI Test Case Generation with Llama2
No ratings yet
AI Test Case Generation with Llama2
46 pages
Fuzzy Rule-Based Systems Overview
100% (1)
Fuzzy Rule-Based Systems Overview
111 pages
AI Robot's Perspective on Humanity
No ratings yet
AI Robot's Perspective on Humanity
2 pages
Engineering Intelligent Systems Systems Engineering and Design With Artificial Intelligence Visual Modeling 1st Edition Ebook & Testbank
No ratings yet
Engineering Intelligent Systems Systems Engineering and Design With Artificial Intelligence Visual Modeling 1st Edition Ebook & Testbank
255 pages
Aspiring Engineer & Web Developer Resume
No ratings yet
Aspiring Engineer & Web Developer Resume
1 page
Dimensionality Reduction in Machine Learning
No ratings yet
Dimensionality Reduction in Machine Learning
6 pages
Robots and the Umwelt Concept
No ratings yet
Robots and the Umwelt Concept
29 pages
AI and Nigerian Law: Challenges & Solutions
No ratings yet
AI and Nigerian Law: Challenges & Solutions
115 pages
Understanding IoT vs. Non-IoT Concepts
No ratings yet
Understanding IoT vs. Non-IoT Concepts
12 pages
RNN Limitations and Simple Model Overview
No ratings yet
RNN Limitations and Simple Model Overview
33 pages
Tech Lead Assignment: Math App Development
No ratings yet
Tech Lead Assignment: Math App Development
5 pages
Impact of AI on Jobs: Lesson 2 Activities
No ratings yet
Impact of AI on Jobs: Lesson 2 Activities
10 pages
XAI Techniques in Intrusion Detection Systems
No ratings yet
XAI Techniques in Intrusion Detection Systems
45 pages
Self-Guided Training for Image Generation
No ratings yet
Self-Guided Training for Image Generation
12 pages
Grade 12 Mock Test Questions
No ratings yet
Grade 12 Mock Test Questions
6 pages
2025 English Exam Practice Paper
No ratings yet
2025 English Exam Practice Paper
6 pages
AI Project Cycle and Problem Scoping Guide
No ratings yet
AI Project Cycle and Problem Scoping Guide
54 pages
AI Projects by Genba Moze College Students
No ratings yet
AI Projects by Genba Moze College Students
1 page
AI Opportunities for SMEs Explained
No ratings yet
AI Opportunities for SMEs Explained
3 pages
AI's Impact on Indian Universities: Challenges & Opportunities
No ratings yet
AI's Impact on Indian Universities: Challenges & Opportunities
15 pages
Marketing Cloud Growth Edition Overview
No ratings yet
Marketing Cloud Growth Edition Overview
22 pages
Smart Vision for Saudi Arabia's Future
100% (1)
Smart Vision for Saudi Arabia's Future
30 pages

Data Science and Analytics Expertise

Uploaded by

Data Science and Analytics Expertise

Uploaded by

ARUNABHA GUPTA

AWARDS AND RECOGNITION

You might also like