SUPARNA CHAKRABORTY

Actively Seeking Relocation Opportunities in Germany (Chancenkarte Eligible)

Angestellt, Senior Associate, PwC SDC
Kolkata, Indien

Fähigkeiten und Kenntnisse

ETL
SQL
PySpark
Microsoft Azure
Python
Azure Databricks
Cloud Computing
Data Analysis
Microsoft Excel
SAP HANA
MS Office
Consulting
Software Development
Oracle
Informatica
English Language
PostgreSQL
Data Migration
SAP Fiori
JavaScript
Business English
German
Apache Airflow
SAP
SAP S/4HANA
Snaplogic
Data lake
AWS
Data Warehouse
Big Data
Python pandas
Team work
Communication skills

Werdegang

Berufserfahrung von SUPARNA CHAKRABORTY

  • Bis heute 3 Jahre und 5 Monate, seit März 2022

    Senior Associate

    PwC SDC

    SKILLS - 1. SQL Advanced(Postgresql , Databricksql , Mysql) 2. ETL Tool(Snaplogic , BODS) 3. Advanced Exel 4. Python , SAP , Oracle

  • 9 Monate, März 2021 - Nov. 2021

    Data Engineer

    Pwc(IN)(Contractor)

    SKILLS - 1. SQL Intermediate(Azure Sql) 2. ETL Tool(Snaplogic ) 3. Advanced Exel

  • 6 Monate, Juli 2017 - Dez. 2017

    Intern

    Optimize IT Solution

Ausbildung von SUPARNA CHAKRABORTY

  • 2 Monate, Mai 2025 - Juni 2025

    ETL Pipeline Automation with Apache Airflow

    Online Project

    • Designed and implemented an end-to-end ETL pipeline using Apache Airflow for workflow orchestration. • Developed PySpark scripts for efficient data transformation and automated CSV data ingestion into SQLite. • Configured Airflow DAGs for scheduling, monitoring, and error handling of data workflows. • Utilized Bash and Python for post-processing and seamless integration tasks. • Version-controlled the project using Git and GitHub, ensuring collaboration and code tracking.

  • 2 Monate, Feb. 2025 - März 2025

    ETL Pipeline with Medallion Architecture for Real-Time IoT Data Processing

    Online Project

    Designed and implemented an ETL pipeline using Azure IoT Hub for real-time data ingestion from Raspberry Pi Azure IoT Online Simulator, storing raw data in Azure Data Lake as part of a Medallion Architecture (Bronze, Silver, Gold layers). • Loaded data in the Silver and Gold layers using PySpark’s foreachBatch and lambda functions to process batch data generated using groupby and window functions on date columns.

  • Bis heute 10 Monate, seit Okt. 2024

    Ad-hoc Activity on PySpark and Databricks

    Online Project

    Mounted Databricks notebooks with an Azure Storage Account using dbutils.fs.mount. Read and cleansed JSON files from an Azure Storage Account using StructType to create a schema, UDFs, and explode_outer to format unstructured JSON columns. Connected with Azure SQL DB and Cosmos DB through Databricks for table creation, upsert operations, and working with streaming data from Azure IoT Hub. Worked extensively with Spark DataFrame API and Spark SQL for CSV/JSON file manipulation and temporary view

  • 1 Jahr und 11 Monate, Sep. 2014 - Juli 2016

    Computer Science

    University of Calcutta

  • 2 Jahre und 11 Monate, Juli 2011 - Mai 2014

    Computer Science

    University of Calcutta

Sprachen

  • Englisch

    Fließend

  • Deutsch

    Gut

XING – Das Jobs-Netzwerk

  • Über eine Million Jobs

    Entdecke mit XING genau den Job, der wirklich zu Dir passt.

  • Persönliche Job-Angebote

    Lass Dich finden von Arbeitgebern und über 20.000 Recruiter·innen.

  • 22 Mio. Mitglieder

    Knüpf neue Kontakte und erhalte Impulse für ein besseres Job-Leben.

  • Kostenlos profitieren

    Schon als Basis-Mitglied kannst Du Deine Job-Suche deutlich optimieren.

21 Mio. XING Mitglieder, von A bis Z