Data Analysis Using Pyspark

4.4
186件の評価
提供:
6,622人がすでに登録済みです
このガイド付きプロジェクトでは、次のことを行います。

Learn how to setup the google colab for distributed data processing

Learn applying different queries to your dataset to extract useful Information

Learn how to visualize this information using matplotlib

1.5 h
中級
ダウンロード不要
分割画面ビデオ
英語
デスクトップのみ

One of the important topics that every data analyst should be familiar with is the distributed data processing technologies. As a data analyst, you should be able to apply different queries to your dataset to extract useful information out of it. but what if your data is so big that working with it on your local machine is not easy to be done. That is when the distributed data processing and Spark Technology will become handy. So in this project, we are going to work with pyspark module in python and we are going to use google colab environment in order to apply some queries to the dataset we have related to lastfm website which is an online music service where users can listen to different songs. This dataset is containing two csv files listening.csv and genre.csv. Also, we will learn how we can visualize our query results using matplotlib.

あなたが開発するスキル

  • Google colab

  • Data Analysis

  • Python Programming

  • pySpark SQL

ステップバイステップで学習します

ワークエリアを使用した分割画面で再生するビデオでは、講師がこれらの手順を説明します。

  1. Prepare the Google Colab for distributed data processing

  2. Mounting our Google Drive into Google Colab environment

  3. Importing first file of our Dataset (1 Gb) into pySpark dataframe

  4. Applying some Queries to extract useful information out of our data

  5. Importing second file of our Dataset (3 Mb) into pySpark dataframe

  6. Joining two dataframes and prepapre it for more advanced queries

  7. Learn visualizing our query results using matplotlib

ガイド付きプロジェクトの仕組み

ワークスペースは、ブラウザに完全にロードされたクラウドデスクトップですので、ダウンロードは不要です

分割画面のビデオで、講師が手順ごとにガイドします

レビュー

DATA ANALYSIS USING PYSPARK からの人気レビュー

すべてのレビューを見る

よくある質問

ガイド付きプロジェクトを購入することによって、ガイド付きプロジェクトを完了するために必要なものすべてが得られます。これには、開始する必要のあるファイルとソフトウェアを含むWebブラウザを介したクラウドデスクトップワークスペースへのアクセスの他、専門家によるステップバイステップのビデオ講座が含まれます。

ワークスペースにはラップトップまたはデスクトップコンピューターに適したサイズのクラウドデスクトップが含まれているため、モバイル機器ではガイド付きプロジェクトを使用できません。

ガイド付きプロジェクトの講師は、プロジェクトのスキル、ツール、またはその分野での経験があり、知識を共有して世界中の何百万人もの受講生に影響を与えるたことに情熱を持つ専門家です。

ガイド付きプロジェクトから作成したファイルをダウンロードして保持できます。そのためには、クラウドデスクトップにアクセスしているときに「ファイルブラウザ」機能を使用できます。

ガイド付きプロジェクトは払い戻しの対象外です。すべての返金ポリシーを表示する

ガイド付きプロジェクトには学費援助が利用できません。

ガイド付きプロジェクトでは監査を使用できません。

ページの上部で、このガイド付きプロジェクトの経験レベルを押して、知識の前提条件を表示できます。ガイド付きプロジェクトのすべてのレベルで、インストラクターがステップバイステップでご案内します。

はい。ガイド付きプロジェクトを完了するために必要なものはすべて、ブラウザで利用可能なクラウドデスクトップで利用できます。

分割画面環境でタスクをブラウザで直接完了することで学習できます。画面の左側で、ワークスペースでタスクを完了します。画面の右側で、講師がプロジェクトをステップごとにガイドします。

さらに質問がある場合は、受講者ヘルプセンターにアクセスしてください。