Hierarchical Clustering using Euclidean Distance

提供:
Coursera Project Network
このガイド付きプロジェクトでは、次のことを行います。

Understand the importance and usage of the hierarchical clustering using skew profiles.

Locate and process the viral cDNA genome files to calculate the skew profiles.

Understand the theory for using the Pythagorean equation to calculate the Euclidean distance. And apply that using python to build a linkage matrix.

Understand how errors occur, how to avoid them, and resolve their sources.

ClockAbout 75 minutes required for the project and 45 for the other materials (reading and assignment).
Intermediate中級
Cloudダウンロード不要
Video分割画面ビデオ
Comment Dots英語
Laptopデスクトップのみ

By the end of this project, you will create a Python program using a jupyter interface that analyzes a group of viruses and plot a dendrogram based on similarities among them. The dendrogram that you will create will depend on the cumulative skew profile, which in turn depends on the nucleotide composition. You will use complete genome sequences for many viruses including, Corona, SARS, HIV, Zika, Dengue, enterovirus, and West Nile viruses.

あなたが開発するスキル

Python ProgrammingGenomicsplotting

ステップバイステップで学習します

ワークエリアを使用した分割画面で再生するビデオでは、講師がこれらの手順を説明します。

  1. Task 1: Getting Started with Hierarchical Clustering

  2. Task 2: Locate and Process The Data Files

  3. Task 3: Understand The Result Dataset

  4. Task 4: Hierarchical Clustering - Metric

  5. Task 5: Hierarchical Clustering - Ordering & Methods

  6. Task 6: Dendrogram Plotting

  7. Task 7: Dendrogram - Analysis

  8. Task 8: Errors to Avoid

ガイド付きプロジェクトの仕組み

ワークスペースは、ブラウザに完全にロードされたクラウドデスクトップですので、ダウンロードは不要です

分割画面のビデオで、講師が手順ごとにガイドします

よくある質問

よくある質問

さらに質問がある場合は、受講者向けヘルプセンターにアクセスしてください。