Exploratory Data Analysis with Textual Data in R / Quanteda

提供:
Coursera Project Network
このガイド付きプロジェクトでは、次のことを行います。

Learn how to import textual data, visualize textual data, stratify textual data by a third variable.

Clock2 hours
Beginner初級
Cloudダウンロード不要
Video分割画面ビデオ
Comment Dots英語
Laptopデスクトップのみ

In this 1-hour long project-based course, you will learn how to explore presidential concession speeches by US presidential candidates over time, looking specifically at speech length and top words and examining variation by Democrat and Republican candidates. You will learn how to import textual data stored in raw text files, turn these files into a corpus (a collection of textual documents) and tokenize the text all using the software package quanteda. You will also learn how to extract useful information from filenames and how to use this information to generate visualizations of textual data using the stringr and ggplot2 packages. Note: This course works best for learners who are based in the North America region. We’re currently working on providing the same experience in other regions.

あなたが開発するスキル

  • Data Analysis
  • Data Visualization (DataViz)
  • R Programming
  • Text Analysis

ステップバイステップで学習します

ワークエリアを使用した分割画面で再生するビデオでは、講師がこれらの手順を説明します。

  1. You will learn how to import textual data stored in raw text files

  2. You will learn how to turn files into a corpus (a collection of textual documents)

  3. You will learn how to tokenize the text and turn text into a document feature matrix

  4. You will learn how to extract useful information from filenames

  5. You will learn how to generate visualizations of textual data

ガイド付きプロジェクトの仕組み

ワークスペースは、ブラウザに完全にロードされたクラウドデスクトップですので、ダウンロードは不要です

分割画面のビデオで、講師が手順ごとにガイドします

よくある質問

よくある質問

さらに質問がある場合は、受講者ヘルプセンターにアクセスしてください。