Quantitative Text Analysis and Evaluating Lexical Style in R

提供:
Coursera Project Network
このガイド付きプロジェクトでは、次のことを行います。

tokenize text documents to examine top words by frequency

examine the change in type to token ratio or level of text complexity over time

Clock1 hour
Beginner初級
Cloudダウンロード不要
Video分割画面ビデオ
Comment Dots英語
Laptopデスクトップのみ

By the end of this project, you will learn about the concept of lexical style in textual analysis in R. You will know how to load and pre-process a data set of text documents by converting the data set into a corpus and document feature matrix. You will know how to calculate the type to token ration which evaluates the level of complexity of a text, and know how to isolate terms of particular lexical interest in a text and visualize the variation in frequency of such terms in texts over time.

あなたが開発するスキル

  • Descriptive Analysis
  • Text Analysis
  • Data Wrangling
  • Data Visualization (DataViz)
  • Text Corpus

ステップバイステップで学習します

ワークエリアを使用した分割画面で再生するビデオでは、講師がこれらの手順を説明します。

  1. Load textual data into R and turn it into a corpus object and understand the concept of lexical style in textual analysis

  2. Extract meta-data from text document filenames and calculate the type to token ratio (TTR)

  3. Examine the change in the type to token ratio or level of text complexity over time

  4. Tokenize text documents to examine top words by frequency of appearance and isolate words of particular lexical interest in the text

  5. Visualize the change in the variation in the frequency of features of particular lexical interest in your text

ガイド付きプロジェクトの仕組み

ワークスペースは、ブラウザに完全にロードされたクラウドデスクトップですので、ダウンロードは不要です

分割画面のビデオで、講師が手順ごとにガイドします

よくある質問

よくある質問

さらに質問がある場合は、受講者ヘルプセンターにアクセスしてください。