確率・統計学

スピアマンの順位相関係数の導出とpythonを使った計算例

データ間の関係性を要約する方法として、相関係数がよく用いられます。相関係数には種類があり、データの順位しかわかっていない場合のような場合に用いられるものとして順位相関係数とよばれるものがあります。この記事では、順位相関係数の中でも特にスピアマンの順位相関係数に焦点を当て、その導出や、pythonを使った計算例を述べます。
確率・統計学

【統計検定対策】多変量データの扱い方 散布図と相関係数

この記事では多変量データの基本的な扱い方として散布図や散布図行列を、要約の方法として相関係数や、順位相関係数、分散共分散行列について述べます。
確率・統計学

【統計検定対策】1変量データの扱い方 ヒストグラムと箱ひげ図

この記事では、1変量データの特徴を掴む方法として、平均、分散といった要約統計量や、視覚的に特徴を捉えるヒストグラム、箱ひげ図の作成方法について述べます。使用するプログラムはpythonで記載しており、それは以下のGoogle Colabで試すことができます。
プログラミング

【Google Cloud (GCP)】音声をテキストに Speech-to-Text APIの使い方

音声データに含まれる会話の内容を簡単に文字起こしすることができるAPIとして、Google Cloud の Speech-to-Text APIがあります。この記事では、Speech-to-Text APIをGoogle Cloud上で導入する方法と、Google Colab上で利用する方法について述べます。
プログラミング

VSCodeでおこなうpythonのデバッグ方法とlaunch.jsonについて解説

この記事ではVSCodeでpythonのデバッグをおこなう方法を述べます。デバッグの設定は、.vscode/launch.json ファイルに記載できます。このファイルはサイドバーの「デバッグと実行」から自動的に作成されます。
機械学習

ROC曲線、AURの解説とpythonによる書き方

分類器の評価としてよく使用される「ROC曲線」と「AUR」について述べます。ROC曲線ではTPR (treu positive rate (= recall)) と FPR (false positive rate) を用いてます。
プログラミング

【pandas】日時の間隔が空いているデータを埋める

時間の間隔が空いているデータに対して、データの間隔を埋める方法を述べます。日時の間隔を埋めるには、pandasのasfreq関数を使います。
プログラミング

【Python】連続した日付、時間のリストの作成する pandas

pythonで連続した日付、時間のリストの作成方法について述べます。方針は、pandasのdate_range関数を使います。
プログラミング

【Git】Sourcetree + P4Mergeの使い方

この記事ではSourcetreeの使い方とGitコマンドの一覧を述べます。また、コンフリクトの解決方法として、mergetoolの「P4Merge」の使い方も述べます。
機械学習

機械学習の分類評価指標 混同行列と正解率・適合率・再現率・F値

分類結果を可視化する混同行列と、分類評価指標である正解率・適合率・再現率・F値を解説します。pythonによる実装もおこないます。