AMATERAS RAY wiki

次元圧縮

1.PCAで次元圧縮

次元圧縮を行う時は、データ読み込み画面のヘッダーメニューの「次元圧縮」をクリックします。 AMATERAS RAYではPCAという手法で次元圧縮を行います。 PCAのパラメータとは、次元を圧縮した際に、特徴量の情報量をどれだけ保持できるかの情報のことです。 これをまず作成する必要があるので、「OK」を選択します。

2.次元数の決定

PCAパラメータの計算が終わると、下記のようなモーダルが表示されます。 「次元数」とは説明変数を圧縮する削減目標の数です。 (Indexと目的変数は、圧縮後のデータに結合されます。) 「説明力」とは、指定した次元数まで列を圧縮する場合、元のデータの情報量に対して、何%の情報量になるのかという目安です。 説明力は次元数を変更すると、変わります。

3.プロジェクトの作成

圧縮後のデータをそのまま学習に使いたい場合は「圧縮してプロジェクトを作成する」をクリックします。 処理が終わると、次元圧縮後のプロジェクトが追加されます。 {元プロジェクト名}_次元圧縮{圧縮したデータ名}の形式で名称が決まります。

4.圧縮後のプロジェクト

圧縮後のプロジェクトです。 Indexと目的変数は保持され、その他の特徴量が、指定した次元まで削減されていることがわかります。 圧縮後のデータをダウンロードしたい場合は「圧縮してダウンロードする」をクリックします。 タスクが完了すると、自動的にデータがダウンロードされます。 ダウンロードしたデータは下記のような形式になっています。