前回、機械学習を簡単にできる人工知能プラグイン「Amazon Machine Learning」(以下AML)を紹介しましたが、今回はそのプラグイン実際に使ってみましたので紹介したいと思います。
AMlを使用するにはまず、「AmazonWebService」のアカウントを所持している必要があります。お持ちでない方は作成しましょう。ちなみに料金は使用した分に応じて支払いする形式で、登録初回1年間は無料となっています。

AmazonWebServiceでアカウントを作成する


以下からAMLの登録をすることができます。
https://aws.amazon.com/jp/machine-learning/

「AmazonWebService」のアカウントを所持していない方はアカウントの作成からになります。
基本情報・支払い情報(クレジット)・本人確認それぞれのステップを進みます。
※料金は初回1年間は無料になっています。それ以降は使用した分に応じて支払いする形式

 

計測したいデータをアップロードする


「AmazonWebService」の登録が完了したら、早速AMLを使ってみましょう。今回はAML側で用意されているサンプルCSVを使ってみようと思います。
サンプルデータは以下からダウンロード可能です。
https://s3.amazonaws.com/aml-sample-data/banking-batch.csv

ダウンロードしたら、そのCSVをアップロードします。
トップページの左上にあるサービスメニューからストレージの「S3」を選択して、バケットを作成します。バケット作成とは要するにAmazonの中に自分用のデータフォルダを用意するみたいな感じです。

バケットが作成できたら、作成したバケットを選択し、左上の「アップロード」から先ほどのCSVをアップロードします。
この辺りは日本語なので分かりやすいですね。(この後はアルファベット地獄です。。)

 

アップロードしたデータをAMLに読み込む


アップロードが完了したようやく本題のAMLに読み込む作業に入ります。
左上にあるサービスメニューからストレージの「S3」を選択して、人工知能の「Machine Learning」を選択します。

先ほどアップロードした「bucklet-name + file名.csv」を「S3 location」に入力して、「Datasource name」に適当な名前を入れます。

入力した後に「vertify」するとS3へのパーミッションを求められるので「YES」とします。

 

MLModel(回帰器・判別器)を作成する

アップロードしたCSVのプレビューが一覧で表示されます。
CSVの最初の行が項目名の場合、「Does the first line in your CSV contain the column names?」の部分を「YES」にします。
その他データタイプが異なる場合は変更します。(この辺りはサンプルなので飛ばしてもよし)

MLModelとして評価したいターゲットの値項目を選択し、MLModelを作成へと進めます。
年齢や職業、ローンがあるかどうか、今回はキャンペーンに参加するかどうかのフラグ項目「y」を選択しました。
(途中、オプション項目の設定ありますが、今回は無視。。)

作成したMLModelの閲覧・予測結果の作成へ


MLModelを作成するとしばらく「Pending」状態になり、3~4分程すると、作成したMLモデルの結果が見れるようになります。

これで学習モデルの構築が終わりましたので、ようやく実際に実データを入力して予測結果を取得することができるようになりました。。
「tools」の「Try real-time predictions」から実際に計測したい値を入れてみましょう。
(例えば年齢が32歳、職業がサービス業、ローンがあるかどうかなど)

 

すると右側に結果がリアルタイムに表示されます。
今回の場合は「predictedLabel」が0となっているので、この潜在的な顧客はキャンペーンに反応しない可能性がないということになります。
逆に「predictedLabel」が1であれば興味があるということになりますね。

 

おわりに


AMlを使用することで機械学習についてほどんと知識がなくても簡単にMLModelを作成することができました。
ドキュメントもあり、ステップ形式で進められますので、初心者にはもってこいのサービスですね。
今だと無料で始められますので、気になる方は是非試してみてはいかがでしょうか。