コミュ障だから明日が僕らをよんだって返事もろくにしなかった

何かを創る人に憧れたからブログをはじめたんだと思うよ

きっと何者にもなれない僕だから

身の程知らずの初心者が機械学習をやってみたでござるの巻

なぜ "身の程知らずの初心者" である僕は機械学習をやろうとおもふのか

おはようございます。これから機械学習についてのあれこれを学ぶことを志す "身の程知らずの初心者" の僕です。今日はいい天気ですね。鳥は歌い、花は咲き誇る。こんな日は僕みたいな "身の程知らずのクソ初心者" が機械学習を勉強するには最高の日だと思いませんか?

そうしたわけで無料キャンペーン期間がそろそろ終了する"10秒ではじめる人工知能プログラミング学習サービス"をやっていくことにします。

aidemy.net


前回記事
inujini.hatenablog.com

やってみた

f:id:andron:20180331222511p:plain


とりあえず難易度的に次のステッポっぽいやつやってみました。なにやっているのか分からなくなりそうですが、ジャンルを大まかに分類するとこんな感じです。
f:id:andron:20180331225539p:plain
機械学習の細かいジャンルを詳しく見ていく感じです。ノリで強化学習とかいれちゃったけど今後そのジャンルが増えたりするのかは不明です。あと、ブロックチェーン機械学習とはまた別のお話になってきます。

まあそんなわけでして、有料化になる前に必要そうなナレッジを描きためていく作業をしていきます。当然、コードの写しとかは営業妨害になっちゃうのでしないけども自分が得た情報で怒られない程度のまとめはさせてもらいます。
・教師あり学習(回帰)
・教師あり学習(分類)

教師あり学習(きょうしありがくしゅう, 英: Supervised learning)とは、機械学習の手法の一つである。事前に与えられたデータをいわば「例題(=先生からの助言)」とみなして、それをガイドに学習(=データへの何らかのフィッティング)を行うところからこの名がある。

教師あり学習ってこんな感じのやつです。まあ、何言ってるかわからないですね。語弊があるように言ってしまうと正解データを食わせて、それに沿って学習させていく感じです。回帰は数値など、分類は画像や文字などを扱うのに利用します。このモデルづくりに下のやつ使うっぽいです。というか、このツールが強すぎる気がする……。

仕様ツール
scikit-learn: machine learning in Python — scikit-learn 0.19.1 documentation

scikit-learn (旧称:scikits.learn) はPythonオープンソース機械学習ライブラリである。サポートベクターマシン、ランダムフォレスト、Gradient Boosting、k近傍法、DBSCANなどを含む様々な分類、回帰、クラスタリングアルゴリズムを備えており、Python数値計算ライブラリのNumPyとSciPyとやり取りするよう設計されている。

 


・教師なし学習

教師なし学習(きょうしなしがくしゅう, 英: Unsupervised Learning)とは、機械学習の手法の一つである。「出力すべきもの」があらかじめ決まっていないという点で教師あり学習とは大きく異なる。データの背後に存在する本質的な構造を抽出するために用いられる。

入力データはあるけど答えはないやつです。たくさんあるデータの傾向をまとめたみたら新たな発見があったとかそんな感じの用途っぽい?これも上のツールでなんとかなっちゃうんですよね……。すごい。


ブロックチェーン基礎

ブロックチェーン(英語: Blockchain、ブロックチェインとも)とは、分散型台帳技術、または、分散型ネットワークである。ビットコインの中核技術(サトシ・ナカモトが開発)を原型とするデータベースである。ブロックと呼ばれる順序付けられたレコードの連続的に増加するリストを持つ。各ブロックには、タイムスタンプと前のブロックへのリンクが含まれている。理論上、一度記録すると、ブロック内のデータを遡及的に変更することはできない。ブロックチェーンデータベースは、Peer to Peerネットワークと分散型タイムスタンプサーバーの使用により、自律的に管理される。フィンテックに応用されるケースでは独占や資金洗浄の危険が指摘されることもある。

最近流行ってるやつ、ビットコインのアレ。内容は暗号とかそんな感じで実際にブロックチェーンを実装してみような話でした。


とまあそんな感じっぽいです。かなり駆け足でやったのであまり頭に入ってないけど、概略と使用ツールさえなんとかわかればあとはググってなんとかなるでしょうって軽い気持ちでまとめてます。それに某所で言われるように "身の程知らずの初心者" が機械学習なんて手を出してもどうあがいても無駄ですしね。