人工知能 AI の概要:
機械学習との違い、各種アルゴリズム、用語集

UB3/informatics/ai/ai_overview

このページの最終更新日: 2022/11/29

  1. 概要: 人工知能 AI とは – 機械学習との違いなど
  2. 機械学習 Machine learning

広告

概要: 人工知能 AI とは – 機械学習との違いなど

図 (文献 1) に示したように、人工知能 (artificial intelligence, AI) とはコンピューターに知性を持たせようとする試みまたは技術全般をいう。

機械学習 (machine learning, ML) はその一分野であり、経験やデータを通じてコンピューターが学習し、特定のタスクを実行できるようになるというもの。

深層学習 (deep learning, DL) は ML の一部であり、多数の人工ニューラルネットワークによる機械学習法である。文献 2 から定義を転載しておく。

Deep learning, a recently introduced branch of machine learning, applies a system of artificial neural networks (ANNs) with several hidden layers that compute a transformation of the underlying data that result in an output layer associated with a class (2).

AI, ML, DL の違い
広告

機械学習 Machine learning

機械学習とは、上で述べた通り「経験やデータを通じてコンピューターが学習し、特定のタスクを実行できるようになる」プロセスをいう。これについてもう少し考えてみる。

従来のコンピューターというのは、基本的にはプログラムされた通りに動くものである。たとえばユーザーが何かを入力した場合、その入力値をどう扱うか、どういう状況ならどういうエラーが出るか・・・などの項目は、細かい場合分けをされたプログラムに全て書かれている (図、Public domain)。

この「人間によってデザインされたプログラム」に基づいてソフトウェアが入力値に対して処理を実行し、結果を output として返す。

機械学習のコンセプト

これに対して、機械学習では、コンピューター自身が 事前に厳密にプログラムされることなく 何かを実行できるようになっている。

人間のプログラムの代わりに、コンピューター自身が学習し、あるモデルを構築する。このモデルを使って、入力値に対する処理が実行されるわけである。人間は、モデルを構築するためのアルゴリズムを作成するだけである。

機械学習のコンセプト

機械学習の input と output

いくつか機械学習の実例を挙げてみる。

画像認識

新しい画像を生成、画像の分類、異常のある画像を検出、画像内の物体を検出、人間や動物の骨格を推定するなど、さらに詳細な分野がある。

二値分類

臨床研究でよく使われる。複数のデータから、患者が特定の疾患をもっているかどうかを 0 or 1 で判断する。

教師あり学習と教師なし学習

上で述べたように、機械学習には「学習してモデルを作り出すステップ」が必要になる。これは大きく 教師あり学習 supervised learning と 教師なし学習 unsupervised learning にわけられる。

教師あり学習では、プログラムはデータと

機械学習 用語集

機械学習に関係した用語を簡単に表にしておく。


K 近傍法 (RF)

k-nearest neighbor algorithm, k-NN。しばしば「最も単純な ML アルゴリズム」と表現される。

K 点平均法 (RF)

k-means 法。データを教師なしでクラスタリングする方法。まずデータを適当なクラスタに分け、クラスタの平均を用いてさらに調整していく。

k はクラスターの数になる。R ヒートマップ にある ComplexHeatmap という関数では、この方法でクラスタリングするオプションがある。

Support vector machine (SVM)

サポートベクターマシン SVM は、supervised ML の一つである。1963 年に線形モデルが発表され、1992 年に非線形モデルに拡張された。

"unsupervised SVM" で検索してみると、数百件の論文がヒットする。おそらく、拡張アルゴリズムが日々作られている状況なので、それぞれのアルゴリズムに対して supervised と unsupervised の別、また線形と非線形の別を書くのはあまり意味がないと思われる。

Naive Bayes

線形モデル。トレーニングデータが少なくて良いのが特徴らしい。

Gradient boosting decision tree (GBDT)

非線形モデル。

Artificial neura network (ANN)

単にニューラルネットワークと呼ばれることもある。脳にみられる特性に類似したモデル、非線形。

ネットワークを形成した各ノードが、学習によってシナプスの結合強度を変化させ、能力を向上させていくようなモデルの総称。

決定木
Decision tree

「けっていぎ」と読む。Wikipedia の説明がわかりやすく、画像も Public domain なので、ここに概要をまとめておく。フローチャートを作成するようなものと理解している。

下のようなデータで、どのような日にゴルフをする人が多いのかを予測したい。したがって独立変数は天気、気温・・・など、従属変数はゴルフをするかどうかの二値変数である (参考: 回帰分析の概要)。

決定木

まず、表を天気でソートする。この場合、「曇りなら必ずゴルフをする」ということがわかる。雨や晴れでもゴルフをするグループもいるが、この「曇りなら必ずゴルフをする」という情報は、従属変数を予測する上で非常に有用である。

決定木

一方、この表を気温でソートすると、はっきりとしたグループが見えない。つまり、気温はあまり従属変数の決定に寄与しない説明変数であるといえる。

決定木

このような判断を総合すると、まず天気で場合分けし、そこからさらに細かい条件をみていくというのが、予測精度を高めるのに良さそうである。これが次のような決定木で表される。

決定木

Random forest (RF)

教師ありモデル。多数の決定木を使用するので、このような名前がついているらしい (図、Ref. 3)。

ランダムフォレスト

広告

References

  1. By Original file: <a href="//commons.wikimedia.org/w/index.php?title=User:Avimanyu786&amp;action=edit&amp;redlink=1" class="new" title="User:Avimanyu786 (page does not exist)">Avimanyu786</a>SVG version: <a href="//commons.wikimedia.org/wiki/User:Tukijaaliwa" title="User:Tukijaaliwa">Tukijaaliwa</a> - <a href="//commons.wikimedia.org/wiki/File:AI-ML-DL.png" title="File:AI-ML-DL.png">File:AI-ML-DL.png</a>, CC BY-SA 4.0, Link
  2. Tran et al., 2019a. Personalized breast cancer treatments using artificial intelligence in radiomics and pathomics. J Med Im
  3. Venkata Jagannath - https://community.tibco.com/wiki/random-forest-template-tibco-spotfirer-wiki-page, CC 表示-継承 4.0, https://commons.wikimedia.org/w/index.php?curid=68995764による

コメント欄

各ページのコメント欄を復活させました。スパム対策のため、以下の禁止ワードが含まれるコメントは表示されないように設定しています。レイアウトなどは引き続き改善していきます。「管理人への質問」「フォーラム」へのバナーも引き続きご利用下さい。

禁止ワード: http, the, м (ロシア語のフォントです)


このページにコメント

Name:


Comment:



これまでに投稿されたコメント

Date Name Comment