人工知能 AI の概要:
機械学習との違い、各種アルゴリズム、用語集

UB3/informatics/ai/ai_overview

このページの最終更新日: 2023/02/14

  1. 概要: 人工知能 AI とは – 機械学習との違いなど
  2. 機械学習 Machine learning

広告

概要: 人工知能 AI とは – 機械学習との違いなど

図 (文献 1) に示したように、人工知能 (artificial intelligence, AI) とはコンピューターに知性を持たせようとする試みまたは技術全般をいう。

機械学習 (machine learning, ML) はその一分野であり、経験やデータを通じてコンピューターが学習し、特定のタスクを実行できるようになるというもの。

深層学習 (deep learning, DL) は ML の一部であり、多数の人工ニューラルネットワークによる機械学習法である。文献 2 から定義を転載しておく。

Deep learning, a recently introduced branch of machine learning, applies a system of artificial neural networks (ANNs) with several hidden layers that compute a transformation of the underlying data that result in an output layer associated with a class (2).

AI, ML, DL の違い

機械学習 Machine learning

機械学習とは、上で述べた通り「経験やデータを通じてコンピューターが学習し、特定のタスクを実行できるようになる」プロセスをいう。これについてもう少し考えてみる。

従来のコンピューターというのは、基本的にはプログラムされた通りに動くものである。たとえばユーザーが何かを入力した場合、その入力値をどう扱うか、どういう状況ならどういうエラーが出るか・・・などの項目は、細かい場合分けをされたプログラムに全て書かれている (図、Public domain)。

この「人間によってデザインされたプログラム」に基づいてソフトウェアが入力値に対して処理を実行し、結果を output として返す。

機械学習のコンセプト

これに対して、機械学習では、コンピューター自身が 事前に厳密にプログラムされることなく 何かを実行できるようになっている。

人間のプログラムの代わりに、コンピューター自身が学習し、あるモデルを構築する。このモデルを使って、入力値に対する処理が実行されるわけである。人間は、モデルを構築するためのアルゴリズムを作成するだけである。

機械学習のコンセプト

機械学習の input と output

いくつか機械学習の実例を挙げてみる。

画像認識

新しい画像を生成、画像の分類、異常のある画像を検出、画像内の物体を検出、人間や動物の骨格を推定するなど、さらに詳細な分野がある。

二値分類

臨床研究でよく使われる。複数のデータから、患者が特定の疾患をもっているかどうかを 0 or 1 で判断する。

教師あり学習と教師なし学習

上で述べたように、機械学習には「学習してモデルを作り出すステップ」が必要になる。これは大きく 教師あり学習 supervised learning と 教師なし学習 unsupervised learning にわけられる。

教師あり学習では、プログラムはデータと

機械学習 用語集

機械学習に関係した用語を簡単に表にしておく。


K 近傍法 (RF)

k-nearest neighbor algorithm, k-NN。しばしば「最も単純な ML アルゴリズム」と表現される。

K 点平均法 (RF)

k-means 法。データを教師なしでクラスタリングする方法。まずデータを適当なクラスタに分け、クラスタの平均を用いてさらに調整していく。

k はクラスターの数になる。R ヒートマップ にある ComplexHeatmap という関数では、この方法でクラスタリングするオプションがある。

Support vector machine (SVM)

サポートベクターマシン SVM は、supervised ML の一つである。1963 年に線形モデルが発表され、1992 年に非線形モデルに拡張された。

"unsupervised SVM" で検索してみると、数百件の論文がヒットする。おそらく、拡張アルゴリズムが日々作られている状況なので、それぞれのアルゴリズムに対して supervised と unsupervised の別、また線形と非線形の別を書くのはあまり意味がないと思われる。

Naive Bayes

線形モデル。トレーニングデータが少なくて良いのが特徴らしい。

Gradient boosting decision tree (GBDT)

非線形モデル。

Artificial neura network (ANN)

単にニューラルネットワークと呼ばれることもある。脳にみられる特性に類似したモデル、非線形。

ネットワークを形成した各ノードが、学習によってシナプスの結合強度を変化させ、能力を向上させていくようなモデルの総称。

決定木
Decision tree

「けっていぎ」と読む。フローチャートを作成するようなものと理解している。詳細は 決定木のページ を参照のこと。

Random forest (RF)

教師ありモデル。多数の決定木を使用するので、このような名前がついているらしい (図、Ref. 3)。

ランダムフォレスト

広告

References

  1. By Original file: <a href="//commons.wikimedia.org/w/index.php?title=User:Avimanyu786&amp;action=edit&amp;redlink=1" class="new" title="User:Avimanyu786 (page does not exist)">Avimanyu786</a>SVG version: <a href="//commons.wikimedia.org/wiki/User:Tukijaaliwa" title="User:Tukijaaliwa">Tukijaaliwa</a> - <a href="//commons.wikimedia.org/wiki/File:AI-ML-DL.png" title="File:AI-ML-DL.png">File:AI-ML-DL.png</a>, CC BY-SA 4.0, Link
  2. Tran et al., 2019a. Personalized breast cancer treatments using artificial intelligence in radiomics and pathomics. J Med Im
  3. Venkata Jagannath - https://community.tibco.com/wiki/random-forest-template-tibco-spotfirer-wiki-page, CC 表示-継承 4.0, https://commons.wikimedia.org/w/index.php?curid=68995764による

コメント欄

サーバー移転のため、コメント欄は一時閉鎖中です。サイドバーから「管理人への質問」へどうぞ。