人工知能(AI)を支える技術の一つである、機械学習(Machine Learning)。企業でDX推進を担当されている方や新規事業を検討されている方の中には、「機械学習とは一体何で、どういった仕組みなのか」「どのような場面で活用できるのか」など知りたい方も多いでしょう。
今回の記事では、企業でDXを推進したりAI導入を進めたりする方向けに、機械学習の定義や種類、導入する際に知っておいた方が良い技術の説明、活用事例などを紹介します。
機械学習とは?AIとの関係性
機械学習(Machine Learning)とは、人工知能(AI)を支えるデータ分析手法の一つです。入力されたデータをもとに、機械(コンピューター)が自動で学習し、データの背景にあるルールやパターンを発見します。 データのルールやパターンを統計的に判断する「統計学」や、大量のデータから有益な情報や価値ある知見を抽出する「データマイニング」とも関係が深い技術です。
また、似た言葉でよく聞くディープラーニング(深層学習)は、機械学習の一つで「ニューラルネットワーク」という手法を使ったものです。
※エクサウィザーズ作成
これらは AI > 機械学習 > ニューラルネットワーク > ディープラーニングというように階層構造になっています。
AIについて詳しく知りたい方は、「AIとは何か?機械学習やディープラーニングとの関係、最新事例、将来展望を解説!」の記事をご参照ください。
ディープラーニングについて詳しく知りたい方は、「ディープラーニングとは?ニューラルネットワークや機械学習との関係性、仕組みや実装する際の注意点を解説」の記事をご参照ください。
機械学習の種類
機械学習は、大きく「教師あり学習」「教師なし学習」「強化学習」という3つの学習方法に分けられます。それぞれの特徴やメリット・デメリット、学習手法(機械学習アルゴリズム)の例について、見ていきましょう。「教師あり学習」と「教師なし学習」を組み合わせた「半教師あり学習」もここでは紹介します。
教師あり学習
教師あり学習とは、正解があらかじめ与えられている学習データに合うように、モデルを構築していく方法のことです。正解となる事象にラベル付け(アノテーション)し、入力データがそれと近いときに「正解」と判定できるようにモデルを作成します。
例えば果物の種類を判別する場合は「これはりんご」「これはバナナ」「これはみかん」といったようにあらかじめラベリングしたデータを学習させます。
教師あり学習は、精度の高いモデルを学習させることができるのがメリットです。一方で、入力データに対して教師データを作成する作業に時間がかかるというデメリットもあります。教師あり学習で用いられるデータ分析手法にはいくつかあるので詳しく紹介します。
ニューラルネットワーク
ニューラルネットワークとは、人間の脳にある「ニューロン」という神経細胞のつながりをコンピューター上で設計し、入力と出力がセットになった学習ができるプログラムのことを指します。「入力層」「中間層(隠れ層)」「出力層」の3層からなっています。
なお、ニューラルネットワークを多層構造に階層化したものが、ディープニューラルネットワークと言い、それを活用した機械学習モデルの構築を行うプロセス全体をディープラーニング(深層学習)と言います。
ロジスティック回帰
ロジスティック回帰とは、いくつかの要因(説明変数)をもとに、「賛成/反対」「合格/不合格」「購入する/購入しない」といった2値の結果(目的変数)が起こる確率を予測する手法のことで多変量解析の手法の1つです。
簡単に言うと「ある事象が発生する確率を判別する分析」になります。
目的変数の値は「0と1(0%と100%)の間」となり、「0.5」より大きい場合には「ある事象が発生する」、そうでない場合には「ある事象が発生しない」と予測されます。
例えば、不良品と正常な製品のデータを両方学習させ、不良品に属する可能性が高ければ不良品を検知する、という使い方ができます。
決定木
決定木とは、教師データをもとに、木の枝のような「ツリー構造」を用いてデータを分類する手法のことです。分類結果が可視化されるため、「要因」と「結果」の影響度合いを視覚的に判断できるのが特徴です。具体的には、「目的変数と一番関係が強い要因は何か」「そうした要因が最も現れるのは、どういった条件・ルール下においてか」などを把握できます。
決定木は分類木と回帰木の2つに大別され、分類木は対象を分類する場合に活用し、回帰木は数値を推定する際に活用します。
線形回帰
線形回帰とは、1つ以上の説明変数(予測子変数)を使用して目的変数(応答変数)を予測する際に用いられる手法です。線形回帰には、1つの応答変数に対して予測子を1つのみ持つ「単回帰」、1つの応答変数に対して複数の予測子をもつ「重回帰」、複数の応答変数に対応した「多変量回帰」などの種類があります。
サポートベクターマシン
サポートベクターマシン (SVM)とは、二項分類や回帰分析に使用されるアルゴリズムの一種です。現在知られている手法の中でも、特に認識性能が優れた機械学習モデルの一つといわれています。サポートベクターマシンでは、2つのデータを分離する境界と各データとの距離を意味する「分離マージン」に着目。2つのクラス間の分離マージンを最大化する超平面により、分類タスクを実行します。
判別分析
判別分析とは、既存データの分布からデータ分類の基準(判別関数)を導き出す手法のことです。特徴量のデータ特性をもとに、「特定の対象」と「そうでない対象」にグループ分けします。判別分析により判別関数が明確になるため、分析以後に得た未知のデータについても、どちらのグループに分類されるのかを判別することが可能です。
この他、教師あり学習の学習手法には、シンプルでわかりやすいアルゴリズムとして知られる「k近傍法」や、ベイズの定理という数学(確率論)の定理をもとにした「単純ベイズ」などがあります。
AIのスペシャリストが語る、新時代に求められるスキルとは?
AIやWEB3という言葉は耳にするものの、それが実際に仕事にどのような変化をもたらすのでしょうか。
「Web3時代のAI戦略」を執筆したエクサウィザーズ取締役の大植択真が、テクノロジーの現在地と今後の展望について解説しています。
アーカイブ動画を無料で公開中のため、ぜひご視聴ください。
\こんな方におすすめの動画です/
- DX人材育成やDX組織構築に関わっているが今後の方向性や具体的な方法論にお悩みの方
- ChatGPTなどの基盤モデルの登場で今後求められるスキルがどのように変化するのかを知りたい方
- これからの時代を先読みし、それに対応したスキルをどのように身に着けるべきかについてお悩みの方
教師なし学習
教師なし学習とは、AIにデータのみを与え、それをもとにAIが自己で反復学習し、モデルを構築していく手法のことです。AIが入力データを解析し、データの共通点を学習した後、構造やパターンを導き出します。
例えば鳥や魚など多様な種類の生き物の画像群を与えます。これらの画像群を何らかの観点で2つに分けるように指示をすると、今回の例ではうろこやくちばしの有無、形の特徴などから魚とそれ以外の画像群にわけます。
※エクサウィザーズ作成
これが教師なし学習の一つの例になります。
教師なし学習のメリットとして、入力データを集めるだけでよく教師データを必要としないためアノテーションの手間がかかりません。一方で、教師あり学習に比べて精度が劣るというデメリットもあります。
混合ガウスモデル
混合ガウスモデル(GMM)とは、ガウス分布(正規分布)を複数重ね合わせる「線形重ね合わせ」を用いたモデルのことです。「データポイントがどのように分布しているか」というパラメーターを推定します。混合ガウスモデルを用いれば、「データセットをクラスターごとに分ける」「データセットの確率密度分布を得る」といったことが可能です。
隠れマルコフモデル
隠れマルコフモデルとは、数理統計学において想定される確率的法則性を意味する「確率モデル」の一つです。隠れマルコフモデルでは、ある事象が、観測されない(隠れた)状態をもつマルコフ過程(次の事象の発生確率が、現在の状態のみによって決まり、過去の状態には一切依存しない確率過程)にあると仮定します。限られたデータ・情報から、直接観測できない元の事象の状態を予測する際に、このモデルが用いられます。自然言語処理、パターン認識、音声認識などの分野でよく用いられます。
自己組織化マップ
自己組織化マップとは、フィンランドの研究者コホネン (T. Kohonen)によって開発された、クラスタリング手法の一つです。ニューラルネットワークに基づき、入力データの類似度をマップ上での距離として表現し、自動的に分類を行います。自己組織化マップを用いれば、人間では識別が困難な高次元データの中に存在する特徴を、予備知識なしにクラスタリングすることが可能です。
この他、教師なし学習の学習手法には、非階層クラスタリングの代表的な手法である「k平均法」や、データ内のクラスター数が事前に分からない際に有効な「階層クラスタリング」などがあります。
半教師あり学習
半教師あり学習とは、「教師あり学習」と「教師なし学習」を組み合わせた手法のことです。「教師なし学習を行った上で、教師あり学習で復習する」「教師あり学習→教師なし学習→教師あり学習という順に学習する」といった組み合わせ方法があります。メリットとして、膨大な教師データの作成コストを抑えられる点があげられます。一方で、教師データに偏りがあるとうまく学習できないというデメリットもあります。
強化学習
強化学習とは、AIが自ら試行錯誤しながら、より高い報酬を得られるような行動をするように学習していくものです。「教師あり学習」や「教師なし学習」とは、「明確にデータが与えられはしない」という点が異なります。データが不足していてもAIが自ら学習できるという点がメリットです。一方で、想定外の答えが出力されることがあるというデメリットもあります。
最初はスイングを様々な角度や速さ・環境で繰り返し実行するように命令します。そこでボールがホールの近くまで飛んだ場合は報酬(評価)を与え、ボールがホールから遠い位置に飛んだり池に落ちたりバンカーに落ちたりした場合には報酬を減らすor与えない、ということを繰り返します。繰り返すうちにAIはどのようにすれば報酬が最大化できるのか試行錯誤しながら学習していきます。これにより、ゴルフゲームで良いスイングを打てるようになり、ゲームに強いAIが完成するのです。
これが強化学習のイメージになります。
強化学習が使われている例としてカーナビゲーションがあります。目的地に最短でたどり着くために多くのルートを瞬時に判断し、どのルートが最適かを導き出します。
機械学習で用いられる手法についてそれぞれ概要とメリットデメリットを紹介しました。実際にビジネスに活用する場合には、解決したい課題に対して、どの手法を用いて、どのパラメータで学習するかという要素は非常に重要になります。たいていは既存のアルゴリズム(分類問題なら決定木、ロジスティック回帰、サポートベクターマシンなど)から選択しますが、解決したい課題にあるアルゴリズムが無い場合には一から作る場合もあります。アルゴリズムを作る場合も簡単に作れるようなツールもあるので活用してみましょう。
機械学習の活用事例
機械学習の活用シーンは広がってきています。実際、どのようなシーンで活用されているのか、機械学習の活用事例をエクサウィザーズの実際の社会実装例とあわせて2つ紹介します。
予測
ビジネスシーンにおいては、様々な予測に機械学習が活用されています。過去のデータに基づき、「今後、どの程度の需要が見込まれるか」「将来的に、どのくらいの個数を売れそうか」などの数値予測が過去の様々なデータから時系列の数値変化などを予測します。
機械学習を用いた予測は
- 製品の売上予測
- 商品の需要予測
- 在庫量の予測
- 面接の合否予測
- 業務量予測
など幅広い活用が始まっています。
また、近年では機械学習による需要・売上予測をもとに商品の在庫数を調整し、価格を変動させる「ダイナミック・プライシング」を実施する企業も増えてきています。
例えば、エクサウィザーズではAI予測分析サービス「exaBase 予測・分析」を提供しており、ヒューマネージ社が提供する採用管理システム「i-web」と、録画面接の分野において連携を開始しました。
これにより、録画面接の選考判定をベースに、exaBase 予測・分析が各社の合否基準に基づいたAIモデルの構築が可能となり、採用担当者のより精緻な意思決定をサポートします。
参考:『AI予測分析サービス「exaBase 予測・分析」が採用管理システムシェアNo.1の「i-web」と連携』エクサウィザーズ 2022年7月28日
ロボット
人手不足の解消や、作業の効率化などへの対応として広がりを見せるAIロボットにも、機械学習が活用されています。
AIロボットにはさまざまなものがあり、身近なところでは、本物の動物のように感情豊かなペットロボットや、カメラ・対話機能などを備えた見守りロボットを始めとする「家庭用AIロボット」が挙げられます。二足歩行や対話が可能な「ヒューマノイドロボット」を小売店やレストラン、ホテルなどで見たことがある方も多いでしょう。また、「介護」「医療」「農業」「製造」「物流」「建設」など、特定の分野に特化したAIロボットも活躍しています。
例えば、エクサウィザーズでは世界初のAIによるパンケーキ盛り付けロボットを開発しています。ミシュラン2つ星獲得のシェフが盛り付けたパンケーキの画像から特徴を学習し、擬似的なパンケーキのデザインを生成するAIと、そのデザインを識別するAIを相互に学習させることにより、デザインの良し悪しを判断するAIモデルを開発。これによりシェフの盛り付けの特徴を理解したAIロボットが最適な位置へパンケーキやトッピングを配置することが可能になりました。
参考:『2022国際ロボット展に「exaBase ロボティクス」を出展』エクサウィザーズ 2022年3月2日
この他、商品レコメンド、金融商品の価格付け、金利の分析、株式売買・為替取引のタイミング決め、チャットボット、顔認証、画像認識、音声認識、自動運転などにも、機械学習は活用されています。
まとめ
機械学習には、「教師あり学習」「教師なし学習」「半教師あり学習」「強化学習」などがあり、学習手法(機械学習アルゴリズム)も多岐に渡ります。どのような場合にどの手法が適切なのかをよく理解し活用を検討しましょう。
様々な用途に活用されている機械学習ですが、無料ツールを使って気軽に実装することも可能です。無料ツールを活用し、まずは興味のあるテーマで、機械学習の習得に挑戦してみてはいかがでしょうか。