こんにちは!
ファンリピートの佐藤です。
現在はテクノロジーの進化が凄まじく、AIもどんどん注目を浴びていると思います。
しかしながら、生成AIやLLMなどのワードは耳にして何となく意味は分かっても、自分の口で説明するとなると意外に難しいのではないかと思います。
そこで今回はAI関連の用語を9つピックアップして解説してみました。
ただ、詳しく解説すると長くなってしまうのでイメージの部分だけを掴んで頂けたらと思います。
AI(人工知能)
まずはそもそも、AIとは何でしょうか?
これは正直、人によって定義付けも違い、明確な定義はありません。
ですが、AIは人間みたいに考えたり学んだりするコンピューターと言えると思います。
人間が学習を積み重ねて賢くなるように、AIはデータを使って学習して、賢くなります。機械に人間の脳みそがあるようなイメージです。
身近なAIの例としてはSiriやGoogleアシスタント、NetflixやYouTubeのおすすめ機能、自動運転などが当てはまります。
機械学習(Machine Learning)
次にAIの一部である機械学習についてです。
AIと機械学習は何が違うのでしょうか?
AIが全体として「人間みたいに考えるコンピューター」なら、機械学習はその「学ぶ」部分となります。データをたくさん見せて、そこからパターンを見つけ出すのが機械学習と言えます。
たとえば、メールの迷惑フィルターとか、写真の中の猫を見つけるといったことが該当します。
AIは大きな概念で、その中に機械学習があるというイメージです。
AIが全体の脳みそなら、機械学習はその脳みそを鍛えるトレーニング方法となります。
ニューラルネットワーク(Neural Network)
ニューラルネットワークは先程の機械学習の一部になります。
ですので、AIの中に機械学習があり、さらにその中にニューラルネットワークの概念があるということになります。
そして、ニューロンをご存知でしょうか?
ニューロンは生き物の脳を構成する神経細胞のことを指します。
その無数の神経細胞がつながって、情報を伝える脳の仕組みとなっています。
それを擬似的にコンピューターで再現しようとしたのがニューラルネットワークになります。
ニューラルネットワークは層が積み重なっており、各層で処理を積み重ねる点に特徴があります。
画像認識や音声認識、自然言語処理など様々なところでニューラルネットワークの技術が使われています。
ディープラーニング(Deep Learning)
ディープラーニングは「深層学習」といわれています。
これはニューラルネットワークの一種であり、従来のニューラルネットワークをさらに進化させたものになります。
従来のニューラルネットワークは、複雑なデータや問題に対して十分に対応できませんでした。そこで登場したのがディープラーニングです。
ニューラルネットワークが数層である一方、ディープラーニングはたくさんの層を持っていて、その数は数十層にもなることがあります。
どうして層を増やすのでしょうか?
それは、各層が異なるレベルの特徴を抽出できるからです。
例えば、画像認識の最初の層では、単純なエッジや線を検出します。
次の層では、これらのエッジや線を組み合わせて、より複雑な形状やパターンを検出する。さらにその次の層では、これらの形状を組み合わせて、具体的な物体(例えば、目や鼻、口など)を認識します。
最終的には、全体の画像を認識して「これは猫だ」とか「これは車だ」と判断します。
ディープラーニングが力を発揮するのは、この「特徴抽出」の段階的な処理のおかげになります。たくさんの層を通過することで、データの持つ複雑なパターンや関係性をより深く理解できるようになります。
教師あり学習 / 教師なし学習
ディープラーニングのさらにその枠の中に教師あり学習/教師なし学習という概念があります。
教師あり学習はAIに答えを教えて学習させる方法である一方で、教師なし学習はAIに答えを見せず自らパターン等を見つけさせて学習させる方法です。
教師あり学習はデータに正解ラベルがついている場合に使う学習方法です。
例えば、犬と猫の画像があるとして、それぞれに「犬」や「猫」というラベルがついているとします。AIにこのデータを見せて、「これが犬で、これが猫だよ」って教えて学習させていきます。
一方で教師なし学習はデータに正解ラベルがない場合に使う学習方法です。
例えば、たくさんの動物の画像がありながら、どれが犬でどれが猫かラベルがついてないとします。AIは自分で「この画像は似てるから同じグループだな」って判断して学習します。
自然言語処理(NLP)
自然言語処理の解説前に前提知識として、そもそもコンピューターには2進数(0と1)の概念があり、機械語で動いています。
機械語は私達では理解するのが大変です。
そこで、プログラミング言語を使ってコンピューターに指示しています。
つまり、コンピューターは私達の言語が分からない状態であり、逆も然りです。
自然言語処理(NLP)というのは、AIが人間の言葉を理解したり生成したりする技術のことです。言い換えるとNLPは、プログラミング言語と似ており、人間が普通に使っている言葉、つまり「自然言語」をコンピュータが理解して使えるようにする技術です。
ちなみにNLPにはいくつかの重要な技術や手法があります。
自然言語処理(NLP)は「音声アシスタント」「翻訳」「文章生成」と日常生活のあらゆる場面で使われています。
大規模言語モデル(LLM)
大規模言語モデル(LLM)は、膨大な量のテキストデータを基に訓練されたAIモデルのことです。代表的なものとしてChatGPTなどが挙げられます。
膨大な量のテキストデータには、「インターネット上の公開データ」「論文」「政府や研究機関が提供する統計データ」と様々なものが含まれています。
「大規模」と呼ばれるのには以下の理由があります。
①膨大な量のテキストデータを使って訓練される
②モデルが学習するための調整可能な値(パラメータ)が非常に多い
③非常に多くの計算リソースが必要
そして、大規模言語モデル(LLM)はざっくりと以下のような仕組みで動いています。
①大量のテキストデータを読む
②パターンを見つける
③予測する
生成AI(Generative AI)
生成AIは、AIが新しいデータやコンテンツを作り出す技術のことです。
例えば、文章を書いたり、絵を描いたり、音楽を作ったりします。
生成AIは、既存のデータを学習し、そのパターンや特徴を理解することで、新しいデータを生成していきます。
与えられたデータに対して正解か不正解かを識別する識別系AI(Discriminative AI)とは対照的なアプローチになり、生成AIは新しいコンテンツを「創り出す」ことに重点を置いています。
生成AIには文章生成・画像生成・音楽生成・動画生成といくつか種類があります。
マルチモーダルAI(Multimadal AI)
マルチモーダルAIは、複数の異なる種類のデータ(モーダリティ)を同時に処理し、理解する能力を持ったAIのことです。
ここでいう「モーダリティ」とは、データの形式や種類のことを指します。例えば、画像、テキスト、音声、動画など、異なるモーダリティのデータを組み合わせて利用するのがマルチモーダルAIの特徴となります。
マルチモーダルAIの基本的な仕組みは、異なるモーダリティのデータをそれぞれ個別に処理し、それらを統合して一つの意味を持つ情報に変換します。
このプロセスは大きく分けて三つのステップからなります。
このマルチモーダルAIの技術の応用例として、ビデオ内容の要約・医療診断支援・自動運転といったものが挙げられます。
まとめ
今回は9つのAI用語について解説してみました。
今回解説した用語の知識をもとにAI関連のニュースの内容理解等に役立て頂けますと幸いです。
内容を調べてみると改めてAIは凄い技術だと感じました。
そして、今回解説した用語以外にもAI用語は多くあるので、興味があれば調べてみてください。