こんにちは。ファンリピートの塙です。
最近はAIブームがかなり広がっており、Open AIのChat GPTを使用しているという方も増えてきているのではないでしょうか。
今最も人気なのはChat GPTだと思いますが、今回はGoogle の開発する大規模言語モデルであるPaLM(パーム)について紹介します。
ぜひこの記事を最後までお読みいただき、Chat GPT以外のAIについて知る機会にしていただければ幸いです。
PaLMとは
PaLMは、2022年にGoogleによって発表された非常に大きな言語モデルで、正式名称は「Pathways Language Model」です。これは驚異的な数である5400億のパラメータを持ち、高度な「Dense Decoder-Only Transformer」モデルを使用して構築されています。
このモデルの開発には、Googleの特別な「Pathways」システムが利用されました。そして、何千もの高速アクセラレータチップを組み合わせて、非常に効率的にトレーニングされています。これらのチップは「TPU v4 Pods」と称され、多くの「TPU」から構成されています。ここで、「TPU」は「Tensor Processing Unit」の略で、これはGoogleが開発した深層学習を高速化するためのプロセッサです。
PaLMの注目すべき特徴は、その驚異的なスケーリング能力にあります。これまでにないほどの大量のTPUを使用し、これが大規模なシステム設定でのトレーニングをスケールアップする最初の例となっています。このスケーリングプロセスは、「Pod」レベルでのデータ並列処理を活用して行われており、各Pod内では、通常のデータ並列処理とモデル並列処理が併用されています。これにより、PaLMは従来の言語モデルと比較して、大幅なスケールアップが達成されています。これにより、多くの言語理解や生成タスクにおいて、最先端の性能を発揮することが可能となりました。
PaLMが進化した!PaLM2とは
Googleは2023年5月11日に、次世代言語モデルであるPaLM 2を発表しました。PaLM 2は、過去10年間のAIにおける進化の中で、Googleが積み重ねてきた基盤モデル(基本的なAIの構造やアルゴリズム)における画期的な研究の成果として登場しました。この研究の発展により、言語モデルの能力が大幅に向上し、医療から人間の創作活動に至るまで、広範囲にわたる分野で大きな変革をもたらすことができる可能性があります。
PaLM 2は、多言語、推論(論理的な判断や結論を導く能力)、およびコーディング機能が向上した最先端の言語モデルで、100以上の言語に対応しています。学習には、数式を含む科学論文やウェブページなどの広範なデータセットが利用されており、常識に基づく推論や数学に関する能力が向上しています。さらに、公開されている大量のソースコードデータセット(プログラムのコード集)を用いた学習により、PythonやJavaScriptなどの一般的なプログラミング言語だけでなく、Prolog、Fortran、Verilogなどの言語でコードを生成することも可能になりました。
また、PaLM 2は、以前のモデルよりも能力が高く、高速で効率的であり、さまざまなサイズ(Gecko、Otter、Bison、Unicornの4つ)が提供されています。これにより、あらゆる用途で展開でき、幅広い製品に対応する形でファインチューニング(特定の目的に合わせて調整)することが可能となり、より多様な形で多くのユーザーの役に立つことができます。
どのようなサービスに使用されているのか
GoogleのI/O(Googleの開発者向けカンファレンス)では、PaLM 2を搭載した25以上の製品と新機能が発表されました。この中には、Bardの多言語対応、Google Workspaceでの下書きやスプレッドシート(表計算ソフト)の整理支援、そして医療情報のデータを用いた学習結果を活用したMed-PaLM 2などが含まれています。Med-PaLM 2は、理解するのが容易でない医学文章の内容を用いて質問に答えたり、洞察をまとめたりすることが可能で、米国医師国家試験形式の質問で「エキスパート」レベルのパフォーマンスを達成した最初の大規模言語モデルとなりました。これらの特性により、PaLM 2は、多言語対応やコーディング能力、そして推論能力など、AIの最新技術を進歩させ、人々の日常生活に真の利益をもたらすことが期待されています。(PaLM2の対応によりBardは日本語対応しました。)
Bardは無料で使用することができます。気になる方はぜひ以下のリンクから実際に触ってみて下さい。(googleのアカウントが必要です)
GPT – 4との違い
Open AIのGPT-3.5やGPT-4が現在多くの市場で使用されていますが、PaLM2もそれらにならぶ最先端言語モデルです。GPT4はすでにBing AI、 speak(英語学習アプリ)、 Chat GPT、 Tome(プレゼン資料作成ツール)などの多くのAIツールで使用されています。
一方、PaLM2の使用はBard AIなどに限定されており、我々が使用できる範囲は限られております。
PaLM2とGPT – 4との最も大きな違いはその学習量ではないでしょうか。正確な量は発表されていませんが、PaLM2に比べてGPT4は圧倒的な学習量を誇っているようです。つまり、GPT4の方が多くの知識を持ち、より的確な返答ができる可能性が高いということです。一方、PaLM2の学習にはヘイトスピーチのような偏った可能性のあるデータは含まれていないようで、有害な情報を出力することは少ないようです。
Bardを実際に使用してみた所感
私は通常、業務にChat GPTを導入していますが、今回の記事作成においては、Bardを試してみることにしました。結果として、Chat GPTの方が使い勝手が良く、出力の精度も高いと感じました。Chat GPTでは出力が段階的に表示されるのに対し、Bardでは一度に全文が表示されるため、Bardの方がストレスフリーであると感じるかもしれません。さらに、Chat GPTは時折冗長な回答をするのに対して、Bardはより簡潔に回答する傾向があります。
とはいえ、求める回答を的確に提供する点では、Chat GPTが優れていると感じます。今回使用したのはGPT-4版のChat GPTです。TOEICの勉強問題を出してほしいというプロンプトを投入してみたところ、Bardは「The company is expanding its operations in Asia.」など、4つの英文を日本語に訳すよう指示しました。これに対して、Chat GPTはTOEICの問題形式に従い、1つの問題に対して4つの選択肢を提示しました。これはTOEICのテスト形式により近い回答で、これがChat GPTの強みであることがわかります。
また、複数の質問文をプロンプトとして提示し、それらを順番に尋ねてもらいたいとリクエストした際、Chat GPTは一つずつ丁寧に質問をしてくれました。しかし、Bardの場合、一度に全ての質問が表示されてしまいました。
さらなる利点として、Chat GPTの使いやすさが際立っています。複数のチャットセッションを分けて管理できる機能や、多岐にわたるタスクに対応できる豊富なプラグインが利用できる点が特筆すべきです。
総じて、Chat GPTとBardにはそれぞれの特長がありますが、使い勝手と精度の面ではChat GPTが優れていると言えるでしょう。
終わりに
いかがだったでしょうか。
最後までお読みいただき、ありがとうございました。
今はChat GPT一強という雰囲気がありますが、今後はどのモデルを使うか迷う時代が来るかもしれませんね。今後の動向に注目です。
かなり早いスピードで進むAI周りの革新に置いていかれないよう情報を常にキャッチアップしていってみてください。