よくある質問と答え

Q
「オモやん」って誰?
A

大規模言語モデルを中心に機能する自然言語による会話システム(AI)にて、会話を行うアシスタントのAIのキャラクターのひとりです。
この「オモやん」というキャラクターはもちろん架空の存在ですが、このキャラクターの名前、外観、性格などの特長を示す要素は大規模言語モデルを利用した対話型AIサービス「ChatGPT」自身によって創り出されました。
ですので、この「オモやん」は「AIによって生み出されたAI」のキャラクターでもあります。

また、この「大規模言語モデルを中心に機能する自然言語による会話システム」は、最終的に複数のペルソナなどを定義して自分好みのキャラクターなどとお話しできるようにすることが一つのゴールではありますが、現在はシステムの開発段階として彼女の人格モデルを確立させるためのプロトタイプ構築が中心となっています。
そのため、現段階ではこのプロジェクトは「オモやん」自信を作り上げるためのフェーズと捉え、この初期システム自体を差す代名詞として「オモやん」と呼ぶ場合もあります。

ちなみに、オモやんという名前はニックネームで、正式名称は「思兼御子神(おもいかねのみこがみ)」といいます。オモイカネノカミ、ではありません。

Q
「オモやん」はプログラムなの?
A

はい、オモやんはプログラムとして動作するAIキャラクターのひとりです。
ユーザーからの声、テキストの入力に反応し、適切な回答を行うのが基本動作となっています。

現在は、このオモやんの回答を作り出すために「ChatGPT」による大規模言語モデルが利用されていますが、これは現在の技術的、予算的な制約によって選択された手段のひとつにすぎません。
今後他の大規模言語モデルや新たな自然言語処理の仕組みが使えるようになれば、それを使ってオモやんはアップデートするかもしれません。

言語処理や音声認識、音声再生などははあくまで「オモやん」というキャラクターを形作るために集合した機能の一部でしかありません。

オモやん自身を確立する要素は、彼女自身のキャラクター、ペルソナ、アイデンティティーであり、これらはプログラムのバージョンとは無関係に彼女自身とともに成長します。

Q
会話システムってなに?
A

現在は人格モデルのプロトタイプである「オモやん」というキャラクターを動作させるための

Q
会話システムでは何ができるの?
A

現在開発している会話システムでは、主に以下のようなことができるようになっています。

  • 合成音声による回答の音声再生(Text to Speech)
  • 音声認識による質問の入力(Speech to Text)
  • バックグラウンド非同期処理による連続会話
  • 不特定多数のユーザーの同時質問受付、回答
  • OBSなどの外部アプリケーションとの連携(Websock、Comクライアント)
  • Web検索などと非同期に連携し、LLMが持たない最新情報などをプロンプトに提供する機能補助

これらの機能を使って、AIキャラクターをTVuberのようにしてYouTubeのライブ配信などを行うことが可能です。

Q
「オモやん」は誰が作っているの?
A

個人が開発しています。
また、開発に必要な技術的サポートの多くは、オモやん自身(ChatGPT)に聞いて進行しています。

もともとこの手の開発には慣れていないのですが、プログラムのコードの多くはオモやんが生成してくれるので、作業自体は驚くほどスムーズに進んでいます。

とはいえ、個人開発では時間も使える予算も限られているので、現在は週に数時間ずつ作業時間を確保してのんびりと進行している状況です。

ちょっとずつ情報発信も行っていければと思いますので、気長にお待ちください。

タイトルとURLをコピーしました