お喋りする会話ボット


一時期、マイクロソフトがつくった「りんな」が話題になったことがありました。

最近はAIの技術をつかった色々な会話ボットが開発されています。

用途も様々で、業務用に開発された、問い合わせや質問に対して回答する味気ない会話ボットもあります。

例えば同じマイクロソフトでもwindows10のcortanaはパソコンの技術的な回答しかできません。

人口無能(じんこうむのう)

会話ボットあるいはおしゃべりボット、チャットボットなど(英語圏ではchatterbotもしくはchatbot)と呼ばれる、主にテキストを用いた会話をシミュレートするコンピュータプログラムです。

一見して知性を感じることもありますが、収集した文章からキーワードを抽出(構文解析)し、内部のデータベースとマッチング(探索)して応答を返しているため、知性と呼べるほど複雑な処理を行っているわけではありません。

「人工知能」ないし「人工頭脳」をひねったネットスラングとして人口無能と呼ばれています。

脳と比肩するほどの高度な処理は行われていないという皮肉が込められています。

大半の人工無脳は、GoogleアシスタントやAmazonアレクサなどのバーチャルアシスタント、FacebookメッセンジャーやDiscord、微信などのメッセージアプリ、個々のアプリやウェブページを介して利用されています。

初期の会話ボットとしては、ELIZA と PARRY があります。
その後、Racter、Verbot、A.L.I.C.E.、ELLA などが登場しました。

社内の情報システム部門のヘルプデスク担当者の負担軽減のために、チャットボットを導入した事例もあります。

学習データの作成が大変ですが、人件費の節約に効果があり、24時間365日体制での対応も可能とされます。

最も人間に近い自然言語を話す会話ボット A.L.I.C.E. は AIML という特殊な言語を使っています。

A.L.I.C.E. も推論などとは無縁な単なるパターンマッチングに基づいて動作し、これは1966年の最初の会話ボット ELIZA と基本的に変わりはありません。

Jabberwacky や Kyle はそれよりも若干強いAIに近く、ユーザーとのやり取りから学習し、新たなユニークな応答を生成することができます。

これらはある程度の効果を発揮するものの、様々な自然言語にまつわる問題への対処はまだ十分ではなく、汎用的な自然言語による対話が可能な人工知能は未だ存在しません。

microsoft りんな

りんなは、日本マイクロソフトが開発した会話ボットの一つです。


2015年7月31日にLINEのサービスに登場し、同年12月にはTwitterでの活動を開始しました。

当初は高等学校に通う女子生徒であるという設定にもとづき、ユーザーと交流していました。

2019年3月20日に高校を卒業し、同年4月3日、エイベックス・エンタテインメントと契約し歌手デビューしたという設定になっています。

当初、日本マイクロソフトはりんなのアルゴリズムの詳細を公表していませんでした。

少なくともマイクロソフト社の検索エンジンBingと収集されたビッグデータを基礎として機械学習プラットフォーム「Azure Machine Learning」が用いられていることはわかっていました。

その後日本マイクロソフトは、2016年5月に開催されたイベント「de:code 2016」にて、りんなの自然言語処理アルゴリズムの詳細を公開しました

りんなの基本的な仕組みとして、ユーザーの問いかけに対して返答候補を関連度に基づいてランク付けして回答していることが明らかにされました。

この仕組みには、Word2VecLearning to ranktf-idfニューラルネットワークの4つのアルゴリズムが用いられています。

より具体的には、ディープラーニング深層構造類似度モデル再帰型ニューラルネットワークなどの技術が活用されています

2018年5月22日からは、「共感モデル(Empathy model)」が採用されています。

このモデルは、ユーザーがりんなと共感し、会話を長く続けられるようにすることを目的とするものです。

りんなは共感を得るために、ユーザーの発言を肯定する、質問する、新しい話題を切り出す、聞き手に回るなどの手法から適したものを選び、回答を自動生成します。

過去のAIでは、人種差別的な発言をしたことで問題になったケースがあります。

りんなでは、不適切な表現は開発陣によって排除する、あるいはりんなに覚えさせることで自動で削除するといった処置がとられています。

りんなの歌声は、ボーカロイドなどのように波形を組み合わせて生成するのではなく、人間による大量の音声データをAIに覚えこませて人の声をモデル化し、音の長さ・強弱・音程・声色の4つのパラメーターを調整することで生成しています。

AIアシスタントCortanaはマイクロソフト社の提供である点が共通しており、検索エンジンとしてもりんなと同じBingを使用しています

しかし、りんなはCortanaと比べて、「面白い、興味深い」という部分に力を入れて開発されています

使用用途が異なるため、学習のためのテキスト情報は両者別々のデータベースに蓄積されています

Cortanaや、アップル社のSiriが利用者にとっての秘書のような役割を果たしているのに対し、りんなは「楽しい友人」としての役割を持っているといわれています

同じようにマイクロソフトが開発したおしゃべりボットのTayはTwitter上の書き込みボットです。

中国のXiaoiceも、りんなと同じマイクロソフトのチャットbotであり、りんなと同じ技術を使用しています。

りんなはXiaoiceの後発となりますが、日本ユーザーに対応するためにゼロから開発し、日本の文化やコミュニケーションスタイルを反映させています。


マイクロソフトではXiaoice、りんなの他、米国(Zo)、インド(Ru)、インドネシア(Rinna)においても同様のAIを開発しています。

google Meena(ミーナ)

米グーグル(Google)が2020年1月末に論文発表した「Meena(ミーナ)」は会話の流れや一般常識を踏まえて発言できるチャットボットです


AppleのSiriやAmazonのAlexaといった人と会話できるAIは、人の質問に適切に答え、時には冗談を飛ばすこともありますが、一問一答のやりとりではなく「会話」を行う場合、人がAIに配慮して言葉を選ばなければうまく会話できないことが多くありました。

そんな中、ディープラーニングを用いて「自然な会話」を行うことができるAIをGoogleが開発しました。

文章の内容が理解できるとして話題になった自然言語処理AI(人工知能)BERTでも使う「Transformer」という技術が進化の原動力となりました。

Googleが開発したAI「Meena」は、ニューラルネットワークによって文章を生成する手法のひとつである「Evolved Transformer seq2seq」が用いられています。


チャットボットは2016年ごろから企業での導入も始まっているが、これまではあらかじめ開発者の側で設定したパターンに当てはまる会話しかできないことが課題でした。

パターンに無い質問が来ると、それっぽい応答をしてごまかすだけで、人間のような会話のキャッチボールをすることは困難でした。

それに対してグーグルが2020年1月28日に公開した論文「Towards a Human-like Open-Domain Chatbot」で明らかにしたチャットボットのMeenaは、ソーシャルメディアなどで交わされる実際の会話データ341ギガバイト(GB)を、パラメーターの数が26億個も存在する巨大なニューラルネットワークに学習させることで、様々な分野の話題について人間のような会話ができるようになったということです。