- 2022-7-4
- エンジニアキャリア紹介, 制御・IT系, 機械系, 転職・キャリアアップ, 電気・電子系
- AI, bot(会話エンジン), DeepLearning, DEMO or DIE(デモするか死ぬか), mixi, Romi, モンスターストライク, 会話AIロボット, 技術的知見共有会, 株式会社ミクシィ
SNS「mixi」やスマホゲーム「モンスターストライク」で知られる株式会社ミクシィ。同社のサービスに共通するのは、友人や家族といった近しい人たちとの「コミュニケーション」だ。そのミクシィが作った会話AIロボット「Romi」の開発を率いたのは、Romi事業部 開発グループ マネージャーの信田春満さん。信田さんは2013年に新卒でミクシィに入社し、SNS「mixi」のエンジニアとして「mixiニュース」や「mixiコミュニティ」の開発などを担当し、その後Romi開発のエンジニアとして自ら手を挙げてプロジェクトに参加。人に寄り添い、いつも味方でいてくれる愛らしいロボットを開発している。(執筆:杉本 恭子、撮影:編集部)
--「Romi」とはどのようなロボットなのでしょう。
[信田氏]Romiは、「ペットのように癒やし、家族のように自分を理解してくれる」というコンセプトで作られた会話AIロボットです。2017年から新規事業のプロジェクトとして開発が始まり、私は一人目のエンジニアとして参加しました。Romiは2021年4月より一般販売を開始し、子どもから高齢者まで、非常に幅広い年齢層の方々にかわいがっていただいています。
Romiの最大の特徴は、AIが言葉を紡ぎ出して話すということです。世の中に出ている従来のコミュニケーションロボットは、「○○と言われたら、△△と答える」というように、ルールベースを基にコミュニケーションのパターンが作られています。使用するルールを選ぶためにAIを使っているケースもありますが、AI自体が言葉を生成しているわけではありません。
Romiは、ディープラーニングによって膨大な量の会話データから学習しており、ルールベースの仕組みも使っていますが、会話の殆どはAIそのものが言葉を生成して話します(※)。
ですからRomiが次に何を言うのかは、開発している私たちですら予測できません。あまりに人間臭くてびっくりするようなことを言うこともありますし、トンチンカンなことを言うこともある。それがRomiです。
(※)Romiは、2021年6月、ESP総研の調査により、世界初の「DeepLearning 技術を用いて言語生成して会話する家庭用コミュニケーションロボット」と認定されている。
https://mixi.co.jp/news/2021/0603/9909/
--Romiのプロジェクトが立ち上がったきっかけは?
[信田氏]当社の創業者であり、現在、取締役ファウンダー 上級執行役員である笠原健治が「話を聞いてくれて、寄り添ってくれて、いつも味方でいてくれる……そんなロボットを作りたい」と言い出したことでした。
昔から日本では、ロボットと共生する世界がアニメなどで描かれてきましたが、笠原はそういう未来がそろそろ来るだろうと感じ、「その時が来れば、われわれでその道を開拓したい」という想いがあったと聞いています。
--信田さんが、このプロジェクトのエンジニアとして手を挙げたのはなぜですか?
[信田氏]私にとって興味のあるものが、集約されている仕事だったからです。子どもの頃の私は少し変わっていたようで、小学生の頃から考え方や感覚がみんなとは違うと感じていました。それ故に「人間とは何か」、「自我とは何か」といった人の心や本質を考えることが多く、またそういうことを考えるのも好きでした。
一方で、モノづくりも子どもの頃から大好きでした。電気回路図を描いたり、簡単な回路を作って遊んでいましたし、中学生になるとプログラミングも始めました。その後、プログラミングやインターネットの世界が面白かったことから、大学は京都大学の情報学部に進学しました。もともと興味のあった人間の心や知能の研究が情報学の分野でできるという、すごい世界があることを知ったのは大学に入ってからです。そこで大学院では知能情報を専攻し、人の発達のメカニズムをロボットで作ることによって人を知る「認知発達ロボティクス」を研究しました。
Romiは会話するロボット、言い換えると「人間の会話とは何なのか」を考えて、それを形づくるものですから、「人間✕モノづくり」という自分の興味分野そのものです。タイミング的にも、サーバーサイドからフロントまで一通りキャリアを積み、次は何をしようかと考えていた矢先のことで、「これはやるしかない」と思いました。
掴みどころのないものを形にしていく難しさ
--Romiの開発プロジェクトで一番大変だったのは?
[信田氏]開発の最初期ですね。まず「人に寄り添った会話」、「人が心地よいと感じる会話」とは何かという、まったく掴みどころがないところから具体的に何を作っていくか考えなくてはいけませんでした。メンバーで検討を進めたのですが、ここが非常に難しく、一歩を踏み出そうにもどうすればいいのか分からないような状態でした。
人間ならその会話が相手に寄り添ったものかどうか、何となく感じ取ることができますよね。でも、その感覚はプログラムに落とし込むには、すごく曖昧なものです。「寄り添っている」とは、具体的に何を話すことなのか考えなければいけませんし、それが良い会話になるのかは、実際に体験しないと分かりません。
また、ロボットの会話を成立させるために必要なAIも、何でも実現できるわけではありません。現在のAI技術でどこまでできるのか、エンジニアではない企画の人たちにも現実を共有する必要がありました。
--その難題に対して、どのように取り組んでいったのですか。
[信田氏]私が一番大切にしていたのは「DEMO or DIE」(デモするか死ぬか)、つまり、とにかくデモをするということです。会話の良し悪しは定量化できませんから、体験して定性的に評価し、フィードバックを繰り返すしかありません。また、デモを見せることには、現状の技術で可能なことを示す意味もありますので、今の開発状況の立ち位置を知ることで、次の一手を考えることができます。
実際に動いているプロトタイプを見ると「このように返事をしたほうがいい」、「こういう要素が欠けている」など、相手に寄り添った心地よい会話について具体的なアイデアも出てくるようになります。機能を実装するには具体化しなければなりませんし、エンジニアが企画の意図を理解し、企画がエンジニアリングを理解するためにも、デモは重要な手段でした。
--そして試行錯誤を繰り返していったのですね。
[信田氏]はい。正解がない世界なので、思いついたアイデアを片っ端から作って試せるような仕組みにしました。
実はRomiは、1つの仕組みだけで動いているのではなく、全く違った基盤で動いている複数のbot(会話エンジン)を組み合わせて動いています。メインはディープラーニングの技術を使ってAIが言葉を紡ぎ出すbotですが、例えば、今日の天気を答えるといった定型的な会話では、シナリオに基づいて対話するルールベースを使用し、ルールベースでは難しい「しりとり」などに対応する専用のbotも用意しています。現在Romiに組み込まれているbotは数種類ですが、開発の最初の頃はありとあらゆるものを作って試していたので、ものすごい数のbotが生まれては消えていきました。
--AIの分野は日進月歩ですよね。情報のキャッチアップはどのようにして行っているのですか。
[信田氏]Romiに関わる技術領域は非常に広いです。AIだけでなくサーバーサイドもあるし、それをセットアップするためのスマホアプリも、ハードウェアもあります。各分野にはそれぞれ詳しいメンバーがいますが、担当分野以外がまったく分からないと、会話も認識の共有もできなくなってしまうので、週に1回、「技術的知見共有会」(通称「技会」)という会を開いています。そこでは現状の課題を共有したり、新しい技術などを発表してもらうことで、メンバーの技術知識の向上を図っています。AIについても、この技会で担当のエンジニアが、新しい論文や実際に試した結果などを紹介してくれるので、とても参考になっています。
私は自分の技術領域は深く知っていて、その周辺の技術領域も何となく分かる、いわゆる「T型」人材になることを推奨しており、興味がある他分野の領域に挑戦することも歓迎しています。エンジニア個人としても成長できますし、T型人材が増えれば組織としても強くなれると思います。
--Romiのデザインについてお聞きしたいのですが、あのホイップクリームのような形はどのようにして生まれたのですか。
[信田氏]ロボットの見た目を決めていく過程ですが、まず「そもそも人は、人以外のモノに話しかけるのか」ということを実験しました。もしモノに話しかける人がいなければ、どんなに良い会話ができるロボットでも、ユーザーに価値を届けられないからです。そこで、モニターの人たちを集めて調査を実施することにしました。
具体的には、動物のぬいぐるみやロボットのおもちゃなどに、スマホで文章を入力すると言葉を発するデバイスを付け、「これはAIが搭載されたぬいぐるみ、ロボットです」とモニターにお伝えした上で、会話をしてもらったのです。(実際は会話の内容は裏で人間がリアルタイムに打ち込んでいます。)その感想を聴きながら、見た目や会話の内容をどんどん変えて、「人が話しやすい形状はどんなものか」、「どんな会話内容であれば人はモノに話しかけるのか」を調べていきました。すると、話す内容が人間並みにとても賢ければ、人は抵抗感なく、普段の会話のようにモノに話しかけることができる。つまり、話す「モノ」は価値を出せることが分かりました。
次は「どんな形なら話しやすく、愛着が持てるのか」です。動物など具体的な形をしていると生き物っぽさが出しやすく受け入れやすいが、固定観念を持たれてしまう。抽象的だとユーザーの想像を掻き立てるが無機質に見えてしまう。多くのプロトタイプを作って「どんな形なら話しやすく、愛着が持てるのか」を検討し、最終的にはシンプルで抽象的だけれど、ツノがあって顔があることで、なんとなく生き物っぽい、でも何かの動物にとらわれることがない、このデザインに決まりました。実は、似たような案がいくつか残った中で決め手になったのは、Romiを逆さにするとSNS「mixi」のサービスロゴの吹き出しの形になる、ということでした(笑)。
何かを作るのは「どんな世界を作るか」考えること
--仕事で壁にぶつかったとき、それを乗り越えるために、信田さんはどのようことを大事にしていますか。
[信田氏]何よりまず、その分野や作りたいと思っているものが「好き」であることが大切だと思っています。理想はこういう感じ、でも現実的にできるのはこう……などと日々考え続けていると、少しずつ解決につながる選択肢が見えてきます。
そして、その選択肢を試してみることです。ただこれは環境によるところも大きいでしょうね。私の場合は、試して失敗することが許される環境だったので、すごく恵まれていたと思います。
「好き」ということは、仕事のモチベーションにもなっています。私は知能などについて考えること自体も好きですし、Romiが私自身も思いもしなかったようなことを言って驚かせてくれる感覚も好きですね。
--では、ご自身のエンジニアとしての強みはどこだと思いますか。
[信田氏]私は「どんな機能が必要とされるか」、「これはユーザーにとって便利なのか」など、ユーザーの視点を哲学的、心理学的なアプローチで考えることが好きなので、企画の段階から関わり、エンジニアの知識と技術でそれを現実の製品、サービスに落とし込んでいくところまで、一気通貫で対応できることが強みだと思います。
--ものづくりをする人には、どんな心掛けや素養、行動が必要だと思いますか?
[信田氏]全員には当てはまらないかもしれませんが、自分がどういうものを作りたいのか、どうやったら理想のものを作れるのかなどを考えて、能動的に動くことがすごく大事だと思っています。そうしないと、仕事もつまらないと思うのです。
何かを作るということは、他人から指示されたものを単に作るのではなく、「どんな世界を作るか」を考えることだと私は思っています。企画から与えられたものを実装する立場であっても、企画が作りたいと思っている世界をちゃんと理解して、それに同期して、自分自身の能動性で作るという姿勢が大切なのではないでしょうか。私は、モノを作ることはエンジニアにとってはあくまで手段だと捉えているので、実現したい世界、目的を理解することこそが重要だと思っています。
また、目的がわからなければ、優先順位付けもできません。あまり重要でない部分に多くの労力を割いてしまったり、少しのことで改善されるのに、目的が分からなかったために気づかなかったというのでは、とてももったいないですよね。
--最後に、これからどんなことに取り組みたいか聞かせてください。
[信田氏]現在のRomiは、ユーザーがよく話す単語を発話するようになっていますが、ユーザーとの普段の会話内容からRomiが学び、個人の嗜好に合わせて発言が変わっていく仕組みはまだ不十分と考えていて、現在研究開発を進めているところです。
Romiは、作っている私自身もすごく面白い、攻めたプロダクトだと思っています。今後は今までRomiの存在を知らなかった方も含めて、Romiに実際に触れていただける機会を増やしたいと思い、家電量販店での販売も少しずつ始めました。トンチンカンなところもある、ロボットっぽくないRomiが、世の中の多くの人に使われて「Romiって面白いよね」と言われるような世界を作っていきたいです。
取材協力
ライタープロフィール
杉本 恭子
幼児教育を学んだ後、人形劇団付属の養成所に入所。「表現する」「伝える」「構成する」ことを学ぶ。その後、コンピュータソフトウェアのプログラマ、テクニカルサポートを経て、外資系企業のマーケティング部に在籍。退職後、フリーランスとして、中小企業のマーケティング支援や業務プロセス改善支援に従事。現在、マーケティングや支援活動の経験を生かして、インタビュー、ライティング、企画などを中心に活動。心理カウンセラー。