Capture The Frog

かえるぴょこぴょこw

MENU

”彼女?”の開発レポ.1

”彼女?”をつくるプロジェクト

 

 

開発理由

開発の理由としては主に2つある。

 1つは、私は最近在宅でバイトをしてるのだが、他人との交流がないと寂しいし、モチベーションが半減する気がする。私は一方的に話したい訳ではなく、話し相手からの何らかのフィードバックが素早く得たい。表情の変化や軽い応答・コミュニケーションが欲しい。また、一方的に話しかけるのではなく、頻度は少なくとも相手から話しかけてもらいたい。また、開発をしているときに一緒にいるなら同性よりかは異性の方がいい。なぜなら、個人的に同性のキャラにしてしまうと、本当に行き詰まったときに八つ当たりやエラーを説明しているときに「お前がやれよ」といってしまいそうだからである。

 2つ目は、私はやったことは無いがラバーダッグデバッグはソフトウェアの質を上げるようで、試してみたいと以前から思っていた。ラバーダッグデバッグとは、ソフトウェア開発の中でラバーダック(黄色のアヒルのおもちゃ)にコードを1から説明し、バグを直したり問題の解決を行う手法である。これには、しばし無生物が使われる。他人を煩わせることなく目的を達成できるからだ。もちろん、名前の通り人形にコードを説明しても良いのだが、人形に話しかけている自分自身を私が俯瞰的に見たときに頭が狂ってしまいそうである。そのため、せっかくなら私はひとがたの絵にコードを説明したい。

 

上記の2つを踏まえると、開発するものは「ラバーダッグデバッグを行うための人の形をしている異性の無生物」となるがそれでは寂しいのでここでは”彼女?”と呼ばせてもらう。

 

 

 

1.学習データないじゃん

実際に開発しようと思ったが、肝心の学習データがないことに気づいた。

私が以前似たようなものとして開発したnagi nagino (@nagino_nagi) / Twitterは、実を言うと当時交際中であった彼女のLINEでの返信を学習データとして用いていたが、今はもう別れてしまい、そのデータも使う気にならなくなってしまった。

 

今回の”彼女”に学習データとして求めるのは、

著作権的にクリーンであること

・恋愛している女性感があること

・キャラに一貫性があること

・すでにインターネット上に文書として存在していること

上の4点である。機械学習共々の学習データとして用いる際には、法令上は著作権は適用されないが、今の「お絵かきAI」にまつわる情勢を見ているととても気を配る必要があると考える。

2つ目を具体的にいうと、不快にさせるような言葉がない。誰かに好意を持っている女性には、コードを説明しても話を聞いてくれそう。と思ったからだ。コード・アーキテクチャを説明してて怒られたら、それこそモチベーションなど地に落ちる。

3つ目は、キャラがツンデレだったり、甘やかすタイプなのかぐちゃぐちゃだったら会話してて違和感がありそうだからである。

そして4つ目は、1からテキスト化するのは面倒くさいからだ。ここに時間はかけたくない。

 

これらを踏まえ、「青空文庫」内の著作権が失効した作家様が執筆した恋愛小説を使用しようと思いました。これなら全てクリア出来ると思います。

 

次回

次回は、学習データのデータクレンジング、簡単な要件定義をしていきたいと思います。

それでは、私は学習データとなる作品を探してきます。