査読者のポジティブな意見は以下の通りです. ・多腕バンディットアルゴリズムを一対比較的な手法に基づくユーザの嗜好性の理解に用いられるように適用する手法には一定の新規性があります. ・一対比較によるインタラクションでも嗜好画像生成の適切性に効果があることが示されており,有用性が認められる他,手法はシンプルながら新規性を認めることができます.
4: どちらかと言えば採録
1: 専門外である
GANによる嗜好画像生成におけるユーザの嗜好を取得するために,スワイプ操作を用いて行う手法の提案である.比較は同じインタフェースでシンプルなベイズ最適化法と多腕バンディッド法との間の比較となっている. 関連研究の末尾で,潜在的な複数次元の調整法として,複数のスライダや複数対比較を要求するために,ユーザの負荷が高くなることが human-in-the-loop 手法としての問題であるとしている.ここを一対比較のように軽量な手法で実現できれば,提案手法の効果が高いことは論を俟たない. 一方で,本稿では,多腕バンディットアルゴリズムによる潜在次元の重要性選択手法と,単純なベイズ最適化とを比較している.先に述べたように,当該手法の利点はユーザ負荷の低減であると考えられるので,ユーザ負荷を低減しつつ既存の(スライダ・複数対からの選択のような)手法との比較により,どの程度の精度が期待されるかを評価するのが論旨として適当と考えられるが,その比較は実施されていない. また,多腕バンディッドアルゴリズムを一対比較のインタラクションで提供したことには一定の新規性があるものの,そもそも多腕バンディッドアルゴリズムは,複数のパラメータ群(ここでは,次元)から最適な選択肢を推定するための方法であり,単純な最適化よりもユーザの意図性を汲めるアルゴリズムであることが推察される.その結果,BanditBOがSimpleBOより(Randomより)高評価になるのは素直な結果であると考えられる. さらに,ユーザは「潜在的な」パラメータではなく,顕在化したパラメータ(性別・眼鏡などの服装)に興味を持っている場合があることが示されており,この観点は興味深い.一方で,例えば比較評価のためのインタラクションスタイルとはどうあるべきかなど,これらに基づく検討は深められていないことから,本稿自体の有用性は高いとは言えない.
WISSはインタラクティブシステムに関するシンポジウムということもありますので,発表の際には,ユーザが実際にどのようにシステムとインタラクションするのか,その結果どのように生成された画像が変容していくか,がわかるようなプレゼンテーションを期待します.
4: どちらかと言えば採録
1: 専門外である
本論文は、GANの潜在空間を利用し、スワイプ操作でユーザの好みの画像を効率的に生成する方法を提案しています。潜在空間の探索を効率化するために主成分分析と多腕バンディットアルゴリズムを使用しています。 探索すべき次元を動的に決定しながら、探索を進める手法に新規性が認められます。また、論文自体の記述の質も高いかと思います。さらに、シミュレーション結果やユーザスタディからもシステムの有用性が読み取れます。 しかし、以下の点が気になりました。
- 実験設定の説明が不足しており、実験の内容がやや不透明です。例えば、シナリオを6個用意した、とありますが、どのような指示を出したのかがよくわかりませんでした。具体的な例を1つ示す必要があるように思います。また、実験の実施時間が示されておらず、探索にどの程度時間がかかったのかがわかりませんでした。
- 探索した際のユーザの操作について、例えばデモ動画のようにただ右をスワイプし続けたのか、それとも所々で左を選択しているのかなどが示されておらず、どのような探索が行われたのかが把握できませんでした。
- ユーザ主体のシステムが求められていることを発見したことについて主張していますが、システムの操作性が低下すると、システムに対するユーザの満足度も低下することは一般的な話かと思いました。 以上より、4: どちらかと言えば採録 と判断しました。
- 探索がうまく進む例や進まなかった例などの過程を画像で示せると、より理解が深まるように思いました。 - 事前の嗜好イメージと探索結果の対応を示してもらえると、より理解が深まるかと思います。
4: どちらかと言えば採録
2: やや専門からは外れる
GANを用いた画像生成において、潜在空間を主成分分析で縮小しつつ、ベイズ最適化により効率的に探索する手法の提案です。目的関数として一対比較の結果を受け取る点、多腕バンディッ トアルゴリズムを適用する点にも新規性があり、シンプルなベイズ最適化よりも効率的に目標画像に近づくことを確認しました。 上記のように、システムの背後にある手法の新規性や面白さから、本論文は採択に値すると判断しました。 ただし、それを用いたインタラクションの説明に改善可能性があると感じます。まず、論文を読むだけだと「ユーザは画面に提示された画像を左右にスワイプすることで嗜好を表現する」という記述と図1のみで、どういう風に使うのかが想像しにくいと感じました。 どういう操作をするとどういう生成がなされるのか。 5章の説明において、d'は説明があっても、削減前のdが明記されていません。d'はもともとのdの次元数が異なると意味が変わると思うので、明記してください。 また、h,wも明記されていませんので、明記が必要と思います。 一対比較を活用したインタラクションの実現方法の一つが今回の提案だと思いますが、もし他にもインタフェース案を色々考えられたり、それをWISSで議論できると有益ではないかと感じました。
5: 採録
3: 自身の専門分野とマッチしている
この論文では, スマートフォンなどの限られた画面上で, 生成モデルの潜在空間を効率的に探索して所望の画像を得るための手法を提案している. 生成した2枚の画像を一対比較させ, それをもとにベイズ最適化で潜在空間を探索するというのは既存手法と同様だが, さらにPCAによって潜在空間の自由度を削減しつつ, かつ部分空間内でどの自由度がユーザにとって重要なのかを多腕バンディットで推定することによって, 高次元空間での探索を現実的なコストに納めている. 潜在空間探索において自由度削減をおこなう手法は過去にも提案されているが, これに加えて多腕バンディットでの有効な探索軸の推定を組み合わせたところに新規性がある. 実験も丁寧におこなわれており, 採択基準を満たしていると判断する. PCAを潜在空間でおこない, バンディッドで選択された次元ごとに最適化をおこなっています. このときの基底は潜在空間では直交していますが嗜好空間?では直交しているとは限りません. 実験ではうまくいっているようにみえますが, 自由度ごとと部分空間 全体でベイズ最適化をおこなった場合とでどちらがよいかは自明ではないのでその考察があることが望ましいです. 提案されているインタフェースでは, 現在の画像との比較対象として, 一つ前の既に表示が隠れてしまった画像を使っていますが, この表示方法だとユーザは前の画像を思い出そうとしてうっかり前に戻ってしまい, それを正規の操作だとシステムが誤認してしまう可能性があるとおもいます. 小さい画面に納めたいというモチベーションはわかりますが, それでも比較する2枚は常に表示したほうがよいのではないでしょうか?ひとつ解決法としては指が画面にタッチして動かしている間はスワイプで両方の画像を連続的にスライドして見せることができるようにして, 指を離したときにはじめてシステムへの入力だと判断する方法もあるとおもいます.
論文中にも記述されているように, システムが提示した画像をみることでユーザの目標とする系統が途中で変化することはよくあることだとおもいます. こうしたときにガウス回帰しようとしている関数形状も変化してしまうためベイズ最適化がうまく働かなくなる可能性があります. このようなとき, 今までとは系統が異なる画像をユーザが選択したときのスコアを多めに見積もるなどの工夫があるとよいとおもいます. また, 実験としても被験者に, "用意された目標画像に近づけさせる操作"と"単純に好みの画像を目指させる操作", のどちらをおこなうのか明確に分けて設計するとより説得力のある評価となるとおもいます.
GANによる嗜好画像生成におけるユーザの嗜好を,スワイプ操作を用いて効率的に行う手法を提案し,その手法に沿った生成アルゴリズムとして多腕バンディットアルゴリズムを適用することで,シンプルなベイズ最適化手法よりもよりユーザの嗜好性を反映した画像を生成できることを示している論文です.