現時点での完成度は高く、WISSにおいて有益な議論ができると判断したため、「ロング採録」が良いとの結論に至りました。但し、ページの都合上、書ききれなかった(と思われる)個所について、分かりやすく紹介をしてもらえればと思います。今後の研究の発展を期待いたします。
(ページ数の都合上、書ききれなかった個所がありそうですが)現状、注目すべき歌唱の探索などに関する記載などが不足し、目的があいまいになっている個所があります。これらについての説明を追加するとより良い論文になると思います。
5: 採録
2: やや専門からは外れる
本研究は、「ニコニコ動画やYoutube上の"歌ってみた"動画の音源」のような、多数の歌い手が存在している曲を想定し、F0分布の可視化方法(SingDistVis)を紹介したものです。具体的には、一人一人のF0の折れ線グラフの代わりに、ヒートマップや色情報(赤色と青色)などの工夫によって、平均的なF0から外れていても魅力的な歌い手の傾向を(比較的)見やすくしています。 - 高評価/低評価について 今回のポイントは、高評価/低評価e_{k}の歌い手に関する傾向を見やすくする可視化だと思っています。本文中でも高評価・低評価という単語を多用していますが、どういう基準で歌が高評価なのか、低評価なのかの記載がないと思います。Youtubeやニコニコ動画などからダウンロードされた音楽データを用いている場合は、「いいね数」からe_{k}判定しているようにも思いますが、あくまでも憶測の範囲になってしまうので一言明記が必要だと思います。 (また、like数とdislike数(投票数や再生数)を基に、何かしらのアルゴリズムでe_{k}を判定している場合は、その方法も記載 or 発表の際に説明してもらいたいです) - 評価方法について。 a) 被験者は、歌唱に関する知識や経験(楽譜が読める人なのか等)がある方なのでしょうか?? 楽譜が読めない人や歌を全然歌えない人の場合、本システムの良さを理解できない可能性がありますので、被験者の条件をより書いたほうが良いと思います。 b) 現状の回答で十分かもしれませんが「SUS(使いやすさ)」「NASA-TLX(作業負荷)」といった一般的な評価尺度のほうが、考察はしやすいかと思います。 また、(小さなことですが)デモ動画や本文を一目見たとき、どの質問がポジティブな設問か、ネガティブな設問かが判断しづらいです(質問7~10や質問12~13など)。なので、質問を箇条書きした段階で、どの問題が「点数が高いほうが良いのか」「低いほうが良いのか」を明記したほうが良いと思います。
- 本研究の最終ゴールは「ある程度、条件が統一された」膨大なデータを効率的に分析するための可視化方法を模索することであり、その第一歩として「youtubeやニコニコ動画に公開されているような"歌ってみた動画"の歌い手の傾向」を対象とした研究だと考えています(一種のケーススタディ)。同様の可視化方法が応用できそうな例も紹介 or 将来的にはほかの例に試した研究も面白いかもしれません - 本研究はインターフェースの提案とありますが、本文やデモ映像は「可視化方法」自体の説明に留まり、インターフェースを実際に触っている様子(処理速度なども含)が確認できませんでした。なので、発表の際には実機デモ または、インターフェースを触っている動画を用意してもらえると幸いです。
5: 採録
1: 専門外である
同一の楽曲を非常に多くの人が歌っているという現在の状況に基づき、そうした歌の基本周波数(F0)の推移を可視化するインタフェースの提案を行っています。大域的なF0分布の概略表示と局所的な分布表示を組み合わせることで、容易に評価の高い人、低い人の特徴を掴むことが出来ます。また被験者実験によって有用性を検証しています。 可視化を、歌唱技術の理解、上達のために用いるというモチベーションが明確であり、未来志向のはっきりした研究だと思いました。
5: 採録
2: やや専門からは外れる
本論文は,同一楽曲を異なる人々が歌った同曲異唱コンテンツを対 象として,大域的なF0分布をヒートマップで表現するOverview表示 と,局所的なF0分布を折れ線の集合で表現するDetail表示を用いた 可視化を行うインタフェースSingDistVisを提案しています. 同曲異唱コンテンツの可視化という問題設定自体が新しく,提案さ れているインタフェースは,歌唱者によって共通する部分や異なる 部分を発見するのに十分役立つものになっていると思います.
本論文で提案されている範囲で特に異論はありませんが,同曲異唱 コンテンツの可視化によって,本当にしたいことがこれだったのだ ろうかという疑問を感じました.6.2.2節の質問12,13にあるよう なことが本来の目的なのでしょうか. 未来ビジョンに書かれている「多数の歌唱者の中から自分がお手本 としたい歌唱者・歌唱技法を探すことで多様な歌唱技法を理解し, その結果として発見した歌唱にならうことで歌唱力を向上させる」 であれば,可視化の目的として理解できます.しかし,本論文自体 はこのような歌唱を探索する方法を論じているわけではなく,その 点を残念に思いました.
5: 採録
2: やや専門からは外れる
構成も読みやすく,よく書かれた論文だと思います.こういった可視化手法の目的としては, ・ある目的で大量データのなかを探索していくことを効率化するための可視化 と ・目的は特に決まっておらず,特性可視化によって何か新しいものを見つけだすための可視化 の大きく2パターンの目的があるのかなと考えます(両方ということもあると思います).特に,目的がある程度決まっている場合,可視化で探索しないと見つからないのか,それとも特徴量を使った認識でリストアップされてそれを見るだけでいいものなのか,という観点が,可視化の必要性についての評価ポイントになるのではないかと査読者は考えました.そういった意味では,歌唱というのは,「注目すべき歌唱」や「自分がお手本にしたい歌唱」を探したいといったタスクに対して,ルールであらかじめ定義して認識することは難しいので,可視化システムを使う価値が充分に高いと判断しました. そういった観点からすると,スペースの都合もあるので難しいとは思いますが,この可視化システムを使った「注目すべき歌唱」探索タスクの記録などがあるとより興味深いと思いました.
本研究は「ある程度条件が統一された膨大なデータを効率的に分析するための可視化方法の模索」を目的とし、その第一歩として、youtubeやニコニコ動画に公開されている"歌ってみた動画"の歌い手の傾向を対象とする手法を提案している。アイディア自体はシンプルではあるものの、いずれの査読者もWISSで議論するべき論文として、採録を推薦しました。手法の発展性などについて活発な議論ができると期待している。