配置と時間による可読性を維持した画像内文字提示手法

-----------------------------
review comment 1
-----------------------------
■ 総合点
4
■ 確信度
2
■ 査読コメント
Webページを表示する端末によって解像度が違うため異なる画像サイズで表示してしまう場合に,文字のみを抽出してその文字のみを大きく表示する手法を提案されています.多くの商用Webサイトで起こりうる問題を扱っています.また,Webサイト運営者側とユーザ側の双方にとって,解決してもらいたい問題でもあると言えます.
同じような課題は,Woodruffらも扱っていますが,彼らは文字情報と背景画像とが切り離されたWebページを扱っていたため,本研究が問題とするような画像を対象とすることはできません.
・画像から文字部分を抽出し,その文字を拡大表示する.
・取り出した文字を重ならないように再配置する.
・上記において小さくなって消えた文字のあった部分を活用する.
・時間方向にも表示領域を拡張する.
という4点について,新規性があると思います.また,提案手法により自動作成された画像の例を見ても有用性も高いと思います.
インタラクション的には,推定した文字部分をドラッグにより修正する機能.消えても構わない文字を指定する機能などを提案しています.これらは特に斬新なインタフェースであるとは言えませんが,妥当な設計であると思います.また,生成した画像に対して,被験者による評価実験もしており,認知的にも有用であることを示しています.

ただし,画像からの文字列の切り出しについては,画像認識の分野で多くの研究が行われていると思います.技術的には,それらと比べて,新規性があるのか,認識精度が高いのかは不明です.ただし,抽出した後の表示方法については新規性はあるものと思われます.
消えても良い文字列がある部分ですが,それを画像上で消す方法について書かれていません.文字列を拡大表示する際にも,もともと文字であったピクセルが,背景を表示せざるを得ない場合が出てくると思います.このような場合に,どのような色をそのピクセルに割り当てるのかについて書かれていません.これらについても,補足してほしく思います.
■ レビューサマリー
2名の査読者は提案システムの必要性と新規性を高く評価しています.しかし,1名の査読者は,そもそも画像とテキストを別に保存しておけば良く,提案システムの必要性を否定しています.
バナー広告や商品のアピール用の画像では,商品やイメージの画像を背景にして,「激安」「今だけ!」のような文字情報を,魅力的なフォントやデザインで前面に表示しています.文字情報のデザイン性を重視しているため,画像とテキスト情報を切り離すということが,一般に浸透していないのだと思います.そのため,現状では,背景画像と文字画像がいっしょになった画像ファイルが一般的なことは致し方ないのだと思います.
本研究は,そのような現状を考慮して,背景画像と文字画像を別々に拡大縮小できる点に新規性と有用性があると思います.
しかし,1名の査読者と議論した結果,魅力的なフォントやデザインが重要なのであるならば,テキスト情報をそれらのデザインを施した画像として持っておけば,背景画像とテキスト画像を別々に拡大縮小できることを指摘しています.このような保存方法が浸透すれば,提案システムは使われなくなってしまいます.
上記の観点から,背景画像と文字画像がいっしょになった画像ファイルが流通している現状では,提案システムは有効となる可能性がありますが,これらが別々に保存されるようになれば,使われなくなってしまいます.
また,テキスト部分の切り出し作業については妥当な設計ではあるものの,やや煩雑な印象が否めません.また,インタラクティブシステムとして新規性を見出すことができません.切り出し作業を支援する工夫があると良いと思います.



-----------------------------
review comment 2
-----------------------------
■ 総合点
2
■ 確信度
2
■ 査読コメント
そもそもどういう場合に本システムが必要になるのかがよくわかりません。最近は「レスポンシブデザイン」などと言って、スマホでもパソコンでも適切なレイアウトが出るような工夫を行なうことが一般的になっていると思いますが、そういう工夫では駄目なのでしょうか? そもそも文字が見えないほど縮小した場合、写真の中身も見えなくなってしまうのではないでしょうか。この場合、テキストデータだけ表示した方が良いということはないのでしょうか?
また、画像を縮小したとき文字を表示したいことがあるとしても、手作業で文字を切り出す手間をかけるよりも、文字データをテキストとして別に扱えば良いのではないでしょうか。ALTタグに設定しておくなど、一般的な方法が使えるように思われます。

輪廓抽出技術などの新しさについてはよくわかりませんが、ユーザインタフェースとはあまり関係ないように思われます。

本論文で解説されている自動配置法及び「時間拡張」手法は単純な工夫であり、論文として充分有益なものとはいえません。



-----------------------------
review comment 3
-----------------------------
■ 総合点
4
■ 確信度
3
■ 査読コメント
本来、ウェブは、文字情報と画像情報を分離して扱っているはず、あるいは扱うべきはずと言われているものだが、実際のウェブでは画像に文字情報と結合されたものが多いのが実情である。ウェブの素材として作ったものはまだしも、日常的な写真にも文字情報と画像情報が結合して入っている。そこに目をつけて提案されている本手法は、まさに逆転の発想とも言えるもので、現在のウェブにおいてとても有用な考え方を秘めているように思う。

今日、大画面から時計まで、様々なサイズの画面でウェブを閲覧する時代となっており、レスポンシブなデザインが求められているので、このような柔軟性を画像に持たせることへのニーズはますます高まっていくと考えられる。そうした利便性の高いウェブにするために「画像情報と文字情報は分離せよ」「Altを使え」などとデザイナーの方に責任や作業負担が押しつけられる思想だったのが、それを解放し、むしろ文字情報を画像の中に記して構わないようにしたのはそれなりに画期的かもしれない。

インタフェースはまだまだ荒削りであり使い勝手が悪いところもあるように思う。が、現状のツールの利便性の是非よりも、このシステムの延長上に見える思想は議論に値すると考えられる。この技術の先には、グラフィックデザインとして作り出した画像をそのままレスポンシブなウェブサイトにすることができる世界が広がっているのかもしれない。

評価実験は、読みやすさを10段階で評価するだけではなく、極端な例(離れて見るなど)において、「読めるか否か」をテストする実験が加わると説得力が増すと思われる。