KuroNet Text Editor

“KuroNet Text Editor”は、「KuroNetくずし字認識サービス」による多文字くずし字OCR結果を編集するツールである。

KuroNetくずし字認識サービスが出力する、多文字くずし字OCR結果を含んだキュレーションに対し、読み順を編集する機能を提供する。

本ツールは、IIIF Curation Viewerをベースとして、OCRテキスト編集用途に特化して機能を加除したツールである。この文章では、本ツール固有の内容を中心に記述する。

目次

動作デモ/活用例

KuroNet Text Editorのデモンストレーション

使い方

キュレーションの指定

IIIF Curation Viewerと同じく、GET引数(パラメータ名:curation)の指定やドラッグ&ドロップ、ペースト(貼り付け)により、OCRテキスト編集を行うキュレーションのURLを指定する。

KuroNetダッシュボードに用意された本ツールへのリンクを用いても良い。

また、IIIF Curation Viewerでキュレーションを閲覧している場合、ウェブブラウザのアドレスバーに表示されているURLを本ツールへドラッグ&ドロップやペーストしても良い。

キュレーション表示画面キャプチャ

KuroNetくずし字認識サービスによる多文字くずし字OCR結果が表示される。OCR結果は、資料画像上に「文字マーカー」として重ねて表示される。画面左下に表示されるマーカー表示調整パネルから、文字マーカーの表示位置、不透明度、サイズを調整できる。

読み順の編集

文字認識後、読み順の情報が設定されていない状態から、文字の読み順と行の読み順を編集し、OCR結果に対して読み順を登録するケースを例として説明する。

読み順設定対象

本ツールでは、文字の読み順を指定することで行を形成し、行の読み順を指定することで、全体の読み順を完成させるモデルとなっている。

どちらのレベルの読み順を指定するかは、画面左上に表示される読み順設定対象パネルの「文字」「行」ボタンによって切り替える。

読み順設定対象パネルキャプチャ

また、読み順設定対象の切り替えは、文字マーカーを右クリックして表示されるコンテクストメニューからも行うことができる。

文字マーカーコンテクストメニューキャプチャ

読み順の削除を行った場合、削除後に読み順を訂正追加することを想定し、読み順設定対象は、削除した読み順と同じレベルに自動的に切り替わる。

文字の読み順の追加

読み順設定対象パネルが「行」になっている場合は、読み順設定対象を「文字」に切り替える。

文字マーカーをマウスでなぞっていくと(文字マーカーをクリックした状態からドラッグし、次に読む文字マーカーの上を通過していくと)、文字の読み順が設定され、文字マーカー間に連結線(青色・直線)が引かれる。