Top | Xwiretap

Xwiretap

Xプロトコルを盗聴してユーザに表示している文字列を推測し、それらを日本語XIMサーバの参照辞書に登録、更新するXサーバのプロキシです。

出力履歴を利用した予測入力

予測入力では、入力履歴や与えられたコンテキスト辞書から予測候補を提示、補完することができますが、ユーザが初めて入力する（計算機の知らない）語句を補完することは当然できません。

XwiretapはXサーバとXクライアントの通信を盗聴して、アプリケーションが画面に表示した文字列を出力履歴に記録し、それを日本語XIMサーバの予測候補として利用できるようにします。結果として、ユーザが読み書きした経験を計算機と共有できるようになります。

Xサーバのとしてプロキシとして、ディスプレイ接続を転送します。リクエストPolyText8, PolyText16, ImageText16, ImageText8の内容から、表示文字列を推測します。

MeCabを使用して形態素解析を行い、読み文字列と文節の区切りを取得します。

表示文字列の先頭から文節を削りながら参照辞書に登録します。さらに、各文節をひとつずつ登録します。

入力履歴は入力時のタイムスタンプを、出力履歴は出力時のタイムスタンプを保持しています。日本語XIMサーバは入力履歴、出力履歴に関わらず、タイムスタンプの新しい予測候補を優先します。そのため、参照したい文書を画面に表示するだけで、その表示している部分の内容が優先的に予測入力の候補となります。

また、日本語XIMサーバにはAutisticモードとReferenceモードがあり、Autisticモードのときは入力履歴だけを、Referenceモードのときは入力履歴と出力履歴の両方を使用します。ユーザがモードを切り替えることで、状況に適した予測入力ができるようになります。