しらぎく日本語URIでは、各ディレクトリ内の文書や子ディレクトリの名前をどう読み替えるかを指定するURL読替表を設置する事になっております。
しらぎく日本語URIに於けるURL読替表は簡単なテキストファイルです。
但し、予め設定で決めたファイル名ある事が条件となっております。
しらぎく日本語URIに於けるURL読替表の書式は単純で、
を必要な数だけ改行して並べて行くと言うものです。
実際にURL読替表の記述例を挙げ、それがどのように機能するかを解説致します。
今、
をそれぞれ、
と言う日本語名で扱いたい場合には、以下のように記述します。
第一章.html text1.html
第二章.html text2.html
附録 appendix
www.hoge.net
とし、設置ディレクトリがルートディレクトリであるとします。閲覧者の方が従来通り www.hoge.net/text1.html でアクセスしてきた場合、この読替表に従って www.hoge.net/第一章.html にリダイレクトさせます。実際にはURLはUTF-8となり非アスキィ文字の部分はURLエンコードされます。
従いまして、ファイル名だけでなく、記述の文字コードも統一する必要があります。
尚、HTMLに用いられている文字コードに合わせる必要はありません。
読替が不要な文書や子ディレクトリは記述しなくても構いません。
この場合、実際のアスキィ文字でのファイル/ディレクトリ名で扱われます。
読替元の名前・読替後の名前とも前から順番に検索して見付かり次第検索を打切ります。
問題は読替元と読替後の双方が複数書かれている場合です。
この場合、読替元で記述した場合と読替後の名前で記述した場合とで結果が異なる事が予想されます。
前述の通り、読替表を前から順番に読込んで該当するものが見付かり次第読替表の検索を打切ります。
つまり、前の方に名前があればより早く処理が終わります。
ANSI
(実際にはシフトJISコード)で保存する場合には特に問題はございませんが、UTF-8
で保存する場合には必ず一行目を空行にしておいて下さい。
ウィンドウズのメモ帳でUTF-8でエンコードされたテキストを作成しようとすると、冒頭にBOMと呼ばれるゴミが付いてしまいます。
このゴミが読替の際に支障を来たす事となるため、一行目には何も記述しない事で無効な行として読み飛ばさなければなりません。