しらぎく日本語URIについて解説します。
しらぎく日本語URIは、日本語文字を正しく扱えない事とされている環境でも、日本語で書かれたURLを実現するためのスクリプトです。
つまり、
するシステムです。
但し、このようなシステムをCGIで実現するには、普通のサーヴァでは不可能である場合があります。
ここでは、最も普及しているウェブサーヴァであるアパッチ独自の内部URL読替機能・mod_rewrite を活用する事でシステムを呼出してURLの読替を行うようにしております。
しらぎく日本語URIには、以下のような特徴があります。
日本語のファイル名やディレクトリ名は、稀にトラブルの原因となる事があります。
このため、日本語でファイル名などを書くのは、しばしばいけない事とされております。
そこで、ファイル名などをアクセスの度に読み替える事で、サーヴァにはアスキィURLを、クライアントには日本語URLをそれぞれ与えるようにしております。
既にアスキィURLだけで作られたウェブサイトをお持ちの方も、HTMLには一切の修正をせずに日本語URLに転換出来るようになります。
従来のアスキィURLでアクセスしてきた場合でも、読替対象となっているものであれば自動的に日本語URLに読み替えてリダイレクトするので、URL変更の告知も要りません。
また、Perl 5.8.3 以降であるかUTF-8コードで読替表を作成しているのであれば、UTF-8でエンコードされた日本語URLとなり、グーグルやヤフーなどの検索エンジンでURLも日本語文字で分かり易く案内されるようになります。
ご承知の通り、日本語文字コードにはシフトJISコードやUTF-8など、概ね四つ以上のコードがあります。
しらぎく日本語URIでは、ISO-2022-JP, シフトJISコード, 日本語EUC, 及びUTF-8コードで書かれたURLを常にUTF-8コードに読み替える事で文字コードの違いを吸収出来るようになっております。