ちょっと仕事で五十音順というものが話題になったので調べてみました。
五十音順というものは、言うまでもなく、
あいうえお順とか辞書順と呼ばれる「あれ」です。


ところで、僕が仕事で直面したのは、
言葉をコンピュータのプログラムで五十音順に並べるという問題。


コンピュータのプログラムで、日本語の語句を並べ替える場合は、
五十音順ではなく、文字コード順というものを使うことが多いです。


WindowsXPをご利用の方であれば、
「スタート」→「すべてのプログラム」
 →「アクセサリ」→「システムツール」→「文字コード表」
とメニューをたどっていただけると文字コード表というのが出てきますが、
この表に書かれている順番に並べ替えることが一般的なのです。


で、この表の通り語句を並べ替えてやると何となく五十音順になるのですが、
実はそんなに簡単な話でもないのです。


たとえば、
「きいと(生糸)」「きあい(気合い)」「きー(キー)」「きんき(禁忌)」
という語句は、五十音順ではどのようなに並べ替えればよいでしょうか?


五十音順では次のようになります。
1. きあい
2. きー
3. きいと
4. きんき


文字コード順では次のようになります。
1. きあい
2. きいと
3. きんき
4. きー


この例では長音(「ー」)が、その前にある文字によって読み方が変わるために、
単純に文字の順に並べ替えでも五十音順にならないことを示しています。


ただ、五十音順といっても、明確な定義があるわけではなく
実際には、辞書、百科事典、電話帳などによっても違いがあるようです。


長音の問題だけでなく五十音順に並べ替えるには、
いろいろと、超えなければいけないハードルがあるようです。
調べてみると、コンピュータで五十音順を扱う場合には
「日本語文字列照合順番」というものが、JISで規格化されているようです。