土曜日, 8月 26, 2006

native2asciiの代替品u2aを作る

Javaに依存しない、単独で軽量なnative2asciiがほしいわけですが。

といっても、ほんとはnative2asciiじゃなくても、
UTF-8 to ASCII だけできればいい。
Emacs (+ mule-ucs) がUTF-8で保存してくれるから。
ASCIIといってるのはエスケープされたUnicode。
ネイティブ文字コード扱うとなるとUnicodeへの変換テーブルが必要だけど、
UTF-8からUnicodeにするだけなら演算でできるし、
こんなのC言語でUnix流儀のフィルタとして書くのが簡単なはず。

といったわけで、作りました、UTF-8限定、標準入出力限定、
のnative2ascii、名前はu2aにしました。
逆変換は別プログラムでa2uという名前。

mozlessのCVSに入ってるので、ほしかったらどうぞ‥。
Webで見るならこのへん

これを作るときに参考にしたものは、Linuxのmanページ
man utf-8 だけ。UTF-8のフォーマット書いてあるから。

ところで、u2a使ったmakefile書くと、u2aも一緒に配らないと動かない。
native2ascii使ったmakefileなら
「native2asciiはどっかから持ってきて」と言えば済むけど。
u2aのインターフェイスをnative2asciiと同じにすれば
どっちでも使えていいんだけど、
せっかく単純なu2aにnative2asciiをまねするためだけの
ダミー構造を加えるのはいや。

まぁしばらくこれでいいよ‥。

0 件のコメント: