configure --with-extra-charsetsについて

この"--with-extra-charsets"オプションは、以下のように説明されています。

 --with-extra-charsets=CHARSET,CHARSET,...
                          Use charsets in addition to default (none, complex,
                          all, or a list selected from the above sets)

つまりデフォルトの文字コード(--with-charsetで指定したもの、指定がない場合はlatin1)以外の文字コードについても好きに列挙すればそれもいっしょにコンパイルするよん、という意味ですが、ここでキニナルのはallとかcomplexとかってなぁにという話。とりあえずcomplexと書いとけ、みたいなノリでも別に良いのですが。

これはなぜかconfigure.inには書いてなくて、configureの方を見る必要があります。

簡単にいうと、"all"は全ての文字コード。具体的には以下です。

CHARSETS_AVAILABLE="binary armscii8 ascii big5 cp1250 cp1251 cp1256 cp1257 cp850 cp852 cp866 cp932 dec8 eucjpms euckr gb2312 gbk geostd8 greek hebrew hp8 keybcs2 koi8r koi8
u latin1 latin2 latin5 latin7 macce macroman sjis swe7 tis620 ucs2 ujis utf8"

つづいて"complex"は簡単にいうと、メジャーな文字コード集といったところでしょうか。具体的には以下です。

CHARSETS_COMPLEX="big5 cp1250 cp932 eucjpms euckr gb2312 gbk latin1 latin2 sjis tis620 ucs2 ujis utf8"

cp932、eucjpms、sjis、ujis、utf8と日本語関連の文字コードが全て入っているのでとりあえずcomplexでOKと。

そういえば

以前もこのテーマで調べたことがある気がしてきた。ループしてるのか成長してないのか・・w