西ヨーロッパのキャラクタセットには、大部分の西ヨーロッパ言語(フランス語、スペイン語、カタロニア語、バスク語、ポルトガル語、イタリア語、アルバニア語、オランダ語、ドイツ語、デンマーク語、スウェーデン語、ノルウェー語、フィンランド語、フェロー語、アイスランド語、アイルランド語、スコットランド語、英語など)が含まれています。
ascii (US ASCII) 照合順序:
ascii_bin
ascii_general_ci (デフォルト)
cp850 (DOS 西ヨーロッパ言語)
照合順序:
cp850_bin
cp850_general_ci (デフォルト)
dec8 (DEC 西ヨーロッパ言語)
照合順序:
dec8_bin
dec8_swedish_ci (デフォルト)
hp8 (HP 西ヨーロッパ言語)
照合順序:
hp8_bin
hp8_english_ci (デフォルト)
latin1 (cp1252 西ヨーロッパ言語)
照合順序:
latin1_bin
latin1_danish_ci
latin1_general_ci
latin1_general_cs
latin1_german1_ci
latin1_german2_ci
latin1_spanish_ci
latin1_swedish_ci (デフォルト)
latin1
はデフォルトキャラクタセットです。MySQLのlatin1
はWindowscp1252キャラクタセットと同じです。つまり公式ISO
8859-1 あるいはIANA (アイアナ)
latin1と同様ですが、アイアナlatin1
は0x80
と0x9f間のコードポイントは「定義されていません」。
これに対して、cp1252、つまりMySQLのlatin1はそれらポジションに対して文字を指定しています。例えば
0x80
はユーロのサインです。cp1252の「定義されていない」エントリーでは、MySQLは0x81
をUnicode
0x0081、0x8d
を0x008d、0x8fを0x008f、0x90を0x0090そして0x9dを0x009dに変換します。
latin1_swedish_ci照合順序は大部分のMySQLカスタマに使用されているデフォルトです。スウェーデン語/フィンランド語の照合順序ルールに基づいているとされていますが、スウェーデン人やフィンランド人の中にはこのステートメントに賛成しない人もいます。
latin1_german1_ciとlatin1_german2_ci照合順序はDIN-1
およびDIN-2
標準に基づいて、DINはDeutsches
Institut für Normung
(アンシーのドイツ版)を表しています。DIN-1
は「辞書の照合順序」と呼ばれ、DIN-2は「電話帳の照合順序」と呼ばれています。
latin1_german1_ci (辞書) ルール:
Ä = A Ö = O Ü = U ß = s
latin1_german2_ci (電話帳)
ルール:
Ä = AE Ö = OE Ü = UE ß = ss
latin1_spanish_ci 照合順序では、
‘ñ’ (n-tilde)
は‘n’と‘o’とは区別されます。
macroman (Mac 西ヨーロッパ言語)
照合順序:
macroman_bin
macroman_general_ci (デフォルト)
swe7 (7bit Swedish) 照合順序:
swe7_bin
swe7_swedish_ci (デフォルト)
