Comments
Transcript
ロケールのサポート IBM Red Brick Warehouse バージョン 6.20
ロケールのサポート IBM Red Brick Warehouse バージョン 6.20 本書では、IBM Red Brick Warehouse の各製品でサポートされている標準ロケール要素であ る、言語、地域、コードセット、ソート順を定義しています。1 つの言語の範囲内では、 地域、コードセット、ソート順を任意に組み合わせて使用できます。1 つの言語を基に作 られたロケールが 2 つある場合、ロケール間の変換は自動的に行われます。言語間の変換 はサポートされていません。 ロケールのサポートのカテゴリ ここで示すロケールのサポートには、次の 3 つの区分があります。 ■ カテゴリ A: ローカライズ済みロケール ■ カテゴリ B: ローカライズ可能ロケール ■ カテゴリ C: 各国対応ロケール ローカライズ済みロケール ローカライズ済みソフトウェア製品は、特定の現地市場に完全に適合した製品です。ロー カライズとは、製品のユーザ インターフェイス、メッセージ、ヘルプ システムを翻訳し て、特定地域の言語で表示されるようにすることです。ローカライズ済み製品には、追加 機能やロケール特有の機能など、現地表記に合わせた機能が含まれることになります。 ローカライズ可能ロケール ローカライズ可能ロケール ローカライズ可能度は、ソフトウェア製品をどの程度までローカライズできるかを 示すものです。製品がローカライズ可能となるのは、その製品の製品データをプロ グラム コードから完全に切り離すことができ、ローカライズ対象の言語で正しく表 示でき、特定のロケールで正常に機能する場合です。 NLS の要件を満たし、現地の言語環境で円滑に作動し、特定のロケールについて製 品サポートが行われているという形において、IBM Red Brick Warehouse の各製品は 特定ロケールでローカライズ可能です。カテゴリ B の製品はカテゴリ A に容易に移 行できます。ローカライズ ツールと関連ドキュメントが用意されており、ローカラ イズのプロセスでは言語翻訳のリソースを確保しさえすればよいからです。 各国対応ロケール このカテゴリの IBM Red Brick Warehouse の各製品のロケールは、ISO/IEC および X/Open 言語標準に基づいて定義された、標準レベルのロケール サポートです。こ れらの製品は各国対応ロケール独自の機能で定義されます。 2 2002 年 9 月 定義済みロケールと要素 定義済みロケールと要素 ロケール要素の論理的に可能な組み合わせを次の表に示します。ただし、これ以外 の組み合わせが有効な場合もあります。表中に記載されていない組み合わせについ て、IBM は一切その責任を負いません。 この表に記載されている各要素の文字列は、記載されているとおりのスペルにする 必要がありますが、大文字と小文字の区別はありません。太字の値は、不完全なロ ケールが指定された場合に、対応する言語で使用されるデフォルト値です。たとえ ば、ドイツ語のデフォルトのコード セットは Latin1 です。 言語 ASCII ベース 最大 バイト数 バイナリ、 デフォルト はい はい はい はい いいえ いいえ 1 1 1 3 1 1 JapanEUC MS932 Shift_JIS UTF-8 IBM930 バイナリ、 日本語 はい はい はい はい いいえ 3 2 2 3 2 中国 MS936 MS54936* UTF-8 IBM935 バイナリ、 簡体字中国語 はい はい はい いいえ 2 4 3 2 台湾 EUC-TW MS950 UTF-8 IBM937 バイナリ、 繁体字中国語 はい はい はい いいえ 4 2 3 2 地域 コード セット ソート順 アメリカ オーストラリア カナダ 南アフリカ イギリス US-ASCII 日本語 日本 簡体字中国語 繁体字中国語 カテゴリ A: ローカライズ済みロケール 英語 Latin1 MS1252 UTF-8 IBM037 IBM285 * コード セットの詳細については、GB18030 の導入 をご覧ください。 (1 / 5) ロケールのサポート 3 定義済みロケールと要素 言語 地域 コード セット ソート順 ASCII ベース 最大 バイト数 カテゴリ B: ローカライズ可能ロケール カナダ フランス語 カナダのフランス 語使用地域 Latin1 MS1252 ISO-8859-9 UTF-8 IBM297 デフォルト、 バイナリ はい はい はい はい いいえ 1 1 1 3 1 デンマーク語 デンマーク Latin1 MS1252 ISO-8859-9 ISO-8859-15 UTF-8 デンマーク語、 バイナリ はい はい はい はい はい 1 1 1 1 3 フィンランド語 フィンランド Latin1 MS1252 ISO-8859-9 UTF-8 フィンランド語、 バイナリ はい はい はい はい 1 1 1 3 フランス語 フランス ベルギーのフラン ス語使用地域 カナダのフランス 語使用地域 スイスのフランス 語使用地域 Latin1 MS1252 ISO-8859-9 ISO-8859-15 UTF-8 IBM297 デフォルト、 バイナリ はい はい はい はい はい いいえ 1 1 1 1 3 1 ドイツ語 ドイツ オーストリア スイスのドイツ語 使用地域 Latin1 MS1252 ISO-8859-9 ISO-8859-15 UTF-8 IBM273 デフォルト、 バイナリ はい はい はい はい はい いいえ 1 1 1 1 3 1 イタリア語 イタリア スイスのイタリア 語使用地域 Latin1 MS1252 ISO-8859-9 ISO-8859-15 UTF-8 IBM280 デフォルト、 バイナリ はい はい はい はい はい いいえ 1 1 1 1 3 1 ノルウェー語 ノルウェー Latin1 MS1252 ISO-8859-9 UTF-8 デンマーク語、 バイナリ はい はい はい はい 1 1 1 3 (2 / 5) 4 2002 年 9 月 定義済みロケールと要素 ASCII ベース 最大 バイト数 デフォルト、 バイナリ はい はい はい はい はい いいえ 1 1 1 1 3 1 Latin1 MS1252 ISO-8859-9 ISO-8859-15 UTF-8 スペイン語、 スペイン語 トラディショナル、 バイナリ はい はい はい はい はい 1 1 1 1 3 スウェーデン Latin1 MS1252 ISO-8859-9 UTF-8 スウェーデン語、 バイナリ はい はい はい はい 1 1 1 3 タイ MS874 UTF-8 タイ語、 バイナリ はい はい 1 3 言語 地域 コード セット ソート順 ポルトガル語 ポルトガル ブラジル Latin1 MS1252 ISO-8859-9 ISO-8859-15 UTF-8 IBM037 スペイン語 スペイン アルゼンチン チリ メキシコ スウェーデン語 タイ語 カテゴリ C: 各国対応ロケール アルバニア語 アルバニア ISO-8859-2 MS1250 Latin1 MS1252 ISO-8859-9 UTF-8 デフォルト、 バイナリ はい はい はい はい はい はい 1 1 1 1 1 3 アラビア語 サウジアラビア ISO-8859-6 MS1256 UTF-8 デフォルト、 バイナリ はい はい はい 1 1 3 ブルガリア語 ブルガリア ISO-8859-5 MS1251 UTF-8 デフォルト、 バイナリ はい はい はい 1 1 3 ベラルーシ語 ベラルーシ ISO-8859-5 MS1251 UTF-8 デフォルト、 バイナリ はい はい はい 1 1 3 カタロニア語 カタロニア Latin1 MS1252 ISO-8859-9 UTF-8 デフォルト、 バイナリ はい はい はい はい 1 1 1 3 (3 / 5) ロケールのサポート 5 定義済みロケールと要素 ASCII ベース 最大 バイト数 クロアチア語、 バイナリ はい はい はい 1 1 3 ISO-8859-2 MS1250 UTF-8 チェコ語、 バイナリ はい はい はい 1 1 3 オランダ ベルギーのオラン ダ語使用地域 Latin1 MS1252 ISO-8859-9 ISO-8859-15 UTF-8 IBM037 デフォルト、 バイナリ はい はい はい はい はい いいえ 1 1 1 1 3 1 エストニア語 エストニア ISO-8859-4 ISO-8859-10 MS1257 UTF-8 エストニア語、 バイナリ はい はい はい はい 1 1 1 3 現代ペルシャ語 イラン ISO-8859-6 UTF-8 デフォルト、 バイナリ はい はい 1 3 ギリシャ語 ギリシャ ISO-8859-7 MS1253 UTF-8 デフォルト、 バイナリ はい はい はい 1 1 3 ヘブライ語 イスラエル ISO-8859-8 MS1255 UTF-8 デフォルト、 バイナリ はい はい はい 1 1 3 ハンガリー語 ハンガリー ISO-8859-2 MS1250 UTF-8 ハンガリー語、 バイナリ はい はい はい 1 1 3 韓国語 韓国 MS949 MS1361 UTF-8 バイナリ はい はい はい 2 2 3 ラトビア語 ラトビア ISO-8859-4 ISO-8859-10 MS1257 UTF-8 ラトビア語、 バイナリ はい はい はい はい 1 1 1 3 リトアニア語 リトアニア ISO-8859-4 ISO-8859-10 MS1257 UTF-8 リトアニア語、 バイナリ はい はい はい はい 1 1 1 3 言語 地域 コード セット ソート順 クロアチア語 クロアチア ISO-8859-2 MS1250 UTF-8 チェコ語 チェコ共和国 オランダ語 (4 / 5) 6 2002 年 9 月 定義済みロケールと要素 ASCII ベース 最大 バイト数 デフォルト、 バイナリ はい はい はい 1 1 3 ISO-8859-2 MS1250 UTF-8 ポーランド語、 バイナリ はい はい はい 1 1 3 ルーマニア ISO-8859-2 MS1250 UTF-8 ルーマニア語、 バイナリ はい はい はい 1 1 3 ロシア語 ロシア ISO-8859-5 MS1251 UTF-8 デフォルト、 バイナリ はい はい はい 1 1 3 セルビア語 ユーゴスラビア ISO-8859-2 MS1250 UTF-8 デフォルト、 バイナリ はい はい はい 1 1 3 キリル文字セルビア語 ユーゴスラビア ISO-8859-5 MS1251 UTF-8 デフォルト、 バイナリ はい はい はい 1 1 3 スロバキア語 スロバキア ISO-8859-2 MS1250 UTF-8 スロバキア語、 バイナリ はい はい はい 1 1 3 スロベニア語 スロベニア ISO-8859-2 MS1250 UTF-8 スロベニア語、 バイナリ はい はい はい 1 1 3 トルコ語 トルコ ISO-8859-9 ISO-8859-3 MS1254 UTF-8 トルコ語、 バイナリ はい はい はい はい 1 1 1 3 ウクライナ語 ウクライナ ISO-8859-5 MS1251 UTF-8 ウクライナ語、 バイナリ はい はい はい 1 1 3 ベトナム語 ベトナム MS1258 UTF-8 ベトナム語、 バイナリ はい はい 1 3 言語 地域 コード セット ソート順 マケドニア語 マケドニア ISO-8859-5 MS1251 UTF-8 ポーランド語 ポーランド ルーマニア語 (5 / 5) ロケールのサポート 7 ロケール定義ファイル ロケール定義ファイル IBM Red Brick Warehouse はロケール生成ツールを使用して、FDCC 設定の ISO/IEC 14652 互換ロケール定義テキスト ファイルからロケール定義バイナリ ファイルを作 成します。 バイナリと言語固有のソート順 表内のソート順の列で、「バイナリ」でない値は言語固有のソート定義です。 デフォルトは、CAN/CSA Z243.4.1 Canadian ordering standard で指定されたソート定 義です。この標準は、英語、およびいくつかの西ヨーロッパ言語を対象としていま す。 コード セット名 コード セット名には一貫性がありません。IBM Red Brick Warehouse では、ISO-88591 の代わりに Latin1、Latin2 の代わりに ISO-8859-2、Latin3 の代わりに ISO-8859-3、 Latin4 の代わりに ISO-8859-4、キリル文字セルビア語の代わりに ISO-8859-5、アラ ビア語の代わりに ISO-8859-6、ギリシャ語の代わりに ISO-8859-7、ヘブライ語の代 わりに ISO-8859-8、Latin5 の代わりに ISO-8859-9、Latin6 の代わりに ISO-8859-10 ( デンマーク語、フィンランド語、スウェーデン語、ノルウェー語で使用可能 )、 Latin9 の代わりに ISO-8859-15 ( ヨーロッパの新しいコード セット ) がそれぞれ使用 されています。 コード セットの変換 ある特定の言語の 2 コード セットの間では、確実にコード セット変換を実行できま す。表中の言語の各行について、その範囲外での変換はサポートされていません。 たとえば、文字を Latin1 から MS1252 に変換することはできますが、Latin1 から JapanEUC に変換することはできません。 Shift_JIS コード セット 日本語に対して記載されている Shift_JIS コード セットは、MS932 をカスタマイズ したものです。MS932 の代わりに Shift_JIS を使用することをお勧めします。MS932 では、クライアントとデータベースのロケールが異なっていると、コード変換の問 題が発生します。 8 2002 年 9 月 Unicode のサポート Unicode のサポート IBM Red Brick Warehouse では、Unicode の一部がサポートされています。サポート されている中では UTF-8 が唯一の各国共通のコード セットになります。The Red Brick JDBC Driver では Unicode が全面的にサポートされています。 EBCDIC コード セット ASCII ベースでない (EBCDIC) コード セットを使用してデータベースを作成するこ とはできません。EBCDIC ベースのコード セットのデータはデータ ベースにロード できますが、データベースでは対応する ASCII ベースのコード セットに変換されま す。 GB18030 の導入 MS54936 には新しい中国語のエンコード標準である GB18030 が導入されています。 この標準は GBK ( または MS936) コード セットのスーパーセットです。GB18030 は MS936 コード セットを完全に補完し、その他の文字も多数含んでいるので、 MS54936 と MS936 が混在する環境では、未定義のコードポイントの翻訳が発生し ないように注意を払う必要があります。 MS54936 コード セットはバイナリの照合順序においてのみソートされます。簡体字 中国語をソート順として指定することはできません。 ユーロ準拠 IBM Red Brick Warehouse はユーロに対応しています。 ■ サポートされている ISO-8859-15 は Latin9 や Latin0 とも呼ばれ、欧州連合 の標準コード セットです。 ■ すべてのラテン系の言語コード セットおよび新しい中国語のコード ペー ジである MS54936 には、ユーロの通貨記号 U+20AC が含まれています。 この通貨記号は以下のコード セットの 0x80 位置に加えられています。 MS1250、MS1252、MS1253、MS1254、MS1255、MS1256、MS1257、 MS1258、MS874。また、MS1251 は 0x88 位置に、MS54936 は 0xA2E3 位置 に加えられています。 ロケールのサポート 9 XML エンコーディングにマップされた Red Brick のコード セット XML エンコーディングにマップされた Red Brick の コード セット SQL EXPORT コマンドを使用してクエリ結果を XML の書式に保存する場合、IBM Red Brick Warehouse でサポートされているコード セットは標準の XML エンコー ディングにマップされます。名前付け規則が対応しないこともあるため、次の表に 各コード セットに対応する XML 名を示します。 10 2002 年 9 月 Red Brick のコード セット XML のコード セット US-ASCII US-ASCII Latin 1 ISO-8859-1 JapanEUC EUC-JP EUC-TW EUC-TW Shift_JIS Shift_JIS UTF-8 UTF-8 ISO-8859-2, 3, 4, 5, 6, 7, 8, 9, 10, 15 ISO-8859-2, 3, 4, 5, 6, 7, 8, 9, 10, 15 MS54936 GB18030 MS874 TIS-620 MS932 WINDOWS-31J MS936 GB_2312-80 MS949 KS_C_5601-1987 MS950 BIG5 MS1250, 51, 52, 53, 54, 55, 56, 57, 58 WINDOWS-1250, 51, 52, 53, 54, 55, 56, 57, 58 MS1361 KS_C_5601-1987 Java 準拠のエンコードから Red Brick のコード セット名への変換 Java 準拠のエンコードから Red Brick のコード セット名への変換 次の表は、Java 準拠のエンコードに対応する IBM Red Brick Warehouse のコード セッ トです。日付や数値をデータベースのロケールのフォーマットからクライアントの ロケールのフォーマットに変換する場合などに、Java ロケール コードが必要になる 場合があります。 Java IBM Red Brick Warehouse のコード セット ASCII US-ASCII ISO8859_1 Latin1 ISO8859_2 ISO-8859-2 ISO8859_3 ISO-8859-3 ISO8859_4 ISO-8859-4 ISO8859_5 ISO-8859-5 ISO8859_6 ISO-8859-6 ISO8859_7 ISO-8859-7 ISO8859_8 ISO-8859-8 ISO8859_9 ISO-8859-9 Big5 MS950 Cp037 IBM037 Cp1006 なし Cp1025 なし Cp1026 なし Cp1046 なし Cp1097 なし Cp1098 なし Cp1112 なし Cp1122 なし (1 / 5) ロケールのサポート 11 Java 準拠のエンコードから Red Brick のコード セット名への変換 Java IBM Red Brick Warehouse のコード セット Cp1123 なし Cp1124 なし Cp1250 MS1250 Cp1251 MS1251 Cp1252 MS1252 Cp1253 MS1253 Cp1254 MS1254 Cp1255 MS1255 Cp1256 MS1256 Cp1257 MS1257 Cp1258 MS1258 Cp1381 なし Cp1383 なし Cp273 IBM273 Cp277 なし Cp278 なし Cp280 IBM280 Cp284 なし Cp285 IBM285 Cp297 IBM297 Cp33722 なし Cp420 なし Cp424 なし Cp437 なし Cp500 IBM500 (2 / 5) 12 2002 年 9 月 Java 準拠のエンコードから Red Brick のコード セット名への変換 Java IBM Red Brick Warehouse のコード セット Cp737 なし Cp775 なし Cp838 なし Cp850 なし Cp852 なし Cp855 なし Cp857 なし Cp860 なし Cp861 なし Cp862 なし Cp863 なし Cp864 なし Cp865 なし Cp866 なし Cp868 なし Cp869 なし Cp870 なし Cp871 なし Cp874 MS874 Cp875 なし Cp918 なし Cp921 なし Cp922 なし Cp930 IBM930 Cp933 なし (3 / 5) ロケールのサポート 13 Java 準拠のエンコードから Red Brick のコード セット名への変換 Java IBM Red Brick Warehouse のコード セット Cp935 IBM935 Cp937 IBM937 Cp939 なし Cp942 なし Cp948 なし Cp949 MS949 Cp950 MS950 Cp964 なし Cp970 なし EUC_CN MS936 EUC_JP JapanEUC EUC_KR MS949 EUC_TW EUC-TW GBK なし GB18030 MS54932 ISO2022CN なし ISO2022CN_CNS なし ISO2022CN_GB なし ISO2022JP なし ISO2022KR なし JIS0201 なし JIS0208 なし JIS0212 なし KOI8_R なし MS874 MS874 (4 / 5) 14 2002 年 9 月 Java 準拠のエンコードから Red Brick のコード セット名への変換 Java IBM Red Brick Warehouse のコード セット MacArabic なし MacCentralEurope なし MacCroatian なし MacCyrillic なし MacDingbat なし MacGreek なし MacHebrew なし MacIceland なし MacRoman なし MacRomania なし MacSymbol なし MacThai なし MacTurkish なし MacUkraine なし SJIS MS932 UTF8 UTF-8 ISO8859_15 ISO-8859-15 なし MS1361 (5 / 5) ロケールのサポート 15