...

ロケールのサポート IBM Red Brick Warehouse バージョン 6.20

by user

on
Category: Documents
37

views

Report

Comments

Transcript

ロケールのサポート IBM Red Brick Warehouse バージョン 6.20
ロケールのサポート
IBM Red Brick Warehouse
バージョン 6.20
本書では、IBM Red Brick Warehouse の各製品でサポートされている標準ロケール要素であ
る、言語、地域、コードセット、ソート順を定義しています。1 つの言語の範囲内では、
地域、コードセット、ソート順を任意に組み合わせて使用できます。1 つの言語を基に作
られたロケールが 2 つある場合、ロケール間の変換は自動的に行われます。言語間の変換
はサポートされていません。
ロケールのサポートのカテゴリ
ここで示すロケールのサポートには、次の 3 つの区分があります。
■
カテゴリ A: ローカライズ済みロケール
■
カテゴリ B: ローカライズ可能ロケール
■
カテゴリ C: 各国対応ロケール
ローカライズ済みロケール
ローカライズ済みソフトウェア製品は、特定の現地市場に完全に適合した製品です。ロー
カライズとは、製品のユーザ インターフェイス、メッセージ、ヘルプ システムを翻訳し
て、特定地域の言語で表示されるようにすることです。ローカライズ済み製品には、追加
機能やロケール特有の機能など、現地表記に合わせた機能が含まれることになります。
ローカライズ可能ロケール
ローカライズ可能ロケール
ローカライズ可能度は、ソフトウェア製品をどの程度までローカライズできるかを
示すものです。製品がローカライズ可能となるのは、その製品の製品データをプロ
グラム コードから完全に切り離すことができ、ローカライズ対象の言語で正しく表
示でき、特定のロケールで正常に機能する場合です。
NLS の要件を満たし、現地の言語環境で円滑に作動し、特定のロケールについて製
品サポートが行われているという形において、IBM Red Brick Warehouse の各製品は
特定ロケールでローカライズ可能です。カテゴリ B の製品はカテゴリ A に容易に移
行できます。ローカライズ ツールと関連ドキュメントが用意されており、ローカラ
イズのプロセスでは言語翻訳のリソースを確保しさえすればよいからです。
各国対応ロケール
このカテゴリの IBM Red Brick Warehouse の各製品のロケールは、ISO/IEC および
X/Open 言語標準に基づいて定義された、標準レベルのロケール サポートです。こ
れらの製品は各国対応ロケール独自の機能で定義されます。
2 2002 年 9 月
定義済みロケールと要素
定義済みロケールと要素
ロケール要素の論理的に可能な組み合わせを次の表に示します。ただし、これ以外
の組み合わせが有効な場合もあります。表中に記載されていない組み合わせについ
て、IBM は一切その責任を負いません。
この表に記載されている各要素の文字列は、記載されているとおりのスペルにする
必要がありますが、大文字と小文字の区別はありません。太字の値は、不完全なロ
ケールが指定された場合に、対応する言語で使用されるデフォルト値です。たとえ
ば、ドイツ語のデフォルトのコード セットは Latin1 です。
言語
ASCII
ベース
最大
バイト数
バイナリ、
デフォルト
はい
はい
はい
はい
いいえ
いいえ
1
1
1
3
1
1
JapanEUC
MS932
Shift_JIS
UTF-8
IBM930
バイナリ、
日本語
はい
はい
はい
はい
いいえ
3
2
2
3
2
中国
MS936
MS54936*
UTF-8
IBM935
バイナリ、
簡体字中国語
はい
はい
はい
いいえ
2
4
3
2
台湾
EUC-TW
MS950
UTF-8
IBM937
バイナリ、
繁体字中国語
はい
はい
はい
いいえ
4
2
3
2
地域
コード セット
ソート順
アメリカ
オーストラリア
カナダ
南アフリカ
イギリス
US-ASCII
日本語
日本
簡体字中国語
繁体字中国語
カテゴリ A: ローカライズ済みロケール
英語
Latin1
MS1252
UTF-8
IBM037
IBM285
* コード セットの詳細については、GB18030 の導入 をご覧ください。
(1 / 5)
ロケールのサポート
3
定義済みロケールと要素
言語
地域
コード セット
ソート順
ASCII
ベース
最大
バイト数
カテゴリ B: ローカライズ可能ロケール
カナダ フランス語
カナダのフランス
語使用地域
Latin1
MS1252
ISO-8859-9
UTF-8
IBM297
デフォルト、
バイナリ
はい
はい
はい
はい
いいえ
1
1
1
3
1
デンマーク語
デンマーク
Latin1
MS1252
ISO-8859-9
ISO-8859-15
UTF-8
デンマーク語、
バイナリ
はい
はい
はい
はい
はい
1
1
1
1
3
フィンランド語
フィンランド
Latin1
MS1252
ISO-8859-9
UTF-8
フィンランド語、
バイナリ
はい
はい
はい
はい
1
1
1
3
フランス語
フランス
ベルギーのフラン
ス語使用地域
カナダのフランス
語使用地域
スイスのフランス
語使用地域
Latin1
MS1252
ISO-8859-9
ISO-8859-15
UTF-8
IBM297
デフォルト、
バイナリ
はい
はい
はい
はい
はい
いいえ
1
1
1
1
3
1
ドイツ語
ドイツ
オーストリア
スイスのドイツ語
使用地域
Latin1
MS1252
ISO-8859-9
ISO-8859-15
UTF-8
IBM273
デフォルト、
バイナリ
はい
はい
はい
はい
はい
いいえ
1
1
1
1
3
1
イタリア語
イタリア
スイスのイタリア
語使用地域
Latin1
MS1252
ISO-8859-9
ISO-8859-15
UTF-8
IBM280
デフォルト、
バイナリ
はい
はい
はい
はい
はい
いいえ
1
1
1
1
3
1
ノルウェー語
ノルウェー
Latin1
MS1252
ISO-8859-9
UTF-8
デンマーク語、
バイナリ
はい
はい
はい
はい
1
1
1
3
(2 / 5)
4 2002 年 9 月
定義済みロケールと要素
ASCII
ベース
最大
バイト数
デフォルト、
バイナリ
はい
はい
はい
はい
はい
いいえ
1
1
1
1
3
1
Latin1
MS1252
ISO-8859-9
ISO-8859-15
UTF-8
スペイン語、
スペイン語
トラディショナル、
バイナリ
はい
はい
はい
はい
はい
1
1
1
1
3
スウェーデン
Latin1
MS1252
ISO-8859-9
UTF-8
スウェーデン語、
バイナリ
はい
はい
はい
はい
1
1
1
3
タイ
MS874
UTF-8
タイ語、
バイナリ
はい
はい
1
3
言語
地域
コード セット
ソート順
ポルトガル語
ポルトガル
ブラジル
Latin1
MS1252
ISO-8859-9
ISO-8859-15
UTF-8
IBM037
スペイン語
スペイン
アルゼンチン
チリ
メキシコ
スウェーデン語
タイ語
カテゴリ C: 各国対応ロケール
アルバニア語
アルバニア
ISO-8859-2
MS1250
Latin1
MS1252
ISO-8859-9
UTF-8
デフォルト、
バイナリ
はい
はい
はい
はい
はい
はい
1
1
1
1
1
3
アラビア語
サウジアラビア
ISO-8859-6
MS1256
UTF-8
デフォルト、
バイナリ
はい
はい
はい
1
1
3
ブルガリア語
ブルガリア
ISO-8859-5
MS1251
UTF-8
デフォルト、
バイナリ
はい
はい
はい
1
1
3
ベラルーシ語
ベラルーシ
ISO-8859-5
MS1251
UTF-8
デフォルト、
バイナリ
はい
はい
はい
1
1
3
カタロニア語
カタロニア
Latin1
MS1252
ISO-8859-9
UTF-8
デフォルト、
バイナリ
はい
はい
はい
はい
1
1
1
3
(3 / 5)
ロケールのサポート
5
定義済みロケールと要素
ASCII
ベース
最大
バイト数
クロアチア語、
バイナリ
はい
はい
はい
1
1
3
ISO-8859-2
MS1250
UTF-8
チェコ語、
バイナリ
はい
はい
はい
1
1
3
オランダ
ベルギーのオラン
ダ語使用地域
Latin1
MS1252
ISO-8859-9
ISO-8859-15
UTF-8
IBM037
デフォルト、
バイナリ
はい
はい
はい
はい
はい
いいえ
1
1
1
1
3
1
エストニア語
エストニア
ISO-8859-4
ISO-8859-10
MS1257
UTF-8
エストニア語、
バイナリ
はい
はい
はい
はい
1
1
1
3
現代ペルシャ語
イラン
ISO-8859-6
UTF-8
デフォルト、
バイナリ
はい
はい
1
3
ギリシャ語
ギリシャ
ISO-8859-7
MS1253
UTF-8
デフォルト、
バイナリ
はい
はい
はい
1
1
3
ヘブライ語
イスラエル
ISO-8859-8
MS1255
UTF-8
デフォルト、
バイナリ
はい
はい
はい
1
1
3
ハンガリー語
ハンガリー
ISO-8859-2
MS1250
UTF-8
ハンガリー語、
バイナリ
はい
はい
はい
1
1
3
韓国語
韓国
MS949
MS1361
UTF-8
バイナリ
はい
はい
はい
2
2
3
ラトビア語
ラトビア
ISO-8859-4
ISO-8859-10
MS1257
UTF-8
ラトビア語、
バイナリ
はい
はい
はい
はい
1
1
1
3
リトアニア語
リトアニア
ISO-8859-4
ISO-8859-10
MS1257
UTF-8
リトアニア語、
バイナリ
はい
はい
はい
はい
1
1
1
3
言語
地域
コード セット
ソート順
クロアチア語
クロアチア
ISO-8859-2
MS1250
UTF-8
チェコ語
チェコ共和国
オランダ語
(4 / 5)
6 2002 年 9 月
定義済みロケールと要素
ASCII
ベース
最大
バイト数
デフォルト、
バイナリ
はい
はい
はい
1
1
3
ISO-8859-2
MS1250
UTF-8
ポーランド語、
バイナリ
はい
はい
はい
1
1
3
ルーマニア
ISO-8859-2
MS1250
UTF-8
ルーマニア語、
バイナリ
はい
はい
はい
1
1
3
ロシア語
ロシア
ISO-8859-5
MS1251
UTF-8
デフォルト、
バイナリ
はい
はい
はい
1
1
3
セルビア語
ユーゴスラビア
ISO-8859-2
MS1250
UTF-8
デフォルト、
バイナリ
はい
はい
はい
1
1
3
キリル文字セルビア語
ユーゴスラビア
ISO-8859-5
MS1251
UTF-8
デフォルト、
バイナリ
はい
はい
はい
1
1
3
スロバキア語
スロバキア
ISO-8859-2
MS1250
UTF-8
スロバキア語、
バイナリ
はい
はい
はい
1
1
3
スロベニア語
スロベニア
ISO-8859-2
MS1250
UTF-8
スロベニア語、
バイナリ
はい
はい
はい
1
1
3
トルコ語
トルコ
ISO-8859-9
ISO-8859-3
MS1254
UTF-8
トルコ語、
バイナリ
はい
はい
はい
はい
1
1
1
3
ウクライナ語
ウクライナ
ISO-8859-5
MS1251
UTF-8
ウクライナ語、
バイナリ
はい
はい
はい
1
1
3
ベトナム語
ベトナム
MS1258
UTF-8
ベトナム語、
バイナリ
はい
はい
1
3
言語
地域
コード セット
ソート順
マケドニア語
マケドニア
ISO-8859-5
MS1251
UTF-8
ポーランド語
ポーランド
ルーマニア語
(5 / 5)
ロケールのサポート
7
ロケール定義ファイル
ロケール定義ファイル
IBM Red Brick Warehouse はロケール生成ツールを使用して、FDCC 設定の ISO/IEC
14652 互換ロケール定義テキスト ファイルからロケール定義バイナリ ファイルを作
成します。
バイナリと言語固有のソート順
表内のソート順の列で、「バイナリ」でない値は言語固有のソート定義です。
デフォルトは、CAN/CSA Z243.4.1 Canadian ordering standard で指定されたソート定
義です。この標準は、英語、およびいくつかの西ヨーロッパ言語を対象としていま
す。
コード セット名
コード セット名には一貫性がありません。IBM Red Brick Warehouse では、ISO-88591 の代わりに Latin1、Latin2 の代わりに ISO-8859-2、Latin3 の代わりに ISO-8859-3、
Latin4 の代わりに ISO-8859-4、キリル文字セルビア語の代わりに ISO-8859-5、アラ
ビア語の代わりに ISO-8859-6、ギリシャ語の代わりに ISO-8859-7、ヘブライ語の代
わりに ISO-8859-8、Latin5 の代わりに ISO-8859-9、Latin6 の代わりに ISO-8859-10
( デンマーク語、フィンランド語、スウェーデン語、ノルウェー語で使用可能 )、
Latin9 の代わりに ISO-8859-15 ( ヨーロッパの新しいコード セット ) がそれぞれ使用
されています。
コード セットの変換
ある特定の言語の 2 コード セットの間では、確実にコード セット変換を実行できま
す。表中の言語の各行について、その範囲外での変換はサポートされていません。
たとえば、文字を Latin1 から MS1252 に変換することはできますが、Latin1 から
JapanEUC に変換することはできません。
Shift_JIS コード セット
日本語に対して記載されている Shift_JIS コード セットは、MS932 をカスタマイズ
したものです。MS932 の代わりに Shift_JIS を使用することをお勧めします。MS932
では、クライアントとデータベースのロケールが異なっていると、コード変換の問
題が発生します。
8 2002 年 9 月
Unicode のサポート
Unicode のサポート
IBM Red Brick Warehouse では、Unicode の一部がサポートされています。サポート
されている中では UTF-8 が唯一の各国共通のコード セットになります。The Red
Brick JDBC Driver では Unicode が全面的にサポートされています。
EBCDIC コード セット
ASCII ベースでない (EBCDIC) コード セットを使用してデータベースを作成するこ
とはできません。EBCDIC ベースのコード セットのデータはデータ ベースにロード
できますが、データベースでは対応する ASCII ベースのコード セットに変換されま
す。
GB18030 の導入
MS54936 には新しい中国語のエンコード標準である GB18030 が導入されています。
この標準は GBK ( または MS936) コード セットのスーパーセットです。GB18030 は
MS936 コード セットを完全に補完し、その他の文字も多数含んでいるので、
MS54936 と MS936 が混在する環境では、未定義のコードポイントの翻訳が発生し
ないように注意を払う必要があります。
MS54936 コード セットはバイナリの照合順序においてのみソートされます。簡体字
中国語をソート順として指定することはできません。
ユーロ準拠
IBM Red Brick Warehouse はユーロに対応しています。
■
サポートされている ISO-8859-15 は Latin9 や Latin0 とも呼ばれ、欧州連合
の標準コード セットです。
■
すべてのラテン系の言語コード セットおよび新しい中国語のコード ペー
ジである MS54936 には、ユーロの通貨記号 U+20AC が含まれています。
この通貨記号は以下のコード セットの 0x80 位置に加えられています。
MS1250、MS1252、MS1253、MS1254、MS1255、MS1256、MS1257、
MS1258、MS874。また、MS1251 は 0x88 位置に、MS54936 は 0xA2E3 位置
に加えられています。
ロケールのサポート
9
XML エンコーディングにマップされた Red Brick のコード セット
XML エンコーディングにマップされた Red Brick の
コード セット
SQL EXPORT コマンドを使用してクエリ結果を XML の書式に保存する場合、IBM
Red Brick Warehouse でサポートされているコード セットは標準の XML エンコー
ディングにマップされます。名前付け規則が対応しないこともあるため、次の表に
各コード セットに対応する XML 名を示します。
10 2002 年 9 月
Red Brick のコード セット
XML のコード セット
US-ASCII
US-ASCII
Latin 1
ISO-8859-1
JapanEUC
EUC-JP
EUC-TW
EUC-TW
Shift_JIS
Shift_JIS
UTF-8
UTF-8
ISO-8859-2, 3, 4, 5, 6, 7, 8, 9, 10, 15
ISO-8859-2, 3, 4, 5, 6, 7, 8, 9, 10, 15
MS54936
GB18030
MS874
TIS-620
MS932
WINDOWS-31J
MS936
GB_2312-80
MS949
KS_C_5601-1987
MS950
BIG5
MS1250, 51, 52, 53, 54, 55, 56, 57, 58
WINDOWS-1250, 51, 52, 53, 54, 55, 56, 57, 58
MS1361
KS_C_5601-1987
Java 準拠のエンコードから Red Brick のコード セット名への変換
Java 準拠のエンコードから Red Brick のコード
セット名への変換
次の表は、Java 準拠のエンコードに対応する IBM Red Brick Warehouse のコード セッ
トです。日付や数値をデータベースのロケールのフォーマットからクライアントの
ロケールのフォーマットに変換する場合などに、Java ロケール コードが必要になる
場合があります。
Java
IBM Red Brick Warehouse のコード セット
ASCII
US-ASCII
ISO8859_1
Latin1
ISO8859_2
ISO-8859-2
ISO8859_3
ISO-8859-3
ISO8859_4
ISO-8859-4
ISO8859_5
ISO-8859-5
ISO8859_6
ISO-8859-6
ISO8859_7
ISO-8859-7
ISO8859_8
ISO-8859-8
ISO8859_9
ISO-8859-9
Big5
MS950
Cp037
IBM037
Cp1006
なし
Cp1025
なし
Cp1026
なし
Cp1046
なし
Cp1097
なし
Cp1098
なし
Cp1112
なし
Cp1122
なし
(1 / 5)
ロケールのサポート
11
Java 準拠のエンコードから Red Brick のコード セット名への変換
Java
IBM Red Brick Warehouse のコード セット
Cp1123
なし
Cp1124
なし
Cp1250
MS1250
Cp1251
MS1251
Cp1252
MS1252
Cp1253
MS1253
Cp1254
MS1254
Cp1255
MS1255
Cp1256
MS1256
Cp1257
MS1257
Cp1258
MS1258
Cp1381
なし
Cp1383
なし
Cp273
IBM273
Cp277
なし
Cp278
なし
Cp280
IBM280
Cp284
なし
Cp285
IBM285
Cp297
IBM297
Cp33722
なし
Cp420
なし
Cp424
なし
Cp437
なし
Cp500
IBM500
(2 / 5)
12 2002 年 9 月
Java 準拠のエンコードから Red Brick のコード セット名への変換
Java
IBM Red Brick Warehouse のコード セット
Cp737
なし
Cp775
なし
Cp838
なし
Cp850
なし
Cp852
なし
Cp855
なし
Cp857
なし
Cp860
なし
Cp861
なし
Cp862
なし
Cp863
なし
Cp864
なし
Cp865
なし
Cp866
なし
Cp868
なし
Cp869
なし
Cp870
なし
Cp871
なし
Cp874
MS874
Cp875
なし
Cp918
なし
Cp921
なし
Cp922
なし
Cp930
IBM930
Cp933
なし
(3 / 5)
ロケールのサポート
13
Java 準拠のエンコードから Red Brick のコード セット名への変換
Java
IBM Red Brick Warehouse のコード セット
Cp935
IBM935
Cp937
IBM937
Cp939
なし
Cp942
なし
Cp948
なし
Cp949
MS949
Cp950
MS950
Cp964
なし
Cp970
なし
EUC_CN
MS936
EUC_JP
JapanEUC
EUC_KR
MS949
EUC_TW
EUC-TW
GBK
なし
GB18030
MS54932
ISO2022CN
なし
ISO2022CN_CNS
なし
ISO2022CN_GB
なし
ISO2022JP
なし
ISO2022KR
なし
JIS0201
なし
JIS0208
なし
JIS0212
なし
KOI8_R
なし
MS874
MS874
(4 / 5)
14 2002 年 9 月
Java 準拠のエンコードから Red Brick のコード セット名への変換
Java
IBM Red Brick Warehouse のコード セット
MacArabic
なし
MacCentralEurope
なし
MacCroatian
なし
MacCyrillic
なし
MacDingbat
なし
MacGreek
なし
MacHebrew
なし
MacIceland
なし
MacRoman
なし
MacRomania
なし
MacSymbol
なし
MacThai
なし
MacTurkish
なし
MacUkraine
なし
SJIS
MS932
UTF8
UTF-8
ISO8859_15
ISO-8859-15
なし
MS1361
(5 / 5)
ロケールのサポート
15
Fly UP