実践!文字コード変換〔外字コード編〕

OrangeLab. 運営チーム
作成日時: - 更新日時:
Avatar

使用ソフトウェア:DataMagic Server for Windows Ver.3.0.0
今回は「DataMagic」を利用した外字コードへの変換方法をご説明します。
※Ver.2.2.2のDataMagicについては、次の記事をご参照ください。
 (記事内容に大きな差異はありません。
      Ver.3.0.0のインタフェースに沿った操作手順とスクリーンショットにて、再度ご紹介しています。)
 DataMagic 実践!文字コード変換〔外字コード編〕 (Ver.2.2.2)

はじめに

HULFT OrangeLab.運営チームの佐々木です。

近年、オンライン上では外字の使用を控える傾向が増えてきていますが、それでも人名・地名を代表として使用され続けています。
また企業で発送する郵送物などは、正式な地名/人名で印字する必要があります。
特に名前は大切なものであり、簡易な字体ではなく、本来の字体が好まれて使用されています。 

しかし、環境によっては、JIS第1水準、第2水準の文字に含まれないものは表示されないため、外字フォーマットを取り込む必要があります。
※環境やソフトウェアで対応していない外字は○や□のように文字化けすることがあります。

よって外字は、入力するにも変換するにも苦労することが多いです。
今回はDataMagicを活用し、対象の外字データをコード変換してみましょう。

下記イメージのように外字データを含むIBMメインフレームの固定長データを、Shift_JISのCSVデータに変換します。



赤字がJIS第1、第2水準以外の外字で、コード変換が必要な文字となります。

準備

まずは、変換元となるデータを用意します。

サンプルデータ[IBM(zOS)の固定長データ、外字テーブルデータ]

格納先は任意ではありますが、今回は以下のフォルダを作成してください。
サンプルデータ格納先
C:\work\SAMPLE\inputdata\
出力データ格納先
C:\work\SAMPLE\outputdata\
外字テーブルデータ格納先
C:\work\SAMPLE\gtf\
※外字テーブルデータはサンプルとして用意した物を取り込み使用します。

準備として「DataMagic」を起動し、任意で作成した接続先に接続してください。

手順

データ変換に必要な定義情報を作成します。
データ変換の流れは大きく分けると以下になります。
  1. 入力ファイル情報の設定
  2. 出力ファイル情報の設定
  3. データ加工情報の設定

Step01

まずは、「1.入力ファイル情報の設定」を行いましょう。

スタートページから「フォーマット」を選択します。

Step02

操作メニューから「新規作成」をクリックし、フォーマット情報詳細画面を起動します。
画面が起動したら、下記画面を参考に「ID」と項目情報を設定し、「保存」をクリックして登録します。
項目情報の設定は、空行をダブルクリックして表示されるフォーマット情報項目設定画面から行います。



項目名 説明
ID 登録したフォーマット情報を識別するためのIDを指定します。
今回はIDを【SAMPLE_GAIJI_IN】とします。
固定長/可変長 今回のデータは固定長の為、【固定長】を選択します。
※項目名、項目タイプ、繰り返し数、バイト数、小数部桁数は上記フォーマット情報詳細画面に合わせて設定してください。

Step03

フォーマット情報画面の「ゾーン/パック10進数詳細設定」の「設定」をクリックし、ゾーン/パック10進数詳細設定画面を起動します。
「ゾーン部」を「F」に設定し、「OK」ボタンをクリックします。



これで、「1.入力ファイル情報の設定」は完了です。

Step04

次に「2.出力ファイル情報の設定」を行います。 

スタートページから「CSV」を選択します。

Step05

操作メニューから「新規作成」をクリックし、CSV情報詳細画面を起動します。
画面が起動したら、下記画面を参考に「ID」と項目情報を設定し、「保存」をクリックして登録します。



項目名 説明
ID 登録したCSV情報を識別するためのIDを指定します。
今回はIDを【SAMPLE_GAIJI_OUT】とします。

これで、「2.出力ファイル情報の設定」は完了です。

Step06

次に「3.データ加工情報の設定」を行います。 

スタートページから「データ加工」を選択します。


Step07

操作メニューから「新規作成」をクリックし、データ加工情報設定画面を起動したら、入力ファイルの設定を行います。

オブジェクトパレットから「フォーマット」を選択し、入力ファイルエリアへドロップします。
ドロップ後、「FMT」アイコンをダブルクリックします。


Step08

入力設定画面のレイアウトタブを設定します。



項目名 説明
ID 出力ファイルのIDを設定します。
Step02で作成した【SAMPLE_GAIJI_IN】を設定します。
ファイル名 入力ファイルを指定します。
事前準備で用意した【C:\work\SAMPLE\inputdata\SAMPLE_外字IN】を設定します。
※ヘッダレコードを設定しない場合、データの編集時に入力データのタイトル行が原因で型不一致となります。

Step09

入力設定画面のコードタブを設定します。



項目名 説明
漢字コード種 入力ファイルの漢字コード種を選択します。
今回は【IBM漢字】を選択します。

これで、入力ファイルの設定は完了です。

Step10

出力ファイルの設定を行います。

オブジェクトパレットから「CSV」を選択し、出力ファイルエリアへドロップします。
ドロップ後、「CSV」アイコンをダブルクリックします。


Step11

出力設定画面のレイアウトタブを設定します。



項目名 説明
ID 出力ファイルのIDを設定します。
Step05で作成した【SAMPLE_GAIJI_OUT】を設定します。
出力先指定 出力先の指定方法を選択します。今回は、"固定値"を指定します。
ファイル名には、出力ファイルの絶対パスまたは相対パスで設定します。
今回、出力ファイル名は【C:\work\SAMPLE\outputdata\GAIJI_out】とします。

Step12

出力設定画面の外字タブを設定します。



項目名 説明
外字変換テーブル使用 外字変換テーブルの使用有無を選択します。
今回は【使用する】を選択します。
外字変換テーブル格納パス Windowsの場合、外字変換テーブル格納フォルダgtfへのパスを、絶対パスまたは相対パスで指定します。
今回は【C:\work\SAMPLE】を設定します。
※「外字変換テーブル格納パス」の入力欄の最後に「/gtf/」が設定されている為、格納先指定の際に注意してください

これで、出力ファイルの設定は完了です。

Step13

入力ファイル・出力ファイルの項目間のマッピング処理を定義します。

抽出条件と出力条件を結び、マッピングアイコンをダブルクリックします。


Step14

メニューから「同一項目をマッピング」を選択します。
この操作により、入力項目と出力項目がマッピング線で結ばれます。

Step15

任意の「ID」を入力し、データ加工情報設定画面の「適用」をクリックします。



項目名 説明
ID データ加工情報を識別するためのIDを指定します。
今回はIDを【SAMPLE_GAIJI】とします。

これで、「3.データ加工情報の設定」は完了です。

Step16

それでは実行してみましょう。データ加工情報設定画面上部の「実行」をクリックし、データ加工実行画面を起動します。
画面が起動したら、そのまま「実行」ボタンをクリックします。

Step17

出力データ格納先として指定した「C:\work\SAMPLE\outputdata\」を確認してください。
「GAIJI_out」というファイルが出力されているので、メモ帳などで中身を参照し、コード変換結果を確認してください。

さいごに

今回の変換は視覚的にはわかりにくい為、少し解説をします。
下記データは変換用の外字テーブルデータをバイナリ表示したものです。
選択部分は入力データに「Dm」のコードがあった場合、該当コードをデータを「㈱」へ変換する定義になっています。



次のデータは入力データです。該当するコードを選択状態にしています。



次のデータは出力データです。該当するコードが変換されていることがわかります。



今回の外字コード変換ですが、外字のテーブル定義を用意することで様々な変換のパターンを用意することが可能です。
これらの機能を利用し、環境依存文字となる外字を対応することができます。

サンプルデータ

サンプルデータはzip形式での提供となります。解凍してからご利用ください。

この記事は役に立ちましたか?
0人中0人がこの記事が役に立ったと言っています

コメント