目的
本稿はnode.js+expressにおいて多言語化をどのように行うべきかを考察する。
サンプル
http://needtec.sakura.ne.jp/release/node_globalization_sample.zip
このサンプルはログイン画面とユーザ登録画面について、多言語化対応できるように実装している。
基本的な考え方
ユーザに提示する、すべてのメッセージは1つのファイルに記述する。
たとえば、エラー時に表示するメッセージやボタンに表示するテキストがこれにあたる。
今回はroutes/message.jsonがメッセージ情報を格納するファイルとなる。
routes/message.json
多言語化対応を行う場合は、このmessage.jsonと同様のJSONファイルを対応言語分用意する。
そして、設定に応じて使用するjsonファイルを切り替える。
プログラムには、直接文字を記述せず必ずmessage.jsonから文字を取得するようにする。
このさい、util.formatを使用してすると、以下のように動的に文字を構築てきる。
var name = 'Jack'
var c = 10
util.format('%s は %d の リンゴを持っている', name, c)
//-> Jack は 10 のリンゴを持っている
この際、注意することして、翻訳の際は%sや%dの順番が同じになるようにしなければならない。
message.jsonに登録する際は文章単位で登録する。けっしてプログラムで連結してはいけない。
英語の場合:
str1 // "I have "
str2 // "pen"
strRet= str1 + str2;
// I have pen. ... OK
日本語の場合:
str1 = "私は持っている";
str2 = "ペン";
strRet = str1 + " " + str2;
// 私は持っているペン ... NG
言語によって文法は異なるので単語単位の翻訳ではなく、文章単位の翻訳を行うこと。
多言語化の例
実際の多言語化の例をソースコードと共に例示する。
サーバーの応答の多言語化
サーバーの応答に含む文字を多言語化する例を以下に示す。
以下の例では、エラーが発生した場合に「ユーザ名(%s)は存在しないかパスワードが間違っています.」と表示する。
この場合、直接、文字をプログラムに記述していない。common.getMessageにコードを指定し、エラーメッセージを作成している。
router/login.js
var data = {};
if (result) {
data = {result: true};
req.session.user = email;
data = {
result: true
};
} else {
data = {
result: false,
error: common.getMessage('error',
'NotfoundUser',
[email])
};
}
res.contentType('application/json');
var json = JSON.stringify(data);
res.send(json);
common.getMessageでおこなっていることはmessage.jsonから指定のキーのデータを取得して引数で指定された文字と併せて文字列として返している。
routes/common.js
var util = require('util');
var message = require('./message.json');
/**
* メッセージの取得
* @param {string} category カテゴリ名
* @param {string} id ID
* @param {Array} args 引数の配列
*/
function _getMessage(category, id, args) {
var msg = message.message[category];
if (msg) {
if (msg[id]) {
var param = [msg[id]];
param = param.concat(args);
return util.format.apply(this, param);
}
}
return util.format('category:%s id:%s args:%s' ,category, id, args);
}
Viewにおけるメッセージの構築例
ボタンのタイトルやラベルの文字を多言語化するには、レンダリングするさいに、ビューで必要なメッセージをすべて渡せばよい
以下の例ではユーザの新規登録画面における例を示している。
以下のように、message.jsonから必要なメッセージを common.getViewMessageを用いてすべて取得して、テンプレートエンジンに渡している。
routes/login.js
exports.register = function(req, res){
res.render('register',
{ message: common.getViewMessage('register') });
};
ここで使用しているテンプレートは次のようになる。
doctype html
html
head
title #{message.title}
link(rel='stylesheet', href='/stylesheets/style.css')
link(rel='stylesheet', href='/javascripts/lib/msgbox/msgBoxLight.css')
script(type='text/javascript', src='/javascripts/lib/jquery-1.11.1.min.js')
script(type='text/javascript', src='/javascripts/lib/msgbox/jquery.msgBox.js')
script(type='text/javascript', src='/javascripts/src/ui_util.js')
script(type='text/javascript', src='/javascripts/src/register.js')
body
h2 #{message.title}
form(action='/login/doRegister' method='POST')#registerForm
div #{message.user}.
input(type='text', name='user', placeholder='#{message.user}')
div #{message.password}.
input(type='password' name='password', placeholder='#{message.password}')
div #{message.passwordConfirm}.
input(type='password' name='passwordConfirm', placeholder='#{message.passwordConfirm}')
div
button #{message.doRegister}
include message
InputBoxの表題やボタン名などユーザに表示する文字は、直接記述していない。
以下のように、message.jsonのデータが格納されているオブジェクトを経由して表示している。
button #{message.doRegister}
クライアントサイドのJavaScriptでメッセージを使用する
クライアントサイドのJavaScriptで文字を表示しようする場合はどうするべきか?
先のテンプレートの最期に下記のようにincludeを行っている。
include message
これは別のmessage.jadeというテンプレートを埋め込むことを意味している。
このように記述することで、
これを、以下のようなコードで取得すればよい。
$('#message').find('#' + id).text();
もし、%sや%dなどを使用したい場合はutil.formatのコードで必要な部分をクライアントサイドのJavaに移植してやればよい。
public/javascripts/src/ui_util.js
var formatRegExp = /%[sdj%]/g;
function _format(f) {
if (!_isString(f)) {
var objects = [];
for (var i = 0; i < arguments.length; i++) {
objects.push(arguments[i]);
}
return objects.join(' ');
}
var i = 1;
var args = arguments;
var len = args.length;
var str = String(f).replace(formatRegExp, function(x) {
if (x === '%%') return '%';
if (i >= len) return x;
switch (x) {
case '%s': return String(args[i++]);
case '%d': return Number(args[i++]);
case '%j':
try {
return JSON.stringify(args[i++]);
} catch (_) {
return '[Circular]';
}
default:
return x;
}
});
for (var x = args[i]; i < len; x = args[++i]) {
if (isNull(x) || !isObject(x)) {
str += ' ' + x;
} else {
str += ' ' + inspect(x);
}
}
return str;
}
function _isObject(arg) {
return typeof arg === 'object' && arg !== null;
}
function _isNull(arg) {
return arg === null;
}
function _isString(arg) {
return typeof arg === 'string';
}
function _isUndefined(arg) {
return arg === void 0;
}
別解
自前で実装せずにnode用の多言語のライブラリを使用する
https://github.com/mashpie/i18n-node
一般的な多言語対応における注意事項
多言語化で一般的に気を付けることは以下のとおりである。
長さ
同じ意味を持つ言葉でも言語によって長さが異なる。そのため、描画を行う際には文字が長くなった時のレイアウトも考慮しなければならない。
改行
ラベルなどのコントロールに複数行の文字を表示する場合があります。 この場合、改行の方法は言語によってことなる。
日本語の場合、単語の途中で改行する事は許されている。
天の光はすべ
て敵ですか?
しかし英語の場合、単語の途中で改行することは許されていない。
NG
Are all the ligh
ts in the heavens our enemy?
OK
Are all the lights
in the heavens our enemy?
ブラウザを使用するなら適切に描画してくれるが、もし自分で改行を行う場合は注意すること。
比較とソート
地域によってアルファベットの順番は異なり、ソート順と文字の比較に影響を与える。
たとえばデンマーク言語ではÆをアルファベットのZの後にくる独特な文字として扱う。
以下のような配列をソートしたとする。
[0]: Apple [1]: Æble [2]: Zebra
"en-US"の環境では下記のソート順にする必要がある
[0]: Æble [1]: Apple [2]: Zebra
"da-DK"の環境では下記のソート順にする必要がある。
[0]: Apple [1]: Zebra [2]: Æble
複数形
数字と組み合わせて表示を行う場合、複数を考える必要がある。
英語には 2 種類の複数形、単数と複数しかないが、スロベニア語には 4 つの複数形があるので単純なifではいけない。
以下のように()でごまかす場合も多々ある。
2 photo(s).
色とアイコン
色とアイコンも地域化の場合に注意を払う必要がある項目である。
文化によって色やアイコンの意味合いがことなることがある。
文字の方向
英語は左から右に読みますが、アラビア語は右から左に読みます。
右から左に読む言語は以下の通りになります。
Questions & Answers: Which languages are written right-to-left (RTL)?
http://www.i18nguy.com/temp/rtl.html
その他
・タイムゾーン
・日付の表記方法 yyyy-mm-dd か dd-mm-yyyy ...
・金額の表記方法
・数値の表記方法 1,053.3 か 1.050,3 か 1’050.3 ...
参考
国際対応アプリケーションの開発
http://msdn.microsoft.com/ja-jp/library/aa719955(VS.71).aspx
ウェブサイトのローカライズで気をつけたい6つのポイント
http://builder.japan.zdnet.com/sp/web-design-localize-2008/