忍者ブログ
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

(その47)ユーザー辞書(UPF3)と一語一義               

 Lazy Susanというものをご存じでしょうか。おそらくみなさんが必ず一
 度は目にし、また使ったことがあるものです。答えは「回転式テーブル」。
 「1932年に目黒雅叙園の創設者、細川力蔵氏が作った」という説があり、
 日本で広まったのはそちらなのかもしれませんが、18世紀のイギリスに
 すでに原形があったようです。Lazy Susan という語は1917年に米語と
 して初出となっています。調べものには裏の裏があるので、気が抜けま
 せんね。

 それはさておき、今回は「ユーザー辞書」について少し考えてみたいと
 思います。ユーザー辞書とは、翻訳ソフトや日本語入力システムなどで
 使われる辞書ですが、「ソフトウェア製品に付属する辞書」つまりシス
 テム辞書ではなく、「ユーザー自身が作成する辞書」です。

 翻訳ソフトの研究者やメーカーなどで構成されるAAMT(アジア太平洋機
 械翻訳協会)では、仮称「UPF3」という、翻訳ソフトの共有ユーザー辞
 書フォーマットを策定中です。私もこの仕事のお手伝いをしています。
 翻訳ソフトを活用するにはユーザー辞書が重要です。しかし多数のきめ
 細かいユーザー辞書があっても、ユーザー辞書の形式がメーカー独自で
 ばらばらだと、せっかくのデータを有効に活用できません。この新しい
 フォーマットはXMLに基づいており、異なるメーカーの翻訳ソフトであ
 っても簡単にユーザー辞書をやり取りできるようにします。多くのユー
 ザー辞書を集約することで、翻訳ソフトの精度を大きく向上できます。
 現在AAMTでは、このフォーマットの策定のために翻訳の需要があるパー
 トナーを募集しています。関心のある方は以下のページまでどうぞ。
 http://www.aamt.info/japanese/upf3.htm

 翻訳ソフトの場合、システム辞書には原語、訳語、活用形などの必要最
 低限の情報のほかに、その単語特有の詳細情報が加えられています。名
 詞であれば、生物・無生物など、「その語がどのような性質を持つのか」
 といった情報です。システム辞書は翻訳ソフト製品自体に含まれるため、
 出荷前にさまざまな調整をして、より適切に翻訳できるようにしている
 わけです。これは自動翻訳させる場合、ユーザーが手を加えなくても可
 能な限り適切な訳文を出すために必要な情報でもあります。言い換えれ
 ば、自動翻訳では「可能な限り適切に自動で訳し分けをする」必要があ
 る、ということです。

 さて翻訳ソフトには自動翻訳のほかに、ユーザーが手を加えることが前
 提の「翻訳支援」という使い方があります。この場合は、翻訳ソフトに
 任せ切りにするのではありません。自動翻訳でもすでにあるユーザー辞
 書を受動的に使うことがありますが、翻訳支援ではより積極的に「ユー
 ザー辞書を作る」という使い方になります。

 ユーザー辞書では「単語特有の情報」は必須ではありません。あればい
 いかもしれませんが、実際には必要最低限以外の詳細情報をいちいち登
 録するには、大変な労力が必要になります。簡単に作れるものでなけれ
 ば、忙しいユーザーはわざわざ辞書など作らないでしょう。また、ユー
 ザー辞書ではそもそも「訳し分け」を考える前に、基本的な大前提があ
 ります。それが「一語一義」です。

 「一語一義」は、技術文書全般で重要です。これは「1つの言葉には1つ
 の意味を割り当て、明確に定義する」ということです。そうしないと言
 葉の意味があいまいになり、不正確な文書になってしまいます。技術
 「翻訳」の場合には、原則として1つの原語に対して1つの訳語のみをあ
 てる、ということになります。もちろん言葉の中には、文脈によって複
 数の訳語で訳し分ける必要があります。ただ、その場合でもその時の気
 分で訳語を決めるのでは困ります。技術翻訳であれば、Lazy Susanを
 「回転式テーブル」と訳すか、「回転食卓」と訳すか、1つにしっかり
 決めて、いったん決めたらそれを貫くということです。ある言葉に対し
 て複数の訳語を使うのは、「明確に訳し分けをする理由がある場合のみ」
 に限定する必要があります。実際には、訳し分けは用語集やスタイル
 ガイドで規定されることになります。

 文芸翻訳ではまた事情が異なり、柔軟な対応が必要です。文脈にもよる
 でしょうが、「回転式テーブル」とした上で「レイジー スーザン」と
 ルビをあてる、といった具合になるかもしれません。

 さて、一語一義が守られていれば、訳し分けは必要最低限になります。
 言い換えれば、ユーザー辞書では一語一義が守られていれば、単語特有
 の詳細情報は必須ではなく、必要最低限の情報でよい、ということにな
 ります。また翻訳ソフトが「余計なことを考えなくなる」ため、正確に
 翻訳できるようになるわけです。

PR
この記事にコメントする
Name:
Title:
Mail:
URL:
Color:
Comment:
pass: emoji:Vodafone絵文字 i-mode絵文字 Ezweb絵文字
最新CM
[12/09 山本ゆうじ]
[12/07 Lisa Hosoi]
[09/29 NONAME]
[09/29 NONAME]
[03/13 エラリー]
カレンダー
08 2017/09 10
S M T W T F S
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
バーコード
ブログ内検索
カウンター
アクセス解析
カウンター
忍者ブログ [PR]
Copyright(C) TranRadar(トランレーダー)ブログ All Rights Reserved