忍者ブログ
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

■「山本ゆうじの翻訳道具箱」(その11)汎用翻訳メモリは可能か

今回は前回に続いて、翻訳メモリについてのお話です。

翻訳メモリという仕組みの課題として、不一致の箇所では効率化に貢献
しない、ということがあります。改訂を重ねている文書など、なんらか
の理由で一致率が高い場合を除いて、異なる文書での旧メモリの一致率
は驚くほど低いものです。他の文書の一部を流用して作成した文書など
でない限り、つまり、類似している明確な理由がない限り、偶然の一致
というものはほとんど望めません。ただし、このような場合でも用語確
認ができるというのは大きな意味があります。しかし、用語適用という
点では、根本的には、一致率という数学的な分析ではなく、言語的な分
析を行う翻訳ソフトのほうが適しています。ところで、翻訳ソフトにつ
いては、翻訳者の間では99%誤解されているといえるでしょう。翻訳ソ
フトについては、また後ほど触れたいと思います。

さて、翻訳メモリを使い始めたころ、訳した文を片っ端からためこみ、
あらゆる翻訳に再利用できるようにする、「汎用の翻訳メモリ」という
ものができないか、ということを考えたことがありました。しかし、翻
訳メモリでの作業経験が蓄積されるにつれて、この発想の問題点に目を
向けざるをえなくなりました。人間が作成する文の複雑さは、文例を機
械的に蓄積するだけではとうてい対応できません。かつて存在し、今も
生きている日本人の「のべ人口」、そしてそのひとりひとりが書いた、
また日々書いている文章の数は想像もつかないほど多数ですが、それで
も、ここに書かれている文章のどれひとつとして、宇宙の開闢以来まっ
たく同じ文章が書かれたことはなかったでしょう。どうも表現が大げさ
ですが、確率の点からは、まったく同じ文が出現する確率は顕微鏡的に
小さいのです。句のレベルならともかく、一文まるまるを Google 検索
しても、よほど短い文やことわざ、決まり文句などでない限り、ヒット
することはまずありません。

Googlewhack という遊びをご存じでしょうか。
http://www.googlewhack.com/
Google の検索結果が1ページだけになるような2つの英単語の組み合わせ
を探す、というものです。また Google で検索できる 4,285,199,774 ウ
ェブページ(本原稿執筆時点)のうち、たとえば私自身のウェブサイト
中の1ページを特定できるような単語の組み合わせを見つけだすのは簡単
です。それほどよく似た文というものは少ないということです。

誤解のないようにはっきり書いておきますが、私はだから「翻訳メモリ
が無意味だ」といっているのではありません。翻訳メモリ自体は、きわ
めて有効な方法です。ただ「汎用の翻訳メモリ」というものは、手間の
割には、役に立つことはまれであるということです。

次回も翻訳メモリの続きです。

ご質問、ご感想や、「もっとわかりやすく」「もっと詳しく」「この点
について扱ってほしい」といったご要望、「いや、私は汎用翻訳メモリ
を便利に使っている」といったご意見などもお待ちしております。
tran@nichigai.co.jp までどうぞ。
PR
この記事にコメントする
Name:
Title:
Mail:
URL:
Color:
Comment:
pass: emoji:Vodafone絵文字 i-mode絵文字 Ezweb絵文字
この記事へのトラックバック
TrackBackURL:
最新CM
[12/09 山本ゆうじ]
[12/07 Lisa Hosoi]
[09/29 NONAME]
[09/29 NONAME]
[03/13 エラリー]
カレンダー
08 2017/09 10
S M T W T F S
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
バーコード
ブログ内検索
カウンター
アクセス解析
カウンター
忍者ブログ [PR]
Copyright(C) TranRadar(トランレーダー)ブログ All Rights Reserved