Foreign Language Education & Research
外 语 教 育 研 究
Vol. 2 No.3Jul. 2014
コーパス言語学の立場から中日同形語の分類を考え直す
施建军1(北京外国语大学日语学院,北京 100089)
要旨:中国と日本の言語学界においては、中日同形語が意味用法の相違から同形同義語(Same)、同形異義語(Differance)、
同形類義語(Overlap)など三つの種類に分けられるのが一般的な見方である。大まかに見てこういった分類は間違いがないようであるが、中日同形語の意味用法の相違を深く追究すれば、意味用法のまったく同じ同形語がないくらい少なく、同形類義語も意味用法の相違に差があることが分かる。中日同形類義語は意味用法相違の大小によって、同義と異義を両端とした一本の連続的な直線に並べられるといっていいくらいである。本研究では中日対訳コーパスを利用して中日同形語のこのような特性の証明を試みた。
キーワード:中日同形語;コーパス;コロケーション;意味分類11973年から1975年まで、日本早稲田大学語学教育研究所では日本文化庁から委託研究プロジェクトを受けて日本語と中国語の言語構造の対照研究が行われた。このプロジェクトの研究成果の一つとして、日本文化庁から「中国語と対応する漢語」が刊行された。それ以来、中日同形語の研究は中国と日本の学者の注目を浴びてきた。この分野において、今になっても、結論がまだ付いていない課題が沢山残っている。たとえば、中日同形語はいったいどのような単語を指すのかというようなまるで足元の問題もあれば、どういうような方法で中日同形語の意味用法を弁別すべきかというような応用面の問題もある。
「中国語と対応する漢語」では、中日同形語の種類として、意味の立場に立って、S(同形同義)、O(同形類義)、D(同形異義)、N(日本語にしかない漢語)など四つの種類が提案されている。論理的には、そういうような分類は成り立つと思われるが、これに基づいて中日同形語を実際に分類するとき、適当でない分類が出たこともずっと前から指摘されてきた。たとえば、O類に属するはずのものがSに分類されてしまったとか、また、意味が似たりよったりして、使い方が違う同形語はどう扱ったらいいのかまだ研究の余
地がある。
「中国語と対応する漢語」によれば、早稲田語学教育の研究はまず当時日本で広く使われていた3種類あわせて10冊の教科書から漢字音読語を選び、一枚のカードに一語ずつ記録し、漢語一語の情報を記録したカードを約10000枚作った。そして、その中から教科書2冊以上使われた漢語を常用漢語として選び、約2000あまりの常用漢語を選出した。それから、中国人留学生と当時日本で広く使われていた中日・日中辞書を利用して手作業で2000語の漢語を上述のSODNという四つの種類に分類した。結果として、同形同義にされた語は2/3を占め、同形類義にされた語は約80語であった。
その後、荒川清秀(1979)、守屋宏則(1979)、大河内康憲(1992)、施建軍・洪潔(2013)など多数の研究では、中日同形語の定義付け、中日同形語の意味用法判別方法について、さらなる研究が行われた。これらの研究は主として、中日同形語とは何であるのか、どういうような方法で中日同形語の意味用法の異同を記述するかなどの課題をめぐって展開してきた。意味用法の記述に先立って、どういうような方法で、数多くの中日同形語をSODNなど四つの種類に振り当てることは中国
基金项目:教育部哲学社会科学研究重大课题攻关项目“东亚国家语言中汉字词汇使用现状研究”(12JZD014)、国家社会科学基金一
般项目“中日两国现代语言生活中的同形词汇研究”(12BYY138)
作者简介:施建军,教授,博导。研究方向:日文信息处理、日语语言学、汉日语言比较、计量文体学。
总第4期 施建军:コーパス言語学の立場から中日同形語の分類を考え直す13における日本語教育と日本における中国語教育にとってもっと実用的ではないかと思われる。もちろん、中国語と日本語の辞書の意味記述に基づいて手作業で分類すれば、一種の方法と言えるが、上述早稲田語学教育研究所の研究から分かるように、次のような欠陥がある。一つは、辞書の意味記述に依頼するから、辞書の意味記述に不備がある場合、同形語の分類が間違ってしまう恐れがある。例えば:「中国語と対応する漢語」では辞書の意味記述に基づいて、中国語の“贵重”と日本語の「貴重」を同形同義語としてい
る。しかし、「貴重なアドバイス、貴重な花」などのような、中国語と対応できない「貴重」の意味用法が日本語にある。もう一つは、多数ある中日同形語の数から言えば、辞書に基づいた手作業の手法は決して能率的な方法とはいえない。大規模な中日同形語の自動分類作業に対応できる方法の研究が必要である。また、中日同形語の意味分類に先立って、「中国語と対応する漢語」で提案された同形語の意味に関する分類体系そのものに不都合なところがあるかどうかを考え直す必要がある。
「中国語と対応する漢語」によって、意味が同じかどうかを基準にして、中日同形語はS(同形同義)、O(同形類義)、D(同形異義)など三種類に分類できる。(Nは日本語にしかないもので、中日同形語とは言えないから、中日間の意味対照は無意味なものである)。論理的にはこのような分類には問題ないが、しかし、中日同形語使用の実際を考えてみると中日同形語意味用法の実際の状況はそう簡単ではない。同形異義語はもちろん形態上から見れば、同じ語形を有するが意味用法がまったく違う同形語のことである。同形語には必ずこういう種類があるから、Dの類の設置には問題がないが、問題は同形同義語と同形類義語にある。「中国語と対応する漢語」では、中日同形語のほとんどが同形同義語に分類された。同形類義語に分類されたのはただ80語くらいしかない。言語運用の実際は必ずしもそうではない。同形同義語に分類された上述の「貴重」は、意味が同じ同形語のようで、実際の運用から見て、中国語と日本語の間にズレがある。これは「貴重」と共起できる単語の群れが中日の間で一致してい
ないことから分かる。意味がまったく同じであれば、それと共起する単語が大体同じである。共起できる単語には相違が生じた場合、必ず中日間の意味のどこかにズレがある。だから、こういう点から見れば中国語の“贵重”と日本語の「貴重」との間には意味的な距離がある。また、意味が大体同じでありながら、用法には中日間のズレがある単語は少なくない。こういうようなものには中日の間で違う品詞を持っている同形語がよく見られる。例えば「損害」(中国語の場合は動詞、日本語の場合は名詞)。意味も、品詞も同じでありながら、文において果たせる役割が違うものもよく見られる。例えば:「話題」“话题”という同形語は中国語も日本語もともに「話の主題、話の種」という意味を持っているが、「話題の車、話題の人物、話題の商品」などと対応する用例は中国語にはめったにない。
上述の言語事実から見れば、中日同形語の意味分類を簡単にSODの三種類に分類することができない。意味の異同から見れば、もちろん中日同形語には意味のまったく同じものもあれば、まったく違うものもある。この二種類のものを中日同形語意味分類の両端にすれば、その間にまたいろいろな種類があることは言語事実である。この両端の間にあるものは従来同形類義語とされてきた。しかし、この同形類義語にはまたどんな種類があるのか、中日同形語の意味用法の距離をいったいどういうふうに測るのかは非常に興味深い研究課題である。
中日同形語意味用法の距離は語彙的意味、コロケーション、品詞、文法機能などの要素から考察できる。大まかに見れば、中日同形語は同形同義語、同形類義語、同形異義語と言う三つの種類に分けられるが、同形同義語は意味用法のまったく同じ同形語である。つまり、語彙的意味、品詞、文法機能、コロケーションなど四つの要素が揃って中日の間にあまり大したズレのない同形語の群れである。同形異義語は語彙的な意味が違う同形語のことである。中国語と日本語とは語彙的な意味が違う同形語は形態上は同じ形をしているが、実は違う単語である。違う単語であるから、中国語と日本語との間に、このような同形語の品詞性、文法機能、コロケーションを比較すること
14外 语 教 育 研 究第2卷は無意味なことである。この二種類の同形語は運用上から見れば数が少ないだけでなく、その意味用法の把握は中国の日本語学習者あるいは日本の中国語学習者にとってはそんなに難しい問題ではなく、覚えればよい単語の群れである。
これに対して、同形類義語の場合は決して簡単の問題ではない。まず、第一は、同形類義語は数から見れば、三種類の中で一番数の多いものである。80語あまりしかないと言う『中国語と対応する漢語』の調査結果は実に間違っているものだ。同形類義語の意味用法は中日両言語においては、上記の四つの面のいずれかに相違が現れている。上記四つの面がまったく同じ同形語はまれにしかない。同形異義語も数が少ない。しかし、『人民日報』と『朝日新聞』(それぞれ2000万字)を対象にした我々の調査では一年間で中日両言語に使われている同形語は10000語の異なり語がある。同形同義語と同形異義語が少ないので、その大多数は同形類義語であるわけである。第二は、意味用法の中日間の距離から見て、同形類義語には同形同義語に近いものもあれば、同形異義語に近いものもあり、また、その中間にあるものもある。同形類義語の状況は実に複雑である。同形類義語中日間意味用法の相違は均一なものではなく、それには大小の差があることを証明するために、ここでコーパスを利用して考察してみる。施建軍、洪潔(2013)が提案した中日同形語用法相違の考察方法によると、中日同形類義語意味用法相違の大と小はその語の共起語の群れ、品詞性、文法機能という三つの要素を統合的に考察して分析できる。コーパス言語学では、「パートナーから単語の意味が分かる」ということがよく言われている。つまり、語の意味的相違はその共起語から伺うことが出来る。だから、共起語の群れが語義の意味的相違の考察においては非常に重要な役割を果たしている。だから、ここで、語のコロケーションをもって同じ同形類義語に属する同形語は意味的相違に大と小の差があることを証明する。
まず、中日両言語の意味用法に重なりがあるがかなり食い違っている同形類義語のことを考察してみよう。これを説明するために中日同形類義語“深刻”(日本語:深刻)を例にする。主として、「深刻」という言葉が連体修飾成分とし
て使う場合、「深刻」と共起する中日両言語の共起語群れの相違を通して、「深刻」の中日の相違を分析する。連体修飾語として使う「深刻」のコロケーションを抽出するに当たって、「深刻な」と“深刻的”をもって、『光明日報』(2009年約56M)と『朝日新聞』(1998-2000年約40M)を調べた。「深刻な」が連体修飾節の述語になりうるので、調査した結果からこの部分の例を削除した。中国語の“深刻的”も同じようなケースがあるので、同じく連体修飾節の述語になる“深刻的”の例文も削除した。結果として、「深刻」が
連体修飾語になった例文を、中国語は624例、日本語は314例抽出した。中国語の“深刻的”と共起する異なり語を153語、日本語の「深刻な」と共起する異なり語を88語得た。その中で中国語の“深刻的”と一番よく共起するのは“印象”で88例あり、述べ語数の14%を占めている。日本語の「深刻な」と一番よく共起するのは「不況」で、37例あり、延べ語数の12%を占めている。これらの共起語を用例数の順で並べ替え、上位10語を下記の表にまとめた。
表1 “深刻的”と「深刻な」の共起語上位10語
中国語
日本語
異なり語用例数異なり語
用例数印象88不況37变化57問題35变革34影響33内涵27事態22影响25危機17认识19状況17启示18~難14意义18被害10教训16打撃9理解
15
不足
7
上記の表から分かるように“深刻”(「深刻」)と共起する中国語コロケーションと日本語コロケーションには重なっている語はただ“影响”(「影響」)しかない。日本語の「深刻」と
共起する語を中国語に翻訳すると、ほとんど中国語の“严重”と共起できる。つまり、日本語の「深刻」のコロケーションを中国語に翻訳する場合、その対訳語として中国語の“深刻”が使えないのである。中国語と日本語における中日同形
总第4期 施建军:コーパス言語学の立場から中日同形語の分類を考え直す15語“深刻”(「深刻」)のコロケーションについての上記の考察から分かるように、中国語の“深刻”と日本語の「深刻」はその語彙的な意味がか
なり掛け離れている。このような同形類義語は意味の重なりがありながら、同形異義語により近い同形類義語だと言っていい。
上記のように中日同形語に意味の重なりがあるにもかかわらず食い違っているところが多い類義語があることを“深刻”(「深刻」)を例にして考察した。中日同形類義語には中日間の意味が食い違いところがありながらかなり近いものもある。ここで“简单”「簡単」を例にしてこういうような語の存在を証明する。今回、使ったコーパスは『人民日报』(2000年,約2000万字)と日本の『朝日新聞』(1998-2000年,約2000万字)である。“简单的”「簡単な」をもって、連体修飾語として使う場合、「簡単」と共起する中国語と日本語のコロケーションを調べた結果、中国語の共起語を延べ178例抽出し、114語の異なり語が得られ、日本語の共起語を延べ68例抽出し、47語の異なり語が得られた。「簡単」と共起できる中国語の共起語と日本語の共起語を比べて見たら、これらの共起語はお互いに対訳語として訳すことが出来る。中日間で同じ意味を持っている共起語が多くあることから、中国語の“简单的”と日本語の「簡単な」は意味が近いことが裏付けられる。こういうことを説明するために、これらの共起語を用例数の順で並べ替えて、上位10語を下記の表にまとめた。
表2 “简单的”と「簡単な」の共起語上位10語中国語
日本語
異なり語用例数異なり語用例数方法12こと7事10もの4问题9操作4事情7手続き4案件3方法3手续3話3变化3会話2道理3言葉2工作3質問
1模仿
3
シミュレーション
1
以上のように共起語を比べて中日同形語類義語には“简单的”「簡単な」のような中日の意味が非常に近い類義語があることを証明できた。実は“简单的”「簡単な」のようなものは同形同義語に近い同形類義語である。
以上のことで中日同形類義語には同形同義語に近いものと同形異義語に近いものの存在が証明できた。実は中日同形語にはもう一種類のものがある。つまり、中日の間でその意味用法が半分くらい重なっている同形語の群れがある。これらの同形語は典型的な同形類義語である。こういうような同形類義語があることを証明するために、“贵重”「貴重」を例にとって、中国語と日本語における「貴重」の共起語の食い違いを考察する。ここで、やはり上述の『人民日報』と『朝日新聞』のコーパスを使って、「貴重」が連体修飾語として使われる場合のかかり先の共起語を調べた。結果として、中国語の共起語を延べ47例抽出し、20語の異なり語が得られ、日本語の共起語を延べ202例抽出し、102語の異なり語が得られた。単に共起語の異なり語数と延べ語数から見れば、日本語の「貴重」は中国語の“贵重”より幅広く使われていることが分かる。さらに、中国語の共起語の群れと日本語の共起語の群れを比較してみると、中国語の共起語と日本語の共起語に共通している語が沢山ある。中国語の共起語が日本語の共起語に含まれているようなイメージが与えられた。翻訳の立場から見て、中国語の共起語の日本語訳がほとんど日本語の共起語に見られる。しかし、逆には日本語の共起語はその中国語訳が中国語の共起語にないものが沢山ある。また、コロケーションを翻訳する場合、中国語の“贵重”で日本語の「貴重」のコロケーションを翻訳できるものがあるが、少ない。多くの場合、日本語の「貴重」は中国語の“宝贵”と対応している。これに対して、中国語の“贵重”のコロケーションはほとんど日本語の「貴重」で対訳できる。こういうような事から日本語の「貴重」は中国語の“贵重”より意味が広いことが伺える。これは、「貴重」と“贵重”の共起頻度上位10語の共起語から分かる。
16外 语 教 育 研 究第2卷表3 “贵重”と「貴重」の共起語上位10語中国語
日本語
異なり語频度異なり語频度物品24資料25礼品3~点15东西2発見8金属2経験8礼物2時間6家产1体験6家具1もの5器具1干潟5珊瑚1教訓5商品
1
湿地
5
以上のように、“深刻”「深刻」、“简单”「簡単」、“贵重”「貴重」等三ペアの中日同形語中日間意味用法の相違についてコーパスを利用した分析から、従来中日同形類義語とされてきたものには、同形同義語に近いもの、同形異義語に近いもの、意味用法に半分ぐらい重なりもあれば半分ぐらい違うところもある典型的なものもあることが証明できた。つまり、中日同形類義語と言っても、同形語によってその中日間の意味相違に大小の差がある。同形同義語から同形異義語までには意味距離の異なる同形類義語で一本の連続的な線がつながっている。数多くの同形語は中日間の意味距離が同形語によって違うから、「中国語と対応する漢語」で提案されたSODの三種類で精密に分類することが出来ない。特に同形類義語の場合は分類という伝統的な手法で描くことが出来ないほど複雑である。
こういうような立場から中日同形語を敢えて分類すると少なくとも次の五つの種類に分けられる。
同形同義語:意味用法のまったく同じ同形語、つまり語彙的意味、品詞、文法機能、コロケーションなど四つの要素が揃って中日の間にあまり大したズレのない同形語である。
同形類義語1類:語彙的意味と品詞と文法機能が同じが、コロケーションに相違がある同形語。従来はこのような同形語は同形同義語として扱われやすい。しかし、品詞も文法機能も同じであるにもかかわらず、コロケーションに相違があるから必ず単語の意味のどこかに相違がある。
同形類義語2類:語彙的な意味と品詞が同じで、文法機能にズレがあるような同形語は類義語の一種とされる。文法機能が違うからコロケーションに相違があるのは無理のないことである。この類に属する単語は「話題」などが挙げられる。
同形類義語3類:語彙的な意味が同じで品詞に相違があるような同形語のことである。品詞に違いがあるから、自然に文法機能もコロケーションも違ってくる。例としては「損害」などがこのようなものである。
同形異義語:語彙的な意味が違う同形語のことである。中国語と日本語とで語彙的な意味が違う同形語は形態上は同じ形をしているが、実は違う単語である。違う単語であるから、中国語と日本語との間に、品詞性、文法機能、コロケーションを比較することは無意味なことである。意味用法の距離から見れば、同形同義語と同形異義語を中日間の意味用法距離連続線の両端にすることができるとすれば、同形同義語は中日間の意味用法距離が0に近い。同形異義語は中日間の意味用法距離が一番掛け離れている。この五つの種類の同形語意味用法距離を大小の順序に並べると次のようになる。
同形同義語<同形類義語1類<同形類義語2類<同形類義語3類<同形異義語
これを導き出す根拠は下記の表のようである。
表4 同形語意味と用法の関係語彙的意味
品詞文法機能
コロケーション
同義++++類義1+++-類義2++--類義3+---異義
----
論理的には、意味用法距離によって中日同形語を分類すれば上述の五つの種類に分類できるが、実際、多数の中日同形語を上述の基準で分類すると大変な作業になる。これだけではなく、上述の基準を利用する際、乗り越えられない難題がいくつかある。つまり、語彙的意味の把握、中国語の品詞の弁別、コロケーションの抽出、文法機
总第4期 施建军:コーパス言語学の立場から中日同形語の分類を考え直す17能の分析などは決して容易なことではない。これらの問題は理論上解決の方法があるにしても、中国語と日本語をともに使いこなしている専門家に依頼するよりほかはない。だから、多数の同形語の分類には対応できない。
大塚秀明(1990)では、「中国語と対応する漢語」の不備を指摘しながら、同形語の対訳を手がかりにして中日同形語の意味用法距離を測り、「現代漢語800語」に出ている中日同形語の分類を試みた。同形語の対訳状況を持って同形語意味用法距離を推し量るという方法は確かに従来の手法よりかなり進んだと思われる。しかし、中日同形語の意味用法の距離はSODで簡単に分類できないので、対訳状況を持って中日同形語をSOD三種類に分類する考えそのものには欠陥があるのである。
その欠陥を補って、対訳コーパスから、同形語の対訳状況を統計し、これを踏まえて同形語の対訳状況を反映できる対訳係数を算出する。それから、同形語の対訳係数を持って同形語の意味用法の距離を精密に推し量るという計量的な方法が考えられる。
参考文献
[1] 施建军 谯燕.基于语料库的汉日语通用词汇获取方法研究[J].解放军外国语学院学报,2011(1):23-26.
[2] 施建军.中日同形词共时比较研究的现状及存在的课题[J].东北亚外语研究,2013(1):4-9.
[3] 施建军 洪洁.汉日同形词意义用法对比方法研究[J].外语教学与研究,2013(4):531-640.
[4]
荒川清秀.中国語と漢語――文化庁『中国語と対応する漢語』
の評をかねて[J].文学論叢,1979(62):361-388.
[5] 大河内康憲.日本語と中国語の同形語[C]//日本語と中国語の対照研究論文集(下).くろしお出版,1992:179-215.
[6]
大塚秀明.日中同形語について[J].外国語教育論集,1990(12):327-337.
[7] 日本文化庁.中国語と対応する漢語[M].大蔵省印刷局,1978.
[8] 守屋宏則.資料·日中同形語――その意味用法の差違[J].日本語学校論集,1979(6):159-167.
Rethinking About Classification of Chinese-Japanese Homographs
Abstract: Both China and Japan’s linguists consider that the Chinese-Japanese homographs can be classified into three categories of the same, the overlap and the difference based on their meanings and usages. This classification system is logical from the wide sense. However, through the deep study on the meaning and usage differences between Chinese-Japanese homographs, we find out that there are no absolute homographs with the same meaning. There are more or less meaning and usage differences between the homographs. According to the meaning and usage differences, the Chinese-Japanese homographs range along a continuous line between the same and the difference. Through the study of the co-occurrence words of the Chinese-Japanese homographs, this paper proved the feature of the homographs on the meaning and usage differences.Key words: Chinese-Japanese homographs; corpus; collocation; semantic classification
因篇幅问题不能全部显示,请点此查看更多更全内容