日本語の語彙に関連して

コーパス言語学の成果を受けて、英語教育の世界でもコーパスを利用した研究が増えてきている。市販の教材も、「コーパス」という言葉を冠したものが増えてきた。
私自身、TEXTANAを使って、簡易学習者コーパスを作っていた時期もあり、コーパスの利用には大いに興味を持っている。しかしながら、学習者コーパスの構築に当たって、気になることがいくつかある。
まず、学習者が表現した英語しかデータとして使われず、「表現したかったけどできなかった」データが十分整備されていないのではないかということである。
和文英訳はコミュニケーション能力を反映しない、他人の言葉を英語に直す活動は実際的ではない、などという考え方が現在は主流であるため、当然学習者コーパスのデータも、いわゆる自由英作文的な、テーマ作文などで産出された英文となる。ところが、もし、学習者が回避ストラテジーを総動員して、自分で言えることしか言わないとすると、「本当はなにを言いたかったのか」、という部分との対応が希薄となる。平均的な日本人学習者が「英語で考え」て作文をしているとは考えにくいので、学習者の守備範囲にある日本語の語彙そのものが痩せ細っている現在、自由英作文的な課題による英文の産出を基にしたデータがどの程度の意味を持つのか、少々懐疑的である。その意味でパラレルコーパスとしての利用価値も低く、発達段階を推測するのにもあまり寄与していないのではないか、と危惧するのである。
また、コーパスをウリにした英単語集はいくつも出ているが、英単語集をいくら長文問題をデータにしたコーパス利用で作成したところで、表現のために必要な語彙を反映していないのであるから、英作文やライティングには活用できないのは自明である。
そんな動向を横目に現在私が進めているのが、大学入試で出題される和文英訳の日本語コーパス構築である。今手元にある日本語対応コンコーダンサーはTEXT FINDERなので、ワードリスト作成などできないことが多いのだが、それでも、気が付くことは多い。例えば、「人」という検索で「人々」「人間」「人類」「大人」「個人」「老人」「他人」「日本人」「人口」「人生」「人工」などの出題例がヒットするし、「大」という検索で、「大人」「最大」「巨大」「大きな」「大学」「大切」「大概」「大半」「大差」「大都市」「大震災」「大火災」という出題例がヒットする。「問題」という語のコロケーションとして「食料問題」「問題を解く」「〜の問題に限られる」「問題を先送りにする」「最大の問題」「深刻な問題」「お金の問題」「考えさせられる問題」などの出題例がヒットする。まだまだ始めたばかりで根拠はないなのだが、突き抜けられそうな予感は漠然としてある。できることなら茶筅などを利用してもう少し大きなデータを整理してみたいと思う。
大学入試の和文英訳問題への対処方法として必ず言われるのが、「英語に直しやすいように和文を他の和文に言い換える」というストラテジーだが、上述したように、学習者の日本語の語彙、文構造が貧弱である今、この手法を金科玉条のようにみなしてよいのかと言うことも検証の必要があるだろう。もっとはっきり言うと、結局の所、貧弱な日本語でかろうじて表せる内容を、その日本語よりもさらに貧弱な英語の語彙で表現しているだけであって、英語の表現力そのものはいつまでたっても伸びていないのではないのか、ということである。