JUSTSYSTEMS.

ATOK.com

日本語こだわり調査団

ATOKの信頼をささえるかしこい日本語。その規範となる「ATOK監修委員会」にインタビュー

高本條治<上越教育大学学校教育学部言語系准教授、ATOK監修委員会メンバー>

1960年 岡山生まれ。上越教育大学にて、国語学・日本語学の教育と研究を行う。専門分野は、日本語学・語用論。コンピュータ媒介コミュニケーション(CMC)における日本語使用の多面性に関する研究にも取り組む。1992年の立ち上げ時より初期メンバーとしてATOK監修委員会に参加。

普段は高本先生はどのようなお仕事をされているんですか?
教員養成系の大学で、国語学・日本語学の教育と研究を行っています。学校教員を目指す若い学部学生たちばかりでなく、現職のベテラン学校教員も大学院生として日本中の各地から集まってくるようなところですね。とても真摯に向き合う学生が多いので、学校や社会の現場で活用できるテーマやトピックを議論するように心掛けています。
日本語の研究もされているとのことですが、最近はどのようなテーマに取り組んでいるんですか?
日本語研究にはさまざまな分野がありますが、特に「語用論」(プラグマティックス)という方法論を中心に研究しています。これは音声や語彙や文法を、言葉が実際に使われた場面や状況の中で問題にしていくという研究姿勢です。語用論では、具体的な「文脈」(コンテクスト)の中で私たちの言葉がどのような働きをしているのかということに主眼を置きます。実際に言葉が使用される場面では、時として文字通りの意味ではなく、裏の意味や付随的な意味が伝達されることがあります。例えば、皮肉やユーモアなどがそうですね。夏目漱石は“I love you.”の訳文として「われ汝を愛す」ではなく、「月がきれいですね」とでも訳すのがいいと言ったそうですが、この事例なども語用論と深く関わっています。
なるほど。「文脈を読んで」というのは、ATOKのかしこい変換にも通じますね。
日本語の専門家としてご参加いただいているATOK監修委員会ですが、ATOKの日本語の監修とは、具体的にどのようなことをしているのですか?
ひとことで全体像を言い表すのは難しいですが、ATOKの日本語変換に関わるさまざまなデータの収集・吟味・改訂を営々と続けてきました。最もわかりやすいのは辞書にどのような単語を登録するかという仕事ですね。実は、辞書の登録単語数というのは多ければ多いほど良いというものではないんです。

文法に比べると、語彙というのは時代による移り変わりが早いものなんですね。新語や流行語は次々に生まれ、また忘れ去られていきます。また、新しい表現や口語的な表現を好む人もいる一方で、伝統的な表現や文語的な表現を好む人もいます。ATOKではユーザーができるだけ不自由を感じることのないように登録単語の増強に努めてきました。しかし、何でもかんでも辞書に入れてしまうと、候補群の中からなかなか目当ての語が見つけられなかったり、誤変換を誘発したりしてしまうんです。

他にも、一つの語に複数の表記が存在する場合がありますが、このような場合、どういう候補をあらかじめ辞書に登録しておくのか、変更候補の並び方をどういう順序にするのか、そういう問題も発生してきます。もちろん、学習機能が働きますから、使い慣れていくうちに自然と自分が目当てにする候補に到達しやすくなっていきますが、ATOKでは使い始めの状態で、バランスよく変換候補を提示できるように細心の注意を払っています。

さらに、ATOKには「AI用例」によって変換効率を向上する仕組みがあります。辞書に登録されている語やそれらの語から派生される文節が、別のどのような語や文節とつながるのかには一定の規則があります。例えば、「熱い」は「お茶」とつながって「熱いお茶」となりますが、「暑い」は「お茶」とはつながりませんよね。このような個々の用例情報も辞書の中にデータとして収められています。

こうした作業はATOK監修委員会とATOKの開発チーム・辞書チームが連携しながら進められていきますが、それに先立って登録単語の選定基準、表記や語形の選定・配列の基準、語と語のつながりに関するルール策定などは、監修委員がそれぞれの知見に基づいて熱のこもった議論を闘わせます。特に表記に揺れがあるケースや、「誤用」とされているが実際には許容されている表現のようなケースでは、一つの問題について長時間にわたる論争が繰り広げられることもありますよ。監修委員会は、いつもそのような真剣勝負に満ちたスリリングな場でもあります。


監修委員会の会合の様子です。

候補の並び順や、登録単語に必要情報を付与する作業などは、辞書開発チームへのインタビューでも話題に上がっていました。やはりかしこい変換を目指すには、重要な作業なんですね。最近は、ATOKチームからどのような問い合わせが多いのですか?
敬語に関するご質問が多いですね。例えば、「お求めやすい価格」の「お求めやすい」。これは敬語として正しいのかどうか。監修委員のA氏は「美化語や丁寧語としてはOKだが、敬語としてはグレーだ」と判定しました。しかし、別のB氏の判定は「口語では効率性が重視されるので、これは一種の省略であって敬語表現としては認めてよい」というものでした。監修委員会はそうした意見の対立の中から、ユーザーにとって最も納得してもらいやすい回答を探っていきます。

テレビや雑誌などのメディアで使われている言葉に関する質問も少なくありません。例えば、「世界最薄のノートPC」という表現が文字だけで書かれているとき、「最薄」の読みは「さいうす」なのか「さいはく」なのか。「極薄」の場合は?「最厚」や「極厚」の場合は?「最低」は「さいひく」ではなく「さいてい」ですし、「極寒」は「ごくさむ」ではなく「ごっかん」(または「ごくかん」)ですよね。ユーザーによっては他の語からのさまざまな連想から、自分なりの読み方をすることもあります。こうした場合、どこまで読みの多様性を認めればいいのか難しいところです。
言われてみれば確かに、私も感覚で読んでしまっている言葉がありますね。正確さを追求するATOKの監修は難しい作業だと思いますが、監修いただくにあたり気をつけていることを教えてください。
伝統的なルールやお定まりの規範に頼るのは楽です。しかしながら、現実に使われてる日本語表現は、必ずしもルール通りでもなく規範通りでもないという側面があります。「規範に厳密に従え」という見方を《規範主義》と言います。一方、「現実の用法を網羅せよ」という見方を《記述主義》と言います。どちらも言語学の用語です。ATOK監修委員会のディスカッションでは、しばしばこの《規範主義》と《記述主義》とが対立してきました。そして、その結果として、一方的な《規範主義》でも、何でもありの《記述主義》でもない、絶妙のバランスが生み出されてきたのです。

実は、監修委員会発足当時からずっと引き継がれてきたディスカッションテーマがあるんですよ。それは「語彙空間」というキーワードに集約されます。現代を生きる私たちは必ずしも単一の「語彙空間」だけで十分とは言えません。ビジネスシーンとプライベートシーンでは異なった「語彙空間」が必要になることも多いはずです。ソーシャルメデイアでのメッセージのやりとりの中で、どのような日本語表現をするかで、その人の個性も伝わってしまいます。あるいは、メッセージの内容に応じて異なった「語彙空間」の使い分けが求められることもあるでしょう。

ATOK監修委員会の議論は、常にこの「語彙空間」というキーワードに立ち戻ってきた気がします。「語彙空間」とは何か、「語彙空間」は具体的にどのように切り分けられるのか、本当に使いやすい日本語変換のためには「語彙空間」をどのように適切に判別すればよいのか。この議論はまだ終結していません。ATOKができるだけバランスのとれた日本語変換を実現できるように、監修委員会では今後もこの議論を続けていくことになるでしょう。


監修委員会の資料も膨大な量になりました。

「語彙空間」という利用シーンに応じた使い分けまで考えれらているのが、ATOKなんですね。では、次は、これまでATOK監修委員会の意見が反映された個所など代表的なものを教えてください。
ATOKの「表現モード」の切り替えのうち、方言への対応や文語への対応は監修委員会でも比較的初期の段階から話題に上りました。その実現までには長い時間が必要でしたが、よくぞ実現できたものだと今でも思っています。ATOKの開発チーム・辞書チームの皆さんが、何とか監修委員会の要望に応えようという熱い気概をもってくれていたおかげです。

日本語変換ソフトというのは、アプリケーションシステムと辞書データとの複合体であり、両者を切り離すことはできません。幸いジャストシステムには、方言や文語も含めた日本語文法を効率的に扱うための高度なシステムを開発しているATOK開発チームと、辞書データの洗練と増補・改訂をたゆまなく地道に続けるATOK辞書チームとが、車の両輪のように互いに切磋琢磨し合っています。

特に強調したいのは、ATOKには専属の辞書チームがいてくれるという安心感です。私もATOK監修委員の一人としてこれまでさまざまな要望をATOKに対して行ってきました。最初のうちは語彙増強に関する要求を感じることが多く、辞書に登録してほしい語彙リストを辞書チームに突きつけたこともあります。辞書チームの皆さんはその一語一語について丹念なチェックを行ってくれたものです。

文語的な表現の弱さや一貫性のなさを指摘したこともあります。例えば、「悠然」という語がありますが、「悠然と」「悠然たる」という形式でも使われます。ごく初期のATOKでは「悠然」は独立語、「悠然と」は副詞、「悠然たる」は連体詞といった具合に、辞書には別々に登録されていました。しかし、これは明らかに効率的ではありません。そこで、システム内部の文法を書き換え、辞書登録の仕方を変えてはどうかと提案してみたのですが、開発チームと辞書チームの皆さんは、実に短時間でこの提案に対応してくれました。
監修委員会とATOK開発・辞書チームとの連携が、今のATOKを作ったんですね。他にも監修委員会が関わった機能はありますか?
ATOK監修委員会の議論は辞書に直接関わるものだけではありません。ATOKの日本語変換には「校正支援機能」というサービスがあります。「ら抜き表現」や「さ入れ表現」、ことわざの誤り、敬語の誤り、仮名遣いの誤り、同音語の使い分けなど、ついつい間違えてしまいやすい表現についてユーザーに注意喚起を促すという機能です。何が正しいかを伝統や規範に従って指摘すること自体はそれほど難しいことではないのですが、個々のユーザーがどのような誤りを犯す可能性があるかを見通すことは、実はとても厄介なことなのです。

あるいは、最近のATOKで高い評価を得ているのが「推測変換機能」とのことですが、これも監修委員会が関わっています。これは、ユーザー自身が以前に入力した単語やフレーズ、および省入力データに登録されている表現が、先頭の文字を入力するだけで自動的に変換候補に出てくるという機能です。この場合も、どのようなデータをユーザーの入力履歴から拾い出すか、あらかじめどのようなデータを登録しておけばいいのか、十分な議論が必要でした。何でもデータ化してしまえばいいというものではありませんからね。

あと、先程も少し話題に出ましたが、「表現モード」の切り替えです。ATOKでは通常の書き言葉表現に適した「一般」モードの他に、「話し言葉」モードや「文語」モードに切り替えられる機能があります。このうち「話し言葉」モードは各地方の方言に対応しており、関西・北海道東北・関東・中部北陸・中国四国・九州の各地域ごとに、ご当地ならではの表現が容易に変換できます。また、「文語」モードでは歴史的仮名遣いに対応しているので古典の文章などを入力するときにとても役立ちます。こうした多様な「表現モード」を備えているのも、ATOKがさまざまなシーンでの柔軟な日本語変換に対応しようとしていることの表れですね。
高本先生は立ち上げ時から20年もの間ATOKを監修いただいていますが、何か思い出すエピソードなどはありますか?
思い出すエピソードはたくさんあります。それはもう語り始めたらキリがありませんが、何と言っても、ATOKの開発チーム・辞書チームに所属していた歴代のメンバーの方々との出逢いですね。よく「理系」対「文系」の差ということが言われますが、ジャストシステムの風土ではそのようなことがありませんでした。学生時代はコンピューターにまともに触ったことがないような純「文系」の方が、入社後、システム開発の先導役を担う。その一方で、コンピューター科学に習熟したエキスパートの方が、とても泥くさい人間言語に関する議論に懸命になってくれる。そういう人間的な付き合いの中で、「文系」と「理系」という区別の無意味さに気づかされました。それは、言葉というものを真剣に考え、言葉について真正面から取り組むためには「文系/理系」などという世俗的な区分に毒されていては駄目だという教訓にもなりました。今もATOK監修委員会では互いの専門性を尊重しつつも、そういう枠組みを超えた「人間らしい議論」が毎回繰り広げられていますよ。
では、苦しかった思い出は?
個人的に最も苦しかったのは二つですね(笑)。

一つは、監修委員会が発足してまもなくの頃、「AI用例」に関わる基礎データ作成をしてほしいと依頼されたときのことです。そのデータ書類の分量は並大抵のものではありませんでした。笑顔で受け取ってしまったものの、帰りの電車の中でその重みに気持ちが半分萎えてしまいました(笑)。データチェックには本当に時間と労力と神経を使いました。そのとき、安易な判定をしてしまったために、後々、開発チーム・辞書チームの方々にご迷惑をお掛けしたという苦い思い出もあります。

もう一つは、「同音語の使い分け支援」のための用例データ作りです。「同音語の使い分け支援」というのは、例えば「対象・対照・対称」というように同じ読み方をする語を、ユーザーが適切に使い分けられるように、効果的で簡明な例文を作成するという作業でした。この作業も笑顔で引き受けてしまったのですが、すぐに後悔しました(笑)。あの夏はとりわけ暑く、汗がキーボードの上に滴ったことを覚えています。


監修委員会の努力の結晶です。本当にご苦労をおかけしました。

これからも日本語は変化し続けると思いますが、ここ数年の変化の傾向などあれば、教えてください。
先ほども述べましたが、言葉に対する見方には《規範主義》と《記述主義》があります。いかに現実の言葉が変化したとしても「正しく美しい日本語」は変わらないという極論を唱える方もいます。しかし、実際には、ご質問の通り、言葉は変化し続けます。特に語彙については、新語や流行語を始め、新しい地名・人名・商品名・企業名など、辞書に登録していかなくてはならない項目は増加するばかりです。

その一方で、「変化」というのは新しい現象を取り込むだけではありません。従来から大切にされている伝統的で、かつ、風格のある日本語が忘れかけられているとしたら、そういう言葉にもう一度活躍のチャンスを与えることも重要なことです。「文化」は言葉と共にあります。今はあまり目を向けられない芸術家の名前や作品名も、実は大切な日本語文化なのです。

ATOK監修委員会発足時から「座長」を務めておられるのが作家・評論家の紀田順一郎さんです。紀田さんは、常にそうした言葉の文化的側面に意識的であれという指針と教唆を与えてくれていて、私たちはその紀田哲学の背後にある言語感覚を「紀田フレーバー」と呼んできました。そうなのです。言葉は文化です。歴史です。それと同時に、各個人の人生経験の記憶でもあるのです。

言葉は変化します。言葉は社会と共にあります。社会の変化に応じて言葉も変化します。その一方で、言葉は個人の成長と共に変化します。そういった意味では、インターネットが爆発的に普及し、ソーシャルメディアがここまで生活の中になだれ込んできた現在、社会の言葉、個人の言葉が変化しない方が不思議だと言えるでしょう。

最近の事例として一つだけ挙げるとすれば、音声からではなく文字から新しい言葉を獲得していく傾向が顕著に見られるようになったことです。ラジオやテレビがマスメディアの中心であったときは、文字表記と音声形式とが対応していました。ところが、最近のように文字表記優先のコミュニケーション手段が普及してくると、自分がもっている個人的なルールをやや拡大的に適用してしまう傾向が強くなってしまうのです。

例えば、映画の興行で「封切り」や「封切館」という言葉が使われます。通常、これまでは「ふうきり」「ふうきりかん」と読むのが一般的でした。ところが、最近では「ふうぎり」「ふうぎりかん」というように「き」を「ぎ」と濁って読む傾向が広がりつつあります(補足:日本語研究の専門用語では「連濁」と言うそうです)。

「甘辛」や「甘辛い」はどうでしょう。もちろん地域的な言語差もあるのですが、共通語としてはこれまで「あまから」「あまからい」と連濁しないで読むのが一般的でした。ところが、これらも連濁する傾向が生まれてきています。つまり、「あまがら」「あまがらい」という読み方を選択する人が少なくないのです。

ATOK監修委員会では、こうしたケースについての相談がユーザーから寄せられるたびに、可能な限りの議論を行い、ATOKの辞書にそうした新しい読みでの単語登録をするべきかどうかの基準を決めていきます。そして、辞書チームの皆さんが、全体的なバランスを考慮しながら、製品としてのクオリティーを下げないような地道な調整作業を行っています。
今後もATOKの監修を続ける上で、実現したいことや目指すことなどあれば教えてください。
人間言語を見るとき、大きく分けて二つの見方があります。一つは、音韻や語彙や文法などを個々の使用環境や使用状況から切り離して、自律的で体系的な仕組みとして捉える見方です。言語学ではこれを《構造的な見方》と言います。一方、誰が、いつ、どこで、何のために、誰に向かってその言葉を使ったのかを、具体的・個別的な文脈の中で言葉を捉えようという見方もあります。これを《運用的な見方》と言います。

ATOK監修委員を引き受けたときから、《構造的な見方》だけでも《運用的な見方》だけでもなく、両者をつなぎ合わせる立場にいたいと考えてきました。文芸作品の中に登場する比喩の表現や各種の古典的言い回しにも対応できる一方で、実に現代的な、例えばパソコン通信やインターネットというメディアの中で生まれてきた新しい言い回しにも対応できる。それが自分がこれから関わるATOKであってほしい。そういう願いがありました。

幸いにして、ATOKの開発チームや辞書チームの皆さんとの間で、そうした願いはかなり共有されているように思います。例えば、日本語用例の収集ということで言えば、ネット上から単に機械的・自動的に単語を切り出して、それを変換用の辞書に登録するという方法もあります。しかし、もちろんそれだけでは本当に実用に沿った変換精度にするには限界があります。

効率は悪いけれども、あくまでも一つ一つの語を生きた人間の知恵で吟味し、辞書に登録するかどうかを決め、表記の配列順序や、登録後にどのような「AI用例」をもたせるかをチェックし、さらに他の語を変換する上で弊害にならないかどうかを見通す。このようなコストの掛かる作業を行っているのはATOKだけではないでしょうか。

私たちは自分たちが使う言葉によって自己実現しています。言葉はある時は無力かもしれませんが、またある時は強力です。それが「言葉の力」です。《規範主義》で割り切れるものでもないし、《記述主義》で何でもありと開き直るわけにもいきません。《構造的な見方》と《運用的な見方》も両者併存でなくてはならないのです。

ATOK監修委員会の一員として、これからのATOKに期待していることは「人間らしい人間のためのATOK」という漠然としたイメージです。ATOKという道具に合わせて個々のユーザーが不便な思いをするようではいけません。ATOKは言わば「無色透明」でなくてはならないのです。ユーザーの思考を邪魔することなく、ユーザーの意向をくみ取って、適切で的確な日本語入力をサポートすること。それがATOKの唯一の到達目標であると信じています。

PAGE TOP

Update:2012.02.10