


新エンジンを語る《第3弾》です。
今回は、新変換エンジン「ハイパーハイブリッドエンジン2」と、新機能「ATOKわたしの辞書プラス」が同時に働くことで得られる相乗効果について、
それぞれの開発担当者を交えて、対談をおこないました。
司会
本日は、お集まりいただきありがとうございます。
特許出願中の新変換エンジン「ATOKハイパーハイブリッドエンジン2」の開発秘話を、これまで「Vol.1」「Vol.2」と2回にわたりお伝えしてきましたが、今回はそれをより拡張して、同じく2月に公開したばかりの「ATOKわたしの辞書プラス」と絡めると、どんないいことがあるのか、ユーザーの皆さまにお伝えしたいことなどたくさんあると思いますので、双方の開発担当者の皆さまで、一緒に語っていきたいと思います。
よろしくお願いいたします。
では、まずは、自己紹介をお願いいたします。
皆さま同じATOK開発チームなので、普段から深く関わっていらっしゃるとは思いますが、この記事をお読みのユーザー様に向けて、改めてご自身の紹介をお願いします。
M.H
ATOK開発チーム、変換エンジン辞書開発担当のM.Hです。
新しいことばがATOKで変換できるように単語や共起情報を辞書に追加したり、誤変換を改修するために辞書情報を調整するなど、ATOKの辞書部分の開発を担当しています。
新機能「ATOKわたしの辞書プラス」では、使う人ごとに異なる語彙空間に柔軟に対応できるように、ジャンル辞書という形での辞書提供を開始しました。
専門用語や趣味のことば・地域に特化した語句など、これまで以上に多種多様なことばが変換できるようになりますが、中には、一般的な言い回しとバッティングしてしまうこともあります。
文脈に応じてうまく訳し分ける新エンジンと組み合わせることで、より快適にジャンル辞書を利用いただけると考えています。

K.T
ATOK開発チーム、変換エンジン開発担当のK.Tです。
私はATOKのプログラム的な動作を担当しています。
最近は統計データを活用した機械学習により、日本語の一般的な性質に焦点を当てた新機能の開発や性能向上に力を入れています。
それだけでなく、辞書開発担当メンバーによる辞書データとも連携して、変換エンジンは動作します。
この総合力により、ユーザーが自然な日本語入力を体験できるようにしています。
新機能のわたしの辞書プラスを利用することで、さまざまなジャンルの辞書が利用可能となりました。
しかし単に変換できる言葉が増えるというだけでなく、ハイパーハイブリッドエンジン2との組み合わせにより、より適切なタイミングでより適切な言葉に変換できるようにしています。
どうぞよろしくお願いいたします。

Y.W
ATOK開発チーム、変換エンジン辞書開発担当のY.Wです。(※テレビ会議で参加)
私もM.Hと同じく、新しいことばがATOKで変換できるように単語や共起情報を辞書に追加したり、誤変換を改修するために辞書情報を調整するなど、ATOKの辞書部分の開発を担当しています。
最近は、新エンジン開発における辞書の部分での改良、提案に携わることも多いです。
いろいろなことに興味が拡散気味で、ニュースや新聞からATOKに登録されていない新しいことばを探したり特許について調べたり、何やかやと取り組んでいます。
休みの日は、鉄道で近郊を巡ったり、大きな公園で巨樹や季節の花を楽しむことが多いです。
お菓子作りは子供の頃からの趣味で、夜中に突然クレープを焼き出すこともあります。
最近カボチャプリンを作ったのですが、少しよいポテトマッシャーを購入して愛用しています。
日本語入力を選ぶことは、手になじむ調理器具を購入して長く使うことに似ていると感じます。
均一価格ショップのものでも用は足せますが、角が鋭かったり、力が入れにくかったり、何かちょっとしたストレスを感じることも多い。
自分が何かを作りたいと思ったときに、そういう手になじむ道具があるというのは案外大事なのではないかと思います。
本日はよろしくお願いいたします。

司会
自己紹介ありがとうございました。
さて、本日の対談のテーマですが、ざっくり言うと、
特許出願中の新変換エンジン「ATOKハイパーハイブリッドエンジン2」と、新サービス「ATOKわたしの辞書プラス」を一緒に使うと、とってもいいことがある!
ということかと思いますが、
これは、具体的にどういうことなのでしょうか?
K.T
ふたつの機能のかけあわせで、相乗効果が得られる! ということです。
さまざまなジャンル用語が変換できるようになることで、その後の変換もスムーズに行えるようになり、文章全体をさらにかしこく快適に変換できるようになります。
今回、新変換エンジンにより、状況によって変換強度を弱めたりすることで、学習による誤変換を防ぎ、快適に入力が進められるようになりましたが、例えば、専門的な文章の入力や、趣味などの特化した話題での入力などでは、そもそも辞書に語彙がないことで、エンジンで処理する前段階で誤変換が発生してしまうことが多々あります。
それを解決するのに、今回サービス提供を始めた「ATOKわたしの辞書プラス」のジャンル辞書が役立つということです。
司会
エンジンで処理する前段階での誤変換を阻止するのに、わたしの辞書プラスのジャンル辞書が活躍するということですね。
実際には、どのような例がありますか?
K.T
そうですね。まず、以下のような事例をご紹介します。
これまでのATOKでは、ジャンル特有の語彙を変換しようとした際に辞書に登録されておらず誤変換になることがありました。
新しいATOKでは、わたしの辞書プラスで法律ジャンルを選択することで、「バルトルス」のようなジャンル特有の語も意図通りに変換。
その後に続く「いごた」も、これまでのATOKでは直前に確定した「井後田」を優先して提示していましたが、ハイパーハイブリッドエンジン2では、「井後田」を一時的な利用と判断して変換強度を弱め、「以後/他の」と正しく変換します。
M.H
法律用語って、難しいですよね。
上の例では、ATOKわたしの辞書プラスの[ビジネス・専門]ジャンルの「法律」辞書を使っています。
「バルトルス」は法律家の名前なのですが、普段は見聞きすることがないような専門性の高い語を含む文章を入力すると、辞書に単語がなくて、おかしな文節区切りで変換されてしまうことがあります。
おかしな文節区切りで変換・学習されると、その後の変換に影響を与えてしまい、びっくりするような変換結果になることもあります。
みなさんも、経験されたことがあると思います。
でも、「法律」辞書を入れると、豊富な語彙収録により、専門性の高い用語も一発変換できるようになるため、その後の文章の正しい変換に寄与します。
ATOKわたしの辞書プラスでは、「法律」だけでなく、さまざまなジャンルの辞書を取りそろえています。
▽ATOKわたしの辞書プラス 《みんなでつくる!ジャンル別辞書》ジャンル一覧はこちら
https://atok.com/mydicplus/category/


Y.W

ジャンル辞書により、正しく変換されたあとですが、同じ読みのことばが含まれる文章を入力しようとすると、以前のATOKでは、直前に確定した「井後田」を優先し、「バルトルス/井後田の/法律家」と変換していました。
学習により、この地名が次回からは候補トップに出てくるようになるのが定石ですが、今回の「ATOKハイパーハイブリッドエンジン2」では、日本語文書中での出現の特徴を元に、「井後田」は一時的に入力された語であると判断し、「井後田」ではなく「以後/他の」と正しく変換します。
専門的な用語の変換を正しく行ったのち、一般的な内容の文章を打ったときには、日本語としての出現の特徴を元に適切な候補が提示できる、ということです。
司会
その時々で使い分けた変換ができるのですね!
これはとても便利で助かります。
Y.W
はい。ジャンル特有の語彙と学習による誤変換の両方が改善され、意図した変換結果が提示されるようになります。
K.T
他にも、こんな例がありますよ。
たとえば、旅行仲間と、旅行に関する話題をやり取りしていて、かなりマイナーな観光地などを入力しているような場合があるかと思います。
ジャンル辞書「旅行」を使ったときと、使ってないときとでは、変換結果に大きな違いが出ます。
以下をご覧下さい。
Y.W
これまでのATOKでは、ジャンル特有の語彙を変換しようとした際に辞書に登録されておらず誤変換になることがありました。
新しいATOKでは、わたしの辞書プラスで旅行ジャンルを選択することで、「マタヌスカ」のようなジャンル特有の語も意図通りに変換。
その後に続く「とうのまえ」も、これまでのATOKでは直前に確定した「藤之前」を優先して提示していましたが、ハイパーハイブリッドエンジン2では、「藤之前」を一時的な利用と判断して変換強度を弱め、「等の/前」と正しく変換します。

M.H
マイナーな観光地や、地元の地名・店名などの固有名詞が変換できなくて、文節の区切りが変になってしまうことがよくありますよね。
これは、辞書開発の立場からすると、語彙が登録されていないため仕方がないのですが、ユーザーの立場だと、このような誤りが生じると「使いにくい」「イライラする」と思ってしまいますよね。
文章を作成するとき、誤変換で思考が中断されてしまうのは、できるだけ避けたい!
せっかく新エンジンで学習の強度を調節できるようになったのだから、“プラス辞書” で、もっと快適に文章入力ができるようにしたいと思います。
K.T
プログラム開発側でも、今回のエンジンでの変換強度の学習対応に加えて、よりよい変換精度が得られるアルゴリズムの研究や、誤変換対策などにも力を入れています。
今後も、さまざまなシーンにおける変換精度の向上に努めます。
司会
そういえば、Y.W さんは、鉄道やお菓子作りが趣味なのですよね?
今はまだないですが、[趣味・生活]ジャンルに、「鉄道」辞書や、「お料理」「お菓子」などの辞書があれば、嬉しいのでは?
趣味に関わる話題でチャットやメールのやり取りをしたり、記録文を書いたりする際に、役立ちそうですよね。
Y.W
はい。ジャンル語彙というのは、多くの人が広く使うものもあれば、利用する人はそこまで多くなくても、深く思い入れを持って使われ、親しまれているものもあると思います。
是非、皆様が入力していてわくわくするような、そんな語彙をATOKわたしの辞書プラスの投稿単語としてお寄せいただきたいと考えています。
ATOKわたしの辞書プラスによる語彙の強化と、ATOKハイパーハイブリッドエンジン2による誤変換の改善、この二つが組み合わさって、あなたの文章作成をより自由に、思いが伝わるものにしたい、それが開発者としての願いです。
K.T
ユーザーさんの中には、仕事と趣味など異なるジャンルの文章をATOKで入力される方もいらっしゃるのではないかと思います。
ATOKわたしの辞書プラスにより変換できる言葉の数が増えます。
しかし一方のジャンルではよく使うが、他方のジャンルではそうでもないというような言葉も多いのではないでしょうか。
ATOKでは、現在の入力状況に応じて最適な変換結果を出し分けるための取り組みを継続しています。
ハイパーハイブリッドエンジン2も、学習機能に着目してそのような改善を行う取り組みのひとつです。
M.H
今、提供しているジャンルはまだまだ少なくて、自分がほしいジャンルがないなと感じているユーザーさんが多いのではと思います。
また、今あるジャンルについても、投稿サイトにいただくご要望から、この部分が足りていないんだなと気づかされます。
ご要望に耳を傾けつつ、ジャンルのラインナップを増やしていき、多くのユーザーさんの語彙空間に(Y.Wさんの語彙空間にも!)寄り添える辞書にしていきたいと考えています。
司会
Vol.1 と Vol.2 で熱く語った「高性能エンジンを生み出す」開発秘話に加えて、
今回は、新エンジンと、ATOKわたしの辞書プラスのジャンル辞書との「相乗効果」について、開発担当者の皆さまに対談していただきました。
いかがでしたでしょうか?
ユーザーの数だけ、変換の内容も異なります。
今回の事例だけでなく、ユーザーの皆さまが日ごろ良く使っている用語や、用途・シーンに応じて入力している様々な内容の文章において、「ATOKハイパーハイブリッドエンジン2」と「ATOKわたしの辞書プラス」のジャンル辞書との相互作用による快適な変換を体感いただけると幸いです。
そして、気になる誤変換や、登録してほしい語彙の要望などがありましたら、報告・投稿をお待ちしています。
ATOKは、これからも進化を続けてまいります。
本日はありがとうございました。