「つづらご出てら」
もしあなたが医者で、患者にこう言われたらどうだろうか? これは全国の方言の中でも難しいとされる青森県の津軽弁で「帯状疱疹出てる」と言っているのだが、意味が分からなければ円滑なコミュニケーションはできない。
医療においては、患者の話をしっかり理解していないと十分な治療などができない場合もあるだろう。そこで弘前大学ではAIを活用し、津軽弁を共通語に変換するシステムの開発に取り組んでいる。
これは「弘大×AI×津軽弁プロジェクト」の一環で、特に医療・介護の現場で、津軽弁を話す人と分からない人のコミュニケーションに課題があるとして、双方向の音声文字変換システムを目指している。最終的には、ネットワーク経由で津軽弁を共通語にするシステムを組み込んだ小型端末を開発し、医療や介護だけでなく農業や観光サービス業でも活用するとのことだ。
集まった津軽弁の文例はこれまでに約1万
弘前大学はプロジェクト開始以前の2017年から東北電力と協力し、コールセンターにかかってきた電話の津軽弁をテキスト化する研究を行っていた。ただ、その際に使った翻訳エンジンが海外製だったため、日本語の認識に限界があったなどの理由から、独自に研究を行うようになったという。
そしてプロジェクトが始まった2019年からは、インターネットを通じて津軽弁の文例データを広く募り、2021年以降は音声データの収集もはじめている。例文と音声は専用サイトからのアップロードを受け付けているほか、音声はスマホアプリでの投稿もできる。
だがAI開発には一般的に膨大なデータが不可欠で、うまく変換するためには約20万例が必要とされるそうだが、取材時までに集まった文例は約1万、音声は数百とのことだ。なお文例の登録者は、地域別だと中南津軽で年齢は60~69歳、男性が多い。
津軽弁を話す人と自由にコミュニケーションできる社会の実現のために大切なことだと思うが、自分の症状を医師に話すときにも細かいニュアンスが伝わらないのだろうか? また、文例や音声の収集があまり進んでいないようだが、何が大変なのだろうか? 弘前大学の担当者に聞いてみた。
症状を伝えるときのオノマトペも異なる
――津軽弁変換において医療分野に乗り出したのはなぜ?
医療現場や災害現場において、県外・国外の医療関係者と津軽地方の患者との間で、津軽弁が円滑なコミュニケーションの妨げとなっていることが大きな問題となっていることがわかり、最初に取り組むべき分野として医療・介護分野を選んでいます。
――「文例」「音声データ」を集めるのは難しいの?
津軽弁を日常的に使われている方からすると、何が特徴的なものかよくわからないということがあるようです。そのため、学習に利用するための文例をあらかじめ用意して、それに対応する津軽弁のテキスト及び音声の収集を行う方法と、指定したテーマに関して、自由に発話した音声を収集する方法をとっています。
また、薬局や高齢者施設等での音声収集も行っておりますが、会話相手が共通語だとそれに合わせて共通語となり、自然な津軽弁を収集することは意外に難しいことがわかりました。
――共通語と津軽弁で大きく違うのはどこ?症状の名前、ずきずきなどの擬音、体の部位?
症状自体も異なり、例えば、「脳卒中になる」ことを津軽弁では「あだる」と言います。また、症状を伝えるときによく使われるオノマトペも異なりますし、身体の部位の名称も異なります。
【オノマトペ】
津軽弁:えぼえぼ
共通語:でこぼこ。ざらざら。
津軽弁:げわげわ
共通語:比較的大きいものが、めくれて剥げるさま。
津軽弁:にやにや
共通語:しくしく腹が痛むさま。
津軽弁:わやわや
共通語:胸の気分が悪くなり、吐気を催すさま。
【身体の名称】
津軽弁:あげたあわなくてさ。
共通語:口の中の上の部分(口蓋)がうまくあわなくてさ。
――プロジェクトの未来はどうなる?
医療現場、災害現場等でのコミュニケーションの妨げが解消されること、農業現場で県外からの学生アルバイトと津軽の農業従事者とのコミュニケーションが円滑に行えるようになること、また、観光業やコールセンター等で広く活用できると考えています。
また、現在は若年層からの収集が少ない状況ですので、小中学校の訪問やアンケート等を通して、津軽弁の文例・音声情報の収集を行うことを検討しています。これらを通し、津軽弁を中心とした文化継承に繋げていきたいと考えています。
たしかに外国語を翻訳するアプリがたくさんあるように、難しい方言も変換するシステムがあると世の中はもっと便利になりそうだ。弘前大学のプロジェクトの今後に注目したい。