ruby-robotの夢

cygwin-ruby,qgisの達人を目指す奮闘記

Google翻訳の使い方と注意(2) 丁寧体の変換

私の翻訳したものは、行政文書であるが、すべて丁寧体になっていた。
これは読みづらいので、常体に変えたい。
プログラムで一括変換を試みたが、なかなか簡単ではない。
ちょっと分析すると、
名詞+です
でした。ではありません。ではありませんでした。
動詞は、・・る、・・する。が多いが、
他の形もある。さらに、通常体だけではなく、否定や過去もある。
なかなか奥深い。

何かツールがあろうと、
ワードに変換機能があると知り、試みたが、どうも動作がおかしい。
候補を出してくれるところと出さないところがあり、使えない。

やはり、分析していくと、

笑う、生む、運ぶ、交す、引く、待つ、注ぐといった変形もある。
さらに、ある、いる、える、おる、くる、するは、少し変化の仕方が異なる。

い、っ、ん、音便等の変則もある。
ちょっとまとめてみたものを下に示そう。説明は省く
こんなことを考えていくうちに、あきらめることとした。
pythonツールがどこかにあるかな?

丁寧体の変換のための整理

ここで、図中のru1変化をする動詞は、以下の動詞
在 居 得 来 煮 似 寝 め 見 り れ げ じ び べ 出 で