お試し用 試験運用中
!! -> こちら
現在,長崎弁,大阪弁,讃岐弁,死語,コロスケ語,コギャル語への変換が可能です.
超オススメのWindows版 -> こちら
標準語の文書を流し込むと、方言に変換してくれるソフトを作ってみました。自分のプログラミング練習がてら、です。
従来のものは元のフレーズと変換後のフレーズが一対一に対応しておりまして,それはそれで面白いのですが,対応する言い回しはいくつかあるのが普通です.
そういうわけで,一対多の変換に対応させました.つまり辞書に,ある標準語のフレーズに対応する方言のフレーズをいくつか(ひとつでもよい)持っておき,変換の際には対応フレーズをランダムに選択して置き換えるように改良を施しました.
従来型の場合,ある文章を変換してやると完全に決まった変換がされていましたが,私が製作したエンジンとそれに対応した辞書を用いれば変換する度に異なる出力結果が得られることになります(再現性がありません).
結果として,
にも関わらず,「ばってん」はやはりどうしても使いたいものですから,対応語には「ばってん」を使うことになります.その結果,「しかし」,「でも」,「xxxだが」などは必ず「ばってん」と変換されることになり,いかにも機械的に置換しましたという感じの,いまいち現実を反映しない出力結果になってしまいます.
それを改良できる余地ができた,というわけです(?).
また,フレーズを大きめにとっていろいろと遊ぶことができます.またまた長崎弁を例に取ると,「そんなこと言われても」に対して「そげんこと言われたっちゃ」,「そんがんこといきなりゆーたっちゃ」,「んーげんバカんごたっことば突然ゆーてもさぁ」....などなど,バリエーションは無限大に広がります.
辞書の仕様としては,現在のところ一行にTab文字で区切って「8000字」まで書き込めます.もちろんその分変換にはメモリを消費(ハッシュ検索のため)しますが,最近のPCの性能をもってすれば余裕です.その範囲であれば対応語はいくらでも増やせます.
これからもエンジンの方に改良をぼちぼち加えて行く予定ではありますが,基本的に逐次変換のままだと思いますので,どちらかというとエンジンよりも辞書の方が変換性能に重大な影響があります.
どなたかご自分の出身地の方言を辞書化してみませんか?
また,従来からあるosaka.exeの資産も使用できるように,スイッチによってフィールドの半角スペース区切り辞書にも対応しております(区切り文字をTabから半角スペースに変えてるだけです).