ひらがな誤字脱字チェッカー(js) - ルール

 ひらがなの書き方について、政府は現代仮名遣い常用漢字表人名用漢字 送り仮名の付け方法令における漢字使用等についてなどを公開しています。
 三省堂 Web Dictionalyも参考になります。
 記者ハンドブックなどの市販の本が表記ルールに詳しいそうです。
 小説は芸術の分野に属するので、このルールに従う必要はありませんが、ある程度は準じたほうが読者にとって読みやすい文章になると思います。

ひらがなにする文字

■常用漢字・人名漢字
 常用漢字に含まれない難しい漢字は、ひらがなで書くことも検討してください。
 常用漢字・人名漢字であってもJIS第二基準に含まれない文字は、携帯電話対応サイトなどでShift_JISが使われていると表示できないため、ひらがなにするか代わりの漢字を使うことを推奨します。
 常用漢字にも難しい漢字は含まれています。作者の判断でひらがなにしてください。
 当て字や、常用漢字表にない読みの言葉もひらがなにすると、よいとされています。

  囁く→ささやく   呟く→つぶやく   纏う→まとう  掠る→かする
  抉る→えぐる    頷く→うなずく   溢れる→あふれる

 チェッカーではJIS第二基準に含まれている常用漢字、以外の漢字を「常用漢字」ボタンで強調表示できます。
 ただしUnicodeのBMP外に追加された漢字については特に警告表示は行いません。

 ファンタジーでは「巫(女)」「杖」「槍」「鞄」「胡椒」「(石)鹸」「鎧」など頻出する漢字も常用漢字ではありません。それらは漢字でないと逆に読みづらい可能性もあるため、作者の感覚で使い分けてください。
 また、同音異義語がある場合は、漢字が好まれる傾向にあります。

 一部の難しい漢字などは、あえてカタカナで書くと読みやすさが向上します。
 ひらがなが続く場合には擬音語や動植物名もカタカナで表記するとよい場合もあります。

  バカにする
  頭の上にアホ毛が生えている
  みんなでワイワイさわいだ
  おいしいクマ肉ステーキを食べる

■接続詞・助詞
 接続詞・助詞・助動詞などに該当する単語は、ひらがなにする事が多いです。

  もっとも、まったく、たとえば、しかし、かつ、また、ただし、おそれ、ほか、さらに、すなわち、あるいは、まず
  の、より、と、は、や、か、のみ、ず、べし、る、ごとし、なり
  この、これ、その、ため、もって、ら(僕らのら)

■補助動詞
 動詞の後に書かれる補助する動詞は、ひらがなにするのが一般的です。

  食べて来る→食べてくる   勉強を見て上げる→勉強を見てあげる
  見て頂いた→見ていただいた   ご覧下さい→ご覧ください
  推奨出来る→推奨できる  食べて無い→食べてない
  頑張って行きたい→頑張っていきたい
  勉強致します→勉強いたします

 もちろん本来の漢字の意味で使用される場合は、漢字で表記します。

  友達が家に来る  棚に上げる
  ご飯を頂く   ご飯を下さい
  出来すぎ    (笠が無い)
  学校へ行く
  不徳の致すところです

■本来の意味でない漢字
 動詞以外でも、元の意味から離れた言葉は、ひらがなにするようです。

  良く食べる→よく食べる
  そういう物→そういうもの
  明るい内→明るいうち
  ああ言う→ああいう
  こと、ところ

■あいさつなど
  お早う御座います→おはようございます   今日は→こんにちは
  今晩は→こんばんは   お休みなさい→おやすみなさい
  宜しく→よろしく

■その他
  ある、いる、ない、ため、ゆえ
  いったん、ほとんど、あらかじめ、おおむね、さまざま、ちょうど、すでに
  ほう(方)、いつ、どこ、なぜ、あとで、ひとり、ふたり、たち(達)、やすい(易い)

■複数の読みがある単語
 複数の読みで、状況からでも判断しにくい場合は、ひらがなで表記するのも一つの方法です。ルビを振ることもできます。

  潜る→もぐる、くぐる
  人気→にんき、ひとけ
  辛い→からい、つらい
  行って→おこなって、いって
  主→おも、あるじ
  市場→しじょう、いちば
  一日→ついたち、いちにち
  一月→ひとつき、いちがつ
  十分→じゅうぶん、じっぷん
  角→かど、つの、すみ

■標準辞書の単語
 ひらがなの登録単語は、主にひらがなで表記するものを集めているため、圧倒的に語彙がたりません。意図的にひらがな書きにしたものは、高確率で未登録単語扱いになります。
 また「単語の区切り」は「国語文法」に則ったものではありません。

表記ゆれ

 どの表記を採用するかは作者しだいですが、同一の文書内では統一したほうがよいです。

■現代仮名遣い
 いくつかの項目は、本則でない表記を赤背景で強調表示し未登録単語行と共に表示します。
 念のため強調されているものの、間違いではなく、必ずしも従う必要はありません。
 警告単語は、追加・削除のカスタマイズが可能です。

 
  [警告→本則]  
  言う:ゆう→いう ああゆう→ああいう 結う:いう→ゆう
  氷:こうり→こおり 小売り:こおり→こうり 頬:ほう→ほお
  炎:ほのう→ほのお 憤る:いきどうる→いきどおる 概ね:おうむね→おおむね
  凡そ:おうよそ→おおよそ 王様:おおさま→おうさま 蝋燭;ろおそく→ろうそく
  稲妻:いなづま→いなずま 通る:とうる→とおる 通り:どうり→どおり
  催す:もようす→もよおす 模様:もよお→もよう (物)作り:ずくり→づくり
  何れ:いづれ→いずれ 訪れる:おとづれる→おとずれる (色)付く:ずく→づく
  (力)尽く:づく→ずく (黒)尽くめ:づくめ→ずくめ(注:づくし/ずくめで表記が異なる)
  (松茸)尽くし:ずくし→づくし (毛)繕い:ずくろい→づくろい (扱い)辛い:ずらい→づらい
  続く:つずく→つづく 綴る:つずる→つづる 常々:つねずね→つねづね
  (3つ)ずつ:づつ→ずつ (竹)筒:ずつ→づつ 難しい:むづかしい→むずかしい
  若しくは:もしくわ→もしくは こんにちわ→こんにちは すいません→すみません
  近々:ちかじか→ちかぢか ぢゃない→じゃない 

■漢字かな表記ゆれ
  よく目にするのが、「思いつく」「思い付く」などです。

■漢字
 「分かる」「判る」「解る」が作者ルールによる使い分けではなく、混在していることがあります。
 ワカルの場合は、分かるは常用表内、判ると解るは常用表外の読みなので、こだわりがないなら「分かる」または「わかる」に統一するといいでしょう。
 実質的意味は同じでも複数の漢字表記がある場合は、文書内で漢字を統一するといいと思います。
 
 同じ音でも、漢字が使い分けられているものもあります。
 「効く、聴く、聞く、利く、訊く」のようなタイプです。これは誤字扱いになるので注意する必要があります。

■送り仮名
 「表す」「表わす」のように書くことができます。
 本則と、そうでない表記があります。
 内蔵辞書では本則かどうかは特に区別せずに収録しています。

■長音記号
 ひらがなチェッカーでは無関係ですが、カタカナの末尾のrの音を表す長音記号・伸ばし棒(ー)は、表記ゆれが多いです。
 チェッカーでは判定できないので、Wordの校閲機能やエディタなどで検索して確認してください。
 日本語の指標としては長音は省かないのが一般的ですが日本工業規格では省く表記を採用していたため、どちらに合わせるかは状況によります。
 近年では省略しないほうがやや優勢です。

  ユーザー/ユーザ
  パーティー/パーティ
  ブラウザ/ブラウザー
  
 チェッカーではカタカナ等のひらがな以外に続くまたは行頭の長音記号はチェックの対象にしていません。
 いっぽう、ひらがなの途中に登場する長音記号は対象にしています。「ありがとーです」のように単語の途中に現れる場合は、未登録単語扱いになることがあります。
 ひらがな列の末尾に現れる長音記号列は、強調表示の対象から外しています。そのため「かれー」のような単語を登録しても色分けできません。

現代の口語表現

■ら抜き言葉
 一段活用またはカ変活用で「られる」の「ら」が抜けている物をら抜き言葉といいます。
 現代文の小説で頻出するため、チェッカーでは活用形に、ら抜き言葉も含まれています。

  [口語→元の言葉]
  食べれる→食べられる
  来れる→来られる

■い抜き言葉
 「いる」「いた」「いく(いかない)」の「い」が抜けているものをい抜き言葉といいます。
 現代文の小説で頻出するため、チェッカーでは活用形に、い抜き言葉も含まれています。

  書いてる→書いている(五段活用)
  食べてる→食べている(一段活用)
  食べてた→食べていた
  食べてて→食べていて
  食べてろ→食べていろ
  食べてく→食べていく
  食べてかない(or,なく,なかった,なきゃ)→食べていかない
  食べてます→食べています
  食べてました→食べていました

■ラ行五段活用の「ん」+「ない」
 本来ラ行五段活用は「らりるれろっ」だが、否定形の「ない」(なく、なかった)が続く場合に、「ん」に変化することがあります。
 チェッカーではこれも活用ルールに含めています。

  わかんない→わからない
  降んなくて→降らなくて
  頑張んなかった→頑張らなかった

■れ足す言葉
 可能の活用があるのに、さらに「れ」が追加されているものです。
 チェッカーではこれはサポートしていません。分割されて表示されます。

  書けれる→書ける
  脱げれる→脱げる
  飲めれる→飲める

■さ入れ言葉
 五段活用・サ変活用では動詞+「せる」、一段活用は動詞+「させる」なのに、五段活用で「させる」を用いている場合があります。
 チェッカーではこれはサポートしていません。

 五段活用:
  書かさせて→書かせて(いただいた)
  歩かさせて→歩かせて
  言わさせて→言わせて

 一段活用:(これは正常)
  食べさせて
  着させて
  見させて

■違くない
 「違う」はワ行五段動詞なので、違わない、違い、違う、違えば、違った、違おうと活用します。
 違くない、違かった、違くて、については「違/形容詞」「ちが/形容詞」を登録すれば使えますが、標準では単語に入れていません。

■その他
 チェッカーは口語表現もある程度はカバーしていますが、完ぺきではありません。

  そしたら→そうしたら
  こないだ→このあいだ
  頑張っちゃう→頑張ってしまう(っちまう)
  頑張っちゃだめ→頑張ってはだめ
  脱いじゃえ→脱いでしまおう
  歩いたんでしょ→歩いたのでしょう
  思うんです→思うのです
  そんとき→そのとき
  大きいんじゃ(あ)→おおきいのでは
  パンじゃない/じゃねぇ→パンではない
  パンじゃなきゃ→パンでなければ
  やんなきゃ(いけない)→やらなければ
  言うんだっけ→言うのだったかな
  食べんの→食べないの?/食べるの
  ケーキのがいい→ケーキのほうがいい

 口語では「たのしい→たのしー」のように、母音が長音化して発音されることが多いのですが、それらの文字表現はサポートしていません。
 関西弁をはじめとする方言や古風なしゃべり方、ギャル言などの対応はおこなっていません。

プログラム

■内蔵ルーチンについて
 活用の語尾表現はプログラムに埋め込まれていて、後続文字列による例外処理も行われています。
 この処理をカスタマイズする方法は今のところ提供していません。

 サ変(する、した)、カ変(くる、きた)はプログラム上はサポートしていません。それぞれの活用形を単語として登録してしのいでいます。

 「ひらがな」「漢字ひらがな」及び「カタカナひらがな」の形は動詞表現をサポートしています。
 漢字またはカタカナで始まる単語は、漢字・カタカナ部分も色分けされます。
 ただし、漢字・カタカナの後ろがひらがなのみの単語として長く一致した場合はそちらが優先されます。
 漢字またはカタカナで始まる単語は除外用ルールとして「頑張りたく/ない」のように漢字を含めたルールが適用されます。

 「ひらがな漢字」は「ひらがな/末尾漢字」という内部表現に変換され、色の強調はひらがな部分のみ行われます。
 末尾は漢字だけでなく、/以外の任意の文字列が指定可能です。例「ど真ん中」ただしこの場合「ん」は色分けされません。
 「真ん中」のように前後を漢字等ではさんだ形式はサポートしていません。
 
 「ああ〈、」のようなひらがな列の先頭または末尾を指定する場合は動詞活用・末尾文字列は併用できません。

 漢数字・算用数字の直後に置かれた「つ」および「こ」は例外として、強調表示候補から外してあります。

  3つあげる
  五こちょうだい

■記号類や改行のルール
 ノベルチェッカーで、ある程度の入力ミスを検出することができます。
 別プロジェクトとしてノベルチェッカークローンを用意してあるので、ご利用ください。

品詞判定

■五段活用
 語幹が「脱・[ぐ]」→[*]が[うぐすつぬぶむる]のどれか→ないを接続して「脱[が]ない」にしたときに[*]がア行になります。[歌[う]]は「五段ワ」です。
 「書・[く]」→上記と同じだが「楽し[く]」のような形容詞の可能性に注意。
 「走・[る]」→「走[ら]ない」→「五段ラ」[る]の場合は「食べ[る]」のように一段活用の可能性に注意。
 「行・[く]」→「行[っ]た」のようにカ行だが「った」が接続される場合は「五段イク」を指定してください。(普通のカ行は「書[い]た」のように[い]になる)
 「なさ・[る]」→「なさ[い]ます」のようにラ行で「ます」「ました」を接続した時に[い]になる場合は「五段ナサル」を指定してください。(普通のラ行は「貼[り]ます」のように[り]になる)
 五段活用はその行のアイウエオ段すべてと、ナバマ行およびラ行は[ん]にも活用します。カガ行は[い]にも活用します。カタラワ行は「っ」にも活用します。
 「死ぬ」(ナ行)→「死んだ」、「書く」(カ行)→「書いた」、「分かる」(ワ行)→「分かった」
 ガ行ナバマ行では後続の[たてとちゃ]が「死ん[だ]」「死ん[で]」「死ん[ど]く」「死ん[じ]ゃう」のように濁音に変化します。

■下一段・上一段
 語幹が「み・[る]」→「み[ない]」「み」はイ段なので「上一段」動詞です。
 「食・べ[る]」→「食べ[ない]」「べ」はエ段なので「下一段」動詞です。
 「食べ(物)」のように五段活用と違い、語幹自体も単語として認識します。
 プログラムでは「上一段」と「下一段」を同じカテゴリとして処理していますが、念のため分けています。

■形容詞
 「楽し[い]」「楽し[かった]」(楽し[き])「楽し[く]」「楽し[くない]」「楽し[ければ]」と活用するものがそうです。
 「楽しがる」「楽しげ」「楽しさ」「楽しすぎる」「楽しそう」なども接続します。
 「小さい」「小さかった」(小さき)「小さく」「小さくない」「小さければ」
 「小さがる」「小さげ」「小ささ」「小さすぎる」「小さそう」
 「し」で終わっていない形容詞は「小さし」も活用として登録されています。
 「よ[い]」も形容詞です。
 「よさげ」「よさ」「よすぎる」「よさそう」と接続しますが未対応です。
 「楽し」自体は単語として認識しないので、必要なら別で登録してください。

■な型形容詞
 品詞としては処理されていません。
 「小さな」「大きな」「偉大な」などです。
 「な」が単独の単語として登録されていて、漢字に続く場合を広くサポートしています。
 「小さめ」「大きめ」などは下一段動詞として登録しています。

常用漢字チェッカー

■常用漢字
 常用漢字→白で表示
 人名用漢字→青背景で表示
 その他の漢字→赤背景で表示


copyright © syuribox