Webサイトの日本語改行問題を機械学習(Budou)で解決できるか検証
投稿者:江藤 光
はじめに
この記事のオリジナルは 2017/02/28 にレコチョク社内向けに公開したものです。多少情報が古くなっているかもしれません。ご了承ください。
改行問題改行問題、とは例えば以下のような状態のことです。
「リリース」の「リリ」で改行されています。
本当ならば、「リリース」という単語の途中で改行をしてほしくありません。
この、「改行させない」という処理はWeb のコード的には難しくありません。
例えば、以下のような ...