符号長を減らすような連結がなかった場合

A B C D A B C A A B C A B C C D B A D D A D A D B

のような文字列を対象として、bigram 'A B' の連結を行うと、
符号サイズが大きくなる。
そのうえで、もういちど bigram 'AB C' の連結を行うと、
符号サイズが最初よりも小さくなる。

この文字列の場合、顕著なパターン 'A B C' があり、
その一部だけを単語と認める(第2ステップ)ではむしろ符号長が長くなる。

対処:
差分が最小の連結でも符号長を増やしてしまう場合、
そこで連結をやめるべきかどうかは、
そのあとで符号長が減るかどうかによる。

符号長を増やす連結を採用する条件は、以降k回のうちに減少があること。

追記:
杞憂かも。