非整形HTMLからsimplexmlの生成

Tidyを使う方法はもちろんですが、他にも選択肢はあります。 Tidy使えないときのためにHTMLParserとXML_HTMLSAX3を使う方法を以下においておきます。 用意するもの HTMLParser-1.2.1 XML_HTMLSAX3(HTMLParserに付属しているはずです) 下ごしらえ HTMLCleane…

波ダッシュ対策

1:16 PM Jul 29th TwitterFoxで - 波ダッシュ対策たぶんこれで全部→波ダッシュを全角チルダ(〜)へ変換全角マイナス記号(−)の変換双柱・平行記号(‖)の変換セント記号(¢)の変換ポンド記号(£)の変換否定記号(¬)の変換 "\xEF\xBD\x9E", // 全角マイナス記号(−)の…

試し書き

ここでは開発サーバーのこやしにしてしまうのも忍びないと思ったものを置きます。 これまで匿名で流していたのですが、ここでまとめて公開しようと思います。備忘録として、気がついたときに書いていきたいと思います。 内容は技術的な話題がメインになりま…