テキストエディタでHTMLタグを取り除く方法 正規表現で置換する

HTMLタグを削除したい時ってありませんか?そんな時はテキストエディタの「置換」機能を使うと簡単ですよ。さらに「マクロ」に登録しておけばいちいち入力する手間も省けます。今回はそんな話です。
それでは、早速いってみましょう。

テキストエディタ

テキストエディタって使ってますか?私は前はよく使っていたのですが、最近はあまり使ってないです。

私の場合は基本的に無料で使えるテキストエディタをインストールして使わせてもらってます。無料でも高機能なエディタはいっぱいありますよね。

そんな私が今使っているのが「サクラエディタ」です。無料ですけど高機能で私には充分すぎるほどの性能です。

で、HTMLタグの削除方法ですが、今回はこのサクラエディタを使ってやりたいと思います。

まあ、基本的な使い方は他のエディタでも同じだと思いますので自分のエディタの使い方に合わせてみてください。

公式サイトはこちら サクラエディタ

置換機能

では、HTMLタグの削除を行ってみたいと思います。

削除を行うにはエディタの「置換機能」を使います。これは文章の中の特定の単語を別の単語に置き換える機能です。

サクラエディタでいいますとメニューの「検索」から「置換」を選びます。

そうするとこんな画面が。

「置換前」と「置換後」に入力して「置換」ボタン(または「すべて置換」ボタン)を押すと置換してくれます。

例えば「AAA」という文字を「BBB」に置換したい場合はこんな感じ。「BBB」の部分を空白にすると削除されます。

ただですね、HTMLタグの場合は「<」と「>」に囲まれた部分を削除したいんですが、囲まれた部分の中にはいろいろな文字があるんです。それを一度に全部削除するのはなかなか大変。

そこで「正規表現」の出番です。正規表現を使えば「<」と「>」で囲まれた部分がどんな文字でも削除してくれます。すごいぞ正規表現!

しかし、正規表現てちょっと複雑で分かりにくい。私も実はよく分からないんです。なので基本コピペです。世の中には優秀な方がたくさんいらっしゃるので、そういう方を参考にさせていただいてます。

で、今回参考にさせていただくのが、この正規表現です。

<(“[^”]*”|'[^’]*’|[^'”>])*>

これを「置換前」にコピペして「置換後」は空白。そして「置換」ボタン(または「すべて置換」ボタン)を押すとHTMLタグを削除してくれます。

これでHTMLタグの削除は完了なんですが、削除するファイルの数が多くなると1回1回入力しないとならないんで大変なんですよね(履歴を呼び出す事も出来ますが、それでも大変)。

そんな時はマクロを作ってしまいましょう。

マクロにしてしまう

サクラエディタにはマクロを作る機能があります。他のほとんどのエディタにもあると思います。

一度マクロを作ってしまえば、あとは楽できますよ〜。

マクロには動作を記録してマクロに登録する機能が付いてますので、「記録開始」を押して先ほどの「置換」を行って「記録終了」を押せば完了です。

あとは名前を付けて保存。使うときは呼び出して使います。ショートカットもありますので、それを使えばかなり楽。

あと、記録したマクロを編集も出来ますので、思った通りに動作しない時には編集して思った通りに動作するように出来ます。

まとめ

以上、テキストエディタでHTMLタグを取り除く方法 正規表現で置換するでした。

いやー、1個1個手動で削除する事を考えると本当に楽でいいですね〜。自動ってすばらしい(笑)。

ではまた次回。