2013年1月16日水曜日

正規表現メモ

ここの所キチンと仕事しているので、あまり新規性が無くよってネタも生まれないし、ネタ作る時間もない訳なんですが。まあ兎に角ieは滅びた方が良いと思います。

それはさておき、仕事しててチョイチョイ必要になってしかも毎回忘れる正規表現についてのメモです。

  例えば

とかあって、クラスの所だけ取りたいって事ないですか?無いですね。でも僕の場合あったんです。
そんな時はこんな感じ。
class=".[a-zA-Z0-9]*"

あと、ページの文章の文字数数えたくて、タグ全部いらないって時は
 <("[^"]*"|'[^']*'|[^'">])*>
 こんな感じ。コレは有名。既存のページの再構築なんかでは良く使うかも。

まだ研究の余地はありありなんだけどタグに囲まれた2バイト文字だけに引っ掛かるのはこんな感じ。
<.[^\x01-\x7E]*>
そんな状況あんまりないけどね。

マークアップめんどくさいんだけど、結局自動化とか出来ねーんだよなー。
なんか効率良い方法ないですかねー。

0 件のコメント:

コメントを投稿