正規表現と住所


全文検索系のシステムなんかで、住所だけ抜きたい場合等正規表現と住所は色々使える。
[正規表現 Assemble]で検索してみよう。

例えば、都道府県なんかを検索する場合、機械にくわすと下記のような正規表現になる。

(?:(?:(?:[富岡]|和歌)山|(?:[広徳]|鹿児)島|(?:[石香]|神奈)川|山[口形梨]|福[井岡島]|[佐滋]賀|宮[城崎]|愛[媛知]|長[崎野]|三重|兵庫|千葉|埼玉|奈良|岐阜|岩手|島根|新潟|栃木|沖縄|熊本|秋田|群馬|茨城|青森|静岡|高知|鳥取)県|大(?:分県|阪府)|京都府|北海道|東京都)?

まあ最終的には人間介した方がよい場合はあるが。

カテゴリー: 開発環境 パーマリンク