ホ−ム » 住所検索時の入力パラメータ(フリーワード)正規化仕様

住所検索時の入力パラメータ(フリーワード)正規化仕様

住所検索時に入力したフリーワードパラメータを以下の法則で変換を行い、検索を行います。
ZDC.Search.getAddrByWordV2()とZDC.Search.getAddrByWord()では正規化の仕様が違います。

ZDC.Search.getAddrByWordV2()でのフリーワード正規化仕様

検索文字は下記のように変換されます。

変換前変換後
半角カタカナ全角大文字カタカナ
小文字英字全角大文字英字
半角数字全角数字

その他
normalization_v2.png

ZDC.Search.getAddrByWord()でのフリーワード正規化仕様

表記の統一

数字、アルファベット、修飾語は下記のように変換されます。 ※1

変換前変換後
全角数字、漢数字 ※2半角数字
全角アルファベット半角アルファベット
漢数字/算用数字(半角/全角)の直後に、修飾語と判断できる文字半角ハイフン

※1 以下の条件に該当するものは、半角ハイフンに変換して検索を行います。
・漢数字/算用数字(半角/全角)の直後にあった場合変換する修飾語

丁目、街区、住区、番地、番町、番丁、の町、地割、‐、−、-、ー、-、―、線、号、番、区、班、内−、通、内、外、筆、条町、条、丁

※2 数字として扱う漢数字の範囲は(一~九千九百九十九)とし、「機↓供廚△襪い蓮岼蹇弐」といったフォーマットは数字として扱いません。

数字の検索仕様

入力パラメータ内のひとつながりの数字は部分マッチを行いません。
例:
「東京都昭島市中神町111」で検索
 ⇒「東京都昭島市中神町1113」は検索されない。

「東京都昭島市中神町11135」で検索
 ⇒「東京都昭島市中神町1113」は検索されない。

「東京都昭島市中神町1113」で検索
 ⇒「東京都昭島市中神町1113」が検索される。

第の省略

「第一」など、数字の前に第がある場合、第を省略して検索を行います。

大字、小字、字の省略

字名称(大字名称)の前に「字/小字」(「大字」)とつけることがありますが、省略して検索を行います。

カッコ内の文字の省略

括弧内の文字は、括弧ごと省略して検索を行います。
例:「東京都目黒区(自由が丘)」⇒「東京都目黒区」

スペースの取り扱い

半角/全角スペースは区切り文字として扱い、区切られた語句の左から順番に部分一致する住所の検索を行います。
例):"新潟県新潟市中央区明石"という住所を検索する場合
   新潟県新潟市中央区明石 ⇒ 新潟県新潟市中央区明石(存在する住所)
   新潟県 新潟市 明石 ⇒ 新潟県新潟市中央区明石(左のワードから順番に絞り込む)
   新潟県 明石 新潟市 ⇒ 新潟県(新潟県までヒット)
   新潟市 新潟県 明石 ⇒ 該当なし(新潟市新潟県は存在しないため)

送り仮名の統一

1.カタカナは全て平仮名に変換します。
2.「ヶ」「け」「が」「の」「り」は省略した場合でも検索を行います。
例:「自由丘」で「自由が丘」も検索を行います。

一部の漢字の統一

以下の漢字は置換して検索を行います。

置換前置換後
龍淵竃砺瀦諌粕薮
螢曾檜籠麸彌惠鰺檮
竜渕竈礪潴諫糟藪
蛍曽桧篭麩弥恵鯵梼

施設検索時の検索結果パラメータ(施設名称)正規化仕様

返却パラメータに施設名称が含まれる検索機能では、処理系によっては表示できない文字の代替表記を分りやすくするため、
施設名称に含まれる旧字・外字を以下の法則で変換をしておりますのでご留意ください。

normalization_v1.png
※旧字が「はしご高」「難しい塚」の2文字のみ正規化を行っているのは、上記の2文字以外を使用した施設名称が存在しないためです。(2010/5/26現在)
上記以外の旧字を含んだ施設の出現次第、順次対応予定です。