住所検索時の入力パラメータ(フリーワード)正規化仕様

住所検索時に入力したフリーワードパラメータを以下の法則で変換を行い、検索を行います。
ZDC.Search.getAddrByWordV2()とZDC.Search.getAddrByWord()では正規化の仕様が違います。

ZDC.Search.getAddrByWordV2()でのフリーワード正規化仕様

検索文字は下記のように変換されます。

変換前 変換後
半角カタカナ 全角大文字カタカナ
小文字英字 全角大文字英字
半角数字 全角数字

その他
normalization_v2.png

ZDC.Search.getAddrByWord()、ZDC.Search.getLatLonByAddr()でのフリーワード正規化仕様

表記の統一

数字、アルファベット、修飾語は下記のように変換されます。 ※1

変換前 変換後
全角数字、漢数字 ※2 半角数字
全角アルファベット 半角アルファベット
漢数字/算用数字(半角/全角)の直後に、修飾語と判断できる文字 半角ハイフン

※1 以下の条件に該当するものは、半角ハイフンに変換して検索を行います。
・漢数字/算用数字(半角/全角)の直後にあった場合変換する修飾語

丁目、街区、住区、番地、番町、番丁、の町、地割、‐、-、-、ー、-、―、線、号、番、区、班、内-、通、内、外、筆、条町、条、丁

※2 数字として扱う漢数字の範囲は(一~九千九百九十九)とし、「Ⅰ、Ⅱ」あるいは「壱、弐」といったフォーマットは数字として扱いません。

数字の検索仕様

入力パラメータ内のひとつながりの数字は部分マッチを行いません。
例:
「東京都昭島市中神町111」で検索
 ⇒「東京都昭島市中神町1113」は検索されない。

「東京都昭島市中神町11135」で検索
 ⇒「東京都昭島市中神町1113」は検索されない。

「東京都昭島市中神町1113」で検索
 ⇒「東京都昭島市中神町1113」が検索される。

第の省略

「第一」など、数字の前に第がある場合、第を省略して検索を行います。

大字、小字、字の省略

字名称(大字名称)の前に「字/小字」(「大字」)とつけることがありますが、省略して検索を行います。

カッコ内の文字の省略

括弧内の文字は、括弧ごと省略して検索を行います。
例:「東京都目黒区(自由が丘)」⇒「東京都目黒区」

スペースの取り扱い

半角/全角スペースは区切り文字として扱い、区切られた語句の左から順番に部分一致する住所の検索を行います。
例):"新潟県新潟市中央区明石"という住所を検索する場合
   新潟県新潟市中央区明石 ⇒ 新潟県新潟市中央区明石(存在する住所)
   新潟県 新潟市 明石 ⇒ 新潟県新潟市中央区明石(左のワードから順番に絞り込む)
   新潟県 明石 新潟市 ⇒ 新潟県(新潟県までヒット)
   新潟市 新潟県 明石 ⇒ 該当なし(新潟市新潟県は存在しないため)

送り仮名の統一

1.カタカナは全て平仮名に変換します。
2.「ヶ」「け」「が」「の」「り」は省略した場合でも検索を行います。
例:「自由丘」で「自由が丘」も検索を行います。

一部の漢字の統一

以下の漢字は置換して検索を行います。

旧字 新字
龍淵竃砺瀦諌粕薮螢曾檜籠麸彌惠鰺檮涛亞惡壓圍醫爲壹
飮隱榮營衞驛圓鹽應歐毆櫻奧穩假價畫會繪壞懷擴殼覺學
嶽樂罐卷陷勸關歡觀顏氣歸僞戲犧舊據擧峽挾狹曉驅勳徑
莖溪經輕繼鷄藝缺縣儉劍險圈檢獻權顯驗嚴廣效恆鑛國碎
濟齋劑册雜參棧蠶慘贊殘絲齒兒辭濕實舍寫釋壽收從澁獸
縱肅處敍將稱燒證奬乘淨剩疊繩壤孃讓釀觸囑眞寢愼盡圖
粹醉穗隨髓樞數聲齊靜竊攝專淺戰踐錢潛纖禪雙壯爭莊搜
插裝總騷藏臟屬續墮對體帶滯瀧擇澤擔單膽團斷彈遲癡蟲
晝鑄廳聽敕鎭遞鐵點轉燈當黨盜稻鬪獨讀屆貳惱腦霸拜廢
賣麥發髮拔蠻祕拂佛竝邊變辨瓣辯舖寶豐襃沒飜萬滿默譯
藥與豫餘譽搖樣謠來亂覽兩獵壘禮勵隸靈齡戀爐勞樓灣艷
巖龜堯穰晉聰槇遙祿亙瑤餠櫨靱
←→ 竜渕竈礪潴諫糟藪蛍曽桧篭麩弥恵鯵梼濤亜悪圧囲医為壱
飲隠栄営衛駅円塩応欧殴桜奥穏仮価画会絵壊懐拡殻覚学
岳楽缶巻陥勧関歓観顔気帰偽戯犠旧拠挙峡挟狭暁駆勲径
茎渓経軽継鶏芸欠県倹剣険圏検献権顕験厳広効恒鉱国砕
済斎剤冊雑参桟蚕惨賛残糸歯児辞湿実舎写釈寿収従渋獣
縦粛処叙将称焼証奨乗浄剰畳縄壌嬢譲醸触嘱真寝慎尽図
粋酔穂随髄枢数声斉静窃摂専浅戦践銭潜繊禅双壮争荘捜
挿装総騒蔵臓属続堕対体帯滞滝択沢担単胆団断弾遅痴虫
昼鋳庁聴勅鎮逓鉄点転灯当党盗稲闘独読届弐悩脳覇拝廃
売麦発髪抜蛮秘払仏並辺変弁弁弁舗宝豊褒没翻万満黙訳
薬与予余誉揺様謡来乱覧両猟塁礼励隷霊齢恋炉労楼湾艶
巌亀尭穣晋聡槙遥禄亘瑶餅枦靭

施設検索時の検索結果パラメータ(施設名称)正規化仕様

返却パラメータに施設名称が含まれる検索機能では、処理系によっては表示できない文字の代替表記を分りやすくするため、
施設名称に含まれる旧字・外字を以下の法則で変換をしておりますのでご留意ください。

normalization_v1.png
※旧字が「はしご高」「難しい塚」の2文字のみ正規化を行っているのは、上記の2文字以外を使用した施設名称が存在しないためです。(2010/5/26現在)
上記以外の旧字を含んだ施設の出現次第、順次対応予定です。