8-4 重複データを削除する

               前述8-1②の重複するデータを削除する方法の一例を紹介します。

 

EXCEL の重複削除機能を利用

     機能を利用するだけでなく、ひと手間必要です。

 

   <重複削除の手順>

   データに見出しを付ける

 No. 」「緯度」「緯度」「合体」

  合体:経度と緯度の間に半角スペースを入れた文字列にする。

  経度 & “ “ & 緯度

  No.」を1~最終行まで複写し、別シートなどに複写する。

                   『削除前 No.』として後から利用するためです。

   見出しを付けた次の行から最終行までを選択する。

   [データ][重複の削除]のダイアログを表示させ『合体』以外の

                    チェックを外し[OK]を選択する。

  ここまでで、散布図の「点」を利用するなら、No.でデータをソートするだけ

 でOKですが、散布図の「線」の場合は、予期せぬ箇所が結ばれてしまうこと

 があります。

そこで、結ばれな いように「No.」を空白行とし追加して対応します。

その前に VLOOKUP関数を使って「削除前 No.」と「削除後 No.を比較

させ削除された No.をチェックし No. とデータを抽出します。

 『削除された No.』は、次項 8-5 で使用しますので保存しておきます。

                  但し VLOOKUP関数 の処理時間は、かなり必要となります。

                  下図『 #NA 』が削除されたデータです。このデータを保存しておきます。

  予期せぬ箇所が結ばれないように必要な個所にデータ空白の行を挿入します。

方法としては、削除後の「No.」に着目し番号が連続しない箇所に空白行を

                挿入します。

F 列の「No.」を B列の最後尾に追加し、全体を『No.』でソートして完了です。

因みに、挿入する No.は、ダブラないように「0.5」を加えてた ものとしてい

               ます。

 


    最後にこのやり方のデメリットを追記します。重複データが削除されるので「島」

 「埠頭」などがクローズドループにならないこです。しかし、地図投影しても

 拡大されないかぎり目立ちませんので活用してみてください。

 

< 実施データ削減例 >

    データソース元:国土交通省国土政策局{国土数値情報行政区域データ}

データ  ソース 都道府県 元ポイント数

    重複削除後

      ポイント数

N03-17_01_170101.shp  北海道       1,415,786        1,012,694
N03-17_13_170101.shp  東京          446,174           410,158
N03-17_14_170101.shp 神奈川          187,242           144,991