8-4 重複データを削除する
前述8-1②の重複するデータを削除する方法の一例を紹介します。
■ EXCEL の重複削除機能を利用
機能を利用するだけでなく、ひと手間必要です。
<重複削除の手順>
① データに見出しを付ける
「 No. 」「緯度」「緯度」「合体」
② 合体:経度と緯度の間に半角スペースを入れた文字列にする。
経度 & “ “ & 緯度
③ 「No.」を1~最終行まで複写し、別シートなどに複写する。
『削除前 No.』として後から利用するためです。
④ 見出しを付けた次の行から最終行までを選択する。
⑤ [データ][重複の削除]のダイアログを表示させ『合体』以外の
チェックを外し[OK]を選択する。
⑥ ここまでで、散布図の「点」を利用するなら、No.でデータをソートするだけ
でOKですが、散布図の「線」の場合は、予期せぬ箇所が結ばれてしまうこと
があります。
そこで、結ばれな いように「No.」を空白行とし追加して対応します。
その前に VLOOKUP関数を使って「削除前 No.」と「削除後 No.」を比較
させ削除された No.をチェックし No. とデータを抽出します。
『削除された No.』は、次項 8-5 で使用しますので保存しておきます。
但し VLOOKUP関数 の処理時間は、かなり必要となります。
下図『 #NA 』が削除されたデータです。このデータを保存しておきます。
⑦ 予期せぬ箇所が結ばれないように必要な個所にデータ空白の行を挿入します。
方法としては、削除後の「No.」に着目し番号が連続しない箇所に空白行を
挿入します。
F 列の「No.」を B列の最後尾に追加し、全体を『No.』でソートして完了です。
因みに、挿入する No.は、ダブラないように「0.5」を加えてた ものとしてい
ます。
最後にこのやり方のデメリットを追記します。重複データが削除されるので「島」
「埠頭」などがクローズドループにならないことです。しかし、地図投影しても
拡大されないかぎり目立ちませんので活用してみてください。
< 実施データ削減例 > データソース元:国土交通省国土政策局{国土数値情報行政区域データ} |
|||
データ ソース | 都道府県 | 元ポイント数 |
重複削除後 ポイント数 |
N03-17_01_170101.shp | 北海道 | 1,415,786 | 1,012,694 |
N03-17_13_170101.shp | 東京 | 446,174 | 410,158 |
N03-17_14_170101.shp | 神奈川 | 187,242 | 144,991 |
あなたもジンドゥーで無料ホームページを。 無料新規登録は https://jp.jimdo.com から