今回は、Excelの重複削除で名簿整理を進める方法を紹介します。
重複削除は同じデータを整理する機能
Excelで名簿、顧客リスト、参加者一覧、取引先一覧を管理していると、同じ人や同じ会社が複数回登録されることがあります。入力担当が複数いたり、別のファイルを結合したりすると、重複が混ざりやすくなります。
重複削除を使うと、指定した列を基準に同じデータを取り除けます。名簿整理では便利ですが、使い方を誤ると必要な行まで削除してしまうことがあります。
重複削除で大切なのは、何をもって同じデータと判断するかを決めることです。氏名だけで判断するのか、メールアドレスや会員番号も含めるのかで結果が変わります。
削除前にバックアップを残す
重複削除は、対象の行を実際に削除します。元に戻せる場合もありますが、保存後に気づくと復旧が難しくなることがあります。
作業前には、元データを別シートや別ファイルにコピーしておきます。特に顧客情報や申込情報など、再取得が難しいデータでは必ず元の状態を残します。
バックアップのファイル名には、作業日や「削除前」などを入れておくと分かりやすくなります。作業後に削除結果を確認し、問題がなければ整理済みデータとして保存します。
基準にする列を決める
重複削除では、どの列を見て重複と判断するかを選べます。名簿の場合、氏名だけでは同姓同名を誤って削除する可能性があります。会社名だけでも、同じ会社の別担当者を消してしまうことがあります。
基準にしやすい列は次のとおりです。
- 会員番号や管理番号
- メールアドレス
- 電話番号
- 氏名と生年月日の組み合わせ
- 会社名と担当者名の組み合わせ
一意に近い情報があるなら、それを基準にします。基準が弱い場合は、複数列を組み合わせて判断します。
表記ゆれを整えてから削除する
重複削除は、セルの内容が一致しているかを見ます。そのため、表記ゆれがあると同じデータでも別扱いになります。
たとえば、「株式会社サンプル」と「(株)サンプル」、「山田
太郎」と「山田太郎」、全角英数字と半角英数字が混在している場合、重複として認識されないことがあります。
削除前に、会社名、氏名、メールアドレスなどの表記を整えます。余分なスペースを削除し、全角半角をそろえ、略称の扱いを決めます。関数や検索置換を使って整理してから重複削除を行うと、結果を確認しやすくなります。
空白の扱いに注意する
重複削除では、空白セルも判断に影響します。基準列が空白の行が複数あると、それらが重複と判断されることがあります。
名簿でメールアドレスを基準にする場合、メールアドレスが未入力の人が複数いると、同じ空白として扱われる可能性があります。未入力が多い列だけを基準にするのは避けます。
空白が多い場合は、先に未入力行を確認し、別の基準列と組み合わせます。必要に応じて、未入力の行を別に抽出して確認してから削除します。
削除ではなく抽出で確認する方法もある
重複をすぐ削除するのが不安な場合は、条件付き書式や関数で重複を表示し、目で確認してから整理する方法があります。
メールアドレスの重複に色を付ければ、どの行が重なっているか確認できます。重複している行のうち、どちらを残すべきか判断が必要な場合に向いています。
たとえば、同じ人の情報でも、片方には住所があり、もう片方には電話番号が入っていることがあります。この場合、単純に削除するより、情報を統合してから片方を削除するほうがよいです。
残す行のルールを決める
重複削除では、同じと判断された行のうち、基本的には先にある行が残ります。そのため、並び順が結果に影響します。
最新の情報を残したいなら、更新日が新しい順に並べ替えてから重複削除します。受付番号が若いものを残したいなら、その順に並べます。情報量が多い行を残したい場合は、事前確認が必要です。
作業前に「どの行を残すか」のルールを決めておくと、削除後の確認がしやすくなります。名簿では、最新情報、正式登録情報、管理番号付きの情報を優先することが多いです。
整理後は件数と内容を確認する
重複削除を実行したら、削除件数だけで判断せず、残ったデータを確認します。代表的な行をいくつか見て、必要な情報が消えていないか確認します。
削除前後の件数をメモしておくと、作業結果を説明しやすくなります。ただし、統計的な説明ではなく、作業確認としての件数管理です。業務上の記録が必要な場合は、作業日、担当者、基準列も残しておくと引き継ぎやすくなります。
まとめ
Excelの重複削除は、名簿や顧客リストの整理に役立つ機能です。会員番号、メールアドレス、氏名と別情報の組み合わせなど、重複判定の基準を決めて使います。
作業前にはバックアップを残し、表記ゆれや空白を確認します。すぐ削除せず、条件付き書式などで重複を確認してから整理する方法もあります。
重複削除で大切なのは、削除することより正しい行を残すことです。残す行のルールを決め、作業後に内容を確認してから整理済みデータとして使いましょう。