Cách lọc dữ liệu trùng nhau giữa 2 cột trong Excel

Làm thể nào để lọc dữ liệu trùng nhau giữa 2 cột trong Excel, phục vụ cho việc xóa, highlight hoặc là tô màu các dữ liệu trùng lặp? Đây là vấn đề được rất nhiều bạn quan tâm và đặt câu hỏi cho chúng tôi. Vậy thì hãy cùng chúng tôi tìm ngay câu trả lời trong bài viết bên dưới nhé!

Giả sử rằng bạn có 2 cột tên người, trong đó có 5 tên ở cột A và 3 tên ở cột B. Bạn đang muốn so sánh dữ liệu giữa hai cột này từ đó tìm được các tên bị trùng lắp. Đây là một ví dụ đơn giản, nhưng trong các bảng tính thực, dữ liệu để so sánh này thường có hàng ngàn, hàng vạn mục. Vì vậy chúng ta cần có một hàm chuyên dụng để xử lí.

Trường hợp A: Nếu cả hai cột đều trong một trang tính và  cùng một bảng dữ liệu: Cột A và cột B.

Trường hợp B: Hai cột được đặt ở hai trang tính khác nhau: cột A trong Sheet2 và cột A trong Sheet3.

SO SÁNH HAI CỘT ĐỂ TÌM GIÁ TRỊ TRÙNG BẰNG CÔNG THỨC:

Trường hợp 1: Nếu cả hai cột cùng một danh sách, ta làm như sau:

Bước 1: Trong ô trống đầu tiên, tại ô C1, nhập công thức: =IF(ISERROR(MATCH(A1,$B$1:$B$10000,0)),”Unique”,”Duplicate”)

Trong công thức này, A1 là ô đầu tiên tại cột đầu tiên mà bạn muốn sử dụng để so sánh. Trong đó, $B$1 và $B$10000 là địa chỉ của ô đầu tiên và cuối cùng của cột thứ hai mà bạn đang muốn so sánh. Hãy chú ý việc cố định tham chiếu ô – ký hiệu đô la ($) trước các ký tự cột và số hàng. Hãy sử dụng tham chiếu tuyệt đối nhằm giữ nguyên địa chỉ ô khi sao chép công thức.

Nếu như bạn muốn tìm các giá trị trùng trong cột B, tiến hành hoán đổi tên cột như sau: =IF(ISERROR(MATCH(B1,$A$1:$A$10000,0)),”Unique”,”Duplicate”)

Thay vì “Unique”/”Duplicate” (duy nhất/trùng lắp), bạn có thể tự đặt nhãn cho mình, ví dụ như “Not found”/”Found” (Tìm thấy/Không tìm thấy) hoặc là “Duplicate” và gõ “” thay vì “Unique”. Trong cách thứ hai, bạn có một ô trống kế bên ô mà giá trị trùng lắp không được tìm thấy.

Bước 2: Còn bây giờ hãy sao chép công thức vào tất cả các ô của cột C cho đến hàng cuối cùng có chứa dữ liệu trong cột A. Để thực hiện được điều này, bạn đặt con trỏ vào góc dưới bên phải của ô С1, con trỏ lúc này sẽ chuyển thành một dấu thập phân đen như trong hình dưới đây:

Tiếp tục nhấn giữ chuột trái, thao tác kéo đường viền ô xuống để chọn tất cả các ô mà bạn muốn sao chép công thức vào. Khi tất cả các ô đã được chọn, hãy thả chuột trái:

Chú ý. Trong bảng lớn, sẽ có một cách nhanh hơn để sao chép công thức, đó là sử dụng phím tắt. Nhấp vào ô C1 để chọn nó rồi nhấn Ctrl + C (để sao chép công thức vào clipboard), tiếp tục nhấn Ctrl + Shift + End (để chọn tất cả những ô chứa dữ liệu trong cột C), cuối cùng, hãy nhấn Ctrl + V (để dán công thức vào tất cả ô tính đã chọn).

Bước 3: Tất cả những ô chứa giá trị trùng đều được đánh dấu là “Duplicate”.

Trường hợp B: Nếu hai cột nằm trên hai trang tính (bảng tính) khác nhau.

Bước 1: Trong ô đầu tiên của cột trống đầu tiên trong Sheet2 (cột B), bạn nhập công thức: =IF(ISERROR(MATCH(A1,Sheet3!$A$1:$A$10000,0)),””,”Duplicate”)

Sheet3! là tên trang tính có chứa cột thứ 2, $A$1:$A$10000 là địa chỉ của ô tính đầu tiên, ô tính cuối cùng trong cột thứ 2.

Bước 2: Tương tự như bước trong trường hợp A, chúng ta có kết quả sau đây:

Xem thêm: Hướng dẫn cách khôi phục file Excel chưa lưu

XỬ LÝ CÁC GIÁ TRỊ TRÙNG LẮP ĐƯỢC TÌM THẤY:

Ta đã tìm thấy những giá trị trong cột thứ nhất (cột A) cũng trùng so với cột thứ hai (cột B). Bây giờ bạn cần làm vài thứ với chúng.

Thật không hiệu quả và tốn thời gian nếu như phải tìm kiếm trên toàn bộ bảng và xem xét từng giá trị trùng lắp một cách thủ công. Sẽ có nhiều cách thực hiện ưu việt hơn để bạn làm việc này.

CHỈ HIỂN THỊ HÀNG BỊ TRÙNG TRONG CỘT A:

Nếu như cột của bạn không có tiêu đề, bạn sẽ cần thêm vào cho chúng. Để thực hiện được điều này, hãy đặt con trỏ chuột vào con số thứ tự đầu hàng (số 1), con chuột lúc này sẽ biển đổi thành mũi tên màu đen như trong hình bên dưới.

Sau đó, nhấp phải vào hàng được chọn và chọn Insert từ danh sách tùy chọn:

Tiếp đến, đặt tên cho cột, ví dụ “Name”, “Duplicate?”… rồi mở thẻ Data và nhấp chọn Filter:

Sau khi đã nhấp chuột vào mũi tên nhỏ màu xám kế bên “Duplicate?” để thực hiện mở danh sách tùy chọn, hãy bỏ chọn tất cả các mục ngoại trừ Duplicate trong danh sách đó rồi nhấn OK:

Như vậy lúc này bạn chỉ thấy những ô tính trong cột A có chứa giá trị trùng lắp với cột B. Và có 3 ô tính như vậy trong trang tính ví dụ.

Để hiển thị được tất cả các hàng trong cột A lần nữa, hãy nhấp vào biểu tượng filter trong cột B, sau đó chọn Select All. Hoặc là bạn có thể vào thẻ Data > Select & Filter > Clear như trong hình bên dưới:

 

TÔ MÀU HOẶC HIGHLIGHT NHỮNG GIÁ TRỊ TRÙNG TÌM THẤY:

Ngoài gắn nhãn “Duplicate”, bạn cũng có thể thực hiện đánh dấu vào các giá trị trùng bằng một cách khác như là định dạng màu chữ hoặc bôi màu nó.

Thực hiện lọc các giá trị trùng lặp như giải thích ở trên, bạn chọn các ô tính đã lọc và nhấn Ctrl + F1 để mở hộp thoại Format Cells. Ví dụ như việc hãy thay đổi màu nền của các hàng bị trùng sang màu vàng tươi. Tất nhiên, bạn cũng có thể thay đổi màu nền của các ô này bằng cách dùng tùy chọn Fill color trên thẻ Home, nhưng ưu thế của hộp thoại Format Cells đó chính là nó cho phép bạn thực hiện tất cả các thay đổi định dạng cùng lúc.

Bây giờ thì bạn sẽ không bỏ sót bất kỳ ô chứa giá trị trùng nào.

LOẠI BỎ GIÁ TRỊ TRÙNG LẶP TỪ CỘT ĐẦU TIÊN:

Thực hiện lọc bảng dữ liệu để hiển thị các giá trị trùng lặp, chọn tất cả những ô đó.

Nếu như hai cột được so sánh nằm trên hai trang tính khác nhau, cụ thể là trong hai bảng dữ liệu riêng biệt, bạn hãy nhấp phải vào vùng dữ liệu được chọn và nhấp chọn Delete Row từ danh sách tùy chọn.

Khi Excel yêu cầu bạn thực hiện xác nhận bạn có thật sự muốn xóa toàn bộ hàng này không, hãy nhấn OK và bỏ bộ lọc. Như vậy thì chỉ những hàng chứa các giá trị duy nhất được hiển thị:

Nếu như có hai cột nằm trên cùng một trang tính, hai cột liền kề hoặc là không liền kề thì việc xóa các giá trị trùng lắp sẽ trở nên khá là phức tạp. Lúc này, bạn không thể xóa toàn bộ hàng chứa chúng bởi vì như vậy sẽ xóa đi các ô tương ứng trong cột 2. Vì thế, để có thể hiển thị những giá trị duy nhất trong cột A, bạn hãy thực hiện theo các bước sau:

Bước 1: Tiến hành lọc bảng để các giá trị trùng lặp được hiển thị, rồi chọn tất cả những ô đó. Bạn nhấp phải vào vùng được chọn và chọn Clear Contents.

Bước 2: Bỏ bộ lọc.

Bước 3: Thao tác chọn tất cả ô tính trong cột A bắt đầu từ ô A1 đến ô cuối cùng có chứa dữ liệu.

Bước 4: Tiến hành di chuyển đến thẻ Data, rồi nhấp chọn Sort A to Z. Trong hộp thoại mở ra, hãy chọn Continue with the current selection và nhấn Sort.

Bước 5: Xóa cột chứa công thức, chỉ để lại “Uniques”

Bước 6: Như vậy, cột A chỉ còn những dữ liệu không bị trùng lặp trong cột B.

Vậy là bạn đã thực hiện xong việc lọc dữ liệu trùng nhau giữa 2 cột trong Excel rồi đấy, đừng quên theo dõi thêm nhiều thông tin bổ ích về tin học của chúng tôi nhé!

Xem thêm: Hướng dẫn cách lấy lại file Excel bị lưu đè

Tin tức liên quan

Gửi bình luận

Email của bạn sẽ không được hiển thị công khai.