Nội dung trùng lặp (duplicate content) là gì

Nội dung trùng lặp (duplicate content) là gì?

SEO Sửa lỗi wordpress

Nội dung trùng lặp hay còn gọi là Duplicate content được xem là một trong những vấn đề đáng sợ nhất đối với các nhà làm web, các blogger hay những người làm marketing với website. Hầu như 100% các công cụ tìm kiếm từ yahoo đến Google search đều sẽ phạt nếu trang web của bạn bị lỗi nội dung trùng lặp. Bài viết này chúng ta sẽ cùng thảo luận chuyên sâu hơn về các lỗi nội dung trùng lặp và cách khắc phục.

Duplicate content là gì?

Dịch nghĩa ra là nội dung trùng lặp, chỉ những nội dung hoàn toàn giống nhau trên những URL khác nhau. Điều này xảy ra khi bạn bị lỗi plugin hoặc cấu hình không đúng, cũng có thể là do bạn cố tình làm điều đó…

Ví dụ : Trên một trang thương mại điện tử có sản phẩm điện thoại nokia, khi khách hàng click vào sản phẩm họ sẽ thấy rằng có các phiên bản màu sắc khác nhau như màu trắng và màu xanh. Tuy nhiên với công cụ quét của Google search thì dù là màu xanh hay trắng thì cũng chỉ là điện thoại nokia mà thôi, trên cơ bản bot không thể phân biệt được điều này. Và bạn sẽ bị phạt vì lỗi nội dung trùng lặp, chính vì thế bạn cần có một kế hoạch khắc phục điều này.

Nội dung trùng lặp ngoài trang web

Nội dung trùng lặp ngoài trang web — nội dung giống hệt nhau tồn tại trên các trang web khác nhau — có thể khó phát hiện hơn.

Để đảm bảo bạn không đăng nội dung đã tồn tại trên một trang web khác, hãy thử sử dụng công cụ đạo văn trước khi xuất bản để đảm bảo không có nội dung blog nào của bạn bị đạo văn. Điều này đặc biệt quan trọng nếu bạn đang làm việc với các nhà văn thuê ngoài hoặc các thành viên nhóm mới có thể không nhận thức được tầm quan trọng của nội dung gốc.

Xem thêm  Link rút gọn dịch vụ Affiliate ảnh hưởng đến SEO website của bạn không?

Bạn cũng có thể sử dụng công cụ đạo văn để xem liệu các trang web khác có sao chép nội dung của bạn hay không. Các công cụ trả phí như Copyscape quét web để tìm các trường hợp nội dung được sao chép từ trang web của bạn. Loại nội dung trùng lặp ngoài trang web này khó sửa chữa hơn, mặc dù bạn có thể thử liên hệ với người quản lý của trang web và yêu cầu họ sửa nó. Nếu điều đó không hiệu quả, hãy đọc tiếp để biết một cách khác để đối phó với nội dung được sao chép.

Vì sao Nội dung trùng lặp được xem là một lỗi đáng bị phạt?

Lý do đơn giản vì nội dung và cơ sở hạ tầng internet là có giới hạn, các công cụ tìm kiếm luôn phải sử dụng tài nguyên của mình để cung cấp cho khách hàng nội dung chất lượng và tốt nhất. Chính vì thế những nội dung giống nhau nên được lược bỏ với mục tiêu một môi trường internet độc nhất là duy nhất cho mỗi câu hỏi và trả lời, điều này cũng thúc đẩy tính chính xác cho từng câu hỏi và câu trả lời với mục đích thông tin.

Nội dung trùng lặp gây rất nhiều rắc rối cho bộ máy tìm kiếm, tốn tài nguyên của họ, chính vì thế bất kỳ nội dung trùng lặp nào nếu không đáp ứng được các yêu cầu cơ bản đều sẽ bị phạt.

Cách khắc phục tốt nhất của nội dung trùng lặp là xóa đi hay viết lại?

Câu trả lời là cả 2, mỗi cách đều có ưu điểm nhược điểm riêng. Tuy nhiên điều tốt nhất khi bạn bị lỗi nội dung trùng lặp là thông báo cho các bot của công cụ tìm kiếm rằng đâu là trang chính, các trang còn lại không nên được lặp chỉ mục. Hiện nay Google cũng đã có cách khắc phục cho tình trạng này bằng cách xác định URL chính tắc, nghĩa là bạn cần thông báo cho Google search xem đâu là URL đúng lớn nhất và chính xác nhất mà bạn muốn nó được lặp chỉ mục với thẻ Canonical.

Xem thêm  Chuyển hướng 301 - cách redirect link để SEO tốt hơn

Cách phát hiện nội dung trùng lặp

Để phát hiện trang web của bạn có bị dính lỗi Duplicate content hay không bạn cần có một số công cụ để check. Công cụ tốt nhất mình tìm được miễn phí trên mạng bạn có thể sử dụng online hơn nữa còn miễn phí là Siteliner.com

Đây là website giúp bạn kiểm tra website nội bộ có bao nhiêu nội dung trùng lặp để bạn có thể tìm cách khắc phục.

Chỉ cần nhập url website của bạn vào khung trang chủ và scan, bạn sẽ thấy phần nội dung bị duplicate được hiển thị rõ ràng

cách kiểm tra duplicate content

Các cách khắc phục lỗi duplicate content

Nếu như bài viết hoặc trang nội dung đó có nội dung mỏng, không ai xem hoặc link nội bộ cũng không tốt. Bạn nên xóa đi và bỏ thành một trang trống 404. Chúng ta sẽ khắc phục trangg 404 bằng cách đưa nội dung khách truy cập về trang chủ để SEO tốt hơn.

Khắc phục lỗi 404 trên website wordpress một lần và mãi mãi full SEO

Chuyển bài viết có nội dung trùng lặp về trang chính xác nhất, điều này có thể khiến cho các công cụ tìm kiếm xác định được đâu là nội dung chính mà chúng ta có thể được lập chỉ mục và đánh giá từ đó loại bỏ bạn khỏi các án phạt có thể xảy ra.

  • Rel=”canonical”
Xem thêm  Sửa lỗi ảnh không hiển thị sau khi Backup website 2022

Các rel = canonical chỉ cho các bot biết đâu là trang chính xác, đây được xem là cách tốt nhất để bạn xác định trang đúng cho nội dung.

  • Meta Robots Tag

Cách này giúp điều hướng khả năng tìm kiếm thông tin của bots tại trang, khi đó bots sẽ không index trang này hoặc các liên kết trong đó. Cách này được khá nhiều công ty SEO áp dụng và làm cho trang thân thiện hơn với Search Engine.

  • Robot.txt

Nếu bạn có một url nội dung trùng lặp trong website, bạn có thể thêm vào tệp Robot.txt một lệnh ngăn không cho lập chỉ mục bằng Disavow

  • Noindex

Đây là cách thêm một thẻ có tên là noindex vào bài viết hoặc link cụ thể, bot search sẽ biết đây là một link, một url nên được loại bỏ hoàn toàn và không được phép lập chỉ mục.

Cách này sử dụng khá phổ biến trên các trang web lớn, thế nhưng bạn cần lưu ý là nếu sử dụng lệnh Disavow trong Robot.txt thì không được dùng noindex. Nguyên nhân vì bot không được đọc link đó bởi lệnh Disavow thì nó cũng không thể tìm được thẻ noindex, bạn không cho nó đọc sao nó thấy được. Mà không thấy thì bot sẽ không loại URL đó ra khỏi công cụ tìm kiếm, đây là một mâu thuẫn thuật toán bạn nên chú ý.

Đăng ký thành viên V.I.P Miễn phí

Khi là thành viên VIP của chúng tôi bạn sẽ được quyền tải xuống miễn phí Bộ tài liệu Marketing Online độc quyền!

Đây là bộ tài liệu chọn lọc từ hơn 88 bài viết chuyên nghiệp về Marketing online – SEO được xuất bản từ các đơn vị, công ty, Agency, Influencer…có tiếng trong lĩnh vực! 

Tải xuống ngay! Ưu đãi Độc quyền

tai-lieu-SEO-marketing

Trả lời

Email của bạn sẽ không được hiển thị công khai.