Lỗi trùng lặp nội dung website – Điều doanh nghiệp cần tránh

Khi thực hiện một dự án website, một trong những điều mà tôi đảm bảo với các khách hàng đó là website của họ sẽ không bị lỗi trùng lặp nội dung (Duplicate Content). Chính vì vậy, tôi đưa ra khá nhiều tiêu chuẩn cho những bạn tham gia nhóm viết bài Content Marketing của BC Media và phần lớn các bạn không hiểu và cũng không tuân thủ đúng theo yêu cầu, khiến cho việc biên tập bài, chỉnh sửa sau đó chiếm nhiều thời gian. Vậy lỗi trùng lặp nội dung website là gì và tác hại ra sao?

I – Lỗi trùng lặp nội dung website là gì?

Lỗi trùng lặp nội dung sảy ra khi có nhiều hơn hai địa chỉ url (đường dẫn của website) chứa cùng một nội dung bài viết. Bao gồm cả giống nhau về cách thức sử dụng từ ngữ, đoạn văn, câu văn, và cách trình bày.

Lỗi trùng lặp nội dung không chỉ xảy ra giữa website A và website B mà còn xảy ra trên cùng một website, chính vì vậy mà tôi dùng cụm từ “địa chỉ url” – điều này có thể gây khó hiểu cho một số bạn. Ví dụ tôi có hai địa chỉ url sau trên cùng website: tmcuong.com

http://tmcuong.com/huong-dan-quay-phim-cuoi-phong-su-phan-1/

http://tmcuong.com/huong-dan-quay-phim-cuoi-phong-su-phan-2/

Nếu hai bài viết trên có nội dung giống nhau thì vẫn gọi là “lỗi trùng lặp nội dung”

***

II – Có bao nhiêu loại trùng lặp nội dung?

Có những lỗi trùng lặp nội dung được phân loại thành 03 dạng như sau:

Trùng lặp nội dung hoàn toàn: bài viết giống nhau 100%. Xảy ra khi bạn copy hoàn toàn một bài viết của người khác.

Trùng lặp nội dung phần lớn: Bài viết được bạn copy và chỉnh sửa một số chỗ. Ví dụ, tiêu đề hay một vài từ ngữ trong đoạn văn, câu văn.

Trùng lặp nội dung một phần: Bài viết này sử dụng một phần nội dung của bài viết kia, và tự phát triển thêm (tự viết).

***

TMC-08-Lỗi-trùng-lặp-nội-dung-website-điều-doanh-nghiệp-cần-tránh-01

III – Trùng lặp nội dung có tác hại gì?

Trong thời đại hiện nay, nhu cầu tìm hiểu thông tin, kiến thức của chúng ta (user) phụ thuộc rất lớn vào các công cụ tìm kiếm (Search Engine). Khi lỗi trùng lặp nội dung sảy ra trên website sẽ dẫn đến các tác hại sau:

01. Bạn bỏ rất nhiều thời gian để viết một bài blog rất hay, thú vị. Ví dụ: Những địa điểm chụp ảnh cưới tuyệt đẹp tại TPHCM. Sau đó một người khác copy bài viết của bạn về và đăng trên website của họ, và 8 người khác cũng hành động tương tự. Vậy khi user tìm kiếm về chủ đề “địa điểm chụp ảnh cưới” trên mạng, nếu kết quả xuất hiện 10 bài cùng một nội dung thì sẽ tạo cảm giác rất “chán nản” cho user, và tức tối cho tác giả của bài viết. Google có một thuật ngữ là “trải nghiệm của người dùng” và trong trường hợp này có thể nói là “trải nghiệm của người dùng không tốt” đó là điều mà Google đang ngày càng hoàn thiện.

02. Do tài nguyên của Google cũng có hạn, việc xuất hiện nhiều kết quả của một bài viết vừa không tốt cho trải nghiệm người dùng, vừa mất không gian để lưu trữ. Vì vậy, Google sẽ gom các kết quả trùng lặp nội dung về thành một “cụm”, và sẽ tự động chọn kết quả theo Google là tốt nhất để xuất hiện khi có người tìm kiếm nhằm làm tăng “trải nghiệm người dùng”. Bởi chúng ta khi tìm kiếm cũng muốn được nhìn thấy những kết quả đa dạng khác nhau và tự chọn bài viết yêu thích để đọc.

03. Việc một website copy nội dung trên một website khác để đăng trên website của mình về mặt cơ bản có thể đánh giá ngay đó là “hành động không đúng đắn, không hợp pháp” và có thể gọi đó là hành động ăn cắp chất xám, ăn cắp ý tưởng. Nếu Google đánh giá website của bạn là một website “chuyên đi copy” thì có thể dẫn đến việc loại bỏ hoàn toàn kết quả của website đó trên công cụ tìm kiếm. Nếu rơi vào trường hợp này, thì chỉ những khách hàng nào thuộc lòng tên website và gõ vào thanh địa chỉ mới có thể truy cập được. Khi tình huống trên xảy ra, chỉ có một cách xử lý nhanh và đơn giản đó là bỏ luôn website đó, mua một tên miền mới và làm lại từ đầu. Nếu bạn làm kinh doanh hoặc doanh nghiệp thì đây có thể xem như là một bản án tử hình đối với thương hiệu trên internet.

Như vậy, các bạn đã hiểu rõ nguyên nhân vì sao mà tôi kiểm tra rất kỹ, hoặc làm khó đối với các bài viết không đúng tiêu chuẩn.

***

IV – Các cách để kiểm tra trùng lặp nội dung?

Một số cách thức sau đây có thể giúp bạn tìm kiếm ra “thủ phạm” copy bài viết của bạn.

Google.com: Thực hiện tìm kiếm với một cụm từ, một câu văn, hoặc đoạn văn. Hạn chế đối với các văn bản dài.

Duplichecker.com: Có thể thực hiện tìm kiếm với văn bản 1500 từ hoặc đường dẫn website, sau khi tạo tài khoản có thể thực hiện 50 lượt tìm kiếm mỗi ngày.

Plagiarisma.net: Cách thức sử dụng tương tự công cụ duplichecker

Copyscape.com: nhập đường dẫn website của bạn, chọn nút Go và chờ trong ít phút là bạn có thể biết được có những website nào đang copy bài viết của bạn.

Ngoài ra, có thể kiểm tra trùng lặp nội dung bằng articlechecker.com, webseoanalytics.com hoặc Google Webmaster Tools

Chúc các bạn thành công với việc viết bài, tránh được lỗi trùng lặp nội dung, và sớm phát hiện ra những website “ăn cắp” chất xám của bạn.

TMCUONG
Film Maker | Photographer | Marketer