Thẻ Canonical là gì?

Đều gì xảy ra nếu bạn rel=canonical đến một URL với rel=canonical đến một URL khác, hoặc bạn rel=canonical đến một URL mà 301-redirect đến URL khác? Nó sẽ rất phức tạp. Trong nhiều trường hợp, nó có thể hiệu quả và thậm chí có thể vượt PageRank. Nói chung, tuỳ vậy, đó là ý tưởng tồi. Đỡ thì nó chỉ cẩu thả. Tồi nhất là nó không có tác dụng gì, hoặc bạn có thể mất PageRank qua chuỗi mắt xích. Hãy cố gắng tránh những chuỗi mắt xích và thực hiện rel=canonical đơn lẻ.

Mục lục

Thẻ Canonical là gì

Đã quá 4 năm kể  từ tháng 2/2009 từ khi Google và Yahoo công bố hỗ trợ thẻ rel=canonical, và dòng HTML đó vẫn gây ra rất nhiều phức tạp với các SEOer và các quản trị website. Gần đây, Google đăng 5 sai lầm chung với rel=canonical – đó là một bài viết tốt và gợi rất nhiều sự minh bạch, nhưng đó không giải quyết nhiều câu hỏi chúng ta gặp hàng ngày trong Q&A. Vì thế tôi nghĩ đó là lúc tốt để giải quyết một số câu hỏi phổ biến nhất

Rel=Canonical là gì?

Đơn giản là thẻ rel=canonical là cách nói với Google rằng một URL tương tự với một URL khác vì mục đích tìm kiếm. Cụ thể là URL (B) là một trùng lặp với URL (A) và thẻ canonical chỉ đến (A). Thẻ sau sẽ xuất hiện trên trang sinh ra URL (B), trong thẻ

Tài liệu hỗ trợ của Google về rel=canonical rất tốt. Chủ đề về nội dung trùng lặp rất phức tạp, và tôi đã chỉ ra trước đó một cách chi tiết. Với bài viết này, tôi sẽ bỏ qua một bên và giả định rằng bạn có hiểu biết về SEO kỹ thuật và cố gắng dùng rel=canonical trên trang web của bạn.

Ghi chú: Thẻ Rel=canonical cũng được nhắc đến như “rel-canonical” và “thẻ canonical”. Với bài viết này, tôi sẽ nhắc đến nó thống nhất là “rel=canonical”.

1. Tôi có nên dùng Rel=Canonical cho việc phân trang?

Tôi sẽ không nhắc lại tất cả câu trả lời của Google, nhưng đây là câu hỏi thường gặp đáng được đi vào chi tiết hơn. Thử nghĩ bạn có một loạt kết quả tìm kiếm phân trang (1,2,3 … n). Đó có thể bị coi là “mỏng”, từ một điểm tìm kiếm, vì thế bạn có nên dùng rel=canonical trang n trở lại trang 1?

Câu trả lời chính thức là “không” – Google không khuyến khích việc này. Họ khuyến khích bạn dùng rel=canonical đến trang “View All” hoặc bạn sử dụng rel=prev/next . Rel=canonical có thể sử dụng kết hợp với rel=prev/next để xử lý việc sắp xếp, lọc tìm kiếm, v.v. nhưng nó sẽ dẫn đến phức tạp hoá.

Phân trang với SEO là chủ đề phức tạp, và tôi khuyên bạn nên tham khảo 2 nguồn sau:

  • Conquering Pagination – A Guide to Consolidating your Content
  • The Latest & Greatest On SEO Pagination

2. Tôi có thể dùng Rel=Canonical Cross-domain?

Có – Cuối năm 2009, Google công bố hỗ trợ ho việc sử dụng cross-domain use of rel=canonical. Điều này đặc biệt dành cho nội dung cung cấp thông tin, khi bạn lo ngại về sự trùng lặp và chỉ muốn 1 phiên bản nội dung được quyền xếp hạng.

3. Tôi có nên dùng Rel=Canonical cho Cross-Domain?

Câu hỏi này khó hơn. Trước hết, Google có thể chọn bỏ qua việc sử dụng cross-domain của rel=canonical nếu các trang có vẻ quá khác hoặc nó có vẻ lôi cuốn. Việc sử dụng cross-domain rel=canonical lý tưởng sẽ là tình huống khi nhiều site sở hữu bởi cùng một cá thể chia sẻ nội dung, và nội dung đó hữu ích cho người dùng của từng trang web riêng biệt. Trong trường hợp đó, bạn có thể không muốn sử dụng điều hướng 301 (nó có thể làm khó người dùng và tổn hại đến từng thương hiệu riêng), nhưng bạn có thể muốn tránh các vấn đề nội dung trùng lặp và kiểm soát những thuộc tính Google hiển thị trên kết quả tìm kiếm. Tôi không thường sử dụng rel=canonical cross-domain nếu chỉ để củng cố PageRank.

 4. Tôi có nên dùng Rel=Canonical trên Near Duplicates?

Như thí nghiệm catastrophic canonicalization và các thí nghiệp theo sau đó cho biết, Google đề cao rel=canonical trên các trang rất khác nhau, trong nhiều trường hợp. Điều đó không có nghĩa là đây là một ý tưởng hay. Nói chung, tôi nghĩ tốt nhất nên dành rel=canonical cho nội dung trùng lặp hoặc gần trùng lặp. Ví dụ, nếu các trang của một sản phẩm tạo thành 5 URL cho 5 màu khác nhau, mỗi trang màu chỉ khác biệt bằng 1-2 câu, hoặc 1 tấm ảnh, và vâng, tôi nghĩ rất ổn để rel=canonical cho trang sản phẩm “mẹ”.

Đừng dùng rel=canonical thay cho 301-redirects và/hoặc 404. Dù nó không gây ra biến động lớn, tôi rất nghi ngờ rằng Google bắt đầu bỏ qua thẻ canonical và điều đó có thể ảnh hưởng đến việc bạn kiểm soát những nội dung trùng lặp hợp pháp.

5. Tôi có thể đặt Rel=Canonical vào trang canonical?

Nói cách khác, việc đặt thẻ rel=canonical vào bản canonical của URL, rồi trỏ lại chính nó có được hay không? Nói thực là có – nhưng bạn không cần. Đã có những ám thị rằng cả Google và Bing sẽ dễ chịu hơn nếu bạn không lạm dụng rel=canonical. Qua thời gian, lập trường đó có vẻ mềm hơn, tôi không thấy bằng chứng nào trong lịch sử việc sử dụng canonical hợp lý và tự tham chiếu gây ra thiệt hại gì.

Đó thường chỉ là một vấn đề thực tiễn – nhiều URL chia sẻ cùng template, và mã nguồn cần thiết để hiển thị một thẻ rel=canonical trên chỉ các nội dung trùng lặp và không phải bản canonical của một trang có thể gây lộn xộn và tăng nguy cơ mắc sai lầm. Về cá nhân, tôi tin rằng các máy tìm kiếm nhận ra thực tế mà hầu hết các quản trị web đối mặt và điều chỉnh lập trường ban đầu bảo thủ của họ.

6. Sẽ ổn không nếu đặt Rel=Canonical trên toàn bộ trang web?

Bạn có nên đánh phủ đầu rel=canonical toàn bộ trang web của bạn – ngay cả khi nhiều trang không chủ đích cho vấn đề nội dung trùng lặp? Tôi nghĩ đó có vẻ rất lý thuyết. Chúng tôi đã gợi ý cách làm này tại SEOmoz và tôi nghĩ nói chung là an toàn. Tôi chỉ lo lắng rằng việc sử dụng quá nhiều rel=canonical có thể khiến các máy tìm kiếm hạ giá và thậm chí phớt lờ những thẻ này, nhưng tôi không thể chỉ ra bằng chứng rõ ràng nếu nó xảy ra. Tôi cũng lo rằng người ta thường tiến hành rel=canonical trên toàn trang một cách tồi và kết quả là chỉ chúng đến các trang sai.

Tôi nghĩ rằng một rel=canonical phủ đầu trên trang chủ của bạn là ý tưởng hay, vì các trang chủ hướng đến các URL khác nhau. Một cách hoàn hảo, tôi sẽ nói sử dụng rel=canonical trên trang chủ, các trùng lặp biết đến và bất cứ trang nào với các tham số có thể dẫn đến nội dung trùng lặp, và chừa ra phần còn lại. Tuy nhiên, đó thường là quy trình rất khó. Trong nhiều trường hợp, thực hiện rel=canonical toàn trang sẽ tốt hơn là không kiểm soát index.

7. Tôi nên dùng Use Rel=Canonical hay 301 Redirects?

Hãy hiểu rằng dù 2 cách làm có vẻ tác động như nhau, đứng trên quan điểm SEO, chúng không thể thay thế cho nhau. Sự khác nhau quan trọng – một điều hướng 301 đưa người dùng đến URL hợp quy, trong khi một rel=canonical không thế. Thường thì chỉ 1 trong những cách này là đúng cho khách truy cập. Nếu bạn thực sự muốn vĩnh viễn nhập 2 trang và loại bỏ trùng lặp, hãy sử dụng điều hướng 301. Nếu bạn muốn giữ cả 2 trang cho người dùng, nhưng chỉ một trang xuất hiện trên kết quả tìm kiếm, hãy sử dụng rel=canonical.

8. Rel=Canonical có thể vượt Authority/PageRank?

Rất khó để đo, nhưng nếu bạn dùng rel=canonical hợp lý, và nếu Google ghi nhận, nó sẽ thực hiện tương tự như điều hướng 301. Chúng tôi nghi ngờ nó vượt authority/PageRank cho các liên kết đến URL non-canonical, với một vài mất mát (tương tự như 301)

9. Tôi có thể chắp nối các Rel=Canonicals (+301s, 302s, etc.)?

Đều gì xảy ra nếu bạn rel=canonical đến một URL với rel=canonical đến một URL khác, hoặc bạn rel=canonical đến một URL mà 301-redirect đến URL khác? Nó sẽ rất phức tạp. Trong nhiều trường hợp, nó có thể hiệu quả và thậm chí có thể vượt PageRank. Nói chung, tuỳ vậy, đó là ý tưởng tồi. Đỡ thì nó chỉ cẩu thả. Tồi nhất là nó không có tác dụng gì, hoặc bạn có thể mất PageRank qua chuỗi mắt xích. Hãy cố gắng tránh những chuỗi mắt xích và thực hiện rel=canonical đơn lẻ.

10. Các trang Non-Canonical có được lập chỉ mục?

Với tất cả các mục đích thực tiễn là không. Nếu Google đề cao một thẻ rel=canonical, vì thế trang không canonical không hợp pháp để xếp hạng. Đó không có một bản cache duy nhất, và nó không xuất hiện trên chỉ mục công khai qua một tìm kiếm “site:” . Giờ đây, Google có còn giữ một bản ghi của URL không canonical? Tôi giả định là họ có. Tuy nhiên, nếu là SEO, URL không canonical sẽ biến mất trong bất cứ con đường nào.

11. Người khác có thể Rel=Canonical trang của tôi?

Tôi đã thấy nhiều người lo lắng về việc người khác sử dụng rel=canonical, đặc biệt qua cross-domain để làm hại một site hoặc ăn cắp uỷ quyền của site đó. Ghi nhớ rằng bạn chỉ có thể được quyền canonical từ các trang bạn kiểm soát. Vì thế, bạn có thể rel=canonical tất cả các trang của bạn tới một site của một ai đó khác, nhưng người ta làm thế để làm gì? Để có thể tàn phá được, ai đó sẽ phải tấn công vào site của bạn. Nếu việc đó xảy ra, lạm dụng rel=canonical sẽ là vấn đề nhỏ nhất của bạn. Những vấn đề lớn hơn bởi rel=canonical là tự nó gây ra.

12. Tôi có thể có miếng bánh của tôi và vừa có thể ăn nó?

Không. Tôi biết, bạn không muốn nghe. Ít nhất một phần ba các câu hỏi chúng tôi có được về rel=canonical đều quay quanh “tôi muốn tất cả các trang đó xếp hạng, và chúng giống nhau, nhưng tôi không muốn gặp rắc rối với nội dung trùng lặp!” Tôi không có gia vị bí mật nào cho món này.

Bạn không phải dùng rel=canonical, nhưng theo kinh nghiệm của tôi, việc kiểm soát nội dung trùng lặp của chính bạn tốt hơn là để Google thay bạn làm việc đó, và cuối cùng nếu họ buộc phải làm cho bạn. Trước kia, đó có thể chỉ nghĩa là một trang sai không được lọc. Tuy nhiên, sau hơn 25 lần cập nhật Panda, việc đó có thể có nghĩa là toàn bộ site chịu ảnh hưởng. Bạn không thể có cả hai – nếu bạn có nội dung trùng lặp, hãy gỡ bỏ, kiểm soát và cải thiện nó.

Bạn có câu hỏi nào không?

Nếu bạn có câu hỏi chung nào về thẻ canonical và cách dùng, hãy để lại bình luận và tôi cố gắng giải quyết chúng. Hãy hiểu rằng tôi không thể đào sâu vào site của bạn và cung cấp dịch vụ tư vấn, nhưng nếu bạn có thể hỏi theo cách chung chung sẽ giúp ích cho cả những người khác, tôi sẽ cố hết sức để trả lời.

Henry Hoàng
Henry Hoàng
Chuyên gia SEO Henry Hoàng. Có nhiều năm kinh nghiệm trong lĩnh vực seo, cải thiện % CTR cho website, nhằm tăng tỉ lệ chuyển đổi. Phân tích đánh giá độ cạnh tranh từ khóa, từ đó đưa ra định hướng SEO phù hợp. Xem thêm
FollowAction (12622) - LikeAction (12822) - WriteAction (900)