Thẻ Canonical là công cụ giúp Google hiểu được đâu là url chính tắc và xếp hạng cho URL đó. Vậy thẻ Canonical là gì? Khi nào mới cần sử dụng chúng? Làm thế nào để thiết lập Canonical URL? Ngoài ra còn có hàng chục câu hỏi khác liên quan đến canonical. Hãy theo dõi bài viết dưới đây của Lagital.Com để tìm câu trả lời cho những thắc mắc trên nhé.
Canonical URL là gì?
“Canonical URL” hay “canonical link” là đường link chính thức, đại diện do bản chính của một webpage trong trường hợp xuất hiện nhiều URL có nội dung giống hệt nhau. Google đã Việt hóa “canonical URL” gọi là “URL chính tắc”.
Nếu một trang web được đánh dấu là canonical URL, công cụ tìm kiếm sẽ chỉ đưa trang đó xuất hiện ở bảng kết quả tìm kiếm, chứ không phải các trang còn lại.
Nói một cách đơn giản, giả sử bạn tạo ra 2 website A và B cùng để kinh doanh thời trang. Các mặt hàng ở 2 website này được mô tả giống hệt nhau hoặc gần giống nhau. Nhưng bạn lại chọn trang A mới là website chính thức của thương hiệu mình. Như vậy ở phần mã nguồn của trang, bạn sẽ phải khai báo website A chính là canonical URL. Lúc này Google sẽ tự động hiểu website B là bản sao và tập trung toàn bộ lưu lượng truy cập vào website A của bạn.
Trong SEO website, vai trò của thẻ Canonical là gì?
Thẻ canonical (canonical tag), còn được gọi là “rel canonical”, là một phần tử nằm ở thẻ <head> trong mã nguồn HTML của trang giúp quản trị viên web ngăn chặn các vấn đề về trùng lặp nội dung.
Tham khảo: Thẻ HTML là gì? Tổng hợp các thẻ HTML thông dụng trong SEO
Theo đó, vai trò của thẻ Canonical trong SEO website sẽ là:
- Hợp nhất liên kết của các trang có nội dung tương tự: Google dựa vào các canonical URL để đánh dấu trang nào là trang chính thức, sau đó sẽ hợp nhất liên kết của các trang có nội dung tương tự để cùng điều hướng tới một URL duy nhất;
- Chỉ định đường link mà người dùng có thể nhìn thấy trên bảng kết quả tìm kiếm: Chỉ có canonical link mới được Google cho xuất hiện ở trang kết quả tìm kiếm;
- Giúp cho quá trình phân tích các chỉ số SEO trở nên đơn giản hơn bởi tinh giản được số lượng URL;
- Giúp lưu lượng truy cập website được khai thác tối đa thay vì phân tán vào các trang trùng lặp: Nếu bạn không đánh dấu canonical tag cho trang của mình, Google sẽ tự chọn ngẫu nhiên một trong số các trang này để điều hướng người dùng. Như vậy lưu lượng truy cập sẽ bị phân tán cho tất cả các trang. Chưa kể khi người dùng nhìn thấy nội dung các trang không có sự khác biệt sẽ dẫn tới tăng tỷ lệ thoát page. Lúc này website sẽ bị đánh tụt điểm SEO và có thể bị phạt do phát hiện nội dung trùng lặp.
Khi nào cần sử dụng thẻ Canonical?
Trong quy trình SEO, tối ưu Canonical thuộc về SEO Onpage. Dưới đây là một số trường hợp mà SEOer có thể sử dụng canonical URL để điều hướng trên các công cụ tìm kiếm và cải thiện cơ hội được xếp hạng cao hơn.
- Website có nhiều phiên bản khác nhau: Nếu website của bạn có nhiều phiên bản khác nhau thì bạn nên sử dụng canonical tag để chỉ định cho công cụ tìm kiếm biết URL nào là mới là URL chính tắc.
- Bài viết được phân phối trên nhiều tiền miền khác nhau: Trong trường hợp quản trị viên có nhiều website với nhiều tên miền và các bài viết ở các website này đều giống nhau thì sẽ cần sử dụng tới canonical tag. Ví dụ như:
- Bài viết được phân phối trên nhiều biến thể http/https, www/non-www: Chúng ta nên ưu tiên khai báo https là URL chính tắc với công cụ tìm kiếm.
- Nội dung được chia thành các phần 1, 2, 3: Đối với những bài viết với lượng thông tin lớn (big content), người viết sẽ thường chia làm nhiều phần (part) để người đọc không bị quá tải thông tin. Nội dung bên trong là khác nhau nhưng tiêu đề của các bài viết này là giống nhau nên vẫn cần sử dụng thẻ rel=canonical để đánh dấu xem đâu là trang ưa thích.
- Website có nhiều page 1,2,3,4,5…: Khi lượng thông tin trong một website quá lớn, kể cả đối với blog hay website bán hàng thì quản trị viên thường phân thành nhiều page. Thứ nhất là để quản trị website tốt hơn, thứ hai là để người dùng dễ tìm kiếm thông tin hơn. Nếu không tìm thấy câu trả lời ở page này, họ sẽ tự động chuyển sang page tiếp theo mà không sợ bị lẫn thông tin trong cùng một page.
- Cùng 1 nội dung có và không có dấu gạch chéo: Google coi 2 trang cùng một nội dung nhưng có và không có dấu gạch chéo “/” ở cuối là 2 trang riêng biệt. Để giải quyết tình trạng này, quản trị viên cần phải sử dụng tới canonical SEO để chỉ định đâu là phiên bản chính tắc.
- Cùng 1 nội dung nhưng có và không có chữ viết hoa
- Có parameterized url (tham số hóa url) cho các tìm kiếm chọn lọc: Parameterized URL là các phần thông tin nằm ở phía sau dấu chấm hỏi “?” trong chuỗi truy vấn của một URL. Parameterized URL xuất hiện khi người dùng gõ vào ô tìm kiếm của một website.
- Có parameterized url (tham số hóa url) cho các IDs phiên: Việc chuyển IDs phiên làm tham số URL tức là máy chủ của trang web chỉ cho phép một số người dùng cụ thể truy cập vào website của họ. Tham số parameterized URL này không thay đổi nội dung của trang mà chỉ được sử dụng để theo dõi người dùng.
Cách sử dụng Canonical URL trong SEO hiệu quả
Sau khi đã tìm hiểu được khái niệm Canonical là gì và các trường hợp phải khai báo canonical tag, chúng ta cùng đi tìm hiểu chi tiết hơn về cách sử dụng canonical URL hiệu quả trong SEO website nhé.
- Cấu trúc đầy đủ sử dụng thẻ Canonical
Trong mã nguồn HTML, canonical tag được khai báo trong thẻ <head>. Dưới đây là cú pháp đầy đủ của canonical tag:
<link rel=”canonical” href=”http://lagital.com/”/>
- Cách thiết lập Canonical với Yoast Seo/Rank Math
Cài plugins Yoast SEO → Kéo phần yoast seo nâng cao → Canonical để canonical url mà trang bạn đang chỉnh sửa muốn trỏ tới. Nếu để trống là mặc định cho đường dẫn tĩnh.
Cách sử dụng tương tự khi bạn dùng Rank Math.
- Cách thiết lập Canonical với thẻ html rel=“canonical”
Giả sử bạn muốn chỉ định: http://lagital.com/ là URL chính tắc. Lúc này, bạn chỉ cần thêm thẻ canonical dưới đây vào bất kỳ trang trùng lặp nào là được:
<link rel=”canonical” href=”http://lagital.com/”/>
- Cách kiểm tra thẻ canonical tags đã được thiết lập chưa?
Sau khi đã thiết lập thẻ canonical tag, chúng ta cần phải kiểm tra lại xem nó đã điều hướng chính xác tới URL gốc hay chưa bằng 2 cách sau:
1. Xem nguồn trang:
Bạn truy cập vào trang có nội dung trùng lặp, ấn chuột phải vào một khoảng trắng trong trang đó và chọn “View page source”. Khi đó bạn quan sát ở thẻ <head>, nếu thấy cú pháp của canonical URL giống với cú pháp trên thì bạn đã thiết lập thành công.
2. Sử dụng Seoquake:
SeoQuake là một tiện ích mở rộng của Google Chrome, trước tiên bạn cần tải tiện ích này về máy. Sau đó truy cập vào website muốn kiểm tra, chọn “DIAGNOSIS”, kéo xuống dưới chọn “Canonical” và kiểm tra thôi nào.
Một số sai lầm và câu hỏi thường gặp thường gặp khi sử dụng thẻ rel=“canonical”
Canonical URL xuất hiện từ năm 2009 và từ đó cho tới nay thì canonical luôn được lọt vào top kỹ thuật SEO web phức tạp nhất. Dưới đây chúng tôi đã liệt kê 7 sai lầm thường gặp với các SEOer khi sử dụng thẻ rel=”canonical”:
- Chặn canonical URL bằng robots.txt
Robots.txt được dùng để chặn Google thu thập thông tin của một trang. Lúc này, cho dù bạn đã thiết lập canonical URL thì Google cũng không nhận được tín hiệu từ bạn, nó sẽ chọn ngẫu nhiên một trong số các trang đó trở thành URL chính tắc.
- Thiết lập canonical URL thành ‘noindex’
Khi sử dụng lệnh “noindex” để ngăn công cụ tìm kiếm lập chỉ mục trên các trang đó sẽ khiến Google không thể nhận được tín hiệu từ thẻ canonical URL.
- Đặt thẻ rel=”canonical” trong thẻ <body>
Thẻ rel=”canonical” chỉ được chấp thuận khi khai báo trong thẻ <head>. Nếu bạn thiết lập nó trong thẻ <body> thì Google không thể nhận được tín hiệu.
- Đặt biến thể http 4XX cho canonical link
Điều này vô tình đã chặn công cụ tìm kiếm thu thập dữ liệu.
- Sử dụng thẻ rel=”canonical” cho tất cả các trang được phân trang đến trang gốc
Đối với website được phân trang, tốt hơn nên sử dụng thẻ rel=”prev” hoặc rel=”next” thay vì thẻ rel=”canonical”. Ví dụ: nếu bạn đang ở trang 2, bạn nên sử dụng: <link rel = ”prev” href = ”http://bohee.vn/page1.html”>
- Không sử dụng thẻ Canonical với Hreflang
Thẻ Hreflang được sử dụng kết hợp với thẻ rel=”canonical” để chỉ định trang gốc phải có cùng một ngôn ngữ với các trang web có nội dung tương tự.
- Chuẩn hóa quá nhiều canonical URL
Google chỉ chấp thuận việc thêm nhiều thẻ rel=”canonical” trong trường hợp URL gốc không xuất hiện trên mã nguồn. Nếu Google phát hiện ra bạn đã gắn thẻ canonical nhưng lại cố tình ghi đè thêm canonical URLs khác thì nó cũng sẽ chọn ngẫu nhiên một trang web bất kỳ làm trang gốc.
- Nên chuyển hướng 301 hay đặt Canonical?
Chuyển hướng 301 có nghĩa là bất kỳ liên kết nào có URL cũ sẽ được chuyển hướng hoàn toàn đến URL mới được cung cấp. URL cũ không thể truy cập được nữa.
Nếu bạn đặt trang B là canonical URL, khi người dùng click vào trang A thì công cụ tìm kiếm sẽ tự biết rằng trang B mới là trang chuẩn. Nhưng mọi người sẽ có thể truy cập cả hai URL này.
Bởi vậy mục đích chuyển hướng 301 hay dùng thẻ rel=”canonical” là phụ thuộc vào mục đích điều hướng người dùng của quản trị viên. Tuy nhiên thông thường mọi người sẽ sử dụng thẻ rel=”canonical”.
- Có nên Canonical URL chính nó không?
Thẻ rel=”canonical” thường được sử dụng để liên kết một trang khác có nội dung tương tự với trang gốc, nhưng chúng cũng có thể được sử dụng để tự liên kết một trang với chính nó.
Khi điều đó xảy ra, Google có thể chọn URL có các tham số (Parameterized URL) làm trang chuẩn. Vì vậy, một trang web tự chuẩn hóa cho phép bạn chỉ định URL nào mới là URL chính tắc.
Sử dụng Canonical URL là một phần thiết yếu trong kỹ thuật SEO website. Do đó, bạn nên nắm chắc cách sử dụng và tránh những sai lầm thường gặp với Canonical Link.