Tìm hiểu về tác động của các URL trùng lặp với trang web của bạn

Một số trang web đôi khi cung cấp cùng một nội dung thông qua các URL khác nhau bằng cách sử dụng ID phiên (session ID) hoặc các thông số URL khác. Một ID phiên là một con số được nối vào đường dẫn URL, từ đó tạo một trang tùy chỉnh mới cho người truy cập tương ứng với ID đó. Ví dụ: ID phiên cho phép các trang web bán hàng có thể phân biệt các khách hàng với nhau để khách hàng có thể thấy được sản phẩm của mình trong giỏ hàng. Còn đối với các thông số URL thì nó ít cụ thể hơn trong việc xác định khách hàng riêng lẻ. Ví dụ khi khách hàng tìm kiếm “mèo con” trong cửa hàng thú cưng, họ có thể phân loại kết quả theo tuổi, giống, màu và khoảng giá. Mỗi bộ lọc đó đại diện cho một URL khác nhau vì bộ lọc đã nối chuỗi hoặc tham số vào URL ban đầu để thay đổi trang mà khách hàng nhìn thấy, mặc dù các URL thường có kết quả tương tự hoặc trùng lặp.

Ví dụ: Các URL sau đây cùng trỏ đến cùng một nội dung mặc dù các trang này được sắp xếp hoặc lọc theo các cách khác nhau:

http://www.example.com/products/women/dresses/green.htm
http://www.example.com/products/women?category=dresses&color=green
http://example.com/shop/index.php?product_id=32&highlight=green+dress&cat_id=1&sessionid=123&affid=431

Khi Google phát hiện ra những nội dung trùng lặp, chẳng hạn như các trang trong ví dụ trên, một thuật toán của Google sẽ nhóm các URL đó thành một nhóm rồi từ đó chọn ra một URL mà họ coi là tốt nhất (ví dụ như Google có thể chọn URL có nhiều nội dung nhất) để hiển thị trong kết quả tìm kiếm. Sau đó Google sẽ cố gắng hợp nhất những gì họ biết về những URL trong nhóm (chẳng hạn như tính phổ biến của URL) để tăng độ chính xác trong việc xếp hạng các trang trong kết quả tìm kiếm.

Tuy nhiên, nếu Google không thể tìm thấy các URL trong nhóm hoặc không thể chọn URL đại diện như bạn mong muốn thì bạn có thể sử dụng công cụ Tham số URL (URL Parameters) trong Google Webmaster Tools để cung cấp cho Google thông tin về cách xử lý các URL chứa các thông số cụ thể.

Lưu ý rằng bạn nên thận trọng khi sử dụng công cụ Tham số URL. Nếu bạn mắc lỗi khi chỉ ra cho Google biết nội dung trùng lặp không nên được thu thập thông tin, Google có thể ngừng thu thập dữ liệu các trang mà bạn muốn xuất hiện trên Google Search.

 

 

Leave a Reply

Your email address will not be published. Required fields are marked *