Việc giữ một cấu trúc URL đơn giản cho trang web sẽ giúp ích rất nhiều cho bạn trong việc SEO, bạn cần quan tâm đến nội dung của bài viết hoặc một trang để từ đó xây dựng các URL một cách logic và dễ hiểu nhất đối với người dùng (nếu có thể thì bạn nên để các từ chứa nội dung thay vì một dãy số ID trong URL). Ví dụ nếu bạn tìm kiếm một thông tin nào đó thì những URL như http://en.wikipedia.org/wiki/Aviation sẽ gây ấn tượng với người dùng hơn so với những URL kiểu như http://en.wikipedia.org/wiki?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1.
Về việc sử dụng dấu chấm câu trong URL, một URL kiểu http://www.example.com/green-dress.html sẽ hữu ích hơn rất nhiều so với URL http://www.example.com/greendress.html. Mình khuyên các bạn nên sử dụng dấu (-) thay vì dấu (_) trong URL của bạn.
Các URL quá phức tạp đặc biệt là những URL chứa nhiều tham số có thể sẽ gặp các sự cố trong quá trình thu thập thông tin của Google bởi nó sẽ tạo ra một số lượng lớn URL không cần thiết trỏ đến những nội dung giống hệt nhau hoặc tương tự trong trang web của bạn. Do đó, Googlebot có thể tiêu tốn nhiều băng thông hơn mức cần thiết hoặc nó sẽ không thể lập chỉ mục tất cả các nội dung trên trang web của bạn.
Các nguyên nhân thường gặp của vấn đề này
Một số lượng lớn URL không cần thiết được tạo ra có thể do một số vấn đề gây ra bao gồm:
+ Thêm bộ lọc các danh mục: Có rất nhiều trang web cung cấp các cách xem khác nhau đối với cùng một bộ các danh mục hoặc kết quả tìm kiếm, thông thường nó sẽ cho phép người dùng lọc bộ danh mục này với các tiêu chí đã được định sẵn. Ví dụ bạn tìm kiếm “Khách sạn gần bãi biển” thì bạn sẽ nhận được một danh các trang web như phù hợp với nội dung tìm kiếm của bạn, nhưng khi bạn thêm hậu tố cho tìm kiếm của mình (khách sạn gần biển có trung tâm thể hình) thì lại một lượng các trang web có nội dung phù hợp với bạn hơn xuất hiện. Điều này xảy ra bởi vì Googlebot chỉ cần nhìn một số lượng nhỏ danh sách mà nó thu thập được khi truy cập vào trang web của các khách sạn đó là có thể đưa ra các kết quả tìm kiếm khác nhau mà nó cho là phù hợp nhất với người dùng.
+ Tạo ra các tài liệu động: Điều này có thể dẫn đến một số thay đổi nhỏ do bộ đếm, thời gian hoặc quảng cáo.
+ Các vấn đề về thông số trong URL: Nó dẫn đến việc tạo ra một lượng lớn các trùng lặp cũng như một lượng lớn URL.
+ Sắp xếp các tham số: Các trang web mua sắm lớn có nhiều cách để sắp xếp các mặt hàng cùng loại với nhau dẫn đến một lượng lớn URL. Ví dụ :
http://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance
&search_category=25
+ Tham số không liên quan trong URL (như tham số giới thiệu). Ví dụ:
http://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=
OPD+Product+Page&cat=79
http://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
+ Broken link: Đây là vấn đề phát sinh trong các liên kết trang web của bạn.
Các bước để giải quyết vấn đề
Để tránh các vấn đề liên quan đến cấu trúc URL thì mình khuyên bạn nên làm như sau:
+ Xem xét việc sử dụng file robots.txt để ngăn chặn truy cập của Googlebot vào các URL gặp vấn đề. Thông thường, bạn nên xem xét chặn URL động, chẳng hạn như URL tạo kết quả tìm kiếm hoặc URL liên quan đến thời gian, chẳng hạn như lịch. Sử dụng các cách thông thường trong file robots.txt của bạn có thể cho phép bạn dễ dàng chặn một số lượng lớn URL.
+ Bất cứ khi nào, hãy rút ngắn URL bằng cách loại bỏ những thứ không cần thiết.
+ Hãy tránh việc sử dụng ID session mà hãy sử dụng cookie.
+ Nếu bạn đặt lịch cho trang web của mình thì hãy thêm thuộc tính nofollow vào các liên kết của trang được đặt lịch.
+ Kiểm tra các Broken link trong trang web của bạn.
Để tạo một URL thân thiện trong WordPress bạn có thể tham khảo thêm bài viết: Hướng dẫn rút gọn URL trong WordPress.