Các lỗi thường gặp trong Sơ đồ trang web (Sitemap) và cách khắc phục

Khi sử dụng sơ đồ trang web thì chắc hẳn việc gặp phải những lỗi liên quan đến nó là điều không thể tránh khỏi, vậy làm thế nào để khắc phục được những lỗi đó thì hôm nay mình sẽ giúp các bạn liệt kê những lỗi thường gặp và cách khắc phục nó:

URL không thể truy cập được

Đây là lỗi gặp phải khi Google cố gắng xem một URL trong sơ đồ trang web của bạn.

+ Khắc phục:

  • Đảm bảo rằng file của bạn tồn tại ở vị trí chính xác.
  • Kiểm tra file robots.txt để xem những file đang chặn nó.
  • Sử dụng các công cụ tìm nạp của Google để xem nó có bị file robots.txt chặn không.
  • Đảm bảo rằng bạn địa chỉ URL của bạn là chính xác.

Không thể theo dõi URL

Thông thường Google sẽ không thể xử lý hoàn toàn sơ đồ trang web của bạn vì một số URL chứa quá nhiều chuyển hướng mà trình thu thập dữ liệu web của Google phải tuân theo. Mình khuyên các bạn nên đưa mỗi URL chuyển hướng đến một trang khác mà URL ở đó đã được trỏ sẵn (URL đích).

+ Khắc phục:

  • Sử dụng một trình duyệt văn bản như Lynx để kiểm tra trang web của bạn, có rất nhiều công cụ tìm kiếm có thể nhìn thấy trang web của bạn giống với Lynx. Nếu các tính năng như Javascript, cookie, ID phiên, khung, DHTML hoặc Flash cho phép bạn nhìn thấy tất cả mọi thứ của trang web trong trình duyệt văn bản, thì các công cụ tìm kiếm đơn giản có thể gặp sự cố khi thu thập thông tin trang web của bạn.
  • Nếu bạn muốn chuyển hướng vĩnh viễn từ trang này sang trang khác thì bạn nên sử dụng chuyển hướng vĩnh viễn. Bạn nên tránh sử dụng các chuyển hướng như JavaScript hoặc chuyển đổi loại meta.
  • Bạn nên sử dụng liên kết tuyệt đối hoặc hoàn chỉnh thay vì liên kết tương đối. Ví dụ: khi liên kết tới một trang khác trong trang web của bạn, hãy liên kết tới https://www.example.com/mypage.html chứ không chỉ đơn giản là liên kết đến mypage.html.

URL không hợp lệ

Sơ đồ trang web của bạn bao gồm một số URL ở cấp cao hơn hoặc tên miền khác với file sơ đồ trang web.

+ Cấp cao hơn: Nếu sơ đồ trang web của bạn được liệt kê dưới http://www.example.com/mysite/sitemap.xml, các URL sau không hợp lệ cho sơ đồ trang web đó:

  • http://www.example.com/ – nó ở mức cao hơn sitemap
  • http://www.example.com/yoursite/ – nó nằm trong thư mục song song với sơ đồ trang web\

+ Tên miền khác: Kiểm tra xem tất cả các URL có bắt đầu với cùng tên miền và vị trí trong sơ đồ trang web. Ví dụ: nếu sơ đồ trang web của bạn ở http://www.example.com/sitemap.xml, các URL sau không hợp lệ đối với sơ đồ trang web đó:

  • http://example.com/ – Thiếu “www”.
  • www.example.com/ – Thiếu “http”.
  • https://www.example.com/ – Sử dụng https chứ không phải http.

Lỗi giải nén

Google gặp phải lỗi khi cố gắng giải nén file sơ đồ trang web của bạn. Bạn cần nén lại sơ đồ trang web của mình (sử dụng một công cụ như gzip) rồi tải nó lên trang web và gửi lại nó.

Sơ đồ trang web rỗng

Sơ đồ trang web của bạn không chứa bất kỳ URL nào. Kiểm tra sơ đồ trang web của bạn và đảm bảo rằng nó có chứa dữ liệu. Nếu sơ đồ trang web của bạn sử dụng giao thức sitemap, đảm bảo rằng URL được gắn thẻ chính xác.

Lỗi về kích thước file: Sơ đồ trang web của bạn vượt quá giới hạn kích thước của file

Sơ đồ trang web của bạn lớn hơn 50MB khi chưa nén. Nếu sơ đồ trang web của bạn lớn hơn mức giới hạn, hãy chia nhỏ nó vào các sơ đồ trang web nhỏ hơn và liệt kê các file này trong file chỉ mục sơ đồ trang, sau đó mới gửi các file chỉ mục sơ đồ trang web.

Giá trị thuộc tính không hợp lệ

Bạn đã gán một giá trị không hợp lệ cho thuộc tính thẻ XML. Kiểm tra sơ đồ trang web của bạn để đảm bảo rằng chỉ cho phép các thuộc tính đang có và bạn chỉ gán các giá trị cho phép theo các thông số của sơ đồ trang web. Kiểm tra lỗi chính tả của thuộc tính và giá trị của bạn.

Ngày không hợp lệ

Sơ đồ trang web của bạn chứa một hoặc nhiều ngày không hợp lệ. Lỗi này có thể là do ngày tháng ở định dạng không chính xác hoặc ngày đó không hợp lệ. Ngày phải sử dụng mã hóa W3C Datetime, mặc dù bạn có thể bỏ qua phần thời gian. Đảm bảo ngày của bạn khớp với một trong các định dạng W3C Datetime sau đây:

2005-02-21
2005-02-21T18: 00: 15 + 00: 00
Chỉ định thời gian là tùy chọn (mặc định thời gian là 00: 00: 00Z), nhưng nếu bạn chỉ định thời gian, bạn cũng phải chỉ định múi giờ.

Giá trị thẻ không hợp lệ

Sơ đồ trang web chứa một hoặc nhiều thẻ có giá trị không hợp lệ. Kiểm tra các thông số kỹ thuật cho loại sơ đồ trang của bạn (chỉ mục, tiêu chuẩn, video, v.v.).

Trên đây là một số lỗi thường gặp khi bạn sử dụng sơ đồ trang web (sitemap), mong rằng bài viết này có thể giúp ích được cho các bạn, chúc các bạn thành công!

One Thought to “Các lỗi thường gặp trong Sơ đồ trang web (Sitemap) và cách khắc phục”

Leave a Reply

Your email address will not be published. Required fields are marked *