MỤC LỤC
Báo cáo Thống kê Thu thập thông tin cung cấp thông tin về hoạt động của Googlebot trên trang web của bạn trong 90 ngày qua. Các thống kê này bao gồm tất cả các loại nội dung mà Google tải xuống (chẳng hạn như file CSS, JavaScript, Flash, file PDF và hình ảnh).
Mở bản báo cáo số liệu thống kê thu thập dữ liệu trong Google Webmaster Tools
Các bạn làm theo các bước sau:
- Trong trang chủ của Webmaster Tools, chọn tên miền bạn muốn truy cập.
- Phía bên trái của bảng điều khiển, chọn mục Thu thập dữ liệu rồi chọn phần Số liệu thống kê thu thập dữ liệu
Hiểu về dữ liệu trong bản báo cáo
Không có con số thu thập dữ liệu “tốt” nhưng bạn sẽ thấy một biểu đồ tương khá đồng đều và tăng theo thời gian nếu bạn mở rộng trang web của mình. Nếu bạn thấy có sự tăng hoặc giảm đột ngột trong biểu đồ thì đừng lo lắng quá và hãy tiếp tục theo dõi vì nó cho bạn thấy rằng những thời điểm mà Google thường xuyên thu thập dữ liệu cho trang web của bạn và ngược lại.
Tại sao dữ liệu thu thập dữ liệu của tôi lại bị giảm?
Nhìn chung tốc độ Google thu thập thông tin của bạn sẽ tương đối ổn định trong khoảng thời gian một hoặc hai tuần. Nếu bạn thấy có sự giảm sút đột ngột thì có thể do các lý do sau:
+ Bạn đã thêm các quy tắc mới trong file robots.txt. Đảm bảo rằng bạn chỉ chặn các tài nguyên mà bạn cảm thấy cần thiết. Nếu Google cần các tài nguyên cụ thể như CSS hoặc JavaScript để hiểu nội dung, chắc chắn bạn không được chặn chúng.
+ Nội dung HTML bị hỏng hoặc không được hỗ trợ trên các trang của bạn: Nếu Googlebot không thể phân tích nội dung trang của bạn thì có thể do bạn sử dụng loại phương tiện không được hỗ trợ hoặc trang đó chỉ gồm hình ảnh nên Google không thể thu thập dữ liệu.
+ Nếu trang web của bạn đang phản hồi chậm các yêu cầu, Googlebot sẽ giảm các yêu cầu đó để tránh quá tải cho máy chủ của bạn. Kiểm tra báo cáo Thống kê Thu thập thông tin để xem liệu trang web của bạn có phản hồi chậm hơn hay không.
+ Nếu tỷ lệ lỗi máy chủ của bạn tăng, Googlebot sẽ giảm tốc độ yêu cầu để tránh quá tải máy chủ của bạn. Kiểm tra bản báo cáo Lỗi thu thập dữ liệu để xem có bị tăng các lỗi kết nối máy chủ không.
+ Đảm bảo rằng bạn không giảm tốc độ thu thập thông tin tối đa của bạn.
Tại sao dữ liệu thu thập dữ liệu của tôi lại tăng đột biến?
Nếu bạn đăng nhiều thông tin mới hoặc có những thông tin thực sự hữu ích trên trang web của mình thì nó có thể sẽ được Google thu thập thông tin nhiều hơn bình thường. Dưới đây là một số cách quản lý việc thu thập dữ liệu để tránh cho máy chủ của bạn bị quá tải.
+ Xác nhận rằng Googlebot đang truy cập trang web của bạn chứ không phải là công cụ khác bằng cách xem báo cáo Thống kê Thu thập thông tin và kiểm tra tác nhân người dùng trong nhật ký của bạn.
+ Nếu bạn cần nhanh chóng chặn một trang để Googlebot không thể thu thập thông tin, bạn cần trả về mã 503 HTML cho các yêu cầu của Googlebot.
+ Tùy chỉnh file robots.txt để chặn các trang không cần thu thập dữ liệu.
+ Bạn có thể tùy chỉnh tốc độ thu thập thông tin trong Webmaster Tools, tuy nhiên mình khuyên bạn không nên sử dụng lâu dài công cụ này vì nó có thể sẽ gây những ảnh hưởng nhất định đến trang web của bạn.
+ Đảm bảo rằng bạn không cho phép thu thập dữ liệu các trang có kết quả “vô hạn”. Chặn các trang đó bằng thẻ robots.txt hoặc nofollow.