Đã thu thập dữ liệu – hiện chưa được lập chỉ mục hay tiếng anh là Discovered – currently not indexed trong Google Search Console, điều đó có nghĩa là Google đã biết đến URL của bạn nhưng chưa thu thập dữ liệu (crawl) hoặc lập chỉ mục (index) nó. Điều này thường xảy ra khi Google ưu tiên các URL khác hoặc gặp vấn đề khi truy cập trang của bạn.
Chất lượng nội dung thấp
Trang có nội dung mỏng, trùng lặp hoặc không mang lại giá trị có thể bị Google bỏ qua trong quá trình lập chỉ mục. Cụ thể, nếu trang của bạn có nội dung mỏng, ít thông tin hoặc nội dung bị trùng lặp với các trang khác, Google sẽ không ưu tiên đưa trang đó vào chỉ mục. Ví dụ, một cửa hàng thời trang online tại Việt Nam có thể tạo rất nhiều trang sản phẩm, nhưng nếu nội dung trên mỗi trang chỉ là tên sản phẩm và vài dòng mô tả ngắn ngủi, Google sẽ coi đó là nội dung chất lượng thấp và bỏ qua không lập chỉ mục.
Lỗi trong tệp robots.txt, thẻ meta "noindex" hoặc cấu trúc trang web không rõ ràng có thể ngăn Google thu thập dữ liệu.
Một nguyên nhân kỹ thuật phổ biến là các lỗi trong tệp robots.txt hoặc thẻ meta “noindex” được cài đặt trên trang. Nếu robots.txt chặn Googlebot truy cập vào trang hoặc trang đó chứa thẻ “noindex”, Google sẽ không thể lập chỉ mục, dù trang đã được phát hiện trước đó.
Ví dụ, một website cung cấp dịch vụ tại Hà Nội có thể vô tình chặn robot thu thập dữ liệu trên một số trang dịch vụ quan trọng do cấu hình robots.txt sai, khiến Google không thể lập chỉ mục các trang này.
Trang không được liên kết từ các phần khác của trang web có thể không được Google phát hiện dễ dàng.
Đây là lỗi mà nhiều trang web mắc phải. Nếu trang không được liên kết rõ ràng từ các phần khác của website, Google cũng khó khăn trong việc thu thập dữ liệu. Liên kết nội bộ giúp Googlebot dễ dàng di chuyển từ trang này sang trang khác, khám phá nhiều nội dung hơn. Nếu bạn tạo một trang mới nhưng không có liên kết từ trang chủ hoặc các trang danh mục, Google có thể biết đến trang đó qua sitemap nhưng lại không ưu tiên lập chỉ mục do không thấy nó quan trọng hoặc dễ truy cập.
Trang tải chậm có thể khiến Googlebot từ bỏ việc thu thập dữ liệu trước khi hoàn tất.
Một yếu tố khác ảnh hưởng là tốc độ tải trang. Google ưu tiên các trang web tải nhanh vì mang lại trải nghiệm người dùng tốt hơn. Nếu trang của bạn tải quá chậm, ví dụ như một trang giới thiệu nhà hàng tại TP.HCM có hình ảnh chất lượng cao nhưng không tối ưu khiến trang tải chậm, Googlebot có thể bỏ qua hoặc trì hoãn việc thu thập dữ liệu trang đó. Ngoài ra, tốc độ tải trang chậm cũng ảnh hưởng tới người dùng và doanh thu.
Đối với các trang web lớn, Google có thể không thu thập dữ liệu tất cả các trang nếu ngân sách thu thập dữ liệu bị giới hạn.
Với các trang web lớn có hàng ngàn hoặc hàng chục ngàn trang, Google có giới hạn về ngân sách thu thập dữ liệu (crawl budget). Nếu ngân sách này bị hạn chế, Google sẽ ưu tiên thu thập dữ liệu các trang quan trọng hơn và trì hoãn các trang ít quan trọng.
Ví dụ, một website thương mại điện tử ở Việt Nam có hàng ngàn sản phẩm mới mỗi ngày cần cân nhắc quản lý crawl budget để các trang sản phẩm quan trọng được lập chỉ mục kịp thời.
Đảm bảo mỗi trang có nội dung độc đáo, hữu ích và đáp ứng nhu cầu của người dùng. Việc trước tiên bạn cần là nâng cao chất lượng nội dung trang. Nội dung nên đủ dài, độc đáo và hữu ích với người dùng. Ví dụ, thay vì chỉ viết “Áo thun nam xanh size M” trên trang sản phẩm, bạn có thể bổ sung thêm phần mô tả về chất liệu, cách phối đồ, hướng dẫn bảo quản để tăng giá trị nội dung.
Xác minh rằng không có lỗi trong tệp robots.txt, thẻ meta "noindex" và đảm bảo cấu trúc trang web rõ ràng.
Bạn cũng cần kiểm tra kỹ lưỡng các cấu hình kỹ thuật. Đảm bảo trong tệp robots.txt không chặn Googlebot truy cập các trang quan trọng và kiểm tra thẻ meta “noindex” trên trang để chắc chắn không vô tình đặt thẻ này. Ví dụ, kiểm tra lại cấu hình tệp robots.txt của website bạn bằng công cụ như Google Search Console hoặc các công cụ phân tích SEO để tránh tình trạng chặn thu thập dữ liệu.
Liên kết các trang chưa được lập chỉ mục từ các trang khác trong trang web để giúp Google phát hiện chúng dễ dàng hơn.
Tăng cường liên kết nội bộ là bước rất quan trọng. Bạn nên liên kết các trang mới hoặc trang chưa được lập chỉ mục từ trang chủ hoặc các trang danh mục liên quan. Điều này giúp Googlebot dễ dàng tìm thấy và hiểu rằng trang đó quan trọng.
Ví dụ, một website dịch vụ du lịch có thể tạo liên kết từ trang chủ đến trang chi tiết tour mới để Google nhanh chóng thu thập dữ liệu.
Một lưu ý là các công cụ kiểm tra tốc độ tải trang hiện nay chỉ cho biết tốc độ tải trang của trang chủ, trong khi tốc độ tải trang ở đây phải là tốc độ tổng thể của toàn bộ các trang trên website. Hãy tưởng tượng tốc độ trang chủ của bạn rất nhanh, trong khi các trang khác lại chậm, vậy thì Google cũng đánh giá website của bạn kém mà thôi. Cho nên lời khuyên là: hãy đánh giá tốc độ tải trang theo cảm nhận của người dùng nhé.
Sử dụng công cụ "Inspect URL" trong Google Search Console để yêu cầu Google thu thập dữ liệu và lập chỉ mục trang.
Bạn có thể sử dụng tính năng “Inspect URL” trong Google Search Console để yêu cầu Google thu thập dữ liệu và lập chỉ mục trang. Tuy nhiên, đây chỉ nên là bước cuối cùng khi bạn đã đảm bảo trang đủ chất lượng và không có lỗi kỹ thuật. Việc gửi yêu cầu này không đảm bảo chắc chắn Google sẽ lập chỉ mục ngay lập tức nhưng giúp bạn tăng khả năng được chú ý hơn.
Trạng thái “Discovered – currently not indexed” là dấu hiệu cho thấy Google đã biết đến trang của bạn nhưng chưa lập chỉ mục. Nguyên nhân có thể xuất phát từ chất lượng nội dung, vấn đề kỹ thuật, liên kết nội bộ yếu, tốc độ tải trang chậm hoặc hạn chế về ngân sách thu thập dữ liệu. Việc hiểu rõ và xử lý các vấn đề này là rất quan trọng để đảm bảo website của bạn được Google lập chỉ mục đầy đủ, từ đó tăng cơ hội xuất hiện trên kết quả tìm kiếm. Với các ví dụ minh họa dễ hiểu ở trên, bạn có thể áp dụng ngay các giải pháp cải thiện để tối ưu hóa hiệu quả SEO một cách bền vững. Chúc bạn thành công!
Hãy chia sẻ bài viết này nếu bạn thấy nó ý nghĩa cho bạn bè!
Nguyên nhân phổ biến website không được index
Chất lượng nội dung thấp
Trang có nội dung mỏng, trùng lặp hoặc không mang lại giá trị có thể bị Google bỏ qua trong quá trình lập chỉ mục. Cụ thể, nếu trang của bạn có nội dung mỏng, ít thông tin hoặc nội dung bị trùng lặp với các trang khác, Google sẽ không ưu tiên đưa trang đó vào chỉ mục. Ví dụ, một cửa hàng thời trang online tại Việt Nam có thể tạo rất nhiều trang sản phẩm, nhưng nếu nội dung trên mỗi trang chỉ là tên sản phẩm và vài dòng mô tả ngắn ngủi, Google sẽ coi đó là nội dung chất lượng thấp và bỏ qua không lập chỉ mục.
Vấn đề kỹ thuật
Lỗi trong tệp robots.txt, thẻ meta "noindex" hoặc cấu trúc trang web không rõ ràng có thể ngăn Google thu thập dữ liệu.
Một nguyên nhân kỹ thuật phổ biến là các lỗi trong tệp robots.txt hoặc thẻ meta “noindex” được cài đặt trên trang. Nếu robots.txt chặn Googlebot truy cập vào trang hoặc trang đó chứa thẻ “noindex”, Google sẽ không thể lập chỉ mục, dù trang đã được phát hiện trước đó.
Ví dụ, một website cung cấp dịch vụ tại Hà Nội có thể vô tình chặn robot thu thập dữ liệu trên một số trang dịch vụ quan trọng do cấu hình robots.txt sai, khiến Google không thể lập chỉ mục các trang này.
Thiếu liên kết nội bộ
Trang không được liên kết từ các phần khác của trang web có thể không được Google phát hiện dễ dàng.
Đây là lỗi mà nhiều trang web mắc phải. Nếu trang không được liên kết rõ ràng từ các phần khác của website, Google cũng khó khăn trong việc thu thập dữ liệu. Liên kết nội bộ giúp Googlebot dễ dàng di chuyển từ trang này sang trang khác, khám phá nhiều nội dung hơn. Nếu bạn tạo một trang mới nhưng không có liên kết từ trang chủ hoặc các trang danh mục, Google có thể biết đến trang đó qua sitemap nhưng lại không ưu tiên lập chỉ mục do không thấy nó quan trọng hoặc dễ truy cập.
Tốc độ tải trang chậm
Trang tải chậm có thể khiến Googlebot từ bỏ việc thu thập dữ liệu trước khi hoàn tất.
Một yếu tố khác ảnh hưởng là tốc độ tải trang. Google ưu tiên các trang web tải nhanh vì mang lại trải nghiệm người dùng tốt hơn. Nếu trang của bạn tải quá chậm, ví dụ như một trang giới thiệu nhà hàng tại TP.HCM có hình ảnh chất lượng cao nhưng không tối ưu khiến trang tải chậm, Googlebot có thể bỏ qua hoặc trì hoãn việc thu thập dữ liệu trang đó. Ngoài ra, tốc độ tải trang chậm cũng ảnh hưởng tới người dùng và doanh thu.
Ngân sách thu thập dữ liệu (Crawl Budget) hạn chế
Đối với các trang web lớn, Google có thể không thu thập dữ liệu tất cả các trang nếu ngân sách thu thập dữ liệu bị giới hạn.
Với các trang web lớn có hàng ngàn hoặc hàng chục ngàn trang, Google có giới hạn về ngân sách thu thập dữ liệu (crawl budget). Nếu ngân sách này bị hạn chế, Google sẽ ưu tiên thu thập dữ liệu các trang quan trọng hơn và trì hoãn các trang ít quan trọng.
Ví dụ, một website thương mại điện tử ở Việt Nam có hàng ngàn sản phẩm mới mỗi ngày cần cân nhắc quản lý crawl budget để các trang sản phẩm quan trọng được lập chỉ mục kịp thời.
Cách khắc phục Đã thu thập dữ liệu – hiện chưa được lập chỉ mục
Cải thiện chất lượng nội dung
Đảm bảo mỗi trang có nội dung độc đáo, hữu ích và đáp ứng nhu cầu của người dùng. Việc trước tiên bạn cần là nâng cao chất lượng nội dung trang. Nội dung nên đủ dài, độc đáo và hữu ích với người dùng. Ví dụ, thay vì chỉ viết “Áo thun nam xanh size M” trên trang sản phẩm, bạn có thể bổ sung thêm phần mô tả về chất liệu, cách phối đồ, hướng dẫn bảo quản để tăng giá trị nội dung.
Kiểm tra và sửa lỗi kỹ thuật
Xác minh rằng không có lỗi trong tệp robots.txt, thẻ meta "noindex" và đảm bảo cấu trúc trang web rõ ràng.
Bạn cũng cần kiểm tra kỹ lưỡng các cấu hình kỹ thuật. Đảm bảo trong tệp robots.txt không chặn Googlebot truy cập các trang quan trọng và kiểm tra thẻ meta “noindex” trên trang để chắc chắn không vô tình đặt thẻ này. Ví dụ, kiểm tra lại cấu hình tệp robots.txt của website bạn bằng công cụ như Google Search Console hoặc các công cụ phân tích SEO để tránh tình trạng chặn thu thập dữ liệu.
Tăng cường liên kết nội bộ
Liên kết các trang chưa được lập chỉ mục từ các trang khác trong trang web để giúp Google phát hiện chúng dễ dàng hơn.
Tăng cường liên kết nội bộ là bước rất quan trọng. Bạn nên liên kết các trang mới hoặc trang chưa được lập chỉ mục từ trang chủ hoặc các trang danh mục liên quan. Điều này giúp Googlebot dễ dàng tìm thấy và hiểu rằng trang đó quan trọng.
Ví dụ, một website dịch vụ du lịch có thể tạo liên kết từ trang chủ đến trang chi tiết tour mới để Google nhanh chóng thu thập dữ liệu.
Tối ưu hóa tốc độ tải trang
Tốc ưu tốc độ tải trang cũng cần được ưu tiên. Bạn có thể sử dụng các công cụ như Google PageSpeed Insights để phát hiện và khắc phục các điểm làm chậm trang như hình ảnh chưa nén, mã JavaScript hoặc CSS chưa tối ưu. Tốc độ nhanh sẽ giúp Googlebot dễ dàng thu thập dữ liệu trang hơn.Một lưu ý là các công cụ kiểm tra tốc độ tải trang hiện nay chỉ cho biết tốc độ tải trang của trang chủ, trong khi tốc độ tải trang ở đây phải là tốc độ tổng thể của toàn bộ các trang trên website. Hãy tưởng tượng tốc độ trang chủ của bạn rất nhanh, trong khi các trang khác lại chậm, vậy thì Google cũng đánh giá website của bạn kém mà thôi. Cho nên lời khuyên là: hãy đánh giá tốc độ tải trang theo cảm nhận của người dùng nhé.
Gửi yêu cầu lập chỉ mục
Sử dụng công cụ "Inspect URL" trong Google Search Console để yêu cầu Google thu thập dữ liệu và lập chỉ mục trang.
Bạn có thể sử dụng tính năng “Inspect URL” trong Google Search Console để yêu cầu Google thu thập dữ liệu và lập chỉ mục trang. Tuy nhiên, đây chỉ nên là bước cuối cùng khi bạn đã đảm bảo trang đủ chất lượng và không có lỗi kỹ thuật. Việc gửi yêu cầu này không đảm bảo chắc chắn Google sẽ lập chỉ mục ngay lập tức nhưng giúp bạn tăng khả năng được chú ý hơn.
Kết luận
Trạng thái “Discovered – currently not indexed” là dấu hiệu cho thấy Google đã biết đến trang của bạn nhưng chưa lập chỉ mục. Nguyên nhân có thể xuất phát từ chất lượng nội dung, vấn đề kỹ thuật, liên kết nội bộ yếu, tốc độ tải trang chậm hoặc hạn chế về ngân sách thu thập dữ liệu. Việc hiểu rõ và xử lý các vấn đề này là rất quan trọng để đảm bảo website của bạn được Google lập chỉ mục đầy đủ, từ đó tăng cơ hội xuất hiện trên kết quả tìm kiếm. Với các ví dụ minh họa dễ hiểu ở trên, bạn có thể áp dụng ngay các giải pháp cải thiện để tối ưu hóa hiệu quả SEO một cách bền vững. Chúc bạn thành công!
Hãy chia sẻ bài viết này nếu bạn thấy nó ý nghĩa cho bạn bè!
WP102 theo Nguyễn Bá Vĩnh
Sửa bởi Amin: