• Hotline: 093.784.1299
  • HCM: 243 Huỳnh Văn Bánh, 12, Phú Nhuận
  • Hà Nội: VINACONEX 7, Cầu Diễn, Từ Liêm

Các nghiên cứu tập tin Robots.txt Tạo file robots.txt

Columnist Glenn Gabe chia sẻ quá trình xử lý sự cố của mình để xác định vấn đề với robots.txt dẫn đến giảm lưu lượng truy cập dài, chậm theo thời gian.

Các nghiên cứu tập tin Robots.txt:

Tôi đã viết nhiều lần trong quá khứ về vấn đề kỹ thuật SEO có thể dẫn đến giảm nghiêm trọng trong bảng xếp hạng và lưu lượng truy cập như thế nào. Để che giấu 404s từ thẻ meta robot đến rel = canonical, một số vấn đề có thể gây thiệt hại nghiêm trọng cho website của bạn, SEO-wise.

Tiếc là tôi đã xem qua trường hợp mới mà tôi sẽ tổng hợp trong bài viết này. Vấn đề đã dẫn đến việc làm chậm bảng xếp hạng và lưu lượng truy cập, làm khó khăn cho các chủ doanh nghiệp. Trước khi công ty biết điều đó, những trang quan trọng đã biến mất khỏi chỉ mục của Google.

Điều gì đã xảy ra? Và tầm quan trọng của việc kiểm soát tập tin Robots.txt của bạn

Khi nói chuyện với khách hàng về nguy hiểm SEO, tôi thường tổng hợp các tập tin robots.txt. Nó là một tập tin văn bản đơn giản, nhưng nó có thể có một tác động nghiêm trọng về nỗ lực SEO nếu không xử lý một cách chính xác.

Nó làm tôi nhớ đến "busy cricket" từ Người đàn ông trong trang phục màu đen. Tầm vóc nhỏ, nhưng rất mạnh mẽ..

Điều gì đã xảy ra? Và tầm quan trọng của việc kiểm soát tập tin Robots.txt của bạn

Mặc dù hầu hết các SEO hiểu rằng không cho phép một tấm phủ trong robots.txt sẽ gây ra vấn đề lớn, có rất nhiều tình huống khác cũng có thể gây ra các vấn đề.

Một số có thể xảy ra từ từ và gây ra sự rò rỉ URL từ chỉ mục của Google- và nếu các URL đó là quan trọng, thì bạn sẽ gặp một số vấn đề lớn. (Và bằng cách này, bạn sẽ không biết được trừ khi ai đó thực sự nắm bắt được vấn đề.)

Giảm lưu lượng truy cập, giảm thứ hạng và URLs DEINDEX

Một công ty tìm đến tôi vào mùa thu này, họ rất lo lắng sau khi nhận ra từ khóa quan trọng của họ đã không còn trong bảng xếp hạng. Nhưng với nhiều thay đổi xảy ra với Google, có phải sự giảm sút trong bảng xếp hạng có thể là bất cứ điều gì? Có lẽ nó là một bản cập nhật thuật toán, có thể cạnh tranh nâng cấp các trò chơi, hoặc chỉ có thể có một vấn đề kỹ thuật gây ra sự sụt giảm trong bảng xếp hạng. Vì vậy, tôi đã thực hiện một số công việc thám tử.

 Sau khi đào sâu vào tình hình, tôi nhanh chóng kiểm tra các URL đã được một lần xếp hạng cho các loại từ khóa. Đó là cách để xem một số URL vẫn được xếp hạng, trong khi những người khác không được tìm thấy. Có một số các URL đã biến mất khỏi chỉ mục của Google.

Giảm lưu lượng truy cập, giảm thứ hạng và URLs DEINDEX

Vì vậy, tôi đã kiểm tra các từ khóa meta robot. Tôi đã kiểm tra tiêu đề x-robot để đảm bảo noindex không được phát hành trong các phản ứng tiêu đề.

Sau đó, tôi đã kiểm tra các URL đều không phải là mô tả, phức tạp và được sử dụng. Về cơ bản, CMS đã không sử dụng các URL "đẹp" cho tỷ lệ phần trăm lớn của các trang trên website ( được thiết lập dựa trên CMS ).

Tôi biết rằng trong những tình huống như thế này, URL dễ dàng nhận ra được bởi chỉ thị của robot.txt tham lam. ("Tham lam" nghĩa là họ có thể ngăn chặn nhiều hơn họ tưởng).

Tôi thấy không hài lòng về robot.txt Tester trong việc tìm kiếm giao diện của Google (GSC) và bắt đầu kiểm tra các URLs. Một vài URLs đã được chặn, trong khi đó một số khác lại được cho phép

Giảm lưu lượng truy cập, giảm thứ hạng và URLs DEINDEX

Tôi cũng đưa ra một danh sách các URL mà trước đó đã thu thập thông tin và nhận được lưu lượng truy cập từ Google. Điều đó giúp tôi có thể xem bất kỳ URL hiện đang bị chặn bởi robots.txt (số lượng lớn). Một lần nữa, một số đã bị chặn và một số được cho phép. Sau khi phân tích tình hình, nó được chia ra làm hai vấn đề.

Hai vấn đề quan trọng: Nhạy loại chữ và sự thay đổi chỉ thị của bên thứ ba

Xem lại các tập tin robots.txt theo thời gian, tôi thấy hai vấn đề chính là đáng lo ngại. Đầu tiên, chỉ thị mới đã được thêm vào robots.txt bởi nhà cung cấp CMS và chủ sở hữu website không có ý tưởng. Các website có hàng chục ngàn URL lập chỉ mục, vì vậy, ngay cả một thay đổi nhỏ trong chỉ thị robots.txt có thể là nguy hiểm.

Thứ hai, chỉ thị đã thay đổi một chút. Điều đó có nghĩa là những chỉ thị nhầm lẫn có thể nhận hoặc bỏ lỡ các URL trên website. Ví dụ, nếu bạn nhắm đến thư mục /Category/ nhưng chỉ thị là /CATEGORY/, sau đó bạn sẽ không cho phép các URL giải quyết trong thư mục /Category/, đó cũng giống như nhạy loại chữ. Đó là một điểm quan trọng cần lưu ý cho mọi SEO, webmaster và chủ doanh nghiệp. Xem ảnh chụp màn hình dưới đây.

Hai vấn đề quan trọng: Nhạy loại chữ và sự thay đổi chỉ thị của bên thứ ba

Sự nguy hiểm của việc rò rỉ chậm

Giữa các chỉ thị được thêm / xóa theo thời gian và độ nhạy loại chữ thay đổi, công ty đã có URL quan trọng vô tình bị cấm. Khi URL không được phép, Google không thể thu thập dữ liệu trang để xác định các nội dung mà họ có, và điều này làm một số những địa chỉ URL giảm chỉ mục của Google theo thời gian

Nhưng đây là khó khăn: URL thường không hạ chỉ mục ngay lập tức - do đó, rất khó khăn để công ty phát hiện. Hiện không có sự giảm sút nào trong một ngày; thay vào đó họ có kinh nghiệm làm rò rỉ chậm URL quan trọng từ chỉ mục của Google. Như bạn có thể đoán, bảng xếp hạng và lưu lượng truy cập bị rò rỉ nhu các URL bị bỏ khỏi các chỉ mục.

John Mueller trên Robots.txt

Vào tháng 8 năm nay, Google Webmaster Trends Analyst John Mueller ghi lại toàn bộ một hangout webmaster dành riêng cho robots.txt. Đối với những người có liên quan với kỹ thuật SEO phải xem.

John phải giải thích một điều là những URL không được phép được xử lý bởi Google như thế nào, indexation-wise. Ví dụ, URL không được phép vẫn trong chỉ mục, nó sẽ biến mất, mất bao lâu để nó biến mất ?

Tại 32:34 trong video, John giải thích rằng Google sẽ giảm thông tin về URL không được phép từ các lần thu thập trước đó, và nó có thể lập chỉ mục các thông tin cơ bản URL.

Ngoài ra, Google có thể giảm các URL trong danh mục theo thời gian. Không bảo đảm các URL sẽ giảm, nhưng điều đó chắc chắn có thể xảy ra. Xem video tại đây:

Vì vậy, khi có tình huống mà bạn nhầm lẫn việc thu thập dữ liệu từ các URL không được phép, họ có thể vẫn lập chỉ mục trong một thời gian cho đến khi Google quyết định làm giảm chúng. Và cuối cùng khi Google làm giảm, bạn sẽ không có bất kỳ dấu hiệu ( khác hơn là làm giảm lưu lượng truy cập URL ).

Và nếu bạn muốn nghe John nói về nhạy loại chữ, bạn có thể xem 13:50 trong đoạn video. bao gồm một số điểm quan trọng về chỉ thị, nhạy loại chữ 

Làm thế nào để tránh rò rỉ URL do thay đổi robots.txt

Vậy làm thế nào bạn có thể tránh điều này xảy ra trên website của riêng bạn? Tôi sẽ cung cấp một số đạn dưới đây có thể giúp bạn hiểu khi thay đổi là đang được thực hiện vào tệp robots.txt của bạn và làm thế nào để phát hiện ra nếu URL được sử dụng ưu lượng truy cập đang bị cấm bởi robots.txt.

Điều này không có nghĩa là lời khuyên cuối cùng, nhưng viên đạn dưới đây chắc chắn có thể giúp bạn tránh được thảm họa SEO do các vấn đề robots.txt.

  • Thường xuyên thu thập dữ liệu và kiểm toán website của bạn. Tôi đã nói điều này rất nhiều thời gian gần đây. Bạn càng có thể thu thập dữ liệu website của bạn, bạn càng có thể hiểu được thế mạnh, điểm yếu và rủi ro của mình. Và như là một phần của thu thập dữ liệu, bạn có thể xem URL không được phép thông qua một số công cụ (bao gồm Screaming Frog, DeepCrawl, và các công cụ thu thập dữ liệu khác). Bạn chỉ có thể chọn URL quan trọng bị chặn. Nếu vậy, chỉ cần đào sâu bạn sẽ ra được vấn đề.
  • Robots.txt thay đổi lịch sử. Bạn có thể yêu cầu thông báo từ nhà cung cấp CMS của bạn bất cứ khi nào thay đổi được thực hiện vào tập tin robots.txt của bạn. Nếu họ có thể gửi email hoặc tin nhắn cho bạn về những thay đổi, sau đó bạn có thể nhanh chóng kiểm tra chúng. Và bạn có thể di chuyển một cách nhanh chóng để sửa chữa bất kỳ vấn đề nào
  • Tự động-phát hiện những thay đổi robots.txt.. Bạn cũng có thể sử dụng dịch vụ ping cho robots.txt của bạn hàng ngày. Bất cứ khi nào nó đưa ra một sự thay đổi, nó sẽ gửi email cho bạn. Sau đó, bạn có thể xem xét và thực hiện thay đổi ở nơi cần thiết. Nó cũng giống như một cảnh báo của Google cho các kỹ thuật SEO. Ví dụ, Robotto có thể phát hiện một số thay đổi quan trọng và thông báo cho bạn.

Làm thế nào để tránh rò rỉ URL do thay đổi robots.txt

  • Kiểm tra tìm kiếm giao diện điều khiển Google (GSC) liên tục. Bạn nên liên tục kiểm toán báo cáo tìm kiếm giao diện điều khiển Google. Có một số báo cáo có thể giúp bạn xác định các vấn đề mới với website của bạn từ một quan điểm kỹ thuật của SEO. Đối với tình trạng này, bằng cách sử dụng robots.txt Tester trên URL quan trọng sẽ giúp bạn. Bạn cũng có thể kiểm tra trạng thái chỉ mục "bị chặn bởi các robot," đó có thể tiết lộ sự gia tăng số lượng URL bị chặn bởi robots.txt (có thể nâng cao lá cờ đỏ). Và sau đó bạn có thể kiểm tra lỗi thu thập dữ liệu điện thoại thông minh đã bị chặn. Điều này có thể tìm thấy trong tab điện thoại thông minh nhưng hoàn toàn có thể liên quan đến URL.
  • Sử dụng Wayback Machine để kiểm tra xem robots.txt. Bạn có thể sử dụng Wayback Machine để xem lại các tập tin robots.txt của bạn theo thời gian. Đối với nhiều trang web, bạn sẽ thấy những phiên bản khác nhau của robots.txt được lấy ra từ sự tồn tại của website. Nó có thể cung cấp những manh mối quan trọng về sự giảm sút trong các trang được lập chỉ mục.

Làm thế nào để tránh rò rỉ URL do thay đổi robots.txt

Kết luận: Kiểm tra “Under The Hood,” SEO-Wise

Như bạn thấy với trường hợp này, kỹ thuật SEO thay đổi có thể có một tác động lớn trên bảng xếp hạng và lưu lượng truy cập. Mặc dù robots.txt là một tập tin văn bản đơn giản, các chỉ thị của nó nắm giữ có thể chặn các URL quan trọng từ việc thu thập dữ liệu (mà có thể dẫn đến sự giảm sút những URL từ chỉ mục của Google).

Và nếu những trang bụ giảm từ các chỉ mục, họ không có cơ hội tại bảng xếp hạng. Và không có cơ hội tại bảng xếp hạng, họ không có lưu lượng truy cập. Điều này có nghĩa là bạn thua, trong khi tập tin robots.txt tham lam thắng. Đừng để nó giành chiến thắng. Hãy làm theo lời khuyên của tôi ở trên và tránh rò rỉ URL.

4.85 sao của 1922 phiếu bầu
Các nghiên cứu tập tin Robots.txt
Các nghiên cứu tập tin Robots.txt
Các loại thẻ hỗ trợ seo 090.696.7056 093.784.1299 243 Huỳnh Văn Bánh, Phường 12, Q. Phú Nhuận, HCM
Xem thêm
Bạn muốn===>Tìm hiểu thêm

BÀI VIẾT LIÊN QUAN

Bí quyết SEO Youtube Cách đưa video trên Youtube lên top
Bí quyết SEO Youtube Cách đưa video trên Youtube lên top
Cách seo youtube rất đơn giản, bạn chỉ cần làm theo hướng dẫn là thành công? Việc đưa video lên top là một chuyện, quan trọng nhất vẫn phải là nội dung video. Nội dung và chất lượng video giúp người xem ở lại xem video của mình lâu...
Các tiêu chí của Google để xếp hạng một web 200 tiêu chí của Google
Các tiêu chí của Google để xếp hạng một web 200 tiêu chí của Google
Thuật toán tìm kiếm của Google ngày càng phức tạp và thông minh hơn. Các phương pháp nhồi nhét từ khóa. Hoặc mua lại các nội dung sẽ làm  mất hiệu quả của những bài viết của bạn. Và nếu Google phát hiện trang web của bạn đã vi...
Cách SEO web hiệu quả phương pháp SEO top Google Bing
Cách SEO web hiệu quả phương pháp SEO top Google Bing
Dịch vụ seo chuyên nghiệp Nắng Xanh hi vọng với các cách đề cập sau đây, bạn có thể giúp cho trang web của mình xuất hiện đầu tiên trên các trang kết quả của công cụ tìm kiếm Google. Qua đó có thể thu hút khách để thúc đẩy SEO và tăng doanh số bán hàng của mình.
Web có nhiều trang nội dung có tốt cho SEO? Google Bing Youtube
Web có nhiều trang nội dung có tốt cho SEO? Google Bing Youtube
Có nhiều công ty xa lánh các trang web có nhiều trang và tạo ra các trang web một trang tuyệt đẹp và thành công. Xu hướng là có quy mô nhỏ, dễ dàng điều hướng, tối thiểu, có mục đích. Những trang web không yêu cầu trình đơn thả...
Seo marketing Seo la gì trong Marketing Seo Digital Marketing là gì
Seo marketing Seo la gì trong Marketing Seo Digital Marketing là gì
Ai tìm hiểu về Digital Marketing chắc chắn cũng từng nghe đến Seo. Seo là lĩnh vực quan trọng trong Marketing Online, góp phần to lớn ảnh hưởng đến sự thành công của chiến dịch quảng bá trực tuyến của doanh nghiệp. Hãy cùng Dịch Vụ Seo Nắng Xanh tìm hiểu chi tiết hơn về Seo là gì trong marketing.
Cách đưa từ khóa lên trang nhất Google cách SEO từ khóa lên top Google
Cách đưa từ khóa lên trang nhất Google cách SEO từ khóa lên top Google
Muốn Seo từ khóa lên top bạn cần tối ưu tổng thể, nhờ vậy mà điểm chất lượng của toàn website cũng sẽ được đánh giá tốt hơn. Ngoài ra, còn hỗ trợ đắc lực cho khả năng vào trang nhất của landing page.
Cách SEO website lên top Google và ra đơn chốt sale hiệu quả
Cách SEO website lên top Google và ra đơn chốt sale hiệu quả
Nếu so với trước đây, SEO website hiện đã không còn đơn giản vì các công cụ tìm kiếm, cụ thể là Google đã trở nên “khắt khe” hơn với sự ra đời của một loạt thuật toán như Google Panda, Google Penguin,… Song, cuối cùng thì thiết...
Hướng dẫn SEO web WordPress tổng thể từ A-Z cách seo bên vững
Hướng dẫn SEO web WordPress tổng thể từ A-Z cách seo bên vững
SEO Website WordPress là cụm từ ngày càng được tìm kiếm nhiều trong thời gian gần đây. Tại sao các chủ doanh nghiệp dần có xu hướng sử dụng mã nguồn wordpress khi triển khai SEO? Cách triển khai SEO website bằng WordPress như thế nào?
Các chú ý của thẻ alt và thẻ title của hình ảnh seo ảnh lên top Google
Các chú ý của thẻ alt và thẻ title của hình ảnh seo ảnh lên top Google
ALT tag hình ảnh đã trở nên quan trọng với sự gia tăng nhu cầu về tìm kiếm hình ảnh, nó có thể đóng góp đáng kể lưu lượng truy cập từ công cụ tìm kiếm đến website của bạn nếu sử dụng đúng cách.
093.784.1299
Mục lục