Niềm đam mê của chúng tôi để CẢI THIỆN mỗi ngày là INFINITE 🤍 Bạn có những nghi ngờ? Chúng tôi giúp bạn 24/7

Làm thế nào để tìm Sơ đồ trang web của một trang web

Việc tìm kiếm sơ đồ trang web của bất kỳ trang web nào tương đối dễ thực hiện và ở đây chúng tôi sẽ giúp bạn hoàn thành nhiệm vụ này. Chúng tôi sẽ bắt đầu với định dạng sơ đồ trang web phổ biến nhất là XML và sau đó sẽ đề cập đến một số định dạng khác. Đầu tiên, hãy bắt đầu với những điều cơ bản.

Sơ đồ trang web là gì?

Sơ đồ trang web XML là danh sách các trang trên một trang web nhằm trợ giúp các công cụ tìm kiếm khác nhau. Nó cung cấp thông tin quan trọng về các URL trên trang web của bạn bao gồm các trang, video, hình ảnh, tệp và mối quan hệ của chúng. Cùng với các trang, sơ đồ trang web XML cũng bao gồm siêu dữ liệu bổ sung về mỗi URL:

  • ngày cập nhật cuối cùng
  • tần suất nó thay đổi và
  • ưu tiên của nó so với các trang khác.

Khi nói đến các phương pháp hay nhất về SEO, sơ đồ trang web phải được tối ưu hóa để chỉ bao gồm nội dung chất lượng và có thể lập chỉ mục. Bất kỳ trang nào bị hỏng (404), chuyển hướng hoặc trùng lặp bên trong nó đều có thể gây nhầm lẫn cho các công cụ tìm kiếm.

Sơ đồ trang web giống như một phác thảo của một trang web. Nó được xây dựng ở định dạng mã và thường trông như thế này:

Sơ đồ trang web SEOcrawl

Hoặc như thế này:

Sitemap XML

Tại sao bạn cần tìm một sơ đồ trang web?

Chúng tôi đã đề cập đến những điều cơ bản về sơ đồ trang web, bao gồm cả mục đích chính của chúng. Bây giờ hãy xem tại sao chúng ta có thể muốn tìm những tệp này ngay từ đầu.

Như chúng tôi đã thảo luận ở trên, sơ đồ trang web là một cách đơn giản và không thể thay thế để thông báo cho các công cụ tìm kiếm và đặc biệt là các trình thu thập thông tin của chúng (ví dụ: Googlebot) về nội dung quan trọng trên trang web của chúng tôi.

Trước hết, bạn có thể muốn kiểm tra xem mình có sơ đồ trang web XML hay không. Nếu bạn có, bước tiếp theo là kiểm tra nó và xem liệu nó có được tạo đúng cách và chứa đúng thông tin hay không.

Cuối cùng, nếu bạn không có sơ đồ trang web, bạn có thể muốn tạo một sơ đồ trang web và gửi nó tới các công cụ tìm kiếm. Lưu ý rằng sơ đồ trang web XML không bắt buộc theo bất kỳ cách nào. Tuy nhiên, chúng vẫn giúp trình thu thập dữ liệu tìm kiếm tìm, lập chỉ mục và cuối cùng xếp hạng các trang web và trang mới theo cách nhanh hơn.

Bây giờ là lúc đi sâu vào công việc thám tử và tìm những sơ đồ trang web đó!

Sẵn sàng chưa? Đi nào!

Các cách Đơn giản để Tìm Sơ đồ trang web của bạn

Hãy bắt đầu cuộc hành trình của chúng ta với một số cách dễ dàng nhất để tìm sơ đồ trang web của một trang web.

1) Kiểm tra thủ công các vị trí Sơ đồ trang web XML phổ biến

Một trong những cách phổ biến nhất (và đơn giản) để định vị sơ đồ trang web XML của một trang web là kiểm tra thủ công một vài vị trí tiêu chuẩn. Điều này cực kỳ đơn giản và tất cả những gì bạn cần làm là nhập URL trang web của mình vào trình duyệt rồi thử với một vài biến thể khác nhau. Tôi se cho bạn xem:

  • www.YourWebsiteUrl.com/sitemap.xml

Đây là vị trí phổ biến nhất, nhưng không phải là duy nhất. Do đó, nếu chúng tôi không may mắn với lần thử đầu tiên của mình, đây là một số cách kiểm tra nhanh hơn để thử:

  • /sitemap_index.xml (là chỉ mục của tất cả các sơ đồ trang web trong trường hợp một trang web có nhiều hơn một).

Đây là trường hợp với sơ đồ trang web XML của chúng tôi trên blog này. Tôi se cho bạn xem:

URL trong sơ đồ trang web SEOcrawl

Và đây là cách nó trông giống như:

Danh sách sơ đồ trang web của SEOcrawl

Về cơ bản, đây là tất cả các sơ đồ trang web sơ đồ trang web riêng biệt được chia theo loại bài đăng mà chúng có bên trong.

Bây giờ, nếu chúng ta vẫn không may mắn, hãy thử thêm một số tùy chọn:

  • /sitemap-index.xml
  • /sitemap.php
  • /sitemap.txt
  • /sitemap.xml.gz
  • /sitemap/
  • /sitemap/sitemap.xml
  • /sitemapindex.xml
  • /sitemap/index.xml
  • /sitemap1.xml

Lưu ý: Tệp XML chỉ là một trong những cách để mô tả sơ đồ trang web. Ngoài ra còn có các định dạng RSSAtom.

Do đó, chúng tôi cần thêm một vài vị trí sơ đồ trang web khả thi hơn:

  • /rss/
  • /rss.xml
  • /atom.xml

Chúng ta sẽ nói thêm về chúng sau.

Chỉ để xác nhận- chúng ta nên đặt tên miền của các trang web trước dấu “/” trong khi thử các lựa chọn thay thế khác nhau.

2) Kiểm tra tệp Robots.txt

Nếu bạn vẫn ở với chúng tôi, điều đó có nghĩa là bạn không tìm thấy tệp là mục đích chính của bài viết của chúng tôi hoặc bạn chỉ tò mò và đam mê tìm hiểu thêm.

Trên thực tế, bất kể lý do chính xác là gì, tôi có một tin tốt cho bạn – Chúng tôi sẽ tiếp tục hành trình của mình với một mẹo rất đơn giản khác.

Robots.txt là một tệp đặc biệt được giới SEO (và cả lập trình viên) biết đến, cung cấp các chỉ thị hữu ích cho trình thu thập thông tin của công cụ tìm kiếm. Hơn nữa, đây cũng là nơi mà bạn có thể thường xuyên tìm thấy một liên kết đến sơ đồ trang web của một trang web.

Ý tưởng là khi các công cụ tìm kiếm truy cập các tệp robots.txt này, việc thêm một liên kết đến sơ đồ trang web ở đó là hoàn toàn hợp lý. Bằng cách đó, họ sẽ dễ dàng phát hiện sơ đồ trang web hơn ngay từ đầu và thu thập dữ liệu trang web.

Bạn đã sẵn sàng đón nhận một tin vui khác chưa?! Đây là- để truy cập tệp robots.txt của một trang web, bạn chỉ cần thêm /robots.txt vào tên miền của mình trong trình duyệt và nhấn “Enter”. Điều này tương tự như bước trước khi chúng tôi thêm các tuyến sơ đồ trang web có thể khác nhau.

Điều gì hoạt động tốt hơn một ví dụ thực tế? Xem địa chỉ URL của tệp robots.txt rất riêng của chúng tôi:

https://seocrawl.com/robots.txt

Đó là một tệp nhỏ nhưng đơn giản và hữu ích với một số chức năng quan trọng. Trong trường hợp bạn đã mở nó, bạn sẽ có thể thấy gần như ngay lập tức viên ngọc nhỏ mà bạn đang tìm kiếm- tệp sơ đồ trang web:

Thế là xong! Tôi đã hứa với bạn nó sẽ dễ dàng 🙂

3) Kiểm tra Google Search Console

Được rồi, sơ đồ trang web vẫn không được tìm thấy? Không có gì! Chúng tôi có nhiều lời khuyên hơn cho bạn sẽ giúp chúng tôi tìm ra con đường của mình.

Hãy để tôi chỉ cho bạn một cách khác dễ dàng và nhanh chóng.

Google Search Console (trước đây còn được gọi là Công cụ quản trị trang web) là một nơi nữa để tìm đường dẫn mà chúng tôi đang tìm kiếm. Tất nhiên, để có thể thực hiện được điều này, bạn phải là chủ sở hữu của trang web hoặc đã được cấp quyền truy cập.

Nếu bạn đáp ứng một trong các tiêu chí này, bước tiếp theo là đăng nhập vào GSC và từ menu bên trái để chọn Sơ đồ trang web:

Sơ đồ trang web trong Google Search Console

Bây giờ, trong trường hợp sơ đồ trang web (hoặc sơ đồ trang web) đã được gửi bởi người khác trước đây, bạn sẽ có thể nhìn thấy nó ngay lập tức:

Sơ đồ trang web đã gửi

Cùng với địa chỉ URL chính xác của sơ đồ trang web, còn có thông tin bổ sung như loại sơ đồ trang web (tệp chỉ mục chứa sơ đồ trang web khác trong đó hoặc sơ đồ trang web thông thường với các trang của trang web), khi nó được gửi, lần đọc cuối cùng, trạng thái và số lượng URL bên trong.

MẸO: Nếu bạn nghiêm túc về SEO và cải thiện hiệu suất trang web không phải trả tiền của mình, thì Google Search Console là một công cụ bắt buộc phải có. Những hiểu biết bạn có thể nhận được từ nó là rất nhiều.

Ngoài ra, một phần thưởng bổ sung là việc có GSC cho phép bạn dùng thử công cụ mạnh mẽ của chúng tôi- SEOcrawl

4) Kiểm tra Công cụ quản trị trang web Bing

Tin vui là Công cụ quản trị trang web Bing hoạt động khá giống với Google Search Console. Không có gì ngạc nhiên khi cái sau được gọi là Công cụ quản trị trang web của Google vì chúng có nhiều điểm chung.

Một lần nữa, bạn cần phải đăng nhập và sau đó điều hướng đến thanh bên trái, nơi bạn sẽ có phần “Sơ đồ trang web”.

Sơ đồ trang web trong Công cụ quản trị trang web Bing

Nhấp vào nó và trong trường hợp sơ đồ trang web/sơ đồ trang web đã được gửi, bạn sẽ có thể khám phá thêm về chúng.

Sơ đồ trang web đã gửi trong Công cụ quản trị trang web Bing

Các cách nâng cao để tìm sơ đồ trang web của bạn

Vẫn ở bên chúng tôi chứ? Được rồi, điều đó có nghĩa là bạn vẫn đang tìm kiếm vị trí tệp sơ đồ trang web quý giá đó hoặc bạn rất dũng cảm để vào phần nâng cao. Trong cả hai trường hợp, tôi muốn chúc mừng bạn vì đã tiến xa đến vậy và chúc bạn may mắn 🙂

Tôi hứa nó sẽ không phức tạp và đáng sợ như vậy đâu! Đi nào!

5) Sử dụng toán tử tìm kiếm của Google

Toán tử tìm kiếm của Google (còn được gọi là lệnh) có thể rất hiệu quả cho các mục tiêu SEO khác nhau (ví dụ: tìm cơ hội xây dựng liên kết, ý tưởng nội dung, khám phá các vấn đề kỹ thuật, v.v.). Tuy nhiên, trong trường hợp này, chúng tôi sẽ sử dụng chúng để tìm sơ đồ trang XML của trang web mà chúng tôi đang kiểm tra.

Để làm được điều đó, chúng ta sẽ cần tận dụng lệnh “filetype:”. Nó có thể thực sự hữu ích khi chúng ta kết hợp nó với lệnh “site:”. Về cơ bản, sự kết hợp của cả hai sẽ chỉ tìm kiếm các loại tệp cụ thể trong trang web mà chúng tôi muốn.

Ví dụ: site:chess.com filetype:xml

Và đây là những gì tìm kiếm này sẽ mang lại cho Google:

Sử dụng Toán tử tìm kiếm của Google để tìm sơ đồ trang web

Ở đây chúng tôi có nó! Tất cả các sơ đồ trang web được lập chỉ mục của trang web được hiển thị trên Google và chúng tôi có thể khám phá thêm về chúng.

Trong trường hợp có một số kết quả không liên quan hiển thị, bạn có thể tinh chỉnh tìm kiếm của mình hơn nữa. Lần này, chúng tôi sẽ thêm toán tử “inurl” vào kho vũ khí của mình.

Ví dụ: site:uefa.com filetype:xml inurl:sitemap

Toán tử inurl để tìm sơ đồ trang web

Lưu ý: như chúng tôi đã đề cập ở trên, sơ đồ trang web cũng có thể là tệp văn bản. Để tìm chúng, chúng ta có thể thực hiện tìm kiếm tương tự nhưng với phần mở rộng khác.

Ví dụ: site:WebsiteURL inurl:sitemap filetype:txt

Và điều này sẽ dẫn đến kết quả như sau:

Toán tử filetype để tìm sơ đồ trang web

MẸO: Các lệnh này sẽ tiết lộ vị trí của sơ đồ trang web chỉ khi nó được Google lập chỉ mục. Một số plugin WP tạo sơ đồ trang web tự động thêm thẻ no follow, no index vào Sơ đồ trang web. Vì vậy, nếu bạn không tìm thấy kết quả nào, đừng lo lắng!

Hãy để chúng tôi tiếp tục với ý tưởng tiếp theo.

Kiểm tra trang web SEO

6) Sử dụng Công cụ Trực tuyến

Một kỹ thuật khác là thử với một công cụ trực tuyến như SEO Site Checkup nơi bạn chỉ cần dán URL trang web của mình và nhấn Kiểm tra. Sau đó, bạn sẽ nhận được kết quả như sau: Lưu ý: Cách thức hoạt động của công cụ này là kiểm tra các vị trí sơ đồ trang tiêu chuẩn mà chúng tôi đã đề cập trước đó (sitemap.xml, sitemap1.xml, sitemapindex.xml, v.v.). Do đó, nó có thể không tìm thấy trang web của bạn trong các trường hợp cụ thể khác.

7) Kiểm tra CMS của Website

Tùy thuộc vào hệ thống quản lý nội dung mà trang web đang chạy trên đó, sơ đồ trang web XML có thể được đặt ở các vị trí khác nhau. Tin vui là hầu hết các CMS phổ biến đều có các vị trí mặc định mà bạn có thể muốn bắt đầu tìm kiếm từ đó.

Đầu tiên, chúng ta cần xác định CMS của website. Đó là một quy trình khá đơn giản và chúng tôi có thể sử dụng cả công cụ trực tuyến hoặc tiện ích mở rộng trình duyệt.

Ví dụ: một addon hữu ích được Build With xác định không chỉ CMS mà còn nhiều phần mềm và chương trình khác mà trang web đang sử dụng. Đây là cách nó hiển thị thông tin bạn đang tìm kiếm:

Addon Build With để nhận diện CMS

Nếu bạn thích một công cụ trực tuyến, một giải pháp khả thi là WhatCMS:

CMS nào dành cho SEOcrawl

Một giải pháp thay thế là CMS Detect:

CMS phát hiện SEOcrawl

Bây giờ, khi chúng ta biết chính xác CMS, hãy cùng khám phá một số hệ thống quản lý nội dung phổ biến nhất và nơi chúng thường lưu giữ các tệp XML.

WordPress

Trước năm 2020, cách tạo sơ đồ trang web chủ yếu thông qua plugin. Tuy nhiên, ngày nay, với chức năng tích hợp sẵn của WP, chúng nên được đặt tại /wp-sitemap.xml.

Tuy nhiên, trong trường hợp trang web bạn đang kiểm tra đang sử dụng plugin để tạo sơ đồ trang web, bạn có thể thử với một số vị trí sau:

  • /sitemap.xml
  • /tag-sitemap.xml
  • /sitemap_index/xml
  • /category-sitemap.xml

Ngoài ra, bạn có thể kiểm tra cài đặt của plugin và tìm đường dẫn ở đó.

Wix, Shopify, Joomla, Squarespace, Magento

Tin vui là tất cả những thứ này sẽ tự động tạo sơ đồ trang web XML cho người dùng của họ. Do đó, vị trí mặc định (nếu không được sửa đổi bổ sung) là: /sitemap.xml

Với lưu ý tên miền đứng trước phần “/”.

THÊM: Một Bookmarklet để khám phá Sitemap.xml tức thì

Trong trường hợp bạn là người yêu thích năng suất và tiết kiệm thời gian từ mọi nhiệm vụ nhỏ (không phải tất cả SEO chúng tôi đều như vậy sao?!), thì bạn có thể tìm thấy một bookmarklet nhanh hữu ích để kiểm tra ngay lập tức sơ đồ trang XML của một trang web.

Bạn chỉ cần thêm mã javascript này:

javascript:void(location.href=’http://’ + location.host + ‘/sitemap.xml’)

Đánh dấu nó và mỗi khi bạn nhấp vào nó sẽ mở tệp Sơ đồ trang web trong trường hợp nó nằm ở vị trí /sitemap.xml mặc định.

Nhanh chóng và dễ dàng!

Tìm các loại sơ đồ trang web khác

Chúng tôi chủ yếu nói về sơ đồ trang web XML vì chúng là định dạng phổ biến nhất để hiển thị cho trình thu thập thông tin những gì đang xảy ra trên miền của bạn. Tuy nhiên, điều đáng nói là các loại khác cũng có thể được tìm thấy trên một số trang web.

  • HTML. Chúng thường được tạo ra để giúp người dùng dễ dàng hơn và chúng rất hữu ích, đặc biệt đối với các trang web lớn hơn.

Ví dụ: Ebay cung cấp cho khách truy cập của họ một “bản đồ” ảo với các trang và danh mục chính: https://pages.ebay.com/sitemap.html

  • RSS. Trong một số trường hợp, các trang web sử dụng nguồn cấp RSS làm sơ đồ trang web thường nằm ở: /rss/ hoặc /rss.xml.
  • Atom. Điều tương tự cũng áp dụng cho nguồn cấp dữ liệu Atom và bạn thường có thể tìm thấy nó ở dạng: /atom.xml
  • TXT. Đây là một tệp văn bản tiêu chuẩn như chúng ta đã thảo luận về một ví dụ như vậy. Vị trí: /sitemap.txt

Không có sơ đồ trang web? Phải làm gì trong trường hợp này?

Sau khi xem qua các tùy chọn khác nhau để tìm sơ đồ trang web, bạn nên nói một vài lời về những việc cần làm nếu chưa có sơ đồ trang web nào được tạo. Đây sẽ là trường hợp của hầu hết các trang web hoàn toàn mới đã trực tuyến trong một thời gian ngắn. Hoặc một số trang web rất nhỏ và nhỏ.

Ngoài ra, hãy lưu ý rằng không phải tất cả các trang web đều cần sơ đồ trang web. Nếu trang web chỉ có một vài trang, bạn sẽ vẫn ổn ngay cả khi không có trang nào.

Tuy nhiên, nếu bạn sẵn sàng tạo sơ đồ trang web XML của mình, bạn chỉ cần sử dụng plugin tương thích với hệ thống CMS của mình. Một vài ví dụ tốt cho WP là:

  • Rank Math Sitemap Plugin
  • WP Sitemap Plugin
  • Google XML Sitemaps
  • WordPress SEO by Yoast

Ngoài ra, bạn có thể tạo sơ đồ trang web theo cách thủ công hoặc sử dụng trình thu thập thông tin để truy cập trang web của mình và xuất sơ đồ trang web để tải lên.

Tổng kết:

Tôi hy vọng những mẹo này đã giúp bạn tìm hiểu sâu hơn về thế giới Sơ đồ trang web và giờ đây bạn đã quen thuộc hơn với cách chúng hoạt động, tại sao chúng ta cần chúng… và tất nhiên là cách tìm chúng.

Hãy cho chúng tôi biết trong phần nhận xét nếu có bất kỳ điều gì khác mà bạn muốn biết hoặc chỉ để chia sẻ kinh nghiệm của bạn 🙂

Chúc may mắn!

Giúp chúng tôi bằng cách chia sẻ bài viết này

Giới thiệu về tác giả:

Ognian Mikov
Ognian Mikov
I have a bachelor's degree in marketing and a master's in PR & advertising. I have been in the digital marketing world and SEO in particular for the last 10+ years. SEO is more than just a job for me, it is also a passion and hobby. In my free time, I enjoy playing/watching football, chess & poker.

Leave a Comment

bài viết liên quan
seo-visibility
Cách tính Điểm hiển thị SEO cho Domain của bạn
Khái niệm về khả năng hiển thị SEO hầu như luôn được quy cho một bản cập nhật thuật toán cốt lõi của...
Đọc thêm »
roadmap-seocrawl
Lộ trình sản phẩm 2023
Nhóm SEOcrawl đã làm việc trong thế giới định vị thứ hạng website tuyệt vời được gần 10 năm và SEOcrawl...
Đọc thêm »
seo-tasks
Cách quản lý Nhiệm vụ SEO của dự án của bạn
Bạn có cần một công cụ cho phép bạn kiểm soát hoàn toàn các dự án SEO của mình từ một bảng điều khiển...
Đọc thêm »