ずさんなサイトマップ XML。 サイトマップ。 手動でマップを作成する

31.10.2023

最初は、最近気づいた 1 つの興味深いことについて、シンプルで簡単な「週末の投稿」を書こうと考えていました。 Google検索コンソール。 Yandex と Google のウェブマスター パネルでは、XML サイトマップの自動エラー チェックが行われるようになったことがわかりました。 以前は、そのような目的のために特別なサービスが使用されていたと記憶していますが、今ではすべてがはるかに簡単になりました。

この記事では、彼らの助けを借りて追跡できるエラーの説明を見つけるだけでなく、Yandex WebmasterとGoogle Search Consoleにサイトマップファイルを追加する方法についても説明することにしました。 あまり大げさなことは明かしませんが、もしかしたら誰かがこの点を見逃しているかもしれませんし、初心者にとっては役に立つでしょう。 コンテンツ:

  • + 便利なリンク。
  • (エラーの検索を含む)。

1. XML サイトマップを作成する

Web プロジェクトにサイトマップがまだない場合は、必ずサイトマップを作成してください。これは非常に便利な機能です (特に新しいリソースの場合)。 注意したいのは、 この場合ここで話しているのは (検索エンジン用の) 特別な XML 形式についてであり、(訪問者用の) HTML については話していません。 動作のメカニズムは使用しているエンジンによって異なります。このトピックに関するいくつかの記事を次に示します。

  • 私たちは(プラグインのレビューを)行います。
  • — あらゆるリソースに対するいくつかのサービス。
  • (XML を含む)。
  • Blogspot ブログでサイトマップを作成するためのトリッキーなハック。

サイトマップ: http://ドメイン名/sitemap.xml

実は、こんな情報を見つけたのですが、 検索エンジン XML サイトマップが標準のアドレスにある場合は、独自に XML サイトマップを見つけることができますが、原則として、ツールバーにロードすることをお勧めします。

2. Google(サーチコンソール)にサイトマップを追加する

以前は、このパネルはウェブマスター ツールと呼ばれていましたが、見た目はまったく異なりました。 今ではより機能的なツールになりました。 アクションのアルゴリズムは次のとおりです。

  • 登録する Search Console で (すでに Google アカウントをお持ちの場合は、システムにもアクセスできます)。
  • そこにプロジェクトを接続し、権利を確認します。
  • サイトマップ XML を追加するタスクを完了するには、「クロール」 - 「サイトマップ ファイル」セクションに移動します。

このページにはサイトマップ上のすべての情報が含まれており、新しいサイトマップを追加したり (2)、現在のサイトマップにエラーがあるかどうかを確認したり (3) することができます。

Google Search Console はネストされたサイトマップをサポートしています。たとえば、Yoast SEO プラグインにそのような機能があります。 次に、モジュールはアドレスを生成します。 http://your_domain/sitemap_index.xml.

理論的には、Googe Search Console (メインのファイル) に追加できるサイトマップ ファイルは 1 つだけで、残りのオブジェクトは自動的に選択されます。 この場合、パネル ページにはのみが表示されます。 サイトマップ.xmlをクリックすると、サブセクションに移動します。

ちなみに、すべての XML ファイル (メインアイテムとサブアイテム) を個別にアップロードすると、リンクの総数が追加されます。

おそらくコンソールには繰り返しを区別するツールがまだないか、単なる表示形式である可能性があります。 総数記録、または不具合。

サイトマップの誤りについて

追加されたサイトマップ XML に問題がある場合は、パネルに対応する記号 (感嘆符アイコンと [問題] 列のエントリ) が表示されます。 また、ページ内では、 特定のファイルサイトマップにも警告が表示されます。

スクリーンショットのケースでは、robots.txt ルールによって一部のブログ アドレスのインデックス作成が許可されていないことがわかります。 このようなものは修正する必要があります。その後、ファイルを次の宛先に送信する必要があります。 再確認してください— 「テスト」ボタン。

別のプロジェクトでは、さらに悪い状況に遭遇しました。サイトマップには次のようなメッセージが表示されました:(これはまったくナンセンスです。さらに、必要なモジュールがアクティブ化されており、すべてが機能していると完全に確信していました。問題を発見したのは、サイトマップを追加した後です。したがって、ウェブマスターパネル。 この手順これは非常に重要ですが、所要時間はほんの数分です。

3.サイトマップをYandexにアップロードする

ここに関しては、登録し、サイトを追加し、その権利を確認した後、「インデックス作成」-「サイトマップファイル」セクションに移動する必要があります。

このページには Robots.txt からマップが自動検出され、独自のファイルを追加できます。 パネルはネストもサポートしています。 何か問題が発生した場合は、エラー メッセージが表示されます。 上のスクリーンショットでは、問題は の image:image タグに関連していますが、Yandex はこれを理解できません。 Wordpresにはこの枠を解消するモジュールがありますが、原理的には特に影響はありません。 私個人としてはすべてをそのままにしておきます。

サイトマップを Yandex.Webmaster に追加する前に、簡単なチェックを実行することができます。 このツールは、[ツール] - [サイトマップ分析] セクションで利用できます。

合計

上で述べたように、サイトマップ ファイルを Yandex と Google に追加するのに 5 ~ 10 分かかることをお勧めします。 プロジェクトにまだない場合は、必ず作成してください。 このプロセスとその使用は、リソースのインデックス作成を改善するのに役立ち、また、気づいていないエラーを見つけることもできます。 たとえば、CMS を更新してサイトマップ モジュールに接続するのを忘れた、またはサイトマップが自動的に失敗し始めたなど、状況はさまざまです。サイトマップが 404 エラーを出し始めると、これはまったくクールではありません。

もちろん、この投稿は初心者向けですが、あなたにとっても役立つことを願っています。 追加することがあれば、以下に書いてください。

ユニークなコンテンツが満載の Web サイトがあるとします。 SEOの最適化そしてあなたは座って、手のひらをこすりながら、自分の発案が検索ロボットによって訪問され、インデックス付けされ、切望されるトラフィックをもたらし始めるのを待ちます。 時間が経つ、努力の成果が特に目に見えるわけではありません。 どうしたの? おそらく、何かがまだ見落とされ、おいしいものを追い求めているうちに何かが忘れられていたのかもしれません。 サイトがまだユニークで、オプティマイザーがたくさんあると仮定しましょう。 次に、なぜ検索エンジンがそれほど訪問したがらないのか、なぜすべての処理が非常に遅いのかを理解する必要があります。

各 Web プロジェクトには、ロボット (robots.txt) とサイトマップ () という 2 つの重要なファイル (おそらくメイン ファイル) が必要です。 それらのいずれかが欠落しているか、正しく入力されていない場合、リソースが期待した結果を提供しない可能性が高くなります。 結局のところ、検索ボットは、リソースに費やす時間と、チェックしてデータベースに入力できるドキュメントの数の両方に制限を設定しています。 これは、検索ロボットの移動パスを指定していない場合、検索ロボットは最初にエンジン ファイル内をさまよったため、コンテンツにすぐに到達できない可能性があることを示しています。

このような混乱を避けるために、ロボット ファイルには、ボットが時間を無駄にすべきではないことを明記し、逆に、サイト マップを利用して、どこを見るべきか、どこを歩き回るべきかを提案します。

すべてがうまくいき、検索エンジンがプロジェクトのインデックスを作成し始めたとします。ただし、2 番目のものが存在しないため、目標の達成が遅れる可能性があります。 次に、サイトマップの作成について詳しく説明します。

XML バージョンと HTML バージョンのサイト マップ

Sitemap.html はリソースのゲストにとってナビゲーションとして機能し、サイトの構造を理解し、興味のあるセクションを見つけるのに役立ちます。

Sitemap.xml は、検索ボットにプロンプ​​トを表示し、プロジェクトのページを検出してインデックス付けを開始するのに役立ちます。 サイト上に高度なネストがあり、多数の Web ページがある場合、XML を使用すると、ボットがインデックスを作成する必要があるものを見失わなくなります。 どうやって 素敵なボーナス検索エンジン側のリソースに対する信頼が高まるという形で、私たちのカルマにプラスが得られます。

サイトマップを持つことの良い面。 Webサイト上のxml

  • 最近作成されたページのインデックス作成が高速化されます。
  • 検索エンジンが必要なページを見つける確率は 100 パーセントです。
  • スキャンの優先順位、頻度、日付を指定する機能 最新のアップデートページ。
  • リソースに対する信頼がわずかに増加します。

重要!

  • サイトマップには UTF-8 エンコーディングを使用します。
  • ファイルの重さは 10 MB を超えてはならず、そのコンテンツは 50,000 URL を超えてはなりません。

サイトマップを作成して追加する方法。 サイトへの XML

Notepad++ などのテキスト エディタを使用して、作成を開始します。

最初のブロックは標準部分であり、以下を示します。

http://Наш сайт.ru/ 2016-05-23T23:45:36+00:00 daily 1.0

タグの意味:

  • 「loc」 - これには、検索ロボットが間もなくインデックスを作成する Web サイトのページのアドレスが含まれています。
  • 「lastmod」 - 最初のタグで指定されたページの最終更新日を表示します。
  • 「changefreq」 - コンテンツが更新される頻度を示します (この場合は毎日)。
  • 「priority」 - ページのインデックス作成の優先順位を設定します (0 から 1)。

結果のファイルを XML 形式で保存し、 に配置します。 次に、ロボットでそのパスを指定します。 txt に次の行が含まれています:

http://当サイト/sitemap.xml

または、オンライン ジェネレーターのいずれかを使用することもできます。 例えば、、500 ページ以下を作成するように設計されています。 しかし、多くの場合、それ以上は必要ないので、私たちはそれで作業します。

最初の行には、サイトの完全な URL を入力します。http://当社のウェブサイト。

2 行目は「」と呼ばれます。変更頻度 「」は、検索ロボットが Web ページを更新する頻度を示します。 以下を選択できます。なし、毎週、毎日、毎時、毎月、毎年。

3行目「最終変更」 " はページが最後に更新された日付を示します。サイトマップの作成を決定した日付を選択するか、" を選択します。サーバーの応答を使用する " - その後、ジェネレーターは最後の変更の日付を自動的に入力します。

そして4行目「優先度 "、前に説明したように、インデックス作成の優先順位を選択できます。" を選択します。自動計算された優先度».

「開始」ボタンを押して生成されるまで待ちますXML形式のサイトマップ, 次に、これをルートに配置し、robots.txt でパスを指定して再度操作を実行します。

サイトマップ ファイルの作成後に Google と Yandex に報告する方法

ウェブマスターにアクセスし、次の手順を実行します。

サイトマップチェックを選択します:

そして、サイトマップ ファイルへのパスを設定します。

何が起こったのか確認してみましょう:

すべてが正常であることを確認するそしてGoogleに頭を下げに行きます。

実際に地図について報告できる Google Search Console にアクセスするには、次のリンクにアクセスしてください。

ページを更新する- チェックの結果が目の前にあり、「問題」列にダッシュがある場合は、すべてが正しく行われたことを意味します。

要約しましょう

サイトマップ ファイルを作成して配置します。 XML をリソースに追加するのは実際には数分の問題です。任意のテキスト エディターまたはオンライン ジェネレーターを使用できます。 リソースにサイト マップがある場合は、指定されたパスをたどって必要なページにインデックスを作成する検索ロボットの動作が高速化および簡素化されます。 これは、最適化作業の結果がより早く顕著になる可能性があることを意味します。 ただし、サイト マップを忘れずに定期的に更新することが重要です。 ページはプロモーションへの参加を停止する可能性がありますが、ボットは引き続きそのページにアクセスするため、順位に影響します。 また、XML エクスプローラーは、ロボットだけでなく、コンテンツ泥棒のアシスタントとしても機能します。サイトマップに必要なドキュメントが示されているため、コピーペースト者の作業が大幅に簡素化されます。 したがって、リソースのコンテンツの一意性を定期的に確認することをお勧めします。 これらのルールに従うことで、検索エンジンの信頼が高まります。 Googleのシステム Yandex をリソースに追加します。

サイトマップは、訪問者または検索ロボットがネットワーク リソースをナビゲートするのに役立つファイルです。 サイトマップを作成するには、XML 形式と HTML 形式の 2 つのオプションがあります。 1 つ目は検索ロボット用にウェブマスターによって生成され、2 つ目はサイト ユーザーのために手動で生成されることがほとんどです。 HTML マップは、コンテンツ URL が特定の階層に配置された通常の Web ページです。 XML マップは Web サイト ページのネットワーク アドレスのカタログでもあり、検索エンジンに便利な特別なマークアップを使用してのみ生成されます。

XML形式の地図

公式ディレクトリ内 Googleサービス Yandex もたくさん見つかります 役立つ情報サイトマップの作成、更新、公開について。 sitemap.xml ファイルの構造に関するデータもあります。 この記事には、最も重要で役立つ内容のみが含まれています 一般ユーザーデータ。

ファイルの主なタスク:

    便利な方法ですべての Web サイト ページのネットワーク アドレスを提供する クイックビュー形状。

    コンテンツの最終更新の頻度と時刻、優先度、 代替バージョンページ。

サイトマップには、検索エンジンで必要なページの迅速かつ正確なインデックス作成を容易にするさまざまな情報を含めることができます。 ネットワークリソース.

サイト上での地図の存在の重要性

のために 検索エンジンの最適化サイトマップの存在は必須です。 ネットワーク リソースのコンテンツの表示と分析において検索エンジンを支援すると、コンテンツのランキングにプラスの影響を与えます。 これはオプティマイザーやウェブマスターが考えていることです。 サイトでの作業が完了したら、すぐに sitemap.xml ファイルを作成し、検索エンジンに表示します。

検索エンジンにとって、そのようなファイルがなくても重要な役割は果たしません。 ロボット - 独立した ソフトウェア追加の指示は必要ありません。 リンクのあるページを特別に作成しなくても、必要なものはすべて自分で見つけることができます。 サイトマップへのリンクを提供せずにサイトを Yandex または Google ウェブマスター パネルに追加すると、サービスは問題を重大または致命的ではなく、推奨どおりに識別します。

マップを作成する主な理由は次のとおりです。

    メニューまたはサイト コンテンツからの受信リンクがないページの存在。

    ネットワーク リソースは複雑な構造を持ち、さまざまなコンテンツを含む多数のページがあります。

    ウェブサイトの定期的な更新。

    サイトには重要度に応じたページの階層があります。

サイト マップを使用すると、コンテンツのインデックス作成を高速化し、サイトに関する新しいデータを検索エンジンに提供するプロセスを簡素化できます。

創造とつながり

このファイルは、すべてのページ アドレスのリストを手動でコンパイルするなど、さまざまな方法で取得できます。 もちろん、ほとんどの場合、さまざまな自動化手段に頼ることになります。 たとえば、サーバーや通常のソフトウェアを使用します。 でネットワーク リソース マップを作成し、定期的に更新するには 自動モード最も簡単な方法は、CMS の機能を使用することです。 コンテンツ管理システムに組み込みツールがない場合は、検索してインストールします。 追加モジュール。 検索インデックスが存在する間、ユーザーや検索エンジンのあらゆる要件を満たすために、多くのプログラムやアドオンが開発されてきました。

オンライン ジェネレーターの使用:

    適切なサービスをオンラインで見つけます。

    ネットワークリソースのアドレスを指定します。

    適切なボタンを押してソフトウェアを起動します。

    サービス ロボットはサイトのページをクロールし、アドレスの地図を生成します。

完了すると、サービスは sitemap.xml をダウンロードするためのリンクをユーザーに提供します。 ファイルをダウンロードし、サイトのルート ディレクトリにアップロードします。 この方法の欠点は、静的なマップが生成されることです。 新しいページを追加した後、上記の操作を手動で繰り返し、古いファイルを削除して、現在のバージョンをダウンロードする必要があります。

例としてWordPressを使用したCMSツールの使用

    Google XML サイトマップなどの適切なプラグインをインストールしてアクティブ化します。

    設定ページに移動して、地図の更新について検索エンジンに通知すること、sitemap.xml の場所のアドレスを robots.txt ファイルに追加すること、必要に応じてデータを自動的に圧縮することを許可します。

    「記事の優先度」セクションでは、ページの優先度を自分で変更できることが重要な場合、ページの優先度の自動計算の使用を禁止します。

    マップのコンテンツの設定に進み、必要なチェックボックスをオンにします。 「その他のオプション」サブセクションでは、サービスが最後に地図を更新した日付を設定できるようにします。

    次のセクションでは、サービスは、新しいリンクやその他の変更についてファイルをチェックする頻度を変更することを提案します。 通常、次のクロールをいつ実行するかは検索エンジンが決定するため、任意の値を設定できます。

    次に、「優先度」セクションに移動します。ここでは、ページの重要度を選択して設定できます。 希望の値ドロップダウンリストから。 設定値は検索ロボットでも無視できるので、そのままにしておいても問題ありません。

    変更を保存します。

プラグインは自動的にファイルを作成し、目的のディレクトリに配置します。 この時点から、サービスがファイルの現在の状態の維持を引き継ぐため、Web マスターは sitemap.xml の存在を忘れることができます。 残っているのは、検索エンジンに場所のアドレスを指定することだけです 新しいカードサイト。 これは、対応する検索エンジンのウェブマスター コントロール パネルを通じて行われます。

手動でマップを作成する

この情報は、xml 形式で保存され、サイト マップとして使用されるテキスト ファイルの構造を理解することを目的として提供されています。 最新のソフトウェアはこのタスクを非常に効率的かつ迅速に処理するため、このような大きなファイルを手動で作成することは現実的ではありません。

テストファイルの特徴

サイトマップを手動で作成するには、メモ帳などを使用できます。 テキストエディタ。 データは次を使用してファイルに書き込まれます 特殊文字および XLM マークアップ コード。 検索エンジンへのリンクと指示をすべて入力し終えたら、ファイルを xml 拡張子で保存する必要があります。

サイトマップ コードのサンプル:

    使用されるコードのバージョンと文字エンコーディングを示す標準ヘッダー:.

    プロトコル標準仕様: .

    さまざまなパラメータを示す Web サイトのページアドレスをリストします。https://svd-komi.ru/ja/точный адрес страницы!}дата последнего изменения контентачастота обновлениязначение приоритетности.

    タグを使用してファイルを閉じます。.

urlset、url、loc タグは必須ですが、残りは必要に応じて使用できます。 多くのオプティマイザーは、一般的なサイト マップの作成に限定されません。 さらに、ビデオ、サイト ニュース、その他のセクションごとにイメージ マップを作成します。 このようなマップを使用すると、スクリプトなどを使用してページにコンテンツを埋め込む際の特殊性により、通常の方法では利用できない情報を検索エンジンに送信できます。

複数の sitemap.xml

異なるコンテンツ管理システムを同時に使用する場合、複数のサイトマップを使用する必要が生じ、サイトに 50,000 ページを超えるページを追加する必要が生じ、膨大な数の異なるセクションで発生するエラーを追跡するための便利な条件が提供されます。他の理由。

作成したカードはすべて 1 つに結合する必要があります。 つまり、作成します テキストファイル特別なタグを使用してすべてのカードをそこに書き込みます。

一般的なサイトマップ コード:

    標準ヘッダー:.

    プロトコル標準: 。 urlset タグの代わりに、sitemapindex を使用する必要があります。

    必要なパラメータを示すすべてのサイトマップのリスト: https://svd-komi.ru/ja/地図の場所の住所入国日 最新の変更点ファイルする.

    すべてのカードをリストし、タグでコードを閉じます.

この方法では、個別にインデックス付けされない、通常の XML マップのみが結合されます。 複数のサイトマップに個別にインデックスを作成するには、ウェブマスター パネルを通じてサイトマップをインデックスに追加し、検索エンジンに各マップのファイルへの正確なパスを示す必要があります。

サイトマップ アドレスを検索エンジンに送信する

検索エンジンへ グーグルロボット地図を見つけることができました。Google Search Console に移動し、[サイトマップ ファイル] セクションを選択し、適切なフィールドにファイルのネットワーク アドレスを入力して、[送信] ボタンをクリックする必要があります。 しばらくすると、サービス ソフトウェアは指定されたアドレスにファイルが存在するかどうかを確認します。 サイトマップが検出された場合、ロボットはコンテンツを分析し、実行された作業の結果をユーザーに表示します。 エラーが検出された場合は、それぞれについて詳細なレポートが作成され、すべての問題を解決するための推奨事項が追加されます。 エラーがなければ、サイトマップのステータスに「成功」​​というメッセージが表示されます。

sitemap.xml アドレスを Yandex 検索エンジンに転送するには、ウェブマスター パネルにログインし、「インデックス作成」セクションで「サイトマップ ファイル」サブセクションを見つけ、フォームにファイルへのパスを入力し、 「追加」ボタン。 「診断」セクションでエラーを確認できます。

制限と機能

サイトマップを作成および追加することにより、ユーザーはネットワーク リソースのすべてのページのインデックスを迅速かつ定期的に作成できる可能性が高くなります。 検索でコンテンツが失われる可能性は大幅に減少します。 ロボットはファイルに書き込まれたすべてのアドレスを調べ、ウェブマスターのすべてのコメントを考慮して、利用可能な資料のインデックスを作成します。 サイトマップが適切に機能するには、ユーザーは作成時にいくつかの制限を考慮する必要があります。

sitemap.xml の要件:

    ファイルには 50,000 を超えるページ アドレスを含めることはできません。

    ファイル サイズは 10 MB 以下である必要があります。

人気のある大規模なネットワーク リソースの所有者は、これらの制限に関連する問題を解決するいくつかの方法を見つけました。 サイトで確立されたフレームワークに適合しない地図が必要な場合は、以下のリストのオプションを使用してください。

制限の問題を解決するためのオプション:

    優先度が非常に低いページのアドレスをファイルから削除して、リンクの数を減らします。 検索ロボットがサイト マップからのみアクセスできる重要なリンクとページ アドレスを残しておきます。

    いくつかのサイトマップを作成し、その URL を検索エンジンに送信します。

    サイズの問題がある場合は、アーカイバーを使用してデータを圧縮します。

訪問者向けサイトマップ

ユーザー用のサイトマップは、検索ロボット用のサイトマップとは大きく異なります。 これは、アンカー、コンテンツの説明、ナビゲーション、デザイン要素を含むリンクが多数ある通常の Web サイトのページです。 カスタム サイトマップは、ネットワーク リソース内の情報の検索を高速化するために作成されます。

これは、通常のテキスト エディタまたは HTML ページを準備するための特別なエディタで作成され、任意の名前と html 拡張子の付いたファイルに保存されます。 完成したドキュメントは任意のディレクトリに配置できます。 カスタム マップの存在を検索エンジンに通知する必要はありません。 サイトのインデックス作成プロセス中に、検索ロボットがサイトを見つけてすべてのリンクにインデックスを付けます。

HTML マップ作成の特徴:

    書式設定を使用します。見出しや小見出しを強調表示したり、リストやメモを作成したり、テキストを色で強調表示したりできます。 地図は便利で使いやすいものでなければなりません。リンク先のコンテンツをユーザーに知らせないリンクが多数ある普通のページであってはなりません。

    構造を考えて、各リンクに短い説明を追加します。これにより、ユーザーの情報検索が簡素化され、検索エンジンにとって地図が高品質になります。 彼らは、テキストやマルチメディアのサポートのないリンクのあるコンテンツをうまく認識しません。

    リンクにアンカーを追加します。クリックした結果について訪問者に通知します。 このようなリンクはネットワーク リソースの信頼にプラスの影響を与える可能性があるため、検索エンジンはアンカーを含むリンクをより適切に認識します。

カスタム マップを作成したら、アクセス可能な場所に保存し、目立つようにリンクします。 検索エンジンとは異なり、訪問者は便利なナビゲーション ページを求めてサイト全体をクロールしません。 したがって、リンクをメインメニューなどの目立つ場所に配置し、枠や色で強調表示し、フォントサイズを変更してください。 目立つほど良いです。 そうでなければ、その作成に費やした労力が利益をもたらさないでしょう。

ブログ サイトの読者の皆さん、こんにちは。 サイトマップ (サイトマップ xml) についてこれまでに書いたことを 1 つの記事に要約することにしました。サイトマップは主に、最初にインデックスを付ける必要があるページを検索エンジンに示すために必要です。 これは非常に重要であり、実際、Web プロジェクトの必須属性ですが、多くの人はこれを知らないか、サイト マップをあまり重要視していません。

すぐにすべての i に点を付けて、xml 形式のサイトマップと Html 形式のサイトマップという 2 つの概念を分離してみます (この単語には地理的な解釈もあります。これについては記事「」で書きました)。 2 番目のオプションは、Web リソース上のすべてのマテリアルの通常のリストで、対応するメニュー項目をクリックすると誰でも利用できるようになります。 このオプションも便利で、検索エンジンによるリソースのインデックス作成を高速化し、改善するのに役立ちます。

XML 形式のサイトマップ サイトマップ - しかし、それが必要です

しかし、インデックスを作成する必要があるリソース ページを検索エンジンに直接示すように設計された主なツールは、Sitemap.xml というファイルです (これが最も一般的な名前ですが、理論上は任意の名前で呼び出すことができ、問題ではありません)。 、Web プロジェクトの訪問者には表示されません。

これは、検索エンジンが理解できる特別な構文を考慮してコンパイルされており、インデックス付けされるすべてのページがリストされ、その重要度、最終更新日、およびおおよその更新頻度が示されます。

Web プロジェクトには 2 つの主要なファイルが必要です。 robots.txt と sitemap.xml。 プロジェクトにそれらがないか、正しく入力されていない場合は、高い確率でリソースに重大な損害を与え、リソースの潜在能力を最大限に発揮できなくなっています。

もちろん、あなたは私の言うことを聞かないかもしれませんが(蓄積された事実資料が比較的少ないため、私は権威ではありません)、手元に何万ものプロジェクトの統計がある専門家と無差別に議論することはないと思います。

今回のために「藪の中のグランドピアノ」を在庫してきました。 この記事を書く直前に、「Hands」という珍しい名前の、有名な自動プロモーション システムの専門家による出版物を見つけました (これは、私が書いた MegaIndex の類似物です)。

同様のシステムがクライアントのプロジェクトを確実に確実に進行させることに関心があることは明らかですが、クライアントのリソースをリンクマスで汲み上げ、コンテンツに影響を与え、修正することしかできません。 技術的なセットアップ残念ながら、サイトではそれができません。

そこで、プロジェクトの推進を困難にする最も一般的な 10 の理由を特定し、これらのデータをクライアントに直接示すことを目的とした、非常に興味深く明らかな調査が実施されました。

もちろん第一位は「そうではない」 ユニークなコンテンツ「(あなたがそれをコピーしても、あなたがそれを持っていても、本質は変わりません)。 しかし、第 2 位はまさに XML 形式のサイトマップであり、むしろそのサイトマップが存在しないか、認識されている作成形式と一致していませんでした。 さて、3 位は前述の robots.txt ファイル (存在しないか、作成が間違っていました) でした。

プロジェクトには地図が必要である (そうでなければ無駄だ) と根拠なく主張する場合、この発言がかなり代表的な研究による実際の事実によって裏付けられているかのように説得力があるようには聞こえません。

さて、私があなたを納得させたと仮定して、サイトマップを自分で作成する方法 (形式構文)、Joomla と WordPress 用に作成する方法、さらに特別なオンライン ジェネレーターを使用してサイトマップを作成する方法を見てみましょう。

ただし、サイトマップを作成するだけでは、プロジェクトが検索エンジンによって正しくインデックス付けされることを保証するのに十分ではありません。 また、検索エンジン (この場合は Google と Yandex) がこのサイトマップそのものを認識できるようにする必要もあります。 これには 2 つの方法がありますが、これについては少し後で説明します (少なくとも、読者の注意を引く何らかの陰謀が必要です)。

マップ サイトと robots.txt ファイルが必要なのはなぜですか?

まず、Web プロジェクトの特定の要素のインデックス作成を禁止する robots.txt ファイルと、特定のページのインデックス作成を必要とするサイトマップ ファイルの両方を使用する論理的な必要性を正当化してみましょう。 これを行うには、5 ~ 10 年前に戻ってみましょう。当時、インターネット上のほとんどのリソースは、すべての記事のテキストを含む単なる HTML ファイルのセットでした。

Google や Yandex の検索ロボットは、単純にそのような HTML プロジェクトにアクセスし、入手できるすべてのもののインデックスを作成し始めます。これは、ほとんどすべてのものがプロジェクトのコンテンツを含んでいるからです。 しかし、CMS(コンテンツ管理システム)が普及した現在、何が起こっているのでしょうか? 実際、エンジンをインストールした直後でも、検索ロボットはすでに数千のファイルを検索します。これは、まだコンテンツがないにもかかわらず (つまり、まだ記事を 1 つも書いていない) にもかかわらずです。

そして一般に、最新の CMS のコンテンツは、原則としてファイルではなくデータベースに保存されます。当然、検索ロボットは直接インデックスを作成できません (データベースを操作する場合は、無料をお勧めします)。

あちこちを調べた後でも、Yandex と Google の検索ロボットがコンテンツを見つけてインデックスを作成することは明らかですが、これはどれくらいの速さで起こるのでしょうか。 インデックス作成はどの程度完了しますか?あなたのプロジェクトは非常に大きな質問です。

CMS の普及に伴い、検索エンジンによるプロジェクトのインデックス作成を簡素化し、高速化するために、robots.txt と sitemap.xml を作成する必要があります。 最初のファイルを使用して、インデックス作成に時間を無駄にすべきではないファイル (エンジン オブジェクトなど) を検索エンジン ロボットに指示します。また、このファイルを使用して、一部のページのインデックス作成をブロックして、多くのサイトに固有のコンテンツの重複による影響を排除することもできます。 CMS (これについては、記事で詳しく説明します)。

そして、サイトマップ ファイルの助けを借りて、Yandex ロボットと Google ロボットに、プロジェクトに正確にどのようなコンテンツが含まれているかを明確かつ明確に伝えることができるため、ロボットは、使用されているエンジンのファイル管理の隅を無駄に探索することがなくなります。 ボットには表示されるドキュメントの時間と数に一定の制限があることを忘れないでください。 エンジン ファイル内をさまよって去っていき、コンテンツは長期間インデックス付けされないままになります。 ああ、なんと。

有名なコメディーで、あるカラフルなキャラクターが「そこには行かないで、あなたはここに行きます。そうでなければ...」と言ったことを思い出してください。 まさにこのキャラクターの機能が、robots.txt と XML 拡張子を備えたマップ サイトによって実行され、Web プロジェクトの隅々まで検索ボットの動きを制御します。 ボットが起動する可能性があることは明らかですが、おそらく、ボットは (サイト マップにある) 明確に書かれた禁止および規範的な指示に従順に従うでしょう。

それは明らかですか? 次に、sitemap.xml を作成する方法の問題の解決に直接進みましょう。 さまざまな方法でそして、RuNet の検索の 2 つの柱である Google と Yandex にその存在を知らせる方法について説明します。そうすることで、プロジェクトが無駄に探り探りされたり、ホスティング サーバーに追加の負荷が生じたりすることがなくなります。ただし、これは非常に重要です。二次的なことですが、重要なことは、正確にインデックスを作成することです (高速かつ包括的)。

ほとんどの場合自分で作成する必要がある robots.txt とは異なり、XML 形式のサイトマップ ファイルは、原則として、何らかの方法で作成しようとします。 自動的に。 これは理解できます。 大量の頻繁に更新されるプロジェクトのページを手動で作成すると、ウェブマスターの心にダメージを与える可能性があります。

はい、これはまったく必要ありません。なぜなら... ほぼすべての CMS には、サイトマップ ファイルを作成したり、新しいマテリアルが表示されたときにサイトマップ ファイルを再作成したりできる拡張機能があります。 または、いつでも既製のソリューションとしてオンライン サイトマップ ジェネレーターを使用することもできます。

それでも、サイトマップを作成するための単純な (何と言うか - 最も単純な) 構文を理解しておくと役立つと思われます。 さらに、小規模でめったに更新されないプロジェクトの場合は、手動でスケッチすることができます。

Joomla と WordPress で Sitemap.xml を自分で作成する方法

通常、「サイトマップ」ディレクティブは最後に記述されます。 次回、検索ロボットが Web プロジェクトを訪問するとき、ロボットは必ず robots.txt の内容を調べ、学習用にマップをダウンロードします。 ただし、この方法では、あらゆる種類の大根がその存在を知ることができ、地図サイトはコンテンツを盗むのに役立ちます。

ただし、robots.txt を介さずに、サイト マップの位置に関する情報を検索エンジンに直接送信する別の方法があります。 これは、Yandex Webmaster インターフェイスとパネルを通じて行われます。 Googleツール、使用できますが。 これらの検索エンジン ツールについてはすでにご存知ですか?

そうでない場合は、必ずプロジェクトを と の両方に追加し、適切なタブでサイトマップへのパスを XML 形式で指定してください。

Yandex Webmaster のサイトマップを追加するフォームは次のようになります。

そしてこれがそのようです 似た形 Google ツールバーにパスを設定するには:

オンライン ジェネレーター サイトマップ ジェネレーターと XML サイトマップ

地図サイトを自動的に作成できる CMS の拡張機能を探したくない場合は、オンライン ジェネレーターを使用できます。 ただし、これと比べて欠点が 1 つあります。 自動作成 CMS 自体のマップ - 新しいマテリアルを追加した後、次の場所に移動する必要があります。 オンラインサービスこのファイルを再作成し、サーバーにアップロードします。

おそらく最も有名なオンライン サイトマップ ジェネレーターの 1 つは、Sitemap Generator です。 非常に多くの機能があり、1500 ページのサイトマップを無料で生成できます。これはかなりの量です。

サイトマップ ジェネレーターは、robots.txt ファイルの内容を考慮して、インデックス作成が禁止されているページがマップに含まれないようにします。 いずれにしてもロボットの禁止の方が優先されるため、これ自体は怖いことではありませんが、作成されたサイト マップ ファイルに不要な情報が含まれることがなくなります。 地図を作成するには、URLを指定するだけです ホームページ電子メールを入力すると、生成のキューに入れられます。

自分の番が来たら、通知が届きます。 郵便通知レターのリンクをクリックすると、サイトマップ ジェネレーターが作成したファイルをダウンロードできます。 あなたがしなければならないのは、サーバー上の適切な場所にアップロードすることだけです。 サイトマップを最新の状態に保つには、この手順を時々繰り返す必要があります。

同様の英語のオンライン ジェネレーター サービスがあり、このリンク (XML サイトマップ) で見つけることができます。 500 ページという制限がありますが、それ以外は上記とほぼ同じです。

頑張ってね! ブログサイトのページでお会いしましょう

興味があるかもしれません

URL アドレスとは何ですか? サイトの絶対リンクと相対リンクはどのように異なりますか?
Chmod とは何ですか、ファイルとフォルダーに割り当てる権限 (777、755、666)、および PHP 経由で割り当てる方法
サイトおよびオンラインストアによるYandex検索
OpenServer - 最新の ローカルサーバーとその使用例 WordPress のインストールコンピュータへ
ウェブサイトのトラフィックを 1 日あたり 300 人に増やすにはどうすればよいでしょうか?

sitemap.xmlを作成する

ページ制限: 1200
価格:無料で!
アプローチ:プロ!

sitemap.xml の主な目的は、最初にインデックスを作成する必要があるページを検索エンジンに伝えることです。 サイト マップのこの役割を認識していない人もいますが、単に無視して特に重要視していない人もいます。 このファイルはより一般的な名前ですが、プロジェクトの訪問者にはファイル自体は表示されませんが、どのリソース ページに必須のインデックス作成が必要かを検索エンジンに示すための重要なツール、つまりメイン ツールと見なされます。

サイトマップには次の内容が含まれます 重要な情報に埋め込まれており、特別な構文が使用されます。 これには、検索エンジンのページがリストされ、また、その内容も示されます。 彼らの重要度、最後に更新された頻度と日時。 これらはすべて理解できないものであり、訪問者にとってもサイト所有者にとっても必要ありません。 これは検索エンジンのみを対象としています。

このファイルが存在しない場合、またはファイルが正しく入力されていない場合、サイト所有者はリソースが破損するか、サイトのすべての機能が発揮できなくなる危険があります。 重要なページはインデックスに登録されていない可能性があります 長い間、そしてこれはサイト訪問数に反映され、それに応じてランキングにも反映されます。 これは、作成者が無視した多くのプロジェクトの統計を知っている専門家によって確認できます。 サイトマップ.xml。 ある発見的で興味深い調査により、プロジェクトの進行が非常に遅い最も一般的な理由が明らかになりました。 XML拡張子を持つサイトマップが一致しない場合 必要な形式または単に欠けていることが、進捗が遅い理由であり、10 件の理由のうち、低品質のコンテンツに次いで 2 番目にランクされています。 これらの事実は、単なる言葉以上にカードの重要性を確信させることができます。

プロジェクトが検索エンジンによって正しくインデックス付けされていることを確認するには、サイトマップ ファイルを作成するだけでは十分ではありません。 所有することはできますが、検索エンジンには表示されない可能性があります。 検索エンジンはその存在を知る必要があります。 これを行うには、ページを正しく作成し、最も重要と考えられるページを正確に選択する必要があります。 正しく検索するには、ロボットの速度が低下しないように、サイト上のすべての素材を検索に含めないようにする特定の設定を行う必要があります。

これにはツールが役に立ちます。 このツールはマップの作成に役立つという事実に加えて、新しいマテリアルの出現について検索エンジンに通知するため、できるだけ早くインデックスを作成する必要があることがわかります。 マップを覗き見から隠すために、ツールを使用してマップの名前を変更することもできます。

2 つの方法を使用して、sitemap.xml の場所を検索エンジンに示すことができます。 ディレクティブにはファイルのフルパスを省略せずに指定してください。