IT活用術

もう迷わない!検索したPDFファイルが貼られている元ページの探し方

2022年1月18日

PDFファイルの元ページを開くには?

検索でみつけたPDFファイルが置いてあるページを探したい

URLを辿っても、元のページを表示できない

Googleの検索エンジンを使って調べものをしていると、検索結果にPDFファイルが表示されることがあります。

しかし、ヒットしたPDFファイルが置いてある元ページを見つけるのに苦労されている方も多いのではないでしょうか。

実はGoogleの検索コマンドをうまく使うことで、検索結果に表示されたPDFファイルが貼られている元のWebページを探すことができます。

この記事では、その方法を分かりやすく解説します。

対象はPDFファイルも Googleの検索エンジン

Googleの検索エンジンでは、2001年から、Webサイトだけではなく、PDFファイルもインデックスされて検索結果に表示されるようになりました。

現在では、数億件ものPDFファイルがインデックス登録されているといいます。

例えば、「リスキリング」というワードで検索すると、「リスキリングとは」のタイトルで経済産業省のWebサイトに掲載されているPDFファイルが上位に表示されます。URLの右側にPDFのマークがついているので、すぐに判別することができます。

こうしたPDFを見つけると、このファイルが貼られている元のWebページも見たくなります。

そのWebページには、自分が探したい情報に関連する他の資料が掲載されている可能性が高いからです。

URLを辿って元のWebページを開けない

こうした時に試したくなるのが、PDFファイルのURLを手掛かりにリンク元を辿っていく手法です。

例えば、「リスキリングとは」のPDFファイルは、以下のURLにあります。

これは「www.meti.go.jp」というURLのWebサイト上で、「shingikai」の中の「mono_info_service」の中の「digital_jinzai」の中の「pdf」という場所に、「002_02_02.pdf」というファイルが置いてあることを示しています。

しかし、ここで困ったことが起きます。

PDFファイル名を除いた「www.meti.go.jp/shingikai/mono_info_service/digital_jinzai/pdf」で検索すれば、元のWebページを見つけることができるのかというと、そうではありません。

「www.meti.go.jp/shingikai/mono_info_service/digital_jinzai/pdf」 で検索した結果が、こちら。

アクセス不可の表示が出るだけです。

では、もう一つ上の階層ならどうでしょう。

「www.meti.go.jp/shingikai/mono_info_service/digital_jinzai」で検索すると、以下のページが表示されます。

「www.meti.go.jp」 の中にある「デジタル時代の人材政策に関する検討会」というページが表示されました。

しかし、このページには目的のPDFファイルはありません。

「リスキリングとは」のファイルが貼ってあるWebページを見つけるには、 「デジタル時代の人材政策に関する検討会」 から移動できるページをひとつひとつクリックして開いて確認する必要があります。

このケースでは、1ページずつ開いてもそれほど時間はかかりませんが、Webサイトの構造によっては、手作業で確認するページがかなりの数に上ることもあります。

「site:」と「link:」コマンドを使う

こうした場合、「site:」と「link:」のコマンドを使うことで、もっと手軽に目的のWebページを見つけることができます。

Googleの検索エンジンでは、入力の際に特定のコマンドと一緒にワードを検索することで、通常の検索とは違った結果を表示させることができます。

site:

「:」の後にWebサイトのURLを入力すると、そのサイト内のページを検索することができる。

例 site:https://www.meti.go.jp リスキリング

➞「https://www.meti.go.jp」のサイト内で、「リスキリング」という単語が含まれるページを検索できる

link:

「:」の後にURLを入力すると、そのURLにリンクを貼っているページを検索できる

例 link: https://www.meti.go.jp/shingikai/mono_info_service/digital_jinzai/pdf/ 002_02_02.pdf

この2つのコマンドを組み合わせて、以下のように検索してみます。

site:https://www.meti.go.jp link:https://www.meti.go.jp/shingikai/mono_info_service/digital_jinzai/pdf/002_02_02.pdf

これは「 https://www.meti.go.jp 」というWebサイトの中で、「https://www.meti.go.jp/shingikai/mono_info_service/digital_jinzai/pdf/002_02_02.pdf」にリンクを貼っているページを検索せよという意味です。

この結果がこちらです。

ヒットしたのは3件。検索最上位に来ているページを開いてみると、複数のPDFファイルが貼られていて、その一つが「リスキリングとは」というファイルでした。

検索コマンドの 「site:」と「link:」 を使うことで、Google検索でヒットしたPDFファイルが貼ってある元のWebページを探すことができます。

検索コマンドについて、もっと知りたい方は、以下の記事もおすすめです。