株式会社マイティーエース- MightyAce Inc.

資料請求

お問い合わせ

運用型広告

Google・Yahoo!のリスティング広告はもちろん、Facebook・Instagram・LINE・XなどのSNS広告も運用が可能です。

マンガ制作

WEBマンガを中心に、LP・バナー・SNSなど、お客様の商品(サービス)の魅力を伝える完全オリジナルのマンガを制作いたします。

Webページ制作

ページに訪れるユーザーの目的と興味を引く、お客様一人一人のニーズに合わせた完全オリジナルのWebコンテンツを制作いたします。

アクセス解析

精度を高めつつ分析⇒改善のサイクルを回し続け、意思決定に繋がるレポーティングで売上最大化のお手伝いをいたします。

お役立ち

スプレッドシートでスクレイピングをしてみよう!

今回は、「こんなこともできる」という作業効率を上げる技術をご紹介します。

 

スクレイピングとは

スクレイピングとは、ウェブサイトをクローリングし情報を収集、その情報をまとめる技術の事です。

Webスクレイピングとも呼ばれています。

主な、言語としてphpやPythonなどを使用して行います。

基本的にはウェブ上に上がっている情報であれば何でも集めてくることが出来ます。

プログラムを書けば自動で更新情報などを収集することが可能です。RSSみたいなものです。

 

活用方法

主に、機械学習やAIの技術に用いられるものになるのですが、ウェブサービスでもスクレイピングの技術が使われているものが多数あります。

 

①スマートニュースやグノシーなどのニュースサイト※違法のコピーサイトなど

②まとめサイトやブログなどのアンテナサイト

③株価・金の価格や天気など随時変動する情報

④ナンバーズやロト6などの過去の傾向からの予想

 

など

 

上記のような、更新頻度が高いものウェブ上にある過去のデータを集計等、

プログラムを組むことによって、随時更新内容を該当サイトを確認しに行くことなく情報を収集することが可能になります。

 

注意点として、ウェブ上の情報を収集する技術なので、そのまま自分のホームページに使用すると、コピーコンテンツになる為SEOで全く上がらなくなります。

また、スクレイピングを行うと、相手のサーバーに負荷がかかる為、注意が必要です。

 

スクレイピングをスプレッドシートでやってみよう

スクレイピングは難しい言語を覚えなくても、実はスプレッドシートでもできます。

 

ステップ1:新しいGoogleスプレッドシートを開く

ステップ2:Chromeで情報を収集したいWebサイトを開く

ステップ3:「右クリック」⇒「検証」⇒「情報を収集したい部分を選択」⇒「右クリック」⇒「Copy」⇒「Copy XPath」

ステップ4:スプレッドシートで関数【=IMPORTXML(URL, XPathクエリ)】

 

上記の方法で情報をスプレッドシートに一覧で取得することが、可能になります。

 

例えば、下記のような情報を収集することが出来ます。

 

記事一覧のタイトルを取得

=IMPORTXML(“https://sample.co.jp/blog”,”//h2″)

上記でマイティーのブログの記事のタイトル一覧を取得できます。

 

Googleのサジェストを取得

=ImportXML(“http://www.google.com/complete/search?hl=en&output=toolbar&q=”&”テスト”,”//suggestion/@data”)

 

Twitterのフォロワー数を取得

=IMPORTXML(“URL”,”//a[@data-nav=’followers’]/span[@class=’ProfileNav-value’]”)

 

など

 

まとめ

あまり使う機会はないかもしれませんが、使い方次第で、いろいろなウェブ上の情報を収集することが可能になります。

めんどくさいコピペ作業を一瞬ですることも可能です。

スプレッドシートで、こんなこともできるんだ、程度で覚えておいたら便利です。

Request Materials資料請求

資料請求

Webマーケティングにおけるパフォーマンス改善のための資料がダウンロードできます。

  • web広告の改善事例が知りたい方
  • 現在お願いしている代理店との比較をしたい方
  • サービスの全体像・料金を知りたい方